Supported OS Linux

Versión de la integración2.2.0

Información general

Este check monitoriza Ray a través del Datadog Agent. Ray es un marco informático unificado de código abierto que facilita el escalado de cargas de trabajo IA y Python, desde el aprendizaje por refuerzo hasta el aprendizaje profundo, pasando por el ajuste y el servicio de modelos.

Configuración

Sigue las instrucciones a continuación para instalar y configurar este check para un Agent que se ejecuta en un host. Para entornos en contenedores, consulta las plantillas de integración de Autodiscovery para obtener orientación sobre la aplicación de estas instrucciones.

Instalación

A partir del Agent versión 7.49.0, el check de Ray está incluido en el paquete del Datadog Agent. No es necesaria ninguna instalación adicional en tu servidor.

ADVERTENCIA: Este check utiliza OpenMetrics para recopilar métricas desde el endpoint de OpenMetrics que Ray puede exponer, lo que requiere Python v3.

Configuración

Host

Recopilación de métricas
  1. Edita el archivo ray.d/conf.yaml, que se encuentra en la carpeta conf.d/ en la raíz del directorio de configuración de tu Agent, para empezar a recopilar los datos de rendimiento de tu Ray. Para conocer todas las opciones de configuración disponibles, consulta el archivo de configuración de ejemplo.

    Este ejemplo muestra la página de configuración:

    init_config:
      ...
    instances:
      - openmetrics_endpoint: http://<RAY_ADDRESS>:8080
    
  2. Reinicia el Agent después de modificar la configuración.

Docker

Recopilación de métricas

Este ejemplo muestra la configuración como una etiqueta (label) de Docker dentro de docker-compose.yml. Para ver todas las opciones de configuración disponibles, consulta el [archivo de configuración de ejemplo1.

labels:
  com.datadoghq.ad.checks: '{"ray":{"instances":[{"openmetrics_endpoint":"http://%%host%%:8080"}]}}'

Kubernetes

Recopilación de métricas

Este ejemplo demuestra la configuración como anotaciones de Kubernetes en tus pods Ray. Para ver todas las opciones de configuración disponibles, consulta el archivo de configuración de ejemplo.

apiVersion: v1
kind: Pod
metadata:
  name: '<POD_NAME>'
  annotations:
    ad.datadoghq.com/ray.checks: |-
      {
        "ray": {
          "instances": [
            {
              "openmetrics_endpoint": "http://%%host%%:8080"
            }
          ]
        }
      }      
    # (...)
spec:
  containers:
    - name: 'ray'
# (...)

Las métricas Ray están disponibles en el endpoint de OpenMetrics. Además, Ray te permite exportar métricas a nivel de aplicación. Puedes configurar la integración Ray para recopilar estas métricas utilizando la opción extra_metrics. Todas las métricas Ray, incluyendo tus métricas personalizadas, utilizan el prefijo ray..

Nota: Las métricas Ray personalizadas se consideran métricas estándar en Datadog.

Este ejemplo muestra una configuración que aprovecha la opción extra_metrics:

init_config:
  ...
instances:
  - openmetrics_endpoint: http://<RAY_ADDRESS>:8080
    # Also collect your own Ray metrics
    extra_metrics:
      - my_custom_ray_metric

Encontrarás más información sobre cómo configurar esta opción en el archivo de configuración ray.d/conf.yaml de ejemplo.

Validación

Ejecuta el subcomando de estado del Agent y busca ray en la sección Checks.

Datos recopilados

Métricas

Eventos

La integración Ray no incluye eventos.

Checks de servicio

Logs

La integración Ray puede recopilar logs del servicio Ray y reenviarlos a Datadog.

  1. La recopilación de logs está desactivada por defecto en el Datadog Agent . Actívala en tu archivo datadog.yaml:

    logs_enabled: true
    
  2. Descomenta y edita el bloque de configuración de logs en tu archivo ray.d/conf.yaml. A continuación podrás ver un ejemplo:

    logs:
      - type: file
        path: /tmp/ray/session_latest/logs/dashboard.log
        source: ray
        service: ray
      - type: file
        path: /tmp/ray/session_latest/logs/gcs_server.out
        source: ray
        service: ray
    

La recopilación de logs se encuentra deshabilitada de manera predeterminada en el Datadog Agent. Para habilitarla, consulta Recopilación de logs de Kubernetes.

A continuación, configura las Integraciones de logs como anotaciones de pod. Esto también se puede configurar con un archivo, un configmap o un almacén de valores clave. Para obtener más información, consulta la sección Recopilación de logs de Kubernetes.

Anotaciones v1/v2

apiVersion: v1
kind: Pod
metadata:
  name: ray
  annotations:
    ad.datadoghq.com/apache.logs: '[{"source":"ray","service":"ray"}]'
spec:
  containers:
    - name: ray

Para obtener más información sobre la configuración de la generación de logs con Ray, consulta la documentación oficial de Ray.

Solucionar problemas

¿Necesitas ayuda? Consulta el servicio de asistencia de Datadog.

PREVIEWING: may/embedded-workflows