Este check monitoriza Ray a través del Datadog Agent. Ray es un marco informático unificado de código abierto que facilita el escalado de cargas de trabajo IA y Python, desde el aprendizaje por refuerzo hasta el aprendizaje profundo, pasando por el ajuste y el servicio de modelos.
Configuración
Sigue las instrucciones a continuación para instalar y configurar este check para un Agent que se ejecuta en un host. Para entornos en contenedores, consulta las plantillas de integración de Autodiscovery para obtener orientación sobre la aplicación de estas instrucciones.
Instalación
A partir del Agent versión 7.49.0, el check de Ray está incluido en el paquete del Datadog Agent. No es necesaria ninguna instalación adicional en tu servidor.
ADVERTENCIA: Este check utiliza OpenMetrics para recopilar métricas desde el endpoint de OpenMetrics que Ray puede exponer, lo que requiere Python v3.
Configuración
Host
Recopilación de métricas
Edita el archivo ray.d/conf.yaml, que se encuentra en la carpeta conf.d/ en la raíz del directorio de configuración de tu Agent, para empezar a recopilar los datos de rendimiento de tu Ray. Para conocer todas las opciones de configuración disponibles, consulta el archivo de configuración de ejemplo.
Este ejemplo muestra la configuración como una etiqueta (label) de Docker dentro de docker-compose.yml. Para ver todas las opciones de configuración disponibles, consulta el [archivo de configuración de ejemplo1.
Este ejemplo demuestra la configuración como anotaciones de Kubernetes en tus pods Ray. Para ver todas las opciones de configuración disponibles, consulta el archivo de configuración de ejemplo.
Las métricas Ray están disponibles en el endpoint de OpenMetrics. Además, Ray te permite exportar métricas a nivel de aplicación. Puedes configurar la integración Ray para recopilar estas métricas utilizando la opción extra_metrics. Todas las métricas Ray, incluyendo tus métricas personalizadas, utilizan el prefijo ray..
Nota: Las métricas Ray personalizadas se consideran métricas estándar en Datadog.
Este ejemplo muestra una configuración que aprovecha la opción extra_metrics:
init_config:...instances:- openmetrics_endpoint:http://<RAY_ADDRESS>:8080# Also collect your own Ray metricsextra_metrics:- my_custom_ray_metric
La recopilación de logs se encuentra deshabilitada de manera predeterminada en el Datadog Agent. Para habilitarla, consulta Recopilación de logs de Kubernetes.
A continuación, configura las Integraciones de logs como anotaciones de pod. Esto también se puede configurar con un archivo, un configmap o un almacén de valores clave. Para obtener más información, consulta la sección Recopilación de logs de Kubernetes.