El check de Marathon del Agent te permite hacer lo siguiente:
rastrear el estado de cada aplicación: consulta la configuración de la memoria, el disco, la CPU y las instancias; monitorizar el número de tareas en buen estado y en mal estado;
monitorizar el número de aplicaciones puestas en cola y el número de despliegues.
Sigue las instrucciones de abajo para configurar este check para un Agent que se ejecuta en un host. En el caso de entornos en contenedores, consulta la sección Contenedores.
init_config:instances:# the API endpoint of your Marathon master; required- url:"https://<SERVER>:<PORT>"# if your Marathon master requires ACS auth# acs_url: https://<SERVER>:<PORT># the username for Marathon API or ACS token authenticationusername:"<USERNAME>"# the password for Marathon API or ACS token authenticationpassword:"<PASSWORD>"
La función de username y password depende de si configuras la acs_url o no. Si lo haces, el Agent los utiliza para solicitar un token de autenticación a ACS, que luego utiliza para autenticarse en la API de Marathon. De lo contrario, el Agent utiliza username y password para autenticarse directamente en la API de Marathon.
Disponible para las versiones del Agent a partir de la 6.0
La recopilación de logs se encuentra deshabilitada de manera predeterminada en el Datadog Agent; habilítala en el archivo datadog.yaml:
logs_enabled:true
Dado que Marathon utiliza logback, puedes especificar un formato de logs personalizado. Con Datadog, se admiten dos formatos: el predeterminado que proporciona Marathon y el formato recomendado de Datadog. Añade un apéndice de archivo a tu configuración como en el siguiente ejemplo y reemplaza $PATTERN$ por el formato que hayas seleccionado:
Configuración predeterminada de Marathon: [%date] %-5level %message \(%logger:%thread\)%n
<?xml version="1.0" encoding="UTF-8"?><configuration><shutdownHookclass="ch.qos.logback.core.hook.DelayingShutdownHook"/><appendername="stdout"class="ch.qos.logback.core.ConsoleAppender"><encoder><pattern>[%date] %-5level %message \(%logger:%thread\)%n</pattern></encoder></appender><appendername="async"class="ch.qos.logback.classic.AsyncAppender"><appender-refref="stdout"/><queueSize>1024</queueSize></appender><appendername="FILE"class="ch.qos.logback.core.FileAppender"><file>/var/log/marathon.log</file><append>true</append><!-- set immediateFlush to false for much higher logging throughput --><immediateFlush>true</immediateFlush><encoder><pattern>$PATTERN$</pattern></encoder></appender><rootlevel="INFO"><appender-refref="async"/><appender-refref="FILE"/></root></configuration>
Añade este bloque de configuración a tu archivo marathon.d/conf.yaml para empezar a recopilar logs de Marathon:
En el caso de los entornos en contenedores, consulta las Plantillas de integración de Autodiscovery para obtener orientación sobre la aplicación de los parámetros que se indican abajo.
Disponible para las versiones del Agent a partir de la 6.0
La recopilación de logs se encuentra deshabilitada de manera predeterminada en el Datadog Agent. Para habilitarla, consulta Recopilación de logs de Kubernetes.
marathon.can_connect CRITICAL if either cannot connect to API endpoint or no instances of any application are running. WARN if no applications are detected. Additional information about response status at the time of collection is included in the check message. Statuses: ok, critical