Monitor de checks de procesos
Un monitor de checks de procesos observa el estado producido por el check del Agent process.up
. En el nivel del Agent puedes configurar los umbrales de tu check en función del número de procesos coincidentes.
Creación de un monitor
Para crear un monitor de checks de procesos en Datadog, utiliza la navegación principal: Monitors –> New Monitor –> Process Check (Monitores > Nuevo monitor > Check de proceso).
Elegir un proceso
En la lista desplegable, selecciona un proceso para monitorizar. Filtra la lista introduciendo tus criterios de búsqueda.
Elegir el contexto del monitor
Selecciona los hosts para monitorizar eligiendo nombres de host, etiquetas (tags), o elige All Monitored Hosts
. Solo se muestran los hosts o etiquetas que informan de un estado para el proceso seleccionado. Si necesitas excluir determinados hosts, utiliza el segundo campo para hacer una lista de nombres o etiquetas.
- El campo include (incluir) utiliza la lógica
AND
. Todos los nombres de host y etiquetas de la lista deben estar presentes en un host para que se incluya. - El campo exclude (excluir) utiliza la lógica
OR
. Se excluye cualquier host con un nombre o etiqueta de la lista.
Definir condiciones de alerta
Una alerta de check rastrea los estados consecutivos enviados por grupo de check y los compara con tus umbrales. Para monitores de checks de procesos, los grupos son estáticos: host
y process
.
Configura la alerta del check:
Activa la alerta después de un número de fallos consecutivos: <NUMBER>
Cuando se ejecuta el check, envía un estado de OK
, WARN
o CRITICAL
. Elige cuántas veces tiene que darse un estado WARN
y CRITICAL
para que se envíe una notificación. Por ejemplo, pongamos que se produce un error puntual en tu proceso y falla la conexión. Si tienes este valor establecido como > 1
, el fallo se ignorará, pero si el error se da más veces, se activará el envío de una notificación.
Resolver la alerta después de una cantidad consecutiva determinada de intentos sin errores: <NUMBER>
Configura cuántas veces tiene que darse el estado OK
para que se resuelva la alerta.
Una alerta de clúster calcula el porcentaje de checks de procesos en un estado determinado y lo compara con tus umbrales.
Configura una alerta de clúster:
Decide si quieres agrupar o no tus checks de procesos según una etiqueta. Ungrouped
calcula el porcentaje de estado de todas las fuentes. Grouped
calcula el porcentaje de estado por grupo.
Selecciona el porcentaje para los umbrales de alerta y de advertencia. Solo se requiere un parámetro (alerta o advertencia).
Cada check etiquetado con una combinación distinta de etiquetas se considera un check distinto en el clúster. Solo el estado del último check de cada combinación de etiquetas se tiene en cuenta en el cálculo del porcentaje del clúster.
Por ejemplo, un monitor de check de clúster agrupado por entornos puede enviar alertas si más del 70% de los checks en cualquiera de los entornos presentan un estado CRITICAL
y avisa si más del 70% de los checks en cualquiera de los entornos presentan un estado WARN
.
Condiciones de alerta avanzadas
Consulta la documentación Configuración de monitores para obtener información sobre las opciones Sin datos, Resolución automática y Retraso de nuevo grupo.
Notificaciones
Para obtener instrucciones detalladas sobre la sección Configure notifications and automations (Configurar notificaciones y automatizaciones), consulta la página Notificaciones.
Para leer más
Más enlaces, artículos y documentación útiles: