Versión de la integración5.0.0
El check de proceso te permite:
- Recopila métricas del uso de recursos para procesos en ejecución específicos en cualquier host. Por ejemplo, CPU, memoria, E/S y número de subprocesos.
- Utiliza monitores de procesos para configurar umbrales de cuántas instancias de un proceso específico deben ejecutarse y recibe alertas cuando no se cumplen los umbrales (consulta *Checks de servicio a continuación).
Configuración
Instalación
El check de procesos está incluido en el paquete del Datadog Agent, por lo que no necesitas instalar nada más en tu servidor.
Configuración
A diferencia de muchos checks, el check de procesos no monitoriza nada útil por defecto. Debes configurar los procesos que quieres monitorizar.
Aunque no hay una configuración de check por defecto, aquí hay un ejemplo de process.d/conf.yaml
que monitoriza procesos SSH/SSHD. Para ver todas las opciones de configuración disponibles, consulta el process.d/conf.yaml de ejemplo:
init_config:
instances:
- name: ssh
search_string:
- ssh
- sshd
Nota: Asegúrate de reiniciar el Agent después de realizar cambios de configuración.
La recuperación de algunas métricas de procesos requiere que el recopilador de Datadog se ejecute como el usuario del proceso monitorizado o con acceso privilegiado. Para la métricaopen_file_descriptors
en plataformas Unix, existe una opción de configuración adicional. Configurar try_sudo
como true
en el archivo conf.yaml
permite que el El check de procesos intente utilizar sudo
para recopilar la métrica open_file_descriptors
. El uso de esta opción de configuración requiere definir reglas para sudoers apropiadas en /etc/sudoers
:
dd-agent ALL=NOPASSWD: /bin/ls /proc/*/fd/
Validación
Ejecuta el subcomando de estado del Agent y busca process
en la sección Checks.
Notas de métricas
Las siguientes métricas no están disponibles en Linux o macOS:
- Las métricas de I/O de procesos no están disponibles en Linux o macOS, ya que los archivos que lee el Agent (
/proc//io
) sólo pueden ser leídos por el propietario del proceso. Para obtener más información, lee las FAQ del Agent.
Las siguientes métricas no están disponibles en Windows:
system.cpu.iowait
system.processes.mem.page_faults.minor_faults
system.processes.mem.page_faults.children_minor_faults
system.processes.mem.page_faults.major_faults
system.processes.mem.page_faults.children_major_faults
system.processes.mem.real
Nota: Utiliza un check de WMI para reunir métricas de fallos de páginas en Windows.
Nota: En la versión 6.11 o posteriores en Windows, el Agent se ejecuta como ddagentuser
en lugar de Local System
. Debido a esto, no tiene acceso a la línea de comandos completa de los procesos que se ejecutan bajo otros usuarios y al usuario de otros procesos de usuarios. Esto provoca que las siguientes opciones de check no funcionen:
exact_match
, cuando se configura como false
user
, que permite seleccionar los procesos que pertenecen a un usuario específico
Todas las métricas se configuran por instance
en process.yaml y están etiquetados como process_name:<instance_name>
.
La métrica system.processes.cpu.pct
enviada por este check sólo es exacta en procesos que duran más
de 30 segundos. No esperes que tu valor sea exacto en procesos con duraciones más cortas.
Para ver la lista completa de métricas, consulta la sección Métricas.
Datos recopilados
Métricas
Eventos
El check de procesos no incluye eventos.
Checks de servicio
Solucionar problemas
¿Necesitas ayuda? Ponte en contacto con el servicio de asistencia de Datadog.
Referencias adicionales
Para hacerse una mejor idea de cómo (o por qué) monitorizar el consumo de recursos de los proceso con Datadog, consulta esta serie de entradas de blog.