Este check monitoriza Ambari a través del Datadog Agent.
Configuración
Instalación
El check de Ambari está incluido en el paquete del Datadog Agent, por lo que no necesitas instalar nada más en tu servidor.
Configuración
Host
Para configurar este check para un Agent que se ejecuta en un host:
Recopilación de métricas
Edita el archivo ambari.d/conf.yaml, que se encuentra en la carpeta conf.d/ en la raíz del directorio de configuración de tu Agent, para empezar a recopilar los datos de rendimiento de tu Ambari. Para conocer todas las opciones de configuración disponibles, consulta el ambari.d/conf.yaml de ejemplo.
init_config:instances:## @param url - string - required## The URL of the Ambari Server, include http:// or https://#- url:localhost
Disponible para la versión 6.0 o posteriores del Agent
La recopilación de logs está deshabilitada por defecto en el Datadog Agent. Actívala en tu archivo datadog.yaml:
logs_enabled:true
Edita tu ambari.d/conf.yaml y quita los comentarios de las líneas logs de la parte inferior. Actualiza path con la ruta correcta a tus archivos de logs de Ambari.
Para entornos en contenedores, consulta las plantillas de integración de Autodiscovery para obtener orientación sobre la aplicación de los parámetros que se indican a continuación.
Recopilación de métricas
Parámetro
Valor
<INTEGRATION_NAME>
ambari
<INIT_CONFIG>
en blanco o {}
<INSTANCE_CONFIG>
{"url": "http://%%host%%"}
Recopilación de logs
Disponible para la versión 6.0 o posteriores del Agent
La recopilación de logs se encuentra deshabilitada de manera predeterminada en el Datadog Agent. Para habilitarla, consulta Recopilación de logs de Kubernetes.
Esta integración recopila para cada host de cada clúster las siguientes métricas del sistema:
boottime
la cpu
el disco
la memoria
la carga
la red
el proceso
Si se habilita la recopilación de métricas de servicio con collect_service_metrics, esta integración recopila para cada componente de servicio incluido las métricas con encabezados en la lista de inclusión.
Métricas
ambari.boottime (gauge)
Host boot time. Shown as millisecond
ambari.cpu.cpu_idle (gauge)
Host Idle CPU. Shown as percent
ambari.cpu.cpu_nice (gauge)
Host Nice CPU. Shown as percent
ambari.cpu.cpu_num (gauge)
Host Idle CPU.
ambari.cpu.cpu_system (gauge)
Host System CPU. Shown as percent
ambari.cpu.cpu_user (gauge)
Host User CPU. Shown as percent
ambari.cpu.cpu_wio (gauge)
Host CPU waiting for IO. Shown as percent
ambari.disk.disk_free (gauge)
Free disk space. Shown as byte
ambari.disk.disk_total (gauge)
Total disk size. Shown as byte
ambari.disk.read_bytes (gauge)
Read bytes. Shown as byte
ambari.disk.read_count (gauge)
Read count.
ambari.disk.read_time (gauge)
Disk read time. Shown as millisecond
ambari.disk.write_bytes (gauge)
Written bytes. Shown as byte
ambari.disk.write_count (gauge)
Written count.
ambari.disk.write_time (gauge)
Disk write time. Shown as millisecond
ambari.load_fifteen (gauge)
Load fifteen. Shown as percent
ambari.load_five (gauge)
Load Five. Shown as percent
ambari.load_one (gauge)
Load one. Shown as percent
ambari.memory.mem_cached (gauge)
Cached Memory. Shown as byte
ambari.memory.mem_free (gauge)
Free Memory. Shown as byte
ambari.memory.mem_shared (gauge)
Shared Memory. Shown as byte
ambari.memory.mem_total (gauge)
Total Memory Shown as byte
ambari.memory.swap_free (gauge)
Free Swap Shown as byte
ambari.memory.swap_total (gauge)
Total Swap Shown as byte
ambari.network.bytes_in (gauge)
Network bytes in. Shown as byte
ambari.network.bytes_out (gauge)
Network bytes out. Shown as byte
ambari.network.pkts_in (gauge)
Network packets in. Shown as byte
ambari.network.pkts_out (gauge)
Network packets out. Shown as byte
ambari.process.proc_run (gauge)
Process run.
ambari.process.proc_total (gauge)
Process total.
Eventos
Ambari no incluye ningún evento.
Checks de servicio
ambari.can_connect Returns OK if the cluster is reachable, CRITICAL otherwise. Statuses: ok, critical
ambari.state Returns OK if the service is installed or running, WARNING if the service is stopping or uninstalling, CRITICAL if the service is uninstalled or stopped. Statuses: ok, warning, critical