Ce check permet de surveiller Ambari avec l’Agent Datadog.
Configuration
Installation
Le check Ambari est inclus avec le package de l’Agent Datadog. Vous n’avez donc rien d’autre à installer sur votre serveur.
Configuration
Host
Pour configurer ce check lorsque l’Agent est exécuté sur un host :
Collecte de métriques
Modifiez le fichier ambari.d/conf.yaml dans le dossier conf.d/ à la racine du répertoire de configuration de votre Agent pour commencer à recueillir vos données de performance Ambari. Consultez le fichier d’exemple ambari.d/conf.yaml pour découvrir toutes les options de configuration disponibles.
init_config:instances:## @param url - string - required## The URL of the Ambari Server, include http:// or https://#- url:localhost
La collecte de logs est désactivée par défaut dans l’Agent Datadog. Vous devez l’activer dans datadog.yaml :
logs_enabled:true
Modifiez votre fichier ambari.d/conf.yaml en supprimant la mise en commentaire des lignes logs en bas du fichier. Mettez à jour la ligne path en indiquant le bon chemin vers vos fichiers de log Ambari.
Cette intégration recueille les métriques système suivantes pour chaque host de chaque cluster :
boottime
cpu
disque
mémoire
chargement
réseau
processus
Si la collecte de métriques de service est activée avec collect_service_metrics, cette intégration recueille les métriques présentant des en-têtes figurant dans la liste d’inclusion pour chaque composant de service inclus.
Métriques
ambari.boottime (gauge)
Host boot time. Shown as millisecond
ambari.cpu.cpu_idle (gauge)
Host Idle CPU. Shown as percent
ambari.cpu.cpu_nice (gauge)
Host Nice CPU. Shown as percent
ambari.cpu.cpu_num (gauge)
Host Idle CPU.
ambari.cpu.cpu_system (gauge)
Host System CPU. Shown as percent
ambari.cpu.cpu_user (gauge)
Host User CPU. Shown as percent
ambari.cpu.cpu_wio (gauge)
Host CPU waiting for IO. Shown as percent
ambari.disk.disk_free (gauge)
Free disk space. Shown as byte
ambari.disk.disk_total (gauge)
Total disk size. Shown as byte
ambari.disk.read_bytes (gauge)
Read bytes. Shown as byte
ambari.disk.read_count (gauge)
Read count.
ambari.disk.read_time (gauge)
Disk read time. Shown as millisecond
ambari.disk.write_bytes (gauge)
Written bytes. Shown as byte
ambari.disk.write_count (gauge)
Written count.
ambari.disk.write_time (gauge)
Disk write time. Shown as millisecond
ambari.load_fifteen (gauge)
Load fifteen. Shown as percent
ambari.load_five (gauge)
Load Five. Shown as percent
ambari.load_one (gauge)
Load one. Shown as percent
ambari.memory.mem_cached (gauge)
Cached Memory. Shown as byte
ambari.memory.mem_free (gauge)
Free Memory. Shown as byte
ambari.memory.mem_shared (gauge)
Shared Memory. Shown as byte
ambari.memory.mem_total (gauge)
Total Memory Shown as byte
ambari.memory.swap_free (gauge)
Free Swap Shown as byte
ambari.memory.swap_total (gauge)
Total Swap Shown as byte
ambari.network.bytes_in (gauge)
Network bytes in. Shown as byte
ambari.network.bytes_out (gauge)
Network bytes out. Shown as byte
ambari.network.pkts_in (gauge)
Network packets in. Shown as byte
ambari.network.pkts_out (gauge)
Network packets out. Shown as byte
ambari.process.proc_run (gauge)
Process run.
ambari.process.proc_total (gauge)
Process total.
Événements
Ambari n’inclut aucun événement.
Checks de service
ambari.can_connect Returns OK if the cluster is reachable, CRITICAL otherwise. Statuses: ok, critical
ambari.state Returns OK if the service is installed or running, WARNING if the service is stopping or uninstalling, CRITICAL if the service is uninstalled or stopped. Statuses: ok, warning, critical