Kubernetes Metrics Server
Présentation
Ce check surveille Kube_metrics_server v0.3.0+, qui fait partie du plan de contrôle de Kubernetes.
Configuration
Installation
Le check Kube_metrics_server est inclus dans le package de l’Agent Datadog. Vous n’avez donc rien d’autre à installer sur votre serveur.
Configuration
Host
Pour configurer ce check lorsque l’Agent est exécuté sur un host :
Modifiez le fichier kube_metrics_server.d/conf.yaml
dans le dossier conf.d/
à la racine du répertoire de configuration de votre Agent pour commencer à recueillir vos données de performance kube_metrics_server. Consultez le fichier d’exemple kube_metrics_server.d/conf.yaml pour découvrir toutes les options de configuration disponibles.
Redémarrez l’Agent.
SSL
Si votre endpoint est sécurisé, une configuration supplémentaire est requise :
Identifiez le certificat utilisé pour sécuriser l’endpoint des métriques.
Montez le fichier de certificat associé dans le pod de l’Agent.
Appliquez votre configuration SSL. Référez-vous au fichier de configuration par défaut pour en savoir plus.
Validation
Lancez la sous-commande status de l’Agent et cherchez kube_metrics_server
dans la section Checks.
Données collectées
Métriques
kube_metrics_server.authenticated_user.requests (count) | Counter of authenticated requests broken out by username |
kube_metrics_server.go.gc_duration_seconds.count (gauge) | Number of the GC invocation |
kube_metrics_server.go.gc_duration_seconds.quantile (gauge) | GC invocation durations quantiles |
kube_metrics_server.go.gc_duration_seconds.sum (gauge) | GC invocation durations sum |
kube_metrics_server.go.goroutines (gauge) | Number of goroutines that currently exist |
kube_metrics_server.kubelet_summary_request_duration.count (gauge) | Number of Kubelet summary request |
kube_metrics_server.kubelet_summary_request_duration.sum (gauge) | The Kubelet summary request latencies sum |
kube_metrics_server.kubelet_summary_scrapes_total (count) | Total number of attempted Summary API scrapes done by Metrics Server |
kube_metrics_server.manager_tick_duration.count (gauge) | The total time spent collecting and storing metrics |
kube_metrics_server.manager_tick_duration.sum (gauge) | The total time spent collecting and storing metrics |
kube_metrics_server.process.max_fds (gauge) | Maximum number of open file descriptors |
kube_metrics_server.process.open_fds (gauge) | Number of open file descriptors |
kube_metrics_server.scraper_duration.count (gauge) | Time spent scraping sources |
kube_metrics_server.scraper_duration.sum (gauge) | Time spent scraping sources |
kube_metrics_server.scraper_last_time (gauge) | Last time metrics-server performed a scrape since unix epoch |
Checks de service
kube_metrics_server.prometheus.health :
Renvoie CRITICAL
si l’Agent ne parvient pas à se connecter aux endpoints de métriques.
Événements
kube_metrics_server n’inclut aucun événement.
Dépannage
Besoin d’aide ? Contactez l’assistance Datadog.