Kubernetes Metrics Server

Supported OS Windows Mac OS

통합 버전5.0.0

개요

이 점검은 Kubernetes 컨트롤 플레인에서 사용되는 구성 요소인 Kube_metrics_server v0.3.0+를 모니터링합니다.

설정

설치

Kube_metrics_server 점검은 Datadog Agent 패키지에 포함되어 있으므로 서버에 추가 설치가 필요하지 않습니다.

구성

호스트

호스트에서 실행 중인 에이전트에 대해 이 점검을 구성하려면:

  1. Agent의 설정 디렉터리 루트에서 conf.d/ 폴더에 있는 kube_metrics_server.d/conf.yaml 파일을 편집하여 kube_metrics_server 성능 데이터 수집을 시작합니다. 사용 가능한 모든 설정 옵션은 [샘플 kube_metrics_server.d/conf.yaml][4]을 참조하세요.

  2. Agent를 재시작합니다.

컨테이너화

컨테이너화된 환경의 경우 아래 파라미터 적용에 대한 지침은 Kubernetes Autodiscovery 통합 템플릿을 참조하세요.

파라미터
<INTEGRATION_NAME>kube_metrics_server
<INIT_CONFIG>비어 있음 또는 {}
<INSTANCE_CONFIG>{"prometheus_url": "https://%%host%%:443/metrics"}

SSL

엔드포인트에 보안이 설정된 경우 추가 구성이 필요합니다.

  1. 메트릭 엔드포인트 보안에 사용되는 인증서를 식별합니다.

  2. Agent 파드에 관련 인증서 파일을 마운트합니다.

  3. SSL 설정을 적용합니다. 자세한 내용은 기본 설정 파일을 참조하세요.

검증

Agent의 상태 하위 명령을 실행하고 Checks 섹션에서 kube_metrics_server를 찾습니다.

수집한 데이터

메트릭

kube_metrics_server.authenticated_user.requests
(count)
Counter of authenticated requests broken out by username
kube_metrics_server.go.gc_duration_seconds.count
(gauge)
Number of the GC invocation
kube_metrics_server.go.gc_duration_seconds.quantile
(gauge)
GC invocation durations quantiles
kube_metrics_server.go.gc_duration_seconds.sum
(gauge)
GC invocation durations sum
kube_metrics_server.go.goroutines
(gauge)
Number of goroutines that currently exist
kube_metrics_server.kubelet_summary_request_duration.count
(gauge)
Number of Kubelet summary request
kube_metrics_server.kubelet_summary_request_duration.sum
(gauge)
The Kubelet summary request latencies sum
kube_metrics_server.kubelet_summary_scrapes_total
(count)
Total number of attempted Summary API scrapes done by Metrics Server
kube_metrics_server.manager_tick_duration.count
(gauge)
The total time spent collecting and storing metrics
kube_metrics_server.manager_tick_duration.sum
(gauge)
The total time spent collecting and storing metrics
kube_metrics_server.process.max_fds
(gauge)
Maximum number of open file descriptors
kube_metrics_server.process.open_fds
(gauge)
Number of open file descriptors
kube_metrics_server.scraper_duration.count
(gauge)
Time spent scraping sources
kube_metrics_server.scraper_duration.sum
(gauge)
Time spent scraping sources
kube_metrics_server.scraper_last_time
(gauge)
Last time metrics-server performed a scrape since unix epoch

이벤트

Kube_metrics_server는 이벤트를 포함하지 않습니다.

서비스 점검

kube_metrics_server.prometheus.health
Returns CRITICAL if the check cannot access the metrics endpoint.
Statuses: ok, critical

kube_metrics_server.up
Returns CRITICAL if Kubernetes Metrics Server is not healthy.
Statuses: ok, critical

트러블슈팅

도움이 필요하신가요? Datadog 지원팀에 문의하세요.

PREVIEWING: safchain/fix-custom-agent