- 필수 기능
- 시작하기
- Glossary
- 표준 속성
- Guides
- Agent
- 통합
- 개방형텔레메트리
- 개발자
- API
- Datadog Mobile App
- CoScreen
- Cloudcraft
- 앱 내
- 서비스 관리
- 인프라스트럭처
- 애플리케이션 성능
- APM
- Continuous Profiler
- 스팬 시각화
- 데이터 스트림 모니터링
- 데이터 작업 모니터링
- 디지털 경험
- 소프트웨어 제공
- 보안
- AI Observability
- 로그 관리
- 관리
Supported OS
이 점검은 Kubernetes 컨트롤 플레인에서 사용되는 구성 요소인 Kube_metrics_server v0.3.0+를 모니터링합니다.
Kube_metrics_server 점검은 Datadog Agent 패키지에 포함되어 있으므로 서버에 추가 설치가 필요하지 않습니다.
호스트에서 실행 중인 에이전트에 대해 이 점검을 구성하려면:
Agent의 설정 디렉터리 루트에서 conf.d/
폴더에 있는 kube_metrics_server.d/conf.yaml
파일을 편집하여 kube_metrics_server 성능 데이터 수집을 시작합니다. 사용 가능한 모든 설정 옵션은 [샘플 kube_metrics_server.d/conf.yaml][4]을 참조하세요.
컨테이너화된 환경의 경우 아래 파라미터 적용에 대한 지침은 Kubernetes Autodiscovery 통합 템플릿을 참조하세요.
파라미터 | 값 |
---|---|
<INTEGRATION_NAME> | kube_metrics_server |
<INIT_CONFIG> | 비어 있음 또는 {} |
<INSTANCE_CONFIG> | {"prometheus_url": "https://%%host%%:443/metrics"} |
엔드포인트에 보안이 설정된 경우 추가 구성이 필요합니다.
메트릭 엔드포인트 보안에 사용되는 인증서를 식별합니다.
Agent 파드에 관련 인증서 파일을 마운트합니다.
SSL 설정을 적용합니다. 자세한 내용은 기본 설정 파일을 참조하세요.
Agent의 상태 하위 명령을 실행하고 Checks 섹션에서 kube_metrics_server
를 찾습니다.
kube_metrics_server.authenticated_user.requests (count) | Counter of authenticated requests broken out by username |
kube_metrics_server.go.gc_duration_seconds.count (gauge) | Number of the GC invocation |
kube_metrics_server.go.gc_duration_seconds.quantile (gauge) | GC invocation durations quantiles |
kube_metrics_server.go.gc_duration_seconds.sum (gauge) | GC invocation durations sum |
kube_metrics_server.go.goroutines (gauge) | Number of goroutines that currently exist |
kube_metrics_server.kubelet_summary_request_duration.count (gauge) | Number of Kubelet summary request |
kube_metrics_server.kubelet_summary_request_duration.sum (gauge) | The Kubelet summary request latencies sum |
kube_metrics_server.kubelet_summary_scrapes_total (count) | Total number of attempted Summary API scrapes done by Metrics Server |
kube_metrics_server.manager_tick_duration.count (gauge) | The total time spent collecting and storing metrics |
kube_metrics_server.manager_tick_duration.sum (gauge) | The total time spent collecting and storing metrics |
kube_metrics_server.process.max_fds (gauge) | Maximum number of open file descriptors |
kube_metrics_server.process.open_fds (gauge) | Number of open file descriptors |
kube_metrics_server.scraper_duration.count (gauge) | Time spent scraping sources |
kube_metrics_server.scraper_duration.sum (gauge) | Time spent scraping sources |
kube_metrics_server.scraper_last_time (gauge) | Last time metrics-server performed a scrape since unix epoch |
Kube_metrics_server는 이벤트를 포함하지 않습니다.
kube_metrics_server.prometheus.health
Returns CRITICAL
if the check cannot access the metrics endpoint.
Statuses: ok, critical
kube_metrics_server.up
Returns CRITICAL
if Kubernetes Metrics Server is not healthy.
Statuses: ok, critical
도움이 필요하신가요? Datadog 지원팀에 문의하세요.