백엔드 서비스 오류 추적

개요

오류 추적 탐색기에서 확인된 문제의 세부정보

Datadog에서 수집한 오류를 일관되게 모니터링하는 것은 시스템 상태를 위해 매우 중요합니다. 개별 오류 이벤트가 많으면 트러블슈팅을 위해 오류의 우선 순위를 정하기가 어려워집니다.

오류 추적은 수천 개의 유사한 오류를 하나의 이슈로 그룹화하여 디버깅을 간소화합니다. 이슈는 다음과 같은 인사이트를 제공하는 오류 데이터의 집합체입니다.

  • 영향을 받은 사용자 수
  • 오류가 처음 발생한 시기
  • 어떤 커밋이 오류를 발생시켰을까요?

오류 추적을 통해 다음을 수행할 수 있습니다:

  • 치명적인 오류 추적, 분류 및 디버그
  • 유사한 오류를 이슈로 그룹화하여 중요한 오류를 더 쉽게 식별하고 노이즈를 줄일 수 있습니다.
  • 오류 추적 이벤트에서 모니터를 설정합니다. 예: 높은 오류 볼륨 또는 새로운 문제 등
  • 시간 경과에 따른 문제를 추적하여 문제가 처음 시작된 시기, 현재 진행 여부, 발생 빈도를 파악하세요.

설정

오류 추적은 APM에서 지원하는 모든 언어에 사용할 수 있으며 다른 SDK를 사용할 필요가 없습니다.

(선택 사항) 스택 트레이스에서 코드 스니펫을 확인하려면 GitHub 통합을 설정하세요.

스택 트레이스의 인라인 코드 스니펫

리포지토리 설정을 시작하려면 소스 코드 통합 문서를 참조하세요.

스팬 태그를 사용하여 오류 스팬 추적

Datadog 트레이서는 백엔드 서비스 소스 코드의 통합 및 수동 계측을 통해 오류를 수집합니다. 오류가 서비스 항목 스팬(최상위 서비스 스팬)에 있는 경우 트레이스 내의 오류 스팬은 오류 추적에 의해 처리됩니다. 이 스팬에는 추적할 error.stack, error.messageerror.type 스팬 태그도 포함되어야 합니다.

오류가 있는 플레임 그래프

오류 추적은 오류 유형, 오류 메시지 및 스택 트레이스를 형성하는 프레임을 사용하여 처리할 각 오류 스팬의 지문을 계산합니다. 동일한 지문이 있는 오류는 그룹화되며 동일한 이슈에 속합니다. 자세한 내용은 트레이스 탐색기 문서를 참조하세요.

트러블슈팅 또는 디버깅을 시작하기 위한 이슈 검토

오류 추적은 오류 추적 탐색기를 통해 백엔드 서비스에서 수집한 오류를 이슈로 자동 분류합니다. 주요 기능을 살펴보려면 오류 추적 탐색기 설명서를 참조하세요.

APM에서 생성된 이슈에는 영향을 받은 스팬의 분포, 가장 관련성이 높은 최신 스택 트레이스, 스팬 태그, 호스트 태그, 컨테이너 태그 및 메트릭이 포함됩니다.

참고 자료

PREVIEWING: rtrieu/product-analytics-ui-changes