- 필수 기능
- 시작하기
- Glossary
- 표준 속성
- Guides
- Agent
- 통합
- 개방형텔레메트리
- 개발자
- API
- Datadog Mobile App
- CoScreen
- Cloudcraft
- 앱 내
- 서비스 관리
- 인프라스트럭처
- 애플리케이션 성능
- APM
- Continuous Profiler
- 스팬 시각화
- 데이터 스트림 모니터링
- 데이터 작업 모니터링
- 디지털 경험
- 소프트웨어 제공
- 보안
- AI Observability
- 로그 관리
- 관리
서비스 수준 목표(Service Level Objectives) 또는 SLO는 사이트 안정성 엔지니어링 툴킷의 핵심이며, 애플리케이션 성능에 대해 명확한 목표를 정의할 수 있는 프레임 워크를 제공합니다. 이를 통해 각 팀이 일관된 고객 경험을 제공하고 기능 개발과 플랫폼 안정성의 균형을 유지하며 내부 및 외부 사용자와의 커뮤니케이션을 개선할 수 있도록 합니다.
SLO를 생성할 때 다음 유형 중에서 선택할 수 있습니다:
전체 비교는 SLO 유형 비교 차트를 참조하세요.
Datadog 의 서비스 수준 목표(서비스 수준 목표) 상태 페이지를 사용하여 새 SLO를 만들거나 기존의 모든 SLO를 보고 관리할 수 있습니다.
서비스 수준 목표(SLO)를 설정한 후 서비스 수준 목표 목록 보기에서 선택하여 세부 정보 사이드 패널을 엽니다. 사이드 패널에는 각 SLO의 목표에 대한 전체 상태 비율과 남은 오류 예산이 표시되며, 상태 표시줄(모니터링 기반 SLO) 또는 막대 그래프(메트릭 기반 SLO)로 SLI의 이력이 표시됩니다. 하나의 다중 알림 모니터링을 사용하여 그룹화된 모니터링 기반 SLO를 만들거나 sum by
절을 사용하여 그룹화된 메트릭 기반 SLO를 생성한 경우 전체 상태 비율 및 남은 오류 예산과 함께 각 개별 그룹에 대한 상태 비율 및 남은 오류 예산이 함께 표시됩니다.
예: 가용 영역 당 지연 시간 추적을 위해 모니터 기반 SLO를 생성하는 경우 전체 SLO 및 SLO가 추적 중인 각 개별 가용 영역에 대한 상태 백분율과 남은 오류 예산이 표시됩니다.
참고: 남은 오류 예산은 백분율로 표시되며 다음 공식을 사용하여 계산됩니다:
$$\text"error budget remaining" = 100 * {\text"current status" - \text" target"} / { 100 - \text"target"}$$
오류 예산 및 오류 예산 경고를 효율적으로 활용하려면 SLO 목푯값을 100% 미만으로 설정해야 합니다.
100% 목표를 설정한다는 것은 오류 예산이 100%—SLO 목표와 같기 때문에 0%의 오류 예산을 갖는다는 것을 의미합니다. 허용 가능한 위험을 나타내는 오류 예산을 확인함으로써 고객 대면 서비스 안정성 유지와 기능 개발 투자라는 상충되는 우선순위를 조정할 수 있습니다. 또한 목푯값이 100%인 SLO는 SLO 경보 평가에서 0의 오류로 분류됩니다.
참고: SLO에 대해 지정할 수 있는 소수 자릿수는 SLO 유형과 선택한 시간 창에 따라 다릅니다. 각 SLO 유형에 대한 자세한 내용은 아래 링크를 참조하세요.
모니터링 기반 SLO: 7일 및 30일 목표의 경우 소수점 둘째 자리까지 허용되며, 90일 목표의 경우 소수점 셋째 자리까지 허용됩니다.
메트릭 기반 SLO: 모든 대상에 소수점 이하 세 자리까지 허용됩니다.
SLO를 편집하려면 목록 보기에서 SLO의 행 위에 마우스를 올려놓고 행 오른쪽에 나타나는 연필 아이콘을 클릭하거나 행을 클릭하여 세부 정보 사이드 패널을 연 후 패널 오른쪽 상단에 있는 톱니 모양 아이콘에서 편집 버튼을 선택합니다.
모든 사용자는 연결된 역할에 관계없이 SLO 및 SLO 상태 수정을 볼 수 있습니다. slos_write
권한이 있는 역할에 연결된 사용자만 SLO를 만들고, 수정하고, 삭제할 수 있습니다.
상태 수정을 생성, 편집 및 삭제하려면 사용자에게 slos_corrections
권한이 필요합니다. 이 권한이 있는 사용자는 해당 SLO를 편집할 수 있는 권한이 없더라도 상태 수정을 할 수 있습니다. 전체 권한에 대한 목록 내용은 RBAC 문서를 참조하세요.
편집할 수 있는 역할의 목록 을 지정하여 개별 SLO에 대한 액세스를 제한합니다.
SLO에 대한 수정 액세스 권한을 유지하려면 저장하기 전에 자신이 구성원인 역할을 하나 이상 포함해야 합니다. 액세스 제어( 목록 )의 사용자는 역할을 추가할 수 있으며 자신이 아닌 다른 역할만 제거할 수 있습니다.
참고: 사용자는 모니터링에 대한 쓰기 권한이 없더라도 모든 모니터링에 대한 SLO를 생성할 수 있습니다. 마찬가지로, 사용자는 SLO에 대한 쓰기 권한이 없더라도 SLO 알림을 생성할 수 있습니다. 모니터에 대한 RBAC 권한에 대한 자세한 내용은 RBAC 설명서 또는 모니터에 대한 RBAC 설정 방법 가이드를 참조하세요.
서비스 수준 목표 상태 페이지에서는 모든 SLO의 고급 검색을 실행하여 검색 결과에서 SLO를 찾고, 보고, 수정하고, 복제하거나 삭제할 수 있습니다.
고급 검색을 사용하면 다양한 SLO의 속성을 조합해 SLO를 조회할 수 있습니다.
name
및 description
- 본문 검색time window
- 7일, 30일, 90일type
- 메트릭, 모니터creator
tags
- 데이터 센터, env, 서비스, 팀 등.검색을 실행하려면 왼쪽 측면의 패싯 체크박스와 상단에 있는 검색 창을 사용하세요. 박스를 선택하면 검색 창이 해당 쿼리로 업데이트됩니다. 마찬가지로 검색 창의 쿼리를 수정할 때(또는 처음부터 새로 작성할 때) 체크박스를 통해 변경할 수 있습니다. 쿼리 결과는 쿼리를 편집할 때 실시간으로 업데이트되며, 검색 버튼은 사용되지 않습니다.
SLO를 모든 태그를 설정별로 그룹화하여 데이터의 요약 보기를 확인하세요. 각 상태(위반, 경고, 정상, 데이터 없음)에 있는 SLO의 수를 서비스, 팀, 사용자 여정, 계층 또는 기타 설정된 태그별로 그룹화하여 빠르게 분석할 수 있습니다.
상태 및 오류 예산 열을 기준으로 SLO를 정렬하여 주의가 필요한 SLO의 우선순위를 정하세요. SLO 목록에는 설정에서 선택한 기본 기간 동안의 SLO에 대한 세부 정보가 표시됩니다. 다른 모든 설정 기간은 개별 사이드 패널에서 볼 수 있습니다. 해당 표 행을 클릭하여 SLO 세부정보 사이드 패널을 엽니다.
참고: 모바일 기기 홈 화면에서 Datadog 모바일 앱을 다운로드하여 Apple 앱 스토어 및 Google Play 스토어에서 SLO를 확인할 수 있습니다.
SLO 태그는 SLO 상태 페이지에서 필터링하거나, SLO 저장 보기를 만들거나, SLO를 그룹화하는 데 사용할 수 있습니다. 태그는 다음과 같은 방법으로 SLO에 추가할 수 있습니다:
SLO 목록 보기에서 기본 SLO 페이지가 나타납니다.
기본 페이지는 다음을 포함합니다:
저장된 페이지를 사용하면 다음을 공유하여 SLO에 대한 맞춤 검색을 SLO 목록 보기에 저장하고 팀과 공유할 수 있습니다:
목록 보기에서 SLO의 하위 집합을 조회한 후 해당 쿼리를 저장된 페이지에 추가할 수 있습니다.
저장된 페이지를 추가하려면:
저장된 페이지를 불러오려면 페이지 왼쪽 상단에 있는 페이지 보기 버튼을 눌러 저장된 페이지 패널을 열고 목록에서 선택합니다. 또는 저장된 페이지 패널 상단에 있는 저장된 페이지 필터링을 통해 검색할 수도 있습니다.
목록에 있는 저장된 페이지 위에 마우스를 놓으면 하이퍼링크 아이콘이 나타납니다. 아이콘을 클릭해 링크를 복사한 후 팀원들과 공유할 수 있습니다.
저장된 페이지를 선택하고 쿼리를 수정한 다음 저장된 페이지 패널에서 업데이트 버튼을 클릭하여 업데이트합니다. 저장된 페이지의 이름을 변경하거나 삭제하려면 저장된 페이지 패널에서 행 위로 마우스를 움직여 연필 아이콘 또는 휴지통 아이콘을 클릭합니다.
SLO 감사 이벤트 를 통해 이벤트 탐색기 또는 SLO 세부정보의 감사 내역 탭을 사용하여 SLO 설정 내역을 추적할 수 있습니다. 감사 이벤트 는 SLO 또는 SLO 상태 설정을 생성, 수정 또는 삭제할 때마다 이벤트 탐색기에 추가됩니다. 각 이벤트에는 SLO 또는 SLO 상태 수정의 설정에 대한 정보가 포함되어 있으며, 스트리밍은 시간 경과에 따른 설정 변경 내역을 제공합니다.
각 이벤트에는 다음과 같은 SLO 설정 정보가 포함됩니다:
이벤트 탐색기에는 세 가지 유형의 SLO 오딧 이벤트가 표시됩니다:
SLO Created
이벤트 생성 시 SLO 설정 정보 표시SLO Modified
이벤트 수정 동안 변경된 설정 정보 표시SLO Deleted
이벤트 SLO가 삭제되기 전의 설정 정보를 표시합니다.각 이벤트에는 다음과 같은 SLO 상태 수정 설정 정보가 포함되어 있습니다:
이벤트 탐색기에 세 가지 유형의 SLO 상태 수정 감사 이벤트가 표시됩니다:
SLO Correction Created
이벤트 생성 시 상태 수정 설정 정보 표시SLO Correction Modified
이벤트 수정하는 동안 변경된 설정 정보 표시SLO Correction Deleted
이벤트 상태 수정이 삭제되기 전의 설정 정보를 표시합니다.모든 SLO 감사 이벤트 의 전체 목록을 보려면 이벤트 탐색기에 검색 쿼리 tags:(audit AND slo)
를 입력하세요. 특정 SLO에 대한 이벤트 감사 목록을 보려면 원하는 SLO의 ID와 함께 tags:audit,slo_id:<SLO ID>
를 입력합니다. Datadog 이벤트 API 를 사용하여 프로그래밍 방식으로 이벤트 탐색기를 쿼리할 수도 있습니다.
참고: UI에 이벤트가 나타나지 않으면 이벤트 탐색기의 시간 범위를 지난 7일과 같이 더 긴 기간으로 설정해야 합니다.
또한 SLO 세부정보의 ‘감사 내역’ 탭 을 사용하여 개별 SLO에 대한 모든 감사 이벤트 를 볼 수도 있습니다:
이벤트 모니터를 사용하면 알림을 설정하여 SLO 감사 이벤트를 추적할 수 있습니다. 예를 들어 특정 SLO의 설정 가 수정될 때 알림을 받으려면 이벤트 모니터링을 설정하여 태그 audit,slo_id:<SLO ID>
를 통해 [SLO Modified]
텍스트를 추적합니다.
실제 클라우드 컴퓨팅 용량과 Datadog 평가판 계정으로 비용 없이 학습하세요. 지금 등록하여 대시보드 을 구축하여 SLO를 추적하는 방법에 대해 자세히 알아보세요.
SLO를 생성한 후에는 대시보드 및 위젯 을 통해 데이터를 시각화할 수 있습니다.
SLO 위젯에 대한 자세한 내용은 SLO 위젯 및 SLO 목록 위젯 페이지를 참조하세요. SLO 데이터 소스에 대한 자세한 내용은 대시보드에서 [과거 SLO 데이터 그래프 작성하기] 가이드를 참조하세요.
상태 수정을 통해 SLO 상태 및 오류 예산 계산에서 특정 기간만 제외할 수 있습니다. 이는 다음을 의미합니다:
수정을 적용하면 지정한 기간이 SLO의 계산에서 제외됩니다.
임시 조정을 위한 일회성 수정 또는 정기적인 주기로 발생하는 예측 가능한 조정을 위한 반복 수정을 만들 수 있는 옵션이 있습니다. 일회성 수정에는 시작 시간과 종료 시간이 필요하지만 반복 수정에는 시작 시간, 기간 및 간격이 필요합니다. 반복 수정은 iCalendar RFC 5545의 RRULE 사양을 기반으로 합니다. 지원되는 규칙은 FREQ
, INTERVAL
, COUNT
, UNTIL
입니다. 수정을 무한정 반복해야 하는 경우 반복 수정의 종료 날짜를 부수적인 것으로 지정합니다.
어떠한 수정 유형이든 수정 사유를 나타내는 수정 카테고리를 반드시 선택해야 합니다. 사용 가능한 카테고리는 Scheduled Maintenance
, Outside Business Hours
, Deployment
, Other
입니다. 필요시 설명을 추가할 수 있습니다.
각 SLO는 쿼리 성능을 보장하기 위해 수정 제한을 두고 있습니다. 이러한 제한은 SLO 당 지난 90일에만 적용되므로 지난 90일 이전 기간에 대한 수정은 제한에 포함되지 않습니다. 이는 다음을 의미합니다:
SLO 당 90일 제한은 다음과 같습니다:
수정 유형 | SLO 당 제한 |
---|---|
1회 | 100 |
매일 반복 | 2 |
매주 반복 | 3 |
매달 반복 | 5 |
SLO의 사이드 패널에서 Correct Status
, SLO 상태 수정 API 또는 Terraform 리소스를 선택하여 UI를 통해 상태 수정을 설정할 수 있습니다.
UI에서 SLO 상태 수정에 액세스하려면:
One-Time
과 Recurring
중에 선택한 후 수정할 기간을 지정합니다.수정한 내용을 편집하거나 삭제하려면 SLO 세부 사이드 패널 보기 상단에 있는 수정 탭을 클릭하세요.
SLO 캘린더 보기는 SLO 상태 페이지에서 사용할 수 있습니다. 오른쪽 상단에서 ‘기본’ 보기에서 ‘주별’ 또는 ‘월별’ 보기로 전환하면 12개월간의 과거 SLO 상태 데이터를 볼 수 있습니다. 캘린더 보기는 메트릭 기반 SLO 및 타임슬라이스 SLO에 대해 지원됩니다.
‘주별’ 또는 ‘월별’ 캘린더 보기로 전환하면 SLO 상태 페이지에서 SLO CSV 내보내기 기능을 사용할 수 있습니다. 이러한 보기에서 새로운 ‘CSV로 내보내기’ 옵션에 액세스하여 다음 정보가 포함된 과거 SLO 데이터의 CSV를 다운로드할 수 있습니다:
다음 기간 동안 CSV 내보내기를 사용할 수 있습니다.
이 시간은 Datadog 에서 사용자의 표준 시간대 설정을 기준으로 합니다.
SLO 상태는 SLO 유형에 따라 계산됩니다:
참고: