概要

SLO エラーバジェットアラートは閾値に基づき、SLO のエラーバジェットの一定の割合が消費されなかったときに通知します。たとえば、対象とする 7 日間でエラーバジェットの 75% が消費されたらアラート、50% が消費されたら警告(オプション)のように設定します。

Note: Error budget alerts are available for the following SLO types:

エラーバジェットを含む SLO に関する主要な用語の説明については、サービスレベル目標を参照してください。

Error budget alert configuration

モニターの作成

  1. SLO ステータスページに移動します。
  2. 新しい SLO を作成、または既存のものを編集し、Save and Set Alert ボタンをクリックします。既存の SLO の場合は、SLO 詳細のサイドパネルの Set up Alerts ボタンをクリックすると、アラートのコンフィギュレーションに直接アクセスできます。
  3. Step 1: Setting alerting conditionsError Budget タブを選択
  4. 過去の target 日数において、エラーバジェットの消費割合が threshold を超えるとアラートをトリガーするタイミングを設定します。 。
  5. Add Notification information in the Configure notifications and automations section.
  6. Click the Create & Set Alert button on the SLO configuration page.
Create SLO and set up an error budget alert

API および Terraform

create-monitor API エンドポイントを使用して、SLO エラーバジェットアラートを作成することができます。以下は、SLO のエラーバジェットの 75% 以上が消費されたときに警告を発する SLO モニターのクエリ例です。slo_id をバーンレートアラートを構成する SLO の英数字 ID に置き換え、time_window を 7d、30d、または 90d のいずれかに置き換えます (SLO の構成に使用するターゲットによって異なります)。

error_budget("slo_id").over("time_window") > 75

また、Terraform の datadog_monitor リソースを使用して SLO エラーバジェットアラートを作成することも可能です。以下は、上記と同じクエリ例を使用して、メトリクスベースの SLO にエラーバジェットアラートを構成する .tf の例です。

プロバイダーバージョン v2.7.0 以前と v2.13.0 以降の場合

注: SLO エラーバジェットアラートは、Terraform プロバイダー v2.7.0 以前および v2.13.0 以降のみでサポートされています。v2.7.0 から v2.13.0 の間のバージョンはサポートされていません。

resource "datadog_monitor" "metric-based-slo" {
    name = "SLO Error Budget Alert Example"
    type  = "slo alert"

    query = <<EOT
    error_budget("slo_id").over("time_window") > 75
    EOT

    message = "Example monitor message"
    monitor_thresholds {
      critical = 75
    }
    tags = ["foo:bar", "baz"]
}

その他の参考資料

お役に立つドキュメント、リンクや記事:

PREVIEWING: may/unit-testing