はじめに

  1. Navigate to the SLO Manage page.

  2. ユーザーの目線から考えてみてください:

    • ユーザーはアプリケーションをどのように操作していますか?
    • アプリケーションを通じたユーザージャーニーはどのようなものですか?
    • それらのジャーニーには、インフラストラクチャーのどの部分が関わっていますか?
    • システムから何を期待していますか?何を達成したいと思っていますか?

関連する SLI の選択

ステップ 1

応答 / リクエスト

Type of SLI説明
可用性サーバーはリクエストに正常に応答しましたか?
レイテンシーサーバーがリクエストに応答するまでにどれぐらい時間がかかりましたか?
スループットいくつのリクエストを処理できますか?

Storage

Type of SLI説明
可用性データにオンデマンドでアクセスできますか?
レイテンシーデータの読み書きにどれぐらい時間がかかりますか?
耐性データは必要なときに取り出せる状態ですか?

パイプライン

Type of SLI説明
正確性正しいデータが返されましたか?
鮮度新しいデータまたは処理された結果が表示されるまでにどれぐらい時間がかかりますか?

ステップ 2

Do you require an SLI calculation that is time-based or count-based?

The following SLO types are available in Datadog:

Metric-based SLOs

例: リクエストの 99% は、30 日間で 250 ms 未満で完了する必要があります。

  • Count-based SLI calculation
  • SLI is calculated as the sum of good events divided by the sum of total events

Monitor-based SLOs

例: すべてのユーザーリクエストのタイムレイテンシーの 99% は、いずれの 30 日の範囲内でも250 ms 未満で ある必要があります。

  • Time-based SLI calculation
  • SLI calculated based on the underlying Monitor’s uptime
  • You can select a single monitor, multiple monitors (up to 20), or a single multi alert monitor with groups

新しいモニターの作成が必要な場合は Monitor create ページを開きます。

Time Slice SLOs

例: すべてのユーザーリクエストのタイムレイテンシーの 99% は、いずれの 30 日の範囲内でも250 ms 未満で ある必要があります。

  • Time-based SLI calculation
  • SLI calculated based on your custom uptime definition using a metric query

Implement your SLIs

  1. カスタムメトリクス (例: カウンター)
  2. インテグレーションメトリクス (例: ロードバランサー、HTTP リクエスト)
  3. Datadog APM (例: エラー、サービスのレイテンシー、リソース)
  4. Datadog ログ (例: 特定のイベントの発生数に応じてログから生成されたメトリクス)

ターゲット目標および時間枠の設定

  1. Select your target: 99%, 99.5%, 99.9%, 99.95%, or any other target value that makes sense for your requirements.
  2. Select your time window: over the last rolling 7, 30, or 90 days

SLO の名前、説明、タグの追加

  1. SLO に名前を付けます。
  2. 説明を追加します: SLO が追跡している対象と、それがエンドユーザーのエクスペリエンスにとってなぜ重要なのかを記述します。参考としてダッシュボードのリンクを追加することもできます。
  3. タグを追加します: 一般的には team および service のタグが用いられます。

ビューおよび検索

タグを使用して SLO のリストビューから SLO を検索します

その他の参考資料

PREVIEWING: may/unit-testing