SLO チェックリスト

はじめに

Navigate to the SLO Manage page.
ユーザーの目線から考えてみてください:
- ユーザーはアプリケーションをどのように操作していますか？
- アプリケーションを通じたユーザージャーニーはどのようなものですか？
- それらのジャーニーには、インフラストラクチャーのどの部分が関わっていますか？
- システムから何を期待していますか？何を達成したいと思っていますか？

Type of SLI	説明
可用性	サーバーはリクエストに正常に応答しましたか？
レイテンシー	サーバーがリクエストに応答するまでにどれぐらい時間がかかりましたか？
スループット	いくつのリクエストを処理できますか？

Type of SLI	説明
正確性	正しいデータが返されましたか？
鮮度	新しいデータまたは処理された結果が表示されるまでにどれぐらい時間がかかりますか？

Do you require an SLI calculation that is time-based or count-based?

The following SLO types are available in Datadog:

Metric-based SLOs

例: リクエストの 99% は、30 日間で 250 ms 未満で完了する必要があります。

Monitor-based SLOs

例: すべてのユーザーリクエストのタイムレイテンシーの 99% は、いずれの 30 日の範囲内でも250 ms 未満である必要があります。

Time-based SLI calculation
SLI calculated based on the underlying Monitor’s uptime
You can select a single monitor, multiple monitors (up to 20), or a single multi alert monitor with groups

新しいモニターの作成が必要な場合は Monitor create ページを開きます。

Time Slice SLOs

例: すべてのユーザーリクエストのタイムレイテンシーの 99% は、いずれの 30 日の範囲内でも250 ms 未満である必要があります。

Select your target: 99%, 99.5%, 99.9%, 99.95%, or any other target value that makes sense for your requirements.
Select your time window: over the last rolling 7, 30, or 90 days

SLO に名前を付けます。
説明を追加します: SLO が追跡している対象と、それがエンドユーザーのエクスペリエンスにとってなぜ重要なのかを記述します。参考としてダッシュボードのリンクを追加することもできます。
タグを追加します: 一般的には team および service のタグが用いられます。