価値の提供
Datadog Partner Network Documentation
データの取り込みを設定した後、さらにいくつかのステップを踏むことで、クライアントにとっての価値を最大化することができます。ここでは、注目すべき主要な領域をいくつか紹介します。
モニターとダウンタイムの設定
モニターとアラートは、検査や介入が必要な特定のシステムやサービスに人間の注意を向けさせます。アラートを生成するために、Datadog は以下を提供します。
- モニター - アラート条件の定義
- ダウンタイム - アラートを発生させたり抑制したりする時間帯
一般的なモニターの概念に慣れるために、以下の資料を参照してください。
モニターの移行
サービスプロバイダーは、しばしばクライアントを別のモニタリングまたは観測可能性プラットフォームから Datadog に移行する必要があります。このような場合、以前のソリューションのモニターを Datadog で複製することが論理的に思えるかもしれません。このアプローチでは、Datadog の最も有用な機能の多くが使用されないままになってしまうことがよくあります。特に、問題の検出と解決時間を改善したり、アラート疲労を軽減したりする機能は見逃せません。
移行プロジェクトを開始する前に、既存のアラートおよびしきい値の定義を確認し、以下の質問に回答してください。
- メトリクスに時間的な変動がありますか?異常モニターの方が良いかもしれません。
- メトリクスに負荷に応じた変動がありますか?メトリクスに負荷を示すメトリクスを組み合わせることで、演算モニターが最適なアプローチとなるかもしれません。例えば、あるサービスを利用するユーザーが多ければ、システムの負荷は高くなる可能性があります。
- メトリクスの絶対値は、変化率よりも重要ではないですか?変化モニターや予測モニターが最適なアプローチかもしれません。
- メトリクスの値そのものは、他のホストやエンティティの値と異なるかどうかよりも重要性が低いですか?例えば、クラスター内のあるノードが高いレイテンシーを経験しているのに、他のノードはそうでない場合などです。このようなシナリオでは、外れ値モニターが最適なアプローチとなります。
- 複数のメトリクスを組み合わせたものだけが、アクションを起こせる状況を示しますか?複合条件モニターは、スクリプトを必要としない解決策を提供します。
プログラムモニター管理
サービスプロバイダーとして、あなたやクライアントのためのモニターの管理は、次のいずれかの方法でプログラム的に達成するのが最善です。
大量のモニターを簡単に管理するために、モニターにタグを付けることを徹底してください。
推奨モニター
クライアントが運用するテクノロジーで、自分があまり経験のないものに遭遇することがあります。Datadog は、新しいテクノロジーを迅速かつ自信を持って導入できるように、推奨モニターを提供しています。
モニターについて詳しくは、こちらをご覧ください。
ダウンタイム
モニターやアラートに関する一般的な問題として、アラームや通知の過多によりアラームに対する感覚が鈍るアラート疲労があります。アラート疲労に対処する 1 つの方法は、誤検出アラートの数を制限することです。これは、計画的なシステムのシャットダウン、メンテナンス、アップグレードウィンドウなどの管理された状況において特に適切です。
Datadog のダウンタイムは、計画的 (またはアドホック) なメンテナンス時にモニターをミュートする方法をあなたやクライアントに提供します。
ダウンタイムの管理、特にプログラムによる管理について詳しくは、こちらをご覧ください。
通知
通知に関する一般的なガイドラインをいくつか紹介します。
- 自由なアラート、慎重なページ
- 原因ではなく、症状に関するページ
Datadog は、あなたやクライアントが重要なアラートをユーザーに通知できるよう、様々なチャンネルを提供しています。
また、汎用的な Webhooks インテグレーションを使用して、任意の REST API を呼び出すことができます。Webhooks インテグレーションを使用すると、ユーザーに通知するだけでなく、自動的な修復ワークフローをトリガーすることができます。
通知について詳しくは、こちらをご覧ください。
ダッシュボードを使って視覚化を設定する
視覚化は、複雑な技術スタックや、収集された大量のメトリクスやイベントをクライアントに明確に伝えるための素晴らしい方法です。ダッシュボードは、あなたやクライアントがモニターから通知された潜在的な問題を調査するための自然な出発点です。
すぐに使えるダッシュボード
Datadog は、Agent やクラウドインテグレーションをセットアップした瞬間に、新しく統合されたサービスやテクノロジーに対してすぐに使えるダッシュボードを自動的に有効にし、インサイトを即座に提供します。また、すぐに使えるダッシュボードの複製も可能で、カスタムダッシュボードの出発点として最適です。
カスタムダッシュボードの構築
さまざまなペルソナに合わせたビジネス中心の視点を提供することで、さらなる価値を提供し、競合他社と差別化することができます。
ここでは、ダッシュボードを構築する際に考慮すべきダッシュボードのベストプラクティスを紹介します。
ダッシュボードについて詳しくは、こちらをご覧ください。
Datadog にアクセスできないユーザー向けの視覚化
ビジネスモデルによっては、クライアント自身が Datadog にアクセスする必要がない場合があります。しかし、クライアントに Datadog の視覚化を提供したい場合があります。Datadog の視覚化を提供するには、次のオプションがあります。
- ダッシュボードの共有: 読み取り専用のダッシュボードへの公開 URL を共有することで、クライアントにステータスページを提供したり、個々のメールアドレスを使用してダッシュボードを非公開で共有することができます。
- 埋め込み可能なグラフ: クライアントポータルで Datadog の情報を表示する場合、埋め込み可能なグラフが有効です。パラメーターを使用すると、ニーズに合わせてデータをフィルターすることができます。詳細については、以下を参照してください。
サービスレベル目標の設定
クライアントに対して、サービスの品質やレベルを透明性のある形で継続的に提示することは、良いことです。サービスレベル目標 (SLO) は、クライアントに代わってサービス品質を監視・視覚化し、またクライアントが社内でサービスレベルに基づくレポーティングを実施する際にも有効な手段です。
SLO を設定・管理する際には、以下の資料が参考になるかと思われます。
Watchdog の使用
Watchdog は、アプリケーションやインフラストラクチャーの潜在的な問題を自動的に検出するアルゴリズム機能です。
Watchdog が新たな不正を検出したときに通知を受け取ることができる Watchdog モニターを、自社のスタッフやクライアントのために設定します。
詳しくは、Watchdog をご覧ください。
次のステップ
複数組織のアカウント設定において、Datadog プラットフォームの個々のクライアントおよび集計使用量を監視する方法を、請求と使用量報告でご確認ください。