概要

Datadog Log Management は、ログエクスプローラーでコンテキストに沿ったインサイトを提供し、インシデントの迅速な解決を支援する Watchdog Insights を提供します。Watchdog Insights は、ユーザーのサブセットに影響を与える疑わしい異常値、外れ値、潜在的なパフォーマンスのボトルネックを表面化することにより、専門知識と直感を補完します。

Watchdog Insights のバナーと 5 つのログ異常が表示されたログエクスプローラー

ナビゲーション

Watchdog Insights バナーがログエクスプローラーに表示され、現在のクエリに関するインサイトが表示されます。

折りたたみ表示時の Watchdog Insights バナー

すべてのインサイトの概要を確認するには、Watchdog Insight バナーを展開します。

3 つのエラー外れ値を示す Watchdog Insights バナー

Watchdog Insights サイドパネル全体にアクセスするには、View all をクリックします。

Watchdog Insights のサイドパネルに表示されるエラー外れ値に関する詳細な情報

すべてのインサイトには、インタラクションが埋め込まれ、トラブルシューティング情報が記載されたサイドパネルが付属しています。インサイトインタラクションとサイドパネルは、Watchdog Insights タイプによって異なります。

インサイトの種類

Watchdog Insights では、特定のタグで検出された異常と外れ値が表示され、問題の根本原因を調査することができます。インサイトは、service タグを含む APM、Continuous Profiler、ログ管理、インフラストラクチャーのデータから発見されます。ログ管理固有のインサイトは、次の 2 種類です。

ログ異常検出

取り込まれたログはインテークレベルで分析され、Watchdog は検出されたパターンと environmentservicesourcestatus タグの集計を実行します。 これらの集計されたログは、以下のような異常な動作がないかスキャンされます。

  • 警告またはエラーステータスを持つログの出現。
  • 警告やエラーステータスのログの急増。

ログは、検索コンテキストとロールに適用される制限に一致する、ログエクスプローラーのインサイトとして表示されます。

特定のインサイトをクリックすると、検出された異常の詳細な説明と、その異常の原因となるパターンのリストが表示されます。

Watchdog が特に重大と判断した異常は、Watchdog アラートフィードにも表示され、Watchdog ログモニターを設定することで通知を受けることができます。 重大な異常は次のように定義されます。

  • エラーログが含まれている
  • 10 分以上続いている (一時的なエラーを除外するため)
  • 大幅に増加している (小幅な増加を除外するため)

ログエクスプローラーでのログ検索については、ログ検索構文カスタムタイムフレームを参照してください。

エラー外れ値

エラー外れ値は、現在のクエリに一致するエラーの特性を含むファセットタグまたは属性などのフィールドを表示します。エラー間で統計的に過大評価されている key:value ペアは、問題の根本原因へのヒントになります。

典型的なエラー外れ値の例として、env:stagingdocker_image:acme:3.1http.useragent_details.browser.family:curl が挙げられます。

バナーカードビューでは、次のことがわかります。

  • フィールド名。
  • フィールドが寄与するエラーと全体的なログの割合。
エラー全体の 73.3% を占める赤いバーと、8.31% を占める青いバーを示すエラー外れ値カード

サイドパネルカードビューでは、エラーログのメインログパターンをフィールドで確認できます。

エラー外れ値カード (L)

フルサイドパネルビューでは、次のことがわかります。

  • フィールドを含むエラーログの時系列。
  • エラーログに関連付けられることが多いタグ。
  • ログパターンの包括的なリスト。
エラー外れ値サイドパネル

その他の参考資料

PREVIEWING: rtrieu/product-analytics-ui-changes