概要
Datadog によって収集されたエラーを一貫して監視することは、システムの健全性のために非常に重要です。個々のエラーイベントが多数存在する場合、トラブルシューティングのためにエラーの優先順位をつけることが困難になります。
Error Tracking は、何千もの類似したエラーを 1 つの問題にグループ化することで、デバッグを簡素化します。問題はエラーデータの集約であり、以下のような洞察を提供します。
- 影響を受けたユーザーの数
- エラーが最初に発生したとき
- おそらくどのコミットがエラーを引き起こしたか
エラー追跡は、以下のことを可能にします。
- 致命的なエラーの追跡、トリアージ、デバッグ
- 類似のエラーを課題にまとめることで、重要なエラーをより簡単に特定し、ノイズを減らすことができます
- 大量のエラーや新しい問題など、エラー追跡イベントのモニターを設定します
- 経時的に問題を監視するため、開始のタイミングや継続した場合の頻度を把握できます
セットアップ
エラー追跡は、APM でサポートされているすべての言語で利用でき、別の SDK を使用する必要はありません。
オプションで、スタックトレース内でコードスニペットを見たい場合は、GitHub インテグレーションをセットアップしてください。
リポジトリの構成を始めるには、ソースコードインテグレーションのドキュメントを参照してください。
エラースパンを追跡するために span タグを使用する
Datadog トレーサーは、インテグレーションやバックエンドサービスのソースコードの手動インスツルメンテーションを通じて、エラーを収集します。トレース内のエラースパンは、エラーがサービスエントリースパン (一番上のサービススパン) に位置する場合、エラー追跡によって処理されます。このスパンには、追跡対象の error.stack
、error.message
、error.type
スパンタグが含まれている必要があります。
エラー追跡は、エラータイプ、エラーメッセージ、スタックトレースを形成するフレームを使用して、処理する各エラースパンのフィンガープリントを計算します。同じフィンガープリントを持つエラーはグループ化され、同じ問題に属します。詳しくは、トレースエクスプローラーのドキュメントを参照してください。
トラブルシューティングやデバッグを開始するための問題点の検討
Error Tracking は、バックエンドサービスから Error Tracking Explorer に収集されたエラーを自動的に問題に分類します。主な機能を確認するには、Error Tracking Explorer のドキュメントを参照してください。
APM から作成される問題には、影響を受けたスパンの分布、最新の最も関連性の高いスタックトレース、スパンタグ、ホストタグ、コンテナタグ、およびメトリクスが含まれます。
その他の参考資料