概要

APM メトリクスモニターは、通常のメトリクスモニターと同様に機能しますが、APM 専用に作られたコントロールを備えています。このモニターを使用して、サービスレベルのヒット数、エラー数、そしてさまざまなレイテンシー測定値についてアラートを受信します。

Analytics モニターを使用すると、APM データを経時的に視覚化し、Indexed Span に基づきアラート設定を行えます。たとえば、Analytics モニターを使用して、リクエストの遅延急増に関するアラートを受信できます。

モニターの作成

Datadog で APM モニターを作成するには、メインナビゲーションで Monitors –> New Monitor –> APM の順に進みます。

APM Metrics または Trace Analytics モニターのいずれかを選択します。

モニタースコープを選択

ドロップダウンメニューでプライマリタグサービスリソースを選択します。

アラートの条件を設定する

しきい値または異常検知アラートを選択します。

しきい値アラート

メトリクスがしきい値を超えるとアラートがトリガーされます。

  • Requests per secondErrors per secondApdexError rateAvg latencyp50 latencyp75 latencyp90 latency、または p99 latency
  • aboveabove or equal tobelow、または below or equal to の時にアラートを作成
  • アラートのしきい値 <数値>
  • 警告のしきい値 <数値>
  • 過去 5 minutes15 minutes1 hour など、または custom に 1 分~48 時間の値を設定します。

異常検知アラート

メトリクスが予想されるパターンから逸脱するとアラートがトリガーされます。

  • Requests per secondErrors per secondApdexError rateAvg latency, p50 latencyp75 latencyp90 latency、または p99 latency の場合
  • <ALERT_THRESHOLD>%, <WARNING_THRESHOLD>% の時にアラート
  • 値が<数値>偏差、above or belowabove、またはbelow
  • 過去 5 minutes15 minutes1 hour などの間の予測、または custom に 1 分~48 時間の値を設定します。

高度なアラート条件

高度なアラートオプション (データなし、評価遅延など) の詳細な手順については、モニターコンフィギュレーションページを参照してください。メトリクス固有のオプションのフルデータウィンドウについては、メトリクスモニターページを参照してください。

: デフォルトでは、1 アカウントあたり 1000 トレース分析モニターという制限があります。この制限に引っかかっている場合、マルチアラートの使用を検討するか、サポートにお問い合わせください。

検索クエリを定義する

  1. トレース検索と同じロジックを使用して検索クエリを構築します。
  2. トレース数、ファセット、または計測のモニタリングを選択します。
    • Monitor over a trace count: 検索バーを使用し(任意)、ファセットまたはメジャーを選択しません。選択されたタイムフレームで Datadog がログ数を評価し、それをしきい値の条件と比較します。
    • Monitor over a facet or measure: ファセットが選択されている場合、モニターはファセットの Unique value count でアラートを作成します。計測が選択されている場合は、メトリクスモニターと同様、集計を選択する必要があります(minavgsummedianpc75pc90pc95pc98pc99、または max)。
  3. 複数のディメンションでトレースをグループ化する (オプション): クエリに一致するすべてのトレースは、最大 4 つのファセットの値に基づいてグループに集約されます。
  4. アラート設定のグループ化方法を構成します(任意):
    • シンプルアラート: すべての報告元ソースを集計します。集計値が設定条件を満たすと、アラートを 1 件受信します。
      クエリに group by があり、シンプルアラートモードを選択した場合、1 つまたは複数のグループの値がしきい値に違反すると 1 つのアラートが表示されます。この戦略を選択すると、通知ノイズを減らすことができます。
    • Multi-Alert: グループパラメーターに従い、複数のアラートを各ソースに適用します。アラートイベントは、設定された条件を満たすと各グループに生成されます。たとえば、クエリを @resource.name でグループ化すると、スパンのエラー率が高い場合にリソースごとに個別のアラートを受信することができます。
検索クエリの定義

注:* Analytics モニターは、カスタム保持フィルターによって保持されたスパンに基づいてのみ作成できます (インテリジェント保持フィルターではありません)。

アラート条件を選択

  • クエリ結果が aboveabove or equal tobelowbelow or equal to の場合にトリガーします。
  • 過去 5 minutes15 minutes1 hour のしきい値、または custom に 5 分~48 時間の値を設定します。
  • アラートのしきい値: <数値>
  • 警告のしきい値: <数値>

データなしと下限のアラート

特定のクエリにマッチするグループがスパンの送信を停止したときに通知を受け取るには、条件を 1 より下に設定します。これは、グループに対して定義された評価期間内にモニタークエリに一致するスパンがない場合に通知されます。

高度なアラート条件

高度なアラートオプション (評価遅延など) の詳細な手順については、モニターコンフィギュレーションページを参照してください。

通知

For detailed instructions on the Configure notifications and automations section, see the Notifications page.

Note: Find service level monitors on the Service Catalog and on the Service Map, and find resource level monitors on the individual resource pages (you can get there by clicking on the specific resource listed on the a service details page).

その他の参考資料

PREVIEWING: piotr_wolski/update-dsm-docs