ライブプロセスモニター

概要

ライブプロセスモニターは、Process Agent によって収集されるデータを基に機能します。複数のホストまたはタグにまたがるプロセスグループのカウントに基づいて、警告またはアラートを生成するモニターを作成しましょう。

ライブプロセスモニターは、以下のような場合に最適です。

  • コンテナ化されていない長寿命プロセスのインスタンスが十分に実行されていることを確認する。
  • 特定のプロセスが実行中である場合にフラグを立てる。

: Agent によって検出されるのは長寿命のプロセスのみです。20 秒未満の寿命のプロセスのモニターは不安定になる可能性があります。

モニターの作成

ライブプロセスモニターを作成するには 2 つの方法があります。

  • メインナビゲーションで、Monitors –> New Monitor –> Live Process の順に選択する。
  • ライブプロセスページで、監視したいプロセスを検索します。次に、+New Metric の隣にあるドロップダウンメニューをクリックし、Create monitor をクリックします。

プロセスの選択

タグまたはあいまい検索を使用して、インフラストラクチャー内のすべてのプロセスをフィルタリングできます。一致するプロセスとカウントは、検索の下に表示されます。

プロセスの選択

検索を定義すると、検索入力の上にグラフが表示され、見つかったプロセスの総数の概算が表示されます。モニターのスコープは数千プロセス程度にしておくことをお勧めします。必要に応じて、追加のタグを使用して検索を絞り込むか、モニターを複数に分割することを検討してください。より詳細なデータについては、ライブプロセスページを参照してください。

タグ検索

タグで監視するプロセスをフィルタリングします。Datadog は、全文検索を使用する前に、タグでプロセスをフィルタリングしてみることをお勧めします。

全文検索

タグを使用して希望する粒度までプロセスを絞り込めない場合は、テキスト検索を使用してコマンドラインとユーザー名の両方に対してフィルタリングすることができます。この検索では、インフラストラクチャー上のすべてのプロセスに対して部分一致検索とあいまい検索を行います。検索演算子 ANDORNOT がサポートされています。詳細はライブプロセスモニタリングのドキュメントを参照してください。

クエリの例説明
foo AND barコマンドラインに foobar の両方が含まれるプロセスにマッチします
foo AND NOT barコマンドラインに bar ではなく foo が含まれるプロセスにマッチします。
foo OR barfoo または bar が含まれるプロセスにマッチします。
foo or NOT barfoo が含まれるか、bar が含まれないプロセスにマッチします。

アラートのグループ化

シンプルアラート (デフォルト): すべての報告元ソースに関わるアラートを集計します。集計値が設定条件を満たすと、アラートを 1 件受信します。

マルチアラート: グループパラメーターに従って、ソースごとにアラートを適用します。設定条件を満たすと各グループにつき 1 件のアラートを受信します。

アラートの条件を設定する

  • プロセスカウントが aboveabove or equal tobelow、または below or equal to の時
  • 過去 5 minutes15 minutes1 hour またはそれ以上のしきい値。また、custom を使用して 5 分~24 時間の値を設定することができます。

この場合、プロセスカウントは、時間間隔中に生存していたすべてのマッチングプロセスの数を指します。

閾値を使用してアラートをトリガーする数値を設定しましょう。Datadog で使用できる通知タイプは 2 種類 (アラートおよび警告) あります。ライブプロセスモニターはアラートまたは警告閾値に基づいて自動で復旧措置を講じます。

時間枠選択のベストプラクティス

ライブプロセスモニターは、ローリングタイムウィンドウを使用してプロセス数を評価します。言い換えると、モニターは 1 分ごとに過去 X 分間をチェックし、アラート条件が満たされた場合にトリガーします。Process Agent と Datadog 間の散発的なネットワーク障害による誤検知を防ぐために、5 分未満の評価ウィンドウを使用することは推奨されません。

高度なアラート条件

高度なアラートオプション (自動解決、評価遅延など) の詳細な手順については、モニターコンフィギュレーションページを参照してください。

通知

Configure notifications and automations (通知と自動化の構成) セクションの詳しい説明は、通知のページをご覧ください。

その他の参考資料

PREVIEWING: brett0000FF/node-compatibility