概要
プロセスチェックモニターは、Agent チェック process.up
が生成するステータスを監視します。Agent レベルで、一致するプロセスの数に基づいてチェックしきい値を構成できます。
モニターの作成
Datadog でプロセスチェックモニターを作成するには、メインナビゲーションを使用して次のように移動します: Monitors –> New Monitor –> Process Check。
プロセスを選択する
ドロップダウンリストから、監視するプロセスを選択します。検索条件を入力してリストをフィルターします。
モニターのスコープを選択
ホスト名、タグ、または All Monitored Hosts
を選択して、監視するホストを決定します。選択したプロセスのステータスを報告するホストまたはタグのみが表示されます。特定のホストを除外する必要がある場合は、2 番目のフィールドに名前やタグをリストアップします。
- インクルードフィールドでは
AND
ロジックを使用します。リストアップされたすべてのホスト名とタグが存在するホストがスコープに含まれます。 - エクスクルードフィールドでは
OR
ロジックを使用します。リストアップされた名前やタグを持つホストはスコープから除外されます。
アラートの条件を設定する
チェックアラートは、チェックグループごとに送信されたステータスを連続的にトラックし、しきい値と比較します。プロセスチェックモニターの場合、グループは静的です(host
と process
)。
チェックアラートをセットアップする
何回連続して失敗したらアラートをトリガーするか、回数 <数値>
を選択します。
各チェックは OK
、WARN
、CRITICAL
のいずれか 1 つのステータスを送信します。WARN
と CRITICAL
ステータスが連続して何回送信されたら通知をトリガーするか選択します。たとえば、プロセスで接続に失敗する異常が 1 回発生したとします。値を > 1
に設定した場合、この異常は無視されますが、2 回以上連続で失敗した場合は通知をトリガーします。
何回連続して成功したらアラートを解決するか、回数 <数値>
を選択します。
何回連続して OK
ステータスが送信されたらアラートを解決するか、回数を選択します。
クラスターアラートは、既定のステータスでプロセスチェックの割合を計算し、しきい値と比較します。
クラスターアラートをセットアップする
タグによりプロセスチェックをグループ化するかどうか決定します。Ungrouped
はすべてのソースでステータスのパーセンテージを計算します。Grouped
は各グループごとのステータスのパーセンテージを計算します。
アラートと警告のしきい値の割合を選択します。1 つの設定(アラートまたは警告)のみ必須です。
タグの個別の組み合わせでタグ付けされた各チェックは、クラスター内の個別のチェックと見なされます。タグの各組み合わせの最後のチェックのステータスのみが、クラスターのパーセンテージの計算で考慮されます。
たとえば、環境ごとにグループ化されたクラスターチェックモニターは、いずれかの環境のチェックの 70% 以上が CRITICAL
ステータスを送信した場合にアラートし、いずれかの環境のチェックの70% 以上が WARN
ステータスを送信した場合に警告できます。
高度なアラート条件
データなし、自動解決、新しいグループ遅延の各オプションに関する情報は、モニターコンフィギュレーションドキュメントを参照してください。
通知
For detailed instructions on the Configure notifications and automations section, see the Notifications page.
その他の参考資料