概要
プロセスチェックを使用して、以下のことができます。
- 任意のホスト上で実行されている特定プロセスのリソース使用状況メトリクスを収集できます。たとえば、CPU、メモリ、I/O、スレッド数などです。
- プロセスモニターを使用して、実行されなければならない特定プロセスのインスタンス数にしきい値を設定し、そのしきい値が満たされない場合にアラートを発行します (下のサービスのチェックを参照)。
セットアップ
インストール
プロセスチェックは Datadog Agent パッケージに含まれています。サーバーに追加でインストールする必要はありません。
構成
他の多くのチェックとは異なり、デフォルトのプロセスチェックは、特に役立つ監視を行いません。どのプロセスを監視するかを構成する必要があります。
標準的なデフォルトのチェックコンフィギュレーションはありませんが、以下に SSH/SSHD 処理を監視する process.d/conf.yaml
の例を示します。使用可能なすべての構成オプションの詳細については、サンプル process.d/conf.yaml を参照してください。
init_config:
instances:
- name: ssh
search_string:
- ssh
- sshd
注: 構成の変更後は、必ず Agent を再起動してください。
一部のプロセスメトリクスを取得するには、Datadog コレクターを監視対象プロセスのユーザーとして実行するか、特権的なアクセスを与えて実行する必要があります。Unix プラットフォームの open_file_descriptors
メトリクスについては、追加の構成オプションがあります。conf.yaml
ファイルで try_sudo
を true
に設定すると、プロセスチェックは sudo
を使用して open_file_descriptors
メトリクスの収集を試みることができます。この構成オプションを使用するには、/etc/sudoers
で適切な sudoers ルールを設定する必要があります。
dd-agent ALL=NOPASSWD: /bin/ls /proc/*/fd/
検証
Agent の status サブコマンドを実行し、Checks セクションで process
を探します。
メトリクスに関するメモ
以下のメトリクスは、Linux および macOS では使用できません。
- Agent が読み取るファイル (
/proc//io
) はプロセスのオーナーのみ読み取り可能であるため、Process I/O メトリクスは Linux または macOS では使用できません。詳しくは、Agent FAQ をご参照ください。
以下のメトリクスは、Windows では使用できません。
system.cpu.iowait
system.processes.mem.page_faults.minor_faults
system.processes.mem.page_faults.children_minor_faults
system.processes.mem.page_faults.major_faults
system.processes.mem.page_faults.children_major_faults
system.processes.mem.real
注: Windows でページフォールトメトリクスを収集するには、WMI チェックを使用します。
注: Windows の v6.11 + では、Agent は Local System
ではなく、ddagentuser
として実行されます。このため、他のユーザーで実行されているプロセスの完全なコマンドラインや他のユーザーのプロセスのユーザーにアクセスすることができません。このため、以下のチェックのオプションは機能しません。
false
に設定した場合の exact_match
- 特定のユーザーに属するプロセスを選択することができる
user
すべてのメトリクスは process.yaml で構成された instance
ごとに収集され、process_name:<instance_name>
のタグが付きます。
このチェックにより送信される system.processes.cpu.pct
メトリクスは、30 秒間以上存在する処理でのみ正確です。
それ以下の短い処理の場合、その値は正確でない場合があります。
メトリクスの完全なリストについては、メトリクスセクションを参照してください。
収集データ
メトリクス
イベント
プロセスチェックには、イベントは含まれません。
サービスチェック
トラブルシューティング
ご不明な点は、Datadog のサポートチームまでお問合せください。
その他の参考資料
プロセスのリソース消費を監視する方法 (または理由) について理解するには、このブログ記事を参照してください。