
概要
このチェックは、vSphere クラスターの CPU、ディスク、メモリ、ネットワークの使用量から、リソース使用状況のメトリクスを収集します。また、vCenter サーバーでイベントを監視し、それを Datadog へ送信します。
セットアップ
インストール
vSphere チェックは Datadog Agent パッケージに含まれています。vCenter サーバーに追加でインストールする必要はありません。
構成
vCenter の Administration セクションで、datadog-readonly
という読み取り専用のユーザーを追加し、監視が必要なリソースに読み取り専用のユーザー権限を適用します。リソース階層内のすべての子オブジェクトを監視するには、“Propagate to children” オプションを選択します。
次に、Agent のコンフィギュレーションディレクトリのルートにある conf.d/
フォルダーの vsphere.d/conf.yaml
ファイルを編集します。使用可能なすべてのコンフィギュレーションオプションについては、サンプル vsphere.d/conf.yaml を参照してください。
Agent を再起動すると、vSphere メトリクスとイベントが Datadog に送信されます。
注: Datadog Agent が vSphere アプライアンスソフトウェアと同じサーバー上にある必要はありません。vSphere チェックが有効になっている Agent は、vSphere アプライアンスサーバーをポイントするようにセットアップできます。各インスタンスに応じて <HOSTNAME>
を更新してください。
互換性
Agent v6.18.0/7.18.0 に付属のチェック v5.0.0 より、新しい実装が導入されたことに伴い、コンフィギュレーションの変更が必要になりました。後方互換を維持するため、use_legacy_check_version
というコンフィギュレーションパラメーターが一時的に利用可能になっています。
インテグレーションの旧バージョンをアップグレードする際、このパラメーターはコンフィグで未設定となっており、これまでの実装が強制されます。
初めてインテグレーションを構成する場合、または新機能 (タグ収集や高度なフィルターオプションなど) を利用したい場合は、サンプル vsphere.d/conf.yaml コンフィギュレーションファイルを参照してください。特に、use_legacy_check_version: false
を必ず設定するようにしてください。
検証
Agent の status サブコマンドを実行し、Checks セクションで vsphere
を探します。
収集データ
チェックコンフィギュレーションで設定した collection_level
の値によっては、以下のすべてのメトリクスが収集されるわけではありません。特定のコレクションに対して収集されたメトリクスを表示するには、データ収集レベルを参照してください。
メトリクス
インスタンスごとのメトリクスを収集
注: vSphere インテグレーションは、リソースごとのメトリクス(たとえば CPU に関するもの)とインスタンスごとのメトリクス(たとえば CPU コアに関するもの)の両方を収集できます。つまり、メトリクスにはリソースごとのみ、インスタンスごとのみ、または両方に関連するものがあります。
リソースとは、現実的または仮想的なマシンのことです。vSphere の VM、ホスト、データストア、クラスターで表されます。
インスタンスとは、リソース内に見つかる個々のエンティティのことです。vSphere のリソースに関する詳細は、VMWare インフラストラクチャーアーキテクチャの概要ホワイトペーパーをご参照ください。
デフォルトで、vSphere インテグレーションではリソースごとのメトリクスのみが収集されるため、インスタンスごとのメトリクスの一部が無視されることがあります。これは、collect_per_instance_filters
オプションを使用して構成することが可能です。以下に例を示します。
collect_per_instance_filters:
host:
- 'disk\.totalLatency\.avg'
- 'disk\.deviceReadLatency\.avg'
disk
メトリクスは、ホストの各ディスクに特定されるため、収集するには collect_per_instance_filters
を使用してこのメトリクスを有効にする必要があります。
プロパティメトリクスの収集
vSphere インテグレーションでは、プロパティベースのメトリクスも収集可能です。例えば、ホストがメンテナンスモードかどうか、またはクラスターが DRS に構成されているかなどの構成プロパティが該当します。
プロパティメトリクスを有効にするには、次のオプションを構成してください。
collect_property_metrics: true
プロパティメトリクスにはリソース名がプレフィックスとして付与されます。例えば、ホストのプロパティメトリクスには vsphere.host.*
が、VM のプロパティメトリクスには vsphere.vm.*
が付与されます。利用可能なプロパティメトリクスの一覧は metadata.csv でご確認ください。
イベント
このチェックは vCenter イベントマネージャーでイベントを監視し、それを Datadog に送信します。デフォルトで、以下のタイプのイベントを送信します。
- AlarmStatusChangedEvent
- VmBeingHotMigratedEvent
- VmReconfiguredEvent
- VmPoweredOnEvent
- VmMigratedEvent
- TaskEvent
- VmMessageEvent
- VmSuspendedEvent
- VmPoweredOffEvent
追加のイベントを vim.event
クラスから収集するには、サンプル vsphere.d/conf.yaml 内の include_events
パラメータセクションを使用してください。
サービスチェック
vcenter.can_connect
vCenter インスタンスに ping した後のステータスを返します。収集した時点での応答ステータスに関する詳しい情報がチェックメッセージに記載されます。
Statuses: ok, クリティカル
トラブルシューティング
VM を制限する
VMWare インテグレーションで取り込む VM の数は、vsphere.d/conf.yaml
ファイルを使用して制限することができます。サンプル vsphere.d/conf.yaml の resource_filters
パラメーターのセクションを参照してください。
vSphere Tanzu Kubernetes Grid (TKG) の監視
Datadog vSphere インテグレーションは、TKG VM とコントロールプレーン VM からメトリクスとイベントを自動的に収集します。コンテナ、ポッド、ノードレベルのメトリクスを含む、TKG クラスターのより詳細な情報を収集するには、クラスターに Datadog Agent をインストールすることができます。TKG に特化したコンフィギュレーションファイルの例については、ディストリビューションドキュメントを参照してください。
その他の参考資料