概要
Datadog サービスカタログは、オーナーシップのメタデータ、パフォーマンスインサイト、セキュリティ分析、コスト割り当てなどを組み合わせた、サービスの統合ビューを提供します。これにより組織は、スケールに合わせてエンドツーエンドのサービスオーナーシップを実現し、リアルタイムでパフォーマンスの洞察を得ることができ、信頼性とセキュリティのリスクを検出・対処し、アプリケーションの依存関係を一か所で管理することが容易になります。
ユースケース
サービスの発見
- Datadog サービスカタログには、デフォルトで APM、USM、RUM から検出されたすべてのサービスが含まれます。これらの製品のいずれかを使用している場合、カタログにはエントリが事前に入力されています。
- 環境内のさまざまなアプリケーションをインスツルメントすると、それらは自動的にサービスカタログに追加されます。
依存関係のマッピングと管理
- APM、USM、RUM によって収集されたアプリケーションのテレメトリーにより、アップストリームとダウンストリームのすべての依存関係を自動的に文書化し、追跡する。
- コンポーネント間の依存関係を手動で宣言する (メタデータスキーマ v3.0で利用可能)。
- チーム間およびサービス間のパフォーマンス影響を理解し、評価する。
ガバナンスと最適化
- サービススコアカードを通じて、エンジニアリング担当の幹部社員に、チームやサービス全体のベストプラクティスの概要を提供する。
- サービスの依存関係の中に存在する既知のセキュリティ脆弱性を見つけて修正することで、アプリケーションのリスクを低減する。
- トレンドを理解し、サービス関連コストの非効率性を特定する。
知識の共有
- 数多くのリポジトリ、チャンネル、ドキュメントページを探し回ることなく、情報を見つける。
- 新しいチームメンバーのオンボーディング時にランブックや wiki ページの検索時間を短縮する。
- リアルタイムで自動生成されるトポロジーマップを活用して、システムのアーキテクチャを理解する。
監視範囲の評価
- 可観測性データを報告していないサービスや、そのデータを監視していないサービスを検出する。
- タグ付けのベストプラクティスを促進し、クロステレメトリーの洞察を最適化するための推奨セットアップ構成をチェックする。
- SLO、モニター、オーナーシップのないサービスなどの問題を発見する。
インシデント発生中のコラボレーションをスムーズに
- 正しい所有者情報とコミュニケーションチャンネルを確立し、モニタリングとトラブルシューティングの詳細へのアクセスを合理化することで、すべての人のオンコール経験を向上させる。
- エンジニアが既に使用している可観測性ツールに、ランブックやドキュメントなどのソリューションやトラブルシューティングツールへのリンクを直接埋め込む。
- 信頼性を高め、上流と下流のサービスや依存関係の所有者を簡単に特定することで、インシデントの復旧をスピードアップする。
はじめに
ロールベースアクセスおよび権限
一般的な情報は、ロールベースアクセスコントロールおよびロール権限を参照してください。
読み取り権限
サービスカタログの読み取り権限により、サービスカタログのデータを読み取ることができ、以下の機能が有効になります。
- サービスカタログ一覧
- Discover UI
- サービス定義エンドポイント:
/api/v2/services/definition/<service_name>
この権限は、Datadog Read Only Role および Datadog Standard Role でデフォルトで有効になっています。
書き込み権限
サービスカタログの書き込み権限は、ユーザーがサービスカタログのデータを変更することを許可します。書き込み権限は、以下の機能に対して必要です。
POST /api/v2/services/definitions
エンドポイントを使ったサービス定義の挿入または更新DELETE /api/v2/services/definition/<service_name>
エンドポイントを使ったサービス定義の削除- Discover Services UI でオンボーディングプロセスを完了する
- UI でのサービスメタデータの更新
この権限は、Datadog Admin Role および Datadog Standard Role でデフォルトで有効になっています。
サービスタイプ
監視されるすべてのサービスは、特定のタイプに関連付けられています。Datadog は、受信するスパンデータに関連付けられた span.type
属性に基づいて、このタイプを自動的に決定します。このタイプは、Datadog Agent が統合しているアプリケーションやフレームワークの名前を指定します。
たとえば、Flask の公式インテグレーションを使用している場合は、Type
が “Web” にセットされ、カスタムアプリケーションを監視している場合は、Type
が “Custom” にセットされます。
サービスのタイプは次のいずれかに設定されます。
いくつかのインテグレーションは、タイプのエイリアスになります。例えば、Postgres、MySQL、Cassandraは “DB” というタイプに対応します。Redis と Memcache のインテグレーションは、“Cache” というタイプにマッピングされます。
データ保持
サービスリストとサービスページのサービスとリソースの統計、およびスパンのサマリーは、最大で 30 日間保持されます。APM トレースメトリクスをカスタムクエリするには、メトリクスエクスプローラーを使用してください。APM のデータ保持の詳細はこちら。
その他の参考資料