Générer de la valeur ajoutée

Datadog Partner Network Documentation

Une fois l’ingestion de données configurée, l’étape suivante consiste à optimiser la valeur ajoutée de ces données pour vos clients. Voici quelques aspects clés sur lesquels vous concentrer.

Configurer des monitors et des downtimes

Les monitors et les alertes permettent d’attirer l’attention des personnes concernées sur des systèmes et des services qui nécessitent d’être inspectés en vue d’une éventuelle intervention. Pour générer des alertes, Datadog propose :

  • Des monitors, qui permettent de définir des conditions d’alerte
  • Des downtimes, qui permettent de définir des intervalles sur lesquels il n’est pas nécessaire de générer une alerte

Pour vous familiariser avec le concept général des monitors, consultez les ressources suivantes :

Migrer un monitor

Les fournisseurs de services ont souvent besoin de migrer un client vers Datadog à partir d’une autre plateforme de surveillance ou d’observabilité. Dans ce cas, le premier réflexe est souvent de reprendre les monitors utilisés dans la solution précédente et de les recréer dans Datadog. Toutefois, cette méthode signifie souvent que les fonctionnalités les plus utiles de Datadog ne sont pas utilisées. Il serait particulièrement dommage de ne pas tirer parti de la détection améliorée des problèmes, de la réduction des temps de résolution ou de la limitation des alertes superflues.

Avant de commencer à migrer vos monitors, passez en revue les alertes et les seuils définis en répondant aux questions suivantes :

  • La métrique évolue-t-elle dans le temps ? Un monitor d’anomalie est peut-être plus adapté.
  • La métrique évolue-t-elle en fonction de la charge ? Il est peut-être préférable d’utiliser un monitor arithmétique afin de combiner une métrique avec une autre métrique qui mesure la charge d’un système. Par exemple, la charge du système est susceptible d’augmenter avec le nombre de personnes qui utilisent un service.
  • La valeur absolue de la métrique est-elle moins importante que le taux de variation ? Un monitor de changement ou un monitor de prévision est peut-être plus adapté.
  • La valeur de la métrique est-elle moins importante que l’écart avec les valeurs d’autres hosts ou entités ? Par exemple, voulez-vous générer une alerte lorsque la latence est élevée sur l’un des nœuds d’un cluster mais pas sur les autres ? Un monitor de singularité est peut-être plus adapté dans ce cas de figure.
  • Une intervention est-elle nécessaire uniquement lorsque plusieurs métriques remplissent certaines conditions ? Utilisez un monitor composite pour répondre à votre besoin sans avoir à créer de scripts.

Gestion automatique des monitors

En tant que fournisseur de services, vous pouvez optimiser la gestion de vos monitors et de ceux de vos clients via l’une des méthodes suivantes :

Assurez-vous de taguer vos monitors afin faciliter la gestion de grandes quantités de monitors.

Monitors recommandés

Il arrive que vous n’ayez pas beaucoup d’expérience avec certaines technologies utilisées par vos clients. Datadog propose une liste de monitors recommandés pour vous aider à intégrer ces nouvelles technologies rapidement et en toute confiance.

Pour en savoir plus sur les monitors, consultez les ressources suivantes :

Downtimes

Les systèmes d’alerte posent souvent un problème majeur : ils génèrent beaucoup d’alertes superflues, ce qui signifie que les équipes finissent souvent par ne plus prêter attention aux notifications. Afin d’atténuer ce problème, il est nécessaire de réduire le nombre de faux positifs, en particulier dans les situations contrôlées telles qu’un arrêt planifié, une maintenance ou une mise à jour.

Les downtimes de Datadog vous permettent de désactiver vos monitors et ceux de vos clients pendant les périodes de maintenance, qu’elles soient planifiées ou non.

Pour en savoir plus sur la gestion des downtimes, en particulier les solutions automatiques, consultez les ressources suivantes :

Notifications

Voici quelques recommandations générales pour les notifications :

  • Générez des alertes à volonté, mais notifiez les équipes avec modération
  • Notifiez pour informer des symptômes, et non des causes

Datadog propose de nombreux canaux de notification pour informer les utilisateurs en cas d’alerte importante :

Vous pouvez également invoquer n’importe quelle API REST à l’aide de l’intégration Webhooks générique. Cette intégration peut être utilisée pour notifier des utilisateurs, mais aussi pour déclencher des workflows de remédiation automatiques.

Pour en savoir plus sur les notifications, consultez les ressources suivantes :

Configurer des visualisations avec les dashboards

Les visualisations sont idéales pour représenter de façon claire des stacks techniques complexes ainsi que la vaste quantité de métriques et d’événements collectés. Lorsqu’un monitor vous alerte ou alerte l’un de vos clients d’un problème potentiel, il est souvent préférable de commencer par consulter les dashboards pour mener l’enquête.

Dashboards prêts à l’emploi

Dès lors que vous configurez un Agent ou une intégration cloud, Datadog active automatiquement des dashboards prêts à l’emploi pour vous offrir des informations sur le service ou la technologie que vous venez d’intégrer. Vous pouvez également cloner un dashboard prêt à l’emploi pour créer facilement un dashboard personnalisé efficace.

Créer des dashboards personnalisés

Générez de la valeur ajoutée et démarquez-vous de vos concurrents en créant des dashboards spécialement adaptés à des rôles ou des perspectives spécifiques.

Voici quelques recommandations à prendre en compte lors de la création d’un dashboard :

  • Concentrez-vous sur vos métriques opérationnelles au lieu d’ajouter un trop grand nombre de métriques de ressources. Pour comprendre la différence entre les deux types, consultez Monitoring 101 : Recueillir les bonnes données (article de blog en anglais).
  • Utilisez les superpositions d’événements pour mettre en corrélation vos métriques et vos événements.
  • Annotez vos dashboards en ajoutant du texte libre pour décrire les données affichées et la marche à suivre si le dashboard indique un problème.

Pour en savoir plus sur les dashboards, consultez les ressources suivantes :

Visualisations pour les utilisateurs n’ayant pas accès à Datadog

En fonction de votre modèle opérationnel, il est possible que vos clients n’aient pas besoin d’accéder directement à Datadog. Même s’ils n’ont pas accès à la plateforme, vous avez la possibilité de leur transmettre des visualisations Datadog via l’une des méthodes suivantes :

  • Partage de dashboard : offrez une page de statut à vos clients en leur communiquant un lien d’accès public à un dashboard en lecture seule, ou partagez le dashboard en privé en spécifiant une adresse e-mail.
  • Graphiques intégrables : si vous avez un portail client sur lequel vous souhaitez afficher des données Datadog, les graphiques intégrables sont la solution idéale. Vous pouvez modifier les paramètres pour filtrer les données en fonction de vos besoins. Pour en savoir plus, consultez les ressources suivantes :

Configurer des service-level objectives

Il est recommandé de communiquer en permanence à vos clients la qualité et le niveau de vos services en faisant preuve de transparence. Les service-level objectives (SLO) constituent le moyen idéal de contrôler et de visualiser la qualité d’un service pour le compte de vos clients, mais aussi d’aider vos clients à mettre en œuvre un reporting basé sur le niveau de service en interne.

Les ressources suivantes vous aideront à configurer et gérer des SLO :

Utiliser Watchdog

La fonctionnalité Watchdog permet de détecter de manière algorithmique les problèmes au sein de vos applications et de votre infrastructure.

Configurez un monitor Watchdog pour votre propre équipe ou votre client et recevez une notification dès que Watchdog détecte une nouvelle irrégularité.

Pour en savoir plus, consultez la section Watchdog.

Et ensuite ?

Pour découvrir comment surveiller l’utilisation de Datadog par vos différents clients et l’utilisation globale avec un compte multi-organisations, consultez la section Données d’utilisation et de facturation.

PREVIEWING: heston/WEB-5551