Análisis de la gestión de incidencias
Utiliza Incident Analytics para aprender de incidentes anteriores y comprender la eficacia y el rendimiento de tu proceso de respuesta a incidentes. El Análisis de incidentes te permite extraer estadísticas agregadas de tus incidentes a lo largo del tiempo. Puedes utilizar estas estadísticas para crear informes que te ayuden a:
- Analizar si tu proceso de respuesta a incidentes está mejorando con el tiempo
- Evaluar tu plazo medio de resolución
- Identificar las áreas de mejora en las que debes invertir
Datos recopilados
Incident Management Analytics es una fuente de datos consultable de las estadísticas agregadas de incidentes. Puedes consultar estos análisis en una variedad de widgets de gráficos, tanto en dashboards como en notebooks, para analizar tu historial de respuestas a incidentes a lo largo del tiempo. Para darte un punto de partida, Datadog proporciona los siguientes recursos predefinidos que puedes clonar y personalizar:
Medidas
La Gestión de Incidentes recopila las siguientes medidas analíticas para generar consultas analíticas:
- Recuento de incidencias
- Duración del impacto en el cliente
- Duración del estado activo
- Duración del estado estable
- Tiempo de detección (hora detectada: hora de inicio del impacto en el cliente)
- Tiempo de reparación (hora detectada: hora finalización del impacto en el cliente)
- Tiempo de resolución (hora declarada: hora de resolución)
- Número de usuarios afectados
- Reconocimiento
Además de estos valores predeterminados, puedes crear nuevas medidas al añadir campos de propiedad Número personalizados en tu Configuración de incidencias.
Nota: Si sobreescribes una marca de tiempo, el valor de reemplazo se utilizará para calcular el Tiempo de detección, el Tiempo de reparación y el Tiempo de resolución.
Visualizar datos de los incidentes en dashboards
Para configurar tu gráfico con los datos del análisis de gestión de incidencias, sigue estos pasos:
- Selecciona tu visualización.
- Selecciona
Incidents
en el menú desplegable de la fuente de datos. - Selecciona una medida en el menú desplegable amarillo.
- Estadística por defecto: cuenta el número de incidencias.
- Selecciona una agregación para la medida.
- (Opcional) Selecciona un rollup para la medida.
- (Opcional) Utiliza la barra Buscar para filtrar la estadística hasta un subconjunto específico de incidencias.
- (Opcional) Selecciona una faceta en el menú desplegable rosa para desglosar la medida por grupos y seleccionar un número limitado de grupos para mostrar.
- Pon un título al gráfico.
- Guarda tu widget.
Ejemplo: duración del impacto en el cliente de los cortes semanales, agrupada por servicio
Este ejemplo de configuración te muestra una agregación de tus incidentes SEV-1 o SEV-2. El gráfico muestra la duración del impacto en el cliente de esos incidentes, agrupada por servicio.
- Widget: Gráfico de líneas de series temporales
- Fuente de datos:
Incidents
- Medida:
Customer Impact Duration
- Agregación:
avg
- Rollup:
1w
- Filtro:
severity:("SEV-1" OR "SEV-2")
- Grupo:
Services
, limitado a los primeros 5
Utiliza la plantilla de notebook predefinida para crear el informe de incidentes o crear uno desde cero, para obtener un informe resumido de los incidentes de un equipo o servicio.
- Abre la plantilla de informe de incidentes.
- Haz clic en Use Template (Utilizar plantilla) para editar y personalizar.
- Puedes utilizar las celdas de incidentes existentes o personalizar la consulta para mostrar los valores de cada medición.
- Actualiza las celdas de resumen con los valores pertinentes y comparte el informe con el resto de tu equipo.
Referencias adicionales
Más enlaces, artículos y documentación útiles: