Sensitive Data Scanner en la nube analiza datos de telemetría, como logs, eventos de APM, eventos de RUM y eventos de Event Management de tu aplicación. Los datos que se pueden analizar y redactar son:
- Logs: todo el contenido estructurado y no estructurado de los logs, incluyendo los valores de mensajes y atributos de logs
- APM: sólo valores de atributos de tramo
- RUM: sólo valores de atributos de eventos
- Eventos: sólo valores de atributos de eventos
Join the Preview!
El desenmascaramiento de los datos confidenciales en logs está en Vista previa. Para inscribirte, haz clic en Request Access (Solicitar acceso).
Request AccessEnvías logs y eventos al backend Datadog, por lo que los datos salen de tu entorno antes de ser redactados. Los logs y eventos se analizan y redactan en el backend Datadog durante su procesamiento, por lo que los datos confidenciales se ocultan antes de que los eventos se indexen y se muestren en la interfaz de usuario de Datadog.
Si no quieres que los datos salgan de tu entorno antes de ser redactados, utiliza Observability Pipelines y el procesador Sensitive Data Scanner para analizar y redactar datos confidenciales. Para obtener información sobre cómo configurar un pipeline y sus componentes, consulta Configurar pipelines.
Para utilizar Sensitive Data Scanner en la nube, configura un grupo de análisis para definir qué datos analizar y luego añade reglas de análisis para determinar qué información confidencial debe coincidir en los datos.
Este documento repasa lo siguiente:
Configuración
Permisos
Por defecto, los usuarios con el rol administrador de Datadog tienen acceso para visualizar y configurar reglas de análisis. Para permitir el acceso a otros usuarios, concede los permisos data_scanner_read
o data_scanner_write
en Cumplimiento a un rol personalizado. Para obtener más información sobre cómo configurar roles y permisos, consulta Control del acceso.
Añadir un grupo de análisis
Un grupo de análisis determina qué datos analizar. Consta de un filtro de consulta, un conjunto de botones para activar el análisis de logs, APM, RUM y eventos, y la opción de definir frecuencias de muestreo de entre el 10% y el 99% para cada producto. Para obtener más información sobre los filtros de consulta, consulta la documentación sobre sintaxis de búsqueda de logs.
Para Terraform, consulta el recurso Grupo de Datadog Sensitive Data Scanner.
Para configurar un grupo de análisis, realiza los siguientes pasos:
- Ve a la página de configuración de Sensitive Data Scanner.
- Haz clic en Add scanning group (Añadir grupo de análisis). Como alternativa, haz clic en el menú desplegable Add (Añadir) situado en la esquina superior derecha de la página y selecciona Add Scanning Group (Añadir grupo de análisis).
- Introduce un filtro de consulta para los datos que quieres analizar. En la parte superior, haz clic en APM Spans (Tramos de APM) para obtener una vista previa de los tramos (spans) filtrados. Haz clic en Logs para ver los logs filtrados.
- Introduce un nombre y una descripción para el grupo.
- Haz clic en los botones de conmutador para activar Sensitive Data Scanner para los productos deseados (por ejemplo, logs, tramos de APM, eventos de RUM y eventos de Datadog).
- Opcionalmente, define una frecuencia de muestreo del 10-99% para los productos deseados. Cuando añadas reglas de análisis a un grupo que tenga activado el muestreo, no podrás seleccionar acciones que ofusquen los datos que analizas. Para ofuscar las coincidencias, debes elegir analizar todos los datos que coincidan con el filtro de consulta del grupo.
- Haz clic en Create (Crear).
De manera predeterminada, los grupos de análisis recién creados se encuentran deshabilitados. Para habilitar un grupo de análisis, haz clic en el botón correspondiente en el lado derecho.
Añadir reglas de análisis
Una regla de análisis determina qué información confidencial debe coincidir con los datos definidos por un grupo de análisis. Puedes añadir reglas de análisis predefinidas desde la biblioteca de reglas de análisis de Datadog o puedes crear tus propias reglas mediante patrones de expresión regular. Los datos se analizan en el momento de la ingesta durante el procesamiento. Para los logs, esto significa que el análisis se realiza antes de la indexación y otras decisiones de enrutamiento.
Para Terraform, consulta el recurso regla de Datadog Sensitive Data Scanner.
Para añadir reglas de análisis, realiza los siguientes pasos:
- Ve a la página de configuración de Sensitive Data Scanner.
- Haz clic en el grupo de análisis en el que quieres añadir las reglas de análisis.
- Haz clic en Add Scanning Rule (Añadir regla de análisis). Como alternativa, haz clic en el menú desplegable Add (Añadir) situado en la esquina superior derecha de la página y selecciona Add Scanning Rule (Añadir regla de análisis).
- Selecciona si quires añadir una regla de biblioteca o crear una regla de análisis personalizada.
La biblioteca de reglas de análisis contiene reglas predefinidas para detectar patrones comunes como direcciones de correo electrónico, números de tarjetas de crédito, claves de API, tokens de autorización, etc.
- Selecciona un grupo de análisis si no has creado esta regla dentro de un grupo de análisis.
- En la sección Add library rules to the scanning group (Añadir reglas de biblioteca al grupo de análisis), selecciona las reglas de biblioteca que quieres utilizar.
- In the Define rule target and action section, select if you want to scan the Entire Event or Specific Attributes.
- If you are scanning the entire event, you can optionally exclude specific attributes from getting scanned.
- If you are scanning specific attributes, specify which attributes you want to scan.
- For Define actions on match, select the action you want to take for the matched information. Note: Redaction, partial redaction, and hashing are all irreversible actions.
- Redact: Replaces all matching values with the text you specify in the Replacement text field.
- Partially Redact: Replaces a specified portion of all matched data. In the Redact section, specify the number of characters you want to redact and which part of the matched data to redact.
- Hash: Replaces all matched data with a unique identifier. The UTF-8 bytes of the match is hashed with the 64-bit fingerprint of FarmHash.
- Optionally, add tags you want to associate with events where the values match the specified regex pattern. Datadog recommends using
sensitive_data
and sensitive_data_category
tags. These tags can then be used in searches, dashboards, and monitors. See Control access to logs with sensitive data for information on how to use tags to determine who can access logs containing sensitive information. - For Set priority level, select the priority level for the rule based on your business needs.
- In the Name and describe the scanning rule section, enter a name for the rule. Optionally, add a description.
- Haz clic en Add Rules (Añadir reglas).
Añadir palabras clave adicionales
Después de añadir reglas de análisis OOTB, puedes editar cada regla por separado y añadir palabras clave adicionales al diccionario de palabras clave.
- Ve a la página de configuración de Sensitive Data Scanner.
- Haz clic en el grupo de análisis con la regla que quieres editar.
- Pasa el ratón por encima de la regla y haz clic en el icono del lápiz.
- Las palabras clave recomendadas se utilizan por defecto. Para añadir palabras clave adicionales, activa Use recommended keywords (Utilizar palabras clave recomendadas) y, a continuación, añade tus palabras clave a la lista. También puedes exigir que estas palabras clave estén dentro de un número determinado de caracteres de una coincidencia. Por defecto, las palabras clave deben estar dentro de los 30 caracteres anteriores a un valor coincidente.
- Haz clic en Update (Actualizar).
Puedes crear reglas de análisis personalizadas utilizando patrones de expresiones regulares para analizar datos confidenciales.
- Selecciona un grupo de análisis si no creaste esta regla dentro de un grupo de análisis.
- En la sección Definir condiciones de coincidencia, especifique el patrón regex a utilizar para la coincidencia con eventos en el campo Definir el regex. Introduzca datos de muestra en el campo Añadir datos de muestra para verificar que su patrón regex es válido.
Sensitive Data Scanner admite Perl Compatible Regular Expressions (PCRE), pero los siguientes patrones no son compatibles:- Referencias pasadas y captura de subexpresiones (lookarounds)
- Afirmaciones de espacio de ancho cero arbitrarias
- Referencias a subrutinas y patrones recursivos
- Patrones condicionales
- Verbos de control del backtracking
- La directiva
\C
“single-byte” (que rompe las secuencias UTF-8) - La coincidencia de nueva línea
\R
- La directiva de reinicio de la coincidencia
\K
- Llamadas y código integrado
- Agrupación atómica y cuantificadores posesivos
- En Create keyword dictionary (Crear diccionario de palabras clave), añade palabras clave para mejorar la precisión de la detección cuando coincida con condiciones de expresión regular. Por ejemplo, si estás analizando un número de tarjeta de crédito Visa de dieciséis dígitos, puedes añadir palabras clave como
visa
, credit
y card
. También puedes exigir que estas palabras clave estén dentro de un número especificado de caracteres de una coincidencia. Por defecto, las palabras clave deben estar dentro de los 30 caracteres anteriores a un valor coincidente. - In the Define rule target and action section, select if you want to scan the Entire Event or Specific Attributes.
- If you are scanning the entire event, you can optionally exclude specific attributes from getting scanned.
- If you are scanning specific attributes, specify which attributes you want to scan.
- For Define actions on match, select the action you want to take for the matched information. Note: Redaction, partial redaction, and hashing are all irreversible actions.
- Redact: Replaces all matching values with the text you specify in the Replacement text field.
- Partially Redact: Replaces a specified portion of all matched data. In the Redact section, specify the number of characters you want to redact and which part of the matched data to redact.
- Hash: Replaces all matched data with a unique identifier. The UTF-8 bytes of the match is hashed with the 64-bit fingerprint of FarmHash.
- Optionally, add tags you want to associate with events where the values match the specified regex pattern. Datadog recommends using
sensitive_data
and sensitive_data_category
tags. These tags can then be used in searches, dashboards, and monitors. See Control access to logs with sensitive data for information on how to use tags to determine who can access logs containing sensitive information. - For Set priority level, select the priority level for the rule based on your business needs.
- In the Name and describe the scanning rule section, enter a name for the rule. Optionally, add a description.
- Haz clic en Add Rule (Añadir regla).
Notas:
- Cualquier regla que añadas o actualices solo afectará a los datos que ingresen a Datadog después de que se haya definido la regla.
- Sensitive Data Scanner no afecta a ninguna regla que definas directamente en el Datadog Agent.
- Una vez que se añadan las reglas, asegúrate de que se hayan habilitado los botones de los grupos de análisis para comenzar a analizar.
- Cuando añadas reglas a un grupo de análisis con el muestreo activado, no podrás seleccionar las acciones redactar, redactar parcialmente o aplicar hash. Para una ofuscación completa, desactiva el muestreo en la configuración del grupo de análisis.
Consulta Investigar problemas de datos confidenciales para obtener más información sobre cómo utilizar la página Resumen para clasificar los problemas de datos confidenciales.
Espacios de nombres excluidos
Existen palabras clave reservadas que la plataforma de Datadog requiere para su funcionamiento. Si alguna de estas palabras se encuentra en un log que está siendo analizado, los 30 caracteres posteriores a la palabra coincidente se ignoran y no se redactan. Por ejemplo, lo que aparece después de la palabra date
en un log suele ser la marca temporal del evento. Si la marca temporal se redacta accidentalmente, se producirían problemas con el procesamiento del log y se lo podría consultar más tarde. Por lo tanto, el comportamiento de los espacios de nombres excluidos es evitar la redacción involuntaria de información importante para la funcionalidad del producto.
Los espacios de nombres excluidos son:
host
hostname
syslog.hostname
service
status
env
dd.trace_id
trace_id
trace id
dd.span_id
span_id
span id
@timestamp
timestamp
_timestamp
Timestamp
date
published_date
syslog.timestamp
error.fingerprint
x-datadog-parent-id
Ediar reglas de análisis
- Ve a la página de configuración de Sensitive Data Scanner.
- Pasa el ratón por encima de la regla de análisis que quieres editar y haz clic en el icono Edit (Editar) (lápiz).
La sección Define match conditions (Definir condiciones de coincidencia) muestra la expresión regular que escribiste para tu regla personalizada o una explicación de la regla de análisis de biblioteca que elegiste junto con ejemplos de información confidencial coincidente.
- Para asegurarte de que una regla coincide con tus datos, puedes proporcionar una muestra en la sección Add sample data (Añadir datos de muestra). Si la regla encuentra coincidencias en los datos de muestra, aparecerá una etiqueta verde Match (Coincidencia) junto al campo de entrada.
- En Create keyword dictionary (Crear diccionario de palabras clave), puedes añadir palabras clave para mejorar la precisión de la detección. Por ejemplo, si buscas un número de tarjeta de crédito Visa de dieciséis dígitos, puedes añadir palabras clave como
visa
, credit
y card
. - Elige el número de caracteres antes de una coincidencia en los que debe aparecer la palabra clave. Por defecto, las palabras clave deben estar dentro de los 30 caracteres anteriores a una coincidencia.
- Opcionalmente, en Define rule target and action (Definir objetivo y acción de la regla), edita las etiquetas que quieres asociar con eventos donde los valores coincidan con la regla. Datadog recomienda utilizar etiquetas
sensitive_data
y sensitive_data_category
, que pueden utilizarse en búsquedas, dashboards y monitores. Consulta Control de acceso a logs con datos confidenciales para obtener información sobre cómo utilizar etiquetas para determinar quién puede acceder a logs que contengan datos confidenciales. - En Set priority level (Establecer nivel de prioridad), elige un valor basado en las necesidades de tu empresa.
- Haz clic en Update (Actualizar).
Controlar el acceso a logs con datos confidenciales
Para controlar quién puede acceder a los logs que contienen datos confidenciales, utiliza etiquetas añadidas por el Sensitive Data Scanner para crear consultas con control de acceso basado en roles (RBAC). Puedes restringir el acceso a personas o equipos específicos hasta que los datos caduquen tras el periodo de retención. Para obtener más información, consulta Cómo configurar RBAC para logs.
Redactar datos confidenciales en etiquetas
Para redactar datos confidenciales contenidos en etiquetas, debes reasignar la etiqueta a un atributo y, a continuación, redactar el atributo. Desmarca Preserve source attribute
en el procesador de reasignación para que la etiqueta no se conserve durante la reasignación.
Para reasignar la etiqueta a un atributo:
- Ve a tu pipeline de log.
- Haz clic en Add Processor (Agregar procesador).
- Selecciona Remapper (Reasignador) en el menú desplegable de tipo de procesador.
- Nombra el procesador.
- Selecciona Tag key(s) (Claves de etiqueta).
- Introduce la clave de etiqueta.
- Introduce un nombre para el atributo al que se reasigna la clave de etiqueta.
- Deshabilita Preserve source attribute (Preservar atributo de fuente).
- Haz clic en Create (Crear).
Para redactar el atributo:
- Ve a tu grupo de análisis.
- Haz clic en Add Scanning Rule (Añadir regla de análisis).
- Comprueba las reglas de biblioteca que quieres utilizar.
- Selecciona Specific Attributes (Atributos específicos) en Scan entire event or portion of it (Analizar el evento completo o una parte).
- Introduce el nombre del atributo que creaste anteriormente para especificar que quieres que se analice.
- Selecciona la acción deseada cuando haya una coincidencia.
- Si lo deseas, añade etiquetas (tags).
- Haz clic en Add Rules (Añadir reglas).
Desactivar Sensitive Data Scanner
Para desactivar por completo el Sensitive Data Scanner, pon el conmutador en off (desactivado) para cada grupo de análisis, de modo que queden desactivados.
Referencias adicionales
Más enlaces, artículos y documentación útiles: