¿Qué es Azure Purview y cómo ayuda a la gobernanza de datos?

Siga leyendo para saber qué es Azure Purview y cómo puede ayudar en el gobierno de los datos

Microsoft Azure Purview es un portal basado en la nube que ofrece servicios de gobierno de datos unificados. Existe como software como servicio (SaaS). Es capaz de funcionar tanto in situ como en la nube.

Microsoft Azure Purview permite a sus usuarios identificar y descubrir datos valiosos. Ofrece características y capacidades de seguridad inigualables para proteger los datos. Permite a los usuarios crear un mapa de datos holístico para una comprensión más profunda. En este artículo, explicamos cómo Azure Purview ayuda a la gobernanza de los datos.

Catálogo de datos

  • El catálogo de datos es el componente principal de Azure Purview. Permite a los usuarios ver sus colecciones de datos y activos de dos maneras, primero por colecciones y segundo por tipo de fuente. El catálogo de datos tiene varias opciones para filtrar los datos, como el tipo de objeto, las clasificaciones, los expertos, los propietarios de los datos y los términos del glosario.

Al hacer clic en el activo deseado, los usuarios accederán a la página de destino que contiene toda la información relacionada y un enlace directo al servicio. Aunque se requieren permisos para acceder a un servicio, Azure Purview no proporciona la gestión de permisos. Esto puede hacerse mediante Azure IAM y mecanismos de acceso externos, según el caso.

  • Los términos del glosario proporcionan una mayor capacidad de filtrado al catálogo de datos. Los términos del glosario contienen metadatos que permiten a los usuarios establecer un nombre, acrónimos, descripciones, etc. Existe la opción de asignar expertos en datos como puntos de contacto para cada término del glosario, lo que aumenta la facilidad general de uso del sistema.

Mapa de datos

  • El mapa de datos permite escanear datos desde una variedad de fuentes definidas por el usuario. Estas fuentes incluyen Amazon Web Services (AWS), aplicaciones SaaS como Snowflake, o on-site/on-prem. Cada fuente tiene sus propias configuraciones para gestionar el acceso a los datos. En el caso de Azure, es necesario configurar una instancia gestionada que ofrezca a un lector acceso a los servicios requeridos.

En el caso de los servicios externos, las funciones deben definirse mediante tiempos de ejecución de integración o utilizando credenciales. En el tablero de mandos, las fuentes se muestran mediante cuadros discontinuos que pertenecen a colecciones.

  • Las colecciones permiten a los usuarios establecer políticas de acceso y roles. Sin embargo, la regla general es que cada fuente sólo puede pertenecer a una única colección. Una vez que se han configurado las fuentes de datos, es necesario definir y ejecutar los escaneos. Los escaneos ayudan a leer los metadatos y permiten al usuario examinar los datos en el catálogo de datos.

Los escaneos se crean dentro de cada fuente y un mecanismo de conexión ayuda a configurar qué datos deben ser escaneados. Este mecanismo también ayuda a establecer la frecuencia de los escaneos. Una vez que los datos están enlatados en el catálogo, se denominan activos. Toda la información relevante para el activo se puede ver en la página de activos. Azure Purview puede configurarse según los requisitos del usuario para obtener los mejores resultados.

Información sobre los datos

En función de los datos, se generarán automáticamente perspectivas que ayuden a los usuarios a obtener una mejor comprensión. Cada visualización ofrece una opción de "ver detalles" que muestra toda la información en formato tabular. Los insights disponibles pueden ser sobre:

  • qué es azure purviewActivos: Visualizaciones creativas como mapas de árbol, gráficos de líneas y gráficos de barras basados en el tamaño y el recuento. Estas visualizaciones se filtran en función de la clasificación y el tipo de fuente.
  • Escaneos: Un gráfico de barras de serie temporal muestra el número de escaneos fallidos, cancelados y exitosos. Se puede filtrar por fechas.
  • Términos del glosario: Los gráficos circulares se utilizan para mostrar información sobre el número de términos del glosario, y los puntos de contacto asociados a ellos.
  • Clasificaciones: Se puede visualizar el número de clasificaciones y los activos clasificados, con cuatro visualizaciones que atienden a las principales clasificaciones.
  • Sensibilidad: La información sobre la sensibilidad se visualiza de forma similar a las clasificaciones.

Linaje de datos

  • El linaje de los datos ayuda a realizar un seguimiento de todos los cambios desde la creación de los datos hasta su consumo. El linaje de cada conjunto de datos puede ser rastreado y comprobado según los requisitos del usuario. El linaje de datos en Azure Purview también supervisa la salud, la calidad, el estado y las características de los datos.

El linaje de datos es una potente herramienta en Azure Purview que puede funcionar en servicios como Azure Data Lake, Azure Database y Data Factory.

Henson Group es uno de los mejores proveedores de servicios gestionados (MSP) para Microsoft Azure, con una sólida red global de profesionales y expertos. Si está interesado en utilizar Azure Purview, póngase en contacto con nosotros hoy mismo. Deje que nuestros expertos le ayuden a empezar a utilizar Azure Purview con tranquilidad.