5 razones por las que Azure Databricks es lo mejor para las cargas de trabajo de Hadoop

Arindam Chatterjee Director del Grupo de Productos de Azure Databricks

azure databricks

Debido a la complejidad, el alto coste de las operaciones y la infraestructura no escalable, las plataformas Hadoop locales a menudo no han cumplido con sus promesas iniciales de impactar en el valor del negocio. Como resultado, muchas empresas están tratando de modernizar sus plataformas Hadoop a plataformas de datos en la nube. Los catalizadores son:

  • Alto coste de propiedad: El hardware local es costoso y el potencial nunca se aprovecha.
  • Licencias al final de su vida útil y que expiran: ¿Renovación o migración?
  • Fin del soporte: Los clientes se ven obligados a actualizar o comprar un nuevo hardware.

Los clientes están recurriendo a Azure Databricks. Azure Databricks es una plataforma de análisis de datos unificada para acelerar la innovación en la ciencia de datos, la ingeniería de datos y el análisis empresarial. Azure Databricks aporta una solución rentable y escalable para gestionar las cargas de trabajo de Hadoop en la nube, que es fácil de gestionar, altamente fiable para diversos tipos de datos y permite obtener información predictiva y en tiempo real para impulsar la innovación.

Azure Databricks es el mejor lugar para migrar sus cargas de trabajo Hadoop

La migración de sus cargas de trabajo de Hadoop a Azure Databricks aporta gestión de costes, escalabilidad, fiabilidad para todos los tipos de datos y la capacidad de aplicar análisis avanzados para obtener información más profunda. Microsoft Azure proporciona una plataforma en la nube totalmente gestionada que maneja de forma fiable todo tipo de datos con Delta Lake dentro de Azure Databricks. El motor de tiempo de ejecución de Databricks es una versión de Spark altamente optimizada y ajustada al rendimiento que se despliega en Azure como servicio gestionado. Databricks ofrece autoescalabilidad elástica impulsada por Azure. Los clientes pueden ampliar o reducir la escala en función de la carga de trabajo para ofrecer la escala y el rendimiento más rentables en la nube. Con Azure Databricks, los marcos de IA, incluyendo TensorFlow, Keras y PyTorch, están disponibles en un solo lugar. Acceda a ellos utilizando cuadernos de Python o Scala, todo en un cuaderno accesible y compartido. Estas capacidades no son posibles en un entorno local.

Azure Databricks no es sólo el mejor destino para las migraciones de Hadoop, sino también para todas las cargas de trabajo de Databricks. Azure Databricks es el único servicio de primera parte que proporciona a los clientes beneficios que no se ofrecen en ninguna otra nube. La integración de primera parte y nuestra alianza estratégica única ahorran tiempo y esfuerzo a los clientes y aceleran significativamente el tiempo de obtención de valor. Como señala Forrester, "la ventaja competitiva ya no consiste en ser el primero en llegar al mercado, sino en ser el primero en obtener valor".1

Azure Databricks permite a los clientes ser los primeros en obtener valor por estas cinco razones:

1. Una asociación de ingeniería única

Los equipos de ingeniería de Azure y Databricks profundizan en la integración de Databricks dentro de Azure para permitir el rápido éxito de los clientes. Ambos equipos de ingeniería han dedicado cientos de miles de horas a optimizar Databricks para Azure. Esta colaboración impulsa un nivel de alto rendimiento de las operaciones a escala de la nube que no sería posible de otro modo. Dado que Azure Databricks es un servicio de primera mano, el equipo de ingeniería de Azure Databricks puede optimizar la oferta en cuanto a almacenamiento, redes y computación en beneficio de los clientes de Azure. Los clientes también tienen acceso a nuevas innovaciones, como la vista previa exclusiva del nuevo motor Photon, antes de que estén disponibles en otros lugares.

2. Apoyo a la misión crítica y facilidad para el comercio

Los clientes de Azure Databricks reciben soporte de nivel empresarial desde un único lugar en lugar del modelo bifurcado que experimentarían en otros lugares. Esto es importante para los clientes que ejecutan cargas de trabajo de misión crítica con Databricks. Con Azure Databricks, los clientes también se benefician de un proceso de licencia simplificado. Los clientes de Azure pueden empezar a utilizar Azure Databricks inmediatamente, sin tener que firmar o adquirir licencias adicionales. Esto se suma a la recepción de una única factura, lo que simplifica enormemente la experiencia del cliente, y proporciona el nivel de soporte y previsibilidad que los clientes esperan de sus proveedores de nube.

3. Ecosistema Azure

Azure Databricks está totalmente integrado con la amplia cartera de productos y servicios del ecosistema de Microsoft Azure, lo que acelera el tiempo de valor de los clientes. El esfuerzo conjunto de ingeniería garantiza la perfecta integración de Azure Databricks con servicios como Azure Event Hubs, Azure Data Lake Storage, Azure Synapse Analytics y Azure IoT Hub. Tal y como se muestra en nuestra arquitectura de pipelines de ingestión, ETL y procesamiento de flujos, Azure Databricks ingiere datos de forma sencilla, abierta y colaborativa. Al construir una solución de flujo de datos con Azure Databricks, Providence Health Care desbloqueó las capacidades de análisis en tiempo real para aliviar la saturación del hospital. Además, el conector Azure Synapse, altamente optimizado, es el conector de servicios más popular de todo Databricks. La combinación de estos servicios que funcionan a la perfección refuerza a Azure como el destino preferido para ejecutar cargas de trabajo de análisis de misión crítica con Databricks.

4. Seguridad, identidad y cumplimiento nativos

Azure Databricks proporciona seguridad de grado empresarial en Azure, incluyendo la integración de Azure Active Directory (Azure AD), controles de acceso basados en roles y acuerdos de nivel de servicio (SLA) que protegen sus datos y su negocio. La integración nativa con Azure AD permite al cliente ejecutar soluciones completas basadas en Azure utilizando Azure Databricks desde el momento en que se despliega un espacio de trabajo de Azure Databricks. Se trata de una experiencia sin intervención, en comparación con la creación de una solución de autenticación independiente después de desplegar un espacio de trabajo. La gestión de la identidad y el acceso se propaga a través de todos los demás servicios de Azure en la solución y fluye entre otros servicios de Azure en su solución, lo que significa menos trabajo y menos tiempo para poner en marcha una solución.

Azure Databricks es el único entorno de Databricks con la Autorización Alta de FedRAMP junto con otras 12 certificaciones de seguridad. Esta autorización proporciona a los clientes la garantía de que Azure Databricks está diseñado para cumplir con los requisitos de seguridad y cumplimiento del Gobierno de los Estados Unidos para apoyar sus cargas de trabajo de análisis y ciencia de datos sensibles. Puede utilizar Azure Databricks con confianza en sectores regulados como la sanidad, las ciencias de la vida y los servicios financieros.

5. Incorporación rápida

Azure Databricks hace que sea fácil empezar. Con unos pocos clics, los equipos de datos pueden configurar un espacio de trabajo de Azure Databricks. Pueden colaborar entre equipos y acceder a otros servicios necesarios inmediatamente a través del portal de Azure. Azure Databricks ofrece un camino fácil para empezar y está disponible para clientes de todo el mundo en 35 regiones de Azure.

Empieza hoy mismo

Sólo Azure ofrece Databricks como un servicio de primera parte, presentando una opción convincente entre las opciones de proveedores de la nube. Obtenga más información sobre cómo puede aprovechar estas ventajas hoy mismo. Comience con nuestra experiencia de prueba gratuita.