Publicado en: Dec 22, 2023
Amazon EMR sin servidor ahora es compatible con AWS Lake Formation para un control detallado del acceso a los datos con Apache Spark. Esto le permite aplicar políticas a nivel de base de datos, tablas, columnas, filas y celdas para los datos almacenados en Amazon S3 desde sus trabajos de Spark en EMR sin servidor. Las políticas que defina en Lake Formation entran en vigor cuando ejecuta aplicaciones de Spark con EMR Studio, AWS CLI o con orquestadores de trabajos como Amazon Managed Workflows para Apache Airflow y AWS Step Functions.
Lake Formation simplifica la creación, la protección y la administración de lagos de datos. Le permite definir controles de acceso detallados mediante declaraciones de concesión y revocación, similares a las que se utilizan con los sistemas de administración de bases de datos relacionales (RDBMS), y aplicar automáticamente esas políticas mediante motores compatibles como Athena, EMR en EC2 y Redshift Spectrum. Con el lanzamiento de hoy, las mismas reglas de Lake Formation que configuró para su uso con otros servicios como Athena, ahora se aplican a sus trabajos de Spark en EMR sin servidor. De esta manera, se simplifica aún más la seguridad y la gobernanza de sus lagos de datos.
El control de acceso detallado con Apache Spark en EMR sin servidor ya está en versión preliminar y disponible con la versión EMR 6.15 en Asia-Pacífico (Bombay, Seúl, Singapur, Sídney, Tokio), Canadá (centro), Europa (Fráncfort, Irlanda, Londres, París, Estocolmo), América del Sur (São Paulo), Este de EE. UU. (Norte de Virginia, Ohio) y Oeste de EE. UU. (Norte de California, Oregón). Para empezar, consulte Uso de AWS Lake Formation con Amazon EMR sin servidor.