Veröffentlicht am: Dec 22, 2023
Amazon EMR Serverless unterstützt jetzt AWS Lake Formation für eine detaillierte Datenzugriffskontrolle mit Apache Spark. Auf diese Weise können Sie Richtlinien auf Datenbank-, Tabellen-, Spalten-, Zeilen- und Zellenebene für in Amazon S3 gespeicherte Daten aus Ihren EMR Serverless Spark-Jobs durchsetzen. Richtlinien, die Sie in Lake Formation definieren, werden wirksam, wenn Sie Spark-Anwendungen mithilfe von EMR Studio, AWS CLI oder Job-Orchestratoren wie Amazon Managed Workflows for Apache Airflow und AWS Step Functions ausführen.
Lake Formation macht es einfach, Data Lakes zu erstellen, zu sichern und zu verwalten. Es ermöglicht Ihnen, detaillierte Zugriffskontrollen durch Gewährungs- und Widerrufsanweisungen zu definieren, ähnlich denen, die bei relationalen Datenbankmanagementsystemen (RDBMS) verwendet werden, und diese Richtlinien automatisch über kompatible Engines wie Athena, EMR on EC2 und Redshift Spectrum durchzusetzen. Mit der heutigen Markteinführung gelten dieselben Lake Formation-Regeln, die Sie für die Verwendung mit anderen Diensten wie Athena eingerichtet haben, jetzt für Ihre Spark-Jobs auf EMR Serverless, was die Sicherheit und Verwaltung Ihrer Data Lakes weiter vereinfacht.
Die detaillierte Zugriffskontrolle mit Apache Spark auf EMR Serverless befindet sich in der Vorschauversion und ist mit der EMR 6.15-Version in den Regionen Asien-Pazifik (Mumbai, Seoul, Singapur, Sydney, Tokio), Kanada (Zentral), Europa (Frankfurt, Irland, London, Paris, Stockholm), Südamerika (São Paulo), USA Ost (Nord-Virginia, Ohio) und USA West (Nordkalifornien, Oregon) verfügbar. Informationen zu den ersten Schritten finden Sie unter Verwenden von AWS Lake Formation mit Amazon EMR Serverless.