Publicado: Dec 19, 2022
Agora você pode consultar tabelas do Delta Lake sem problemas no Amazon Athena, oferecendo o benefício de maior eficiência operacional, melhor performance de consulta e custo reduzido. O Delta Lake é um formato de tabela de código aberto que ajuda a implementar arquiteturas modernas de data lake normalmente criadas no Amazon S3. Antes desse lançamento, a leitura das tabelas do Delta Lake no Athena exigia um processo complexo de geração e gerenciamento de arquivos de metadados adicionais. Agora você pode usar o Athena para consultar tabelas do Delta Lake diretamente sem esse esforço adicional.
O Athena permite análises interativas e relatórios de painéis para data lakes formatados em Delta Lake, e agora suas atualizações de tabelas do Delta Lake estão disponíveis para análise no Athena assim que são concluídas. O Athena usa metadados contidos nos arquivos do Delta Lake para otimizar suas consultas, para que você reduza seus custos de digitalização de dados e obtenha uma melhoria de performance de até 40% em suas consultas do Athena. O Athena facilita a criação e o gerenciamento de tabelas do Delta Lake no Catálogo de Dados do AWS Glue usando instruções DDL simples, como CREATE EXTERNAL TABLE e DESCRIBE TABLE, que são consistentes com outros tipos de tabelas compatíveis com o Athena. Você também pode usar o AWS Glue Crawler para descobrir esquemas de tabelas do Delta Lake e gerenciar atualizações de esquemas no Catálogo de Dados do Glue para arquivos do Delta Lake, disponibilizando dados recém-catalogados para análise no Athena sem dificuldades.
O suporte de leitura aprimorado para o Delta Lake está disponível no mecanismo do Athena versão 3, pode ser usado com os drivers, a API ou o console do Athena e está disponível em todas as regiões com suporte. Para saber mais sobre o novo suporte do Delta Lake no Athena, consulte Querying Delta Lake tables na documentação do usuário do Athena.