게시된 날짜: Dec 19, 2022
이제 Amazon Athena에서 Delta Lake 테이블을 원활하게 쿼리할 수 있으므로 운영 효율성 향상, 쿼리 성능 향상 및 비용 절감의 이점을 누릴 수 있습니다. Delta Lake는 일반적으로 Amazon S3에 구축되는 최신 데이터 레이크 아키텍처를 구현하는 데 도움이 되는 오픈 소스 테이블 형식입니다. 이번 출시 전에는 Athena에서 Delta Lake 테이블을 읽으려면 추가 메타데이터 파일을 생성하고 관리하는 복잡한 프로세스가 필요했습니다. 이제 Athena를 사용하여 이러한 추가 작업 없이 Delta Lake 테이블을 직접 쿼리할 수 있습니다.
Athena는 Delta Lake 형식의 데이터 레이크에 대한 대화형 분석 및 대시보드 보고를 지원합니다. 이제 Delta Lake 테이블 업데이트가 완료되는 즉시 Athena에서 분석에 사용할 수 있습니다. Athena는 Delta Lake 파일에 포함된 메타데이터를 사용하여 쿼리를 최적화하므로 데이터 스캔 비용을 줄이고 Athena 쿼리의 성능을 최대 40% 향상시킬 수 있습니다. Athena를 사용하면 Athena에서 지원되는 다른 테이블 유형과 일치하는 CREATE EXTERNAL TABLE 및DESCRIPE TABLE과 같은 간단한 DDL 문을 사용하여 AWS Glue 데이터 카탈로그에서 델타 레이크 테이블을 쉽게 생성하고 관리할 수 있습니다. 또한 AWS Glue 크롤러를 사용하여 Delta Lake 테이블 스키마를 검색하고 Glue Data Catalog for Delta Lake 파일에서 스키마 업데이트를 관리하여 새로 카탈로그화된 데이터를 Athena에서 원활하게 분석할 수 있습니다.
Delta Lake에 대한 향상된 읽기 지원은 Athena 엔진 버전 3에서 사용할 수 있으며 Athena 드라이버, API 또는 콘솔과 함께 사용할 수 있으며 지원되는 모든 리전에서 사용할 수 있습니다. Athena의 새로운 Delta Lake 지원에 대해 자세히 알아보려면 Athena 사용자 설명서에서 Delta Lake 테이블 쿼리를 참조하십시오.