게시된 날짜: Jun 5, 2023
AWS Glue의 데이터 통합 엔진 옵션인 AWS Glue for Ray가 이제 정식 버전으로 출시되었습니다. AWS Glue for Ray는 데이터 엔지니어와 추출, 전환, 적재(ETL) 개발자가 Python 작업을 확장할 수 있도록 지원합니다. AWS Glue는 여러 소스에서 데이터를 쉽게 탐색, 준비, 이동 및 통합하는 데 사용되는 확장 가능한 서버리스 데이터 통합 서비스입니다. AWS Glue for Ray는 데이터 통합을 위한 서버리스 기능을 Python 워크로드를 확장할 수 있는 새로운 주요 오픈 소스 컴퓨팅 프레임워크인 Ray(ray.io)와 결합합니다.
AWS Glue의 Apache Spark 및 Python 엔진과 마찬가지로 코드를 실행하는 동안 사용한 리소스에 대해서만 비용을 지불하며, 리소스를 구성하거나 조정할 필요가 없습니다. AWS Glue for Ray는 다중 노드 클러스터를 통해 Python 코드를 원활하게 분산 처리하도록 합니다. AWS Glue ETL 작업을 실행할 수 있는 곳 어디서든 Ray 작업을 생성하고 실행할 수 있습니다. 여기에는 기존 AWS Glue 작업, Command Line Interface(CLI) 및 API가 포함됩니다. 로컬에서 또는 AWS Glue Studio 및 Amazon SageMaker Studio 노트북을 통해 AWS Glue for Ray 엔진을 선택할 수 있습니다. Ray 작업이 준비되면 온디맨드로 실행하거나 일정에 따라 실행할 수 있습니다.
AWS Glue for Ray는 미국 동부(오하이오), 미국 동부(버지니아 북부), 미국 서부(오레곤), 아시아 태평양(도쿄), 유럽(아일랜드) AWS 리전에서 정식 버전으로 제공됩니다.
자세히 알아보려면 AWS Glue 데이터 통합 엔진으로 이동하거나 AWS Glue 개발자 안내서: AWS Glue for Ray를 참조하세요.