게시된 날짜: Dec 22, 2017
이제 Amazon EMR 릴리스 5.11.0에서 Apache Spark 2.2.1, Apache Hive 2.3.2 및 Amazon SageMaker와 Apache Spark의 통합 환경을 사용할 수 있습니다. Spark 2.2.1 및 Hive 2.3.2에는 다양한 버그 수정 및 개선 사항이 포함되어 있습니다. Amazon SageMaker Spark는 Amazon SageMaker에 대한 오픈 소스 Spark 라이브러리이며 대규모의 기계 학습 모델을 빌드, 학습 및 배포할 수 있도록 하는 완전 관리형 서비스입니다. Spark ML Pipelines에서 Amazon SageMaker와 상호 작용하는 Spark 스테이지 및 스테이지를 인터리브하여 K-Means 클러스터링 또는 XGBoost와 같은 Amazon에서 제공하는 ML 알고리즘을 사용하여 Amazon SageMaker에서 Spark DataFrames를 사용하여 모델을 학습할 수 있습니다.
AWS Management Console, AWS CLI 또는 SDK에서 릴리스 레이블 “emr-5.11.0”을 선택하면 릴리스 5.11.0으로 Amazon EMR 클러스터를 생성할 수 있습니다. Spark 및 Hive를 선택하여 이러한 애플리케이션을 클러스터에 설치할 수 있습니다. Amazon SageMaker Spark 라이브러리는 Spark를 설치할 때 자동으로 제공됩니다. 릴리스 5.11.0, Spark 2.2.1, Hive 2.3.2 및 Spark와 함께 제공된 Amazon SageMaker 사용에 대한 자세한 내용은 Amazon EMR 문서를 참조하십시오.
Amazon EMR 릴리스 5.11.0은 Amazon EMR을 지원하는 모든 리전에서 사용할 수 있습니다.