게시된 날짜: Sep 22, 2021
EMR Studio는 데이터 사이언티스트와 데이터가 R, Python, Scala 및 PySpark에서 작성한 빅 데이터 및 분석 애플리케이션을 쉽게 개발, 시각화 및 디버깅할 수 있도록 지원하는 통합 개발 환경(IDE)입니다. 오늘 EMR 6.4.0 이상에서 EMR Studio의 동일한 Jupyter 노트북 내에서 Python, Scala, SparkSQL 및 R을 사용하여 Spark 워크로드에 대한 서로 다른 프로그래밍 언어를 사용하는 유연성을 제공할 수 있다는 소식을 전하게 되어 정말 기쁩니다.
이전에는 Spark 워크로드에 대해 동일한 노트북 내 하나의 언어로만 코드를 작성할 수 있었습니다. Jupyter 노트북의 이번 기능 개선 사항을 통해 이제 동일한 Jupyter 노트북 내에서 Python, Scala, SparkSQL 및 R 사이를 전환하고 임시 테이블을 통해 셀 사이에서 데이터를 공유할 수 있습니다. 또한, 이 기능은 EMR Notebooks에서 사용하거나 EMR 6.4.0 이상의 Jupyter Enterprise Gateway(JEG)로 통신하는 Jupyter 노트북에서 사용할 수 있습니다.
EMR Studio는 미국 동부(오하이오), 미국 동부(버지니아 북부), 미국 서부(오레곤), 캐나다(중부), EU(아일랜드), EU(프랑크푸르트), EU(런던), EU(스톡홀름), 아시아 태평양(뭄바이), 아시아 태평양(서울), 아시아 태평양(싱가포르), 아시아 태평양(시드니), 아시아 태평양(도쿄) 리전에서 사용 가능합니다.
EMR의 동일한 Jupyter 노트북에서 여러 언어를 사용하는 방법에 대한 자세한 내용은 여기에서 설명서를 참조하세요.