投稿日: Sep 22, 2021
EMR Studio は、R、Python、Scala、PySparkで記述されたビッグデータおよび分析アプリケーションを、データサイエンティストやデータエンジニアが簡単に開発、視覚化、デバッグできるようにした統合開発環境 (IDE) です。本日、EMR 6.4.0 以降では、EMR Studio において同じ Jupyter ノートブック内で Python、Scala、SparkSQL、および R を使用できるようになったことをお知らせします。これにより、Spark ワークロードのためにさまざまなプログラミング言語を柔軟に使用できるようになりました。
これまで、Spark ワークロード用の同じノートブック内では、1 つの言語でのみコードを記述することができました。Jupyter ノートブックのこの機能拡張により、同じ Jupyter ノートブック内で Python、Scala、SparkSQL、および R を切り替えて、一時テーブルを介してセル間でデータを共有できるようになりました。この機能は、EMR Notebooks または EMR 6.4.0 以降の Jupyter Enterprise Gateway (JEG) と通信する Jupyter ノートブックからも使用できます。
EMR Studio は、米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (オレゴン)、カナダ (中部)、欧州 (アイルランド)、欧州 (フランクフルト)、欧州 (ロンドン)、欧州 (ストックホルム)、アジアパシフィック (ムンバイ)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (東京) の各リージョンでご利用いただけます。
EMR Studio において同じ Jupyter ノートブックで複数の言語を使用する方法の詳細については、こちらのドキュメントを参照してください。