投稿日: Sep 21, 2021
Amazon SageMaker は、SageMaker Studio ノートブックからインタラクティブな Spark ベースのデータ処理を可能にする新しい機能セットを発表しました。Amazon SageMaker Studio は、機械学習のための初の完全統合開発環境 (IDE) です。SageMaker Studio は、データの準備、モデルの構築、トレーニング、およびデプロイに必要なすべての ML 開発ステップを実行できる単一のウェブベースのビジュアルインターフェイスを提供します。データサイエンティストやデベロッパーは、一回のクリックで素早く Studio ノートブックにサインインし、データセットの検証や ML モデルの構築を始められます。
本日より、データサイエンティストやデータエンジニアは、Studio ノートブックから数回クリックするだけで、Amazon EMR で実行されている Spark データ処理環境を視覚的に参照、検出、接続することができます。接続すると、Python および Scala 用の組み込みの SparkMagic ノートブック環境を使用して、データをインタラクティブにクエリ、探索、視覚化して、Spark ジョブを実行することができます。
大量のデータの分析、変換、準備は、データサイエンスと ML ワークフローの基本的なステップであり、多くの企業は Apache Spark を活用してデータを迅速に準備しています。SageMaker Studio は、Experiments、Clarify、Model Monitor for ML など、専用のクラス最高のツールをすでに提供しています。今回新しくリリースされた機能により、お客様は Studio ノートブックから専用の Spark 環境に簡単にアクセスできるようになります。したがって、SageMaker Studio は、データサイエンスやデータエンジニアリングのワークフローの統合環境として機能し、これを利用するお客様は Studio ノートブックでデータワークフローを標準化できます。
SageMaker Studio のこれらの新しいデータ分析機能は、SageMaker Studio を利用できるすべての AWS リージョンで一般利用可能であり、この機能を使用するための追加料金は必要ありません。料金および利用できるリージョンの全体一覧については、SageMaker Studio 料金ページを参照してください。詳細については、SageMaker Studio ノートブックユーザーガイドの「Studio ノートブックを使用したインタラクティブなデータ準備」を参照してください。