投稿日: Jan 22, 2019
AWS Glue で Python スクリプトを使用して、しばしば ETL (抽出、変換、読み込み) ワークフローの一部となる、中小規模の一般的なタスクを実行できるようになりました。以前の AWS Glue ジョブは、サーバーレスの Apache Spark 環境で実行されるジョブに限定されていました。Amazon Redshift、Amazon Athena、Amazon EMR などのサービスに SQL クエリを送信したり、機械学習および化学分析を実行するなどの Python シェルジョブを使用できるようになりました。
AWS Glue の Python シェルジョブは、Python 2.7 と互換性があり、Boto3、NumPy、SciPy、pandas などのライブラリがあらかじめロードされているスクリプトをサポートします。1 DPU (Data Processing Unit) または 0.0625 DPU (1/16 DPU) を使用して Python シェルジョブを実行できます。1 つの DPU で 4 vCPU のコンピューティングと 16GB のメモリで構成される処理能力を提供します。
AWS Glue を利用できるリージョンについては、AWS リージョンテーブルをご覧ください。