投稿日: Jul 19, 2019
Amazon SageMaker バッチ変換では、Amazon S3 に保存されているデータセットに対して予測を実行できます。大量のデータバッチを扱っていて、1 秒未満のレイテンシーが不要なシナリオに最適です。バッチ変換ジョブを設定すると、特定のデータ属性を予測リクエストから除外したり、入力データ属性の一部またはすべてを予測結果と結合させたりすることができます。そのため、CSV または JSON 形式のデータに対してバッチ予測を実行するときに、追加の前処理や後処理が不要になります。
例として、ID、年齢、身長の 3 つの属性を含むデータセットについて考えてみましょう。ID 属性は、ML 問題にシグナルを伝えず、ML モデルのトレーニング時には使用されなかった、ランダムに生成された番号またはシーケンス番号です。ここでバッチ変換ジョブを設定すると、各レコードから ID 属性を除外し、モデルに送信される予測リクエストに年齢属性と身長属性のみをパスするようにできます。ジョブの最終的な S3 への出力で ID 属性を予測結果に関連付けるようにバッチ変換ジョブを設定することもできます。このように記録レベルの属性を保持すると、予測結果を分析するのに役立ちます。
この新しい機能は、Amazon SageMaker を利用できるリージョンすべてで実装されます。この機能の詳細については、Amazon SageMaker 開発者ガイドを参照してください。