投稿日: Oct 17, 2023
Amazon SageMaker で機械学習 (ML) モデルの非同期推論およびリアルタイム推論を実現するための、ml.p4d、ml.trn1、ml.g5 の各インスタンスのプレビュー版が新しいリージョンで利用できるようになったことをお知らせします。これらのインスタンスは、他のリージョンでも推論用に一般提供されます。
- ml.p4d.24xlarge インスタンスは、現在 GovCloud (米国西部)、欧州 (アイルランド)、アジアパシフィック (東京)、アジアパシフィック (シンガポール) の各 AWS リージョンでプレビュー版として提供されており、深層学習モデル向けに高いパフォーマンスを発揮します。1 つの Nvidia A100 GPU ごとに 40 GB のメモリを備えた P4d インスタンスは、大規模モデルや生成系 AI のユースケースにおいて高性能な機械学習推論を実現します。
- ml.trn1 インスタンスは、現在米国西部 (オレゴン) でプレビュー版として提供されており、テキストの要約、コード生成、質問応答などの幅広いアプリケーションで、パラメータ数 1000 億以上の深層学習モデルおよび生成系 AI モデルを使用した高性能な推論ワークロードをサポートしています。
- ml.g5 インスタンスは、現在アジアパシフィック (ソウル) と南米 (サンパウロ) でプレビュー版として提供されており、レコメンデーション、チャットボット、スマートアシスタント、画像認識などのユースケースに最適です。