投稿日: May 25, 2023
本日より、Amazon SageMaker JumpStart で、大規模な言語モデル、特にドメイン固有データセットのテキスト生成モデルを微調整できるようになりました。カスタムデータセットを使用するモデルを微調整して、特定のドメインのパフォーマンスを向上させることができます。例えばこちらのブログでは、ドメイン適応を使用して、証券取引委員会から公開されている財務データに基づいて GPT-J 6B モデルを微調整し、モデルが金融サービスのユースケースに、より関連性の高いテキストを生成できるようにする方法について説明しています。Amazon SageMaker Studio 内の JumpStart で UI と SageMaker Python SDK を使用し、GPT-J 6B や GPT-J 6B FP16 モデルといった基盤モデルを微調整してドメイン適応ができます。
SageMaker JumpStart でドメイン適応を使用して基盤モデルを微調整するこの機能は、Amazon SageMaker JumpStart が利用可能なリージョンすべてで使用できます。
この新機能の使用方法については、SageMaker JumpStart のドキュメントとサンプルノートブックの SageMaker JumpStart Foundation Models - Fine-tuning text generation GPT-J 6B model on domain specific dataset を参照してください。