发布于: May 25, 2023
从今天开始,Amazon SageMaker JumpStart 提供微调大型语言模型的功能,尤其是针对特定域数据集的文本生成模型。客户现在可以使用其自定义数据集对模型进行微调,以提高特定域的性能。例如,本博客介绍如何使用域自适应功能,根据美国证券交易委员会的公开金融数据对 GPT-J 6B 模型进行微调,以便该模型能够为金融服务用例生成更多相关的文本。客户可以通过用户界面和 SageMaker Python SDK 微调 GPT-J 6B 和 GPT-J 6B FP16 模型等基础模型,以便在 Amazon SageMaker Studio 内的 JumpStart 上进行域自适应。
这项通过 SageMaker JumpStart 上的域自适应来微调基础模型的功能可以在提供 Amazon SageMaker JumpStart 的所有区域使用。
要了解如何使用这项新功能,请参阅 SageMaker JumpStart 文档和示例笔记本 SageMaker JumpStart 基础模型 – 在特定域数据集上微调文本生成 GPT-J 6B 模型。