亚马逊AWS官方博客

AWS Team

Author: AWS Team

利用 Amazon EC2 P5 Spot 实例进行 LLM 的微调任务

介绍了启动和管理 P5 Spot 实例的方法,P5 实例是亚马逊最新的机器学习训练机型,有强大的性能和显存容量,可以更好地支持 LLM 的微调任务。开发者可以参考文中提供的 AWS CLI 命令,根据自身需求,开发完整 Spot 管理系统,利用 EC2 P5 Spot 实例完成低成本高算力的机器学习任务。

Amazon Aurora MySQL 版本 2(兼容 MySQL 5.7)升级到版本 3(兼容 MySQL 8.0)检查清单,第 1 部分

Amazon Aurora MySQL 兼容版版本 2(兼容 MySQL 5.7)计划于 2024 年 10 月 31 日终止标准支持。我们建议您在 2024 年 10 月 31 日之前,尽早将数据库升级到 Amazon Aurora MySQL 3 的默认次要版本或更高版本。在这篇博文中,我们将讨论导致升级和升级预检查失败的最常见原因。这些问题需要在执行升级之前加以解决。

在 Amazon SageMaker HyperPod 上使用 LLaMA-Factory 轻松微调大模型

LLaMA-Factory 是开源社区一套大模型集成训练框架,AWS SageMaker 是亚马逊云服务中的一个全面的机器学习平台,它提供了一种简单、高效的方式来构建、训练和部署机器学习模型。 本文中我们将结合代码和示例介绍如何使用 LLaMA-Factory 在 SageMaker HyperPod 上训练大模型,熟悉 SageMaker HyperPod 集群创建和多机多卡分布式训练方法。

升级至 Amazon Aurora MySQL 版本 3(兼容 MySQL 8.0)

Amazon Aurora MySQL 兼容版版本 3(兼容 MySQL 8.0)是 Amazon Aurora MySQL 支持的最新主要版本。在这篇博文中,我们将讨论一个框架,供您为升级做准备,查看标准支持终止时间表,然后深入探讨升级过程。本文还介绍了在升级生产数据库集群之前,执行性能测试的最佳实践、实时监控所做更改的技巧以及其他关键注意事项。

Network Firewall 部署小指南(一)部署模型

如果您需要对互联网出站和入站流量(即南北向流量)进行检查和过滤,您可以在您的 VPC 网络中部署 Network Firewall。本文介绍了四种推荐的部署模型:出站分布式、出站集中式、入站分布式和入站集中式。此外,还介绍了基于这四种模型衍生出的两种组合模型。每种模型都有其自身的优势和劣势,您应根据安全和运维需求选择适合您的模型。