亚马逊AWS官方博客
利用 Amazon EC2 P5 Spot 实例进行 LLM 的微调任务
介绍了启动和管理 P5 Spot 实例的方法,P5 实例是亚马逊最新的机器学习训练机型,有强大的性能和显存容量,可以更好地支持 LLM 的微调任务。开发者可以参考文中提供的 AWS CLI 命令,根据自身需求,开发完整 Spot 管理系统,利用 EC2 P5 Spot 实例完成低成本高算力的机器学习任务。
Amazon Aurora 数据库升级流量兼容性检测方案介绍
本文将利用 VPC traffic mirroring 功能来提供一种近乎没有性能影响的方案, 旨在帮助用户更简单地提前发现升级到 Aurora3 之后不兼容的语句。
Amazon DocumentDB 与 Amazon OpenSearch Service 的零 ETL 集成现已推出
在这篇博文中,我们将向您展示如何使用 Amazon OpenSearch Ingestion,来配置 Amazon DocumentDB 与 OpenSearch Service 的零 ETL 集成。这涉及到对 Amazon DocumentDB 数据执行完全加载,并使用变更流将最新数据流式传输到 Amazon OpenSearch Service。
Amazon Aurora MySQL 版本 2(兼容 MySQL 5.7)升级到版本 3(兼容 MySQL 8.0)检查清单,第 2 部分
在第一部分中,我们讨论了从 Amazon Aurora MySQL 兼容版 v2 升级到 v3 时,导致预检查过程失败的最常见问题。在这篇博文中,我们将讨论导致升级时间过长和升级失败的最常见原因。
Amazon Aurora MySQL 版本 2(兼容 MySQL 5.7)升级到版本 3(兼容 MySQL 8.0)检查清单,第 1 部分
Amazon Aurora MySQL 兼容版版本 2(兼容 MySQL 5.7)计划于 2024 年 10 月 31 日终止标准支持。我们建议您在 2024 年 10 月 31 日之前,尽早将数据库升级到 Amazon Aurora MySQL 3 的默认次要版本或更高版本。在这篇博文中,我们将讨论导致升级和升级预检查失败的最常见原因。这些问题需要在执行升级之前加以解决。
在 Amazon SageMaker HyperPod 上使用 LLaMA-Factory 轻松微调大模型
LLaMA-Factory 是开源社区一套大模型集成训练框架,AWS SageMaker 是亚马逊云服务中的一个全面的机器学习平台,它提供了一种简单、高效的方式来构建、训练和部署机器学习模型。 本文中我们将结合代码和示例介绍如何使用 LLaMA-Factory 在 SageMaker HyperPod 上训练大模型,熟悉 SageMaker HyperPod 集群创建和多机多卡分布式训练方法。
餐饮业的“过山车”与亚马逊云上的“智能驾驶”–美餐集团 Amazon Aurora Serverless v2 的应用实践与思考
1、引言 对于以企业员工为服务对象的在线订餐平台来说,每个工作日都像是坐上了一辆过山车 ——中午和晚上的业务高 […]
升级至 Amazon Aurora MySQL 版本 3(兼容 MySQL 8.0)
Amazon Aurora MySQL 兼容版版本 3(兼容 MySQL 8.0)是 Amazon Aurora MySQL 支持的最新主要版本。在这篇博文中,我们将讨论一个框架,供您为升级做准备,查看标准支持终止时间表,然后深入探讨升级过程。本文还介绍了在升级生产数据库集群之前,执行性能测试的最佳实践、实时监控所做更改的技巧以及其他关键注意事项。
使用 Amazon RDS 代理和具有两个可读备用数据库的 Amazon RDS Multi-AZ 部署,在停机时间不超过 1 秒的情况下执行次要版本升级
结合使用 Amazon RDS 代理时,具有两个可读备用数据库的 Amazon RDS Multi-AZ 部署现在支持次要版本升级和系统维护更新,而停机时间通常为 1 秒或更短时间。在这篇博文中,我们将讨论这项新功能及其优点和设置步骤。
Network Firewall 部署小指南(一)部署模型
如果您需要对互联网出站和入站流量(即南北向流量)进行检查和过滤,您可以在您的 VPC 网络中部署 Network Firewall。本文介绍了四种推荐的部署模型:出站分布式、出站集中式、入站分布式和入站集中式。此外,还介绍了基于这四种模型衍生出的两种组合模型。每种模型都有其自身的优势和劣势,您应根据安全和运维需求选择适合您的模型。