宣布全面推出 Amazon EC2 G6e 实例

发布于: 2024年8月15日

今天,我们宣布全面推出由 NVIDIA L40S Tensor Core GPU 提供支持的 Amazon EC2 G6e 实例。G6e 实例可用于各种机器学习和空间计算使用案例。与 G5 实例相比,G6e 实例的性能可提升高达 2.5 倍,推理成本比 P4d 实例降低多达 20%。

客户可以使用 G6e 实例部署具有高达 13B 个参数的大型语言模型 (LLM),以及用于生成图像、视频和音频的扩散模型。此外,G6e 实例将解锁客户为空间计算工作负载创建更大、更身临其境的 3D 模拟和数字孪生的能力。G6e 实例配备了多达 8 个NVIDIA L40S Tensor Core GPU(总 GPU 内存为 384GB,每个 GPU 有 24GB 内存)和第三代 AMD EPYC 处理器。它们还支持最多 192 个 vCPU、最高 400Gbps 的网络带宽、最多 1.536TB 的系统内存和最多 7.6TB 的本地 NVMe SSD 存储。开发人员可以使用 AWS Deep Learning AMI、AWS Deep Learning Containers 或托管服务(例如 Amazon Elastic Kubernetes Service (Amazon EKS) 和 AWS Batch),在 G6e 实例上运行 AI 推理工作负载,Amazon SageMaker 支持也即将推出。

Amazon EC2 G6e 实例现已在 AWS 美国东部(弗吉尼亚州北部和俄亥俄州)和美国西部(俄勒冈州)区域推出。客户能够以按需型实例、预留实例、竞价型实例或节省计划的一部分购买 G6e 实例。

要开始使用,请访问 AWS 管理控制台AWS 命令行界面 (CLI) 和 AWS SDK。要了解更多信息,请访问 G6e 实例页面