亚马逊AWS官方博客
新增 – 由 AWS Graviton2 处理器和 NVIDIA T4G Tensor Core GPU 提供支持的 Amazon EC2 G5g 实例
AWS Graviton2 处理器由 AWS 定制设计,可在 Amazon EC2 中实现最佳的性价比。成千上万的客户意识到,使用基于 Graviton2 的实例可为各种工作负载带来显著的性价比益处。
我们宣布正式推出 Amazon EC2 G5g 实例,该实例将 Graviton2 的性价比益处扩展到基于 GPU 的工作负载,包括图形应用程序和机器学习推理。除了 Graviton2 处理器之外,G5g 实例还配备了 NVIDIA T4G Tensor Core GPU,可为 Android 游戏流提供最佳性价比,该 GPU 最高具有 25 Gbps 的网络带宽和 19 Gbps 的 EBS 带宽。
与基于 x86 的 GPU 实例相比,这些实例使 Android 游戏流每小时每个流的成本最高降低 30%。G5g 实例也是寻求经济高效的推理、拥有对 CPU 性能敏感的机器学习 (ML) 模型以及利用 NVIDIA 的 AI 库的机器学习开发人员的理想选择。
G5g 实例有六种大小,如下所示。
实例名称 | vCPU | 内存 (GB) | NVIDIA T4G Tensor Core GPU | GPU 内存 (GB) | EBS 带宽 (Gbps) | 网络带宽 (Gbps) |
g5g.xlarge | 4 | 8 | 1 | 16 | 最高 3.5 | 最高 10 |
g5g.2xlarge | 8 | 16 | 1 | 16 | 最高 3.5 | 最高 10 |
g5g.4xlarge | 16 | 32 | 1 | 16 | 最高 3.5 | 最高 10 |
g5g.8xlarge | 32 | 64 | 1 | 16 | 9 | 12 |
g5g.16xlarge | 64 | 128 | 2 | 32 | 19 | 25 |
g5g.metal | 64 | 128 | 2 | 32 | 19 | 25 |
这些实例非常适合许多有趣类型的工作负载。下面举几个示例:
- 流式传输 Android 游戏 — 使用 G5g 实例,Android 游戏开发者可以在基于 Arm 的 GPU 实例上进行本机构建,而无需在基于 x86 的实例上交叉编译或进行仿真。他们可以对渲染的图形进行编码,然后通过网络将游戏流式传输到移动设备。这有助于简化开发工作和时间,并将每个流每小时的成本最高降低 30%。
- ML 推理 — G5g 还是寻求经济高效的推理、拥有对 CPU 性能敏感的机器学习模型以及利用 NVIDIA AI 的机器学习开发人员的理想选择。如果您对 NVIDIA 软件没有任何依赖关系,则可以使用 Inf1 实例,与 G4dn 实例相比,该实例最高可将每次推理的成本降低 70%。
- 图形渲染 — 对于具有渲染工作负载和 NVIDIA 库依赖项的客户,G5g 实例是最经济高效的选项。这些实例还支持利用行业标准 API(如 OpenGL 和 Vulkan)的渲染应用程序和使用案例。
- 自驾车模拟 — 我们的一些客户正在设计和模拟包含多个实时传感器的自驾车。他们可以使用光线追踪来实时模拟传感器输入。
这些实例与 Linux 上的一长串图形和机器学习库兼容,包括 NVENC、NVDEC、nvJPEG、OpenGL、Vulkan、CUDA、CuDNN、CuBLAS 和 TensorRT。
现已推出
新的 G5g 实例现已推出,您可以在美国东部(弗吉尼亚北部)、美国西部(俄勒冈)和亚太地区(首尔、新加坡和东京)区域以按需 Spot、Savings Plan 和预留实例形式立即开始使用它们。要了解更多信息,请参阅 EC2 定价页面。
G5g 实例现在可以在具有 NVIDIA 驱动程序和常见 ML 框架的 AWS Deep Learning AMI、Amazon Elastic Container Service (Amazon ECS) 或用于容器化 ML 应用程序的 Amazon Elastic Kubernetes Service (Amazon EKS) 集群中使用。
您可以将反馈发送到 Amazon EC2 的 AWS 论坛,或者通过常用 AWS Support 联系人发送反馈。
– Channy