发布于: Apr 26, 2018
AWS Deep Learning AMI 现在包含 Chainer 4 和 Microsoft Cognitive Toolkit (CNTK) 2.5.1 的高级优化,旨在 Amazon EC2 实例上提供更高性能的训练。
对于基于 GPU 的训练,AMI 提供全面配置 CuPy、NVIDIA CUDA 9 和 cuDNN 7 的 Chainer 4,可在驱动 Amazon EC2 P3 实例的 NVIDIA Volta V100 GPU 上发挥混合精度训练优势。Chainer 4 还改进了低精度计算所用 Volta GPU 中对 TensorCore 的支持。此外 AMI 还部署了支持 NVIDIA CUDA 9 和 cuDNN7 的 CNTK 2.5.1 GPU 版本,以加快 Amazon EC2 P3 实例上的训练。
对于基于 CPU 的训练,AMI 提供配置英特尔深度学习扩展包 (iDeep) 的 Chainer 4,它可在驱动 Amazon EC2 计算优化 C5 和 C4 实例的英特尔架构上加快多项深度学习操作,例如卷积。AMI 现在还部署了完全配备面向深度神经网络的英特尔数学核心函数库 (Intel MKL-DNN) 的纯 CNTK 2.5.1 CPU 版本,以优化神经网络例程。
在您首次激活深度学习框架的虚拟环境时,Deep Learning AMI 会自动部署为您选择的 EC2 实例优化的更高性能版本的框架。与此类似,AMI 还会为 Amazon EC2 实例系列部署优化版本的 TensorFlow。
如需开始使用 AWS Deep Learning AMI,请参阅开发人员指南。您还可以订阅我们的讨论论坛,获取发布公告以及提出您的问题。