張貼日期: Apr 26, 2018
AWS 深度學習 AMI 現已納入 Chainer 4 及 Microsoft Cognitive Toolkit (CNTK) 2.5.1 等進階最佳化版本,為所有 Amazon EC2 執行個體提供更高效能的訓練。
若是以 GPU 為基礎的訓練,這些 AMI 會搭載配備 CuPy、NVIDIA CUDA 9 及 cuDNN 7 完整設定的 Chainer 4,在驅動 Amazon EC2 P3 執行個體的 NVIDIA Volta V100 GPU 上充分發揮混合精度訓練 (mixed-precision training) 的效用。如果是低精度運算作業,Chainer 4 也能為 Volta GPU 的 TensorCore 提供更多支援。這些 AMI 也會部署 CNTK 2.5.1 GPU 組件,並支援 NVIDIA CUDA 9 及 cuDNN7,加快 Amazon EC2 P3 執行個體的訓練速度。
若是以 CPU 為基礎的訓練,這些 AMI 則搭載配備 Intel Deep Learning Extension Package (iDeep) 設定的 Chainer 4,以加速深度學習作業,例如在提供 Amazon EC2 運算最佳化 C5 及 C4 執行個體技術支援的 Intel 架構上執行迴旋積運算。這些 AMI 亦可部署配備 Intel Math Kernel Library for Deep Neural Networks (Intel MKL-DNN) 完整設定的 CNTK 2.5.1 CPU 版組建,將神經網路程序最佳化。
首次啟用架構的虛擬環境時,深度學習 AMI 會自動部署上述高效能深度學習架構組建,這些組建皆已針對您選用的 EC2 執行個體完成最佳化。就像 AMI 也會為 Amazon EC2 執行個體系列部署 TensorFlow 最佳化組建,原理類似。