Amazon Web Services ブログ

Amazon EC2 C5 および P3 インスタンスで、最適化された TensorFlow 1.6 により、高速なトレーニングを実行する

AWS Deep Learning AMI には、別々の仮想環境にプリインストールされた、よく使われるディープラーニングフレームワークの最新の pip パッケージが付属しています。それで開発者は、すぐにディープラーニングモデルのトレーニングを始めることができます。Ubuntu および Amazon Linux 向けの、ディープラーニング AMI の新しいバージョンには、Amazon EC2 インスタンスファミリー全体にわたってハイパフォーマンスのトレーニングを行えるように高度な最適化を施して構築された、TensorFlow 1.6 が付属するようになりました。

Amazon EC2 C5 インスタンスでの高速なトレーニング

AMI には、インテルの Advanced Vector Instruction (AVX、AVX-2 および AVX-512) で構築された TensorFlow 1.6 が付属しており、Amazon EC2 C5 インスタンスで用いられている Intel Xeon Platinum プロセッサでのベクタ-および浮動小数点演算の性能を向上させています。AMI には、 十分な設定が施された、インテルのディープニューラルネットワーク向け Math Kernel Library (Intel MKL-DNN) も付属します。これは、ディープニューラルネットワークのトレーニングで使用される数学ルーチンを CPU で加速するためのものです。c5.18xlarge インスタンスタイプ上で、合成 ImageNet データセットに対し、当社の最適化された TensorFlow 1.6 ビルドを使用して
ResNet-50 ベンチマークをトレーニングしたところ、素の TensorFlow 1.6 バイナリの 7.4 倍の速度を達成できました。次に示すのは、一般的に用いられているディープラーニングベンチマークのいくつかについて、スループットを比較したものです。

すべてのテストは、バッチサイズ 32 で実行されました。

これらのコンピューティング最適化は、C3 や C4 インスタンスファミリーを含む、他の EC2 コンピューティング最適化インスタンスにおいても利点をもたらし、素の TensorFlow バイナリと比較して同様の性能向上を実現します。

Amazon EC2 P3 インスタンスでの高速なトレーニングを行えるよう最適化されている

ディープラーニング AMI には、NVIDIA CUDA 9 と cuDNN 7 に合わせて十分な設定の施された TensorFlow 1.6 の最適化ビルドも含まれています。これは、Amazon EC2 P3 インスタンスで使用されている Volta V100 GPU での混合精度トレーニングの利点を活用します。AMI に付属する最新の CUDA および GPU ドライバーは次の通りです。

  • CUDA 9.0
  • cuDNN 7.0.5
  • NCCL 2.1.2
  • NVIDIA GPU Driver 384.111

また、インテルの AVX、SSE および FMA 命令セットを使用してビルドされた、当社の最適化 TensorFlow 1.6 バイナリは、CPU 上で相当なデータ前処理を実施する、Amazon EC2 P3 インスタンスでのディープラーニング負荷にも利点をもたらします。

最適化 TensorFlow バイナリのシームレスなデプロイ

ディープラーニング AMI は、次のようなコマンドによって TensorFlow 仮想環境が初めてアクティブにされたとき、ユーザーが選択した EC2 インスタンスに合わせて最適化された TensorFlow のハイパフォーマンスビルドを自動的にデプロイします。

Python 2 の場合

source activate tensorflow_p27

Python 3 の場合

source activate tensorflow_p36

ディープラーニング AMI の開始方法

AWS ディープラーニング AMI の使用開始の方法はシンプルで、すぐに行えます。当社の最新の AMI は、AWS Marketplace で利用できるようになっています。また、AWS では、モデルトレーニングを迅速に進められるよう、クイックチュートリアルや開発者用リソースを多数ご用意しています。


今回のブログの投稿者について

Sumit Thakur は AWS 深層学習のシニアプロダクトマネージャーです。特に深層学習 AMI のエンジンを使いやすくすることに焦点を当て、ユーザーがクラウドでディープラーニングを開始しやすくする製品を担当しています。自然に触れたり、SF の TV シリーズ鑑賞が趣味です。