Amazon Web Services ブログ
NVIDIA A10G Tensor Core GPU を備えた EC2 G5 インスタンス
2 年前、最大 8 つの NVIDIA T4 Tensor Core GPU を搭載した、当時新しかった G4 インスタンスについてお話ししました。こうしたインスタンスは、機械学習推論やグラフィックスを多用するアプリケーションで、費用対効果の高い GPU パワーを提供するように設計されています。
2021 年 11 月 11 日、最大 8 つの NVIDIA A10G Tensor Core GPU を備えた新しい G5 インスタンスについてお伝えします。第2世代 AMD EPYC プロセッサーを搭載したこうしたインスタンスは、推論やグラフィックスを多用する操作において、以前のものと比較して最大 40% 優れた対費用効果を実現します。
GPU 側では、G4dn インスタンスの T4 GPU と比較して、A10G GPU は ML トレーニングパフォーマンスが最大 3.3x 倍、ML 推論パフォーマンスが最大 3 倍、グラフィックスパフォーマンスが最大 3 倍向上しています。各 A10G GPU には、24 GB のメモリ、80 RT (レイトレーシング) コア、320 の第 3 世代 NVIDIA Tensor コア が搭載されており、AI ワークロードに最大 250 TOPS (テラオペレーション/秒) の処理能力を提供できます。
仕様は以下のとおりです。
インスタンス名 |
NVIDIA A10G テンソルコア GPU |
vCPU | メモリ | ローカルストレージ | EBS 帯域幅 | ネットワーク帯域幅 |
g5.xlarge | 1 | 4 | 16 GiB | 250 GB | 最大 3.5 Gbps | 最大 10 Gbps |
g5.2xlarge | 1 | 8 | 32 GiB | 450 GB | 最大 3.5 Gbps | 最大 10 Gbps |
g5.4xlarge | 1 | 16 | 64 GiB | 600 GB | 8 Gbps | 最大 25 Gbps |
g5.8xlarge | 1 | 32 | 128 GiB | 1900 GB | 16 Gbps | 25 Gbps |
g5.12xlarge | 4 | 48 | 192 GiB | 3800 GB | 16 Gbps | 40 Gbps |
g5.16xlarge | 1 | 64 | 256 GiB | 1900 GB | 16 Gbps | 25 Gbps |
g5.24xlarge | 4 | 96 | 384 GiB | 3800 GB | 19 Gbps | 50 Gbps |
g5.48xlarge | 8 | 192 | 768 GiB | 7600 GB | 19 Gbps | 100 Gbps |
以前のインスタンスと同様に、こうしたインスタンスは多くの興味深いタイプのワークロードに最適です。これから、いくつかの事例をご紹介します。
メディアとエンターテイメント – カスタマーは G5 インスタンスを使用して、通常はハイエンドのプログレードツールを使用して、仕上げやカラーグレーディングタスクをサポートできます。こうしたタスクは、各インスタンスに割り当てられる豊富な EBS 帯域幅によってサポートされ、リアルタイム再生もサポートできます。また、G5 インスタンスのレイトレーシング能力が向上し、ゲーム開発ツールをサポートすることもできます。
リモートワークステーション – メディアとエンターテイメント、ゲーム、教育、アーキテクチャ、エンジニアリング、建設など、さまざまな業界のお客様はハイエンドグラフィカルワークステーションをクラウドで実行したいと考えており、さまざまなサイズのインスタンスを求めています。
機械とディープラーニング – G5 インスタンスは、トレーニングと推論のワークロードに高いパフォーマンスと大きな価値をもたらします。また、NVIDIA NGC カタログ から NVIDIA CuDNN、NVIDIA TensorRT、NVIDIA Triton 推論サーバー、およびその他の ML/DL ソフトウェアへのアクセスを提供します。これらはすべて NVIDIA GPU での使用に最適化されています。
自動運転車 – 当社のお客様の中には、複数のリアルタイムセンサーを含む自動運転車の設計とシミュレーションを行っている方もいます。お客様は、レイトレーシングを利用してセンサー入力をリアルタイムでシミュレートし、強力なネットワークと大容量メモリの利点を受けるツールを使用して、現実世界のテストからデータを収集します。
インスタンスは Linux と Windows をサポートし、CUDA、CuDNN、CuBLAS、NVENC、TensorRT、OpenCL、DirectX、Vulkan、OpenGL を含む、グラフィカルおよび機械学習ライブラリの非常に長いリストと互換性があります。
今すぐ利用可能です
新しい G5 インスタンスはすぐ利用でき、東アメリカ (北バージニア)、西アメリカ (オレゴン)、よびヨーロッパ (アイルランド)で、オンデマンド、スポット、Savings Plans、および留保インスタンスの形式で、本日使い始めることができます。また、Amazon Elastic Container Service (Amazon ECS) および Amazon Elastic Kubernetes Service (EKS) クラスターで起動することもできます。
詳細については、 G5 インスタンスページをご覧ください。
— Jeff;
原文はこちらです。