Amazon Web Services 한국 블로그
신규 Amazon EC2 G5 인스턴스 – NVIDIA A10G Tensor Core GPU 기반
2년 전에 저는 최대 8개의 NVIDIA T4 Tensor Core GPU를 탑재한 당시의 새로운 G4 인스턴스에 대해 이야기했습니다. 이러한 인스턴스는 기계 학습 추론 및 그래픽 집약적 애플리케이션을 위한 비용 효율적인 GPU 성능을 제공하도록 설계되었습니다.
오늘 저는 최대 8개의 NVIDIA A10G Tensor Core GPU를 탑재한 새로운 G5 인스턴스에 대해 알려드리게 되어 기쁩니다. 2세대 AMD EPYC 프로세서로 구동되는 이 인스턴스는 이전 인스턴스와 비교하여 추론 및 그래픽 집약적 작업에 대해 최대 40% 향상된 가격 대비 성능을 제공합니다.
GPU 측면에서 A10G GPU는 G4dn 인스턴스의 T4 GPU에 비해 최대 3.3배 향상된 기계 학습 훈련 성능, 최대 3배 향상된 기계 학습 추론 성능 그리고 최대 3배 향상된 그래픽 성능을 제공합니다. 각 A10G GPU는 24GB의 메모리, 80개의 RT(레이 트레이싱) 코어, 320개의 3세대 NVIDIA Tensor Core를 갖추고 있으며, AI 워크로드에 대해 최대 250TOPS(초당 테라 연산)의 컴퓨팅 성능을 제공할 수 있습니다.
사양은 다음과 같습니다.
인스턴스 이름 |
NVIDIA A10G Tensor Core GPU |
vCPU | 메모리 | 로컬 스토리지 | EBS 대역폭 | 네트워크 대역폭 |
g5.xlarge | 1 | 4 | 16GiB | 250GB | 최대 3.5Gbps | 최대 10Gbps |
g5.2xlarge | 1 | 8 | 32GiB | 450GB | 최대 3.5Gbps | 최대 10Gbps |
g5.4xlarge | 1 | 16 | 64GiB | 600GB | 8Gbps | 최대 25Gbps |
g5.8xlarge | 1 | 32 | 128GiB | 1900GB | 16Gbps | 25Gbps |
g5.12xlarge | 4 | 48 | 192GiB | 3800GB | 16Gbps | 40Gbps |
g5.16xlarge | 1 | 64 | 256GiB | 1900GB | 16Gbps | 25Gbps |
g5.24xlarge | 4 | 96 | 384GiB | 3800GB | 19Gbps | 50Gbps |
g5.48xlarge | 8 | 192 | 768GiB | 7600GB | 19Gbps | 100Gbps |
이전 인스턴스와 마찬가지로 이러한 인스턴스는 많은 흥미로운 유형의 워크로드에 매우 적합합니다. 다음은 몇 가지 예입니다.
미디어 및 엔터테인먼트 — 고객은 일반적으로 고급 프로급 도구를 통해 G5 인스턴스를 사용하여 마무리 및 색상 등급 지정 태스크를 지원할 수 있습니다. 이러한 작업은 또한 각 인스턴스에 할당된 풍부한 EBS 대역폭의 도움을 받아 실시간 재생을 지원할 수 있습니다. 고객은 G5 인스턴스의 향상된 레이 트레이싱 성능을 사용하여 게임 개발 도구를 지원할 수도 있습니다.
원격 워크스테이션 — 미디어 및 엔터테인먼트, 게임, 교육, 건축, 엔지니어링 및 건설을 포함한 다양한 산업 분야의 고객은 클라우드에서 고급 그래픽 워크스테이션을 실행하기를 원하며 다양한 크기의 인스턴스를 찾고 있습니다.
기계 학습 및 딥 러닝 — G5 인스턴스는 교육 및 추론 워크로드에 고성능과 상당한 가치를 제공합니다. 또한 NVIDIA GPU와 함께 사용하도록 최적화된 NVIDIA NGC 카탈로그의 NVIDIA CuDNN, NVIDIA TensorRT, NVIDIA Triton 추론 서버 및 기타 기계 학습/딥 러닝 소프트웨어에 대한 액세스도 제공합니다
자율 주행 차량 — 여러 고객이 여러 실시간 센서를 포함하는 자율 주행 차량을 설계하고 시뮬레이션하고 있습니다. 고객은 레이 트레이싱을 활용하여 실시간으로 센서 입력을 시뮬레이션하고 또한 강력한 네트워킹과 대용량 메모리의 이점을 활용하는 도구를 사용하여 실제 테스트에서 데이터를 수집합니다.
이 인스턴스는 Linux 및 Windows를 지원하며 CUDA, CuDNN, CuBLAS, NVENC, TensorRT, OpenCL, DirectX, Vulkan 및 OpenGL을 비롯한 매우 긴 그래픽 및 기계 학습 라이브러리 목록과 호환됩니다.
정식 출시
새로운 G5 인스턴스를 지금 사용할 수 있으며 지금 미국 동부(버지니아 북부), 미국 서부(오레곤) 및 유럽(아일랜드) 리전에서 온디맨드, 스팟, Savings Plan 및 예약 인스턴스 형태로 사용할 수 있습니다. 또한 Amazon Elastic Container Service(Amazon ECS) 및 Amazon Elastic Kubernetes Service(EKS) 클러스터에서 시작할 수도 있습니다.
자세히 알아보려면 G5 인스턴스 페이지를 확인하세요.
— Jeff;