Amazon Web Services 한국 블로그

Amazon EC2 인스턴스(F2) 정식 출시 – 차세대 FPGA 워크로드용

최대 8개의 AMD 필드 프로그래머블 게이트 어레이(FPGA), 최대 192코어의 AMD EPYC(Milan) 프로세서, 고대역폭 메모리(HBM), 최대 8티비바이트의 SSD 기반 인스턴스 스토리지 및 최대 2티비바이트의 메모리를 탑재한 새로운 F2 인스턴스는 두 가지 크기로 제공되며 유전체학, 멀티미디어 처리, 빅 데이터, 위성 통신, 네트워킹, 실리콘 시뮬레이션 및 라이브 비디오 워크로드를 가속화할 수 있습니다.

FPGA에 대한 간략한 요약
다음은 1세대 FPGA 기반 Amazon Elastic Compute Cloud(Amazon EC2) 인스턴스를 미리 살펴볼 때 FPGA 모델을 설명한 내용입니다

맞춤형 하드웨어 기반 솔루션에 대한 더 흥미로운 경로 중 하나는 필드 프로그래머블 게이트 어레이(FPGA)로 알려져 있습니다. 단일 기능을 염두에 두고 설계한 다음 이를 구현하기 위해 하드 와이어링하는 특수 목적 칩과 달리, FPGA는 더 유연합니다. PC 보드의 소켓에 꽂은 후 현장에서 프로그래밍할 수 있습니다. 각 FPGA에는 고정된 유한한 수의 단순 로직 게이트가 포함되어 있습니다. FPGA 프로그래밍은 원하는 논리 함수(AND, OR, XOR 등) 또는 스토리지 요소(플립플롭 및 시프트 레지스터)를 생성하기 위해 이들을 ‘간단히’ 연결하기만 하면 됩니다. 기본적으로 직렬(병렬 요소 몇 개 포함)이고 고정된 크기의 명령어와 데이터 경로(일반적으로 32비트 또는 64비트)를 가진 CPU와 달리 FPGA는 많은 연산을 병렬로 수행하도록 프로그래밍할 수 있으며, 연산 자체는 거의 모든 폭으로 구성할 수 있습니다.

출시 이후 AWS 고객들은 F1 인스턴스를 사용하여 다양한 유형의 애플리케이션과 서비스를 호스팅해 왔습니다. 최신 FPGA, 더 많은 처리 능력, 더 많은 메모리 대역폭을 갖춘 새로운 F2 인스턴스는 고도로 병렬화 가능한 컴퓨팅 집약적인 워크로드에 더욱 적합한 호스트입니다.

AMD Virtex UltraScale+ HBM VU47P FPGA에는 285만 개의 시스템 로직 셀과 9,024개의 DSP 슬라이스(INT8 값 처리 시 최대 28 TOPS의 DSP 컴퓨팅 성능)가 있습니다. 각 F2 인스턴스와 연결된 FPGA 액셀러레이터 카드는 FPGA당 16기가바이트의 고대역폭 메모리와 64기가바이트의 DDR4 메모리를 제공합니다.

F2 들여다 보기
F2 인스턴스는 3세대 AMD EPYC(밀란) 프로세서로 구동됩니다. F1 인스턴스에 비해 최대 3배 더 많은 프로세서 코어, 최대 2배 더 많은 시스템 메모리와 NVMe 스토리지, 최대 4배 더 넓은 네트워크 대역폭을 제공합니다. 각 FPGA에는 최대 460GiB/s 대역폭의 16GiB 고대역폭 메모리(HBM)가 제공됩니다. 다음은 인스턴스의 크기 및 사양입니다.

인스턴스 이름 vCPU
FPGA
FPGA 메모리
HBM/DDR4
인스턴스 메모리
NVMe 스토리지
EBS 대역폭
네트워크 대역폭
f2.12xlarge 48 2 32GiB /
128GiB
512GiB 1900GiB
(2x 950GiB)
15Gbps 25Gbps
f2.48xlarge 192 8 128GiB /
512GiB
2,048GiB 7600GiB
(8x 950GiB)
60Gbps 100Gbps

하이엔드 f2.48xlarge 인스턴스는 AWS 클라우드 디지털 인터페이스(CDI)를 지원하여 인스턴스 간 지연 시간을 8밀리초로 낮춰 애플리케이션 간에 비압축 라이브 비디오를 안정적으로 전송합니다.

FPGA 애플리케이션 구축
AWS EC2 FPGA 개발 키트에는 하드웨어 가속 FPGA 애플리케이션을 개발, 시뮬레이션, 디버그, 컴파일 및 실행하는 데 사용할 수 있는 도구가 포함되어 있습니다. 개발 및 시뮬레이션을 위해 메모리 최적화 또는 컴퓨팅 최적화 인스턴스에서 키트의 FPGA 개발자 AMI를 실행한 다음, 최종 디버깅 및 테스트를 위해 F2 인스턴스를 사용할 수 있습니다.

개발자 키트에 포함된 도구는 다양한 개발 패러다임, 도구, 액셀러레이터 언어, 디버깅 옵션을 지원합니다. 어떤 선택을 하든, 궁극적으로 사용자 정의 가속 로직이 포함된 Amazon FPGA Image(AFI)와 FPGA 메모리, PCIe 버스, 인터럽트 및 외부 주변 장치에 대한 액세스를 구현하는 AWS 쉘을 생성하게 됩니다. 원하는 만큼의 F2 인스턴스에 AFI를 배포하거나 다른 AWS 계정과 공유하거나 AWS Marketplace에 게시할 수 있습니다.

F1 인스턴스에서 실행되는 애플리케이션을 이미 생성한 경우, 최신 AMD 도구를 사용하도록 개발 환경을 업데이트한 다음 다시 빌드하고 유효성을 검사한 후 F2 인스턴스로 업그레이드해야 합니다.

FPGA 인스턴스의 실제 작동 사례
다음은 F1 및 F2 인스턴스가 독특하고 매우 까다로운 워크로드를 지원하는 방법에 대한 몇 가지 멋진 예시입니다:

유전체학 – 다국적 제약 및 생명공학 기업인 AstraZeneca는 수천 개의 F1 인스턴스를 사용하여 세계에서 가장 빠른 유전체학 파이프라인을 구축하여 2개월 이내에 40만 개 이상의 전체 게놈 샘플을 처리할 수 있었습니다. F2용 Illumina DRAGEN을 도입하여 더 낮은 비용으로 더 나은 성능을 실현하는 동시에 질병 발견, 진단 및 치료를 가속화할 것입니다.

위성 통신 – 위성 사업자들은 유연성이 떨어지고 비용이 많이 드는 물리적 인프라(변조기, 복조기, 컴바이너, 스플리터 등)에서 민첩한 소프트웨어 정의 FPGA 기반 솔루션으로 전환하고 있습니다. 이러한 솔루션은 FPGA의 디지털 신호 프로세서(DSP) 요소를 사용하여 새로운 파형을 지원하고 변화하는 요구 사항을 충족하도록 현장에서 재구성할 수 있습니다. 인스턴스당 최대 8개의 FPGA 지원, 넉넉한 네트워크 대역폭, 가상 이더넷을 사용하는 데이터 요금제 개발 키트(DPDK) 지원 등 F2의 주요 기능을 통해 여러 개의 복잡한 파형을 병렬로 처리하는 데 사용할 수 있습니다.

분석NeuroBlade의 SQL 처리 장치(SPU)는 Presto, Apache Spark 및 기타 오픈 소스 쿼리 엔진과 통합되어 F2 인스턴스에서 실행 시 더 빠른 쿼리 처리와 업계 최고의 쿼리 처리량 효율성을 제공합니다.

알아야 할 사항
다음은 F2 인스턴스에 대해 알아두셔야 할 몇 가지 사항을 마지막으로 알려드리겠습니다:

리전 – F2 인스턴스는 현재 미국 동부(버지니아 북부) 및 유럽(런던) AWS 리전에서 사용할 수 있으며, 향후 추가 리전으로 확장할 계획입니다.

운영 체제 – F2 인스턴스는 Linux 전용입니다.

구매 옵션 – F2 인스턴스는 온디맨드, 스팟절감형 플랜, 전용 인스턴스, 및 전용 호스트 형태로 제공됩니다.

Jeff;