Veröffentlicht am: Jul 26, 2023
Heute kündigt AWS die allgemeine Verfügbarkeit von Amazon Elastic Compute Cloud (Amazon EC2) P5-Instances an, die von den neuesten NVIDIA H100 Tensor Core-GPUs unterstützt werden. Diese Instances bieten die höchste Leistung in Amazon EC2 für Deep Learning- und High Performance Computing (HPC)-Anwendungen. Sie helfen Ihnen dabei, Ihre Zeit bis zur Lösung um das bis zu 6-fache zu verkürzen und die Kosten für das Training von ML-Modellen im Vergleich zu GPU-basierten Instances der vorherigen Generation um bis zu 40% zu senken.
Sie können Amazon EC2 P5-Instances für das Training und die Bereitstellung immer komplexerer großer Sprachmodelle (LLMs) und Diffusionsmodelle verwenden, die die anspruchsvollsten generativen KI-Anwendungen unterstützen. Dazu gehören die Beantwortung von Fragen, Codegenerierung, Video- und Bildgenerierung, Spracherkennung und mehr. Sie können P5-Instances auch verwenden, um anspruchsvolle HPC-Anwendungen in großem Maßstab für die pharmazeutische Forschung, seismische Analyse, Wettervorhersage und Finanzmodellierung bereitzustellen.
Um diese Leistungsverbesserungen und Kosteneinsparungen zu erzielen, kombinieren P5-Instances NVIDIA H100 Tensor Core-GPUs mit zweimal höherer CPU-Leistung, zweimal höherem Systemspeicher und viermal höherem lokalen Speicher im Vergleich zu GPU-basierten Instances der vorherigen Generation. Sie bieten marktführende Scale-Out-Fähigkeiten für verteiltes Training und eng gekoppelte HPC-Workloads mit bis zu 3.200 Gbit/s an Netzwerken mithilfe der Elastic Fabric Adapter (EFA)-Technologie der zweiten Generation. Um den Kundenanforderungen nach großem Umfang bei niedriger Latenz gerecht zu werden, werden P5-Instances in Amazon EC2 UltraClustern bereitgestellt. Diese bieten blockierungsfreie Verbindungen im Petabit-Maßstab über bis zu 20.000 H100-GPUs und bieten eine aggregierte Rechenleistung von bis zu 20 Exaflops.
P5-Instances sind jetzt in den AWS-Regionen USA Ost (Nord-Virginia) und USA West (Oregon) in den Größen p5.48xl verfügbar.
Weitere Informationen zu P5-Instances finden Sie unter Amazon EC2 P5-Instances.