Publicado: Jul 26, 2023
Hoje, a AWS anuncia a disponibilidade geral das instâncias P5 do Amazon Elastic Compute Cloud (Amazon EC2), equipadas com as mais recentes GPUs NVIDIA H100 Tensor Core. Essas instâncias oferecem a melhor performance no Amazon EC2 para aplicações de aprendizado profundo e computação de alta performance (HPC). Elas ajudam você a acelerar seu tempo de solução em até 6 vezes e reduzir o custo de treinar modelos de machine learning em até 40% em comparação com as instâncias baseadas em GPU da geração anterior.
Você pode usar as instâncias P5 do Amazon EC2 para treinar e implantar grandes modelos de linguagem (LLMs) e modelos de difusão cada vez mais complexos que potencializam as aplicações de IA generativa mais exigentes. Isso inclui respostas a perguntas, geração de código, geração de vídeo e imagem, reconhecimento de fala e muito mais. Você também pode usar as instâncias P5 para implantar aplicações de HPC exigentes em grande escala na descoberta farmacêutica, análise sísmica, previsão do tempo e modelagem financeira.
Para oferecer essas melhorias de performance e economia de custos, as instâncias P5 combinam GPUs NVIDIA H100 Tensor Core com performance de CPU 2x maior, 2x mais memória de sistema e 4x mais armazenamento local em comparação com as instâncias baseadas em GPU da geração anterior. Elas fornecem recursos de aumento da escala horizontalmente líderes de mercado para treinamento distribuído e workloads de HPC estreitamente acopladas com até 3.200 Gbps de rede usando a tecnologia Elastic Fabric Adapter (EFA) de segunda geração. Para atender às necessidades dos clientes de grande escala com baixa latência, as instâncias P5 são implantadas nos UltraClusters do Amazon EC2. Elas fornecem interconexão sem bloqueio em escala de petabits em até 20.000 GPUs H100, oferecendo até 20 exaflops de capacidade computacional agregada.
As instâncias P5 agora estão disponíveis nas regiões da AWS Leste dos EUA (N. da Virgínia) e Oeste dos EUA (Oregon) nos tamanhos p5.48xl.
Para saber mais sobre instâncias P5, consulte Instâncias P5 do Amazon EC2.