Publicado en: Nov 2, 2020
Nos complace anunciar la disponibilidad de las instancias P4d de Amazon EC2, la nueva generación de instancias basadas en GPU que brindan el mejor rendimiento para entrenamiento con aprendizaje automático (ML) e informática de alto rendimiento (HPC) en la nube, para aplicaciones como procesamiento de lenguaje natural, clasificación y detección de objetos, análisis sísmico e investigación genómica. Las instancias P4d cuentan con la potencia de las nuevas GPU NVIDIA A100 Tensor Core y ofrecen una red de instancias de 400 Gbps que prioriza la nube y con compatibilidad para Elastic Fabric Adapter (EFA) y GPUDirect RDMA (acceso remoto directo a memoria) de NVIDIA para habilitar el escalado eficaz de cargas de trabajo de HPC y entrenamiento de aprendizaje automático de varios nodos.
Las instancias P4d entregan un costo hasta un 60 % menor para entrenar y un rendimiento de aprendizaje profundo 2,5 veces superior con 2,5 veces la memoria, el doble de rendimiento de punto flotante de precisión doble, 16 veces el ancho de banda y cuatro veces el almacenamiento SSD basado en NVMe local en comparación con las instancias P3 de la generación anterior.
Las instancias P4d están implementadas en clústeres a hiperescala, llamados UltraClusters de EC2, y ofrecen más de 4000 GPU NVIDIA A100, una infraestructura de red sin bloqueo a escala de petabits y almacenamiento de baja latencia y alto rendimiento con FSx for Lustre. Los UltraClusters de EC2 son uno de los principales superordenadores del mundo, y democratizan el acceso a la supercomputación para todo tipo de desarrolladores, científicos de datos e investigadores sin ningún costo de mantenimiento o configuración. Gracias a estos UltraClusters de EC2, los desarrolladores pueden escalar sus aplicaciones de HPC o entrenamiento de aprendizaje automático de varios nodos a miles de GPU, de modo que pueden solucionar sus problemas más complejos, o reducir la escala a unas pocas instancias, y así pagar solo por las instancias que utilizan.
Las instancias P4d de Amazon EC2 están diseñadas a partir del sistema Nitro de AWS, un conjunto de innovaciones de software y hardware diseñado por AWS que permite ofrecer servicios en la nube eficientes, flexibles y seguros, con multitenencia aislada, redes privadas y almacenamiento local de gran velocidad.
Las instancias P4d ya están disponibles en las regiones de AWS EE. UU. Este (Norte de Virginia) y EE. UU. Oeste (Oregón). Las instancias P4d están disponibles en el tamaño p4d.24xl, con 96 vCPU, 8 GPU NVIDIA A100, 1,1 TB de memoria de instancia, 8 TB de almacenamiento SSD basado en NVMe local, 400 Gbps de ancho de banda con EFA y GPUDirect RDMA y 19 Gbps de ancho de EBS con ráfagas. Estas instancias pueden adquirirse bajo demanda, como parte de Savings Plans, como instancias reservadas o como instancias de spot.
Servicios populares de AWS para aprendizaje automático y organización, como Amazon SageMaker, Amazon Elastic Kubernetes Service (EKS), Amazon Elastic Container Service (ECS), AWS ParallelCluster y AWS Batch, agregarán compatibilidad con instancias P4d en las próximas semanas. Desde empresas Fortune 500 a startups, incluidos Toyota Research Institute, GE Healthcare y Aon PathWise, participaron en el programa de vista previa y están comenzando a utilizar instancias P4d para reducir el tiempo y los costos del entrenamiento de sus modelos de aprendizaje automático. Para comenzar a usar las instancias P4d de Amazon EC2, vaya a la consola de administración de AWS, a la interfaz de línea de comandos (CLI) de AWS o a los SDK de AWS. Para obtener más información, visite la página de información general sobre el producto o la página de detalles del producto.