Publié le: Nov 2, 2020
Nous sommes heureux d'annoncer la disponibilité des instances P4d d’Amazon EC2, la prochaine génération d'instances basées sur GPU qui offrent les meilleures performances pour l'entraînement du machine learning (ML) et le calcul haute performance (HPC) dans le cloud pour des applications telles que le traitement du langage naturel, la détection et la classification d'objets, l'analyse sismique et la recherche génomique. Les instances P4d sont alimentées par les derniers GPU NVIDIA A100 Tensor Core et fournissent le premier réseau d'instances dans le cloud à 400 Gbps, avec la prise en charge d'Elastic Fabric Adapter (EFA) et de NVIDIA GPUDirect RDMA (accès direct à la mémoire à distance) pour permettre une montée en puissance efficace de l'entraînement du ML multi-nœuds et des charges de travail du HPC.
Les instances P4d offrent un coût d'entraînement jusqu'à 60 % inférieur et des performances de deep learning 2,5 fois supérieures avec 2,5 fois plus de mémoire, deux fois plus de performances en virgule flottante double précision, une bande passante réseau 16 fois plus large et un stockage SSD local 4x basé sur NVMe par rapport aux instances P3 de la génération précédente.
Les instances P4d sont déployées dans des clusters hyper-échelle, appelés UltraClusters d’EC2, fournissant plus de 4 000 GPU NVIDIA A100, une infrastructure réseau non bloquante à l'échelle Petabit et un stockage à haut débit et à faible latence avec FSx for Lustre. Ces UltraClusters d’EC2 sont parmi les meilleurs supercalculateurs au monde et ils démocratisent l'accès aux supercalculateurs pour les développeurs ordinaires, les scientifiques des données et les chercheurs, sans aucun coût de configuration ou de maintenance. Grâce à ces UltraClusters d’EC2, les développeurs peuvent adapter leur entraînement du ML multi-nœuds ou leurs applications HPC à des milliers de GPU pour résoudre leurs problèmes les plus complexes, ou bien se limiter à quelques instances et ne payer que celles qu'ils utilisent.
Les instances P4d d'Amazon EC2 sont basées sur AWS Nitro System, un ensemble d'innovations matérielles et logicielles conçues par AWS qui permettent la prestation de services cloud efficaces, flexibles et sécurisés grâce au partage isolé, à la mise en réseau privée et au stockage local rapide.
Les instances P4d sont désormais disponibles dans les régions AWS USA Est (Virginie du Nord), USA Ouest (Oregon). Elles sont disponibles dans la taille p4d.24xl et fournissent 96 vCPU, 8 GPU NVIDIA A100, 1,1 To de mémoire d'instance, 8 To de stockage SSD local basé sur NVMe, 400 Gbps de bande passante réseau avec EFA et GPUDirect RDMA et une bande passante en rafale EBS de 19 Gbps. Les instances P4d sont accessibles à la demande, via les Savings Plans, sous la forme d'instances réservées ou d'instances Spot.
Les services AWS populaires pour le ML et l'orchestration tels que Amazon SageMaker, Amazon Elastic Kubernetes Service (EKS), Amazon Elastic Container Service (ECS), AWS ParallelCluster et AWS Batch ajouteront la prise en charge des instances P4d dans les semaines à venir. Des clients allant des entreprises du Fortune 500 aux startups, dont Toyota Research Institute, GE Healthcare et Aon PathWise, ont participé au programme d'avant-première et adoptent les instances P4d pour réduire le temps et les coûts d'entraînement de leurs modèles de ML. Pour démarrer avec les instances P4d d'Amazon EC2, visitez l'AWS Management Console, l'interface de ligne de commande (CLI) AWS et les kits SDK AWS. Pour en savoir plus, visitez la page de présentation du produit ou la page de détails du produit.