Publié le: Oct 23, 2019
Des instances d'Amazon EC2 G4 offrant la plateforme GPU la plus rentable du marché pour le déploiement des modèles de machine learning en production et des applications gourmandes en ressources graphiques sont désormais disponibles dans les régions AWS suivantes : Canada (Centre), Europe (Paris), Asie-Pacifique (Mumbai), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney) et Govcloud (USA ouest). Ainsi, il existe aujourd'hui 15 régions disponibles.
Les instances G4 offrent les GPU NVIDIA T4 Tensor Core de nouvelle génération, des processeurs Intel® Xeon® Scalable (Cascade Lake) AWS personnalisés de deuxième génération, jusqu’à 50 Gbit/s de débit réseau et jusqu’à 900 Go de stockage NVMe local. L'instance bare-metal G4 à venir offre jusqu’à 100 Gbit/s de débit réseau et 1,8 To de stockage NVMe local.
Les instances G4 EC2 sont optimisées pour le déploiement d’applications de machine learning, à l’instar de la classification d’images, de la détection d’objets, des moteurs de recommandations, de la reconnaissance vocale automatique et de la traduction linguistique. Ces instances offrent également des solutions à des coûts avantageux pour les applications gourmandes en ressources graphiques, par exemple les stations de travail graphiques, le transcodage vidéo et le streaming de jeux vidéo à distance dans le cloud. Les instances G4 EC2 sont disponibles en différentes tailles et sont associées à un accès à un ou plusieurs GPU avec des quantités variables de vCPU et de mémoire pour vous permettre de choisir la taille d’instance appropriée pour vos applications.
Pour démarrer avec les instances Amazon EC2 G4, visitez l’AWS Management Console, l'interface de ligne de commande (CLI) AWS ou les kits SDK AWS. Pour en savoir plus sur les instances G4, consultez la page réservée aux instances G4.
Aujourd'hui, nous annonçons également la mise à disposition des instances Amazon EC2 F1 dans la région Asie-Pacifique (Sydney). Les clients peuvent utiliser des instances F1 avec des FPGA programmables pour développer des accélérations matérielles pour les applications telles que l'analyse Big Data, la génomique, la conception assistée par ordinateur électronique (CAO), le traitement d'images et de vidéos, la compression, la sécurité et la recherche/analyse.