Publicado en: Oct 17, 2023
Nos complace anunciar la disponibilidad general de las instancias ml.p4d en Asia-Pacífico (Tokio) y Europa (Fráncfort) para implementar modelos de machine learning (ML) para la inferencia asíncrona y en tiempo real en Amazon SageMaker.
Las instancias ml.p4d.24xlarge ofrecen un alto rendimiento para los modelos de deep learning. Con 40 GB de memoria por GPU Nvidia A100, las instancias P4d permiten inferencias de machine learning de alto rendimiento en modelos de gran tamaño e IA generativa en aplicaciones como el procesamiento del lenguaje natural, la detección de objetos y los motores de recomendaciones.
Los usuarios pueden empezar a implementar modelos para realizar inferencias en instancias ml.p4d en SageMaker en las regiones Asia-Pacífico (Tokio) y Europa (Fráncfort) en SageMaker de inmediato. Para obtener información sobre los precios de esta instancia, visite nuestra página de precios. Si quiere obtener más información sobre los modelos de implementación con SageMaker, consulte la descripción general aquí y la documentación aquí. Para obtener más información sobre las instancias p4d, consulte la página del producto P4.