Publicado: Oct 17, 2023
Temos o prazer de anunciar a demonstração das instâncias ml.p4d, ml.trn1 e ml.g5 em novas regiões para inferência assíncrona e em tempo real de modelos de machine learning(ML) no Amazon SageMaker. Essas instâncias também estão disponíveis ao público em geral para inferência em outras regiões.
- As instâncias ml.p4d.24xlarge, já disponíveis para demonstração nas regiões AWS GovCloud (Oeste dos EUA), Europa (Irlanda), Ásia-Pacífico (Tóquio) e Ásia-Pacífico (Singapura), oferecem alta performance para modelos de aprendizado profundo. Com 40 GB de memória por GPU Nvidia A100, as instâncias P4d permitem inferência de machine learning de alta performance em casos de uso de grandes modelos e IA generativa.
- As instâncias ml.trn1, já disponíveis para demonstração na região Oeste dos EUA (Oregon), oferecem suporte a workloads de inferência de alta performance em mais de 100 bilhões de modelos de aprendizado profundo e IA generativa, abrangendo aplicações como resumo de texto, geração de código e resposta a perguntas.
- As instâncias ml.g5, já disponíveis para demonstração nas regiões Ásia-Pacífico (Seul) e América do Sul (São Paulo), são ideais para casos de uso como recomendações, chatbots, assistentes inteligentes e reconhecimento de imagem.
Para acessar essas demonstrações, basta solicitar aumentos de limite por meio do AWS Service Quotas. Para obter informações sobre os preços dessas instâncias, acesse a página de preços. Para obter mais informações sobre a implantação de modelos com o SageMaker, consulte a visão geral e a documentação. Para saber mais sobre as instâncias em demonstração, consulte a página de produto da G5, a página de produto da Trn1 e a página de produto da P4.