Por que o Trainium?
O AWS Trainium é um chip de machine learning (ML) que a AWS criou sob medida para treinamento de aprendizado profundo (DL) de mais de 100 bilhões de modelos de parâmetros. Cada instância Trn1 do Amazon Elastic Compute Cloud (Amazon EC2) implanta até 16 aceleradores Trainium para oferecer uma solução de alta performance e baixo custo para treinamento de DL na nuvem. Embora o uso de DL e IA generativa esteja se acelerando, muitas equipes de desenvolvimento têm orçamentos fixos, limitando o escopo e a frequência do treinamento necessários para melhorar seus modelos e aplicações. As instâncias Trn1 do Amazon EC2 baseadas no Trainium resolvem esse desafio, oferecendo um tempo de treinamento mais rápido e, ao mesmo tempo, uma economia de custo de treinamento de até 50% em relação a instâncias do EC2 comparáveis. O Trainium foi otimizado para treinar processamento de linguagem natural, visão computacional e modelos de recomendação usados em um amplo conjunto de aplicações, como resumo de texto, geração de código, resposta a perguntas, geração de imagem e vídeo, recomendação e detecção de fraude.
O SDK do AWS Neuron ajuda os desenvolvedores a treinar modelos nos aceleradores Trainium (e implantá-los nos aceleradores AWS Inferentia). Ele se integra nativamente a frameworks populares, como o PyTorch e o TensorFlow, para que você possa continuar a treinar nos aceleradores Trainium e usar seu código e fluxos de trabalho existentes.