Publicado: Sep 30, 2022
O Amazon SageMaker Data Wrangler reduz de semanas para minutos o tempo de agregação e preparação de dados para machine learning (ML). O Amazon SageMaker Autopilot cria, treina e ajusta automaticamente os melhores modelos de machine learning para classificação ou regressão com base em seus dados, permitindo a você manter controle e visibilidade totais. O Data Wrangler ativa uma experiência unificada de preparação de dados e treinamento de modelos com o Amazon SageMaker Autopilot e apenas alguns cliques. Agora, essa integração foi aprimorada para incluir e reutilizar transformações de recursos do Data Wrangler, como imputadores de valores não encontrados, codificadores ordinais/one-hot e modelos do Autopilot para inferência de ML. Quando você prepara dados no Data Wrangler e treina um modelo invocando o Autopilot, já pode implantar o modelo treinado com todas as transformações de recursos do Data Wrangler como um pipeline de inferência serial do SageMaker. Dessa forma, você ativa o pré-processamento automático de dados brutos com a reutilização das transformações de recursos do Data Wrangler no momento da inferência. Atualmente, esse recurso só pode ser usado em fluxos do Data Wrangler que não usam transformações de associação, agrupamento, concatenação e séries temporais.
Antes deste lançamento, para usar modelos do Autopilot treinados com dados do Data Wrangler, os dados apresentados para inferência precisavam ser pré-processados pelo SageMaker Data Wrangler. Esse pré-processamento era necessário antes de apresentar os dados para inferências nos modos em tempo real e em lotes. A partir de hoje, após preparar os dados no Data Wrangler e treinar um modelo no SageMaker Autopilot, você pode fazer previsões em lotes que incluem transformações do Data Wrangler ou implantar o modelo treinado com as transformações do Data Wrangler atrás de um endpoint do SageMaker. Essa inclusão automática das transformações do Data Wrangler permite eliminar a necessidade de pré-processamento manual de dados em inferências em tempo real e em lotes.
Essa nova experiência já está disponível em todas as regiões em que o SageMaker Data Wrangler e o SageMaker Autopilot são oferecidos. Para começar a usar, consulte Treine modelos automaticamente em seu fluxo de dados ou a publicação do blog.