Publicado: Dec 4, 2023
Agora, o Amazon SageMaker Canvas oferece suporte a recursos abrangentes de preparação de dados baseados no Amazon SageMaker Data Wrangler. Você já pode importar dados tabulares e de séries temporais, imagem e texto de mais de 50 fontes de dados; gerar relatórios de qualidade e insights de dados e transformar dados usando mais de 300 operadores integrados para criar e usar modelos de machine learning (ML), tudo isso sem escrever nenhum código. Com essa integração, você pode acelerar de semanas para minutos a preparação de dados para ML usando o SageMaker Canvas.
Agregar, analisar e transformar grandes quantidades de dados é essencial, mas geralmente essas atividades são a parte mais demorada do fluxo de trabalho de ML. Agora, o cliente pode analisar e visualizar dados com rapidez para identificar problemas de dados que possam afetar a qualidade do modelo usando o relatório de insights e qualidade de dados, limpar dados e criar recursos de ML usando mais de 300 transformações apoiadas pelo Spark. Os clientes já podem criar um fluxo visual de preparação de dados no SageMaker Canvas e importar dados do Amazon S3, Amazon Athena, Amazon Redshift, Salesforce Data Cloud, Snowflake e mais de 50 fontes de dados. Após a preparação dos dados, os clientes podem escalar as etapas dessa preparação para execução em trabalhos de processamento distribuídos do Spark, exportar o conjunto de dados para treinar modelos ou prever resultados com modelos de base e de machine learning prontos para uso. Como alternativa, eles podem exportar o fluxo de trabalho de dados como uma etapa em um pipeline do SageMaker para projetar recursos, treinar modelos ou transformar dados praticamente em tempo real para inferência no SageMaker Studio.
Os novos recursos de preparação de dados estão disponíveis em todas as regiões da AWS com suporte para o SageMaker Canvas. Para obter mais informações, consulte o blog e a documentação técnica da AWS.