Publicado en: Dec 1, 2021
Amazon SageMaker ofrece ahora mejoras en la capacidad de seguimiento del linaje del machine learning (ML) que permite a los clientes rastrear y consultar el linaje de los artefactos, como los datos, las características y los modelos, en un flujo de trabajo de ML. Ahora, los clientes pueden recuperar el gráfico del linaje completo que abarca todo el flujo de trabajo, desde la preparación de los datos hasta la implantación del modelo, mediante una única consulta. Esta característica elimina el trabajo arduo e indiferenciado que se necesita para recuperar la información de los linajes paso a paso en el flujo de trabajo y unirlos todos manualmente. Los clientes también pueden recuperar información sobre el linaje de los segmentos del flujo de trabajo al definir un paso como punto focal y consultar el linaje de los pasos que se encuentran antes o después de ese punto focal. Por ejemplo, los clientes pueden definir un modelo como entidad focal y recuperar la ubicación del conjunto de datos sin procesar del que se extrajeron las características para formar ese modelo.
La nueva característica también permite el seguimiento de la información del linaje de los pasos del flujo de trabajo que abarcan varias cuentas de AWS. Crear múltiples cuentas para varias personas (científicos de datos, ingenieros de ML, etc.) para organizar todos los recursos de la organización es una práctica común de DevOps. Para habilitar esta característica, el cliente puede compartir recursos de linaje entre cuentas de AWS mediante AWS RAM. AWS RAM ayuda a reducir la sobrecarga operativa y proporciona visibilidad de los recursos compartidos. Una vez configurado, los clientes pueden utilizar la API de consulta de linaje para rastrear las relaciones entre varios artefactos que se extienden a través de múltiples cuentas de AWS..
La información sobre el linaje de ML se puede utilizar para mejorar la gobernanza del modelo, reproducir versiones anteriores de los artefactos o solucionar los problemas de los flujos de trabajo de forma más eficiente. Para comenzar, forme un nuevo modelo de ML mediante SageMaker Studio o SDK y utilice las API de consulta de linaje para rastrear la información de linaje. Para obtener más información, visite nuestra página de documentación sobre el seguimiento del linaje basado en gráficos entre cuentas y la API de consulta del linaje.