Passer au contenu principal

Catalogue Amazon SageMaker

Catalogue Amazon SageMaker

Découvrez, gérez et collaborez sur les données et l’IA en toute sécurité

Présentation

Amazon SageMaker Catalog simplifie la découverte, la gouvernance et la collaboration en matière de données et d’IA pour vos données structurées et non structurées, vos modèles d’IA, vos tableaux de bord d’informatique décisionnelle et vos applications. Vous pouvez découvrir des données et des modèles approuvés et y accéder en toute sécurité à l’aide de la recherche sémantique avec des métadonnées créées par l’IA générative, ou simplement demander en langage naturel à Amazon Q Developer de rechercher vos données. De manière centralisée dans Amazon SageMaker Unified Studio, les utilisateurs peuvent définir et appliquer des politiques d’accès de manière cohérente à l’aide d’un modèle d’autorisation unique et des contrôles d’accès précis. Partagez des données et des ressources d’IA et collaborez en toute simplicité grâce à des flux de publication et d’abonnement simplifiés. Renforcez la confiance au sein de votre organisation grâce à la surveillance de la qualité des données, à la classification des données et à la traçabilité automatisée de bout en bout au niveau des colonnes pour les données et les ressources d’IA.

Avantages

Découvrez vos données et ressources d’IA à grande échelle grâce au Catalogue SageMaker, basé sur Amazon Datazone. Améliorez la découverte des données grâce à l’IA générative pour enrichir automatiquement vos données et vos métadonnées en fonction du contexte commercial, permettant ainsi à tous les utilisateurs de trouver, de comprendre et d’utiliser facilement les données. Partagez vos données, vos modèles d’IA, vos invites et vos ressources d’IA générative en filtrant par noms de tables et de colonnes ou par termes du glossaire métier. Recommandez automatiquement des colonnes applicables et des applications analytiques pertinentes pour chaque jeu de données, afin de pouvoir utiliser les bonnes données pour créer rapidement les bons modèles. Soutenez les modèles de gouvernance centralisés et décentralisés grâce à un partage transparent des données et de l’IA sur la base de flux de travail de publication et d’abonnement au sein d’une expérience unique en cliquant sur « Projects ».

Gagnez en confiance grâce à une visibilité en temps réel de la qualité des données et au lignage des données et du ML dans SageMaker. Automatisez le profilage des données et les recommandations relatives à la qualité des données, surveillez les règles de qualité des données et recevez des alertes. Résolvez les défis complexes en matière de qualité des données en utilisant des approches basées d’une part sur des règles et d’autre part sur le ML pour réconcilier les entités afin de fournir des données de haute qualité qui permettront de prendre des décisions métier en toute confiance. Améliorez la transparence des pipelines de données et des projets d’IA grâce à la surveillance intégrée des modèles pour détecter les biais ou rendre compte de la manière dont les fonctionnalités contribuent à la prédiction modélisée.

Centralisez la sécurité des données et de l’IA dans SageMaker grâce à des contrôles d’accès ultra-précis, à une classification des données et à des barrières de protection pour garantir une utilisation appropriée des données, de l’analytique et des modèles d’IA. Définissez les autorisations une seule fois et appliquez-les à l’ensemble des données et des modèles. Grâce à l’intégration native d’Amazon Bedrock, les clients peuvent utiliser les barrières de protection Amazon Bedrock dans leur application d’IA générative en bloquant le contenu préjudiciable, en filtrant les hallucinations et en activant des mesures de protection personnalisables en matière de confidentialité, de sécurité et de précision. Identifiez automatiquement les informations sensibles dans vos pipelines à l’aide d’Amazon Comprehend.

Respectez les normes d’audit et de conformité réglementaire en matière d’utilisation des données, de consignation et de surveillance des modèles. Favorisez une utilisation acceptable de vos actifs analytiques et d’IA au sein de toute votre entreprise grâce à une isolation basée sur les projets. Comprenez l’utilisation des données et modélisez l’utilisation de votre lac de données pour une sécurité renforcée. Utilisez Amazon SageMaker Clarify pour contrôler les biais, la précision et la robustesse des modèles, conformément à vos normes d’IA responsable. Alignez les coûts sur les initiatives commerciales et obtenez une vision claire de vos investissements commerciaux.

Fonctionnalités

Catalogue de données et d’IA

Découverte, gouvernance et collaboration sur vos données structurées et non structurées, vos modèles d’IA, vos tableaux de bord d’informatique décisionnelle et vos applications, le tout dans un catalogue unique. 

Missing alt text value

Glossaire métier

Standardisez la terminologie avec des définitions métier partagées et des formulaires de métadonnées personnalisables. Prenez en charge des termes de classification restreints pour appliquer un étiquetage cohérent des données sensibles et permettre des flux de gouvernance en aval.

Missing alt text value

Traçabilité des données

Suivez comment les données se déplacent et évoluent à travers les systèmes. La traçabilité compatible OpenLineage aide les utilisateurs à comprendre les origines, les transformations et les schémas de consommation afin d’améliorer la confiance, le débogage et la gouvernance.

Missing alt text value

Surveillance de la qualité des données

Consultez les métriques de qualité des données provenant d’AWS et d’outils tiers. Les utilisateurs renforcent leur confiance et disposent de plus de contexte lors de leurs recherches, tandis que les équipes de données peuvent intégrer les signaux de qualité externes via des API dans un portail unifié.

Missing alt text value

Découverte des données

Enrichissez les métadonnées techniques avec le contexte métier afin que les utilisateurs puissent rapidement trouver, comprendre et faire confiance aux données qu’ils utilisent.

Missing alt text value

Recommandations de métadonnées automatisées

Utilisez l’automatisation basée sur grand modèle de langage (LLM) pour générer des noms et des descriptions compréhensibles par les utilisateurs, améliorant le contexte, la cohérence et la clarté des actifs techniques.

Missing alt text value

Recherche sémantique

Trouvez des données et des modèles à l’aide de requêtes en langage naturel. La recherche sémantique prend en compte l’intention, le contexte et les relations entre les éléments, et pas seulement les mots-clés, afin de fournir des résultats plus pertinents.

Missing alt text value

Tableaux de bord d’informatique décisionnelle

Transformez vos données en informations analytiques en combinant les données dans SageMaker avec les fonctionnalités Amazon Quick Suite, telles que les tableaux de bord interactifs, les rapports ultraprécis et l’intelligence informatique générative, le tout de manière gouvernée et automatisée. 

Missing alt text value

Produits de données

Regroupez les actifs connexes en produits de données centrés sur le métier, avec des métadonnées partagées. Facilitez la découverte, unifiez les demandes d’accès et réduisez la charge administrative, tout en permettant aux équipes de gouvernance de suivre la consommation au niveau des produits.

Missing alt text value

Clients

Natera, Inc.

« En intégrant Amazon QuickSight à Amazon SageMaker, nos équipes opérationnelles en laboratoire et nos scientifiques peuvent désormais surveiller en temps réel les performances des tests cliniques sur tous les sites. Nous avons développé des tableaux de bord unifiés qui regroupent le débit, les métriques de contrôle qualité et les délais d’exécution, permettant une analyse détaillée des tendances et une optimisation continue des performances. Les scientifiques peuvent désormais effectuer une analyse complète des données, de l’examen exploratoire au développement de modèles, le tout dans un environnement intégré unique. »

Mirko Buholzer, vice-président de l’ingénierie logicielle chez Natera, Inc.

Comment Natera met à l’échelle la génomique à l’aide du Catalogue Amazon SageMaker

Cisco

« Il est important d’avoir accès à vos données, de les partager et de les gérer. Que vous l’appeliez maillage de données ou tissu de données, les données existent au sein de différentes équipes dans de multiples silos, et vous avez besoin d’un moyen de les rassembler. Le catalogue Amazon SageMaker met en relation les producteurs et les consommateurs de données, permettant aux producteurs de partager des données grâce à des contrôles et des contrats de données intégrés, tout en offrant aux consommateurs la possibilité d’accéder aux données à l’aide des outils de leur choix »

Shaja Arul Selvamani, directeur principal de l’IA/ML, Cisco

The Cisco logo featuring the company's name in blue with a stylized bridge design above it.

NatWest

« Notre équipe d’ingénierie des plateformes de données a déployé de nombreux outils destinés aux utilisateurs finaux pour les tâches d’ingénierie des données, de ML, de SQL et d’IA générative. Dans le but de simplifier les processus au sein de la banque, nous avons cherché à rationaliser l’authentification des utilisateurs et l’autorisation d’accès aux données. Amazon SageMaker propose une expérience utilisateur prête à l’emploi pour nous aider à déployer un environnement unique au sein de l’entreprise, réduisant ainsi d’environ 50 % le temps nécessaire à nos utilisateurs de données pour accéder aux nouveaux outils. »

Zachery Anderson, CDAO, NatWest Group

Missing alt text value

Avez-vous trouvé les informations que vous recherchiez ?

Faites-nous part de vos commentaires afin que nous puissions améliorer le contenu de nos pages