- 分析›
- Amazon SageMaker›
- Amazon SageMaker Catalog
Amazon SageMaker Catalog
データと AI を安全に発見、管理、共同作業
概要
Amazon SageMaker Catalog は、構造化データと非構造化データ、AI モデル、ビジネスインテリジェンスダッシュボード、アプリケーションにわたるデータと AI の発見、ガバナンス、コラボレーションを簡素化します。生成 AI 作成のメタデータを用いたセマンティック検索を使用して承認されたデータやモデルをセキュアに検出してアクセスすることができます。データを検索するよう Amazon Q Developer に自然言語で指示することも可能です。ユーザーは、Amazon SageMaker Unified Studio できめ細かなアクセスコントロールを備えた単一の許可モデルを一元的に使用して、アクセスポリシーを一貫した方法で定義および適用できます。簡単なパブリッシュとサブスクライブのワークフローを通じて、データと AI アセットをシームレスに共有し、コラボレーションできます。データ品質モニタリング、データ分類、データと AI アセットの列レベルでのエンドツーエンドの自動リネージュにより、組織全体の信頼を構築できます。
メリット
Amazon Datazone 上に構築された SageMaker Catalog を使用して、データと AI アセットを大規模に検出しましょう。生成 AI でデータ検出を強化してデータとメタデータをビジネスコンテキストで自動的に充実させ、すべてのユーザーがデータを簡単に検索、理解、使用できるようにします。テーブルや列の名前、またはビジネス用語集の用語でのフィルタリングを使用して、データ、AI モデル、プロンプト、生成 AI アセットを共有します。各データセットにとって有益な列と関連する分析アプリケーションを自動的に推奨することで、適切なデータを使用して適切なモデルを迅速に構築できるようにします。プロジェクトを通じてワークフローの公開とサブスクリプションを 1 つのエクスペリエンスで行うことで、シームレスなデータと AI の共有により一元管理型と分散管理型の両方のモデルをサポートします。
特徴
データと AI カタログ
構造化データ、非構造化データ、AI モデル、BI ダッシュボード、アプリケーションを 1 つのカタログから検出、管理、共同作業できます。
ビジネス用語集
共有のビジネス定義とカスタマイズ可能なメタデータフォームで用語集を標準化します。制限付きの分類条件をサポートして、機密データに一貫したタグ付けを適用し、ダウンストリームのガバナンスワークフローを可能にします。
データリネージュ
システム間でデータがどのように移動し、どのように変化するかを追跡します。OpenLineage 互換のリネージュは、ユーザーが起源、変容、消費パターンを理解するのに役立ち、信頼、デバッグ、ガバナンスを改善します。
データ品質モニタリング
AWS およびサードパーティーツールからのデータ品質メトリクスを表示します。消費者は検索時に信頼とコンテキストを得ることができ、データチームは API を通じて外部の品質シグナルを統合ポータルに統合できます。
データ検出
技術的なメタデータをビジネスコンテキストで充実させることで、ユーザーは使用するデータをすばやく見つけ、理解し、信頼できるようになります。
メタデータの自動推奨
LLM を活用したオートメーションにより、ビジネスに適した名前と説明文を生成し、技術資産のコンテキスト、一貫性、明確さを向上させます。
セマンティック検索
自然言語クエリを使用してデータとモデルを検索します。セマンティック検索は、キーワードだけでなく、ユーザーの意図、コンテキスト、関係を理解して、より関連性の高い結果を返します。
BI ダッシュボード
すべて統制された自動化された方法で、SageMaker のデータを、インタラクティブダッシュボード、ピクセルパーフェクトレポート、生成ビジネスインテリジェンス (BI) などの Amazon Quick Suite の機能とまとめることで、データからインサイトが得られます。
データ製品
関連するアセットを、共有メタデータを使用してビジネスに焦点を当てたデータ製品にパッケージ化します。ガバナンスチームが製品レベルの消費量を追跡できるようにすると同時に、発見の改善、アクセスリクエストの統一、管理費の削減が可能になります。
お客様
Natera, Inc
「Amazon QuickSight と Amazon SageMaker を統合することで、ラボ運営チームと科学者が全サイトの臨床検査パフォーマンスをリアルタイムで監視できるようになりました。当社では、スループット、品質管理メトリクス、所要時間を 1 か所にまとめる統合ダッシュボードを開発しました。これは、詳しい傾向分析と継続的なパフォーマンス最適化を可能にします。科学者は、今では探索的レビューからモデル開発に及ぶ包括的なデータ分析のすべてを単一の統合環境内で実行できます」
Natera, Inc.、VP of Software Engineering、Mirko Buholzer 氏
Cisco
「データを発見、共有、管理したいとお思いでしょうか。データメッシュと呼ぶかデータファブリックと呼ぶかにかかわらず、データはさまざまなチームにまたがって複数のサイロに分散して存在し、データをまとめる方法が必要となります。Amazon SageMaker Catalog はデータプロデューサーとコンシューマーをつなぐので、プロデューサーは組み込みのコントロールやデータコントラクトでデータを共有できると同時に、コンシューマーは好きなツールを使用してデータにアクセスできるようになります」
Cisco、Sr. Director AI/ML、Shaja Arul Selvamani 氏
NatWest
「当社の Data Platform Engineering チームは、データエンジニアリング、機械学習、SQL、生成 AI のタスク用に複数のエンドユーザーツールをデプロイしてきました。銀行全体のプロセスを簡素化するために、ユーザー認証とデータアクセス承認の合理化を検討してきました。Amazon SageMaker は既製のユーザーエクスペリエンスを提供してくれるので、組織全体に 1 つの環境をデプロイでき、データユーザーが新しいツールにアクセスするのに必要な時間を約 50% 短縮できます」
NatWest Group、CDAO、Zachery Anderson 氏
Amazon SageMaker Catalog の使用を開始する
今日お探しの情報は見つかりましたか?
ぜひご意見をお寄せください。ページのコンテンツ品質の向上のために役立てさせていただきます