Amazon Web Services ブログ

Amazon Bedrock の新しい機能により、データ処理と取得が強化されます

12 月 4 日、Amazon Bedrock は、生成 AI によるデータ分析の方法を効率化する 4 つの拡張機能を導入しました。

Amazon Bedrock データオートメーション (プレビュー) – Amazon Bedrock のフルマネージド機能で、ドキュメント、画像、オーディオ、ビデオなどの非構造化されたマルチモーダルコンテンツから貴重な洞察を効率的に生成できます。Amazon Bedrock を使用すると、自動化されたインテリジェントドキュメント処理 (IDP)、メディア分析、および検索拡張生成 (RAG) ワークフローを迅速かつ費用対効果の高い方法で構築できます。インサイトには、重要な瞬間のビデオ要約、不適切な画像コンテンツの検出、複雑な文書の自動分析などが含まれます。アウトプットをカスタマイズして、特定のビジネスニーズに合わせてインサイトを調整できます。Amazon Bedrock データオートメーションは、スタンドアロン機能として使用することも、RAG ワークフローのナレッジベースを設定する際のパーサーとしても使用できます。

Amazon Bedrock ナレッジベースはマルチモーダルデータを処理するようになりました –ドキュメントや画像内のテキスト要素とビジュアル要素の両方を処理するアプリケーションの構築に役立つように、Amazon Bedrock データオートメーションを使用してドキュメントを解析するか、パーサーとして基盤モデル (FM) を使用するようにナレッジベースを設定できます。マルチモーダルデータ処理により、画像とテキストの両方に埋め込まれた情報を含むナレッジベースから得られる回答の正確性と関連性を高めることができます。

Amazon Bedrock ナレッジベースで GraphRAG がサポートされるようになりました (プレビュー) – 現在、初めてフルマネージド型の GraphRAG 機能が提供されるようになりました。GraphRAG は、RAG 技術とグラフを組み合わせて使用することで、エンドユーザーにより正確で包括的な応答を提供することにより、生成 AI アプリケーションを強化します。

Amazon Bedrock Knowledge Base が構造化データ取得をサポートするようになりました – この機能により、ナレッジベースがデータウェアハウスとデータレイクの自然言語クエリをサポートするようになりました。これにより、アプリケーションは会話型インターフェイスを通じてビジネスインテリジェンス (BI) にアクセスし、重要なエンタープライズデータを含めることで応答の精度を向上させることができます。Amazon Bedrock ナレッジベースは、構造化データが存在する場所からネイティブにクエリを実行できる、完全マネージド型のすぐに使用できる、業界初の完全管理型の RAG ソリューションの 1 つです。この機能は、データソース間のデータサイロを解消し、生成 AI アプリケーションの構築を 1 か月以上かかっていたものから数日間に短縮するのに役立ちます。

これらの新機能により、構造化データソースと非構造化データソースから情報を処理、理解、取得できる包括的な AI アプリケーションを簡単に構築できます。たとえば、自動車保険会社は Amazon Bedrock データオートメーションを使用して請求裁定ワークフローを自動化することで、自動車保険請求の処理にかかる時間を短縮し、請求部門の生産性を向上させることができます。

同様に、メディア企業はテレビ番組を分析し、シーンの概要、業界標準の広告分類法(IAB)、企業ロゴなど、スマートな広告掲載に必要なインサイトを引き出すことができます。メディア制作会社は、シーンごとの概要を作成し、重要な瞬間をビデオアセットに取り込むことができます。金融サービス会社は、チャートや表を含む複雑な財務文書を処理し、GraphRAG を使用してさまざまな金融機関間の関係を理解することができます。これらの企業はすべて、構造化データ検索を使用してデータウェアハウスにクエリを実行すると同時に、ナレッジベースから情報を取得できます。

これらの機能をもっと細かく見ていきましょう。

Amazon Bedrock データオートメーションのご紹介
Amazon Bedrock データオートメーションは、ドキュメント、画像、ビデオ、オーディオファイルなどのマルチモーダルで構造化されていないコンテンツから貴重な洞察を抽出するプロセスを簡素化する Amazon Bedrock の機能です。

Amazon Bedrock データオートメーションは、開発者が単一のインターフェイスでマルチモーダルコンテンツを処理するために使用できる統一された API 主導型のエクスペリエンスを提供するため、複数の AI モデルやサービスを管理および調整する必要がなくなります。Amazon Bedrock データオートメーションでは、視覚的な根拠や信頼性スコアなどの保護機能が組み込まれているため、抽出されたインサイトの正確性と信頼性が高まり、エンタープライズワークフローへの統合が容易になります。

Amazon Bedrock データオートメーションは 4 つのモダリティ (ドキュメント、画像、ビデオ、オーディオ) をサポートしています。アプリケーションで使用すると、すべてのモダリティが同じ非同期推論 API を使用し、結果が Amazon Simple Storage Service (Amazon S3) バケットに書き込まれます。

各モダリティについて、処理のニーズに基づいて出力を構成し、次の 2 種類の出力を生成できます。

標準出力 – 標準出力では、入力データ型に関連する定義済みのデフォルトのインサイトが得られます。例としては、文書の意味表現、シーンごとのビデオの要約、オーディオトランスクリプトなどがあります。抽出したいインサイトは、わずか数ステップで設定できます。

カスタム出力 – カスタム出力では、「ブループリント」と呼ばれるアーティファクトを使用して抽出ニーズを柔軟に定義および指定し、ビジネスニーズに合わせたインサイトを生成できます。生成された出力を、データベースやその他のアプリケーションなどのダウンストリームシステムと互換性のある特定の形式またはスキーマに変換することもできます。

標準出力は、すべての形式 (オーディオ、ドキュメント、画像、ビデオ) で使用できます。プレビュー中は、カスタム出力はドキュメントと画像でのみ使用できます。

標準出力設定とカスタム出力設定の両方をプロジェクトに保存して、Amazon Bedrock データオートメーション推論 API で参照できます。プロジェクトは、処理されたファイルごとに標準出力とカスタム出力の両方を生成するように構成できます。

標準出力とカスタム出力の両方で文書を処理する例を見てみましょう。

Amazon Bedrock データオートメーションを使用する
Amazon Bedrock コンソールのナビゲーションペインで [データオートメーション] を選択します。ここでは、いくつかのサンプルユースケースでこの機能がどのように機能するかを確認できます。

コンソールのスクリーンショット。

次に、ナビゲーションペインの [データオートメーション] セクションで [デモ] を選択します。この機能を試すには、提供されているサンプル文書のいずれかを使用するか、自分で作成した文書をアップロードします。たとえば、出生証明書を処理する必要があるアプリケーションを作成しているとしましょう。

まず、出生証明書をアップロードして標準出力結果を確認します。初めてドキュメントをアップロードするときに、アセットを保存する S3 バケットを作成するかどうかを確認するメッセージが表示されます。標準出力を見ると、いくつかの簡単な設定で結果を調整できます。

コンソールのスクリーンショット。

[カスタム出力] タブを選択します。文書はサンプルブループリントの 1 つで認識され、情報が複数のフィールドから抽出されます。

コンソールのスクリーンショット。

アプリケーションのほとんどのデータはそこにありますが、いくつかのカスタマイズが必要です。たとえば、出生証明書が発行された日付(2022 年 6 月 10 日)は、文書内の他の日付とは異なる形式になっています。また、証明書を発行した州と、子供の姓が母親または父親の姓と一致するかどうかを示すいくつかの旗も必要です。

前のブループリントのほとんどのフィールドは、Explicit 抽出タイプを使用しています。つまり、ドキュメントからそのまま抽出されます。

特定の形式の日付が必要な場合は、Inferred 抽出タイプを使用して新しいフィールドを作成し、文書の内容から始めて結果をフォーマットする方法についての説明を追加できます。推定抽出を使用して、日付形式や社会保障番号 (SSN) 形式などの変換を実行したり、たとえば今日の日付に基づいて個人が 21 歳以上かどうかを確認する検証を実行したりできます。

サンプルブループリントは編集できません。[ブループリントの複製] を選択して編集可能な新しいブループリントを作成し、[フィールド] ドロップダウンから [フィールドを追加] を選択します。

抽出タイプが Inferred の 4 つのフィールドと、次の手順を追加します。

  1. 出生証明書が MM/DD/YYYY 形式で発行された日付
  2. 出生証明書を発行した州
  3. ChildLastName は FatherLastName と等しいか
  4. ChildLastName は MotherLastName と等しいか

最初の 2 つのフィールドは文字列で、最後の 2 つのフィールドはブール値です。

コンソールのスクリーンショット。

新しいフィールドを作成したら、以前にアップロードしたドキュメントに新しいブループリントを適用できます。

[結果を取得] を選択し、結果の新しいフィールドを探します。必要に応じてフォーマットされた日付、2つのフラグ、および州が表示されます。

コンソールのスクリーンショット。

アプリケーションのニーズに合わせたこのカスタムブループリントを作成したので、プロジェクトに追加できます。パスポートのブループリント、出生証明書のブループリント、請求書のブループリントなど、処理したいさまざまなドキュメントタイプのプロジェクトに、複数のブループリントを関連付けることができます。ドキュメントを処理する際、Amazon Bedrock データオートメーションは各ドキュメントをプロジェクト内の設計図と照合して、関連情報を抽出します。

新しいブループリントを最初から作成することもできます。その場合は、まずプロンプトが表示され、アップロードされたドキュメントで見つかると思われるフィールドを宣言し、正規化または検証を実行できます。

Amazon Bedrock データオートメーションは、オーディオファイルとビデオファイルも処理できます。たとえば、AWS の AI およびデータ担当副社長 Swami Sivasubramanian による基調講演のビデオをアップロードしたときの標準出力は次のとおりです。

コンソールのスクリーンショット。

出力を取得するには数分かかります。結果には、ビデオ全体の要約、シーンごとの要約、およびビデオ中に表示されるテキストが含まれます。ここから、オプションを切り替えて、完全なオーディオトランスクリプト、コンテンツモデレーション、またはインタラクティブ広告局(IAB)の分類基準を設定できます。

また、Amazon Bedrock データオートメーションをパーサーとしてナレッジベースを作成して、視覚的に豊かなドキュメントや画像から洞察を抽出し、検索や応答を生成することもできます。次のセクションでそれを見てみましょう。

Amazon Bedrock ナレッジベースでのマルチモーダルデータ処理の使用
マルチモーダルデータ処理サポートにより、アプリケーションは文書内のテキスト要素とビジュアル要素の両方を理解できます。

マルチモーダルデータ処理では、アプリケーションがナレッジベースを使用して次のことを行うことができます。

  • 既存のテキストサポートに加えて、ビジュアル要素から回答を取得します。
  • テキストとビジュアルデータの両方を含むコンテキストに基づいて回答を生成します。
  • 元の文書のビジュアル要素を参照するソースアトリビューションを提供してください。

Amazon Bedrock コンソールでナレッジベースを作成するときに、解析戦略として Amazon Bedrock データオートメーションを選択できるようになりました。

パーサーとして Amazon Bedrock データオートメーションを選択すると、Amazon Bedrock データオートメーションが視覚的に豊富なコンテンツからのインサイトの抽出、変換、生成を処理し、Amazon Bedrock ナレッジベースが取り込み、取得、モデルレスポンスの生成、ソースアトリビューションを管理します。

あるいは、既存の基盤モデルをパーサーオプションとして使用することもできます。このオプションにより、Anthropic’s Claude 3.5 Sonnet がパーサーとしてサポートされるようになりました。デフォルトのプロンプトを使用することも、特定のユースケースに合わせて変更することもできます。

コンソールのスクリーンショット。

次のステップでは、Amazon Bedrock ナレッジベースがナレッジベースのデータソースに私のドキュメントから抽出した画像を保存するために使用する、Amazon S3 上のマルチモーダルストレージの保存先を指定します。これらの画像は、ユーザークエリに基づいて取得し、応答を生成するために使用し、応答に引用することができます。

コンソールのスクリーンショット。

ナレッジベースを使用する場合、Amazon Bedrock データオートメーションまたは FM がパーサーとして抽出した情報を使用して、視覚要素に関する情報を取得したり、チャートや図を理解したり、テキストコンテンツとビジュアルコンテンツの両方を参照する応答を提供したりします。

Amazon Bedrock ナレッジベースでの GraphRAG の使用
散在するデータソースから洞察を抽出することは、RAG アプリケーションにとって大きな課題であり、関連する応答を生成するには、これらのデータソース全体で多段階の推論が必要になります。例えば、顧客は生成 AI を搭載した旅行アプリケーションに、美味しいシーフードレストランも提供している、自宅所在地からの直行便がある家族向けのビーチ目的地を特定するよう依頼する可能性があります。そのためには、他の家族で楽しんだことのある適切なビーチを特定し、それを飛行ルートと照合し、評価の高い地元のレストランを選択するための連携したワークフローが必要です。従来の RAG システムでは、情報が異なるソースに存在し、相互にリンクされていないため、これらすべての要素を統合してまとまりのある推奨事項にするのが難しい場合があります。

ナレッジグラフは、エンティティ間の複雑な関係を構造化された方法でモデル化することで、この課題に対処できます。ただし、グラフを作成してアプリケーションに統合するには、多大な専門知識と労力が必要です。

Amazon Bedrock ナレッジベースでは、RAG 技術とグラフを組み合わせてエンドユーザーにより正確で包括的な応答を提供することで、生成 AI アプリケーションを強化する初のフルマネージド型 GraphRAG 機能が提供されるようになりました。

ナレッジベースを作成するときに、データベースとして Amazon Neptune Analytics を選択し、基盤となるデータ、エンティティ、およびそれらの関係のベクトルおよびグラフ表現を自動的に生成することで、わずか数ステップで GraphRAG を有効にできるようになりました。これにより、開発作業は数週間からわずか数時間に短縮されます。

新しいナレッジベースの作成を開始します。ベクトルデータベースセクションでは、新しいベクターストアを作成するときに、Amazon Neptune Analytics (GraphRAG) を選択します。新しいグラフを作成したくない場合は、既存のベクトルストアを用意して、リストから Neptune Analytics グラフを選択できます。GraphRAG は、Anthropic’s Claude 3 Haiku を使用して、ナレッジベース用のグラフを自動的に作成します。

コンソールのスクリーンショット。

ナレッジベースの作成が完了すると、Amazon Bedrock は関連する概念とドキュメントをリンクしたグラフを自動的に作成します。知識ベースから情報を取得する際、GraphRAG はこれらの関係を調べて、より包括的で正確な回答を提供します。

Amazon Bedrock ナレッジベースでの構造化データ取得の使用
構造化されたデータ検索により、データベースとデータウェアハウスの自然言語クエリが可能になります。たとえば、あるビジネスアナリストが「前四半期で最も売れた製品は何でしたか?」と尋ねるかもしれません。そして、システムは Amazon Redshift データベースに格納されているデータウェアハウスに適切な SQL クエリを自動的に生成して実行します。

ナレッジベースを作成するときに、構造化データストアを使用できるようになりました。

コンソールのスクリーンショット。

ナレッジベースの名前と説明を入力します。データソースの詳細では、Amazon Redshiftクエリエンジンとして使用しています。ナレッジベースのリソースを管理するための新しい AWS Identity and Access Management (IAM) サービスロールを作成し、[次へ] を選択します。

コンソールのスクリーンショット。

接続オプションと使用するワークグループRedshift サーバーレスを選択します。Amazon Redshift でプロビジョニングされたクラスターもサポートされています。認証には以前に作成した IAM ロールを使用します。ストレージメタデータは、AWS Glue データカタログを使用して管理することも、Amazon Redshift データベース内で直接管理することもできます。リストからデータベースを選択します。

コンソールのスクリーンショット。

ナレッジベースの構成では、クエリの最大期間を定義したり、テーブルや列へのアクセスを含めたり除外したりできます。自然言語からのクエリ生成の精度を向上させるために、オプションでテーブルと列の説明と、質問をデータベースの SQL クエリに変換する方法の実用的な例を示す、厳選されたクエリのリストを追加できます。[次へ] を選択し、設定を確認して、ナレッジベースの作成を完了します

数分後、ナレッジベースの準備が整います。同期が完了すると、Amazon Bedrock ナレッジベースがクエリの結果を生成、実行、フォーマット処理するので、構造化データへの自然言語インターフェイスを簡単に構築できます。構造化データを使用してナレッジベースを呼び出す場合、SQL を生成するか、データを取得するか、または自然言語でデータを要約するように求めるだけで済みます。

知っておくべきこと
これらの新機能は現在、次の AWS リージョンでご利用いただけます。

  • Amazon Bedrock データオートメーションは、米国西部 (オレゴン) でプレビュー版として提供されています。
  • Amazon Bedrock データオートメーションをパーサーとして使用した Amazon Bedrock ナレッジベースでのマルチモーダルデータ処理サポートは、米国西部 (オレゴン) でプレビュー段階にあります。パーサーとしての FM は、Amazon Bedrock ナレッジベースが提供されているすべてのリージョンで利用できます。
  • Amazon Bedrock ナレッジベースの GraphRAG は、Amazon Bedrock ナレッジベースと Amazon Neptune Analytics が提供されているすべての商用リージョンでプレビュー版としてご利用いただけます。
  • 構造化データの取得は、Amazon Bedrock ナレッジベースが提供されているすべての商用地域の Amazon Bedrock ナレッジベースで利用できます。

Amazon Bedrock ではいつものように、使用状況に応じて料金が決まります。

  • Amazon Bedrock データオートメーションでは、画像ごと、ドキュメントの場合はページごと、オーディオまたはビデオの場合は 1 分ごとに課金されます。
  • Amazon Bedrock ナレッジベースでのマルチモーダルデータ処理は、Amazon Bedrock データオートメーションまたは FM をパーサーとして使用した場合に基づいて課金されます。
  • Amazon Bedrock ナレッジベースで GraphRAG を使用しても追加料金は発生しませんが、ベクトルストアとして Amazon Neptune Analytics を使用する場合は料金が発生します。詳細については、Amazon Neptune の料金表をご覧ください。
  • Amazon Bedrock ナレッジベースで構造化データ取得を使用する場合は追加料金がかかります。

料金に関する詳細については、「Amazon Bedrock の料金」を参照してください。

各機能は個別に使用することも、組み合わせて使用することもできます。これらを組み合わせることで、AI を使用してデータを処理するアプリケーションを簡単かつ迅速に構築できます。開始するには、Amazon Bedrock コンソールにアクセスしてください。詳細については、Amazon Bedrock のドキュメントにアクセスし、AWS re:Post for Amazon Bedrock にフィードバックを送信してください。community.aws では、詳しい技術コンテンツを検索し、ビルダーコミュニティが Amazon Bedrock を使用する方法を見出すことができます。これらの新機能で何を構築するのか教えてくださいね!

Danilo

原文はこちらです。