Amazon Web Services ブログ

Category: Analytics

Amazon SageMaker Canvas でノーコード機械学習を行うために Google Cloud Platform BigQuery からデータをインポートする

現代のクラウド中心のビジネス環境では、データが複数のクラウドやオンプレミスのシステムに分散していることが多くあります。この断片化は、お客様が機械学習 (ML) イニシアチブとして、データを統合し、分析する作業を複雑にしています。

本稿では、さまざまなクラウド環境の中でも Google Cloud Platform (GCP) BigQueryに焦点を当て、データソースを移動することなく、データを直接抽出するアプローチをご紹介します。これにより、クラウド環境間でデータ移動の際に発生する複雑さとオーバーヘッドを最小限に抑えることができるため、組織は ML プロジェクトで様々なデータ資産にアクセスし、活用できるようになります。

企業データ×生成 AI ! アクロクエストの DocCollector と Amazon Bedrock で実現する Box 内データ活用

本記事では、アクロクエストテクノロジー社の DocCollector を利用して Box 内のデータを AWS に取り込み、生成 AI アプリケーション開発のためのサービスである Amazon Bedrock を活用した RAG システムを構築する具体的な方法について解説します。

Amazon OpenSearch Service が次世代 OpenSearch UI を発表

Amazon OpenSearch Service は、複数のデータソースにわたる包括的な可観測性を実現する、最新の運用分析機能をリリースしました。これにより、OpenSearch や他の統合されたデータソースから一括でインサイトを得ることができます。このリリースでは、メジャーなユースケースに合わせた体験を提供し、アクセス制御をサポートする OpenSearch Workspaces も導入されました。これにより、ユースケースに応じたプライベートスペースを作成し、コラボレーターだけと共有することが可能です。次世代のユーザーインターフェース(UI)では、Discover 機能が改善され、インタラクティブな分析が簡素化されました。自然言語クエリ生成などの機能を利用して、簡単にデータからインサイトを得ることができます。

OpenSearch 最適化インスタンス (OR1) はインデクシングパフォーマンスとコストを革新

Amazon OpenSearch Service は、アプリケーション監視、ログ分析、オブザーバビリティ、Web サイト検索などのユースケースで、ビジネスデータや運用データのリアルタイム検索、監視、分析を安全に実現にします。

この記事では、2023 年 11 月 29 日に導入された、OpenSearch 最適化インスタンスタイプ OR1 について検討します。

OR1 は Amazon OpenSearch Service のインスタンスタイプで、大量のデータを保存するためのコスト効率の高い方法を提供します。OR1 インスタンスを使用するドメインでは、Amazon Elastic Block Store (Amazon EBS) ボリュームをプライマリストレージとして使用し、データが書き込まれるとすぐに Amazon Simple Storage Service (Amazon S3) に同期的にコピーされます。OR1 インスタンスは、高い耐久性と共に、インデックス作成スループットが向上します。

OR1 の詳細については、紹介ブログ記事をご覧ください。

インデックスに対して書き込みを行っている間は、レプリカを 1 つ維持することをお勧めします。ただし、ロールオーバー後にインデックスに対する書き込みが行われなくなった後は、レプリカを 0 に切り替えることができます。

これは、データが Amazon S3 に永続化されているため、安全に行えます。

ノードの障害と交換が発生した場合、データは Amazon S3 から自動的に復元されますが、修復操作中は一部利用できなくなるため、アクティブに書き込まれていないインデックスの検索に高可用性が必要な場合は、この機能を使用しないでください。