Amazon Web Services ブログ
Category: Analytics
Amazon SageMaker Canvas でノーコード機械学習を行うために Google Cloud Platform BigQuery からデータをインポートする
現代のクラウド中心のビジネス環境では、データが複数のクラウドやオンプレミスのシステムに分散していることが多くあります。この断片化は、お客様が機械学習 (ML) イニシアチブとして、データを統合し、分析する作業を複雑にしています。
本稿では、さまざまなクラウド環境の中でも Google Cloud Platform (GCP) BigQueryに焦点を当て、データソースを移動することなく、データを直接抽出するアプローチをご紹介します。これにより、クラウド環境間でデータ移動の際に発生する複雑さとオーバーヘッドを最小限に抑えることができるため、組織は ML プロジェクトで様々なデータ資産にアクセスし、活用できるようになります。
臨床生成 AI ワークフローの AWS Step Functions による オーケストレーション
この記事は、“Orchestrating Clinical Generative AI Workflows U […]
企業データ×生成 AI ! アクロクエストの DocCollector と Amazon Bedrock で実現する Box 内データ活用
本記事では、アクロクエストテクノロジー社の DocCollector を利用して Box 内のデータを AWS に取り込み、生成 AI アプリケーション開発のためのサービスである Amazon Bedrock を活用した RAG システムを構築する具体的な方法について解説します。
Amazon Redshift Query profiler でクエリ性能診断を簡素化
本記事は、Simplify your query performance diagnostics in Ama […]
AWS の Sales Concierge で製薬企業の営業生産性と効率を飛躍的に向上
このブログは、“Boost sales team productivity and effecti […]
【開催報告】AWS Autotech Forum 2024
みなさんこんにちは。プリンシパルソリューションズアーキテクトの梶本(かじもと)です。9月11日にAWSが主催す […]
AWS Weekly Roundup: AWS ニュースブログの 20 年、Amazon MSK の Express ブローカー、EC2 での Windows Server 2025 イメージなど (2024 年 11 月 11 日)
AWS ニュースブログは 20 周年を迎えました🎉🥳🎊! 2004 年 11 月 9 日、Jeff Barr […]
Kafka クラスター向けの高スループットと高速スケーリングを実現する Amazon MSK のエクスプレスブローカーのご紹介
11 月 7 日、Amazon Managed Streaming for Apache Kafka (Ama […]
Amazon OpenSearch Service が次世代 OpenSearch UI を発表
Amazon OpenSearch Service は、複数のデータソースにわたる包括的な可観測性を実現する、最新の運用分析機能をリリースしました。これにより、OpenSearch や他の統合されたデータソースから一括でインサイトを得ることができます。このリリースでは、メジャーなユースケースに合わせた体験を提供し、アクセス制御をサポートする OpenSearch Workspaces も導入されました。これにより、ユースケースに応じたプライベートスペースを作成し、コラボレーターだけと共有することが可能です。次世代のユーザーインターフェース(UI)では、Discover 機能が改善され、インタラクティブな分析が簡素化されました。自然言語クエリ生成などの機能を利用して、簡単にデータからインサイトを得ることができます。
OpenSearch 最適化インスタンス (OR1) はインデクシングパフォーマンスとコストを革新
Amazon OpenSearch Service は、アプリケーション監視、ログ分析、オブザーバビリティ、Web サイト検索などのユースケースで、ビジネスデータや運用データのリアルタイム検索、監視、分析を安全に実現にします。
この記事では、2023 年 11 月 29 日に導入された、OpenSearch 最適化インスタンスタイプ OR1 について検討します。
OR1 は Amazon OpenSearch Service のインスタンスタイプで、大量のデータを保存するためのコスト効率の高い方法を提供します。OR1 インスタンスを使用するドメインでは、Amazon Elastic Block Store (Amazon EBS) ボリュームをプライマリストレージとして使用し、データが書き込まれるとすぐに Amazon Simple Storage Service (Amazon S3) に同期的にコピーされます。OR1 インスタンスは、高い耐久性と共に、インデックス作成スループットが向上します。
OR1 の詳細については、紹介ブログ記事をご覧ください。
インデックスに対して書き込みを行っている間は、レプリカを 1 つ維持することをお勧めします。ただし、ロールオーバー後にインデックスに対する書き込みが行われなくなった後は、レプリカを 0 に切り替えることができます。
これは、データが Amazon S3 に永続化されているため、安全に行えます。
ノードの障害と交換が発生した場合、データは Amazon S3 から自動的に復元されますが、修復操作中は一部利用できなくなるため、アクティブに書き込まれていないインデックスの検索に高可用性が必要な場合は、この機能を使用しないでください。