最速のクラウドオブジェクトストレージでパフォーマンスクリティカルなアプリケーションに対応
Amazon S3 Express One Zone は単一アベイラビリティーゾーンの高性能ストレージクラスです。1 桁ミリ秒の一貫したデータアクセスを提供することで、アクセス頻度が最も高いデータや低レイテンシーを必要とするアプリケーションに対応できるよう専用に構築されました。S3 Express One Zone では、S3 Standard に比べてデータアクセス速度が最大 10 倍速く、リクエストのコストを最大 50% 低く抑えることができます。これまでも S3 データの保存に特定の AWS リージョンを選択いただけましたが、S3 Express One Zone なら AWS リージョン内の特定の AWS アベイラビリティーゾーンを選択してデータを保存できます。ストレージとコンピューティングリソースを同じアベイラビリティーゾーンに配置して、さらにパフォーマンスを最適化することで、コンピューティングコストの低減、ワークロードの高速実行につながります。S3 Express One Zone では、データは別のバケットタイプ (S3 ディレクトリバケット) に保存されます。このバケットは 1 秒あたり数十万件のリクエストに対応します。さらに、S3 Express One Zone と、Amazon SageMaker モデルトレーニング、Amazon Athena、Amazon EMR、AWS Glue データカタログなどのサービスを併用すると、機械学習や分析のワークロードを加速できます。S3 Express One Zone では、ストレージは使用量とニーズに基づいて自動的にスケールアップまたはスケールダウンするため、低レイテンシーのワークロードのために複数のストレージシステムを管理する必要がなくなります。
高いパフォーマンスを必要とするアプリケーションを高速化
より低い総保有コスト
プロビジョニング不要でシンプルにスケール
仕組み
開始するには、まず選択したアベイラビリティーゾーンに S3 ディレクトリバケットを作成します。パフォーマンスをさらに最適化するために、ストレージと、Amazon Elastic Compute Cloud (EC2)、Amazon Elastic Kubernetes Service (EKS)、および Amazon Elastic Container Service (ECS) のコンピューティングリソースを同じ場所に配置することを選択できます。新しいオブジェクトを S3 Express One Zone に直接アップロードするか、または [インポート] ボタンを使用して他のストレージクラスからデータをコピーします。このコピー機能は、同じ AWS リージョン内の汎用バケットまたはプレフィックスから、既存のオブジェクトをディレクトリバケットにコピーするフルマネージドの追跡可能な方法です。人工知能および機械学習 (AI/ML) のサービスやアプリケーション、および PyTorch などのオープンソースフレームワークでディレクトリバケットを使用して、高い処理能力を必要とするワークロードを高速化し、低レイテンシー、高速な処理時間、低コストなコンピューティングや API リクエストにより総保有コスト (TCO) を全体的に低減します。
ユースケース
機械学習と人工知能のトレーニング
データアクセス速度を大幅に高速化して、モデルデータセットをより高速処理することで、モデルのトレーニングと開発を加速します。
インタラクティブなデータ分析
高いスループットと超低レイテンシーのクラウド内ストレージでより高速な処理スピードを実現することで、クエリの速度を加速し、ペタバイト規模のデータの分析からインサイトを得ます。
ハイパフォーマンスコンピューティング (HPC)
コンピューティングリソースと同じ場所に配置できる高速かつスケーラブルなストレージを使用して、高い処理能力を必要とする HPC ワークロードを高速で完了します。
データストリーミング
1 桁ミリ秒のリクエストレイテンシーと、既存のオブジェクトへのデータ追加などの機能により、ログおよびメディアストリーミングアプリケーションを高速化します。
リアルタイム広告
ターゲティング広告コンテンツを 1 桁ミリ秒のリクエストレイテンシーで配信することで、パーソナライゼーションを微調整し、動的プレースメントでの広告を高速配信します。
メディアコンテンツのワークロード
コンピューティングに合わせてスケールするストレージを使用して、視覚効果 (VFX)、レンダリング、トランスコーディングのタイムラインにこれまでにないほどの短時間で応答します。
Amazon S3 Express One Zone のお客様
Pinterest はビジュアルインスピレーションプラットフォームです。世界で最高のアイデアを検索したり保存したり購入したりするために毎月 4 億 8,000 万人を超える人々が訪れます。Pinterest は高度な機械学習モデルを活用して、数十億のオブジェクトを分析し、ユーザーごとにレコメンデーションをパーソナライズしています。
「機械学習は Pinterest の中心であり、大規模な ML トレーニングログの収集によって支えられています。Pinterest でのデータインジェストと配信を加速するために、当社は MemQ を開発しました。超効率的なオープンソースの PubSub システムは、高い費用効率を維持しながら、自社のすべての ML トレーニングデータと Amazon S3 を活用してデータパイプラインを秒あたり 10 GB で高速化します。当社では、MemQ での Amazon S3 Express One Zone ストレージクラスの評価中に、1 秒あたりのデータ処理トランザクションが増加し、レイテンシーが 10 倍超改善されたのを目にしました。この桁違いのパフォーマンスの改善に基づいて、S3 Express One Zone を利用することで、インフラストラクチャのコストを大幅に削減しながら、より高速なデータ利用とより頻繁な実験が可能になります。S3 Express One Zone は、クラウドアプリケーションのパフォーマンス、スケーラビリティ、柔軟性、効率性を高めるパラダイムシフトを引き起こしています」
Pinterest、Data Engineering Tech Lead、Ambud Sharma 氏
Ansatz Capital
Ansatz Capital はクオンツトレーディングチームです。世界クラスのテクノロジーを極めて優秀な技術分野の人材と組み合わせて活用し、さまざまなアセットクラスやグローバルマーケットにわたって戦略を開発、デプロイします。
「当社は高頻度取引の領域において、金融市場の超高速の世界に後れを取ることのないように、大量の時系列データを利用してモデルを継続的にトレーニングしています。当社は自社の研究エコシステムにおける柔軟なデータレイクとして S3 を利用しており、これにより可能な限り迅速な取引が可能になっています。Amazon S3 Express One Zone ストレージクラスの低リクエストレイテンシーと高いパフォーマンスにより、アセット全体で、かつ、あらゆる時点において、より高い精度でモデルをスケールすることが可能になり、ワークロード速度が全体で 78% 改善されました」
Ansatz Capital、CTO、Shiyang Cao 氏
ClickHouse
ClickHouse は、リアルタイムアプリケーションと分析向けの最速かつリソース効率の高いオープンソースデータベースです。ClickHouse Cloud のクラウドネイティブの Database as a Service は AWS 上で実行されています。
「ClickHouse Cloud は、オブザーバビリティから市場取引データに至るまで、リアルタイム分析に利用されています。これを実現するには、極めて高いストレージパフォーマンスが大規模に必要となります。そのため、当社は、極めて要求の厳しいリアルタイム分析アプリケーションを強化するサービスでデータのホットキャッシュに Amazon S3 Express One Zone ストレージクラスを利用しています。S3 Express One Zone は、1 秒あたり数十万のトランザクションに一貫した 1 桁ミリ秒のリクエストレイテンシーを提供してくれます。これにより、ClickHouse Cloud は以前よりもさらに高速にデータを処理できます。S3 Express One Zone を利用することで、あらゆるデータソースからのクエリを高速化し、SQL クエリを使用してリアルタイムで分析レポートを生成することで、ユーザーに優れたパフォーマンスを提供できます。S3 Express One Zone を当社のアーキテクチャに追加することで、クエリのパフォーマンスを最大 283% 改善し、全体的な TCO を 65% 削減できました」
ClickHouse、VP Product、Tanya Bragin 氏
リソース
Amazon S3 Express One Zone の使用を開始
AWS マネジメントコンソールの使用開始に関する推奨事項とステップバイステップの手順については、この動画をご視聴ください。