Amazon Web Services ブログ
【開催報告】ISV/SaaS 顧客向け「Amazon Redshift Serverless 勉強会」
こんにちは!アマゾンウェブサービスジャパン合同会社 ソリューションアーキテクトの藤川です。
2022年7月〜2022年11月に渡り、月に一度「Amazon Redshift Serverless 勉強会」をオンラインで開催しました。本イベントは、2022年7月に一般公開された「Amazon Redshift Serverless」の概要の説明やQuickSightと連携したデモを1時間でお伝えするイベントです。今回も多くの方にご参加いただきました。
ご参加された皆様、ありがとうございます。
当日の様子と実施内容
本開催報告の中では、当日紹介のあった内容をピックアップし皆様に少しでも Redshift Serverless を知ってもらえるようにトピックをかいつまんでご紹介します。
Agenda
- データ分析の重要性と課題
- Amazon Redshift Serverless とは
- データ分析のデモ
「データ分析の重要性と課題」
データ量はかつてない速度で増加しており、テラバイトからペタバイト、場合によってはエクサバイトのデータへと爆発的に増加しています。従来のオンプレミスのデータ分析アプローチでは、十分な拡張性がなく、コストが高すぎるため、これらのデータ量を処理できません。企業からは、データからより多くの価値を引き出そうとしているが、現代のデジタルビジネスが生み出すすべてのデータの収集、保存、分析に苦労しているとよく耳にします。さらに新しいソースから提供され、多様化が進んでおり、多数のアプリケーションやユーザーが安全にアクセスして分析する必要があります。
そういった背景の中、分析のニーズも多様化してきており、結果的にシステムは複雑化・サイロ化しどこにデータがわからなくなる状況が出てきいます。このような課題からデータ分析は前述の通り沢山の考慮すべき点があり、すぐに始められないといった課題があります。
「Amazon Redshift Serverlessとは」
従来の Amazon Redshift はすでに数万人のお客様を抱え、最も広く使用されているクラウドデータウェアハウスです。利用いただいているお客様からは、より簡単に導入し管理できないのかといった要望や、ITリテラシーの高くないビジネス部門の方々でもよりカジュアルに使いたいといったニーズをいただいています。
先程のニーズに答えるために開発されたサービスが Amazon Redshift Serverless となり、よりお伝えしたいポイントは4つあります。
- 適切なノードタイプやノード数の選択について考える必要なく、数秒で手軽に開始でき、クエリエディタに移動してクエリを開始できます
- データウェアハウスの容量をインテリジェントかつ自動的にプロビジョニングしてスケーリングし、一貫性のある高速なパフォーマンスを提供します
- S3 データレイクや運用データベースへのクエリ、データ共有を使用した他の組織とのライブデータの共有など、Redshift の豊富な SQL 機能とパフォーマンス特性をすべて利用できます
- 使用した分だけお支払いとなり、アイドル時間の料金はかかりません(ただし、マネージドストレージに保存されたデータに対して、対象のリージョンにおいて GB 単位の固定月額料金が課金されます)
Amazon Redshift Serverless は、たった3ステップで簡単に開始できます。
- Amazon Redshift コンソールに移動し、AWS アカウントのサーバーレスエンドポイントを有効にします。
- デフォルト設定を確認し必要な項目を登録します。
- 標準提供されているクエリエディタツールからクエリを開始することも、JDBC/ODBC またはデータ API を介してお気に入りのツールから接続することもできます。ノードタイプを選択してノードを指定したり、ワークロード管理、スケーリング設定などの別の手動設定を行う必要はありません。データはデフォルトで暗号化されます。
Amazon Redshift のシームレスなデータ統合機能をすべてサーバーレスで活用できます。外部メタデータ参照を作成し、AWS Glue カタログを介して Amazon S3 のデータレイクから Parquet などのオープンフォーマットでデータをクエリできます。また、フェデレーテッドクエリ機能を使用して、Amazon Aurora や Amazon RDS などのオペレーションデータソースのデータを参照し、クエリすることもできます。
クエリを継続的に監視し、さまざまな高度な ML 手法を適用することによって構築されるワークロードパターンによって自動的にリソースを割り当てます。たとえば、クエリが小、中、大のいずれであるかを判断し、コンピュートリソースをいつスケーリングし、どれくらいスケーリングするかを決定し、一貫したパフォーマンスを維持しながらコストを最適化できるようにします。
また、Redshift Serverless は、クエリパターンに基づいてデータウェアハウスのプロパティとデータレイアウトを自動的に調整し、パフォーマンスをさらに最適化するため、専門家が手動でクラスターを調整する必要がなくなるといったメリットがあります。
Amazon Redshift Serverless では、コンピューティングとストレージの料金が別々に行われます。コンピューティングキャパシティは Redshift プロセッシングユニット (RPU) で測定され、ワークロード期間中のキャパシティに対して 1 秒あたりの料金をお支払いいただきます。サーバーレスは、適切なサイジング決定を行うことでキャパシティ管理を自動化し、ワークロードに基づいてキャパシティを柔軟かつ自動的にスケーリングします。1 RPU には、対応する CPU とネットワークを備えた 16 GB のメモリがあります。
データについては、Redshift マネージドストレージに保存されたデータに対して、 GB 単位の固定月額料金が課金されます。その他詳細な料金体系については以下の公式サイトを参照ください。
https://thinkwithwp.com/jp/redshift/pricing/
想定されるユースケースとしては以下のようなものがあります。
- IT リテラシーの高くないビジネス部門の方でも簡単に分析を始めたい
- 開発/テスト環境やアドホックなビジネス分析
- Redshift のインフラ設計/構築/運用やトラブルシューティングに精通した有識者が不在
- システムの負荷が予測できない
- 一時的なピークトランザクション
- 夜間のバッチ処理のみのワークロード
「データ分析のデモ」
Amazon Redshift Serverless と Amazon QuickSight を活用したデータ分析のデモを実施しました。
まずは、Amazon Redshift Serverlessを構築し、S3からデータをロードして環境構築を行い、QuickSightと連携させてBI分析を行う簡易なデモとなります。
こちらのハンズオンをベースに当日デモを実施していますので、興味ある方は是非一度お手元の環境で触ってみてください。
https://pages.awscloud.com/JAPAN-launch-GC-RedshiftServerless_Handson-2022-reg.html
ちょっぴり相談会のご案内 – ISV / SaaS 事業者向け個別相談会
ISV / SaaS ソリューション本部では、ISV / SaaS 事業者のお客様がソリューションアーキテクトに対して技術相談をできる時間としてちょっぴり相談会を実施しています。
ちょっぴり相談会や過去の相談事例についてはブログで公開されていますのであわせて御覧ください。
著者
藤川 貞信
ISV/SaaS Business ソリューション アーキテクト
様々なデータベースのパフォーマンストラブルを経験。現在はISV/SaaS業界のお客様向けに AWS 上に実装する際の技術支援全般を担当。