Amazon Web Services ブログ

週刊AWS – 2020/12/7週 (re:Invent 特別編集号)

みなさん、こんにちは。ソリューションアーキテクトの下佐粉です。
今週も週刊AWSをお届けします。

先週はAWSの年次イベント AWS re:Invent 2020 の第二週ということで、引き続き多くの新機能が発表されました。今号も特別編集号として、筆者らが独断でピックアップした重要アイテムを紹介する形でお送りします。今号はMachine Learning KeynoteとAnalyticsのリーダーシップセッションで発表されたものを中心にピックアップしてご紹介します。

それでは、先週の主なアップデートについて振り返っていきましょう。

2020年12月7日週の主要なアップデート – re:Invent 2020 特別編集号

  • 機械学習環境のAmazon SageMakerに多数の新サービス・新機能が発表
    • 巨大データを高いスループットで学習するための分散トレーニングのライブラリが公開されました。分散の手法としてデータを分散する(data parallelism)とモデルを分散する(model parallelism)の二種類のライブラリが用意されています。どちらも無料で利用可能です。
    • Amazon SageMaker Clarifyが発表され利用可能になりました。機械学習ワークフロー内に潜在するサンプリングバイアスを検知し、モデルの透明性向上を実現するサービスです。すべてのSageMaker利用可能なリージョンでご利用いただけます。詳細はこちらのブログをご覧ください。
    • 機械学習トレーニングのデバッグを支援するSageMaker Debuggerに、システムリソースのリアルタイムモニタ機能が追加されました。CPU、GPU、メモリ、ネットワークI/O、ストレージI/O等のメトリクスを自動的に収集し可視化が可能です。詳細はこちらのブログをご覧ください。
    • ロボットやモバイルデバイス等、エッジデバイス群に対してモデルの最適化や運用管理を行うためのAmaon SageMaker Edge Managerが発表されました。エッジデバイス向けのモデル最適化や継続的なモニタリング機能を提供します。東京リージョンでも利用可能になっています。
    • 素早く機械学習を始めるための仕組みを提供するAmazon SageMaker JumpStartが発表されました。 PyTorch HubやTensorFlow Hubなどからの150を超える事前トレーニング済みモデルに対し、様々なソリューションがワンクリックでデプロイ可能です。詳細はこちらのブログをご覧ください。
    • 機械学習用のデータを迅速に準備するためのサービス、Amazon SageMaker Data Wranglerが発表されました。データをプレビューしながらGUI操作で変換やジョインの機能を適用することで、学習に必要なデータの前処理を行うことができます。(こちらは第一週に発表されたものです)
  • Announcing Amazon Forecast Weather Index – automatically include local weather to increase your forecasting model accuracy
    • 時系列予測のサービス Amazon Forecastに、天候情報を予測の条件に加えることで予測精度を高めるForecast Weather Indexが発表されました。現在のところ気象情報は米国とヨーロッパのものが提供されています。
  • クラウドDWHサービスのAmazon Redshiftに多数の新機能が発表
    • 機械学習のモデル作成、トレーニング、利用までをRedshiftのSQLから実現するAmazon Redshift MLがプレビュー開始になりました。機械学習の機能はSageMakerにより提供されていますが、処理はすべてSQLで行えるため、Redshiftの中にあるデータを機械学習と組み合わせて利用することがより容易になりました。東京リージョンでもプレビュー利用可能です。詳細はこちらのブログをご覧ください。
    • 複数のRedshiftクラスター間でデータを共有できる Amazon Redshift Data Sharingがプレビュー開始になりました。いったんデータをS3にエクスポートしたりすることなく、現在保持しているデータを複数クラスター間で共有可能になります。データ(S3)と処理系(コンピュートノード)が分離されたRA3インスタンスでプレビュー利用可能になっています。
    • Redshiftクラスターの別AZへの移動が容易に実現可能になりました。RedshiftはシングルAZの中に構成されるサービスですが、このクラスターをワンステップで別AZに移動(配置)可能になりましした。移動後も同じエンドポイントでアクセス可能です。これにより、AZをまたいだ高い可用性構成の実現が容易になりました。この機能もRA3インスタンスでのみ利用可能です。
    • RA3インスタンスに、RA3.xlplusが追加されました。東京リージョンでも利用可能になっています。xlplusは、1ノードあたり4vCPUと32GiBメモリを搭載しており、4xlargeの約1/3のサイズになっています。比較的小規模のDWH用途でもRA3インスタンスを選択しやすくなりました。
    • Redshiftのテーブルが自動的に最適化されるようになりました。これまでも継続的に管理の自動化機能が追加されてきましたが、それらを統合し、自動化を推し進めた機能です。Redshiftでは表の作成時にソートキーと分散キーを指定する必要があり、必要に応じてこれらを調整する必要がありましたが、この機能によりユーザは指定する必要がなく、バックグラウンドで自動的な最適化が実施されます。新規作成の表は自動最適化の対象になっており、既存の表もALTER TABLEで自動化を設定可能です。詳細はこちらのブログをご覧ください。
    • JSON等の準構造化データのネイティブサポートがプレビューとして発表されました。新しく純構造化データ用のSUPER型が追加され、JSON等のデータを高速に格納できるようになるだけでなく、その操作のためにPartiQLクエリ言語のサポートが追加されました。パブリックプレビューが開始になっており、 RedshiftのSQL_PREVIEWトラックで利用可能です。詳細はこちらのドキュメントをご覧ください。
  • AWS Lake FormationにACIDトランザクション等、複数の新機能がプレビューとして公開 
    • データレイクの管理機能を提供するLake Formationに複数の新機能がプレビューで公開されました。以下の3つの新機能はこちらのリンクからプレビューを申し込み可能です。
    • ACIDトランザクション機能:S3上のデータに対し、行単位の更新・削除やトランザクションが実現可能になりました。たとえばトランザクションAでデータを更新中であってもAがCommitするまでは、トランザクションBには整合性がとれたCommit前のデータが見えているということがデータレイク上で実現可能になります。
    • 行レベルセキュリティ:Lake Formationでは列レベルでのアクセス制御を提供していますが、それに加えて行レベルのアクセス制御を提供します。
    • アクセラレーション:S3上にデータを配置する際、あまりファイルサイズが小さく、数が多くなるとそのアクセスに時間がかかってしまいます。こういった状況において、小さいファイルを自動的に結合してクエリの性能を向上させる機能が提供されます。
  • 量子コンピューティング環境のAmazon BraketがPennyLaneをサポート
    • 量子コンピューティング環境をマネージドで提供するAmazon BraketでPennyLaneをサポートしました。PennyLaneは、PyTorchやTensorFlow等の機械学習ライブラリへのインターフェイスを提供しています。Braketとの統合によりDL学習と同じ方法で量子回路をトレーニング可能になります。
  • Amazon BraketでTensor Network をサポートする TN1 シミュレータが発表
    • Amaon BraketでTensor Network をサポートする TN1 シミュレータが利用可能になりました。最大50量子ビットの 量子計算のシミュレーションを可能にするものです。特にスパースな回路、ローカルゲートを備えた回路等固有構造を持つ量子回路演算でパフォーマンスを発揮します。
  • Amazon AuroraでR6gインスタンスがプレビュー提供開始
    • 高速なマネージドRDBMSサービスであるAmazon Auroraで、AWS Graviton2プロセッサを搭載したR6gインスタンスがプレビュー提供開始になりました。Graviton2は64-bit Arm Neoverse コアを使用したAWS設計のプロセッサで、高いコストパフォーマンスを提供します。Aurora with MySQL compatibility 、Aurora with PostgreSQL compatibility 両方でプレビュー利用可能になっています。料金はこちら(英語ページ)で確認できますように、既存のr5より安価に設定されています。プレビューですので本番利用には適しませんが、ぜひ実際のワークロードでその性能を評価いたただければと思います。
  • VPC Reachability Analyzerが提供開始
    • ネットワーク診断ツールのVPC Reachability Analyzerが提供開始になりました。これはVPC内のエンドポイント間や複数のVPCをまたがっての通信の到達可能性を可視化するサービスで、意図したとおりの(経路の)ネットワーク構成になっているかを容易に確認できます。東京リージョンを含む多くのリージョンで利用可能になっています。詳細はこちらのブログをご覧ください。

先週同様、各種新発表をより広くチェックしたいという方向けに、AWS Black Beltオンラインセミナーの「2020 年 AWS re:Invent 速報 Part2」が本日(12/14)18時から開催されます。re:invent第2週の内容について1時間で説明するオンラインセミナーです。こちらもぜひご覧ください。こちらから申し込みが可能です。

今週は最終の第3週ですね。どういった内容が発表されるのか楽しみです。キーノートとしてはデベロッパー向けのWerner Vogels Keynoteが予定されています。日本から見る場合は16日AM9、もしくは同日PM5からの再放送が見やすい時間帯ですね。

それではまた来週!

ソリューションアーキテクト 下佐粉 昭 (twitter – @simosako)