Amazon Web Services ブログ

Category: Amazon EC2

Hosted Control Plane (HCP) を備えた Red Hat OpenShift Service on AWS (ROSA) を解説

2015年に AWS で初めてリリースされて以来、Red Hat OpenShift は似たようなアーキテクチャを持ってきました。OpenShift 3 、 OpenShift 4 、自己管理の OpenShift Container Platform (OCP) か、マネージドサービスの ROSA かを問わず、お客様はこれまで自身の AWS アカウント内に存在するコントロールプレーンについて、関連するコストを相殺して投資対効果 (ROI) を最大化する方法を検討してきました。これに応えるべく Red Hat は OpenShift 向けに Hosted Control Plane (HCP) をリリースしました。

SAP Private Link と AWS サービスで SAP BTP アプリを機能強化

イノベーションとアジリティは、デジタル環境で優位に立ち続けるための重要な鍵であり、そのため企業はますますクラウドサービスの力を活用しようとしています。しかし、多くの組織が直面する大きな障害は、インターネット上で機密データを送受信することによるリスクです。この課題を認識し、本ブログでは、SAP Private Link が SAP Business Technology Platform (BTP) 内で AWS の標準サービスを安全かつプライベートに利用できる経路を提供する方法を探っています。このアプローチにより、セキュアで制御されたネットワーク環境でイノベーションを促進することができます。

AWS Backup でバックアップした VMware 仮想マシンを Amazon EC2 としてリストアする

VMware 仮想環境 (VMware Cloud on AWS) 上で稼働する仮想マシンを AWS Backup で保護し、Amazon EC2 としてリストアする方法についてご紹介します。AWS Backup を活用すれば、オンプレミス VMware 仮想環境の仮想マシンの災害時の一時的な退避先として Amazon EC2 を利用する、あるいは VMware Cloud on AWS 上の仮想マシンを Amazon EC2 に移行することも可能になります。

AWS Trainium を活用した日本語大規模言語モデルの分散学習と AWS Inferentia2 上での推論環境構築

生成 AI の進化を支える大規模言語モデルの開発及び運用に掛かるコスト、計算機リソースの確保は多くの企業が抱える大きな課題です。AWS では機械学習 (ML) アクセラレーターチップ AWS Trainium、AWS Inferentia2 を自社開発し、これらの課題解決に取り組んでいます。(Anthropic では AWS Trainium、Inferentia の活用を表明しています)
本ブログでは、前半で、AWS Trainium 搭載 Amazon EC2 Trn1 インスタンスを活用した日本語大規模言語モデルの開発事例、大規模分散学習の課題及び実現方法について解説します。
ブログ後半では、公開された日本語大規模モデルを Inferentia2 搭載 Amazon EC2 Inf2 インスタンス上で推論実行する方法について、手順を追って解説します。