Amazon Web Services ブログ
Category: Amazon EC2
Hosted Control Plane (HCP) を備えた Red Hat OpenShift Service on AWS (ROSA) を解説
2015年に AWS で初めてリリースされて以来、Red Hat OpenShift は似たようなアーキテクチャを持ってきました。OpenShift 3 、 OpenShift 4 、自己管理の OpenShift Container Platform (OCP) か、マネージドサービスの ROSA かを問わず、お客様はこれまで自身の AWS アカウント内に存在するコントロールプレーンについて、関連するコストを相殺して投資対効果 (ROI) を最大化する方法を検討してきました。これに応えるべく Red Hat は OpenShift 向けに Hosted Control Plane (HCP) をリリースしました。
Amazon FSx for NetApp ONTAP クローニングによる開発リフレッシュサイクルの加速とコストの最適化
本記事は 2023 年 5 月 22 日に Naim Mucaj (Senior Solutions Arch […]
O2 Telefonica と Nokia、 5G コアネットワークを AWS へ移行
本記事は、「O2 Telefonica Moves its 5G core network to the Cl […]
AWS Weekly Roundup: Amazon EC2 U7i インスタンス、Bedrock Converse API、AWS World IPv6 Day など (2024 年 6 月 3 日)
人生はいつも幸せだとは限らず、苦しいときもあります。それでも、私たちは歩みを共にする人たちと喜びや苦しみを分か […]
大規模なインメモリデータベース向けの Amazon EC2 ハイメモリ U7i インスタンス
re:Invent 2023 でプレビューとして発表された、最大 32 TiB の DDR5 メモリと 896 […]
AWS Weekly Roundup – Application Load Balancer IPv6、Amazon S3 の料金の更新、Amazon EC2 Flex インスタンスなど (2024 年 5 月 20 日)
AWS Summit シーズンは世界中で盛り上がりを見せています。先週はベンガルール、ベルリン、ソウルでイベン […]
SAP Private Link と AWS サービスで SAP BTP アプリを機能強化
イノベーションとアジリティは、デジタル環境で優位に立ち続けるための重要な鍵であり、そのため企業はますますクラウドサービスの力を活用しようとしています。しかし、多くの組織が直面する大きな障害は、インターネット上で機密データを送受信することによるリスクです。この課題を認識し、本ブログでは、SAP Private Link が SAP Business Technology Platform (BTP) 内で AWS の標準サービスを安全かつプライベートに利用できる経路を提供する方法を探っています。このアプローチにより、セキュアで制御されたネットワーク環境でイノベーションを促進することができます。
新しいコンピューティング最適化 (C7i-Flex) Amazon EC2 Flex インスタンス
CPU を絶えず 100% の最大使用率で実行するアプリケーションはほとんどありません。ウェブアプリケーシ […]
AWS Backup でバックアップした VMware 仮想マシンを Amazon EC2 としてリストアする
VMware 仮想環境 (VMware Cloud on AWS) 上で稼働する仮想マシンを AWS Backup で保護し、Amazon EC2 としてリストアする方法についてご紹介します。AWS Backup を活用すれば、オンプレミス VMware 仮想環境の仮想マシンの災害時の一時的な退避先として Amazon EC2 を利用する、あるいは VMware Cloud on AWS 上の仮想マシンを Amazon EC2 に移行することも可能になります。
AWS Trainium を活用した日本語大規模言語モデルの分散学習と AWS Inferentia2 上での推論環境構築
生成 AI の進化を支える大規模言語モデルの開発及び運用に掛かるコスト、計算機リソースの確保は多くの企業が抱える大きな課題です。AWS では機械学習 (ML) アクセラレーターチップ AWS Trainium、AWS Inferentia2 を自社開発し、これらの課題解決に取り組んでいます。(Anthropic では AWS Trainium、Inferentia の活用を表明しています)
本ブログでは、前半で、AWS Trainium 搭載 Amazon EC2 Trn1 インスタンスを活用した日本語大規模言語モデルの開発事例、大規模分散学習の課題及び実現方法について解説します。
ブログ後半では、公開された日本語大規模モデルを Inferentia2 搭載 Amazon EC2 Inf2 インスタンス上で推論実行する方法について、手順を追って解説します。