Amazon Web Services ブログ
Category: Amazon SageMaker
AWS Trainium を活用した日本語大規模言語モデルの分散学習と AWS Inferentia2 上での推論環境構築
生成 AI の進化を支える大規模言語モデルの開発及び運用に掛かるコスト、計算機リソースの確保は多くの企業が抱える大きな課題です。AWS では機械学習 (ML) アクセラレーターチップ AWS Trainium、AWS Inferentia2 を自社開発し、これらの課題解決に取り組んでいます。(Anthropic では AWS Trainium、Inferentia の活用を表明しています)
本ブログでは、前半で、AWS Trainium 搭載 Amazon EC2 Trn1 インスタンスを活用した日本語大規模言語モデルの開発事例、大規模分散学習の課題及び実現方法について解説します。
ブログ後半では、公開された日本語大規模モデルを Inferentia2 搭載 Amazon EC2 Inf2 インスタンス上で推論実行する方法について、手順を追って解説します。
AWS Weekly Roundup:Amazon Bedrock に Anthropic’s Claude 3 Opus、Amazon SageMaker JumpStart に Meta Llama 3、その他(2024 年 4 月 22 日)
AWS Summit は、世界中のさまざまな場所でイベントが開催されるなど、世界を揺るがし続けています。AWS […]
Extension for Stable Diffusion on AWS で大規模に画像生成 AI を活用する
AWS では、Extension for Stable Diffusion on AWS というソリューションを提供しています。このソリューションは OSS の Stable Diffusion Web UI の拡張機能で、モデルのファインチューニングと推論をクラウド上のリソースにオフロードすることで、複数ユーザーによる大規模な利用を可能にします。この拡張機能を使用すると、お客様は Amazon SageMaker 上で Stable Diffusion のモデルトレーニング、ファインチューニング、推論を簡単に実行できます。SageMaker のマネージドな分散学習と高性能の GPU インスタンスを活用することで、必要な時だけ高パフォーマンスのリソースを利用できます。また、 CloudFormation テンプレートを使ってリソースをプロビジョニングすることで、手動設定に伴う複雑さやミスを回避できます。
AWS Weekly Roundup – AWS Chips Taste Test、生成 AI に関する最新情報、Community Days など – 2024 年 4 月 1 日
4月1日はエイプリルフールです。約 10 年前、一部のテクノロジー企業は、読者を喜ばせるために、面白いが、実行 […]
AWS Weekly Roundup — Amazon Bedrock での Claude 3 Haiku の使用、AWS CloudFormation 最適化など — 2024 年 3 月 18 日
3月18日週はストレージの話題からお届けします。 3月11日週、Amazon Simple Storage S […]
データと AI でサプライチェーンの価値を引き出す
先月、2024 年のサプライチェーンについての予測ブログを共有しました。 このブログでは、複数のシステムに分散 […]
Amazon SageMaker JumpStartによるエンドポイントデプロイのベンチマークと最適化
大規模言語モデル (LLM) をデプロイする場合、機械学習 (ML) の担当者は通常、モデルサービングのパフォ […]
32,000トークン対応の商用利用可能な日本語チャットモデル CyberAgentLM2 をワンクリックで FineTune とデプロイ
このたび株式会社サイバーエージェントから公開されている大規模言語モデルである CyberAgentLM2-7B-Chat (CALM2-7B-Chat) が JumpStart から利用できるようになりました。今回 Amazon SageMaker Jumpstart から利用できるようになったモデルは、11月に同社から発表された次世代の CALM2 シリーズのチャット用途向けの CALM2-7B-Chat です。このモデルは 1.3 兆トークンの日本語と英語の公開データセットで学習された Transformer ベース(Llama)の CyberAgentLM2-7B (CALM2-7B) をチャット向けに教師有り学習でファインチューニングしたモデルです。入出力の長さとして 32,000 トークンに対応しており、日本語の文章として約 50,000 文字を一度に処理することができます。モデルは商用利用可能な Apache License 2.0 で提供されています。
八丈町立富士中学校:生成AIを活用したオリジナルチャットボットの制作
生成AIが急速に普及する中、文部科学省が2023年7月に「初等中等教育段階における生成AIの利用に関する暫定的 […]
AWSのサーバーレスと機械学習のサービスを活用した列車遅延予測機能の追加とその精度向上(小田急電鉄様の取り組み)
本投稿は小田急アプリや他社サービスなどに連携する列車遅延予測機能の追加とその精度向上の取り組みについて、実際に […]