Amazon Bedrock の料金
料金設定の概要
Amazon Bedrock は、単一の API を通じて種々の高性能な基盤モデル (FM) を提供するフルマネージドサービスであり、セキュリティ、プライバシー、責任ある AI により生成 AI アプリケーションを構築するために必要な幅広い機能を備えています。
Amazon Bedrock では、モデルの推論とカスタマイズに料金がかかります。推論については、2 つの料金プランからお選びいただけます: 1.オンデマンド: このモードでは、時間ベースの期間に関する確約をすることなく、従量制料金で FM を使用できます。2.プロビジョンドスループット: このモードでは、時間ベースの期間に関する確約をする代わりに、アプリケーションのパフォーマンス要件を満たす十分なスループットをプロビジョニングできます。
料金モデル
高度なツール
料金の詳細
料金は、モダリティ、プロバイダー、モデルによって異なります。詳細な料金を確認するには、モデルプロバイダーを選択してください。
Amazon Bedrock は、Anthropic、Meta、Mistral AI、Amazon などの主要な AI プロバイダーから提供される厳選した基盤モデル (FM) を、オンデマンド推論料金と比較して 50% 低い料金でバッチ推論用に提供しています。モデルのリストについては、こちらをご覧ください。
-
AI21 Labs
-
Amazon
-
Anthropic
-
Cohere
-
Meta Llama
-
Mistral AI
-
Stability AI
-
カスタムモデルインポート
-
AI21 Labs
-
AI21 Labs
オンデマンド料金
AI21 Labs モデル 入力トークン 1,000 個あたりの価格 1,000 出力トークンあたりの料金 Jamba 1.5 Large 0.002 USD 0.008 USD Jamba 1.5 Mini 0.0002 USD 0.0004 USD Jurassic-2 Mid 0.0125 USD 0.0125 USD Jurassic-2 Ultra 0.0188 USD 0.0188 USD Jamba-Instruct 0.0005 USD 0.0007 USD -
Amazon
-
Amazon
-
Anthropic
-
Anthropic
オンデマンド価格とバッチ価格
米国東部 (バージニア北部) と米国西部 (オレゴン)
Anthropic モデル 入力トークン 1,000 個あたりの価格 1,000 出力トークンあたりの料金 1,000 入力トークンあたりの料金 (バッチ) 1,000 出力トークンあたりの料金 (バッチ) Claude 3.5 Sonnet**
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 3.5 Haiku
0.001 USD
0.005 USD
0.0005 USD
0.0025 USD
Claude 3 Opus*
0.015 USD
0.075 USD
0.0075 USD
0.0375 USD
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
Claude 3 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 2.1
0.008 USD
0.024 USD
該当なし
該当なし
Claude 2.0
0.008 USD
0.024 USD
該当なし
該当なし
Claude Instant
0.0008 USD
0.0024 USD
該当なし
該当なし
*Claude 3 Opus は現在、米国西部 (オレゴン) リージョンでご利用いただけます **Claude 3.5 Sonnet の料金は、Claude 3.5 Sonnet の各バージョン (v1 および v2) に適用されます - Claude 3.5 Sonnet v2 は現在、米国西部 (オレゴン) リージョンでご利用いただけます リージョン: 欧州 (ロンドン)
Anthropic モデル 入力トークン 1,000 個あたりの価格 1,000 出力トークンあたりの料金 1,000 入力トークンあたりの料金 (バッチ) 1,000 出力トークンあたりの料金 (バッチ) Claude 3 Sonnet
0.003 USD
0.015 USD
0.0015 USD 0.0075 USD Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD 0.000625 USD
リージョン: 欧州 (チューリッヒ)
Anthropic モデル 入力トークン 1,000 個あたりの価格 1,000 出力トークンあたりの料金 1,000 入力トークンあたりの料金 (バッチ) 1,000 出力トークンあたりの料金 (バッチ) Claude 3.5 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
リージョン: 南米 (サンパウロ)
Anthropic モデル 入力トークン 1,000 個あたりの価格 1,000 出力トークンあたりの料金 1,000 入力トークンあたりの料金 (バッチ) 1,000 出力トークンあたりの料金 (バッチ) Claude 3 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
リージョン: カナダ (中部)
Anthropic モデル 入力トークン 1,000 個あたりの価格 1,000 出力トークンあたりの料金 1,000 入力トークンあたりの料金 (バッチ) 1,000 出力トークンあたりの料金 (バッチ) Claude 3 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
リージョン: アジアパシフィック (ムンバイ)
Anthropic のモデル 入力トークン 1,000 個あたりの価格 1,000 出力トークンあたりの料金 1,000 入力トークンあたりの料金 (バッチ) 1,000 出力トークンあたりの料金 (バッチ) Claude 3 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
リージョン: アジアパシフィック (シドニー)
Anthropic モデル 入力トークン 1,000 個あたりの価格 1,000 出力トークンあたりの料金 1,000 入力トークンあたりの料金 (バッチ) 1,000 出力トークンあたりの料金 (バッチ) Claude 3 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
リージョン: アジアパシフィック (東京)
Anthropic モデル 入力トークン 1,000 個あたりの価格 1,000 出力トークンあたりの料金 1,000 入力トークンあたりの料金 (バッチ) 1,000 出力トークンあたりの料金 (バッチ) Claude Instant
0.0008 USD
0.0024 USD
該当なし
該当なし
Claude 2.0/2.1
0.008 USD
0.024 USD
該当なし
該当なし
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
Claude 3.5 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
リージョン: アジアパシフィック (シンガポール)
Anthropic モデル 入力トークン 1,000 個あたりの価格 1,000 出力トークンあたりの料金 1,000 入力トークンあたりの料金 (バッチ) 1,000 出力トークンあたりの料金 (バッチ) Claude Instant
0.0008 USD
0.0024 USD
0.0004 USD
0.0012 USD
Claude 2.0/2.1
0.008 USD
0.024 USD
0.004 USD
0.012 USD
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
Claude 3.5 Sonnet
0.003 USD
0.015 USD
該当なし
該当なし
リージョン: 欧州 (パリ)
Anthropic モデル 入力トークン 1,000 個あたりの価格 1,000 出力トークンあたりの料金 1,000 入力トークンあたりの料金 (バッチ) 1,000 出力トークンあたりの料金 (バッチ) Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
Claude 3 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
リージョン: 欧州 (フランクフルト)
Anthropic モデル 入力トークン 1,000 個あたりの価格 1,000 出力トークンあたりの料金 1,000 入力トークンあたりの料金 (バッチ) 1,000 出力トークンあたりの料金 (バッチ) Claude Instant
0.0008 USD
0.0024 USD
該当なし
該当なし
Claude 2.0/2.1
0.008 USD
0.024 USD
該当なし
該当なし
Claude 3 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 3.5 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
リージョン: アジアパシフィック (ソウル)
Anthropic モデル 入力トークン 1,000 個あたりの価格 1,000 出力トークンあたりの料金 1,000 入力トークンあたりの料金 (バッチ) 1,000 出力トークンあたりの料金 (バッチ) Claude 3.5 Sonnet
0.003 USD
0.015 USD
該当なし
該当なし
Claude 3 Haiku
0.00025 USD
0.00125 USD
該当なし
該当なし
リージョン: 米国東部 (オハイオ)
Anthropic モデル 入力トークン 1,000 個あたりの価格 1,000 出力トークンあたりの料金 1,000 入力トークンあたりの料金 (バッチ) 1,000 出力トークンあたりの料金 (バッチ) Claude 3.5 Sonnet
0.003 USD
0.015 USD
該当なし
該当なし
Claude 3 Haiku
0.00025 USD
0.00125 USD
該当なし
該当なし
プロビジョンドスループットの料金
米国東部 (バージニア北部) と米国西部 (オレゴン)
Anthropic モデル モデルごとの1時間あたりの価格と
コミットメントなし1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金 6 か月契約の 1 モデルあたりの時間料金 Claude Instant
44.00 USD 39.60 USD
22.00 USD
Claude 2.0/2.1
70.00 USD 63.00 USD
35.00 USD
Anthropic モデル モデルごとの1時間あたりの価格と
コミットメントなし1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金 6 か月契約の 1 モデルあたりの時間料金 Claude Instant
44.00 USD 39.60 USD
22.00 USD
Claude 2.0/2.1
70.00 USD 63.00 USD
35.00 USD
親リージョン: アジアパシフィック (東京)
Anthropic モデル 1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金 6 か月契約の 1 モデルあたりの時間料金 Claude Instant
53.00 USD
29.00 USD
Claude 2.0/2.1
86.00 USD
48.00 USD
AWS リージョン: 欧州 (フランクフルト)
Anthropic モデル 1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金 6 か月契約の 1 モデルあたりの時間料金 Claude Instant
49.00 USD
27.00 USD
Claude 2.0/2.1
79.00 USD
44.00 USD
モデルユニットの詳細については、AWS アカウントチームにお問い合わせください。
-
Cohere
-
Cohere
オンデマンド料金
Cohere モデル 入力トークン 1,000 個あたりの価格 出力トークン 1,000 個あたりの価格 Command 0.0015 USD 0.0020 USD Command-Light 0.0003 USD 0.0006 USD Command R+ 0.0030 USD 0.0150 USD Command R 0.0005 USD 0.0015 USD Embed - English 0.0001 USD 該当なし Embed - Multilingual 0.0001 USD 該当なし モデルのカスタマイズ (微調整) の料金:
Cohere モデル 1000 個のトークンをトレーニングする場合の料金* 各カスタムモデルの 1 か月あたりの保存料金 1 時間あたり 1 モデルユニットに対するカスタムモデルから推測する料金 (契約なしのプロビジョンドスループット料金) Cohere Command
0.004 USD
1.95 USD
49.50 USD
Cohere Command-Light 0.001 USD 1.95 USD
8.56 USD *トレーニングされたトークンの総数 = トレーニングデータコーパス内のトークン数 x エポック数
プロビジョンドスループットの料金
Cohere モデル モデルごとの 1 時間あたりの価格
コミットメントなしで1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金 6 か月契約の 1 モデルあたりの時間料金
Cohere Command
49.50 USD 39.60 USD
23.77 USD
Cohere Command - Light 8.56 USD 6.85 USD
4.11 USD Embed - English 7.12 USD 6.76 USD
6.41 USD Embed - Multilingual 7.12 USD 6.76 USD
6.41 USD モデルユニットの詳細については、AWS アカウントまたは営業チームにお問い合わせください。
-
Meta Llama
-
Meta Llama
Llama 3.2
オンデマンド料金とバッチ料金
Llama 3.1
オンデマンド料金とバッチ料金
モデルのカスタマイズ (微調整) の料金
プロビジョンドスループットの料金
Llama 3
オンデマンド料金
Llama 2
オンデマンド料金
リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)
Meta のモデル 入力トークン 1,000 個あたりの価格 出力トークン 1,000 個あたりの価格 Llama 2 Chat (13B)
0.00075 USD
0.001 USD
Llama 2 Chat (70B) 0.00195 USD
0.00256 USD モデルのカスタマイズ (微調整) の料金
メタモデル 1000 個のトークンをトレーニングする場合の料金* 各カスタムモデルの 1 か月あたりの保存料金 1 時間あたり 1 モデルユニットに対するカスタムモデルから推測する料金 (契約なしのプロビジョンドスループット料金) Llama 2 Pretrained (13B)
0.00149 USD
1.95 USD
23.50 USD
Llama 2 Pretrained (70B) 0.00799 USD
1.95 USD 23.50 USD *カスタムモデルストレージ = 1.95 USD
プロビジョンドスループットの料金
メタモデル 1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金 6 か月契約の 1 モデルあたりの時間料金 Llama 2 Pretrained と Chat (13B)
21.18 USD
13.08 USD
Llama 2 Pretrained (70B) 21.18 USD
13.08 USD *Llama 2 Pretrained モデルは、カスタマイズ後にプロビジョニングされたスループットでのみ利用可能です。
モデルユニットの詳細については、AWS アカウントまたは営業チームにお問い合わせください。
-
Mistral AI
-
Mistral AI
-
Stability AI
-
Stability AI
オンデマンド料金
Stability AI モデル 生成画像あたりの料金 Stable Image Core 0.04 USD SD3 Large 0.08 USD Stable Image Ultra 0.14 USD Stability AI が提供する、前世代の画像モデルは、ステップ数と画像解像度に応じて、画像ごとに料金設定されています。
Stability AI モデル 画像解像度 標準画質 (50ステップ以下) で生成された画像1枚あたりの価格 高品質で生成された画像あたりの料金 (50 ステップ超) SDXL 1.0 1024 x 1024 まで 0.04 USD 0.08 USD プロビジョンドスループットの料金
Stability AI モデル 1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金* 6 か月契約の 1 モデルあたりの時間料金* SDXL 1.0
49.86 USD
46.18 USD
*ベースモデルとカスタムモデルの推論を含みます。
モデルユニットの詳細については、AWS アカウントまたは営業チームにお問い合わせください。
現在、モデルのカスタマイズ (ファインチューニング) は、Amazon Bedrock での Stability AI モデルではサポートされていません。
-
カスタムモデルインポート
-
カスタムモデルインポート
-
Llama
-
マルチモーダル Llama
-
Mistral
-
Mixtral
-
Flan
-
Llama
-
リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.0785 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Llama 3.1 8B 128K モデルには 2 カスタムモデルユニットが必要であり、Llama 3.1 70B 128k モデルには 8 カスタムモデルユニットが必要です。 *5 分単位で請求 -
マルチモーダル Llama
-
リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.0785 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Llama 3.2 11B 128K モデルには 4 カスタムモデルユニットが必要です。 *5 分単位で請求 -
Mistral
-
リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.0785 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Mistral 7B 32K モデルには 1 カスタムモデルユニットが必要です。 *5 分単位で請求 -
Mixtral
-
リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.0785 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Mixtral 8x7B 32K モデルには 4 カスタムモデルユニットが必要です。 *5 分単位で請求 -
Flan
-
リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.0785 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Flan-T5 XL 512 モデルには 1 カスタムモデルユニットが必要です。 *5 分単位で請求
オンデマンド推論の料金:
最初の呼び出しが成功した時点から、モデルコピーがアクティブである期間にわたって、5 分間のウィンドウごとに課金されます。モデルコピーごとの最大スループットと同時実行制限は、入力/出力トークンの組み合わせ、ハードウェアタイプ、モデルサイズ、アーキテクチャ、推論の最適化などの要因によって異なり、モデルのインポートワークフロー中に決定されます。Bedrock は、使用パターンに応じてモデルコピーの数を自動的にスケールします。5 分間にわたって呼び出しがない場合、Bedrock はゼロにスケールダウンし、モデルを呼び出すとスケールアップして元に戻します。スケールアップして元に戻す際に、モデルのサイズによってはコールドスタート期間 (数十秒) が発生する場合があります。推論ボリュームが 1 つのモデルコピーの同時実行制限を継続的に超える場合、Bedrock はモデルコピーの数もスケールアップします。注: インポートされたモデルごとにアカウントあたり 3 つのモデルコピーがデフォルトで最大数に設定されていますが、これは Service Quotas を通じて引き上げることができます。
-
料金アドバンストツール (詳細)
-
Amazon Bedrock のガードレール
-
モデル評価
-
Amazon Bedrock のガードレール
-
Amazon Bedrock のガードレール
ガードレールポリシー*
1,000 テキストユニットあたりの価格**
コンテンツフィルター
0.75 USD
拒否されたトピック
1 USD
コンテキストグラウンディングチェック***
0.1 USD
機密情報フィルター (PII)
0.1 USD
機密情報フィルタ (正規表現)
無料
ワードフィルター
無料
オンデマンド料金
* 各ガードレールポリシーはオプションであり、アプリケーションの要件に基づいて有効にできます。料金は、ガードレールで使用されているポリシーの種類に基づいて発生します。たとえば、ガードレールにコンテンツフィルターと拒否トピックが設定されている場合、これら2つのポリシーには料金が発生しますが、機密情報フィルターに関連する料金は発生しません。
**テキスト単位には最大1000文字まで含めることができます。テキスト入力が 1000 文字を超える場合、それぞれが 1000 文字以下の複数のテキスト単位として処理されます。たとえば、テキスト入力に 5600 文字が含まれている場合、6 テキスト単位で課金されます。*** コンテキストグラウンディングチェックでは、参照ソースとクエリを使用して、モデルの回答がソースに基づいて理由付けされ、クエリに関連しているかどうかを判断します。課金されるテキストユニットの合計数は、ソース、クエリ、およびモデル応答のすべての文字を組み合わせて計算されます。
画像や埋め込みではガードレールはサポートされていません。
-
モデル評価
-
モデル評価
モデル評価では、選択したモデルからの推論について課金されます。自動生成されたアルゴリズムスコアは追加料金なしで提供されます。独自のワークストリームを持ち込むヒューマンベースの評価では、評価におけるモデル推論の料金と、完了したヒューマンタスクごとに 0.21 USD の料金がかかります。
モデル
1,000 入力トークンあたりの料金
1,000 出力トークンあたりの料金
ヒューマンタスクあたりの料金
評価対象として選択されたモデル
選択したモデルに基づく
選択したモデルに基づく
0.21 USD
料金の例
-
AI21 Labs
アプリケーション開発者は Amazon Bedrock に対して次の API 呼び出しを行います: AI21 の Jurrasic-2 Mid モデルに対して、入力テキストの 10,000 トークンの入力を 2,000 トークンの出力にまとめるリクエスト。
発生するコストの合計: 10,000 トークン/1000 x 0.0125 USD + 2,000 トークン/1000 x 0.0125 USD = 0.15 USD
-
Amazon
オンデマンド料金
アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Amazon Titan Text Lite モデルに対して、入力テキストの 1K トークンの入力を 2K トークンの出力にまとめるリクエスト。
発生した 1 時間あたりの総コストは = 2 K トークン/1000 * 0.0003 USD + 1 K トークン/1000 * 0.0004 USD = 0.001 USD です。
アプリケーションデベロッパーが Amazon Bedrock に対して次の API コールを行います。Amazon Titan Image Generator の基本モデルに、標準品質の 1,024 x 1,024 サイズのイメージを 1000 個生成するようにリクエストします。
発生するコストの合計: 1000 画像 x 0.01 USD/画像 = 10 USD
カスタマイズ (微調整と継続的な事前トレーニング) の価格設定
アプリケーション開発者は、1000 組の画像とテキストを使用して Amazon Titan Image Generator モデルをカスタマイズします。トレーニング後、開発者はカスタムモデルでプロビジョニングされたスループットを 1 時間使用して、モデルのパフォーマンスを評価します。微調整されたモデルは 1 か月間保存されます。評価後、開発者はプロビジョニングされたスループット (1mo commit) を使用してカスタマイズされたモデルをホストします。
微調整にかかる月額費用は次のとおりです。微調整トレーニング (0.005 USD* 500* 64)。ここで、0.005 USD は表示される画像あたりの価格、500 USD はステップ数、64 はバッチサイズ + 1 か月あたりのカスタムモデルストレージ (1.95 USD) + 1 時間のカスタムモデル推論 (21 USD) = 160 USD + 1.95 USD + 21 = 182.95 USD
プロビジョンドスループットの料金
アプリケーション開発者は、テキスト要約のユースケースとして、Titan Text Express の 2 つのモデルユニットを 1 か月契約で購入します。
発生する月間コストの合計: 2 モデルユニット x 18.40 USD/時間 x 24 時間 x 31 日間 = 27,379.20 USD
アプリケーションデベロッパーは、Amazon Titan Image Generator の基本モデルのモデルユニットを 1 か月契約で 1 ユニット購入します。
発生した総費用 = 1 モデルユニット* 16.20ドル* 24時間* 31日間 = 12,052.80ドル
-
Anthropic
オンデマンド料金
アプリケーション開発者は、米国西部 (オレゴン) リージョンの Amazon Bedrock に対して次の API コールを行います: Anthropic の Claude モデルに対して、入力テキストの 11K トークンの入力を 4K トークンの出力にまとめるリクエスト。
発生するコストの合計: 11,000 トークン/1000 x 0.008 USD + 4,000 トークン/1000 x 0.024 USD = 0.088 USD + 0.096 USD = 0.184 USD
プロビジョンドスループットの料金
あるアプリケーション開発者が米国西部 (オレゴン) リージョンで Anthropic Claude Instant のモデルユニットを1つ購入しました。
発生する月間コストの合計: 1 モデルユニット x 39.60 USD x 24時間 x 31日 = 29,462.40 USD
-
Cohere
オンデマンド料金
アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Cohere の Command モデルに対して、入力テキストの 6K トークンの入力を 2K トークンの出力にまとめるリクエスト。
発生するコストの合計: 6,000 トークン/1000 * 0.0015 USD + 2,000 トークン/1000 *0.002 USD = 0.013 USD
アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Cohere の Command-Light モデルに対して、入力テキストの 6K トークンの入力を 2K トークンの出力にまとめるリクエスト。
発生するコストの合計 = 6K トークン/1000 * 0.0003 USD + 2K トークン/1000 * 0.0006 USD = 0.003 USD
アプリケーション開発者は、Amazon Bedrock に次の API 呼び出しを行います: Cohere の Embed English モデルまたは多言語モデルに、10K トークンの入力に対して埋め込みを生成するようリクエストします。
発生するコストの合計 = 10K トークン/1000 * 0.0001 USD = 0.001 USD
モデルのカスタマイズ (微調整)
アプリケーション開発者は、1000 トークンのデータを使用して Cohere コマンドモデルをカスタマイズします。トレーニング後、カスタムモデルでプロビジョニングされたスループットを 1 時間使用して、モデルのパフォーマンスを評価します。微調整されたモデルは 1 か月間保存されます。評価後、開発者はプロビジョニングされたスループット (1mo commit) を使用してカスタマイズされたモデルをホストします。
微調整にかかる月額費用は、微調整トレーニング (0.004 USD x 1000) + 1 か月あたりのカスタムモデルストレージ (1.95 USD) + 1 時間のカスタムモデル推論 (49.50 USD) = 55.45 USD
カスタムモデルのプロビジョニングされたスループット (1 か月間のコミット) で発生する月額コスト = 39.60 USD
プロビジョンドスループットの料金
アプリケーションデベロッパーは、テキスト要約のユースケースとして、Cohere Command の 1 モデルユニットを 1 か月の契約で購入します。
発生する月間コストの合計: 1 モデルユニット x 39.60 USD x 24時間 x 31日 = 29,462.40 USD
-
Meta Llama
オンデマンド料金
アプリケーションデベロッパーは、Amazon Bedrock に対して次の API コールを行います: Meta の Llama 2 Chat (13 B) モデルに対して、入力テキストの 2K トークンの入力を 500 トークンの出力にまとめるリクエスト。
発生するコストの合計 = 2K トークン / 1,000 * 0.00075 USD + 500 トークン / 1,000 * 0.001 USD = 0.002 USD
モデルのカスタマイズ (微調整)
アプリケーションデベロッパーは、1000 トークンのデータを使用して Llama 2 Pretrained (70B) モデルをカスタマイズします。トレーニング後、カスタムモデルでプロビジョニングされたスループットを 1 時間使用して、モデルのパフォーマンスを評価します。微調整されたモデルは 1 か月間保存されます。評価後、開発者はプロビジョニングされたスループット (1mo commit) を使用してカスタマイズされたモデルをホストします。
微調整にかかる月額費用は、微調整トレーニング (0.00799 USD x 1000) + 1 か月あたりのカスタムモデルストレージ (1.95 USD) + 1 時間のカスタムモデル推論 (23.50 USD) = 33.44 USD
カスタムモデルのプロビジョニングされたスループット (1 か月間のコミット) で発生する月額コスト = 21.18 USD
プロビジョンドスループットの料金
アプリケーションデベロッパーは、テキスト要約のユースケースとして、Meta Llama 2 の 1 モデルユニットを 1 か月の契約で購入します。
発生する月間コストの合計: 1 モデルユニット x 21.18 USD x 24時間 x 31日 = 15,757.92 USD
-
Mistral AI
オンデマンド料金
アプリケーションデベロッパーは、時間単位で、Amazon Bedrock に対して次の API コールを実行します: 入力テキストの 2K トークンの入力を 1K トークンの出力に要約する、Mistral 7B モデルに対するリクエスト。
発生する時間単位の合計コスト = 2K トークン/1,000 * 0.00015 USD + 1K トークン/1,000 * 0.0002 USD = 0.0005 USD
アプリケーションデベロッパーは、時間単位で、Amazon Bedrock に対して次の API コールを実行します: 入力テキストの 2K トークンの入力を 1K トークンの出力に要約する、Mixtral 8x7B モデルに対するリクエスト。
発生する時間単位の合計コスト = 2K トークン/1,000 * 0.00045 USD + 1K トークン/1,000 * 0.0007 USD = 0.0016 USD
アプリケーションデベロッパーは、時間単位で、Amazon Bedrock に対して次の API コールを実行します: 入力テキストの 2K トークンの入力を 1K トークンの出力に要約する、Mistral Large モデルに対するリクエスト。
発生した 1 時間あたりの合計コストは = 2 K トークン/1000 * 0.008 USD + 1 K トークン/1000 * 0.024 USD = 0.04 USD です。
-
Stability AI
オンデマンド料金
アプリケーション開発者は Amazon Bedrock に対して次の API 呼び出しを行います: SDXL モデルに対して、ステップサイズ 70 (高画質) の 512 x 512 の画像を生成するリクエスト。
発生するコストの合計: 1 画像 x 0.036 USD/画像 = 0.036 USD
アプリケーション開発者は Amazon Bedrock に対して次の API コールを行います: SDXL 1.0 モデルに対して、ステップサイズ 70 (高画質) の 1024 x 1024 の画像を生成するリクエスト。
発生するコストの合計: 1 画像 x 0.08 USD/画像 = 0.08 USD
プロビジョンドスループットの料金
アプリケーション開発者は、SDXL1.0の 1 つのモデルユニットを 1 か月契約で購入します。
発生する合計コスト = 1 * 49.86 USD * 24 時間 * 31 日間 = 37,095.84 USD
-
モデルの評価
モデル評価例 1
オンデマンド料金
あるアプリケーション開発者が、米国東部 (バージニア北部) の AWS リージョンで Anthropic Claude 2.1 と Anthropic Claude Instant を使用して、人間ベースのモデル評価用のデータセットを提出します。データセットには50のプロンプトが含まれており、開発者は各プロンプト-レスポンスセットの評価に1人のワーカーを必要とする(評価ジョブの作成時に「プロンプトごとのワーカー」パラメータとして設定可能)。
この評価ジョブには 50 個のタスクが含まれます (各ワーカーごとにプロンプト/レスポンスのペアごとに 1 つのタスク)。50 個のプロンプトが組み合わされて 5000 個の入力トークンになり、関連する応答が Anthropic Claude Instant の場合は 15000 トークン、Anthropic Claude 2.1 の場合は 20,000 トークンになります。
このモデル評価ジョブには次の料金が発生します:項目 入力トークンの数 1,000 入力トークンあたりの料金 入力のコスト 出力トークンの数 1,000 出力トークンあたりの料金 出力のコスト ヒューマンタスクの数 ヒューマンタスクあたりのコスト ヒューマンタスクのコスト 合計 クロード・インスタント推論 5,000 0.0008 USD 0.004 USD 15000 0.0024 USD 0.036 USD 0.04 USD クロード 2.1 推論 5,000 0.008 USD 0.04 USD 20,000 0.024 USD 0.48 USD 0.52 USD ヒューマンタスク 50 0.21 USD 10.50 USD 10.50 USD 合計 11.06 USD モデル評価例 2
オンデマンド料金
あるアプリケーション開発者が、米国東部 (バージニア北部) の AWS リージョンで Anthropic Claude 2.1 と Anthropic Claude Instant を使用して、人間ベースのモデル評価用のデータセットを提出します。
データセットには 50 個のプロンプトが含まれており、開発者は各プロンプト/応答セットを評価するために 2 人のワーカーを必要とします (評価ジョブの作成で「プロンプトあたりのワーカー数」パラメーターとして設定可能)。この評価ジョブには 100 個のタスクが含まれます (各ワーカーごとにプロンプト/レスポンスのペアごとに 1 つのタスク:2 人の作業者 x 50 個のプロンプト応答セット = 100 個のヒューマンタスク)。
50 個のプロンプトが組み合わされて 5000 個の入力トークンになり、関連する応答が Anthropic Claude Instant の場合は 15000 トークン、Anthropic Claude 2.1 の場合は 20,000 トークンになります。
このモデル評価ジョブには次の料金が発生します:
項目 入力トークンの数 1,000 入力トークンあたりの料金 入力のコスト 出力トークンの数 1,000 出力トークンあたりの料金 出力のコスト ヒューマンタスクの数 ヒューマンタスクあたりのコスト ヒューマンタスクのコスト 合計 クロード・インスタント推論 5,000 0.0008 USD 0.0040 USD 15000 0.0024 USD 0.036 USD 0.04 USD クロード 2.1 推論 5,000 0.008 USD 0.0400 USD 20,000 0.024 USD 0.48 USD 0.52 USD ヒューマンタスク 100 0.21 USD 21.00 USD 21.00 USD 合計 21.56 USD -
Amazon Bedrock のガードレール
例 1: カスタマーサポートチャットボット
アプリケーション開発者は、カスタマーサポートチャットボットを作成し、コンテンツフィルターを使用して有害なコンテンツや拒否されたトピックをブロックし、望ましくないクエリや応答をフィルタリングします。
チャットボットは 1 時間あたり 1000 件のユーザークエリを処理します。各ユーザークエリの平均入力長は 200 文字で、1500 文字の FM 応答を受け取ります。
200 文字の各ユーザークエリは 1 つのテキスト単位に対応します。
1,500 文字の FM 応答は、それぞれ 2 つのテキスト単位に対応します。
1 時間あたりに処理されるテキスト単位 = (1 + 2) * 1000 クエリ = 3000 テキスト単位
コンテンツフィルタと拒否トピックの 1 時間あたりに発生する合計コスト = 3000 * (USD 0.75 + USD 1.00)/1000 = USD 5.25例 2: コールセンターのトランスクリプトの要約
アプリケーション開発者は、ユーザーとサポートエージェント間のチャット記録を要約するアプリケーションを作成します。機密情報フィルターを使用して、生成された10,000件の会話の要約に含まれる個人を特定できる情報(PII)を編集します。
生成された各要約は、4 つのテキスト単位に相当する平均3,500文字です。
10,000 件の会話をまとめるために発生した総コスト = 10000 * 4 * (0.1/1000 ドル) = 4 ドル項目 入力トークンの数 1,000 入力トークンあたりの料金 入力のコスト 出力トークンの数 1,000 出力トークンあたりの料金 出力のコスト ヒューマンタスクの数 ヒューマンタスクあたりのコスト ヒューマンタスクのコスト 合計 クロード・インスタント推論 5,000 0.0008 USD 0.004 USD 15000 0.0024 USD 0.036 USD 0.04 USD クロード 2.1 推論 5,000 0.008 USD 0.04 USD 20,000 0.024 USD 0.48 USD 0.52 USD ヒューマンタスク 100 0.21 USD 21.00 USD 21.00 USD 合計 21.56 USD -
カスタムモデルインポート
料金の例: アプリケーションデベロッパーは、サイズが 8B パラメータ、シーケンス長が 128K である、カスタマイズされた Llama 3.1 タイプのモデルを us-east-1 リージョンにインポートし、1 か月後にそのモデルを削除します。これには 2 つのカスタムモデルユニットが必要です。つまり、2 カスタムモデルユニットが必要であるため、1 分あたりの料金は 0.1570 USD となります。その月の 2 カスタムモデルユニットのモデルストレージコストは 3.90 USD となります。
モデルのインポートには料金はかかりません。最初の呼び出しが成功したのは午前 8 時 3 分で、その時点で計測が開始されます。5 分間の計測ウィンドウは、午前 8 時 3 分~午前 8 時 7 分、午前 8 時 7 分~午前 8 時 11 分などです。ある 5 分間に少なくとも 1 回の呼び出しがあった場合、そのウィンドウはアクティブであるものとみなされ、課金されます。午前 8 時 7 分~午前 8 時 11 分に呼び出しがなかった場合、計測は午前 8 時 11 分に停止します。この場合、請求額は次のように計算されます: 0.1570 USD* 5 分間 * 3 つの 5 分間のウィンドウ = 2.355 USD。