- 機械学習›
- Amazon Polly›
- よくある質問
Amazon Polly のよくある質問
全般
Amazon Polly とは何ですか?
Amazon Polly は、テキストを生きた話し声に変換するサービスです。Amazon Polly は、既存のアプリケーションに優れた会話機能を提供します。モバイルアプリケーションや自動車、各種デバイスやアプライアンスに対して、まったく新しいカテゴリの音声対応製品のチャンスを作り出します。Amazon Polly では、何十種類ものリアルな音声を複数の言語でサポートしているため、最適な音声を選択して、音声対応アプリケーションを多くの地域で配信できます。Amazon Polly は使いやすく、音声に変換したいテキストを Amazon Polly API に送信するだけで、Amazon Polly がすぐにオーディオストリームをアプリケーションに返します。直接再生したり、MP3 などの標準的なオーディオファイル形式で保存したりできます。Amazon Polly では、prosody などの音声合成マークアップ言語 (SSML) タグがサポートされているため、音声のレート、ピッチ、ボリュームを調整できます。Amazon Polly は、大規模かつ低レイテンシーでこれらの利点をすべて実現できる安全なサービスです。また、Amazon Polly が生成した音声をキャッシュしておけば、追加料金なしで再生できます。サインアップすると、Amazon Polly では最初の 1 年間は、1 か月あたり数百万文字を無料で変換できます。Amazon Polly は、従量課金制で、リクエストごとのコストが低く、ストレージ制限もなく音声出力の再利用も可能であるため、どこでも音声合成を実現できるコスト効率に優れた方法です。
Amazon Polly を使用する利点は何ですか?
Amazon Polly を使用すると、アプリケーションで高品質の音声出力を実現できます。コスト効率に優れたこのサービスは、応答時間が非常に短く、ほぼすべてのユースケースで利用できます。ストレージ制限はなく、生成された音声を再利用することもできます。
どのような機能を利用できますか?
標準的な音声合成マークアップ言語 (SSML) を使用して、発音、ボリューム、スピーチ速度など、スピーチの面を管理できます。ニュースキャスタースタイルを使用して、特定のニューラル音声を合成し、テレビやラジオのニュースキャスターのように聞こえるようにすることができます。オーディオストリームに含まれるメタデータに基づいて、ユーザーに対してテキスト内の特定の単語や文が発生された場合に、これを検出できます。これにより、デベロッパーはアバターの口の動きなどのグラフィックのハイライトやアニメーションを、合成音声と同期することができます。会社名、頭字語、外来語、新語など、特定の単語の発音を修正できます。カスタム辞書を使用することで、"P!nk"、"ROTFL"、"C'est la vie" (フランス語以外で発声する場合) の発音を修正できます。
スピーチマークとは何ですか?
スピーチマークは、入力テキストから生成された合成音声を補うように設計されています。このメタデータを合成音声のオーディオストリームとともに使用して、お客様は音声と同期した顔のアニメーションや、カラオケのような単語のハイライトなどの拡張されたビジュアル機能によって、アプリケーションを提供できます。
Amazon Polly では、以下の 4 つの要素を使用してスピーチマークが生成されます。
- 発声する入力テキスト内の文要素を示す Sentence
- テキスト内の単語要素を示す Word
- 発声される音声に対応する唇の形を説明する Viseme
- テキストで使用される SSML 要素を説明する SSML
speech-mark-types パラメーターを指定して synthesize-speech メソッドを使用したときは、スピーチマークが JSON ストリームの形式で提供されます。具体的には、ニューラインで区切られたスタンドアロンの JSON オブジェクトのセットで、上記の 4 つの要素のうち 1 つから 4 つすべてが含まれます。詳細については、Amazon Polly 開発者ガイドを参照してください。
このサービスの最も一般的なユースケースは何ですか?
Amazon Polly では、アプリケーションにリアルな音声機能を追加することで、そのアプリケーションの実用性を向上させます。例えば、E ラーニングや教育の分野では、Amazon Polly のテキスト読み上げ (TTS) 機能を活用したアプリケーションを作成することで、文字を読めない人をサポートできます。Amazon Polly を使用すると、目の見えない人や視覚に障がいのある人のデジタルコンテンツ (電子書籍やニュースなど) の利用を支援できます。公共交通機関や産業用制御システムのお知らせ用システムに Amazon Polly を使用すると、通知や緊急連絡に利用できます。セットトップボックス、スマートウォッチ、タブレット、スマートフォン、IoT デバイスなど、Amazon Polly を利用して音声出力を提供できるデバイスにはさまざまなものがあります。電話ソリューションでは、Amazon Polly を使用して自動音声応答システムの音声を提供できます。クイズゲーム、アニメーション、アバター、ナレーション生成などのアプリケーションは、Amazon Polly のようなクラウドベースの TTS ソリューションにおける一般的なユースケースです。
この製品は、AWS の他の製品とどのように連携しますか?
Amazon Lex と組み合わせると、デベロッパーはアプリケーションに本格的な音声ユーザーインターフェイスを作成できます。Amazon Connect 内で、Amazon Polly の音声はセルフサービスの、クラウドベースのコンタクトセンターサービスの作成に使用されます。さらに、モバイルアプリケーションや IoT (モノのインターネット) ソリューションの開発者は、Amazon Polly を利用して、独自のシステムに音声出力を追加できます。
デバイスで実行するソリューションではなくクラウドベースのテキスト読み上げソリューションを利用する利点は何ですか?
デバイスで実行するテキスト読み上げソリューションでは大量のコンピューティングリソースが必要であり、特に、CPU 性能、RAM、ディスクスペースがデバイスで使用可能になっている必要があります。そのため、開発コストが高くなり、タブレットやスマートフォンなどのデバイスの電力消費も高くなります。これに対して、クラウドでテキスト読み上げ変換を実行すると、ローカルで必要なリソースが劇的に減ります。これにより、利用可能なすべての言語と音声を、実現可能な最高の品質でサポートできます。さらに、音声の修正と機能強化が行われるとき、すぐにすべてのエンドユーザーが利用できるようになり、デバイスで追加の更新を行う必要がありません。クラウドベースのテキスト読み上げ (TTS) はプラットフォームに依存しないため、開発にかかる時間と労力を最小化します。
Amazon Polly の使用を開始するにはどうすればよいですか?
AWS アカウントにログインして、Amazon Polly コンソール (AWS コンソールの一部) に移動するだけです。コンソールを使用して任意のテキストを入力し、生成された音声を聞いたり、オーディオファイルとして保存したりできます。
このサービスはどのリージョンで利用できますか?
Amazon Polly の標準音声をサポートするすべてのリージョンについては、AWS リージョン別サービスリストを参照してください。ニューラル音声は、米国東部 (バージニア北部)、米国西部 (オレゴン)、カナダ (中部)、アジアパシフィック (東京)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アフリカ (ケープタウン)、欧州 (ロンドン)、欧州 (フランクフルト)、欧州 (アイルランド)、および AWS GovCloud (米国西部) AWS リージョンの次のサブセットでサポートされています。
サポートされているプログラミング言語は何ですか?
Amazon Polly では、AWS SDK (Java、Node.js、.NET、PHP、Python、Ruby、Go、C++) および AWS Mobile SDK (iOS/Android) に含まれるすべてのプログラミング言語がサポートされます。また、Amazon Polly では HTTP API もサポートされるため、独自のアクセスレイヤーを実装できます。
サポートされているオーディオ形式は何ですか?
Amazon Polly では、ほぼリアルタイムでユーザーにオーディオをストリーミングできます。また、さまざまなサンプリングレートから選択して、アプリケーション向けに帯域幅と音質を最適化できます。Amazon Polly では、MP3、Vorbis、raw PCM のオーディオストリーム形式がサポートされています。
サポートされている言語にはどのようなものがありますか?
Amazon Polly がサポートする言語の詳細な一覧はドキュメントをご覧ください。
Amazon Polly には AWS サービス制限が適用されますか?
AWS リソースの可用性を確保し、請求に関する問題が新しいお客様に発生するリスクをできる限り抑えるため、AWS ではアカウントごとにサービス制限を設定しています。Amazon Polly を使用してアプリケーションで高品質の音声出力を利用する場合は、スロットリング、運用、音声合成マークアップ言語 (SSML) の使用などにデフォルトのサービス制限が適用されます。詳細については、「Amazon Polly デベロッパーガイド」の「Limits in Amazon Polly」をご覧ください。AWS Batch を使って効率的にバッチ処理を行うなど、Amazon Polly と AWS の他のサービスを組み合わせることにより、ほとんどの場合、Amazon Polly をサービス制限内で利用できます。
Amazon Polly は HIPAA 認定を受けていますか?
A: Amazon Polly は HIPAA 使用可能なサービスで、AWS Business Associate Addendum (AWS BAA) でカバーされています。AWS BAA をお使いの場合、Amazon Polly は貴社の保護医療情報 (Protected Health Information、PHI) を AWS BAA の契約条件で許される範囲でのみ使用、開示、保持し、Amazon Polly FAQ のデータプライバシーセクションに記載のものは適用されません。
Amazon Polly ブランド音声の使用を開始するにはどうすればよいですか?
Amazon Polly を利用してブランド音声を構築することにご興味がある場合は、AWS アカウントマネージャーにお問い合わせいただくか、または詳細について当社までお問い合わせください。
ブランド音声を構築するためのコストとタイムラインはどうなっていますか?
すべての音声はユニークであるため、ブランド音声エンゲージメントの正確な範囲を決めるために、お客様の目標についてより多くを学ぶ必要があります。Amazon Polly を利用してブランド音声を構築することにご興味がある場合は、AWS アカウントマネージャーにお問い合わせいただくか、または詳細について当社までお問い合わせください。
請求
Amazon Polly のコストはどれくらいですか?
最新の料金情報については、Amazon Polly の料金ページを参照してください。
何度も再生される静的な音声プロンプトを生成するためにこのサービスを使用できますか?
はい、できます。このサービスではこの点についての制限はありません。また、追加のコストも発生しません。
一斉通知システム (鉄道の駅など) で使用するコンテンツを生成するためにこのサービスを使用できますか?
はい、できます。このサービスではこの点についての制限はありません。また、追加のコストも発生しません。
合成する文字を 1,000 文字リクエストし、同じ 1,000 文字でスピーチマークをリクエストした場合、2,000 文字分課金されますか?
はい。音声またはスピーチマーク用のすべてのリクエストが、サービスに送信した文字数に基づいて課金されます。
Amazon Polly は AWS の無料利用枠で利用できますか?
はい。AWS 無料利用枠の一環として、Amazon Polly を無料で開始できます。サインアップしていただくと、Amazon Polly を初めて使用するお客様は、最初の 12 か月間は 1 か月あたり数百万文字を無料で利用できます。最新の料金情報については、Amazon Polly の料金ページを参照してください。
価格には税金が含まれていますか?
税金の詳細については、アマゾン ウェブ サービス税務ヘルプを参照してください。
データプライバシー
Amazon Polly で処理されたテキスト入力は保存されますか? また、AWS でどのように使用されますか?
Amazon Polly は、サービスの提供と保守、Amazon Polly や他の Amazon 機械学習/人工知能技術の品質の向上のためにのみ、サービスによって処理されたテキストの入力を保存して使用することができます。お客様のコンテンツを使用することは、関連テクノロジーの開発やトレーニングなど、Amazon Polly のサービスを継続的に改善するために重要です。AWS では、お客様のコンテンツに含まれる個人情報を使用して、お客様やお客様のエンドユーザーを製品、サービス、またはマーケティングのターゲットにすることはありません。AWS の最優先事項は、お客様からの信頼、プライバシー、およびお客様のコンテンツのセキュリティです。また、AWS では、転送中や保管時の暗号化など、お客様のコンテンツへの不正アクセスやお客様のコンテンツの公開を防ぐように設計された、高度で信頼できる技術的および物理的な規制を行っています。さらに、AWS がデータを使用する場合はお客様との契約を確実に遵守します。詳細については、https://thinkwithwp.com/compliance/data-privacy-faq/ を参照してください。AWS Organizations opt-out policy を使うことで、Amazon Polly や他の Amazon 機械学習/人工知能技術の品質の向上を目的として、お客様のコンテンツが保存されないようにオプトアウトすることができます。オプトアウトする方法の詳細については、「AI サービスのオプトアウトポリシーの管理」をご参照ください。
どのようなユーザーが Amazon Polly によって処理および保存されたコンテンツにアクセスできますか?
Amazon Polly で処理されたコンテンツにアクセスできるのは承認された従業員のみです。AWS の最優先事項は、お客様からの信頼、プライバシー、およびお客様のコンテンツのセキュリティです。また、AWS では、転送中や保管時の暗号化など、お客様のコンテンツへの不正アクセスやお客様のコンテンツの公開を防ぐように設計された、高度で信頼できる技術的および物理的な規制を行っています。さらに、AWS がデータを使用する場合はお客様との契約を確実に遵守します。詳細については、https://thinkwithwp.com/compliance/data-privacy-faq/ を参照してください。
Amazon Polly によって処理および保存されたコンテンツは私が引き続き所有しますか?
お客様は常に自分のコンテンツの所有権を保持します。AWS では、お客様のコンテンツをお客様の同意なく使用することはありません。
Amazon Polly によって処理されたコンテンツは、Amazon Polly を利用している AWS リージョンの外に移動されますか?
Amazon Polly で処理されたすべてのコンテンツは、お客様が Amazon Polly を使用している AWS リージョン内で暗号化され、保管されます。Amazon Polly で処理されたコンテンツの一部は、Amazon Polly のカスタマーエクスペリエンスやその他の Amazon 機械学習/人工知能技術の継続的な改善と開発に関連する場合のみ、別の AWS リージョンに保存されることがあります。Amazon Polly や他の Amazon 機械学習/AI技術の品質の向上を目的として、お客様のコンテンツが保存されないようにオプトアウトする場合は、AWS Supportまでお問い合わせください。他の AWS リージョンにお客様のコンテンツが保存されることはありません。AWS の最優先事項は、お客様からの信頼、プライバシー、およびお客様のコンテンツのセキュリティです。また、AWS では、転送中や保管時の暗号化など、お客様のコンテンツへの不正アクセスやお客様のコンテンツの公開を防ぐように設計された、高度で信頼できる技術的および物理的な規制を行っています。さらに、AWS がデータを使用する場合はお客様との契約を確実に遵守します。詳細については、https://thinkwithwp.com/compliance/data-privacy-faq/ を参照してください。
13 歳未満のお子様を対象としていて、Children’s Online Privacy Protection Act (COPPA) を遵守する必要があるウェブサイト、プログラム、その他のアプリケーションに関連して Amazon Polly を利用することはできますか?
必要な注意の提供および COPPA に基づく証明可能な親の同意の取得の義務を含む Amazon Polly サービス条件の順守を前提として、全体でまたは部分的に 13 歳未満のお子様を対象としたウェブサイト、プログラム、またはその他のアプリケーションに関連して Amazon Polly を使用することができます。
Polly レコーディングの所有者は誰ですか?
お客様と AWS との間で、Polly の出力はお客様に帰属します。第三者に帰属するテキストを Polly に入力する場合は、その権限の取得をお願いしています。詳細については、当社のカスタマーアグリーメントと「サービス利用者コンテンツ」の取扱方法をご覧ください
自分のウェブサイト、プログラム、またはアプリケーションが COPPA の対象かどうかを知るにはどうすればよいですか?
COPPA の要件についての情報、およびお客様のウェブサイト、プログラム、その他のアプリケーションが COPPA の対象かどうかを確認するためのガイダンスについては、米連邦取引委員会が提供および管理するリソースを直接参照してください。このサイトには、サービスの全体または一部が 13 歳未満の子どもを対象としているかどうかを確認する方法に関する情報も記載されています。