Amazon Web Services ブログ

Amazon Comprehend が日本語に対応しました

みなさん、こんにちは。アマゾン ウェブ サービス ジャパン、プロダクトマーケティング

シニアエバンジェリストの亀田です。

Amazon Comprehendが日本語に対応しましたのでお知らせいたします。2019年11月7日時点で東京リージョンには対応しておらず、以下のリージョンで日本語対応の機能を使うことになります。

EU (ロンドン)
EU (アイルランド)
アジアパシフィック (シンガポール)
アジアパシフィック (シドニー)
EU (フランクフルト)
米国東部 (バージニア北部)
米国東部 (オハイオ)
カナダ (中部)
米国西部 (オレゴン)

Amazon Comprehend

機械学習を使用してテキスト内でインサイトや関係性を検出する自然言語処理 (NLP) サービスであり、その利用において、機械学習の複雑な知識や経験は必要なくご利用いただけることが特徴です。

一般的にテキストデータは構造化されておらず、法則性を見出すことが困難となるため、その分析には大きな労力を伴います。その一方で、テキストデータには膨大な量の潜在的な知見が存在しています。お客様の E メール、サポートチケット、製品レビュー、ソーシャルメディア、広告コピーが、ビジネス強化の役に立つケースがあります。

Amazon Comprehend は機械学習を使用して、構造化されていないデータのインサイトと関係を明らかにします。このサービスは、テキストの言語を識別し、キーフレーズ、場所、人物、ブランド、またはイベントを抽出し、テキストがどの程度肯定的か否定的かを理解し、トークン分割や品詞を使用してテキストを分析し、テキストファイルのコレクションをトピックごとに自動的に整理します。

ユースケースの例:

例えば実際のユースケースとして、ニュース記事の自動分類などがあります。

Amazon S3に保存されている記事をComprehendで分析を行い、テーマ別にドキュメントを整理して分類し、同じテーマに関連する他の記事を読者に推奨するなどの自動化を行うことができます。

実際にやってみましょう

例えば、2019年7月1日に私がアップした以下の記事を分析してみます。

AWS Service Quotas がリリースされました

https://thinkwithwp.com/jp/blogs/news/aws-service-quotas/

1.マネージメントコンソールにアクセスして、[Launch Amazon Comprehend]を押します。マネージメントコンソールから簡易的なテストが行えるようになっていますが、現在5000bytesの制限があるのでご注意ください。5000文字ではなく5000bytesの制限です。

それ以上のテキストの解析は、S3バケット保存したテキストを読み込む形となります。

2. [Input Text]に記事の本文をコピーペーストして、[Analyze]を押します。

3. 一瞬で分析結果が下に出力されます。

少し分析を見てみましょう。デフォルトで使用しているにもかかわらず、高い精度でキーワードを認識していることがわかります。

API経由で処理をした場合、以下のようにJSON形式で分析が戻されます。

感情は以下のように、中立として判断されました。

Key Phraseの分析では、その記事が伝えたいキーワードなどを抽出してくれますのでいろいろ試してみてください。

– シニアエバンジェリスト 亀田