投稿日: May 21, 2021
Amazon Rekognition は、オブジェクトやコンセプト、人、顔、不適切なコンテンツを識別し、テキストを検出できる、機械学習を利用した画像および動画分析サービスです。Rekognition テキスト検出は、画像内のテキストを検出して読み取り、見つかった各単語のバウンディングボックスを返します。本日より、Rekognition を使用した画像内での検出での単語数の制限が、これまでの 50 個から、最大 100 個に引き上げられました。さらに、特に現在正しく拒否されている判読できないテキストが含まれている場合に、より高い精度が得られます。最後に、各テキスト検出 API 呼び出しの平均レイテンシーは最大 70% 削減されます。
画像内のテキスト検出は、複数のユースケースで活用できます。最初に、テキスト検出はコンテンツのモデレーションおよびコンテンツのマスキングのワークフローに使用できます。検出されたテキストは、不適切または望ましくない語句の独自のリストと照合できます。あるいは、検出されたテキストバウンディングボックスエリアを使用して、機密性の高いテキスト情報をマスキングすることができます。次に、テキスト検出はマーケティング資産の分析と検索に役立ちます。例えば、特定の単語、テキストの配置、およびテキストサイズがキャンペーンのパフォーマンスにどのように影響するかを理解したり、デジタル資産管理 (DAM) システムで特定のキーワードやキャプションを使用して画像や動画のアセットを簡単に検索したりできます。最後に、マッピングや自動車アプリケーションでテキスト検出を使用して、道路標識の文字を読み取ることができます。
これらの改善は、追加コストなしですべてのお客様にご利用いただけるようになりました。Rekognition コンソールにアクセスするか、最新の AWS SDK をダウンロードして、アプリケーションの構築を開始しましょう。Amazon Rekognition を使用したテキスト検出の詳細については、ドキュメントとよくある質問を参照してください。
変更 8/25/2021 – 優れたエクスペリエンスを保証するために、この投稿の期限切れリンクが更新されたか、元の投稿から削除されました。