Veröffentlicht am: Apr 21, 2022
Amazon Textract ist ein Machine-Learning-Service, der automatisch Text, Handschrift und Daten aus Dokumenten oder Bildern extrahiert. Textract bietet Ihnen jetzt die Flexibilität, die Daten, die Sie aus den Dokumenten extrahieren müssen, mit den neuen Abfragefunktionen innerhalb der Analyze Document API zu spezifizieren. Sie brauchen die Struktur der Daten im Dokument (Tabelle, Formular, implizites Feld, verschachtelte Daten) nicht zu kennen und müssen sich keine Gedanken über Abweichungen zwischen verschiedenen Dokumentversionen und -formaten machen. Queries nutzt eine Kombination aus visuellen, räumlichen und sprachlichen Hinweisen, um die gesuchten Informationen mit hoher Genauigkeit zu extrahieren.
Herkömmliche OCR-Lösungen haben Schwierigkeiten beim genauen Extrahieren von Daten aus den meisten unstrukturierten und halbstrukturierten Dokumenten, da die Daten in den verschiedenen Versionen und Formaten dieser Dokumente sehr unterschiedlich aufgebaut sind. Sie müssen einen benutzerdefinierten Nachbearbeitungscode implementieren oder die aus diesen Dokumenten extrahierten Informationen manuell überprüfen. Außerdem müssen Sie die gesamte OCR-Ausgabe analysieren, um die Informationen zu extrahieren, die Sie für Ihre Geschäftsprozesse benötigen. Mit Queries können Sie die benötigten Informationen in Form von Fragen in natürlicher Sprache angeben (z. B. „Wie lautet der Name des Kunden“) und erhalten die genauen Informationen (z. B. „John Doe“) als Teil der API-Antwort. Mit Queries können Sie außerdem jeder Frage einen Alias zuweisen, was die Integration der Ergebnisse in Ihre nachgelagerten Systeme erleichtert. Darüber hinaus ist Queries auf eine Vielzahl von unstrukturierten, halbstrukturierten und strukturierten Dokumenten vortrainiert. Einige Beispiele sind Gehaltsabrechnungen, Kontoauszüge, W-2s, Kreditanträge, Schuldbriefe, Impf- und Versicherungskarten.
Weitere Informationen über diese neue Funktion können Sie der Schritt-für-Schritt-Anleitung in unserem Blog oder der Dokumentation entnehmen. Die Preise für diese neue Funktion sind auf der Preisseite zu Amazon Textract verfügbar.
Analyze Document Queries von Textract wird ab dem 31. März 2022 in den Retionen USA Ost (Ohio), USA Ost (Nord-Virginia), USA West (Nordkalifornien), USA West (Oregon), Asien-Pazifik (Mumbai), Asien-Pazifik (Seoul), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney), Kanada (Zentral), Europa (Frankfurt), Europa (Irland), Europa (London), Europa (Paris), AWS GovCloud (USA-Ost) und AWS GovCloud (USA-West) verfügbar sein. Klicken Sie hier, um mit Analyze Document Queries zu starten.