게시된 날짜: Dec 1, 2021

어떤 문서나 이미지에서든 텍스트 및 데이터를 쉽게 추출할 수 있도록 지원하는 기계 학습 서비스인 Amazon Textract가 이제 미국 운전 면허증 및 미국 여권과 같은 자격 증명 문서에서 데이터를 추출하는 전문적인 지원을 제공합니다. 이름 및 주소와 같은 암시적 필드는 물론 생년월일, 발급일, 만료 날짜, ID 번호, ID 유형 등과 같은 명시적 필드를 키-값 쌍 형태로 추출할 수 있습니다. 오늘날까지 현재의 OCR 기반 솔루션은 제한적이었으며, 풍부한 배경 이미지로 인해 모든 필수 필드를 정확하게 추출하는 기능을 제공하지 못하거나 이름과 주소는 물론 이와 관련된 필드를 인식하는 기능을 제공하지 못했었습니다(예를 들어 워싱턴주 ID는 집 주소를 키 "8"로 나열함). 또한 국가 또는 주에 따라 달라지는 ID 디자인 및 형식을 지원하지도 않았습니다.

오늘부터는 템플릿이나 형식이 다른 ID(미국 운전 면허증 및 여권)에서 정보를 빠르고 정확하게 추출할 수 있습니다. Analyze ID API는 다음과 같은 두 가지 범주의 데이터 유형을 반환합니다.
  • 생년월일, 발급일, ID 번호, 제한과 같이 ID에서 제공되는 키-값 쌍
  • 이름, 주소, 발급기관과 같이 연결된 명시적 키가 없을 수 있는 문서의 암시적 필드

이 외에도 응답 내에서 키 이름을 표준화합니다. 예를 들어 운전 면허증에 면허증 번호(LIC#)가 있고 여권에 여권 번호가 있는 경우 Analyze ID 응답은 원시 키(예: LIC#)와 함께 표준화된 키를 “문서 ID”로 반환합니다. 이 표준화를 통해 고객은 동일한 개념에 서로 다른 용어를 사용하는 여러 ID에서 정보를 쉽게 결합할 수 있습니다.

이 새로운 기능에 대해 자세히 알아보려면 단계별 블로그를 읽어보고 지금 시작하거나 문서를 참조하시기 바랍니다. 이 새로운 기능의 요금은 Amazon Textract 요금 페이지에서 확인할 수 있습니다. 

Analyze ID는 2021년 12월 1일부터 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(캘리포니아 북부), 미국 서부(오레곤), GovCloud(미국 동부), GovCloud(미국 서부), 캐나다(중부), 유럽(런던), 유럽(파리), 유럽(아일랜드), 유럽(프랑크푸르트), 아시아 태평양(싱가포르), 아시아 태평양(시드니), 아시아 태평양(서울), 아시아 태평양(뭄바이) AWS 리전에서 제공됩니다. Analyze ID를 시작하려면 http://thinkwithwp.com/textract로 이동하세요.