문서 분류 및 키 값 추출 개요

OCI(Oracle Cloud Infrastructure)에서 Document Understanding은 문서 파일에서 텍스트, 테이블 및 기타 키 데이터를 추출할 수 있는 사전 학습된 AI 모델을 제공합니다. 문서에 대해 문서 분류 및 키 값 추출을 수행한 다음, 추출된 데이터를 Oracle Analytics에서 분석의 일부로 사용합니다.

또한 Document Understanding에서는 키 값 추출 및 문서 분류를 위한 사용자정의 모델을 생성할 수 있습니다.

Oracle Analytics에서 데이터 흐름을 사용하여 Document Understanding AI 모델을 데이터에 적용합니다.

Oracle Analytics는 Document Understanding에서 사용 가능한 여러 사전 학습/사용자정의 AI 모델을 지원합니다.
  • Oracle Analytics에서 지원되는 사전 학습 모델
    • 문서 분류
    • 키 값 추출(영수증, 송장, 운전 면허증, 여권 용도)
  • Oracle Analytics에서 지원되는 사용자정의 모델
    • 사용자정의 문서 분류
    • 사용자정의 키 값 추출

Oracle Analytics에서 사용자정의 모델을 사용하기 전에 OCI 콘솔에서 설정 및 구축해야 합니다. 먼저, OCI 데이터 레이블링을 사용하여 모델 학습에 사용할 수 있는 좋은 데이터 집합을 생성하고 사용자정의 모델을 구축합니다. OCI Document Understanding - 사용자정의 모델을(를) 참조하십시오.

문서 분류 모델에서 예제 출력

이 예에서 데이터 흐름은 JPG 형식의 문서에 사전 학습된 문서 분류 모델을 적용하여 해당 모델이 영수증인지 여부를 예측하고 분석 결과를 데이터 집합으로 출력합니다. 데이터 집합에는 "문서 유형"에 대한 RECEIPT 값과 각 문서에 대한 "신뢰도" 예측 레벨이 포함되어 있습니다.


GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png에 대한 설명이 이어집니다.
.png''

시작하기 전에: