OCI(Oracle Cloud Infrastructure)에서 Document Understanding은 문서 파일에서 텍스트, 테이블 및 기타 키 데이터를 추출할 수 있는 사전 학습된 AI 모델을 제공합니다. 문서에 대해 문서 분류 및 키 값 추출을 수행한 다음, 추출된 데이터를 Oracle Analytics에서 분석의 일부로 사용합니다.
또한 Document Understanding에서는 키 값 추출 및 문서 분류를 위한 사용자정의 모델을 생성할 수 있습니다.
Oracle Analytics에서 데이터 흐름을 사용하여 Document Understanding AI 모델을 데이터에 적용합니다.
Oracle Analytics에서 사용자정의 모델을 사용하기 전에 OCI 콘솔에서 설정 및 구축해야 합니다. 먼저, OCI 데이터 레이블링을 사용하여 모델 학습에 사용할 수 있는 좋은 데이터 집합을 생성하고 사용자정의 모델을 구축합니다. OCI Document Understanding - 사용자정의 모델을(를) 참조하십시오.
문서 분류 모델에서 예제 출력
이 예에서 데이터 흐름은 JPG 형식의 문서에 사전 학습된 문서 분류 모델을 적용하여 해당 모델이 영수증인지 여부를 예측하고 분석 결과를 데이터 집합으로 출력합니다. 데이터 집합에는 "문서 유형"에 대한 RECEIPT 값과 각 문서에 대한 "신뢰도" 예측 레벨이 포함되어 있습니다.
시작하기 전에: