문서 분류 및 키 값 추출 수행

ML(머신 러닝) 또는 AI(인공 지능) 전문 지식 없이도 사전 학습된 OCI Document Understanding 모델을 사용하여 애플리케이션에 문서 분류 및 키 값 추출을 구축할 수 있습니다. 예를 들어, 문서 분류를 사용하여 여권, 운전 면허증, 영수증 및 송장을 식별할 수 있습니다.

: OCI Document Understanding은 현재 영어만 지원합니다. Document Understanding에 대한 제한을(를) 참조하십시오.
사전 학습 모델에 문서가 10,000개 미만이거나 사용자정의 모델에 문서가 2,000개 미만이면 단일 데이터 흐름으로 처리할 수 있습니다. 이 제한을 초과하는 경우 각 버킷을 처리할 별도의 데이터 흐름을 생성(즉, 각 버킷에 대해 별도의 데이터 집합을 사용)하고, 시퀀스를 사용하여 데이터 흐름을 순서대로 처리합니다. 데이터 흐름 시퀀스를 사용하여 데이터 처리을(를) 참조하십시오.
필요 조건:
  • 관리자에게 Oracle Analytics 인스턴스가 OCI Document Understanding과 통합되어 있는지 확인하도록 요청합니다.
  • 분석할 문서를 참조하는 데이터 집합을 준비하여 Oracle Analytics로 업로드합니다. OCI Document Understanding 모델에서 문서 분석 준비을(를) 참조하십시오.
  1. 홈 페이지에서 생성, 데이터 흐름을 차례로 누릅니다.
  2. 분석할 문서에 링크되는 데이터 집합을 선택한 다음 추가를 누릅니다.

  3. 데이터 흐름 편집기에서 단계 추가(+)를 누릅니다.
  4. 데이터 흐름 단계 창에서 AI 모델 적용을 두 번 누르고 사용할 모델을 선택합니다.
    예를 들어, 사전 학습 문서 분류를 선택하여 여권을 식별할 수 있습니다.
  5. AI 모델 적용에서 입력 섹션으로 이동하고 입력 열입력 유형 매개변수를 구성합니다.
    • 버킷별로 소스 문서를 참조하는 경우 입력 열에서 URL을 선택하고 입력 유형에서 버킷을 선택합니다.

    • 개별적으로 소스 문서를 참조하는 경우 입력 열에서 파일 위치를 선택하고 입력 유형에서 문서를 선택합니다.
  6. 데이터 흐름 편집기에서 단계 추가(+)를 누르고 데이터 저장을 선택합니다.
  7. 이름에 출력 데이터 집합의 이름을 입력합니다.
    예를 들어, 데이터 집합을 '여권 식별 분석 결과'라고 할 수 있습니다.
  8. 데이터 저장 위치 필드에서 출력 데이터 집합에 대한 위치를 지정합니다.
  9. 저장을 누르고 데이터 흐름의 이름을 입력한 후 확인을 누릅니다.
  10. 데이터 흐름 실행을 누릅니다.
데이터 흐름이 분석을 완료하면 단계 7에서 지정한 데이터 집합을 엽니다.

생성된 데이터 집합을 찾으려면 Oracle Analytics 홈 페이지에서 데이터, 데이터 집합으로 차례로 이동합니다.
GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png에 대한 설명이 이어집니다.
.png''

생성된 결과에 대한 자세한 내용은 OCI Document Understanding 모델에 대해 생성된 출력 데이터을(를) 참조하십시오.