문서 분류 및 키 값 추출 수행

ML(머신 러닝) 또는 AI(인공 지능) 전문 지식 없이도 사전 구축된 OCI Document Understanding 모델을 사용하여 애플리케이션에 문서 분류 및 키 값 추출을 구축할 수 있습니다. 예를 들어, 문서 분류를 사용하여 여권, 운전 면허증, 영수증 및 송장을 식별할 수 있습니다.

문서가 10,000개 미만이면 해당 문서를 하나의 데이터 흐름으로 처리할 수 있습니다. 문서가 10,000개를 초과하는 경우 각 버킷을 처리할 별도의 데이터 흐름을 생성(즉, 각 버킷에 대해 별도의 데이터 집합을 사용)하고, 시퀀스를 사용하여 데이터 흐름을 순서대로 처리합니다. 데이터 흐름 시퀀스를 사용하여 데이터 처리을(를) 참조하십시오.
필요 조건:
  • 관리자에게 Oracle Analytics 인스턴스가 OCI Document Understanding과 통합되어 있는지 확인하도록 요청합니다.
  • 분석할 문서를 참조하는 데이터 집합을 준비하여 Oracle Analytics로 업로드합니다. OCI Document Understanding 모델에서 문서 분석 준비을(를) 참조하십시오.
  1. Oracle Analytics 페이지에서 생성을 누른 다음 데이터 흐름을 누릅니다.
  2. 분석할 문서에 링크되는 데이터 집합을 선택한 다음 추가를 누릅니다.

  3. 데이터 흐름 편집기에서 단계 추가(+)를 누릅니다.
  4. 데이터 흐름 단계 창에서 AI 모델 적용을 두 번 누르고 사용할 모델을 선택합니다.
    예를 들어, 사전 학습 문서 분류를 선택하여 여권을 식별할 수 있습니다.
  5. AI 모델 적용에서 입력 섹션으로 이동하고 입력 열입력 유형 매개변수를 구성합니다.
    • 버킷별로 소스 문서를 참조하는 경우 입력 열에서 URL을 선택하고 입력 유형에서 버킷을 선택합니다.

    • 개별적으로 소스 문서를 참조하는 경우 입력 열에서 파일 위치를 선택하고 입력 유형에서 문서를 선택합니다.
  6. 데이터 흐름 편집기에서 단계 추가(+)를 누르고 데이터 저장을 선택합니다.
  7. 이름에 출력 데이터 집합의 이름을 입력합니다.
    예를 들어, 데이터 집합을 '여권 식별 분석 결과'라고 할 수 있습니다.
  8. 데이터 저장 위치 필드에서 출력 데이터 집합에 대한 위치를 지정합니다.
  9. 저장을 누르고 데이터 흐름의 이름을 입력한 후 확인을 누릅니다.
  10. 데이터 흐름 실행을 누릅니다.
데이터 흐름이 분석을 완료하면 단계 7에서 지정한 데이터 집합을 엽니다.

생성된 데이터 집합을 찾으려면 Oracle Analytics 홈 페이지에서 데이터, 데이터 집합으로 차례로 이동합니다.
GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png에 대한 설명이 이어집니다.
.png''

생성된 결과에 대한 자세한 내용은 OCI Document Understanding 모델에 대해 생성된 출력 데이터을(를) 참조하십시오.