OCI Vision 및 OCI Generative AI로 송장 이미지 자동화하기

소개

기업은 공급업체 및 서비스 제공업체로부터 스캔한 이미지 또는 PDF로 인해 수천 건의 송장을 구조화되지 않은 형식으로 수신하는 경우가 많습니다. 송장 번호, 고객 이름, 구매 품목 및 총 금액과 같은 송장에서 데이터를 수동으로 추출하는 것은 시간이 많이 걸리고 오류가 발생하기 쉬운 프로세스입니다.

이러한 처리 지연은 미지급금 주기 및 현금 흐름 가시성에 영향을 줄 뿐만 아니라 규정 준수, 감사 및 보고에 병목 현상이 발생합니다.

이 사용지침서에서는 수신 송장 이미지에 대해 Oracle Cloud Infrastructure(OCI)의 버킷을 모니터링하고, OCI Vision을 사용하여 텍스트 콘텐츠를 추출한 다음, OCI Generative AI(LLM)를 적용하여 송장 번호, 고객, 항목 목록과 같은 구조화된 회계 데이터를 추출하는 자동화된 파이프라인을 구현하는 방법을 설명합니다.

이 자습서에 사용된 OCI 서비스는 다음과 같습니다.

서비스 용도
OCI Vision 업로드된 송장 이미지에 대해 OCR을 수행합니다.
OCI 생성형 AI 몇 샷 프롬프트를 사용하여 원시 OCR 텍스트에서 구조화된 JSON 데이터를 추출합니다.
OCI 오브젝트 스토리지 입력 송장 이미지 및 출력 JSON 결과를 저장합니다.

목표

필수 조건

작업 1: Python 패키지 구성

  1. 다음 명령을 사용하여 requirements.txt 파일을 실행합니다.

    pip install -r requirements.txt
    
  2. Python 스크립트(main.py)를 실행합니다.

  3. 송장 이미지(예: .png, .jpg)를 입력 버킷에 업로드합니다.

  4. 이미지가 처리되고 추출된 JSON이 출력 버킷에 저장될 때까지 기다립니다.

작업 2: 코드 이해

작업 3: 코드 실행

다음 명령을 사용하여 코드를 실행합니다.

python main.py

작업 4: 제안 사항 테스트

  1. 합법적인 제품 라인 및 고객 이름과 함께 실제 또는 더미 송장을 사용합니다.

  2. 입력 버킷에서 여러 이미지를 순서대로 업로드하여 자동 처리를 확인합니다.

  3. OCI 콘솔에 로그인하고 오브젝트 스토리지로 이동하여 두 버킷의 결과를 확인합니다.

참고: 이 자습서에서는 속성 및 처리의 복잡성과 이 사례를 해결하기 위해 프롬프트가 생성된 방법을 설명하기 위해 사용되는 샘플이 브라질 송장입니다.

송장

작업 5: 예상 출력 보기

업로드된 각 송장 이미지에 대해 처리된 출력 버켓 파일을 살펴보십시오. 해당 .json 파일은 다음 이미지와 같이 구조화된 콘텐츠로 생성됩니다.

img.png

참고:

승인

추가 학습 자원

docs.oracle.com/learn에서 다른 랩을 탐색하거나 Oracle Learning YouTube 채널에서 더 많은 무료 학습 콘텐츠에 액세스하세요. 또한 education.oracle.com/learning-explorer를 방문하여 Oracle Learning Explorer가 되십시오.

제품 설명서는 Oracle Help Center를 참조하십시오.