使用 OCI Vision 和 OCI Generative AI 將發票影像自動化

簡介

公司通常會收到數千張非結構化格式的發票,這些發票是源自供應商和服務供應商的掃描影像或 PDF。手動從這些發票中擷取資料,例如發票號碼、客戶名稱、採購項目和總金額,都是耗時且容易出錯的流程。

這些處理延遲不僅會影響應付帳款週期與現金流量的可見性,還會導致合規性、稽核及報表出現瓶頸。

本教學課程示範如何在 Oracle Cloud Infrastructure (OCI) 中導入監控內送發票映像檔儲存桶的自動化管線、使用 OCI Vision 擷取文字內容,然後套用 OCI Generative AI (LLM) 以擷取結構化會計資料,例如發票號碼、客戶和項目清單。

本教學課程中使用的 OCI 服務包括:

服務 目的
OCI Vision 對上傳的發票影像執行光學辨識 。
OCI 生成式 AI 使用少量快照提示,從原始 OCR 文字擷取結構化 JSON 資料。
OCI Object Storage 儲存輸入發票影像與輸出 JSON 結果。

目標

必備條件

工作 1:設定 Python 套裝軟體

  1. 使用下列命令執行 requirements.txt 檔案。

    pip install -r requirements.txt
    
  2. 執行 Python 程序檔 (main.py)。

  3. 將發票影像 (例如 .png.jpg) 上傳至您的輸入分組。

  4. 等待處理影像,以及儲存在輸出儲存桶中的擷取 JSON。

工作 2:瞭解程式碼

任務 3:執行程式碼

使用下列命令執行程式碼。

python main.py

作業 4:測試建議

  1. 使用含有合法產品線與客戶名稱的實際或虛擬商業發票。

  2. 依序在輸入儲存桶上傳多個影像,以查看自動化處理。

  3. 登入 OCI 主控台,瀏覽至物件儲存以驗證兩個儲存桶中的結果。

注意:在本教學課程中,使用的範例是巴西發票,說明屬性和處置的複雜性,以及如何建立提示來解決此情況。

Invoice - 發票

作業 5:檢視預期輸出

針對每個上傳的發票影像,查看已處理的輸出分組檔案。相對應的 .json 檔案會以結構化內容產生,如下圖所示。

img.png

注意:

確認

其他學習資源

docs.oracle.com/learn 上探索其他實驗室,或在 Oracle Learning YouTube 頻道上存取更多免費學習內容。此外,請造訪 education.oracle.com/learning-explorer 以成為 Oracle Learning Explorer。

如需產品文件,請造訪 Oracle Help Center