自動化文件生命週期

在各個產業中,企業的 PDF、掃描和非結構化記錄超載,例如合約、發票、醫療表單和理賠。從這些文件中提取價值通常是手動、緩慢且昂貴。此參考架構顯示如何套用 Oracle Cloud Infrastructure Generative AI 服務以將文件生命週期自動化。

AI 以下列方式增強生命週期:

  • 封存後智慧
  • 數位化
  • 交易分析

可能的管線種類包括:

  • 文件理解 (DU) 加上可擴展 OCR 和推理的文字 LLM
  • 視覺化 / 複雜版面配置的多重模型 LLM
  • 比較 / 一致模式以獲得更高的保證

這項設計是各行各業的一般設計,重點是醫療照護和金融服務。

架構

此架構說明文件處理的邏輯流程,從擷取、儲存到擷取和下游整合。它展示了多個 Oracle Cloud Infrastructure (OCI) 元件 (包括 OCI Document UnderstandingOCI Generative AI 服務 (文字和視覺 LLM) 如何在統一協調中一起運作。

下圖說明邏輯流程。



邏輯流程中顯示的概念元件包括:

  • 遠端資料儲存
    • 代表文件的原始來源,可以是外部儲存區域、企業檔案系統或共用儲存體 (例如網路磁碟機、DMS 或雲端儲存桶)。
    • 文件可以定期擷取或觸發以進行處理。
  • 輸入 UI
    • 用於上傳或提交文件的簡單使用者導向進入點。
    • 可以是使用 Oracle Digital Assistant 或類似工具建立的 Web 表單、內部入口網站或應用程式前端。
  • 聊天機器人 (可選)
    • 提供管線的對話式存取。
    • 允許使用者透過自然語言上傳或查詢文件 (例如,「顯示超過 5 萬美元的所有發票」)。
    • 內部會遞送至與輸入 UI 相同的擷取層。
  • 整合
    • 作為協調和路由層。
    • 負責根據文件類型或業務邏輯觸發正確的業務進程。例如, OCI 文件理解加上結構化文件的 LLM,影像重度輸入的視覺 LLM。
    • 處理對 ERP、CRM 或資料平台的錯誤復原、重試、描述資料管理及下游 API 呼叫。
  • 資料儲存體
    • 儲存原始資料與已處理資料。
    • 一般而言,針對二進位檔案使用 OCI Object Storage 實作,針對結構化 JSON 輸出和稽核日誌使用 Oracle Autonomous AI Database
    • 在整個文件生命週期中實現可追溯性、重新處理和分析。
  • 光學字元辨識 (OCR)
    • 執行光學字元辨識、版面配置偵測,以及擷取索引鍵值組、表格和任意文字。
    • 產生作為文字型 LLM 推理輸入的純文字。
    • OCI Document Understanding 是確定性和綱要型,確保可預測的擷取品質。
  • 文字 LLM (Cohere 命令 A)
    • 使用 OCI Document Understanding 輸出並套用推理、標準化及格式化。
    • 處理超出 OCI 文件理解固定結構的摘要、分類及內容擷取。
    • 可以清除雜訊的 OCR 輸出、統一欄位命名,以及根據相關資訊環境推斷遺漏的值。
  • 多節點 LLM (Llama 4 Maverick)
    • 處理 OCI 文件理解和純文字模型無法完全解譯的視覺內容和複雜版面配置。
    • 處理圖表、手寫、印章、內嵌為影像的表格,以及多頁連續性。
    • 在合併流程中,其輸出會與 OCI Document Understanding 和文字 LLM 結果調節,以提升完整性和準確性。
  • 內嵌與資料載入邏輯
    • 將擷取的文字和影像轉換成向量內嵌,以進行語意搜尋和擷取文件。
    • 支援下游 RAG 工作流程,讓 LLM 能夠根據實際的文件特定資料做出回應。
    • 可以使用 OCI 函數或自訂 ETL 管線來實行。
  • 向量儲存
    • 儲存文字與影像的內嵌內容。
    • 可快速擷取內容相似的內容,並支援企業文件集的生成式問答集。
    • 一般導入包括 Qdrant、 Autonomous AI Database 中的 AI Vector Search 或其他與 OCI 相容的商店。

這是邏輯流程圖中描述的端對端流程:

  1. 文件擷取
    • 文件可透過輸入 UI 上傳,或從遠端資料儲存擷取。
    • 整合層會記錄中繼資料、驗證檔案格式,並觸發對應的處理管線。
    • 聊天機器人提交使用與手動上傳相同的 API 路由。
  2. 儲存與準備
    • 檔案會保存在 OCI Object Storage 中。
    • 中繼資料和狀態項目會寫入 Oracle Autonomous AI Database 以進行稽核和控制。
    • 工作流程觸發程式 (使用 OCI FunctionsOracle Integration) 會起始 OCR/LLM 序列。
  3. 資料擷取與強化
    • OCI 文件理解會執行 OCR 和版面配置分析,傳回結構化文字。
    • 文字 LLM (例如 Command-A) 會解譯此文字、清理文字,並產生標準化輸出 (JSON 或 Markdown)。
    • 當文件包含複雜的視覺元素時,文字和影像會理解 AI,例如 Llama 4 Maverick 會分析影像,以豐富或驗證擷取結果。
    • 兩個輸出都可以透過協調邏輯 (信賴型調節) 進行比較或合併。
  4. 整合與知識載入
    • 最終的結構化和情境化資料會通過嵌入步驟,將文字或視覺洞察轉換為向量。
    • 「嵌入邏輯」和「資料載入邏輯」元件會將這些向量儲存到向量儲存區,並完成 RAG 整合階段。
    • 下游應用程式 (例如分析儀表板、搜尋入口網站或 GenAI 聊天機器人) 現在可以存取已處理的資料,以進行語意擷取和問答。

您可以選擇性地在步驟 3 與步驟 4 之間新增人為迴圈 (HITL) 步驟。

  • 在此階段,HITL 可根據各種準則整合至流程中,包括答案的信賴度、資料類型的其他檢查、格式等。這會視需要提示使用者核准或編輯結果。
  • 在任何選擇的路線中,您可以加入 HITL 以提供額外的連續學習層,讓解決方案能夠隨著使用量調整並成長,並提升效率
  • 對下列項目觸發 HITL:低信賴度、綱要違規、失敗的調節、未見到的廠商 / 配置,或監管機構關鍵欄位。
  • 請考慮使用「評分規則」:亦即,在指定供應商 / 版面配置的連續清除次數為 N 後移除 HITL。
  • 持續修正;饋送提示精簡器和驗證器;追蹤廠商 / 版面配置指紋。

下圖顯示範例實行:



此架構具有下列元件:

  • OCI 地區

    OCI 區域是本地化的地理區域,包含一或多個代管可用性網域的資料中心。區域獨立於其他地區,且遠距離能夠分離它們 (跨國家,甚至是大陸)。

  • 區間

    區間是 OCI 租用戶內的跨區域邏輯分割區。使用區間組織、控制存取,以及設定 Oracle Cloud 資源的使用配額。在指定的區間中,您可以定義控制資源存取和設定權限的原則。

  • 可用性網域

    可用性網域是區域內獨立的資料中心。每個可用性網域中的實體資源會與其他可用性網域中的資源隔離,以提供容錯能力。可用性網域不會共用基礎架構,例如電源或冷卻系統,或內部可用性網域網路。因此,一個可用性網域發生故障不應影響該區域中的其他可用性網域。

  • 容錯域

    容錯域是可用性網域內硬體和基礎架構的群組。每個可用性網域都具有三個獨立電源和硬體的容錯域。當您將資源分散到多個容錯域時,您的應用程式就可以容忍容錯域內的實體伺服器故障、系統維護,以及電源故障。

  • OCI 虛擬雲端網路與子網路

    虛擬雲端網路 (VCN) 是您在 OCI 區域中設定的可自訂軟體定義網路。與傳統資料中心網路一樣,VCN 可讓您控制網路環境。VCN 可以有多個非重疊的無類別網域間路由 (CIDR) 區塊,您可以在建立 VCN 之後變更這些區塊。您可以將 VCN 分隔到子網路中,而子網路的作用領域可以調整到某個區域或可用性網域。每個子網路都是由連續的位址範圍所組成,這些位址不會與 VCN 中的其他子網路重疊。您可以在建立子網路後變更其大小。子網路可以是公用網路或專用網路。

  • 動態路由閘道 (DRG)

    DRG 是一個虛擬路由器,提供相同區域 VCN 之間、VCN 與區域外部網路 (例如另一個 OCI 區域中的 VCN、內部部署網路,或其他雲端提供者中的網路) 的專用網路流量路徑。

  • 服務閘道

    服務閘道可讓您從 VCN 存取其他服務,例如 Oracle Cloud Infrastructure Object Storage 。從 VCN 到 Oracle 服務的流量會透過 Oracle 網路結構傳送,而不會周遊網際網路。

  • Oracle Services Network

    Oracle Services Network (OSN) 是 OCI 上的概念網路,保留給 Oracle 服務使用。這些服務具有公用 IP 位址,您可以透過網際網路連線。Oracle Cloud 以外的主機可以使用 Oracle Cloud Infrastructure FastConnect 或 VPN Connect 以私密方式存取 OSN。您 VCN 中的主機可以透過服務網關私下存取 OSN。

  • Oracle Autonomous AI Database

    Oracle Autonomous AI Database 提供易於使用、完全自主 (自我管理) 的資料庫,可彈性調整規模並提供快速查詢效能。此服務不需要資料庫管理。您不需要設定或管理任何硬體,或安裝任何軟體。它會自動處理佈建、備份、修正與升級,以及增加或縮小資料庫,而且是一項彈性服務。使用內建的 AI 功能,使用任何資料開發可擴展的 AI 應用程式。使用您選擇的大型語言模型 (LLM),並部署在雲端或資料中心。

  • Oracle AI Database 26ai

    Oracle AI Database 26ai 搭配 AI Vector Search,可讓您依意義而非關鍵字查詢資料。向量表示法 (內嵌) 會擷取文字、影像、音訊等語意,讓您能夠有效率地找到相似的內容。內建 SQL 距離函數允許使用向量進行相似性搜尋。您可以將語意相似性和其他搜尋條件與基礎大型語言模型 (RAG) 結合,以獲得更準確且相關的答案。

  • OCI 文件理解

    Oracle Cloud Infrastructure 文件理解是一項 AI 服務,可大規模執行深度學習文件分析。有了提供的預先建置模型,開發人員無須具備機器學習專業知識,即可輕鬆將智慧型文件處理建置到應用程式中。

  • Oracle Digital Assistant

    Oracle Digital Assistant 是一個平台,可讓您為使用者建立和部署數位助理。藉助 Oracle Digital Assistant ,您可以透過文字、交談和語音介面,為業務應用程式建立 AI 導向介面 (或聊天機器人)。每個數位助理都有一或多個專業技能的集合,可協助使用者在自然語言對話中完成各種任務。例如,個別數位助理可能會具備專注於特定類型任務的技能,例如追蹤存貨、提交工時卡及建立費用報表。

  • Oracle AI Data Platform

    Oracle AI Data Platform 是一個統一的平台,可簡化跨資料資產的資料編目、準備和分析。它將資料、AI、分析和治理整合在統一的使用者體驗中,使您能夠建置安全、可擴展的 AI 應用程式。Oracle AI Data Platform 整合了 Autonomous AI LakehouseOracle Analytics CloudOCI Object StorageOCI Generative AIFusion Data Intelligence

    在此平台中,Oracle AI Data Platform Workbench 提供專屬的開發環境,供您設計、協調及部署資料管線和模型、設定 RBAC 原則,以及使用 Spark 等開放原始碼技術來準備、分析及強化資料。

  • OCI 生成式 AI

    Oracle Cloud Infrastructure Generative AI 是完全受管理的 OCI 服務,提供一組最先進、可自訂的大型語言模型 (LLM),涵蓋廣泛的文字產生、摘要、語意搜尋等使用案例。使用操場試用現成的預先訓練模型,或根據專屬 AI 叢集上的自己資料建立及代管自己的微調自訂模型。

  • Oracle Integration

    Oracle Integration 是完全受管理的預先設定環境,可讓您整合雲端和內部部署應用程式、將業務流程自動化,以及開發視覺應用程式。它使用符合 SFTP 規範的檔案伺服器來儲存和擷取檔案,並允許您使用數百個轉接器和處方組合來與 Oracle 和第三方應用程式連線,與企業對企業交易夥伴交換文件。

  • OCI Object Storage

    OCI Object Storage 可讓您存取任何內容類型的大量結構化和非結構化資料,包括資料庫備份、分析資料,以及豐富的內容 (例如影像和影片)。您可以直接從應用程式或雲端平台內安全地儲存資料。您可以擴展儲存,而不會發生任何效能或服務可靠性的降低情況。

    針對需要快速、立即及頻繁存取的「熱」儲存使用標準儲存。將封存儲存用於保留一段很長的時間和很少或很少存取的「冷」儲存。

建議

使用下列建議作為實行架構的起點。您的需求可能會與此處描述的架構不同。
  • VCN

    建立 VCN 時,請根據計畫要連附至 VCN 中子網路的資源數目,決定所需的 CIDR 區塊數目以及每個區塊的大小。使用標準專用 IP 位址空間內的 CIDR 區塊。

    選取未與您要設定專用連線的任何其他網路 (在 Oracle Cloud Infrastructure 、內部部署資料中心或其他雲端提供者中) 重疊的 CIDR 區塊。

    建立 VCN 之後,您可以變更、新增及移除其 CIDR 區塊。

    設計子網路時,請考量您的流量和安全需求。將特定層或角色內的所有資源連附至相同的子網路,以作為安全界限。

  • 網路安全群組 (NSG)

    您可以使用 NSG 定義一組適用於特定 VNIC 的傳入和傳出規則。我們建議您使用 NSG 而非安全清單,因為 NSG 可讓您將 VCN 的子網路架構與應用程式的安全需求分開。

  • 雲端保全

    複製並自訂 Oracle 提供的預設處方,以建立自訂偵測器和回應器處方。這些處方可讓您指定哪些類型的安全違規會產生警告,以及允許對它們執行哪些動作。例如,您可能想要偵測將可見性設為公開的 OCI Object Storage 儲存桶。

    在租用戶層級套用 Oracle Cloud Guard ,以涵蓋範圍最廣,並降低維護多個組態的管理負擔。

    您也可以使用「受管理清單」功能,將特定組態套用至偵測器。

  • 安全區域

    對於需要最高安全性的資源,Oracle 建議您使用安全區域。安全區域是與 Oracle 定義的安全原則處方關聯的區間,以最佳做法為基礎。例如,安全區域中的資源不能從公用網際網路存取,而且必須使用客戶管理的金鑰加密。當您在安全區域中建立及更新資源時,OCI 會根據處方中的原則驗證作業,並防止違反任何原則的作業。

注意事項

針對文件生命週期中的不同階段,請考量下列架構實作:

智慧型後續存檔:

  1. 將歷史 PDF/ 影像批次擷取至 OCI Object Storage
  2. OCI 文件理解會遞送至文字 LLM (預設),以進行摘要、分類及實體擷取。
    • 當模型信賴度低於定義的臨界值 (例如低擷取 / 分類信賴度) 時,遞送輸出至 HITL 複查。
  3. 圖表或視覺提示的選擇性視覺 LLM。
  4. 儲存遞送至分析與擷取的結構化結果 ( Autonomous AI Database /Parquet)。

數位化加速:

  1. 遞送至 OCI 文件理解 OCR 與版面配置的掃描。
  2. 文字 LLM 會將欄位標準化、套用分類及標記中繼資料。
  3. 選用與表格或手寫視覺 LLM 的比較。
    • 當模型信賴度低於定義的臨界值 (例如低擷取 / 分類信賴度) 時,遞送輸出至 HITL 複查。
  4. 持續和索引;實現搜尋和下游自動化。

交易分析 (即時):

  1. 新的提交將透過 API 或入口網站納入 OCI Object Storage
  2. OCI Document Understanding 在延遲 SLO 內遞送至文字 LLM;包括詐騙 / 異常和完整性檢查。
  3. 交叉檢查使用 Oracle Integration 進行 ERP/OTM;閘道核准。
  4. HITL 僅針對例外情況;其餘則直接經過。

針對解決這些問題時可採用的方法,考量下列不同的基礎,以及要採用的其他業務進程策略:

  • 預設值:OCI Document Understanding 至文字 LLM (例如 Command-A),用於清除和擷取。
  • Vision route: Llama 4 Maverick 適用於視覺繁重或低 OCI 文件理解信心。
  • 比較 / 一致 (選擇性):使用 LLM 和 OCI Vision 執行 OCI Document Understanding ;調節衝突 (優先順序規則和業務驗證程式)。
  • 多頁 / 多影像政策
    • 每個 Maverick 呼叫最多可有 10 頁 / 影像,以保持連續性。
    • 使用滑動式視窗 (1 – 10、6 – 15 …) 與滾動式摘要提示,以減少記號並保持內容。
  • 語言處理:根據語言優先順序和 OCI 文件理解支援遞送。少數語言會遞送至 OCI Vision 遞送或僅提供文字的備用。

探索更多資訊

深入瞭解如何使用 GenAI、OCI 自動化文件流程,以及使用 Oracle 開始您的雲端旅程。

請複查這些其他資源:

確認

  • 作者Ali Ottoman
  • 貢獻者Joshua Stanley