自動化文件生命週期
AI 以下列方式增強生命週期:
- 封存後智慧
- 數位化
- 交易分析
可能的管線種類包括:
- 文件理解 (DU) 加上可擴展 OCR 和推理的文字 LLM
- 視覺化 / 複雜版面配置的多重模型 LLM
- 比較 / 一致模式以獲得更高的保證
這項設計是各行各業的一般設計,重點是醫療照護和金融服務。
架構
此架構說明文件處理的邏輯流程,從擷取、儲存到擷取和下游整合。它展示了多個 Oracle Cloud Infrastructure (OCI) 元件 (包括 OCI Document Understanding 和 OCI Generative AI 服務 (文字和視覺 LLM) 如何在統一協調中一起運作。
下圖說明邏輯流程。
邏輯流程中顯示的概念元件包括:
- 遠端資料儲存
- 代表文件的原始來源,可以是外部儲存區域、企業檔案系統或共用儲存體 (例如網路磁碟機、DMS 或雲端儲存桶)。
- 文件可以定期擷取或觸發以進行處理。
- 輸入 UI
- 用於上傳或提交文件的簡單使用者導向進入點。
- 可以是使用 Oracle Digital Assistant 或類似工具建立的 Web 表單、內部入口網站或應用程式前端。
- 聊天機器人 (可選)
- 提供管線的對話式存取。
- 允許使用者透過自然語言上傳或查詢文件 (例如,「顯示超過 5 萬美元的所有發票」)。
- 內部會遞送至與輸入 UI 相同的擷取層。
- 整合
- 作為協調和路由層。
- 負責根據文件類型或業務邏輯觸發正確的業務進程。例如, OCI 文件理解加上結構化文件的 LLM,影像重度輸入的視覺 LLM。
- 處理對 ERP、CRM 或資料平台的錯誤復原、重試、描述資料管理及下游 API 呼叫。
- 資料儲存體
- 儲存原始資料與已處理資料。
- 一般而言,針對二進位檔案使用 OCI Object Storage 實作,針對結構化 JSON 輸出和稽核日誌使用 Oracle Autonomous AI Database 。
- 在整個文件生命週期中實現可追溯性、重新處理和分析。
- 光學字元辨識 (OCR)
- 執行光學字元辨識、版面配置偵測,以及擷取索引鍵值組、表格和任意文字。
- 產生作為文字型 LLM 推理輸入的純文字。
- OCI Document Understanding 是確定性和綱要型,確保可預測的擷取品質。
- 文字 LLM (Cohere 命令 A)
- 使用 OCI Document Understanding 輸出並套用推理、標準化及格式化。
- 處理超出 OCI 文件理解固定結構的摘要、分類及內容擷取。
- 可以清除雜訊的 OCR 輸出、統一欄位命名,以及根據相關資訊環境推斷遺漏的值。
- 多節點 LLM (Llama 4 Maverick)
- 處理 OCI 文件理解和純文字模型無法完全解譯的視覺內容和複雜版面配置。
- 處理圖表、手寫、印章、內嵌為影像的表格,以及多頁連續性。
- 在合併流程中,其輸出會與 OCI Document Understanding 和文字 LLM 結果調節,以提升完整性和準確性。
- 內嵌與資料載入邏輯
- 將擷取的文字和影像轉換成向量內嵌,以進行語意搜尋和擷取文件。
- 支援下游 RAG 工作流程,讓 LLM 能夠根據實際的文件特定資料做出回應。
- 可以使用 OCI 函數或自訂 ETL 管線來實行。
- 向量儲存
- 儲存文字與影像的內嵌內容。
- 可快速擷取內容相似的內容,並支援企業文件集的生成式問答集。
- 一般導入包括 Qdrant、 Autonomous AI Database 中的 AI Vector Search 或其他與 OCI 相容的商店。
這是邏輯流程圖中描述的端對端流程:
- 文件擷取
- 文件可透過輸入 UI 上傳,或從遠端資料儲存擷取。
- 整合層會記錄中繼資料、驗證檔案格式,並觸發對應的處理管線。
- 聊天機器人提交使用與手動上傳相同的 API 路由。
- 儲存與準備
- 檔案會保存在 OCI Object Storage 中。
- 中繼資料和狀態項目會寫入 Oracle Autonomous AI Database 以進行稽核和控制。
- 工作流程觸發程式 (使用 OCI Functions 或 Oracle Integration) 會起始 OCR/LLM 序列。
- 資料擷取與強化
- OCI 文件理解會執行 OCR 和版面配置分析,傳回結構化文字。
- 文字 LLM (例如 Command-A) 會解譯此文字、清理文字,並產生標準化輸出 (JSON 或 Markdown)。
- 當文件包含複雜的視覺元素時,文字和影像會理解 AI,例如 Llama 4 Maverick 會分析影像,以豐富或驗證擷取結果。
- 兩個輸出都可以透過協調邏輯 (信賴型調節) 進行比較或合併。
- 整合與知識載入
- 最終的結構化和情境化資料會通過嵌入步驟,將文字或視覺洞察轉換為向量。
- 「嵌入邏輯」和「資料載入邏輯」元件會將這些向量儲存到向量儲存區,並完成 RAG 整合階段。
- 下游應用程式 (例如分析儀表板、搜尋入口網站或 GenAI 聊天機器人) 現在可以存取已處理的資料,以進行語意擷取和問答。
您可以選擇性地在步驟 3 與步驟 4 之間新增人為迴圈 (HITL) 步驟。
- 在此階段,HITL 可根據各種準則整合至流程中,包括答案的信賴度、資料類型的其他檢查、格式等。這會視需要提示使用者核准或編輯結果。
- 在任何選擇的路線中,您可以加入 HITL 以提供額外的連續學習層,讓解決方案能夠隨著使用量調整並成長,並提升效率
- 對下列項目觸發 HITL:低信賴度、綱要違規、失敗的調節、未見到的廠商 / 配置,或監管機構關鍵欄位。
- 請考慮使用「評分規則」:亦即,在指定供應商 / 版面配置的連續清除次數為 N 後移除 HITL。
- 持續修正;饋送提示精簡器和驗證器;追蹤廠商 / 版面配置指紋。
下圖顯示範例實行:
此架構具有下列元件:
- OCI 地區
OCI 區域是本地化的地理區域,包含一或多個代管可用性網域的資料中心。區域獨立於其他地區,且遠距離能夠分離它們 (跨國家,甚至是大陸)。
- 區間
區間是 OCI 租用戶內的跨區域邏輯分割區。使用區間組織、控制存取,以及設定 Oracle Cloud 資源的使用配額。在指定的區間中,您可以定義控制資源存取和設定權限的原則。
- 可用性網域
可用性網域是區域內獨立的資料中心。每個可用性網域中的實體資源會與其他可用性網域中的資源隔離,以提供容錯能力。可用性網域不會共用基礎架構,例如電源或冷卻系統,或內部可用性網域網路。因此,一個可用性網域發生故障不應影響該區域中的其他可用性網域。
- 容錯域
容錯域是可用性網域內硬體和基礎架構的群組。每個可用性網域都具有三個獨立電源和硬體的容錯域。當您將資源分散到多個容錯域時,您的應用程式就可以容忍容錯域內的實體伺服器故障、系統維護,以及電源故障。
- OCI 虛擬雲端網路與子網路
虛擬雲端網路 (VCN) 是您在 OCI 區域中設定的可自訂軟體定義網路。與傳統資料中心網路一樣,VCN 可讓您控制網路環境。VCN 可以有多個非重疊的無類別網域間路由 (CIDR) 區塊,您可以在建立 VCN 之後變更這些區塊。您可以將 VCN 分隔到子網路中,而子網路的作用領域可以調整到某個區域或可用性網域。每個子網路都是由連續的位址範圍所組成,這些位址不會與 VCN 中的其他子網路重疊。您可以在建立子網路後變更其大小。子網路可以是公用網路或專用網路。
- 動態路由閘道 (DRG)
DRG 是一個虛擬路由器,提供相同區域 VCN 之間、VCN 與區域外部網路 (例如另一個 OCI 區域中的 VCN、內部部署網路,或其他雲端提供者中的網路) 的專用網路流量路徑。
- 服務閘道
服務閘道可讓您從 VCN 存取其他服務,例如 Oracle Cloud Infrastructure Object Storage 。從 VCN 到 Oracle 服務的流量會透過 Oracle 網路結構傳送,而不會周遊網際網路。
- Oracle Services Network
Oracle Services Network (OSN) 是 OCI 上的概念網路,保留給 Oracle 服務使用。這些服務具有公用 IP 位址,您可以透過網際網路連線。Oracle Cloud 以外的主機可以使用 Oracle Cloud Infrastructure FastConnect 或 VPN Connect 以私密方式存取 OSN。您 VCN 中的主機可以透過服務網關私下存取 OSN。
- Oracle Autonomous AI Database
Oracle Autonomous AI Database 提供易於使用、完全自主 (自我管理) 的資料庫,可彈性調整規模並提供快速查詢效能。此服務不需要資料庫管理。您不需要設定或管理任何硬體,或安裝任何軟體。它會自動處理佈建、備份、修正與升級,以及增加或縮小資料庫,而且是一項彈性服務。使用內建的 AI 功能,使用任何資料開發可擴展的 AI 應用程式。使用您選擇的大型語言模型 (LLM),並部署在雲端或資料中心。
- Oracle AI Database 26ai
Oracle AI Database 26ai 搭配 AI Vector Search,可讓您依意義而非關鍵字查詢資料。向量表示法 (內嵌) 會擷取文字、影像、音訊等語意,讓您能夠有效率地找到相似的內容。內建 SQL 距離函數允許使用向量進行相似性搜尋。您可以將語意相似性和其他搜尋條件與基礎大型語言模型 (RAG) 結合,以獲得更準確且相關的答案。
- OCI 文件理解
Oracle Cloud Infrastructure 文件理解是一項 AI 服務,可大規模執行深度學習文件分析。有了提供的預先建置模型,開發人員無須具備機器學習專業知識,即可輕鬆將智慧型文件處理建置到應用程式中。
- Oracle Digital Assistant
Oracle Digital Assistant 是一個平台,可讓您為使用者建立和部署數位助理。藉助 Oracle Digital Assistant ,您可以透過文字、交談和語音介面,為業務應用程式建立 AI 導向介面 (或聊天機器人)。每個數位助理都有一或多個專業技能的集合,可協助使用者在自然語言對話中完成各種任務。例如,個別數位助理可能會具備專注於特定類型任務的技能,例如追蹤存貨、提交工時卡及建立費用報表。
- Oracle AI Data Platform
Oracle AI Data Platform 是一個統一的平台,可簡化跨資料資產的資料編目、準備和分析。它將資料、AI、分析和治理整合在統一的使用者體驗中,使您能夠建置安全、可擴展的 AI 應用程式。Oracle AI Data Platform 整合了 Autonomous AI Lakehouse 、Oracle Analytics Cloud 、 OCI Object Storage 、 OCI Generative AI 和 Fusion Data Intelligence 。
在此平台中,Oracle AI Data Platform Workbench 提供專屬的開發環境,供您設計、協調及部署資料管線和模型、設定 RBAC 原則,以及使用 Spark 等開放原始碼技術來準備、分析及強化資料。
- OCI 生成式 AI
Oracle Cloud Infrastructure Generative AI 是完全受管理的 OCI 服務,提供一組最先進、可自訂的大型語言模型 (LLM),涵蓋廣泛的文字產生、摘要、語意搜尋等使用案例。使用操場試用現成的預先訓練模型,或根據專屬 AI 叢集上的自己資料建立及代管自己的微調自訂模型。
- Oracle Integration
Oracle Integration 是完全受管理的預先設定環境,可讓您整合雲端和內部部署應用程式、將業務流程自動化,以及開發視覺應用程式。它使用符合 SFTP 規範的檔案伺服器來儲存和擷取檔案,並允許您使用數百個轉接器和處方組合來與 Oracle 和第三方應用程式連線,與企業對企業交易夥伴交換文件。
- OCI Object Storage
OCI Object Storage 可讓您存取任何內容類型的大量結構化和非結構化資料,包括資料庫備份、分析資料,以及豐富的內容 (例如影像和影片)。您可以直接從應用程式或雲端平台內安全地儲存資料。您可以擴展儲存,而不會發生任何效能或服務可靠性的降低情況。
針對需要快速、立即及頻繁存取的「熱」儲存使用標準儲存。將封存儲存用於保留一段很長的時間和很少或很少存取的「冷」儲存。
建議
- VCN
建立 VCN 時,請根據計畫要連附至 VCN 中子網路的資源數目,決定所需的 CIDR 區塊數目以及每個區塊的大小。使用標準專用 IP 位址空間內的 CIDR 區塊。
選取未與您要設定專用連線的任何其他網路 (在 Oracle Cloud Infrastructure 、內部部署資料中心或其他雲端提供者中) 重疊的 CIDR 區塊。
建立 VCN 之後,您可以變更、新增及移除其 CIDR 區塊。
設計子網路時,請考量您的流量和安全需求。將特定層或角色內的所有資源連附至相同的子網路,以作為安全界限。
- 網路安全群組 (NSG)
您可以使用 NSG 定義一組適用於特定 VNIC 的傳入和傳出規則。我們建議您使用 NSG 而非安全清單,因為 NSG 可讓您將 VCN 的子網路架構與應用程式的安全需求分開。
- 雲端保全
複製並自訂 Oracle 提供的預設處方,以建立自訂偵測器和回應器處方。這些處方可讓您指定哪些類型的安全違規會產生警告,以及允許對它們執行哪些動作。例如,您可能想要偵測將可見性設為公開的 OCI Object Storage 儲存桶。
在租用戶層級套用 Oracle Cloud Guard ,以涵蓋範圍最廣,並降低維護多個組態的管理負擔。
您也可以使用「受管理清單」功能,將特定組態套用至偵測器。
- 安全區域
對於需要最高安全性的資源,Oracle 建議您使用安全區域。安全區域是與 Oracle 定義的安全原則處方關聯的區間,以最佳做法為基礎。例如,安全區域中的資源不能從公用網際網路存取,而且必須使用客戶管理的金鑰加密。當您在安全區域中建立及更新資源時,OCI 會根據處方中的原則驗證作業,並防止違反任何原則的作業。
注意事項
針對文件生命週期中的不同階段,請考量下列架構實作:
智慧型後續存檔:
- 將歷史 PDF/ 影像批次擷取至 OCI Object Storage 。
- OCI 文件理解會遞送至文字 LLM (預設),以進行摘要、分類及實體擷取。
- 當模型信賴度低於定義的臨界值 (例如低擷取 / 分類信賴度) 時,遞送輸出至 HITL 複查。
- 圖表或視覺提示的選擇性視覺 LLM。
- 儲存遞送至分析與擷取的結構化結果 ( Autonomous AI Database /Parquet)。
數位化加速:
- 遞送至 OCI 文件理解 OCR 與版面配置的掃描。
- 文字 LLM 會將欄位標準化、套用分類及標記中繼資料。
- 選用與表格或手寫視覺 LLM 的比較。
- 當模型信賴度低於定義的臨界值 (例如低擷取 / 分類信賴度) 時,遞送輸出至 HITL 複查。
- 持續和索引;實現搜尋和下游自動化。
交易分析 (即時):
- 新的提交將透過 API 或入口網站納入 OCI Object Storage 。
- OCI Document Understanding 在延遲 SLO 內遞送至文字 LLM;包括詐騙 / 異常和完整性檢查。
- 交叉檢查使用 Oracle Integration 進行 ERP/OTM;閘道核准。
- HITL 僅針對例外情況;其餘則直接經過。
針對解決這些問題時可採用的方法,考量下列不同的基礎,以及要採用的其他業務進程策略:
- 預設值:OCI Document Understanding 至文字 LLM (例如 Command-A),用於清除和擷取。
- Vision route: Llama 4 Maverick 適用於視覺繁重或低 OCI 文件理解信心。
- 比較 / 一致 (選擇性):使用 LLM 和 OCI Vision 執行 OCI Document Understanding ;調節衝突 (優先順序規則和業務驗證程式)。
- 多頁 / 多影像政策:
- 每個 Maverick 呼叫最多可有 10 頁 / 影像,以保持連續性。
- 使用滑動式視窗 (1 – 10、6 – 15 …) 與滾動式摘要提示,以減少記號並保持內容。
- 語言處理:根據語言優先順序和 OCI 文件理解支援遞送。少數語言會遞送至 OCI Vision 遞送或僅提供文字的備用。
探索更多資訊
深入瞭解如何使用 GenAI、OCI 自動化文件流程,以及使用 Oracle 開始您的雲端旅程。
請複查這些其他資源:
- Oracle 提供數種 GenAI 範例應用程式的文件處理。請前往 GitHub 。
- 開發人員指導 - 在 Oracle 開發人員 YouTube 頻道上探索複雜文件的多模式模型
- Oracle Cloud Infrastructure 文件
- 架構完善的 Oracle Cloud Infrastructure 架構
- Oracle 雲端成本估算工具
- 雲端採用架構

