使用 Oracle Integration 實行擷取擴增產生

檢索增強生成 (RAG) 是強大的生成式 AI 實作模式,透過資料擷取機制整合公司資訊來增強生成式模型,而無需額外的模型訓練。RAG 可讓您以目標資訊最佳化大型語言模型 (LLM) 的輸出,而無需修改基礎模型本身;目標資訊可以比 LLM 更為最新,並且可以專屬於特定組織和產業。這可讓 GenAI 系統針對提示提供更符合情境的答案,並以極為目前的資料作為這些答案的基礎。
RAG 協助 LLM 提供更好的答案,因為:
  • 它是一種相對較新的人工智慧技術,可藉由允許 LLM 在不重新訓練的情況下利用其他資料資源來改善 GenAI 的品質。
  • RAG 模型會根據組織本身的資料建立知識儲存庫,而且這些儲存庫可以持續更新,以協助 GenAI 提供及時且符合情境的答案。
  • 使用自然語言處理的聊天機器人和其他對話式系統可從 RAG 和 GenAI 中獲益良多。
  • 導入 RAG 需要向量資料庫等技術,以快速編碼新資料,並搜尋該資料以饋送至 LLM 中。

架構

此參考架構顯示如何使用語意搜尋技術導入 RAG 架構,以使用低程式碼或無程式碼整合平台 (例如 Oracle Integration (OIC) 服務) 來回答企業資料的使用者查詢。

在此架構中,Oracle Cloud Infrastructure Generative AI 用於建立內嵌項目,並根據相關資訊環境特定公司資料產生最佳化或有用的答案 / 回應。Oracle Autonomous Database 23ai 用於儲存向量內嵌、建立索引,並允許根據相似性或距離進行語意搜尋,而非關鍵字式搜尋。OCI 函數是用來使用標準 LangChain python 套裝軟體執行公司文件或資料的分區。OIC 服務會處理整個協調和自動化流程,從接收公司資料到將這些資料儲存 / 查詢為向量內嵌,並以即時或近乎時間的方式,為使用者查詢產生最佳化且具創意的內容特定答案。

下圖說明此參考架構支援的兩個處理:
  • 擷取處理作業:


    rag-oic.png 的描述如下
    rag-oic.png 圖解描述

    rag-oic-oracle.zip

    在此程序中,會發生下列情況:

    1. 系統會以各種格式 (例如 PDF、TXT、CSV、XML、JSON 等) 將公司或公司資料接收至 Oracle Integration Retriever 服務,例如 REST、File 或 sFTP 或任何其他協定。
    2. 「擷取器」服務會使用 OCI 函數將文件或資料分塊。
    3. 然後,Retriever 服務會使用 Cohere 等內嵌模型,呼叫 OCI Generative AI Embedding 服務,為每個資料區塊取得向量內嵌。
    4. 最後,Retriever 服務會將這些內嵌項目與分區資料儲存在 Oracle Autonomous Database 23ai 中。
  • 「擴增與產生」處理程序:


    rag-oic-aug-gen.png 描述如下
    rag-oic-aug-gen.png 圖解描述

    rag-oic-aug-gen-oracle.zip

    在此程序中,會發生下列情況:

    1. 透過前端應用程式的公司或公司使用者會詢問有關公司資料的查詢或問題,例如政策、人力資源、銷售、採購歷史記錄、財務報表、問題等等。
    2. OIC 的「產生」服務會接收查詢資料,並呼叫其本機整合的「擴增」服務以取得該查詢的內容。
    3. OIC 的擴增服務呼叫之後,會呼叫 OCI Generative AI 的內嵌服務來取得查詢資料的向量內嵌。
    4. OIC 的擴增服務會根據查詢資料向量內嵌的語意搜尋,取得儲存在 Oracle Autonomous Database 23ai 中的相關資訊環境。擷取的相關資訊環境會傳回作為「產生」服務的回應。
    5. 在收到的相關資訊環境和查詢的情況下產生服務,會呼叫 OCI Generative AI Generation 服務以產生適當的回應。
    6. 最後,「產生」服務會回覆使用者產生的回應。

OIC 可協助客戶將端對端 RAG 流程自動化。客戶或公司可以利用低程式碼的無程式碼整合平台,在公司資料上導入 RAG。使用低程式碼的無程式碼平台建立 RAG 可在數小時或數天內 (而非數月) 開發和上市。

架構具有下列元件:

  • 自治式資料庫

    Oracle Autonomous Database 是完全受管理的預先設定資料庫環境,可用於交易處理和資料倉儲工作負載。您不需要設定或管理任何硬體,也不需要安裝任何軟體。Oracle Cloud Infrastructure 處理建立資料庫,以及備份、修補、升級和調整資料庫。

  • Autonomous Transaction Processing

    Oracle Autonomous Transaction Processing 是一種自主驅動、自主防護、自主修復的資料庫服務,已針對交易處理工作負載進行最佳化。您不需要設定或管理任何硬體,也不需要安裝任何軟體。Oracle Cloud Infrastructure 處理建立資料庫,以及備份、修補、升級和調整資料庫。

  • 功能

    Oracle Cloud Infrastructure Functions 是一個完全託管的多租戶、高度可擴充、隨選、Functions-as-a-Service (FaaS) 平台。由 Fn Project 開放原始碼引擎提供技術支援。Functions 可讓您部署程式碼,並直接呼叫程式碼或觸發程式碼以回應事件。Oracle Functions 使用 Oracle Cloud Infrastructure Registry 中代管的 Docker 容器。

  • 整合

    Oracle Integration 是一項完全託管的服務,可讓您整合應用程式、自動化流程、深入瞭解業務流程,以及建立視覺化應用程式。

  • 生成式 AI

    Oracle Cloud Infrastructure Generative AI 是一個完全託管的 OCI 服務,提供一組最先進的可自訂大型語言模型 (LLM),其中涵蓋廣泛的文字產生、摘要、語意搜尋等使用案例。您可以使用測試區試用立即可用的預先訓練模型,或者根據自己在專用 AI 叢集上的資料建立及代管經過微調的自訂模型。

  • Oracle Database 23ai

    Oracle Database 23ai 是 Oracle Database 的下一個長期支援版本。它包含超過 300 個新功能,專注於人工智慧 (AI) 和開發人員生產力。AI Vector Search 等功能讓您能夠利用新一代的 AI 模型來產生和儲存文件、圖像、聲音等的向量;編製索引並快速尋找相似性,同時充分利用 Oracle Database 的現有分析功能。這與已經廣泛的機器學習演算法組合,可讓您快速建立複雜的 AI 應用程式。Oracle Database 23ai 還使用 AI 將許多關鍵資料庫功能最佳化,以對時間和資源成本做出更準確的估計。

確認

作者: Pavan Rajalbandi