知識庫

知識庫運用 Oracle Database 26ai Vector Search 功能,從儲存在 AI Data Platform Workbench 中的文件儲存向量內嵌項目。

透過 Oracle Database 26ai 的向量搜尋功能,知識庫可讓 AI 代理執行語意搜尋,並擷取語意相關文件。在「AI 資料平台工作台」中,知識庫建立在「知識庫」類型下的目錄架構中。


AI Data Platform Workbench 主目錄頁面已開啟,其中已選取目錄且已反白顯示知識庫

在「AI 資料平台工作台」中,知識庫是使用「知識庫」類型在標準目錄的架構中建立。知識庫支援擷取儲存在受管理或外部磁碟區中的 PDF、DOCX 和 TXT 檔案。依照預設,向量會儲存在 Oracle Database 26ai Vector Search 執行處理中,當您的 AI 資料平台執行處理建立時,系統會在您的租用戶中佈建這些執行處理。

AI Data Platform Workbench 支援兩種內嵌模型:
  • ALL_MINILM_L12_V2:將句子和段落對應至 384 維度密集向量空間的句子轉換器模型。用於叢集或語意搜尋等作業。
  • MULTILINGUAL_E5_SMALL:為多種語言的文字產生向量內嵌。其精簡設計可實現各種語言的有效效能,適用於各種資料集和多語言案例。

附註:

就其本身,無法直接查詢 AI Data Platform Workbench 中的知識庫物件。您可以在專員流程中建立附加至專員的 RAG 工具並選取相關知識庫,以查詢知識庫。如需有關 RAG 工具的詳細資訊,請參閱 RAG 工具。如需有關 AI 代理程式的詳細資訊,請參閱 AI 代理程式

擷取資料來源

在「AI 資料平台工作台」中建立知識庫之後,您必須進入該知識庫並指定從中擷取資料的資料來源。您可以選取整個磁碟區或磁碟區中的資料夾作為擷取來源,但無法選取個別檔案。

您可以在知識庫的資料來源頁籤中查看資料來源,並按一下資料來源名稱來查看該資料來源的相關資訊。參數頁籤提供所選磁碟區、檔案路徑、連附叢集以及檔案類型的相關資訊。

附註:

AI Data Platform Workbench 不支援排定的攝取工作。您可以按一下資料來源之參數頁籤中的立即擷取,立即擷取資料。

您可以在詳細資訊頁籤中查看資料來源的更多詳細資訊,並在工作執行頁籤中查看資料擷取工作的歷史記錄。

建立知識區

在 AI Data Platform Workbench 中建立知識庫是一種單次設定,可讓您註冊文件來源、自動分區、內嵌及索引檔案,以及透過代理程式流程啟用語意搜尋與 RAG 擷取。

您無法直接查詢 AI Data Platform Workbench 中的知識庫。您可以建立連附至 AI 代理程式的 RAG 工具來查詢知識庫。如需詳細資訊,請參閱 AI 代理程式
  1. 按一下主目錄
  2. 瀏覽至您要建立知識庫的標準目錄與綱要。
  3. 按一下知識庫
  4. 按一下 建立知識基礎圖示 建立知識庫

    建立知識區對話方塊

  5. 提供知識庫的名稱與描述。
  6. 選取要擷取檔案的工作區和 Spark 叢集。如果未選取叢集,則會使用「預設主要目錄運算」。
  7. 如果需要,請選取使用的內嵌模型。
  8. 視需要提供區塊大小與區塊重疊。
  9. 按一下建立

編輯知識區

如果您有相關權限,就可以修改現有知識庫的名稱、描述、叢集、模型或分區詳細資訊。

  1. 導覽至您的知識庫資料夾。
  2. 在您要編輯的知識庫旁邊,按一下 動作 3 點圖示 動作,然後按一下編輯
  3. 對知識庫的屬性進行任何變更。
  4. 按一下「儲存」

刪除知識基礎

您可以刪除不再需要的知識庫或從型錄中使用的知識庫。

  1. 導覽至您的知識庫資料夾。
  2. 在您要刪除的知識庫旁邊,按一下 動作 3 點圖示 動作,然後按一下刪除
  3. 按一下「刪除」

新增資料來源至知識庫

建立知識庫之後,您必須將它指定為擷取的資料來源。

  1. 瀏覽至知識庫。
  2. 按一下資料來源頁籤。
  3. 按一下 新增資料來源至知識庫 新增資料來源至知識庫

    新增資料來源至知識庫對話方塊

  4. 在「主要目錄」中,選取要擷取至知識庫之磁碟區中的磁碟區或資料夾。您無法選取個別的檔案。
  5. 如有需要,請選取要用於資料擷取的運算叢集。
  6. 選取要擷取的檔案類型。支援的檔案類型為 PDF、TXT 和 DOCX。
  7. 選取新增時啟動攝取工作,以便在新增資料來源後立即開始攝取。
  8. 按一下「新增」

將資料攝取至知識庫

將資料來源新增至知識庫之後,您可以從參數頁籤手動啟動資料擷取工作執行。

  1. 瀏覽至知識庫。
  2. 資料來源頁籤中,按一下您要執行擷取資料工作的資料來源名稱。
  3. 在「參數」頁籤中,按一下立即擷取

檢視攝取工作執行狀態

您可以從資料來源的工作執行頁籤,檢視資料來源的所有擷取工作清單。

  1. 瀏覽至知識庫。
  2. 資料來源頁籤中,按一下您要檢視其狀態的資料來源名稱。
  3. 按一下工作執行頁籤。
  4. 您可以使用篩選來縮小顯示的工作執行清單。

刪除資料來源

您可以刪除不再需要的資料來源,或從知識庫使用。

刪除資料來源也會從您的 AI 資料平台刪除對應的向量內嵌項目。
  1. 瀏覽至您的知識庫。按一下資料來源頁籤。
  2. 在您要刪除的資料來源旁邊,按一下 動作 3 點圖示 動作,然後按一下刪除
  3. 按一下「刪除」