知识库

知识库利用 Oracle Database 26ai Vector Search 功能从 AI Data Platform Workbench 中存储的文档中存储向量嵌入。

通过 Oracle Database 26ai 的向量搜索功能,知识库使 AI 代理能够执行语义搜索和检索语义相关的文档。在 AI 数据平台工作台中,知识库是在“知识库”类型下的目录模式中创建的。


已打开 AI 数据平台工作台主目录页,其中选择了目录并突出显示了知识库

在 AI 数据平台工作台中,知识库是使用知识库类型在标准目录方案中创建的。知识库支持摄取存储在托管卷或外部卷中的 PDF、DOCX 和 TXT 文件。默认情况下,向量存储在 Oracle Database 26ai Vector Search 实例中,该实例在创建 AI 数据平台实例时在您的租户中预配。

AI Data Platform Workbench 支持两种嵌入模型:
  • ALL_MINILM_L12_V2:将句子和段落映射到 384 维密集向量空间的句子转换器模型。用于群集或语义搜索等任务。
  • MULTILINGUAL_E5_SMALL:以多种语言生成文本的向量嵌入。其紧凑的设计可实现各种语言的有效性能,适用于各种数据集和多语言场景。

注意:

AI Data Platform Workbench 中的知识库对象本身无法直接查询。您可以通过在座席流中创建附加到座席的 RAG 工具并选择相关的知识库来查询知识库。有关 RAG 工具的更多信息,请参见 RAG Tool 。有关 AI 代理的更多信息,请参阅 AI 代理

摄取数据源

在 AI Data Platform Workbench 中创建知识库后,您需要进入该知识库并指定要从中提取数据的数据源。您可以选择卷中的整个卷或文件夹作为摄取的源,但无法选择单个文件。

您可以在知识库的数据源选项卡中查看数据源,并通过单击数据源名称来查看有关该数据源的信息。参数选项卡提供有关所选卷、文件路径、连接的群集和文件类型的信息。

注意:

AI Data Platform Workbench 不支持计划的摄取作业。通过在数据源的参数选项卡中单击立即摄取,可以立即摄取数据。

您可以在详细信息选项卡中查看有关数据源的更多详细信息,并在作业运行选项卡中查看数据摄取作业的历史记录。

创建知识基础

在 AI Data Platform Workbench 中创建知识库是一项一次性设置,允许您注册文档源、自动分块、嵌入和索引文件,以及通过代理流启用语义搜索和 RAG 检索。

您无法直接在 AI 数据平台工作台中查询知识库。您可以通过创建附加到 AI 代理的 RAG 工具来查询知识库。有关更多信息,请参阅 AI 代理
  1. 单击主目录
  2. 导航到要在其中创建知识库的标准目录和方案。
  3. 单击知识库
  4. 单击 “创建知识库”图标 创建知识库

    “创建知识库”对话框

  5. 为您的知识库提供名称和说明。
  6. 选择工作区和 Spark 集群以进行文件摄取。如果未选择集群,则使用默认主目录计算。
  7. 如有必要,选择所用的嵌入模型。
  8. 如有必要,请提供块大小和块重叠。
  9. 单击创建

编辑知识基础

如果您具有相关权限,则可以修改现有知识库的名称、说明、集群、模型或分块详细信息。

  1. 导航到您的知识库文件夹。
  2. 在要编辑的知识库旁边,单击 “操作三个点”图标 操作,然后单击编辑
  3. 对知识库的属性进行任何更改。
  4. 单击保存

删除知识基础

您可以从目录中删除不再需要或使用的知识库。

  1. 导航到您的知识库文件夹。
  2. 在要删除的知识库旁边,单击 “操作三个点”图标 操作,然后单击删除
  3. 单击删除

将数据源添加到知识库

创建知识库后,需要为其分配数据源以进行摄取。

  1. 导航到您的知识库。
  2. 单击数据源选项卡。
  3. 单击 将数据源添加到知识库 将数据源添加到知识库

    将数据源添加到知识库对话框

  4. 在主目录中,选择要摄取到知识库中的卷或卷文件夹。不能选择单个文件。
  5. 如有必要,选择要用于数据摄取的计算集群。
  6. 选择要摄取的文件类型。支持的文件类型包括 PDF、TXT 和 DOCX。
  7. 选择添加时启动摄取作业可在添加数据源后立即开始摄取。
  8. 单击添加

将数据摄取到知识库

将数据源添加到知识库后,您可以从参数选项卡手动启动数据摄取作业运行。

  1. 导航到您的知识库。
  2. 数据源选项卡中,单击要为其运行摄取数据作业的数据源的名称。
  3. 在“参数”选项卡中,单击立即摄取

查看摄取作业运行状态

您可以从数据源的作业运行选项卡中查看数据源的所有摄取作业的列表。

  1. 导航到您的知识库。
  2. 数据源选项卡中,单击要查看其状态的数据源的名称。
  3. 单击作业运行选项卡。
  4. 使用筛选器缩小显示的作业运行列表。

删除数据源

您可以从知识库中删除不再需要或使用的数据源。

删除数据源还会从 AI 数据平台中删除相应的向量嵌入。
  1. 导航到您的知识库。单击数据源选项卡。
  2. 在要删除的数据源旁边,单击 “操作三个点”图标 操作,然后单击删除
  3. 单击删除