使用 Oracle Integration 实施检索增强生成

检索增强生成 (RAG) 是一种强大的生成式 AI 实施模式,通过数据检索机制整合企业信息而无需额外的模型训练,从而增强生成式模型。利用 RAG,您可以使用目标信息优化大型语言模型 (LLM) 的输出,而无需修改底层模型本身;目标信息可以比 LLM 更新,并且可以特定于特定组织和行业。这使 GenAI 系统能够为提示提供更符合上下文的答案,并将这些答案基于非常当前的数据。
RAG 帮助 LLM 提供更好的答案,因为:
  • 它是一种相对较新的人工智能技术,可以通过允许 LLM 在不进行再培训的情况下挖掘其他数据资源来提高 GenAI 的质量。
  • RAG 模型基于组织自己的数据构建知识库,并且可以不断更新这些库,以帮助 GenAI 提供及时且上下文相关的答案。
  • 使用自然语言处理的聊天机器人和其他对话系统可以从 RAG 和 GenAI 中受益匪浅。
  • 实施 RAG 需要向量数据库等技术,这些技术允许快速编码新数据,并根据这些数据进行搜索以输入到 LLM 中。

体系结构

此参考架构展示了如何使用语义搜索技术实施 RAG 框架,以使用低代码或无代码集成平台(例如 Oracle Integration (OIC) 服务)回答用户对公司数据的查询。

在此架构中,Oracle Cloud Infrastructure Generative AI 用于创建嵌入,并基于特定于上下文的公司数据生成优化或有用的答案/响应。Oracle Autonomous Database 23ai 用于存储向量嵌入,创建索引,并允许根据相似性或距离执行语义搜索,而不是基于关键字的搜索。OCI 函数用于使用标准 LangChain python 程序包执行公司文档或数据的分块。OIC 服务处理从接收公司数据到存储/查询作为向量嵌入的整个编排和自动化流程,并以实时或近时的方式为用户查询生成优化的创意特定答案。

下图说明了此引用体系结构支持的两个进程:
  • 检索进程:


    下面是 rag-oic.png 的说明
    插图 rag-oic.png 的说明

    rag-oic-oracle.zip

    在此过程中将发生以下情况:

    1. 通过 REST、文件或 sFTP 或任何其他协议,以各种格式(例如 PDF、TXT、CSV、XML、JSON 等)将公司或公司数据接收到 Oracle Integration 检索器服务。
    2. Retriever 服务使用 OCI Functions 分块文档或数据。
    3. 然后,Retriever 服务通过使用 Cohere 或其他嵌入模型调用 OCI Generative AI 嵌入服务来获取每个数据块的向量嵌入。
    4. 最后,Retriever 服务将这些嵌入与分块数据一起存储在 Oracle Autonomous Database 23ai 中。
  • 扩充和生成处理:


    下面是 rag-oic-aug-gen.png 的说明
    插图 rag-oic-aug-gen.png 的说明

    rag-oic-aug-gen-oracle.zip

    在此过程中将发生以下情况:

    1. 公司或公司用户通过前端应用程序询问有关公司数据的查询或问题,例如策略、人力资源、销售、购买历史记录、财务报告、问题等。
    2. OIC 的生成服务接收查询数据,并调用其本地集成的 Augment 服务来获取该查询的上下文。
    3. OIC 的 Augment 服务一旦被调用,就会调用 OCI Generative AI 的 Embedding 服务来获取查询数据的向量嵌入。
    4. OIC 的 Augment 服务基于查询数据向量嵌入的语义搜索,获取存储在 Oracle Autonomous Database 23ai 中的上下文。检索到的上下文将作为对生成服务的响应发送回。
    5. 生成服务使用接收的上下文和查询调用 OCI 生成式 AI 生成服务以生成相应的响应。
    6. 最后,“生成”服务会回复生成的用户响应。

OIC 可帮助客户实现端到端 RAG 流程自动化。客户或公司可以使用低代码、无代码集成平台对公司数据实施 RAG,从而从中受益。通过使用低代码的无代码平台构建 RAG,可以在数小时或数天(而不是数月)内完成开发和进入市场。

该体系结构具有以下组件:

  • 自治数据库

    Oracle Autonomous Database 是一个完全托管的预配置数据库环境,可用于事务处理和数据仓库工作负载。您不需要配置或管理任何硬件,或者安装任何软件。Oracle Cloud Infrastructure 可处理数据库创建以及数据库备份、打补丁、升级和调优。

  • 自治事务处理

    Oracle Autonomous Transaction Processing 是一个自我驱动、自我保护和自我修复的数据库服务,针对事务处理工作负载进行了优化。您不需要配置或管理任何硬件,或者安装任何软件。Oracle Cloud Infrastructure 可处理数据库创建以及数据库备份、打补丁、升级和调优。

  • 函数

    Oracle Cloud Infrastructure Functions 是一个完全托管的多租户、高度可扩展的按需函数即服务 (FaaS) 平台。它由 Fn Project 开源引擎提供支持。使用函数可以部署代码,也可以直接调用代码或触发代码以响应事件。Oracle Functions 使用 Oracle Cloud Infrastructure Registry 中托管的 Docker 容器。

  • 集成

    Oracle Integration 是一项全托管式服务,可用于集成应用、自动执行流程、深入了解业务流程以及创建可视化应用。

  • 生成式 AI

    Oracle Cloud Infrastructure Generative AI 是一个完全托管的 OCI 服务,它提供了一组先进、可定制的大型语言模型 (LLM),涵盖了文本生成、汇总、语义搜索等各种用例。使用游乐场试用现成可用的预训练模型,或者根据您自己的数据在专用 AI 集群上创建和托管您自己的优化定制模型。

  • Oracle Database 23ai

    Oracle Database 23ai 是 Oracle Database 的下一个长期支持版本。它包含 300 多项新功能,重点关注人工智能 (AI) 和开发人员工作效率。利用 AI Vector Search 等功能,您可以利用新一代 AI 模型生成和存储文档、图像、声音等向量;为它们编制索引,快速查找相似性,同时利用 Oracle Database 的现有分析功能。这与已经广泛的机器学习算法相结合,可以快速创建支持 AI 的复杂应用。Oracle Database 23ai 还使用 AI 来优化许多关键数据库功能,以更准确地估计时间和资源成本。

确认

作者: Pavan Rajalbandi