使用 Oracle Integration 实施检索增强生成
- 它是一种相对较新的人工智能技术,可以通过允许 LLM 在不进行再培训的情况下挖掘其他数据资源来提高 GenAI 的质量。
- RAG 模型基于组织自己的数据构建知识库,并且可以不断更新这些库,以帮助 GenAI 提供及时且上下文相关的答案。
- 使用自然语言处理的聊天机器人和其他对话系统可以从 RAG 和 GenAI 中受益匪浅。
- 实施 RAG 需要向量数据库等技术,这些技术允许快速编码新数据,并根据这些数据进行搜索以输入到 LLM 中。
体系结构
此参考架构展示了如何使用语义搜索技术实施 RAG 框架,以使用低代码或无代码集成平台(例如 Oracle Integration (OIC) 服务)回答用户对公司数据的查询。
在此架构中,Oracle Cloud Infrastructure Generative AI 用于创建嵌入,并基于特定于上下文的公司数据生成优化或有用的答案/响应。Oracle Autonomous Database 23ai 用于存储向量嵌入,创建索引,并允许根据相似性或距离执行语义搜索,而不是基于关键字的搜索。OCI 函数用于使用标准 LangChain python 程序包执行公司文档或数据的分块。OIC 服务处理从接收公司数据到存储/查询作为向量嵌入的整个编排和自动化流程,并以实时或近时的方式为用户查询生成优化的创意特定答案。
- 检索进程:
在此过程中将发生以下情况:
- 通过 REST、文件或 sFTP 或任何其他协议,以各种格式(例如 PDF、TXT、CSV、XML、JSON 等)将公司或公司数据接收到 Oracle Integration 检索器服务。
- Retriever 服务使用 OCI Functions 分块文档或数据。
- 然后,Retriever 服务通过使用 Cohere 或其他嵌入模型调用 OCI Generative AI 嵌入服务来获取每个数据块的向量嵌入。
- 最后,Retriever 服务将这些嵌入与分块数据一起存储在 Oracle Autonomous Database 23ai 中。
- 扩充和生成处理:
在此过程中将发生以下情况:
- 公司或公司用户通过前端应用程序询问有关公司数据的查询或问题,例如策略、人力资源、销售、购买历史记录、财务报告、问题等。
- OIC 的生成服务接收查询数据,并调用其本地集成的 Augment 服务来获取该查询的上下文。
- OIC 的 Augment 服务一旦被调用,就会调用 OCI Generative AI 的 Embedding 服务来获取查询数据的向量嵌入。
- OIC 的 Augment 服务基于查询数据向量嵌入的语义搜索,获取存储在 Oracle Autonomous Database 23ai 中的上下文。检索到的上下文将作为对生成服务的响应发送回。
- 生成服务使用接收的上下文和查询调用 OCI 生成式 AI 生成服务以生成相应的响应。
- 最后,“生成”服务会回复生成的用户响应。
OIC 可帮助客户实现端到端 RAG 流程自动化。客户或公司可以使用低代码、无代码集成平台对公司数据实施 RAG,从而从中受益。通过使用低代码的无代码平台构建 RAG,可以在数小时或数天(而不是数月)内完成开发和进入市场。
该体系结构具有以下组件:
- 自治数据库
Oracle Autonomous Database 是一个完全托管的预配置数据库环境,可用于事务处理和数据仓库工作负载。您不需要配置或管理任何硬件,或者安装任何软件。Oracle Cloud Infrastructure 可处理数据库创建以及数据库备份、打补丁、升级和调优。
- 自治事务处理
Oracle Autonomous Transaction Processing 是一个自我驱动、自我保护和自我修复的数据库服务,针对事务处理工作负载进行了优化。您不需要配置或管理任何硬件,或者安装任何软件。Oracle Cloud Infrastructure 可处理数据库创建以及数据库备份、打补丁、升级和调优。
- 函数
Oracle Cloud Infrastructure Functions 是一个完全托管的多租户、高度可扩展的按需函数即服务 (FaaS) 平台。它由 Fn Project 开源引擎提供支持。使用函数可以部署代码,也可以直接调用代码或触发代码以响应事件。Oracle Functions 使用 Oracle Cloud Infrastructure Registry 中托管的 Docker 容器。
- 集成
Oracle Integration 是一项全托管式服务,可用于集成应用、自动执行流程、深入了解业务流程以及创建可视化应用。
- 生成式 AI
Oracle Cloud Infrastructure Generative AI 是一个完全托管的 OCI 服务,它提供了一组先进、可定制的大型语言模型 (LLM),涵盖了文本生成、汇总、语义搜索等各种用例。使用游乐场试用现成可用的预训练模型,或者根据您自己的数据在专用 AI 集群上创建和托管您自己的优化定制模型。
- Oracle Database 23ai
Oracle Database 23ai 是 Oracle Database 的下一个长期支持版本。它包含 300 多项新功能,重点关注人工智能 (AI) 和开发人员工作效率。利用 AI Vector Search 等功能,您可以利用新一代 AI 模型生成和存储文档、图像、声音等向量;为它们编制索引,快速查找相似性,同时利用 Oracle Database 的现有分析功能。这与已经广泛的机器学习算法相结合,可以快速创建支持 AI 的复杂应用。Oracle Database 23ai 还使用 AI 来优化许多关键数据库功能,以更准确地估计时间和资源成本。
浏览更多
了解有关使用 Oracle Integration 实施 RAG 的更多信息。
查看以下附加资源:
- Oracle Cloud Infrastructure 优秀实践框架
- Oracle Cloud Infrastructure 文档
- Oracle Integration
- OCI 函数
- 关于 Oracle Database 23ai
- 将生成式 AI 模型部署到 OCI