关于将 Oracle AI Database 26ai 用于企业 AI

让您的企业能够将 Oracle AI Database 26ai 中管理的业务数据转变为受监管的高质量知识,无需添加单独的向量存储即可为 AI 应用提供支持。使用 Dify Enterprise Edition 的知识管道,您可以直接在 Oracle AI Database 26ai 中编排多模式数据(文本、图像、音频)的摄取、扩充和索引编制。然后,您可以对客户支持副驾驶、知识搜索和座席辅助工作流等用例进行快速、可靠的检索,并获得以下优势:
  • 通过激活现有的 Oracle 驻留数据,加快 AI 的价值实现速度
  • 通过符合策略的精心策划环境提高答案质量和一致性
  • 可信心十足地扩展 Oracle 的企业级性能、可用性和安全性
  • 统一数据存储和向量管理,降低架构复杂性
在此解决方案手册中,您将了解如何将 DifyOracle AI Database 集成,为构建在生产规模上运行的检索增强生成 (Retrieval-Augmented Generation,RAID) 和知识应用提供可重复的参考。

体系结构

DifyOracle Cloud Infrastructure Kubernetes Engine (OKE) 上运行,在三层网络设计后,可跨单个虚拟云网络 (VCN) 中的多个可用性域运行。

以下架构显示一个 OCI 区域中典型的 Dify 三层部署,以及跨三个可用性域实现高可用性的单个 VCN:



oracle-adb-dify-arch-oracle.zip

以下列表概述了部署和连接:

  • 本地用户通过 Internet 连接到应用。
  • 请求在 VCN 中由 OCI 负载平衡器 (LB) 提供的公共负载平衡器上终止。
  • 使用入站控制器和 OCI Load Balancer 对平台进行外部访问,以访问 Dify 控制台和服务。
  • 公共负载平衡器需要不同可用性域 (Availability Domain,AD) 中的两个公共子网才能实现高可用性 (High Availability,HA)。
  • 在跨多个 AD 的 VCN 中,在 OKE 上部署 Dify Enterprise Edition。
  • 集群公开一个 kubernetes 应用程序编程接口 (application programming interface,API) 端点并运行多个 worker 节点。
  • 每个节点都托管应用程序云池。使用具有 NAT 网关的专用 pod 子网,以便 pod 连接到互联网而不会公开。
  • 容器映像使用服务网关通过 Oracle 服务网络 (OSN) 从 OCI 容器注册表提取。
  • 使用 Oracle AI Database 26ai 作为向量数据库,利用其原生向量存储/检索和企业功能(分区、RAC、分片、Exadata 优化)实现可扩展性和可靠性。

该体系结构包含以下组件:

  • OCI 地区

    OCI 区域是一个本地化的地理区域,其中包含一个或多个托管可用性域的数据中心。区域独立于其他区域,并且很远的距离可以将它们分开(跨越国家甚至大洲)。

  • 可用性域

    可用性域是区域中独立的数据中心。每个可用性域中的物理资源与其他可用性域中的资源隔离,从而提供容错能力。可用性域不共用基础设施(例如电源或冷却设备)或内部可用性域网络。因此,一个可用性域出现故障不会影响该区域中的其他可用性域。

  • OCI 虚拟云网络和子网

    虚拟云网络 (VCN) 是您可以在 OCI 区域中设置的可定制软件定义网络。与传统数据中心网络一样,VCN 允许您控制网络环境。一个 VCN 可以具有多个不重叠的无类域间路由 (classless inter-domain routing,CIDR) 块,在创建 VCN 后可以更改这些块。您可以将 VCN 细分为多个子网,这些子网可以限定为某个区域或某个可用性域。每个子网由一系列不与 VCN 中的其他子网重叠的连续地址组成。您可以在创建子网后更改子网的大小。子网可以是公共子网,也可以是专用子网。

  • 负载平衡器

    Oracle Cloud Infrastructure Load Balancer 提供从单个入口点到多个服务器的自动流量分配。

  • OCI Kubernetes 引擎

    Oracle Cloud Infrastructure Kubernetes EngineOCI Kubernetes EngineOKE )是一项完全托管、可扩展且高度可用的服务,可用于将容器化应用部署到云端。您可以指定应用所需的计算资源, OKE 可在现有租户的 OCI 上预配这些资源。OKE 使用 Kubernetes 跨主机集群自动部署、扩展和管理容器化应用。

  • Oracle AI Database 26ai

    借助 Oracle AI Database 26ai 和 AI Vector Search,您可以按含义而不是关键字查询数据。向量表示(嵌入)捕获文本、图像、音频等的语义,以便您高效地找到类似的内容。内置的 SQL 距离函数允许使用向量的相似性搜索。您可以将语义相似性和其他搜索标准组合到大语言模型 (RAG) 中,以获得更准确和相关的答案。

  • Oracle Autonomous AI Database

    Oracle Autonomous AI Database 提供易于使用、完全自治的数据库,可弹性扩展并提供快速查询性能。作为服务,它不需要数据库管理。您不需要配置或管理任何硬件,也不需安装任何软件。它可以自动处理预配、备份、打补丁和升级,以及扩展或收缩数据库,是一项弹性服务。使用内置 AI 功能,基于任意数据开发可扩展的 AI 应用。利用您选择的大语言模型 (LLM),在云或数据中心进行部署。

用例

在企业实施基于大型语言模型 (LLM) 模型和专用数据的 AI 开发计划时,Oracle AI Database 26ai 具有原生向量管理和成熟的企业级功能的双重优势,可为基于 Dify Oracle AI Database Agent 开发框架和基于 Dify 构建的 AI 应用提供稳定、高效和低阈值的数据平台解决方案。

  • 资源重用和成本优化:企业不再需要购买专用向量数据库,可以完全重用现有的 Oracle AI Database 资源,从而显著降低硬件采购和维护成本。
  • 可伸缩性:随着多模式数据(例如工业图像和音频日志)在企业 AI 应用中越来越普遍,Oracle AI Database 26ai 可以进一步扩展多模式向量检索功能,为智能制造和医疗诊断等场景提供更全面的 AI 支持。
  • 稳定性保证:利用 Oracle AI Database 在分区、RAC 和 Exadata 优化方面的多年经验,Oracle AI Database 26ai 可以轻松处理 PB 级数据卷和高并发方案,确保企业 AI 应用的 24/7 稳定运行。

Oracle AI Database 26ai 不仅是企业向量数据管理的核心载体,也是推动企业从数据存储向 AI 价值挖掘转型的关键技术基础,为企业智能升级提供了坚实的技术支持。

注意事项

在将 Dify 与 OCI 集成时,请考虑以下选项。

  • 如果可能,对应用程序/数据层使用专用子网,对安全列表使用 NSG。
  • OCI Vault 用于密钥(API 密钥、数据库身份证明)、IAM 策略最低权限以及 OCI Logging 、Monitoring 和 Alarms,以提高可观察性。
  • 考虑多个可用性域节点池和负载平衡器运行状况检查,以实现高可用性和自动扩展。

关于必需的服务和角色

此解决方案需要以下服务和角色:

  • Oracle Cloud Infrastructure
  • Oracle Autonomous AI Database
  • OCI Kubernetes 引擎
  • Dify Enterprise Edition

这些是每项服务所需的角色。

服务名称:角色 必需 ...
Dify :用户 创建由口令默认表空间标识的用户 Dify ,用户限额为 unlimited
Dify :DB_DEVELOPER_ROLE 允许管理员快速分配开发人员为 Oracle Database 设计、构建和部署应用程序所需的权限。

观看 Oracle 产品、解决方案和服务,了解您的需求。