在 Oracle Cloud Infrastructure 上为 ERP 工作负载部署可扩展的 OwnGPT 模型
在 Oracle Cloud Infrastructure (OCI) 上部署 OwnGPT 可加快模型开发速度、提高工作效率并提高投资回报率 (ROI)。
此参考架构的目标是通过 OwnGPT(一种在 OCI 上部署的经过域训练的 AI 模型)使用自然语言与企业资源计划 (Enterprise Resource Planning,ERP) 数据交互,该模型最初侧重于 Oracle E-Business Suite R12(Accounts Payable and Receivable 模块),可扩展到其他模块和 ERP 平台。
我们最初的部署使用 A10 Tensor Core GPU,提供加速模型训练和推理。集成 Oracle HeatWave MySQL 可进一步提高数据库性能,而 OCI Object Storage 可确保安全高效的数据管理。利用 Oracle E-Business Suite Vision 作为主要数据源,OwnGPT 能够有效地处理结构化的企业数据。
在 OCI 的 GPU 实例上部署 OwnGPT 凸显了基础设施在促进 AI 创新方面的重要作用。OCI 在裸金属和虚拟机环境中灵活部署 GPU,支持定制配置来满足不断发展的业务需求。此外,Oracle 的低延迟远程直接内存访问 (Remote Direct Memory Access,RDMA) 网络可加速分布式模型训练,而 OCI Block 和 OCI Object Storage 可为大型数据集提供可扩展的数据管理。
体系结构
这是 AI 驱动的 ERP 解决方案 (OwnGPT) 的生产就绪 OCI 部署,专为安全、可扩展和模块化基于 AI 的查询解决方案而设计。它将 Oracle E-Business Suite (ERP) 与 Airflow、Oracle Base Database Service 、GPU Compute for GPT 和 Storage 等组件相集成,同时安全地连接到本地用户和 OCI 服务。
- 适用于 LLM 负载的 AI 就绪(GPU 驱动)
- 模块化和分层设计将负载平衡、应用和 AI 逻辑分开
- ERP 与 Oracle Oracle E-Business Suite 集成并紧密关联,可随时获得应付账款和应收账款洞察
- 通过 WAF、IAM、NAT Gateway 和 OCI 本机安全功能实现安全性和可扩展性
- 高可用性,并使用容错域来防范硬件故障
下图说明了此参考体系结构。
用户组是将通过 Web 或 VPN 访问应用程序的内部用户或业务分析师。Internet Gateway 可通过外部网络(例如员工 Web 浏览器访问)访问 OCI 环境。所有资源都存在于名为 OWNTESTHUB 的区间中,并分布在三个容错域中以实现高可用性。整个体系结构是在安全的虚拟网络中构建的。Oracle Cloud Infrastructure Web Application Firewall (WAF) 可有效防范 SQL 注入、DDoS 等威胁。
负载平衡器会在后端 Web、API 服务器之间分配传入流量,以实现可扩展性和可用性。WEB API (VM.Standard.E5)。Flex) 托管 OwnGPT 应用程序的前端和 REST API。AIRFLOW (VM.Standard.E5)。Flex) 管理任务编排、调度任务(例如模型训练或 ETL)。OWNGPT (VM.GPU.A10.2) 具有运行 OwnGPT 模型的 GPU 加速 VM,非常适合实时 AI 推断。
Oracle Autonomous Data Warehouse 存储与 ERP 相关的结构化数据(AP、AR 模块),以便快速查询。Oracle E-Business Suite 应用产品 (VM.Standard.E5)。Flex) 将后端服务用于 Oracle E-Business Suite (可能运行连接器或中间件)。OCI File Storage 提供了共享存储,可用于 Airflow DAG、应用程序构件或日志。
OCI Identity and Access Management 控制用户角色、策略和安全验证。服务网关可连接到 OCI 服务(例如 OCI Object Storage ),而无需通过互联网。OCI Object Storage 用于存储模型检查点、训练数据集、日志或归档。通过 NAT 网关,专用子网 VM 可以安全地启动出站互联网流量。响应生成模型可提取相关数据,解释 context,并生成用户可读的响应,而无需手动生成报告。
- Oracle E-Business Suite
Oracle E-Business Suite 由一组产品(人力资本管理、order management、采购和物流)组成,可支持不断发展的业务模式,提高工作效率并满足现代移动用户的需求。
您可以在 Oracle Cloud Infrastructure 上预配 Oracle E-Business Suite,或者将 Oracle E-Business Suite 环境从其数据中心迁移到 Oracle Cloud Infrastructure,从而创建多主机、安全和高可用性拓扑。
- Oracle Autonomous Data Warehouse
Oracle Autonomous Data Warehouse 是一个自治驱动、自我保护和自我修复的数据库服务,针对数据仓库工作负载进行了优化。您不需要配置或管理任何硬件,也不需安装任何软件。Oracle Cloud Infrastructure 可处理数据库的创建、备份、打补丁、升级和优化。
- OCI 对象存储
OCI Object Storage 可访问任意内容类型的大量结构化和非结构化数据,包括数据库备份、分析数据以及图像和视频等丰富内容。您可以安全地直接从应用或云平台内存储数据。您可以扩展存储,而不会出现性能或服务可靠性下降的情况。
将标准存储用于您需要快速、立即和频繁访问的“热”存储。将归档存储用于长期保留且很少或很少访问的“冷”存储。
- 文件存储
Oracle Cloud Infrastructure File Storage 提供持久、可扩展、安全的企业级网络文件系统。您可以从 VCN 中的任何裸金属、虚拟机或容器实例连接到 OCI 文件存储。您还可以使用 Oracle Cloud Infrastructure FastConnect 和 IPSec VPN 从 VCN 外部访问 OCI 文件存储。
- 身份和访问管理
Oracle Cloud Infrastructure Identity and Access Management (IAM) 为 OCI 和 Oracle Cloud Applications 提供用户访问控制。借助 IAM API 和用户界面,您可以管理身份域及其中的资源。每个 OCI IAM 身份域都代表一个独立的身份和访问管理解决方案或不同的用户群体。
推荐
- VCN
创建 VCN 时,根据您计划附加到 VCN 中的子网的资源数,确定所需的 CIDR 块数和每个块的大小。使用标准专用 IP 地址空间内的 CIDR 块。
选择与要设置专用连接的任何其他网络(在 Oracle Cloud Infrastructure 、内部部署数据中心或其他云提供商中)不重叠的 CIDR 块。
创建 VCN 后,您可以更改、添加和删除其 CIDR 块。
设计子网时,请考虑流量和安全要求。将特定层或角色中的所有资源附加到同一子网,该子网可以用作安全边界。
注意事项
实施此参考体系结构时,请考虑这些选项。
- AI 处理
OwnGPT 使用 AP、AR 模块中经过训练的 context 处理查询。
- 输出传送
通过 UI 或聊天界面实时或近乎实时地返回响应。
- 技术指标
- 响应时间:平均 1.2 秒,第 95 个百分位 2.5 秒,复杂查询最多 3.7 秒。
- 吞吐量:峰值 120 个并发用户,每分钟 500 个查询,API 成功率为 99.97%。
- 资源利用率:CPU 42% 平均值(78% 峰值)、内存 4.2GB(最大 7.1GB)、存储效率 12MB(每个公司用于向量数据)。
- 可扩展性:直线扩展至 50 家公司,性能稳定,文档块超过 100,000 个,同时连接超过 25 个。
- 业务影响
- 生产率:搜索时间缩短 68%,重复技术查询减少 42%,每周节省 3.5 小时。
- 准确度:92% 针对公司特定问题,87% 针对技术查询,95% 针对源识别。
- 用户满意度:4.7/5 评级,94% 的合格员工采用,76% 的支持票减少。
- 投资回报率:4.2 个月内收支平衡,12 个月内投资回报率为 327%,估计中型部署每年可节省 142,000 美元。