在 OCI 上运行 Palantir Foundry 和人工智能平台

Palantir Foundry and Artificial Intelligence Platform (AIP) 是一个强大的数据集成、数据建模、低代码开发和分析平台,可以部署在 Oracle Cloud Infrastructure (OCI) 上。Palantir 的行业领先技术可以惠及各种客户细分,包括政府和国防、金融和银行、医疗保健、生命科学、电信、能源和公用事业以及制造。您可以使用此功能强大的整理和集成工具集将复杂数据转化为切实可行的洞察。

Palantir Foundry 和 AIP 是在 OCI 上运行的软件即服务 (SaaS) 产品。规模、安装和集成活动都是高度定制的,传统上是与 Palantir 客户部署团队合作完成的。此处描述的体系结构仅用于信息和高级规划目的。要完成实施 Foundry 和 AIP 的过程,请联系 Palantir 客户团队并直接与他们合作。

体系结构

该架构从功能和面向部署的角度提供了 Foundry 的技术概述。

下图是基于 OCI 的 Foundry 和 AIP 的功能视图。

下面是 palantir-foundry-aip-functional-view.png 的说明
插图 palantir-foundry-aip-functional-view.png 的说明

palantir-foundry-aip-functional-view-oracle.zip

在图表的中间,我们看到了 Palantir Foundry 和 AIP 及其关键组件,例如在 OCI 租户内运行的数据集成、本体、决策、建模、分析、应用构建和核心服务,并利用了核心 OCI 功能,例如灵活计算、实例池、 OCI Object StorageOCI Identity and Access ManagementOracle Key Management Cloud Service 、灵活的负载平衡器即服务等。

客户数据使用 Palantir 的标准数据集成模式从各种数据源摄取到 Foundry 中,无论是公共数据源(公共 API、第三方 SaaS)、在 OCI 中运行的专用源(例如 MySQL HeatWave 或 Oracle Autonomous Database),还是通过 Palantir 的本地代理在本地网络或其他云中运行的专用源。

架构中描述的某些方面是定制的解决方案,这些解决方案不是 Foundry 的产品化功能,并且依赖于客户自己的租户内定制的 OCI 服务实施来与 Foundry 一起工作。有关更多详细信息,请参见本文档的“注意事项”部分。

下图是 OCI 上的 Foundry 和 AIP 的面向部署视图。下面是 palantir-foundry-aip-technical-view.png 的说明
图 palantir-foundry-AIP-technical-view.png 的说明

palantir-foundry-aip-technical-view-oracle.zip

基于 OCI 的 Foundry 利用 OCI 的高可用性结构,在一个区域(如果适用)内构建多个可用性域 (AD) 以及每个 AD 中的多个容错域 (FD)。

公共 API 和其他云服务提供商 (Cloud Service Provider,CSP) 的所有公共互联网数据源都通过传输层加密的互联网网关流入和流出公共子网,而专用子网则利用 OCI 服务网关与 OCI Object Storage 和其他 OCI 平台服务进行私密通信。专用子网中的实例还利用 NAT 网关与 OCI 外部的任何 Palantir 共享服务进行通信;这些服务包括 Palantir 的管理层以及名为 Apollo 的观测和管理平台。客户还可以选择利用 OCI FastConnect 而非站点到站点 VPN,或通过站点到站点 VPN 将其内部部署系统与其 Palantir 租户集成。

此架构支持以下 OCI 组件:

  • Tenancy

    租户是 Oracle 在您注册 Oracle Cloud Infrastructure 时在 Oracle Cloud 中设置的安全隔离分区。您可以在您的租户内的 Oracle Cloud 中创建、组织和管理资源。租户是公司或组织的同义词。通常,公司将具有单个租户并反映其在该租户中的组织结构。单个租户通常与单个订阅关联,单个订阅通常只有一个租户。

  • 区域

    Oracle Cloud Infrastructure 区域是包含一个或多个数据中心(称为可用性域)的本地化地理区域。地区独立于其他地区,远距离可以把它们分开(跨越国家甚至大陆)。

  • 可用性域

    可用性域是区域中的独立数据中心。每个可用性域中的物理资源与其他可用性域中的资源隔离,从而提供容错能力。可用性域不共享电源或冷却设备等基础设施,也不共享内部可用性域网络。因此,一个可用性域出现故障不会影响区域中的其他可用性域。

  • 容错域

    容错域是可用性域内的一组硬件和基础设施。每个可用性域都有三个容错域,它们具有独立的电源和硬件。在多个容错域之间分配资源时,应用可以承受容错域内的物理服务器故障、系统维护和电源故障。

  • 虚拟云网络 (VCN) 和子网

    VCN 是一个可定制的软件定义网络,您可以在 Oracle Cloud Infrastructure 区域中设置。与传统的数据中心网络一样,VCN 允许您控制您的网络环境。VCN 可以具有多个不重叠的 CIDR 块,您可以在创建 VCN 后更改这些块。您可以将 VCN 划分为子网,子网可以限定为区域或可用性域。每个子网都包含一系列不与 VCN 中的其他子网重叠的连续地址。可以在创建后更改子网的大小。子网可以是公共子网,也可以是专用子网。

  • 安全列表

    对于每个子网,可以创建安全规则来指定必须允许进出子网的通信的源、目标和类型。

  • 站点到站点 VPN

    站点到站点 VPN 在您的内部部署网络与 Oracle Cloud Infrastructure 中的 VCN 之间提供 IPSec VPN 连接。IPSec 协议套件在数据包从源传输到目标之前对 IP 流量进行加密,并在数据包到达时对流量进行解密。

  • FastConnect

    Oracle Cloud Infrastructure FastConnect 提供了一种在您的数据中心与 Oracle Cloud Infrastructure 之间创建专用私有连接的简便方式。与基于 Internet 的连接相比,FastConnect 提供了更高的带宽选项和更可靠的网络体验。

  • Internet 网关

    通过互联网网关,可以在 VCN 中的公共子网与公共互联网之间进行流量传输。

  • 网络地址转换 (NAT) 网关

    通过 NAT 网关,VCN 中的专用资源可以访问 Internet 上的主机,而不会向传入的 Internet 连接公开这些资源。

  • 服务网关

    通过服务网关,您可以从 VCN 访问其他服务,例如 Oracle Cloud Infrastructure Object Storage 。从 VCN 到 Oracle 服务的流量通过 Oracle 网络结构传输,不会通过互联网传输。

  • 计算服务

    借助 Oracle Cloud Infrastructure Compute ,您可以在云中预配和管理计算主机。您可以通过配置启动计算实例,以满足对 CPU、内存、网络带宽和存储的资源要求。创建计算实例后,可以安全地访问该实例,重新启动该实例,附加和分离卷,并在不再需要时终止该实例。

  • 对象存储

    Oracle Cloud Infrastructure Object Storage 支持您快速访问任意内容类型的大量结构化和非结构化数据,包括数据库备份、分析数据以及图像和视频等丰富内容。您可以安全地存储数据,然后直接从互联网或云平台检索数据。您可以在不降低性能或服务可靠性的情况下扩展存储。将标准存储用于需要快速、立即和频繁访问的“热”存储。将归档存储用于长期保留、很少访问或很少访问的“冷”存储。

以下是 Palantir 组件:

  • 数据集成服务

    Foundry 提供了一组高度可配置的数据连接和集成工具,这些工具远远超出了典型的提取 - 转换 - 加载 (ETL) 或提取 - 加载 - 转换 (ELT) 解决方案。Foundry 旨在通过一系列丰富的功能来降低数据集成成本,这些功能是数据团队的力量倍增器。

  • 本体

    Palantir Ontology 是该组织的运营层。Ontology 位于集成到 Palantir 平台(数据集和模型)的数字资产之上,并将它们与现实世界的对应物连接起来,从工厂,设备和产品等实物资产到客户订单或金融交易等概念。在许多设置中,Ontology 是组织的数字孪生体,包含启用所有类型的用例所需的语义元素(对象,属性,链接)和动能元素(操作,函数,动态安全性)。

  • Palantir 管理层

    管理层是外部 Palantir 控制器,可安全地编排多个客户环境的操作。

  • 阿波罗升级和遥测

    Apollo 是一个由 Palantir 开发的连续交付和编排平台。它旨在跨各种环境(包括云、内部部署和边缘设备)自动部署、扩展和维护复杂的软件应用。Apollo 使公司能够安全可靠地部署其软件,从而管理与大规模运行关键应用相关的运营挑战。

  • 审计安全信息和事件管理 (SIEM)

    所有 Palantir 服务的审计日志首先写入磁盘,然后在写入后 24 小时内归档到 OCI Object Storage 存储桶。访问这些存储桶受到严格限制。Palantir 客户可以选择启用审计基础设施,将审计日志从归档导出到每个组织的数据集,以便在 Foundry 或下游 SIEM 中进行分析。

推荐

每个 Foundry 部署都安装在自己的租户中,并位于具有两个子网(一个公共子网和一个专用子网)的虚拟云网络中。专用子网托管在 OCI 实例池中运行的 Foundry 和 AIP 控制层 (CP) 和数据层 (DP),以便按工作负载需求上下扩展节点数。

作为在 OCI 上运行并由 Palantir 管理的软件即服务 (SaaS) 应用的使用者,您无需担心各个 OCI 结构,例如 VCN、子网、安全列表、网络安全组或网关。无论您的 Palantir 实施是在您的租户中还是在 Palantir 的租户中,Palantir 工程师都可以应用 OCI 优秀实践来确保为 Foundry 和人工智能平台优化使用 OCI 资源。

注意事项

计划使用 OCI 运行 Palantir 时,请考虑以下事项。

  • OCI 租户

    Palantir 经过认证,可以在 OCI 中以单租户容量运行,既可以在客户租户内运行,也可以代表 Palantir 自己的 OCI 租户内的客户运行。

  • 子网

    公共子网最多托管三个绑定到保留 OCI 公共 IP 的 Foundry 出站路由器和负载平衡器实例,这些实例优先于 Kubernetes 的“服务”类型。

  • 部署

    Palantir Foundry 和人工智能平台不能自行部署。请与 Oracle 和 Palantir 客户团队合作,以预配可供您使用的环境。

  • 自定义实施

    架构的某些方面具有前瞻性,目前尚未实施。他们依靠您自己的租户内定制的 OCI 服务实施来与 Foundry 协同工作。您的 Palantir 和 Oracle 客户团队可以帮助您完成以下工作:

    • 统一集成

      Oracle Integration 的目录包含一百多个适配器,适用于各种第三方和 Oracle 应用。通过使用原生适配器将 Foundry 插入此生态系统,现有 Oracle Integration 流的客户可以将 Foundry 包括在其编排中,并使 Palantir 可以快速轻松地从更广泛的 Oracle 应用生态系统(包括 Oracle Fusion、E-Business Suite、Oracle Property Management (Opera) 和 Oracle Health (Cerner))摄取数据。

    • 报表和分析

      虽然 Palantir 客户已经可以访问 Foundry 中的报告和可视化,但一些客户可以选择将 Foundry 的数据集成到更广泛的组织报告和仪表盘中。对于此类用例,请考虑将 Foundry 与 Oracle Analytics Cloud 集成。

    • 机器学习和 AI

      Foundry 附带了机器学习 (ML) 模型构建和部署工具。对于投资或感兴趣 Oracle AI 和机器学习工具(例如数据科学或数据目录)的客户,两个建模套件之间的集成可能是有利的。

浏览更多

详细了解 Oracle Cloud Infrastructure 和 Palantir。

确认

  • 作者Ed Shnekendorf, Distinguished Cloud Architect, Oracle Cloud Infrastructure