在 Oracle Cloud 上部署多云公共卫生数据管理平台
在华盛顿特区,DC Health 帮助居民和游客识别健康风险,预防和控制疾病,治疗伤害,避免暴露于环境危害,并提供公平的公共卫生和人类服务。
虽然 DC Health 仅负责收集公共健康记录,但它以前通过第三方供应商管理和分析这些记录。这种安排不仅阻碍了数据可视化和解释的努力,还破坏了该机构立即根据任何见解采取行动的能力。为了解决这个问题,DC Health 创建了一个多云“数据桥梁”,在各州机构、联邦政府、公共卫生官员和其他利益相关者之间移动数据。
架构的亮点包括:
- 在 Oracle Cloud Infrastructure 上不受限制地访问在安全的政府云区域中管理的数据
- 由美国国会和白宫管理的 Amazon Web Services 、OCI 和私有云之间的多云集成
- 数据桥平台,从个人、学校、医院、药店以及各种数据库和应用中摄取数据
- 使用 Oracle GoldenGate 实时同步数据,并存储在 Oracle Autonomous Data Warehouse 中
- 按需生成临时报表
- 立即与公众沟通即将到来的健康风险、个性化的治疗方案以及可用的服务提供商
- 随着新疾病和药物治疗的出现,入职供应商和医疗保健服务提供商迅速进入公共卫生系统
体系结构
第一个集成点是该州用于跟踪疫苗接种的 SaaS 应用程序。此应用程序托管在第三方云上,并通过站点到站点 VPN 隧道进行连接。Oracle GoldenGate 中心部署在第三方云中,有助于将数据从 SaaS 应用数据库提取到该州 OCI 租户中的 Oracle GoldenGate 管理器实例。然后,数据存储在中转数据库中。
第二个集成点允许各个美国联邦政府机构与 Oracle Autonomous Data Warehouse 集成,以在联邦级别报告州数据。
第三集成点集成了其他状态健康应用,这些应用托管在从其他云到内部部署的各种位置。这些集成还使用各种数据集成工具,根据需要通过 Oracle GoldenGate 推送到暂存数据库并推送到数据仓库。
下图说明了此参考体系结构。

插图 tharseo-data-platform-oci-arch.png 的说明
tharseo-data-platform-oci-arch-oracle.zip
数据科学家和 DBA 可以从通过站点到站点 VPN 连接的内部部署网络访问暂存数据库和数据仓库。数据科学家可以访问 Oracle Autonomous Data Warehouse ,并通过 Tableau Web Layer API 运行分析。
为了获得额外的安全层,国家机构使用部署在不同位置的防火墙来执行规则和策略,并过滤网络流量。除了防火墙外,DC Health 还在 OCI 租户的子网中实施了安全列表和网络安全组。IP 隧道受 IP 地址的限制,以确保仅允许可信的源 IP 地址进入虚拟云网络 (VCN)。该状态使用 Oracle Cloud Infrastructure Block Storage 和 Oracle Cloud Infrastructure File Storage 来提供更多存储功能
对于灾难恢复 (Disaster Recovery,DR),该状态会频繁将数据库备份到 Oracle Cloud Infrastructure Object Storage ,并将备份卸载到 OCI Government Cloud Region Phoenix 和本地,以获得其他备份副本。
该体系结构包含以下组件:
- Tenancy
租户是 Oracle 在您注册 OCI 时在 Oracle Cloud 中设置的安全隔离分区。您可以在租户的 OCI 上创建、组织和管理资源。租户是公司或组织的同义词。通常,公司将具有单个租户,并反映其在该租户中的组织结构。单个租户通常与单个订阅关联,而单个订阅通常只有一个租户。
- 区域
OCI 区域是一个本地化的地理区域,其中包含一个或多个托管可用性域的数据中心。区域独立于其他区域,并且很远的距离可以将它们分开(跨越国家甚至大洲)。
- 可用性域
可用性域是区域中独立的数据中心。每个可用性域中的物理资源与其他可用性域中的资源隔离,从而提供容错能力。可用性域不共用基础设施(例如电源或冷却设备)或内部可用性域网络。因此,一个可用性域出现故障不会影响该区域中的其他可用性域。
- 虚拟云技术网络 (VCN) 和子网
虚拟云网络 (VCN) 是您可以在 OCI 区域中设置的可定制软件定义网络。与传统数据中心网络一样,VCN 允许您控制网络环境。一个 VCN 可以具有多个不重叠的无类域间路由 (classless inter-domain routing,CIDR) 块,在创建 VCN 后可以更改这些块。您可以将 VCN 细分为多个子网,这些子网可以限定为某个区域或某个可用性域。每个子网由一系列不与 VCN 中的其他子网重叠的连续地址组成。您可以在创建子网后更改子网的大小。子网可以是公共子网,也可以是专用子网。
- 路由表
虚拟路由表包含用于将流量从子网路由到 VCN 之外目标(通常通过网关)的规则。
- 服务网关
通过服务网关,您可以从 VCN 访问其他服务,例如 Oracle Cloud Infrastructure Object Storage 。从 VCN 到 Oracle 服务的流量将通过 Oracle 网络结构传输,不会通过互联网。
- OCI 对象存储
OCI Object Storage 可访问任意内容类型的大量结构化和非结构化数据,包括数据库备份、分析数据以及图像和视频等丰富内容。您可以安全地直接从应用或云平台内存储数据。您可以扩展存储,而不会出现性能或服务可靠性下降的情况。
将标准存储用于您需要快速、立即和频繁访问的“热”存储。将归档存储用于长期保留且很少或很少访问的“冷”存储。
- Oracle Autonomous Database
Oracle Autonomous Database 是一个完全托管的预配置数据库环境,可用于事务处理和数据仓库工作负载。您不需要配置或管理任何硬件,也不需安装任何软件。OCI 可处理数据库创建、备份、打补丁、升级和调优。
- 安全列表
您可以为每个子网创建安全规则,以指定允许进出子网的通信的源、目标和类型。
- GoldenGate
Oracle GoldenGate Cloud Service 是一项完全托管的服务,允许从本地或任何云端的源摄取数据。它利用 GoldenGate Change Data Capture (CDC) 技术,实时、大规模地捕获数据并将其交付到 Oracle Autonomous Data Warehouse 。
- Oracle Base Database Service
借助 Oracle Base Database Service,您可以保持对数据的绝对控制,同时利用 Oracle Database 和 Oracle Cloud Infrastructure 的综合功能。Oracle Cloud Infrastructure (OCI) 在虚拟机上提供单节点数据库系统和多节点 RAC 数据库系统。
- OCI 站点到网站 VPN
OCI Site-to-Site VPN 可在内部部署网络与 OCI 上的 VCN 之间提供 IPSec VPN 连接。IPSec 协议套件在数据包从源传输到目标之前对 IP 通信进行加密,并在数据包到达时对通信进行解密。
- OCI 文件存储
Oracle Cloud Infrastructure File Storage 提供持久、可扩展、安全的企业级网络文件系统。您可以从 VCN 中的任何裸金属、虚拟机或容器实例连接到 OCI 文件存储。您还可以使用 Oracle Cloud Infrastructure FastConnect 和 IPSec VPN 从 VCN 外部访问 OCI 文件存储。
- OCI 块存储卷
借助 Oracle Cloud Infrastructure Block Volumes ,您可以创建、附加、连接和移动存储卷,并更改卷性能,以满足存储、性能和应用需求。连接卷并将其连接到实例后,您可以像常规硬盘驱动器那样使用该卷。您还可以断开卷的连接并将其附加到另一个实例,而不会丢失数据。
- 数据集成
Oracle Cloud Infrastructure Data Integration 是一个完全托管、无服务器、云原生服务,可提取、加载、转换、清理和重塑各种数据源中的数据,并将其转变为目标 Oracle Cloud Infrastructure 服务,例如 Autonomous Data Warehouse 和 Oracle Cloud Infrastructure Object Storage 。ETL(提取转换加载)在 Spark 上利用完全托管的横向扩展处理,ELT(提取加载转换)利用 Autonomous Data Warehouse 的完整 SQL 下推功能,以最大限度地减少数据移动并缩短新摄取的数据实现价值的时间。用户使用直观、无代码的用户界面设计数据集成流程,优化集成流,生成高效的引擎和编排,自动分配和扩展执行环境。Oracle Cloud Infrastructure Data Integration 提供了交互式研究和数据准备功能,可帮助数据工程师通过定义规则来处理模式更改,从而防止模式偏差。
- 备份/还原
Oracle Database Backup Cloud Service 是一个安全、可扩展的按需存储解决方案,用于将 Oracle 数据库备份到 Oracle Cloud。该服务通过在公共云中提供异地存储位置来补充您现有的备份策略。如果需要,您可以使用 Oracle Cloud 中存储的备份执行数据库还原和恢复。
- 动态路由网关 (DRG)
DRG 是一个虚拟路由器,用于为同一区域中的 VCN、VCN 与该区域之外的网络(例如另一个 OCI 区域中的 VCN、内部部署网络或其他云提供商中的网络)之间的专用网络流量提供路径。
- Internet 网关
互联网网关允许 VCN 中的公共子网与公共互联网之间的流量。