Oracle Cloud 上部署多云公共卫生数据管理平台

在新冠疫情肆虐之后,加强医疗基础设施仍然是美国公共卫生机构的首要任务。虽然一些机构仍在规划阶段,但该国首都的公共卫生官员已转向 Tharseo IT 来帮助他们实施数据驱动的计划和政策开发方法,在 Oracle Cloud Infrastructure (OCI) 上部署一个全双工数据管理平台。

在华盛顿特区,DC Health 帮助居民和游客识别健康风险,预防和控制疾病,治疗伤害,避免暴露于环境危害,并提供公平的公共卫生和人类服务。

虽然 DC Health 仅负责收集公共健康记录,但它以前通过第三方供应商管理和分析这些记录。这种安排不仅阻碍了数据可视化和解释的努力,还破坏了该机构立即根据任何见解采取行动的能力。为了解决这个问题,DC Health 创建了一个多云“数据桥梁”,在各州机构、联邦政府、公共卫生官员和其他利益相关者之间移动数据。

架构的亮点包括:

  • 在 Oracle Cloud Infrastructure 上不受限制地访问在安全的政府云区域中管理的数据
  • 由美国国会和白宫管理的 Amazon Web Services 、OCI 和私有云之间的多云集成
  • 数据桥平台,从个人、学校、医院、药店以及各种数据库和应用中摄取数据
  • 使用 Oracle GoldenGate 实时同步数据,并存储在 Oracle Autonomous Data Warehouse
自从在 OCI 上部署数据桥梁以来,Tharseo IT 帮助公共卫生服务机构执行以下操作:
  1. 按需生成临时报表
  2. 立即与公众沟通即将到来的健康风险、个性化的治疗方案以及可用的服务提供商
  3. 随着新疾病和药物治疗的出现,入职供应商和医疗保健服务提供商迅速进入公共卫生系统

体系结构

Tharseo IT 使用 Oracle Base Database ServiceOracle GoldenGateOracle Cloud Infrastructure (OCI) Government Region East (Ashburn) 上托管,为 DC Health 构建和部署了数据桥梁。 数据桥使用双节点 Oracle Base Database ServiceOracle Real Application Clusters (Oracle RAC)Oracle Autonomous Data Warehouse 将多个应用和数据库集成到一个集中式暂存数据库中。

第一个集成点是该州用于跟踪疫苗接种的 SaaS 应用程序。此应用程序托管在第三方云上,并通过站点到站点 VPN 隧道进行连接。Oracle GoldenGate 中心部署在第三方云中,有助于将数据从 SaaS 应用数据库提取到该州 OCI 租户中的 Oracle GoldenGate 管理器实例。然后,数据存储在中转数据库中。

第二个集成点允许各个美国联邦政府机构与 Oracle Autonomous Data Warehouse 集成,以在联邦级别报告州数据。

第三集成点集成了其他状态健康应用,这些应用托管在从其他云到内部部署的各种位置。这些集成还使用各种数据集成工具,根据需要通过 Oracle GoldenGate 推送到暂存数据库并推送到数据仓库。

下图说明了此参考体系结构。

后面是 tharseo-data-platform-oci-arch.png 的说明
插图 tharseo-data-platform-oci-arch.png 的说明

tharseo-data-platform-oci-arch-oracle.zip

数据科学家和 DBA 可以从通过站点到站点 VPN 连接的内部部署网络访问暂存数据库和数据仓库。数据科学家可以访问 Oracle Autonomous Data Warehouse ,并通过 Tableau Web Layer API 运行分析。

为了获得额外的安全层,国家机构使用部署在不同位置的防火墙来执行规则和策略,并过滤网络流量。除了防火墙外,DC Health 还在 OCI 租户的子网中实施了安全列表和网络安全组。IP 隧道受 IP 地址的限制,以确保仅允许可信的源 IP 地址进入虚拟云网络 (VCN)。该状态使用 Oracle Cloud Infrastructure Block Storage 和 Oracle Cloud Infrastructure File Storage 来提供更多存储功能

对于灾难恢复 (Disaster Recovery,DR),该状态会频繁将数据库备份到 Oracle Cloud Infrastructure Object Storage ,并将备份卸载到 OCI Government Cloud Region Phoenix 和本地,以获得其他备份副本。

该体系结构包含以下组件:

  • Tenancy

    租户是 Oracle 在您注册 OCI 时在 Oracle Cloud 中设置的安全隔离分区。您可以在租户的 OCI 上创建、组织和管理资源。租户是公司或组织的同义词。通常,公司将具有单个租户,并反映其在该租户中的组织结构。单个租户通常与单个订阅关联,而单个订阅通常只有一个租户。

  • 区域

    OCI 区域是一个本地化的地理区域,其中包含一个或多个托管可用性域的数据中心。区域独立于其他区域,并且很远的距离可以将它们分开(跨越国家甚至大洲)。

  • 可用性域

    可用性域是区域中独立的数据中心。每个可用性域中的物理资源与其他可用性域中的资源隔离,从而提供容错能力。可用性域不共用基础设施(例如电源或冷却设备)或内部可用性域网络。因此,一个可用性域出现故障不会影响该区域中的其他可用性域。

  • 虚拟云技术网络 (VCN) 和子网

    虚拟云网络 (VCN) 是您可以在 OCI 区域中设置的可定制软件定义网络。与传统数据中心网络一样,VCN 允许您控制网络环境。一个 VCN 可以具有多个不重叠的无类域间路由 (classless inter-domain routing,CIDR) 块,在创建 VCN 后可以更改这些块。您可以将 VCN 细分为多个子网,这些子网可以限定为某个区域或某个可用性域。每个子网由一系列不与 VCN 中的其他子网重叠的连续地址组成。您可以在创建子网后更改子网的大小。子网可以是公共子网,也可以是专用子网。

  • 路由表

    虚拟路由表包含用于将流量从子网路由到 VCN 之外目标(通常通过网关)的规则。

  • 服务网关

    通过服务网关,您可以从 VCN 访问其他服务,例如 Oracle Cloud Infrastructure Object Storage 。从 VCN 到 Oracle 服务的流量将通过 Oracle 网络结构传输,不会通过互联网。

  • OCI 对象存储

    OCI Object Storage 可访问任意内容类型的大量结构化和非结构化数据,包括数据库备份、分析数据以及图像和视频等丰富内容。您可以安全地直接从应用或云平台内存储数据。您可以扩展存储,而不会出现性能或服务可靠性下降的情况。

    将标准存储用于您需要快速、立即和频繁访问的“热”存储。将归档存储用于长期保留且很少或很少访问的“冷”存储。

  • Oracle Autonomous Database

    Oracle Autonomous Database 是一个完全托管的预配置数据库环境,可用于事务处理和数据仓库工作负载。您不需要配置或管理任何硬件,也不需安装任何软件。OCI 可处理数据库创建、备份、打补丁、升级和调优。

  • 安全列表

    您可以为每个子网创建安全规则,以指定允许进出子网的通信的源、目标和类型。

  • GoldenGate

    Oracle GoldenGate Cloud Service 是一项完全托管的服务,允许从本地或任何云端的源摄取数据。它利用 GoldenGate Change Data Capture (CDC) 技术,实时、大规模地捕获数据并将其交付到 Oracle Autonomous Data Warehouse

  • Oracle Base Database Service

    借助 Oracle Base Database Service,您可以保持对数据的绝对控制,同时利用 Oracle Database 和 Oracle Cloud Infrastructure 的综合功能。Oracle Cloud Infrastructure (OCI) 在虚拟机上提供单节点数据库系统和多节点 RAC 数据库系统。

  • OCI 站点到网站 VPN

    OCI Site-to-Site VPN 可在内部部署网络与 OCI 上的 VCN 之间提供 IPSec VPN 连接。IPSec 协议套件在数据包从源传输到目标之前对 IP 通信进行加密,并在数据包到达时对通信进行解密。

  • OCI 文件存储

    Oracle Cloud Infrastructure File Storage 提供持久、可扩展、安全的企业级网络文件系统。您可以从 VCN 中的任何裸金属、虚拟机或容器实例连接到 OCI 文件存储。您还可以使用 Oracle Cloud Infrastructure FastConnect 和 IPSec VPN 从 VCN 外部访问 OCI 文件存储

  • OCI 块存储卷

    借助 Oracle Cloud Infrastructure Block Volumes ,您可以创建、附加、连接和移动存储卷,并更改卷性能,以满足存储、性能和应用需求。连接卷并将其连接到实例后,您可以像常规硬盘驱动器那样使用该卷。您还可以断开卷的连接并将其附加到另一个实例,而不会丢失数据。

  • 数据集成

    Oracle Cloud Infrastructure Data Integration 是一个完全托管、无服务器、云原生服务,可提取、加载、转换、清理和重塑各种数据源中的数据,并将其转变为目标 Oracle Cloud Infrastructure 服务,例如 Autonomous Data WarehouseOracle Cloud Infrastructure Object Storage 。ETL(提取转换加载)在 Spark 上利用完全托管的横向扩展处理,ELT(提取加载转换)利用 Autonomous Data Warehouse 的完整 SQL 下推功能,以最大限度地减少数据移动并缩短新摄取的数据实现价值的时间。用户使用直观、无代码的用户界面设计数据集成流程,优化集成流,生成高效的引擎和编排,自动分配和扩展执行环境。Oracle Cloud Infrastructure Data Integration 提供了交互式研究和数据准备功能,可帮助数据工程师通过定义规则来处理模式更改,从而防止模式偏差。

  • 备份/还原

    Oracle Database Backup Cloud Service 是一个安全、可扩展的按需存储解决方案,用于将 Oracle 数据库备份到 Oracle Cloud。该服务通过在公共云中提供异地存储位置来补充您现有的备份策略。如果需要,您可以使用 Oracle Cloud 中存储的备份执行数据库还原和恢复。

  • 动态路由网关 (DRG)

    DRG 是一个虚拟路由器,用于为同一区域中的 VCN、VCN 与该区域之外的网络(例如另一个 OCI 区域中的 VCN、内部部署网络或其他云提供商中的网络)之间的专用网络流量提供路径。

  • Internet 网关

    互联网网关允许 VCN 中的公共子网与公共互联网之间的流量。

确认

  • Authors: Robert Huie, Sasha Banks-Louie
  • Contributors: Brian Keehn, Brad Goodwin

    Tharseo Team: Zach Ehrhardt, HeeMin Kim