为医疗保险分析设计数据湖

医疗保险提供商需要分析各种数据源的数据,从而改善索赔管理客户体验并防止欺诈。数据源可能包括 Web 事务处理、办公室访问、电话翻译等;通常位于多个系统中,没有通用存储、处理或可视化工具。

医疗保险提供商可以捕获大量数据并转向基于云的大数据解决方案来汇总和管理数据。Oracle Cloud Infrastructure (OCI) 数据湖中心体系结构可用于捕获、管理和获取数据洞察。借助 lakehouse 架构,您可以存储和限制结构化和非结构化数据,并访问紧密集成的服务来组织来自多个来源的大量高度多元化数据。

OCI 数据湖平台架构提供了数据湖和数据仓库功能,并提供了紧密集成的服务,例如 数据科学 Oracle Analytics Cloud,可提供全面、高级的分析体验。

以下参考体系结构介绍了平台拓扑、组件概述以及推荐的最佳实践。

体系结构

此参考体系结构的两个主要元素是 Oracle Health Insurance (OHI) 和 Oracle Revenue Management and Billing (RMB),在 Oracle Cloud 上以软件即服务形式提供。该架构结合了 Autonomous Data Warehouse (ADW) 和数据湖功能,支持基于 数据科学 服务跨集成式医疗卫生网络实施多种方案。此外,此体系结构还使用 数据目录 Oracle Analytics Cloud 等服务。

  • Oracle 医疗保险管理系统

    使保险公司能够简化医疗保健 IT,提高运营效率,降低成本并快速适应当前的市场和法规要求。它可以灵活地在一个平台上管理各种业务规则,为小型和大型医疗卫生服务提供商提供可扩展性,并为专业人员和客户提供统一的体验。它采用透明的索赔裁定和索赔处理方案来改善客户体验,同时确保云端安全性。

  • Oracle Revenue Management and Billing for Healthcare Payers

    先进的业务服务,提供:

    • 理顺和自动化计费、付款和收款流程,准确、及时地访问计费信息并控制收入损失。
    • 支持交换、个人计费和组开单、仅管理服务计费(避免损失、政府计划等),同时通过符合 HIPAA 的云解决方案尽可能降低成本和风险。
    • 通过及时、准确的计费和透明度提高客户满意度,同时通过扩展来满足大量需求。
  • Oracle Integration Cloud (OIC)

    启用云和内部部署应用的集成,并可用于:

    • 自动执行业务流程
    • 深入了解业务流程
    • 开发可视应用程序
    • 使用符合 SFTP 的文件服务器来存储和检索文件,以及与 B2B 贸易伙伴交换业务文档
Oracle Cloud Infrastructure 分类为无视图云服务提供商,可以支持 HIPAA 范围内的客户。

注意:

要确定并建立 Oracle Cloud Infrastructure 和客户各自的职责,以便根据 HIPAA 以及任何修改法规正确保护患者健康信息,必须符合业务伙伴协议。

下图介绍概念性健康保险湖中心参考体系结构。

下面是 healthcare-lakehouse-arch.png 的说明
插图 healthcare-lakehouse-arch.png 的说明

healthcare-lakehouse-arch.zip

在上面的说明中,我们可以找到以下集成:
  • OHI 通过 Oracle 保险网关 (OIG) 与 OIC 集成。
  • OHI 可以直接与 OCI 技术适配器集成(例如 REST、SOAP、文件 /SFTP、B2B、ERP),也可以通过 API Gateway 集成,使用无服务器 Oracle Functions 服务进行定制转换。
  • OIC 通过数据集成将数据发送到数据湖中的 ADW。
  • Oracle RMB 使用 Oracle GoldenGate 与数据湖中心 /ADW 集成,有可能通过 API Gateway 与 OIC 技术适配器进行其他集成。
  • Oracle ERP 和 EPM 相集成,并且 ERP 与数据湖中心和 OIC 直接集成。
  • 伊斯兰会议组织在此示例中扮演了与客户数据中心(包括 PeopleSoft 和 Siebel CRM)以及第三方应用程序的集成的附加角色。
  • 此集成使用动态路由网关 (Dynamic Routing Gateway, DRG) 和 FastConnect/VPN 连接。
  • ADW 使用查询加速器快速无缝地查询对象存储数据湖。
  • Oracle Analytics Cloud 和数据科学无缝集成了数据仓库中的其他服务。

该架构具有多种用途,包括将重要数据存储在安全、可靠、快速的检索存储中,是机器学习模块的源泉,并为内部和外部使用提供高级可视化和报告功能。

该体系结构包含以下组件:

  • Autonomous Data Warehouse

    Oracle Autonomous Data Warehouse 是一种针对数据仓库负载进行了优化的自治驱动、自治安全、自治修复的数据库服务。您不需要配置或管理任何硬件,也不需要安装任何软件。Oracle Cloud Infrastructure 处理数据库创建以及备份、修补、升级和优化数据库。

  • 对象存储

    通过对象存储,可以快速访问任意内容类型的大量结构化和非结构化数据,包括数据库备份、分析数据以及图像和视频等丰富内容。您可以安全可靠地存储数据,然后直接从互联网或云平台检索数据。您可以无缝扩展存储,而不会性能或服务可靠性降低。对需要快速、立即和频繁访问的“热”存储使用标准存储。对您长时间保留的“冷”存储使用归档存储,并且很少或很少访问。

  • 数据目录

    Oracle Cloud Infrastructure 数据目录 是适用于您的企业数据的完全托管的自助数据发现和监管解决方案。它为数据工程师、数据科学家、数据专员和首席数据官提供了单一的协作环境,可管理组织的技术、业务和运营元数据。

  • Oracle Analytics Cloud

    Oracle Analytics Cloud 是一项可扩展、安全的公有云服务,它为业务分析师提供基于 AI 的现代自助分析功能,以支持数据准备、可视化、企业报告、增强分析以及自然语言处理和生成。借助 Oracle Analytics Cloud,您还可以获得灵活的服务管理功能,包括快速设置、轻松扩展和打补丁以及自动化生命周期管理。

  • 数据科学 100Matched

    OCI 数据科学是一个完全托管的无服务器平台,它支持数据科学团队使用 OCI 构建、训练和管理机器学习 (ML) 模型。它可以轻松地与其他 OCI 服务(例如 Autonomous Data Warehouse、对象存储)集成,等等。您可以构建和评估高质量的机器学习模型,通过让企业可信的数据快速工作来提高业务灵活性,并通过易于部署的机器学习模型来支持数据驱动的业务目标。

  • Oracle Data Integration

    Oracle Cloud Infrastructure Data Integration is a fully managed, serverless, cloud-native service that extracts, loads, transforms, cleanses, and reshapes data from a variety of data sources into target Oracle Cloud Infrastructure services, such as Autonomous Data Warehouse and Oracle Cloud Infrastructure Object Storage. ETL (extract transform load) leverages fully-managed scale-out processing on Spark, and ELT (extract load transform) leverages full SQL push-down capabilities of the Autonomous Data Warehouse in order to minimize data movement and to improve the time to value for newly ingested data. Users design data integration processes using an intuitive, codeless user interface that optimizes integration flows to generate the most efficient engine and orchestration, automatically allocating and scaling the execution environment. Oracle Cloud Infrastructure Data Integration provides interactive exploration and data preparation and helps data engineers protect against schema drift by defining rules to handle schema changes.

  • GoldenGate

    Oracle Cloud Infrastructure GoldenGate 是一项完全托管的服务,它利用 GoldenGate CDC 技术实时、大规模地捕获数据和交付到 Oracle Autonomous Data Warehouse,以便向消费者提供相关信息,从而允许他们从内部部署或任何云中提取数据。

  • Oracle Functions

    Oracle Functions 是一个完全托管的多租户、高度可扩展的按需提供函数即服务 (FaaS) 平台。它由 Fn 项目开源引擎供电。使用函数可以部署代码,并可以直接调用代码或触发代码以响应事件。Oracle Functions 使用 Oracle Cloud Infrastructure Registry 中托管的 Docker 容器。

  • API 网关

    Oracle API Gateway 服务使您能够发布具有专用端点的 API,这些端点可从您的网络中访问,并且您可以在需要时公开到公共互联网。端点支持 API 验证、请求和响应转换、CORS、验证和授权以及请求限制。

  • 虚拟云网络 (VCN) 和子网

    VCN 是在 Oracle Cloud Infrastructure 区域中设置的可定制软件定义的网络。与传统的数据中心网络类似,VCN 允许您完全控制您的网络环境。VCN 可以有多个不重叠的 CIDR 块,您可以在创建 VCN 后更改这些块。您可以将 VCN 细分为多个子网,这些子网可以限定于某个区域或可用性域。每个子网都包含与 VCN 中的其他子网不重叠的连续地址范围。您可以在创建子网后更改其大小。子网可以是公共的,也可以是专用的。

  • 动态路由网关 (DRG)

    DRG 是虚拟路由器,用于为 VCN 与区域外网络之间的专用网络通信提供路径,例如另一个 Oracle Cloud Infrastructure 区域中的 VCN、内部部署网络或其他云提供商中的网络。

  • FastConnect

    Oracle Cloud Infrastructure FastConnect 提供了一种在数据中心与 Oracle Cloud Infrastructure 之间创建专用专用专用连接的方式。与基于 Internet 的连接相比,FastConnect 提供更高带宽选项和更可靠的网络体验。

  • VPN 连接

    VPN Connect 可以在您的内部部署网络与 Oracle Cloud Infrastructure 中的 VCN 之间提供站点到站点 IPSec VPN 连接。IPSec 协议套件对 IP 通信进行加密,然后将包从源传输到目标,并在到达时对通信进行解密。

建议

您的要求可能与此处介绍的体系结构有所不同。使用以下建议作为起点。
  • VCN

    创建 VCN 时,请根据您计划附加到 VCN 中的子网的资源数量确定所需的 CIDR 块数和每个块的大小。使用标准专用 IP 地址空间内的 CIDR 块。

    选择与要设置专用连接的任何其他网络(在 Oracle Cloud Infrastructure、内部部署数据中心或其他云提供商中)不重叠的 CIDR 块。

    创建 VCN 后,可以更改、添加和删除其 CIDR 块。

    设计子网时,请考虑您的流量和安全性要求。将特定层或角色中的所有资源连接到可充当安全边界的同一子网。

  • 安全性

    使用策略限制可以访问您公司拥有的 OCI 资源的人员及其访问方式。

    使用 Oracle Cloud Guard 可主动监视和维护 OCI 中的资源安全性。Cloud Guard 使用检测器配方,您可以定义这些配方来检查资源是否存在安全漏洞,并监视操作员和用户是否有风险活动。检测到任何错误配置或不安全活动时,Cloud Guard 会根据可以定义的响应方配方建议采取纠正措施并帮助执行操作。对于需要最大安全性的资源,Oracle 建议您使用安全区域。安全区域是与基于优秀实践的 Oracle 定义的安全策略配方关联的区间。例如,安全区域中的资源不能从公共互联网访问,必须使用客户管理的密钥进行加密。在安全区域中创建和更新资源时,OCI 将根据安全区域配方中的策略验证操作,并拒绝违反任何策略的操作。

  • Autonomous Data Warehouse

    此体系结构使用共享基础结构上的 Oracle Autonomous Data Warehouse。启用自动扩展,使数据库负载的处理能力达到三次。

    如果您希望在公有云上运行的专用数据库云环境中,在专用基础设施上使用 Oracle Autonomous Data Warehouse。

    考虑使用自治数据仓库的混合分区表功能将数据分区移动到 Oracle Cloud Infrastructure Object Storage,并以透明方式为用户和应用程序提供服务。我们建议将此功能用于并非经常使用的数据,并且您不需要与 Autonomous Data Warehouse 中存储的数据相同的性能。

    考虑使用外部表功能实时使用存储在 Oracle Cloud Infrastructure Object Storage 中的数据,而无需将其复制到自治数据仓库。无论 Autonomous Data Warehouse 中的数据采用何种格式(方块、通道、组织、json、csv 等等),此功能都可以透明无缝地与在 Autonomous Data Warehouse 外部弯曲的数据集联接。

    在使用对象存储数据时,可以考虑使用 ADW 查询加速器,从而为用户在数据仓库和数据湖之间使用和联接数据提供更快速的体验。

  • 对象存储

    对象存储具有可靠、经济高效的数据持久性,可快速访问任意内容类型的大量结构化和非结构化数据,包括数据库数据、分析数据、图像、视频等。我们建议使用标准存储从外部源提取数据,并将其用于进一步处理,因为它可以快速且频繁地访问。您可以构建生命周期策略,以便在不再频繁需要数据时将数据从标准存储移至冷存储。

  • 数据目录

    要全面、全面的平台上存储和流式数据端到端视图,不仅要考虑对支持数据持久性层的数据存储进行收集,还要考虑源数据存储进行收集。通过将此收集的技术元数据映射到业务词汇表并使用自定义属性进行扩充,您可以映射业务概念并记录和管理安全性和访问定义。

    为了便于创建虚拟化 Oracle Cloud Infrastructure Object Storage 上存储数据的 Oracle Autonomous Data Warehouse 外部表,请利用 Oracle Cloud Infrastructure 数据目录以前收集的元数据。这简化了外部表的创建,增强了数据存储中元数据的一致性,减少了出现人为错误的可能性。

浏览更多

了解有关数据池和 Oracle Cloud Infrastructure 的更多信息。

查看以下附加资源: