了解 OCI AI 和 ML 如何改善患者体验

与任何企业一样,医疗保健都需要能够访问、分析、操纵和存储大量数据。这种数据处理对 Oracle Cloud Infrastructure Lakehouse (数据资源池)背后的技术至关重要,有助于人工智能 (AI) 和机器学习 (ML) 改善患者体验。

在患者经验方面,医疗保健系统的设置应考虑:

  • 尽可能快地向临床医生提供准确的患者信息,以减轻不必要的负担,让临床医生尽可能多地处理患者的情况。
  • 让患者从症状中尽快康复。
  • 无论患者、医疗保险还是公共卫生服务(e.g,英国国家卫生服务)是否承担了费用,确保这一过程尽可能具有成本效益。

例如,一般从业者 (GP) 或初级护理提供者 (PCP) 认为他们的患者正在显示肺炎的迹象。他们将患者送往医疗中心(医院或成像中心)进行胸部 X 光检查,以检查肺炎或其他因素是否导致患者的症状。此过程的第一步是与医疗中心设置预约,并共享患者的电子医疗记录 (EMR) 或电子健康记录 (EHR)。理想情况下,这些数据将合并到数据池中。

医疗中心的放射科人员将采用 X 射线,但从这一点开始,数据湖和相关技术在诊断过程中发挥了积极作用。x 射线图像是使用放射学信息系统 (RIS) 创建的,并使用图片归档和通信系统 (PACS) 或新一代的数据存储(如供应商中立档案 (Vendor Neutral Archive,VNA) 进行存储。这些图像可能使用医疗成像格式(例如医疗中的数字成像和通信 (DICOM))存储,该格式存储具有相关元数据的高分辨率图像,例如有关图像生成位置和生成时间以及模式类型(如何捕获图像)的详细信息。此元数据与正确的患者及其记录关联。

收集图像后,临床医生检查并解释每个图像,以确定患者的临床需求。这是一个耗时的过程,通常导致患者在家里等待更多信息。

本手册将重点介绍数据资源池如何参与提供我们描述的结果的解决方案。

本手册将重点介绍涉及地区医院的一个用例所涉及的系统,并会标出相关领域,但不会进入解决方案细节。

体系结构

此架构展示了医疗中心访问和使用 OCI 数据资源池。



  1. 初始设置可能需要使用数据传输服务来高效、经济高效地将所有现有数据从 PACS 解决方案迁移到 Oracle Cloud Infrastructure (OCI) 进行处理。如果正在进行的操作的连接性能有问题,这可以扩展到每日传输。除了 PAC 数据外,这还可用来批量发运患者记录和关联信息。
  2. 其他数据源(例如在医疗提供商之间共享 EMR 的协作)可能包括患者的 GP 或 PCP。
  3. 该函数用于执行复杂的数据处理。例如,它们从 DICOM 映像提取元数据。这些流程太复杂,无法在持久性工具和业务逻辑中有效地执行操作。这意味着每次引入新的复杂非结构化数据对象(例如新类型的映像)时,我们都可以在新逻辑中进行缝合。
  4. 进出服务的数据支持患者 EHR/EMR 的共享。
  5. 如方案中所述,与用例(例如对患者的额外洞察)相关的数据越多,就能获得更多洞察。例如,CDC 数据集社会健康决定因素 (SDOH) 为各种健康状况的社会经济指标提供 API。
  6. 这反映了直接或间接用于支持安全和平台和解决方案可操作性的服务数量。
  7. 数据资源池服务已分组。根据具体用例,并非所有服务都需要。
  8. 主要期望值以 Web 服务为中心,因为第三方将隐瞒其数据的处理方式。这也反映了诸如 FHIR 等标准发展的方向。

如图所示,医疗中心与 OCI 环境之间的数据流通过 VPN 进行保护,并在性能方面保证使用 Oracle Cloud Infrastructure FastConnect (FastConnect),尽管成像数据大量来回移动。

PACS 或 VNA 解决方案可以通过多种方式集成,具体取决于 PACS 解决方案的功能,从简单地将 PACS 存储公开到可以定期轮询的受限 FTP 服务器(e.g,每 10 到 15 分钟),到与消息交换的 DICOM 通信模型对齐的 API 规范。我们可以在架构图中看到,使用 OCI 功能取代本地 PACS 也是一种可能。

提供的定制函数可以在 DICOM 中提取与图像相关的元数据。提取的元数据可以单独存储,以支持快速搜索内容,因为在每次执行搜索时不必询问图像。

虽然使用各种协议和技术可以与其他数据源集成,但首选机制是采用 FHIR REST API。然而,提供的集成工具提供了广泛的集成技术和协议。请注意,FHIR 无法支持成像,因为该标准目前不支持此类数据。

虽然数据集中用于利用数据库预配,但使用 Oracle Cloud Infrastructure Data Catalog 和 API 网关,组织可以针对数据网格创意进行开发。特别是,通过以数据所有者舒适的方式公开数据来分散数据所有权。此外,API 还提供了一种方法来实现对数据的高效访问,同时实施访问控制。这意味着相同的数据可以提供给不同的消费者用于不同的目的,同时保持不受消费者行为和需求的影响(e.g,数据在医疗可视化平台上提供给移动工作人员和患者的临床医生)。

此体系结构支持以下特定于数据资源池的服务:

  • 对象存储

    通过对象存储,可以快速访问任意内容类型的大量结构化和非结构化数据,包括数据库备份、分析数据以及丰富的内容(例如图像和视频)。您可以安全可靠地存储数据,然后直接从互联网或云平台检索数据。您可以在不降低性能或服务可靠性的情况下无缝扩展存储。将标准存储用于需要快速、立即和频繁访问的“热”存储。将归档存储用于长时间保留的“冷”存储,很少或很少访问。

    在此上下文中,对象存储用于存储非结构化内容(例如 x 光图像),然后由结构化程度更高的数据(包括映像元数据)引用,以使映像可快速搜索。

  • 数据目录

    Oracle Cloud Infrastructure Data Catalog 是针对企业数据的完全托管式自助数据发现和治理解决方案。它为数据工程师、数据科学家、数据管理员和首席数据官提供单个协作环境来管理组织的技术、业务和运营元数据。

    在他的上下文中,数据目录有助于了解数据资产以及如何在资源池中处理数据资产以提供额外的洞察。这将包括内部持有的数据和第三方数据资源,这些数据资源可以通过 API 调用和文件传输等机制拉入湖库。其他技术可用于摄取数据,但 API 和文件是最常见的模型。

  • 数据集成

    使用 Oracle Cloud Infrastructure Data Integration 可在系统之间实现最佳数据流。

    它支持声明式、无代码或低代码 ETL 和数据管道开发。对于湖屋来说,这将是主要的数据操纵和处理工具之一。

    还可以应用数据集成来执行任务,例如将数据从半结构化数据转换为完全结构化的可最小数据。执行数据清理等活动,以便脏数据或损坏数据无法扭曲查找结果。

  • 数据流

    Oracle Cloud Infrastructure Data Flow 是一款完全托管的 Apache Spark 服务,它可以在不使用要部署或管理的基础设施的情况下对庞大的数据集执行处理任务。开发人员还可以使用 Spark 流处理对持续生成的流数据执行云 ETL。这可以快速交付应用,因为开发人员可以专注于应用开发,而无需关注基础设施管理。

    数据流可帮助以更多事件或计时器系列方式处理数据。这样做意味着可以在发生事件时执行更多的分析,而不是等到收到所有数据。

  • 大数据服务

    Oracle Big Data Cloud Service 帮助数据专业人员管理、编目和处理原始数据。Oracle 提供了基于对象存储和 Hadoop 的数据池来持久保存数据。

  • Autonomous Database

    Oracle Cloud Infrastructure Autonomous Database 是一个完全托管的预配置数据库环境,可用于事务处理和数据仓库负载。您不需要配置和管理任何硬件,也不需要安装任何软件。Oracle Cloud Infrastructure 可处理数据库创建以及备份、打补丁、升级和优化数据库。

建议

使用以下建议作为起点。您的要求可能不同于此处所述的体系结构。
  • 虚拟云网络 (VCN) 和子网

    VCN 是可在 Oracle Cloud Infrastructure 区域中设置的可定制的软件定义网络。与传统的数据中心网络一样,VCN 允许您完全控制您的网络环境。VCN 可以具有多个不可重叠的 CIDR 块,您可以在创建 VCN 后更改这些块。您可以将 VCN 分段到子网,这些子网可以限定到区域或可用性域。每个子网包含一个连续的地址范围,这些地址与 VCN 中的其他子网不重叠。您可以在创建子网后更改其大小。子网可以是公共子网,也可以是专用子网。

  • Cloud Guard

    您可以使用 Oracle Cloud Guard 监视和维护 Oracle Cloud Infrastructure 中资源的安全。Cloud Guard 使用检测器配方,您可以定义这些配方来检查资源是否存在安全缺陷,以及监视操作员和用户是否有风险活动。检测到任何错误配置或不安全活动时,Cloud Guard 将根据您可以定义的响应器配方建议更正操作并协助执行这些操作。

  • 安全区域

    安全区域一开始就确保 Oracle 的安全最佳做法,强制实施加密数据等策略并防止对整个区间的网络进行公共访问。安全区域与同名的区间关联,并包括安全区域策略或应用于区间及其子区间的“配方”。无法将标准区间添加或移动到安全区域区间。

  • 网络安全组 (NSG)

    网络安全组 (NSG) 充当云资源的虚拟防火墙。使用 Oracle Cloud Infrastructure 的零信任安全模型,将拒绝所有流量,您可以控制 VCN 中的网络流量。NSG 包含一组入站和出站安全规则,这些规则仅应用于单个 VCN 中的一组指定 VNIC。

  • 负载平衡器

    Oracle Cloud Infrastructure Load Balancing 服务提供从单个入口点到后端多个服务器的自动流量分配。

考虑事项

部署此引用体系结构时,请考虑这些选项。

  • 数据源

    我们看到 IoT 解决方案的可能性不断监视和报告有关患者的数据,例如心率,以及允许患者轻松记录事件的应用,例如饮食习惯或医疗事件,例如适合和癫痫发作。这些信息可以提供大量额外的洞察,并纳入医疗记录,并使用 AI/ML 支持的医疗专业知识进行分析。此类数据馈送建议使用诸如 Kafka 等事件流技术,可以快速高效地捕获这些事件,并可以以自然的时间序列方式存储数据。

    通常,当发现有助于诊断的模式和异常时,可以捕获并组织到(半)结构化数据(可以轻松查询)的患者数据越多,结果就越好。因此,在患者的许可下,寻源患者数据(如家庭历史记录和其他医疗组织持有的数据)可能会揭示见解,而不必透露具体的个人事实。

  • 性能

    人工智能培训需要处理高分辨率图像,并且需要定期重现(例如,适应较新的图像格式或更高质量的图像)。需要执行此模型更新,以使其不影响接受诊断或治疗的患者。这可以通过在隔离的环境中运行模型更新,然后将当前环境扩展到操作环境和培训环境都可以在没有资源竞争或资源分配问题的情况下共存。

  • 安全性

    在临床环境中,安全至关重要,因为对此类需求进行了高度监管。数据不仅可以被视为价值,而且通过意外或蓄意行动中断数据访问和使用的能力也很重要。因此,涉及此类数据的服务需要安全。

  • 可用性

    将服务迁移到云环境可从医疗中心消除恢复能力和可用性方面的许多问题。云提供商无法保证网络的可用性。因此,必须主动拥有网络可恢复性和回退选项,以确保在发生“最后一英里”故障时继续提供。此外,最好是具有严重依赖此类故障情况的组织定期执行切换和中断。因此,如果真的需要它,该过程将像任何其他常规过程一样运行。

  • 成本

    任何特定用例都可能不需要确定的所有湖泊房屋服务。这些反映了与湖泊应用相关的评论技术。例如,如果不需要 Oracle Big Data Cloud Service ,则不应部署它。通过将不需要的映像放入性能较低的存储配置,可以智能地使用对象存储;当发生与患者相关的事件时,内容将移至性能更高的存储配置。在许多方面,这与数据库应用于存储的相同原则一样 - 将数据移入和移出高速缓存、快速访问存储 (e.g,NVMe) 和更慢的旋转磁盘。