使用分析和 AI 架构实现医疗保健数据标准化

实现医疗保健数据现代化和标准化、应用数据模型并提取具体可行的智能,从而获得洞察并改善客户体验。

付款人、提供商和索赔数据可以丰富,包括人工智能在内的高级分析技术可以应用于患者护理和疾病预防等用例,基于证据的预授权决策,分析,检测和索赔欺诈预防,以及优化医院和医疗保健提供商的医疗报警参数。

体系结构

该架构利用现有数据加速医疗业务职能的数字化与现代化。

Oracle Cloud Infrastructure (OCI) 服务可用于摄取、处理和分析数据,从而获得商务智能、改善客户体验并提高运营效率。Oracle 提供全面、完全集成的云应用和云平台服务堆栈。

OCI 提供了一种简单灵活的方式来部署和扩展大型语言模型。与任何其他云提供商相比,Oracle 为您的业务应用提供了多种选择,包括使用 Oracle SaaS 解决方案、数据和 AI 平台来构建、测试、部署和使用先进的人工智能应用提供更低的成本、更高性能的高性能计算、存储和网络基础设施。如果您刚接触 OCI,可以使用 Oracle Cloud 免费套餐免费试用此解决方案,该套餐在 30 天内提供 300 美元的免费试用储值。免费套餐还包括多项“始终免费”服务,即使您的免费储值到期后,这些服务仍可无限期地使用。

在此参考架构 oracle 云中,我们可以实施和应用 Zero Trust 安全、数据保护和隐私以及自动日志记录和监视解决方案。可以使用行业标准加密技术对静态数据和传输中的数据进行加密。可以使用 OCI Logging 实施系统日志记录和应用性能监视,并将 Web 应用防火墙与 OCI API Gateway 一起使用,以防潜在的 DDoS 攻击和网络威胁。

下图说明了此引用体系结构。



oci-healthcare-lifescience-aiml-oracle.zip

该体系结构具有以下组件:

  • 数据集成

    Oracle Cloud Infrastructure Data Integration 是一项完全托管的无服务器云原生服务,可将各种数据源中的数据提取、加载、转换、清理和重塑为目标 Oracle Cloud Infrastructure 服务,例如 Autonomous Data WarehouseOracle Cloud Infrastructure Object Storage 。用户可以使用直观、无代码的用户界面设计数据集成流程,优化集成流以生成高效的引擎和编排,并自动分配和扩展执行环境。

    ETL(提取转换负载)利用 Spark 上的完全托管的横向扩展处理,ELT(提取负载转换)利用 Autonomous Data Warehouse 的完整 SQL 下推功能,以尽可能减少数据移动并缩短新摄取数据的价值实现时间。

    Oracle Cloud Infrastructure Data Integration 提供交互式探索和数据准备,通过定义规则来处理模式更改,帮助数据工程师防范模式偏差。

  • GoldenGate

    Oracle Cloud Infrastructure GoldenGate 是一项提供实时数据网格平台的托管服务,它通过复制保持数据的高可用性,并支持实时分析。客户可以设计、执行和监视数据复制和流数据处理解决方案,而无需分配或管理计算环境。

  • 对象存储

    Oracle Cloud Infrastructure Object Storage 支持您快速访问任意内容类型的大量结构化和非结构化数据,包括数据库备份、分析数据以及图像和视频等丰富内容。您可以安全地存储数据,然后直接从互联网或云平台检索数据。您可以在不降低性能或服务可靠性的情况下扩展存储。将标准存储用于需要快速、立即和频繁访问的“热”存储。将归档存储用于长期保留、很少访问或很少访问的“冷”存储。

  • 函数

    Oracle Cloud Infrastructure Functions 是一个完全托管的多租户、高度可扩展的按需函数即服务 (FaaS) 平台。它由 Fn Project 开源引擎提供支持。通过 OCI 函数,您可以部署代码,并直接调用代码或触发代码以响应事件。OCI Functions 使用 Oracle Cloud Infrastructure Registry 中托管的 Docker 容器。

  • 数据流

    Oracle Cloud Infrastructure 数据流是一项用于运行 Apache Spark 应用的全托管式服务。它让开发人员可以专注于他们的应用程序,并提供一个轻松的运行时环境来运行它们。它具有一个简单易用的用户界面,支持 API 与应用和工作流集成。

  • 自治数据仓库

    Oracle Autonomous Data Warehouse 是一个自我驱动、自我保护和自我修复的数据库服务,针对数据仓库工作负载进行了优化。您不需要配置或管理任何硬件,或者安装任何软件。Oracle Cloud Infrastructure 负责创建、备份、打补丁、升级和优化数据库。

  • 文件存储

    Oracle Cloud Infrastructure File Storage 提供持久、可扩展、安全的企业级网络文件系统。您可以从 VCN 中的任何裸金属、虚拟机或容器实例连接到 OCI 文件存储。您还可以使用 Oracle Cloud Infrastructure FastConnect 和 IPSec VPN 从 VCN 外部访问 OCI 文件存储

  • Slurm 调度程序和数据库(开源)

    Slurm 是一个开源、容错、高度可扩展的集群管理和作业调度系统,适用于大型和小型 Linux 集群。

  • 监视

    Oracle Cloud Infrastructure Monitoring 服务使用指标主动和被动监视云资源,监视资源和警报,以便在这些指标满足警报指定的触发器时通知您。

  • 日志记录
    日志记录是一项高度可扩展且完全托管的服务,它允许您从云端资源访问以下类型的日志:
    • 审计日志:与审计服务发出的事件相关的日志。
    • 服务日志:由各个服务发出的日志,如 API 网关、事件、函数、负载平衡、对象存储和 VCN 流日志。
    • 定制日志:包含来自定制应用程序、其他云提供商或内部部署环境的诊断信息的日志。
  • 计算服务

    借助 Oracle Cloud Infrastructure Compute ,您可以在云中预配和管理计算主机。您可以通过配置启动计算实例,以满足对 CPU、内存、网络带宽和存储的资源要求。创建计算实例后,可以安全地访问该实例,重新启动该实例,附加和分离卷,并在不再需要时终止该实例。

  • 向量数据库 (Oracle DB 23ai)

    向量数据库是任何可以本地存储和管理向量嵌入并处理它们描述的非结构化数据(例如文档、图像、视频或音频)的数据库。

  • 数据目录

    Oracle Cloud Infrastructure Data Catalog 是一个完全托管的自助式企业数据发现和治理解决方案。它为数据工程师、数据科学家、数据管理员和首席数据官提供了一个统一的协作环境来管理组织的技术、业务和运营元数据。

  • 公司简介

    LangChain 是一个开源的模块化框架,用于从大型语言模型 (LLM) 创建应用程序。您可以使用 LangChain 构建聊天机器人、分析文本、根据结构化数据执行问答、与 API 交互以及创建使用生成式 AI 的应用。

  • 集成

    Oracle Integration 是一个完全托管的预配置环境,可用于集成云和内部部署应用、自动执行业务流程以及开发可视化应用。它使用符合 SFTP 标准的文件服务器来存储和检索文件,并允许您通过使用数百个适配器和配方组合来与 Oracle 和第三方应用进行连接,从而与企业对企业贸易合作伙伴交换文档。

数据摄取和处理

  • Oracle Cloud 提供全面的混合云和多云解决方案,可跨本地、其他云平台和互联网集成数据。OCI GoldenGate数据集成平台即服务可用于根据源类型从各种源系统摄取数据。OCI GoldenGate 可用于复制数据、保持数据同步和修复数据,以保持数据完整性和一致性。Oracle Integration 可以连接到各种企业应用并摄取数据。可以使用安全的 FTP、MLP 上的 HL7v2 和标准的快速医疗保健互操作性资源 (Fast Healthcare Interoperability Resources,FHIR) Web 服务进行批量数据传输。
  • 来自医疗卫生系统(例如电子健康记录 (EHR)、患者信息、索赔和提供商数据、医疗设备数据和基因组信息)的数据可以作为暂存区域迁移到 Oracle 的高可用性、持久性和低成本对象存储。
  • OCI 数据流可用于处理 OCI Functions 触发的原始数据,因为新数据到达暂存区域。Oracle Cloud 平台上的数据流提供无服务器、基于火花的加速数据准备和处理服务,您可以根据自己的偏好使用 PySpark、SQL 或 Java 编写代码,而无需管理和维护任何基础设施。
  • 可以将准备和处理的数据写入 Oracle Autonomous Data WarehouseOCI Object Storage ,作为下游处理和使用的精选阶段。Oracle Autonomous Data Warehouse 是一个业界领先的全托管式分析数据库平台,具有内置的可扩展性、安全性、管理和高可用性。对于医疗保健数据,隐私和保护 PII 信息至关重要。Oracle Autonomous Data Warehouse 始终提供静态数据加密 (AES256)。数据也使用 TLS 2.0 进行转换加密。Autonomous Database 附带的 Oracle Data Safe 提供了一个统一的控制中心,可帮助您管理 Oracle 数据库的日常安全性和合规性要求。Oracle Data Safe 提供医疗卫生行业所需的高级数据安全功能,例如数据屏蔽、数据混淆、活动审计和 SQL 防火墙管理。
  • 在 AI 层,该解决方案包括数据集成、AI 集成、用于 LLM 训练和推理的 GPU 和 CPU 集群、AI 开发工具和库、上下文和目录。对于模型, OCI Generative AI 服务可用于 Cohere 和 Meta Llama 3.1 模型的行业领先 AI 模型、性能卓越的专用 GPU 集群、聊天 API 和 Playground、LangChain 和 LlamaIndex 以及其他开源集成。Oracle 提供范围更广的 GPU,例如 L40s、A10、A100 和 H100,与其他超大规模供应商相比,具有极高的性价比。
  • Oracle 提供了一个完全自动化的 Slurm 调度程序,可在集群部署自动化过程中进行部署。Slurm 是一个开源、容错、高度可扩展的集群管理和作业调度系统,适用于大型和小型 Linux 集群。
  • OCI 通过 OCI GenAI 代理提供检索增强生成 (Retrieval-Augmented Generation,RAG) 作为托管服务(该服务仍处于测试版中,仅支持 OpenSearch 作为知识库存储库)。Oracle Database 23ai 和 Oracle HeatWave MySQL 非常适合 AI 向量搜索和存储。使用 RAG,组织可以使用基于现有数据的现有知识库来集成和扩充大型语言模型 (LLM) 响应。例如,如果用户提出问题,它将检索包含附加上下文信息的信息并添加到问题中,然后向 LLM 提供问题和检索的文本,以增强 LLM 的响应并减少幻觉。

推荐

使用以下建议作为起点。 您的要求可能与此处描述的体系结构不同。
  • 使用专用虚拟云网络部署服务,并使用安全列表和 NSG 来限制意外访问。
  • 使用 OCI Identity and Access Management 应用最少权限和基于角色的访问控制的主体。
  • 通过 OCI API 网关,您可以发布具有专用端点的 API,这些端点可从网络内访问,并且可以根据需要向公共互联网公开。这些端点支持 API 验证、请求和响应转换、CORS、验证和授权以及请求限制。
  • OCI 提供全面的 HIPAA 合规性以及 FedRAMP 和其他标准合规性,可满足监管义务和保护要求。
  • 使用开源技术,避免供应商锁定 OCI(例如 LangChain、REST API、Functions)并基于 OCI 构建抽象层,从而加速创新和转型。

确认

  • 授权者Gautam Karmakar
  • 贡献者John Sulyok