Estandarización de los datos sanitarios mediante la analítica y la arquitectura de IA

Moderniza y estandariza los datos de atención médica, aplica modelos de datos y extrae inteligencia procesable para obtener información y mejorar la experiencia del cliente.

Los datos de pagadores, proveedores y reclamaciones se pueden enriquecer y se pueden aplicar técnicas de análisis avanzadas, incluida la inteligencia artificial, para casos de uso como la atención al paciente y la prevención de enfermedades, la toma de decisiones basada en la evidencia en la preautorización, el análisis, la detección y la prevención del fraude de reclamaciones y la optimización de los parámetros de alarma médica para hospitales y proveedores de atención médica.

Arquitectura

Esta arquitectura acelera la digitalización y modernización de las funciones empresariales de la asistencia sanitaria utilizando sus datos existentes.

Los servicios de Oracle Cloud Infrastructure (OCI) se pueden utilizar para ingerir, procesar y analizar datos para obtener inteligencia empresarial, mejorar la experiencia del cliente y mejorar la eficiencia operativa. Oracle ofrece una pila completa y totalmente integrada de servicios de plataforma y aplicaciones en la nube.

OCI proporciona una forma fácil y flexible de desplegar y escalar grandes modelos de lenguaje. Oracle proporciona varias opciones para aplicar la inteligencia artificial a las aplicaciones de negocio y acelerar la innovación mediante las soluciones SaaS de Oracle, la plataforma de datos e IA, y un costo más bajo, una infraestructura de red, almacenamiento y recursos informáticos de alto rendimiento de mayor rendimiento que cualquier otro proveedor en la nube para crear, probar, desplegar y utilizar aplicaciones de IA de última generación. Si es nuevo en OCI, puede probar esta solución de forma gratuita mediante Oracle Cloud Free Tier, que proporciona créditos de prueba gratuitos por valor de 300 dólares durante un período de 30 días. Free Tier también incluye varios servicios Siempre gratis que están disponibles por tiempo ilimitado, incluso después de que caduquen sus créditos gratuitos.

En esta arquitectura de referencia de oracle cloud, podemos implantar y aplicar la seguridad, la protección y la privacidad de datos de Zero Trust, así como soluciones automatizadas de registro y supervisión. Los datos estáticos y en tránsito se pueden cifrar mediante tecnologías de cifrado estándar del sector. El registro del sistema y la supervisión del rendimiento de las aplicaciones se pueden implantar mediante OCI Logging, y se puede utilizar un firewall de aplicación web junto con OCI API Gateway que protege frente a posibles ataques DDoS y amenazas cibernéticas.

El siguiente diagrama ilustra esta arquitectura de referencia.



oci-healthcare-lifescience-aiml-oracle.zip

La arquitectura tiene los siguientes componentes:

  • Data Integration

    Oracle Cloud Infrastructure Data Integration es un servicio totalmente gestionado, sin servidor y nativo en la nube que extrae, carga, transforma, limpia y vuelve a formar datos de una variedad de orígenes de datos en servicios de destino de Oracle Cloud Infrastructure, como Autonomous Data Warehouse y Oracle Cloud Infrastructure Object Storage. Los usuarios diseñan procesos de integración de datos mediante una interfaz de usuario intuitiva y sin código que optimiza los flujos de integración para generar el motor y la orquestación más eficaces y asignar y ampliar automáticamente el entorno de ejecución.

    ETL (carga de transformación de extracción) aprovecha el procesamiento de escala horizontal totalmente gestionado en Spark y ELT (transformación de carga de extracción) aprovecha las capacidades de transferencia SQL completa de Autonomous Data Warehouse para minimizar el movimiento de datos y mejorar el tiempo de obtención de resultados para los datos recién ingeridos.

    Oracle Cloud Infrastructure Data Integration proporciona exploración interactiva y preparación de datos, y ayuda a los ingenieros de datos a protegerse contra el cambio de esquema mediante la definición de reglas para manejar los cambios de esquema.

  • GoldenGate

    Oracle Cloud Infrastructure GoldenGate es un servicio gestionado que proporciona una plataforma de malla de datos en tiempo real que utiliza la replicación para mantener los datos altamente disponibles y permite análisis en tiempo real. Los clientes pueden diseñar, ejecutar y supervisar sus soluciones de replicación de datos y procesamiento de datos de flujo sin necesidad de asignar ni gestionar entornos informáticos.

  • Almacenamiento de objetos

    Oracle Cloud Infrastructure Object Storage proporciona acceso rápido a grandes cantidades de datos estructurados y no estructurados de cualquier tipo de contenido, incluidas copias de seguridad de base de datos, datos analíticos y contenido enriquecido, como imágenes y vídeos. Puede almacenar datos de forma segura y, a continuación, recuperarlos directamente desde Internet o desde la plataforma en la nube. Puede ampliar el almacenamiento sin experimentar ninguna degradación del rendimiento ni de la fiabilidad del servicio. Utilice el almacenamiento estándar para el almacenamiento al que debe acceder de forma rápida, inmediata y frecuente. Utilice el almacenamiento de archivo para el almacenamiento "frío" al que conserva durante largos períodos de tiempo y al que rara vez accede.

  • Funciones

    Oracle Cloud Infrastructure Functions es una plataforma de funciones como servicio (FaaS) totalmente gestionada, multi-inquilino, altamente escalable y bajo demanda. Se basa en el motor de origen abierto Fn Project. OCI Functions permite desplegar el código y llamarlo directamente o dispararlo en respuesta a eventos. OCI Functions utiliza contenedores de Docker alojados en Oracle Cloud Infrastructure Registry.

  • Flujo de datos

    Oracle Cloud Infrastructure Data Flow es un servicio totalmente gestionado para ejecutar aplicaciones de Apache Spark. Permite a los desarrolladores centrarse en sus aplicaciones y proporciona un entorno de tiempo de ejecución fácil para ejecutarlas. Tiene una interfaz de usuario simple y sencilla con soporte de API para la integración con aplicaciones y flujos de trabajo.

  • Autonomous Data Warehouse

    Oracle Autonomous Data Warehouse es un servicio de base de datos autogestionado, autoseguridad y autorreparable optimizado para cargas de trabajo de almacenamiento de datos. No necesita configurar ni gestionar ningún hardware, ni instalar ningún software. Oracle Cloud Infrastructure gestiona la creación, la copia de seguridad, la aplicación de parches, el cambio de versión y el ajuste de la base de datos.

  • Almacenamiento de archivos

    Oracle Cloud Infrastructure File Storage proporciona un sistema de archivos de red duradero, escalable, seguro y empresarial. Puede conectarse a OCI File Storage desde cualquier instancia con hardware dedicado, de máquina virtual o de contenedor en una VCN. También puede acceder a OCI File Storage desde fuera de la VCN mediante Oracle Cloud Infrastructure FastConnect y la VPN IPSec.

  • Programador Slurm y base de datos (código abierto)

    Slurm es un sistema de gestión de clusters y programación de trabajos de código abierto, tolerante a fallos y altamente escalable para clusters de Linux grandes y pequeños.

  • Monitoring

    El servicio Oracle Cloud Infrastructure Monitoring supervisa de forma activa y pasiva los recursos en la nube mediante métricas para supervisar recursos y alarmas para notificarle cuando estas métricas cumplen los disparadores especificados por la alarma.

  • Logging
    Logging es un servicio altamente escalable y totalmente administrado que proporciona acceso a los siguientes tipos de registros de sus recursos en la nube:
    • Logs de auditoría: logs relacionados con eventos emitidos por el servicio de auditoría.
    • Logs de servicios: logs emitidos por servicios individuales como API Gateway, eventos, funciones, equilibrio de carga, Object Storage y logs de flujo de VCN.
    • Logs personalizados: logs que contienen información de diagnóstico de aplicaciones personalizadas, otros proveedores de nube o un entorno local.
  • Compute

    Con Oracle Cloud Infrastructure Compute, puede aprovisionar y gestionar hosts de recursos informáticos en la nube. Puede iniciar instancias informáticas con unidades que cumplan los requisitos de recursos de CPU, memoria, ancho de banda de red y almacenamiento. Después de crear una instancia informática, puede acceder a ella de forma segura, reiniciarla, asociar y desconectar volúmenes y terminarla cuando ya no lo necesite.

  • Base de datos vectorial (Oracle DB 23ai)

    Una base de datos vectorial es cualquier base de datos que puede almacenar y gestionar de forma nativa incrustaciones de vectores y manejar los datos no estructurados que describen, como documentos, imágenes, video o audio.

  • Data Catalog

    Oracle Cloud Infrastructure Data Catalog es una solución de descubrimiento y gobernanza de datos de autoservicio totalmente gestionada para los datos de su empresa. Proporciona a los ingenieros de datos, científicos de datos, administradores de datos y directores de datos un único entorno de colaboración para gestionar los metadatos técnicos, empresariales y operativos de la organización.

  • Langchain

    LangChain es un marco modular de código abierto para crear aplicaciones a partir de modelos de lenguaje grandes (LLM). Puede utilizar LangChain para crear bots conversacionales, analizar texto, realizar preguntas y respuestas a partir de datos estructurados, interactuar con API y crear aplicaciones que utilicen IA generativa.

  • Integración

    Oracle Integration es un entorno preconfigurado y totalmente gestionado que permite integrar aplicaciones en la nube y locales, automatizar los procesos de negocio y desarrollar aplicaciones visuales. Utiliza un servidor de archivos compatible con SFTP para almacenar y recuperar archivos y le permite intercambiar documentos con partners comerciales de negocio a negocio mediante una cartera de cientos de adaptadores y recetas para conectarse con aplicaciones de Oracle y de terceros.

Ingesta y procesamiento de datos

  • Oracle Cloud proporciona soluciones integrales híbridas y multinube que integran datos en entornos locales, otras plataformas en la nube e Internet. La plataforma como servicio de OCI GoldenGate y Data Integration se puede utilizar para ingerir datos de diversos sistemas de origen según el tipo de orígenes. OCI GoldenGate se puede utilizar para replicar datos, mantenerlos sincronizados y repararlos para mantener la integridad y consistencia de los datos. Oracle Integration se puede conectar a varias aplicaciones empresariales y datos de ingestión. Las transferencias masivas de datos se pueden realizar mediante FTP seguro, HL7v2 a través de MLP y servicios web estándar de Fast Healthcare Interoperability Resources (FHIR).
  • Los datos de los sistemas sanitarios, como los registros médicos electrónicos (EHR), la información del paciente, las reclamaciones y los datos del proveedor, los datos de los dispositivos médicos y la información genómica, se pueden trasladar al almacenamiento de objetos de alta disponibilidad, duradero y bajo costo de Oracle como área temporal.
  • OCI Data Flow se puede utilizar para procesar datos raw disparados por OCI Functions a medida que llegan nuevos datos al área temporal. Data Flow en la plataforma Oracle Cloud proporciona un servicio de preparación y procesamiento de datos acelerado, sin servidor y basado en chispas, donde el código se puede escribir mediante PySpark, SQL o Java según sus preferencias sin gestionar ni mantener ninguna infraestructura.
  • Los datos preparados y procesados se pueden escribir en Oracle Autonomous Data Warehouse y OCI Object Storage como una etapa seleccionada para el procesamiento y el consumo descendentes. Oracle Autonomous Data Warehouse es una plataforma de base de datos analítica totalmente gestionada y líder del sector con escalabilidad, seguridad, gestión y alta disponibilidad incorporadas. Para los datos de salud, la privacidad y la protección de la información de PII es de suma importancia. Oracle Autonomous Data Warehouse siempre proporciona cifrado de datos estático (AES256). Los datos también se cifran en transición mediante TLS 2.0. Oracle Data Safe, que se incluye con Autonomous Database, proporciona un centro de control unificado que le ayuda a gestionar los requisitos diarios de seguridad y conformidad de las bases de datos Oracle. Oracle Data Safe proporciona funciones avanzadas de seguridad de datos necesarias para el sector sanitario, como enmascaramiento de datos, ocultación de datos, auditoría de actividades y gestión de firewall de SQL.
  • En la capa de IA, la solución consta de Data Integration, integración de IA, GPU y clusters de CPU para entrenamiento e inferencia de LLM, herramientas y bibliotecas de desarrollo de IA, contexto y catálogo. Para un modelo, el servicio OCI Generative AI se puede utilizar para modelos de IA líderes del sector de los modelos Cohere y Meta Llama 3.1, un cluster de GPU de alto rendimiento dedicado, Chat API y Playground, LangChain y LlamaIndex, y otra integración de código abierto. Oracle ofrece una gama más amplia de GPU, como L40s, A10, A100 y H100, y una atractiva distinción entre precio y rendimiento con respecto a otros hiperescaladores.
  • Oracle ofrece un programador Slurm totalmente automatizado listo para desplegar como parte de la automatización del despliegue de clústeres. Slurm es un sistema de gestión de clusters y programación de trabajos de código abierto, tolerante a fallos y altamente escalable para clusters de Linux grandes y pequeños.
  • OCI ofrece la generación con recuperación aumentada (RAG) como servicio gestionado con agentes de OCI GenAI (el servicio sigue en fase beta y solo soporta OpenSearch como repositorio de la base de conocimientos). Oracle Database 23ai y Oracle HeatWave MySQL son excelentes para la búsqueda y almacenamiento de vectores de IA. Con RAG, las organizaciones pueden integrar y enriquecer la respuesta del modelo de lenguaje grande (LLM) mediante la base de conocimientos existente basada en sus datos existentes. Por ejemplo, si un usuario hace una pregunta, recupera información que contiene información contextual adicional y la agrega a la pregunta, luego proporciona la pregunta y los textos recuperados a un LLM para aumentar la respuesta del LLM y reducir la alucinación.

Recomendaciones

Utilice las siguientes recomendaciones como punto de partida. Sus requisitos pueden diferir de la arquitectura descrita aquí.
  • Utilice una red virtual en la nube privada para desplegar servicios y utilice una lista de seguridad y NSG para restringir el acceso no deseado.
  • Utilice OCI Identity and Access Management para aplicar el principal de los controles de acceso basados en roles y con privilegios mínimos.
  • Gateway de API de OCI permite publicar API con puntos finales privados accesibles desde la red y que se pueden exponer a la red pública de Internet si es necesario. Los puntos finales admiten la validación de API, la transformación de solicitud y respuesta, CORS, la autenticación y autorización, y la limitación de solicitudes.
  • OCI proporciona cumplimiento total de HIPAA y FedRAMP y otros cumplimientos estándar para la protección y obligación regulatorias.
  • Utiliza tecnología de código abierto para evitar la dependencia de proveedores en OCI, como LangChain, la API de REST y Functions, y crea una capa de abstracción para acelerar la innovación y la transformación.

Confirmaciones

  • Autores: Gautam Karmakar
  • Contribuyentes: John Sulyok