Descubra cómo la IA y el AA de OCI mejoran la experiencia del paciente

Al igual que sucede con cualquier empresa, la asistencia sanitaria necesita poder acceder, analizar, manipular y almacenar grandes volúmenes de datos. Este tipo de procesamiento de datos es fundamental para las tecnologías que hay detrás de Oracle Cloud Infrastructure Lakehouse ( Data Lakehouse), que facilita la inteligencia artificial (IA) y el aprendizaje automático (AA) para mejorar la experiencia de los pacientes.

La configuración de un sistema sanitario, en términos de experiencia del paciente, debe considerar:

  • Obtener información precisa del paciente a los médicos lo más rápido posible, con una facilidad que elimina las cargas innecesarias, lo que permite al médico pasar tanto tiempo en el caso del paciente como sea posible.
  • Llevar al paciente de los síntomas a la recuperación lo antes posible.
  • Asegurar que el proceso sea lo más rentable posible, independientemente de si el costo es asumido por el paciente, su seguro médico o un servicio público de salud (e.g., Servicio Nacional de Salud del Reino Unido).

Por ejemplo, un médico general (GP) o un proveedor de atención primaria (PCP) creen que su paciente presenta signos de neumonía. Remitieron al paciente a un centro médico (hospitalario o centro de imágenes) para que una radiografía de tórax investigara si la neumonía o algo más está causando los síntomas del paciente. El primer paso de este proceso es establecer una cita con el centro médico y compartir la historia clínica electrónica del paciente (REM) o la historia clínica electrónica (HCE). Lo ideal sería incorporar estos datos en el Data Lakehouse.

El personal de radiología del centro médico tomaría las radiografías, pero desde ese momento, el Data Lakehouse y las tecnologías relacionadas desempeñan un papel activo en el proceso de diagnóstico. La imagen de rayos X se crea utilizando el sistema de información de radiología (RIS) y se almacena utilizando el sistema de archivado y comunicación de imágenes (PACS) o una nueva generación de almacenamiento de datos, como el archivo neutro del proveedor (VNA). Las imágenes se almacenan probablemente utilizando un formato de imagen médica como Digital Imaging and Communications in Medicine (DICOM), que almacena una imagen de muy alta resolución con sus metadatos asociados, como detalles sobre dónde y cuándo se generó la imagen y el tipo de modalidad (cómo se capturó la imagen). Estos metadatos están vinculados al paciente correcto y a sus registros.

Una vez capturadas las imágenes, un médico revisa e interpreta cada una para determinar las necesidades clínicas del paciente. Este es un proceso que requiere mucho tiempo, lo que a menudo resulta en que el paciente espera más información en el hogar.

Este cuaderno de estrategias se centrará en cómo un Data Lakehouse participa en soluciones que ofrecen los resultados que hemos descrito.

Este cuaderno de estrategias se centrará en los sistemas implicados en un caso de uso que involucre a un hospital regional, y llamará a las áreas relacionadas, pero no entrará en detalles de la solución.

Arquitectura

Esta arquitectura muestra un centro médico que accede y utiliza un Data Lakehouse de OCI.



  1. Es probable que la configuración inicial requiera el uso del servicio de transferencia de datos como una forma eficiente, rentable y rápida de migrar todos los datos existentes de la solución PACS a Oracle Cloud Infrastructure (OCI) para su procesamiento. Si el rendimiento de la conectividad para las operaciones en curso era problemático, podría ampliarse a las transferencias diarias. Además de los datos de los PAC, esto puede ser un medio para enviar registros masivos de pacientes e información asociada.
  2. Entre las fuentes de datos adicionales, como la colaboración en el intercambio de EMR entre proveedores de asistencia sanitaria, se podrían incluir el médico general o el médico de cabecera del paciente.
  3. Se proporcionan funciones para realizar manipulaciones de datos complejas. Por ejemplo, extraen los metadatos de una imagen DICOM. Estos procesos son demasiado complejos para que se puedan realizar acciones efectivas en las herramientas de persistencia y la lógica de negocio. Esto significa que podemos coser en una nueva lógica cada vez que se introduce un nuevo objeto de datos complejo no estructurado, como un nuevo tipo de imagen.
  4. Los datos de entrada y salida de los servicios apoyan el intercambio de la EHR/EMR del paciente.
  5. Como se mencionó en el escenario, cuanto más datos se puedan obtener relacionados con los casos de uso, como información adicional sobre los pacientes, permite obtener información adicional. Por ejemplo, el conjunto de datos de los CDC Social Determinants of Health (SDOH) proporciona API para indicadores socioeconómicos para diversas condiciones de salud.
  6. Esto refleja el número de servicios utilizados directa o indirectamente para soportar la seguridad, la plataforma y la operatividad de la solución.
  7. Los servicios de Data Lakehouse están agrupados. Según el caso de uso específico, puede que no se necesiten todos los servicios.
  8. Se supone que la expectativa principal está centrada en el servicio web, ya que terceros ocultarán cómo se manejan sus datos. Esto también refleja la dirección del desarrollo de estándares, como el FHIR.

Como se muestra en el diagrama, los datos que fluyen entre el centro médico y el entorno de OCI se protegen a través de una VPN y se garantizan en términos de rendimiento mediante Oracle Cloud Infrastructure FastConnect (FastConnect), a pesar del gran volumen de datos de imágenes que se mueven hacia adelante y hacia atrás.

La solución PACS o VNA se puede integrar de varias maneras en función de las capacidades de la solución PACS, desde simplemente exponer el almacenamiento PACS a un servidor FTP restringido que se puede sondear regularmente (e.g., cada 10 a 15 minutos), hasta las especificaciones de API alineadas con el modelo de comunicación DICOM para el intercambio de mensajes. En el diagrama de arquitectura, podemos ver que el uso de las capacidades de OCI para sustituir el PACS local también es una posibilidad.

Se proporcionan funciones personalizadas que pueden extraer metadatos relacionados con imágenes en DICOM. Los metadatos extraídos se pueden almacenar por separado para soportar la búsqueda rápida de contenido, ya que las imágenes no tienen que ser interrogadas cada vez que se realiza una búsqueda.

Aunque la integración con otros orígenes de datos se puede producir mediante diversos protocolos y tecnologías, el mecanismo preferido es la adopción de API REST de FHIR. Sin embargo, las herramientas de integración disponibles proporcionan una amplia gama de tecnologías y protocolos de integración. Tenga en cuenta que la imagen no puede ser soportada con FHIR ya que el estándar no soporta actualmente dichos datos.

Mientras que los datos están centralizados para aprovechar el aprovisionamiento de la base de datos, el uso de Oracle Cloud Infrastructure Data Catalog y el gateway de API permite a las organizaciones desarrollarse hacia las ideas de una malla de datos. En particular, la descentralización de la propiedad de los datos mediante la exposición de los datos de una manera en la que los propietarios de los datos son cómodos. Además, la API proporciona un medio para lograr un acceso eficiente a los datos mientras aplica el control de acceso. Esto significa que los mismos datos pueden ponerse a disposición de diferentes consumidores para diferentes propósitos, mientras que permanecen sin impacto por el comportamiento y las necesidades de los consumidores (e.g., los datos se ponen a disposición tanto del personal móvil como de los médicos con pacientes en plataformas de visualización médica).

Esta arquitectura admite los siguientes servicios específicos del Data Lakehouse:

  • Object Storage

    El almacenamiento de objetos proporciona acceso rápido a grandes cantidades de datos estructurados y no estructurados de cualquier tipo de contenido, incluidas copias de seguridad de bases de datos, datos analíticos y contenido enriquecido, como imágenes y vídeos. Puede almacenar datos de forma segura y, a continuación, recuperarlos directamente desde Internet o desde la plataforma en la nube. Puede ampliar el almacenamiento sin problemas sin experimentar ninguna degradación del rendimiento o la fiabilidad del servicio. Utilice el almacenamiento estándar para el almacenamiento "en caliente" al que necesita acceder de forma rápida, inmediata y frecuente. Utilice el almacenamiento de archivos para el almacenamiento "en frío" que conserva durante largos períodos de tiempo y a los que rara vez se accede o que rara vez se accede.

    En este contexto, Object Storage se utilizaría para contener contenido no estructurado, como imágenes de rayos X y, a continuación, para hacer que las imágenes se puedan buscar rápidamente con más datos estructurados, incluidos los metadatos de imagen.

  • Catálogo de datos

    Oracle Cloud Infrastructure Data Catalog es una solución de descubrimiento y gobernanza de datos de autoservicio totalmente gestionada para los datos de su empresa. Proporciona a los ingenieros de datos, científicos de datos, administradores de datos y directores de datos un único entorno de colaboración para gestionar los metadatos técnicos, empresariales y operativos de la organización.

    El catálogo de datos en su contexto contribuirá a comprender los activos de datos y cómo se podrían manejar en el Data Lakehouse para proporcionar estadísticas adicionales. Esto cubriría los datos retenidos internamente y los recursos de datos de terceros que se pueden extraer al Lakehouse mediante mecanismos como la llamada a la API y la transferencia de archivos. Hay otras tecnologías disponibles para ingerir datos, pero las API y los archivos son los modelos más comunes.

  • Integración de Datos

    Utilice Oracle Cloud Infrastructure Data Integration para un flujo de datos óptimo entre sistemas.

    Soporta el desarrollo de pipelines de datos y ETL declarativos y sin código o con poco código. Para el Data Lakehouse, sería una de las principales herramientas de manipulación y procesamiento de datos.

    Data Integration también se puede aplicar para realizar tareas como la transformación de datos de datos semiestructurados a datos extraíbles totalmente estructurados. Realice actividades como la limpieza de datos para que los datos sucios o corruptos no puedan distorsionar las conclusiones.

  • Flujo de datos

    Oracle Cloud Infrastructure Data Flow es un servicio Apache Spark totalmente gestionado que realiza tareas de procesamiento en grandes conjuntos de datos, sin la infraestructura que desplegar ni gestionar. Los desarrolladores también pueden utilizar Spark Streaming para realizar ETL en la nube en sus datos de transmisión continuamente producidos. Esto permite una entrega rápida de aplicaciones porque los desarrolladores pueden centrarse en el desarrollo de aplicaciones, no en la gestión de infraestructura.

    Data Flow ayuda a procesar datos de una manera más de serie de temporizador o evento. Esto significa que se pueden realizar más análisis a medida que suceden las cosas en lugar de esperar hasta que se hayan recibido todos los datos.

  • Servicio de big data

    Oracle Big Data Cloud Service ayuda a los profesionales de datos a gestionar, catalogar y procesar datos no procesados. Oracle ofrece almacenamiento de objetos y lagos de datos basados en Hadoop para la persistencia.

  • Autonomous Database

    Oracle Cloud Infrastructure Autonomous Database es un entorno de base de datos preconfigurado y totalmente gestionado que puede utilizar para cargas de trabajo de procesamiento de transacciones y almacenamiento de datos. No necesita configurar ni gestionar ningún hardware, ni instalar ningún software. Oracle Cloud Infrastructure gestiona la creación de la base de datos, así como la copia de seguridad, la aplicación de parches, la actualización y el ajuste de la base de datos.

Recomendaciones

Utilice las siguientes recomendaciones como punto de partida. Sus requisitos pueden ser diferentes de la arquitectura descrita aquí.
  • Red virtual en la nube (VCN) y subred

    Una VCN es una red personalizable definida por software que se configura en una región de Oracle Cloud Infrastructure. Al igual que las redes de centros de datos tradicionales, las VCN le proporcionan un control total de su entorno de red. Una VCN puede tener varios bloques CIDR no superpuestos que puede cambiar después de crear la VCN. Puede segmentar una VCN en subredes que se pueden acotar a una región o a un dominio de disponibilidad. Cada subred consta de un rango contiguo de direcciones que no se solapan con las demás subredes de VCN. Puede cambiar el tamaño de una subred después de la creación. Una subred puede ser pública o privada.

  • Cloud Guard

    Puede utilizar Oracle Cloud Guard para controlar y mantener la seguridad de los recursos en Oracle Cloud Infrastructure. Cloud Guard utiliza recetas de detector que puede definir para examinar los recursos en busca de debilidades de seguridad y para supervisar a operadores y usuarios en busca de actividades de riesgo. Cuando se detecta una configuración incorrecta o una actividad insegura, Cloud Guard recomienda acciones correctivas y ayuda a realizar esas acciones en función de las recetas de responsable de respuesta que puede definir.

  • Zona de seguridad

    Las zonas de seguridad garantizan desde el principio las mejores prácticas de seguridad de Oracle mediante la aplicación de políticas como el cifrado de datos y la prevención del acceso público a las redes para un compartimento completo. Una zona de seguridad está asociada a un compartimento con el mismo nombre e incluye políticas de zona de seguridad o una "recepción" que se aplica al compartimento y sus subcompartimentos. No puede agregar ni mover un compartimento estándar a un compartimento de zona de seguridad.

  • Grupo de seguridad de red (NSG)

    El grupo de seguridad de red (NSG) actúa como un firewall virtual para sus recursos en la nube. Con el modelo de seguridad de confianza cero de Oracle Cloud Infrastructure, se deniega todo el tráfico y puede controlar el tráfico de red dentro de una VCN. Un NSG está formado por un conjunto de reglas de seguridad de entrada y salida que se aplican solo a un conjunto especificado de VNIC en una única VCN.

  • equilibrador de carga

    El servicio Oracle Cloud Infrastructure Load Balancing proporciona una distribución automatizada de tráfico desde un único punto de entrada a varios servidores en el backend.

Consideraciones

Al desplegar esta arquitectura de referencia, tenga en cuenta estas opciones.

  • Orígenes de datos

    Observamos la posibilidad de que las soluciones IoT supervisen y comuniquen continuamente datos sobre un paciente, como la frecuencia cardíaca, y aplicaciones que permiten a los pacientes simplemente registrar eventos, como hábitos dietéticos o eventos médicos como ajustes y convulsiones. Esta información puede proporcionar una gran cantidad de información adicional, incorporarse a las historias clínicas y analizarse utilizando la experiencia médica apoyada por AI/ML. Tales fuentes de datos sugieren el uso de tecnologías de flujo de eventos como Kafka, que capturan estos eventos de forma rápida y eficiente y pueden almacenar los datos de manera natural en serie temporal.

    Cuando se encuentran patrones y anomalías que pueden ayudar con el diagnóstico, por lo general, más datos sobre un paciente que se pueden capturar y organizar en datos (semies)estructurados que se pueden consultar fácilmente, mejor. Por lo tanto, la obtención de datos de pacientes, como antecedentes familiares y datos de otras organizaciones médicas, con el permiso del paciente, puede revelar información sin revelar necesariamente hechos individuales específicos.

  • Rendimiento

    El entrenamiento con IA requiere el procesamiento de imágenes de alta resolución y tendrá que volver a ocurrir periódicamente (por ejemplo, para acomodar formatos de imagen más recientes o imágenes de mayor calidad). Esta actualización del modelo debe realizarse de manera que no afecte a los pacientes sometidos a diagnóstico o tratamiento. Para ello, ejecute actualizaciones de modelos en un entorno aislado y, a continuación, escale el entorno actual a un punto en el que el entorno operativo y el entorno de formación puedan coexistir sin problemas de competencia de recursos o asignación de recursos.

  • Seguridad

    En un contexto clínico, la seguridad será primordial, ya que dichos requisitos están muy regulados. No solo se puede considerar el valor de los datos, sino que también es crucial la capacidad de interrumpir el acceso y el uso de los datos mediante acciones accidentales o deliberadas. Por lo tanto, los servicios implicados en estos datos deben ser seguros.

  • Disponibilidad

    La migración de servicios a entornos en la nube elimina una serie de problemas relacionados con la resiliencia y la disponibilidad del centro médico. El proveedor de nube no puede garantizar la disponibilidad de la red. Como resultado, la resiliencia de la red y las opciones de reserva deben ser de propiedad activa para garantizar una disponibilidad continua en caso de fallo de "última milla". Además, es mejor que una organización con dependencias críticas en esos escenarios de fallo ejerza periódicamente el recorte y recorte. Por lo tanto, en caso de que realmente lo necesite, el proceso se ejecuta como si fuera algún otro proceso normal.

  • Costo

    Cualquier caso de uso particular puede no requerir todos los servicios de Lakehouse identificados. Estos reflejan las tecnologías de comentarios asociadas a la aplicación de un lago. Por ejemplo, si Oracle Big Data Cloud Service no es necesario, no se debe desplegar. El almacenamiento de objetos se puede utilizar de forma inteligente colocando imágenes que no son necesarias en una configuración de almacenamiento de menor rendimiento; cuando se produce un evento relacionado con el paciente, el contenido se mueve a una configuración de almacenamiento de mayor rendimiento. Esto es, en muchos aspectos, al igual que los mismos principios, una base de datos se aplica a los datos que mueven el almacenamiento dentro y fuera de la caché, el almacenamiento de acceso rápido (e.g., NVMe) y los discos que giran más lentamente.