Aplicación de Data Lakehouse

Un Data Lakehouse puede acelerar y mejorar el proceso de diagnóstico, mejorando las posibilidades de recuperación de un paciente.

La diferencia entre PACS y VNA es la capacidad de manejar una mayor variedad de formatos de imagen más allá de DICOM. Sin embargo, cualquiera puede presentar desafíos. Las imágenes exigen mucha capacidad de almacenamiento, por lo que el sistema de almacenamiento suele contener imágenes de cajas actuales. Es probable que las imágenes más antiguas se muevan a un costo menor, posiblemente al almacenamiento fuera de línea, lo que hace que el acceso al historial de imágenes de un paciente sea un esfuerzo difícil y laborioso. Es probable que las soluciones RIS y PACS/VNA residan localmente en el centro médico, lo que significa que puede ser necesario acceder a su infraestructura de TI. Esto también significa que el centro médico debe emplear especialistas en almacenamiento para garantizar la seguridad de los datos. Es más probable que una solución VNA apoye la participación en el intercambio de información sanitaria (HIE), lo que permite a los proveedores de asistencia sanitaria colaborar en el intercambio de datos, la creación de redes seguras y el uso de Fast Healthcare Interoperability Resources (FHIR) y estándares relacionados. Puede ser una solución regulada en algunos países, como la Red de Salud y Atención Social (HSCN) en el Reino Unido. Las regulaciones podrían causar costos adicionales para probar el cumplimiento.

Un Data Lakehouse puede acelerar significativamente el proceso paciente-recorrido. La adopción de una solución de almacenamiento proporcionada por la nube proporciona acceso rápido a volúmenes muy altos de almacenamiento (incluso almacenamiento archivado) a escala económica según los cuales es poco probable que un centro médico coincida con una solución local. Una solución en la nube también reduce o elimina la necesidad de que los centros médicos mantengan las habilidades especializadas necesarias para gestionar los problemas de redundancia y recuperación a fin de mantener la solución en funcionamiento.

Un acceso más rápido a las imágenes significa que los médicos tienen más tiempo para evaluar las imágenes, lo que reduce el tiempo que un paciente pasa esperando un diagnóstico y tratamiento. También significa que se pueden utilizar grandes volúmenes de imágenes para entrenar capacidades de inteligencia artificial (IA) y aprendizaje automático (ML) (entregadas por Oracle Cloud Infrastructure Vision y Oracle Cloud Infrastructure Data Science) en parásitos sanos y no saludables. Esto no solo permite que la IA/ML investigue el problema primario (los síntomas actuales del paciente), sino que también podría detectar otros problemas para los que el paciente aún no ha presentado síntomas. Si la IA/AA ha detectado o no algún problema al evaluar los rayos X, la última afirmación debe ser siempre de un humano. La IA de procesamiento de imágenes puede ayudar con eso de varias maneras en función de su evaluación:

  • La IA puede priorizar los rayos X que sugieren problemas significativos donde la intervención rápida puede marcar la diferencia en el pronóstico del paciente. Esto podría llevar al paciente a ser ingresado inmediatamente en lugar de ser enviado a casa.
  • La IA puede actuar como un segundo par de ojos al resaltar anomalías para el médico evaluador. Esto puede ayudar a identificar potencialmente sutilezas para problemas secundarios que un humano puede perder. Se puede crear una experiencia digital con el uso de Oracle Functions (o Oracle Container Engine for Kubernetes) o se puede presentar un panel de control con Oracle Visual Builder, Oracle JET o el servicio APEX.
  • El Data Lakehouse tendrá una amplia gama de datos relacionados que se pueden mezclar con el análisis médico para obtener información adicional a partir de los datos del paciente. Esto puede ayudar a descubrir tendencias o estadísticas inesperadas de las que el médico puede no estar al tanto.

    Por ejemplo, las notas en la historia clínica del paciente pueden añadir variables como si el paciente es fumador, es fumador o proviene de un hogar que incluye fumadores; o los datos de contacto del paciente combinados con datos geográficos pueden añadir variables asociadas con condiciones de vida que podrían tener factores complicantes (e.g., presencia de humedad o amianto).

    Sin esta asistencia, evaluar estos factores requeriría que el clínico también pensara como un trabajador social, un realista, y aumentaría el tiempo para revisar la historia clínica de un paciente en detalle, además de centrarse en evaluar las imágenes.

    Para lograr esta combinación de datos, almacenamos los datos semiestructurados o totalmente estructurados en una base de datos como el servicio Autonomous Database, utilizando Data Integration para enlazar los juegos de datos. Los datos no estructurados y semiestructurados, como las imágenes de Oracle Cloud Infrastructure Object Storage, se integrarán agregando enlaces a los datos estructurados, como los metadatos asociados a las imágenes. El proceso de enlazar imágenes a datos aptos para búsqueda se soportaría mediante el servicio Oracle Cloud Infrastructure Data Labeling (etiquetado de datos). El etiquetado de datos también se puede utilizar para etiquetar datos estructurados, de modo que los registros que representan valores atípicos se puedan etiquetar fácilmente y, a continuación, incluirlos explícitamente o excluirlos de los procesos de IA/AA.

  • Los hallazgos de AI/ML se notificarían como preliminares (o sujetos a un control clínico secundario) al paciente y a su proveedor de atención, por lo que podrían examinarse otras causas de los síntomas. El resultado neto de esto sería que el paciente es otro paso más cerca de su diagnóstico. Esta comunicación se podría conseguir extrayendo información de contacto de los registros del paciente en Autonomous Database y utilizando servicios como SMS, correo electrónico o notificando al personal clínico a través del panel de control o frontends digitales mencionados anteriormente.

Dado que los datos del paciente no están vinculados a restricciones físicas de TI de un centro médico, puede ser referido por expertos médicos externos en otras ubicaciones. Esto puede ocurrir de forma rápida y eficiente porque es probable que la infraestructura para trabajar con uno o más HIE esté en vigor, ampliando así las capacidades más allá de las capacidades de un único proveedor de atención. Este tipo de automatización se puede lograr mediante Oracle Integration Cloud Service (OIC) y un gateway de API (en una posición de salida, para que podamos controlar y auditar la salida de datos; si se utilizan API externas por llamada, la gestión de salida permite controlar esos servicios y evitar cargos por excedente). El uso compartido masivo de datos se gestionaría mediante FTP (proporcionado a través de OIC), pero la comunicación de datos no API se señalaría a través de llamadas de API en la primera instancia.

Figura: escenario de experiencia del paciente sin Data Lakehouse en OCI



Figura: escenario de experiencia del paciente con Data Lakehouse en OCI



Acerca del enlace de datos socioeconómicos con procesos de imagen clínica

Los almacenes de datos, que se pueden utilizar para ingerir grandes volúmenes de datos, se pueden conectar a otras fuentes de datos para facilitar un análisis eficiente para los médicos que evalúan a sus pacientes.

Hemos resaltado cómo el uso de un Data Lakehouse nos permite ingerir grandes volúmenes de datos y mezclar diferentes fuentes de datos para ayudar a proporcionar un tratamiento clínico adecuado. La capacidad de vincular datos no médicos con los pacientes es crucial. Considere la pandemia COVID-19 o los brotes de ébola en África Occidental, donde esos datos vinculados han ayudado a identificar y limitar la propagación de estos virus. Se pueden encontrar tratamientos óptimos para aquellos ya infectados que mejoran sus posibilidades de recuperación, velocidad de recuperación y problemas de salud postinfección (condiciones de depresión y ansiedad, intolerancia al ejercicio y fatiga) analizando a otros pacientes con infecciones y enfermedades similares y sus resultados.

Para conseguir este tipo de enlace, necesitamos comprender los datos disponibles, que es donde ayuda Oracle Cloud Infrastructure Data Catalog; no solo es necesario realizar un seguimiento de los datos que se almacenan en el mismo Data Lakehouse, sino que se almacenan en otros orígenes de datos a los que se puede acceder y utilizar mediante orígenes como API. A continuación, se puede utilizar para gestionar el contenido del Data Lakehouse e informar del análisis de datos que se realiza con las herramientas de Oracle Cloud Infrastructure Data Science para determinar las relaciones en los datos.

Entre las aplicaciones más comunes de los datos de mezcla se incluyen la identificación y el aislamiento de brotes como la enfermedad de Legionnaire, que tiene una tasa de mortalidad del 10% y estimada de 20.000 casos al año solo en los Estados Unidos. Este tipo de identificación implicaría extraer registros EMR/EHR relevantes en Autonomous Database y notas digitalizadas (Oracle Cloud Infrastructure Vision) de los pacientes sobre sus movimientos, y combinarlos con datos geográficos mediante el conjunto de herramientas de ciencia de datos y las capacidades de visualización de cualquiera de estos productos: Oracle Analytics Cloud, Oracle Visual Builder, Oracle JET o servicio APEX. La elección de las herramientas depende de la experiencia del usuario y de los datos que se van a presentar.

Organizaciones como el Centro para el Control de Enfermedades (CDC) y la Organización Mundial de la Salud (OMS) proporcionan API conectadas a conjuntos de datos sobre factores que contribuyen a la salud. Por ejemplo, los datos de calidad del aire se pueden recuperar de servicios de API como el Índice Mundial de Calidad del Aire. Estos datos son vitales para las personas con problemas pulmonares como la neumonía, ya que la calidad del aire o los niveles de toxicidad son un factor agravante significativo y pueden ser difíciles de evaluar debido a una varianza significativa incluso en distancias cortas entre cada sensor. Los datos se pueden evaluar mediante una combinación de Oracle Integration Cloud Service, gateway de API, Oracle Functions (o Oracle Container Engine for Kubernetes), Autonomous Database (contenido estructurado) y Oracle Cloud Infrastructure Object Storage (contenido no estructurado). Los procesos de preparación o limpieza de datos pueden utilizar Oracle Cloud Infrastructure Data Science, Oracle Cloud Infrastructure Data Flow u Oracle Cloud Infrastructure Data Integration para regular el flujo de datos dentro o fuera de la plataforma. A continuación, los flujos proporcionarían una capacidad de complemento de la API de Kafka, ya que nos permite manejar datos como una serie de eventos. Esto significa que si un servicio externo proporciona datos en ráfagas de datos altamente concentradas, los datos se pueden almacenar temporalmente hasta que esté listo para cargarlos en el Data Lakehouse.

Para lograrlo, necesitamos:

  • Capture y limpie los datos relevantes para evitar la "colada, la basura".
  • Traducir datos no estructurados a datos semiestructurados para facilitar la búsqueda y la interrogación.

El uso de estándares como HL7, FHIR, SNOMED (terminología clínica) y prácticas de HIE para representar los datos permite una mayor interoperabilidad con DICOM para imágenes. Estos estándares de dominio se basan en tecnologías comunes del sector como XML, JSON, REST, etc. Como resultado, los productos de Oracle pueden manejar los datos listos para usar con soluciones específicas de dominio entregadas sobre estas tecnologías.