Anwendung eines Data Lakehouse

Ein Data Lakehouse kann den Diagnoseprozess beschleunigen und verbessern und die Wiederherstellungschancen eines Patienten verbessern.

Der Unterschied zwischen PACS und VNA ist die Fähigkeit, eine größere Vielfalt von Bildformaten über DICOM hinaus zu behandeln. Beide können jedoch Herausforderungen darstellen. Die Images erfordern viel Speicherkapazität, sodass das Speichersystem häufig aktuelle Fallbilder enthält. Ältere Bilder werden wahrscheinlich zu niedrigeren Kosten, möglicherweise Offline-Speicher, verschoben, wodurch der Zugriff auf die Bildhistorie eines Patienten eine herausfordernde und zeitaufwendige Anstrengung ist. Die RIS- und PACS/VNA-Lösungen befinden sich wahrscheinlich On Premise im medizinischen Zentrum, sodass der Zugriff auf seine IT-Infrastruktur erforderlich sein kann. Das bedeutet auch, dass das medizinische Zentrum Speicherspezialisten einsetzen muss, um die Datensicherheit zu gewährleisten. Eine VNA-Lösung unterstützt eher die Teilnahme am Gesundheitsinformationsaustausch (HIE), wodurch Gesundheitsdienstleister zusammen daran arbeiten können, Daten zu teilen, sichere Netzwerke aufzubauen und Fast Healthcare Interoperability Resources (FHIR) und zugehörige Standards zu verwenden. Dies kann eine regulierte Lösung in einigen Ländern sein, z.B. im Gesundheits- und Sozialversicherungsnetz (HSCN) in Großbritannien. Vorschriften können zusätzliche Kosten für die Einhaltung der Vorschriften verursachen.

Ein Data Lakehouse kann den Prozess der Patientenreise erheblich beschleunigen. Durch die Einführung einer cloud-fähigen Speicherlösung ist ein schneller Zugriff auf sehr große Speichermengen (auch archivierte Speicher) in wirtschaftlicher Weise möglich, dass ein medizinisches Zentrum wahrscheinlich nicht mit einer On-Premise-Lösung übereinstimmt. Dank einer Cloud-Lösung können medizinische Zentren auch weniger oder weniger gezwungen werden, die für die Verwaltung von Redundanz- und Recovery-Problemen erforderlichen Fachkenntnisse zu erwerben, um die Lösung funktionsfähig zu halten.

Ein schnellerer Zugriff auf Bilder bedeutet, dass Ärzte mehr Zeit haben, Bilder zu bewerten, was die Zeit reduziert, die ein Patient auf eine Diagnose und Behandlung wartet. Das bedeutet auch, dass große Mengen an Images verwendet werden können, um Funktionen für künstliche Intelligenz (KI) und maschinelles Lernen (ML) (bereitgestellt von Oracle Cloud Infrastructure Vision und Oracle Cloud Infrastructure Data Science) in fehlerfreien und fehlerhaften Chests zu trainieren. Dies ermöglicht es KI/ML nicht nur, das primäre Problem (die aktuellen Symptome des Patienten) zu untersuchen, sondern könnte auch andere Probleme erkennen, für die der Patient noch keine Symptome entwickelt hat. Ob KI/ML beim Bewerten der Röntgenstrahlen Probleme festgestellt hat oder nicht, das letzte Wort sollte immer ein Mensch sein. Die KI zur Bildverarbeitung kann aufgrund ihrer Beurteilung auf verschiedene Weise dabei helfen:

  • Die KI kann die Röntgenstrahlen priorisieren, die signifikante Probleme aufzeigen, bei denen eine schnelle Intervention einen Unterschied zur Prognose des Patienten bewirken kann. Dies könnte dazu führen, dass der Patient sofort zugelassen wird, anstatt nach Hause geschickt zu werden.
  • Die KI kann als zweites Augenpaar fungieren, indem sie Anomalien beim Beurteilungskliniker hervorhebt. Dies kann dazu beitragen, Unterletien für sekundäre Probleme zu identifizieren, die ein Mensch möglicherweise versäumt. Eine digitale Erfahrung kann mit Oracle Functions (oder Oracle Container Engine for Kubernetes) erstellt werden, oder ein Dashboard kann mit Oracle Visual Builder, Oracle JET oder APEX-Service wiedergegeben werden.
  • Das Data Lakehouse wird eine Vielzahl von verwandten Daten haben, die mit der medizinischen Analyse kombiniert werden können, um zusätzliche Einblicke aus den Patientendaten zu gewinnen. Dies kann helfen, unerwartete Trends oder Erkenntnisse zu erkennen, die der Arzt möglicherweise nicht kennt.

    Beispielsweise können Notizen in den medizinischen Aufzeichnungen des Patienten Variablen hinzufügen, wie z.B. ob der Patient ein Raucher ist, ein Raucher war oder aus einem Haushalt kommt, der Raucher umfasst; oder die Kontaktdaten des Patienten in Kombination mit geografischen Daten können Variablen hinzufügen, die mit Lebensbedingungen verbunden sind, die komplizierende Faktoren haben könnten (e.g, das Vorhandensein von Feuchtigkeit oder Asbest).

    Ohne diese Hilfe würde die Bewertung dieser Faktoren erfordern, dass der Arzt auch wie ein Sozialarbeiter, ein Realtor denken würde, und würde die Zeit erhöhen, die Krankengeschichte eines Patienten im Detail zu überprüfen, und sich nicht nur auf die Beurteilung der Bilder konzentrieren.

    Um diese Datenmischung zu erreichen, speichern wir die halb- oder vollständig strukturierten Daten in einer Datenbank wie dem Autonomous Database-Service und verknüpfen die Datasets mit Data Integration miteinander. Die unstrukturierten und halbstrukturierten Daten, wie die Images in Oracle Cloud Infrastructure Object Storage, werden integriert, indem Links zu den strukturierten Daten hinzugefügt werden, wie die mit den Images verknüpften Metadaten. Die Verknüpfung von Images mit durchsuchbaren Daten wird mit dem Oracle Cloud Infrastructure Data Labeling-(Data Labeling-)Service unterstützt. Mit der Datenbeschriftung können auch strukturierte Daten beschriftet werden, sodass Datensätze, die Ausreißer darstellen, einfach getaggt und dann explizit in KI/ML-Prozesse aufgenommen oder daraus ausgeschlossen werden können.

  • Die Befunde der KI/ML würden als vorläufige (oder einer sekundären ärztlichen Prüfung) an den Patienten und ihren Pflegedienst gemeldet, sodass andere Ursachen für die Symptome untersucht werden könnten. Das Ergebnis wäre, dass der Patient einen weiteren Schritt näher an seine Diagnose stellt. Diese Kommunikation könnte dadurch erreicht werden, dass Kontaktdaten aus den Datensätzen des Patienten in Autonomous Database abgerufen und Services wie SMS, E-Mail oder die klinischen Mitarbeiter über das Dashboard oder die zuvor genannten digitalen Frontends genutzt werden.

Da die Daten des Patienten nicht an physikalische IT-Beschränkungen eines medizinischen Zentrums gebunden sind, können externe medizinische Experten an anderen Standorten darauf verweisen. Dies kann schnell und effizient geschehen, da die Infrastruktur, mit einer oder mehreren HIE zusammenzuarbeiten, wahrscheinlich vorhanden sein wird, wodurch die Kapazitäten über die Fähigkeiten eines einzigen Pflegeanbieters hinaus erweitert werden. Diese Art der Automatisierung kann über Oracle Integration Cloud Service (OIC) und ein API-Gateway (in einer ausgehenden Position, sodass wir Daten-Egress kontrollieren und auditieren können. Wenn externe APIs auf Aufrufbasis verwendet werden, kann die ausgehende Verwaltung diese Services kontrollieren und Überschussgebühren vermeiden. Bulky Data Sharing wird über FTP (über OIC bereitgestellt) verwaltet, aber die Kommunikation von Nicht-API-Daten wird in der ersten Instanz über API-Aufrufe signalisiert.

Abbildung - Patientenerfahrungsszenario ohne Data Lakehouse auf OCI



Abbildung - Patientenerfahrungsszenario mit Data Lakehouse auf OCI



Informationen zum Verknüpfen von sozioökonomischen Daten mit klinischen Bildprozessen

Data Lakehouses, die für die Aufnahme großer Datenmengen verwendet werden können, können mit anderen Datenquellen verbunden werden, um eine effiziente Analyse für Ärzte, die ihre Patienten bewerten, zu erleichtern.

Wir haben hervorgehoben, wie wir mit einem Data Lakehouse große Datenmengen aufnehmen und verschiedene Datenquellen kombinieren können, um eine geeignete klinische Behandlung zu ermöglichen. Die Fähigkeit, nicht-medizinische Daten mit Patienten zu verknüpfen, ist von entscheidender Bedeutung. Betrachten Sie die COVID-19-Pandemie oder die Ebola-Ausbrüche in Westafrika, in denen solche verknüpften Daten dazu beigetragen haben, die Verbreitung dieser Viren zu erkennen und zu begrenzen. Optimale Behandlungen für diejenigen, die bereits infiziert sind, die ihre Recovery-Chancen, Recovery-Geschwindigkeit und Post-Infektion Gesundheitsprobleme (Bedingungen von Depressionen und Angstzuständen, Intoleranz und Müdigkeit) verbessern, können gefunden werden, indem sie gegen andere Patienten mit ähnlichen Infektionen und Krankheiten und ihre Ergebnisse analysieren.

Um diese Art von Verknüpfung zu erreichen, müssen wir die für uns verfügbaren Daten verstehen. Hier hilft Oracle Cloud Infrastructure Data Catalog. Dabei werden nicht nur die Daten verfolgt, die im Lakehouse selbst gespeichert werden, sondern sie werden in anderen Datenquellen gespeichert, auf die über Quellen wie APIs zugegriffen und verwendet werden kann. Damit können Sie den Inhalt des Data Lakehouse verwalten und die Datenanalyse informieren, die mit den Oracle Cloud Infrastructure Data Science-Tools ausgeführt wird, um die Beziehungen in den Daten zu bestimmen.

Häufigere Anwendungen von Mischdaten umfassen die Identifizierung und Isolierung von Ausbrüchen wie Legionnaire's Disease, die eine 10%ige Sterblichkeitsrate und schätzungsweise 20.000 Fälle pro Jahr in den USA allein hat. Dieser Identifikationstyp würde das Extrahieren relevanter EMR/EHR-Datensätze in der Autonomous Database- und digitalisierten (Oracle Cloud Infrastructure Vision-)Notizen von Patienten über ihre Bewegungen und das Kombinieren mit geografischen Daten mit dem Data Science-Toolset und den Visualisierungsfunktionen jedes dieser Produkte bedeuten: Oracle Analytics Cloud, Oracle Visual Builder, Oracle JET oder APEX-Service. Die Auswahl der Tools hängt von der gewünschten Benutzererfahrung und den darzustellenden Daten ab.

Organisationen wie das Center for Disease Control (CDC) und die Weltgesundheitsorganisation (WHO) stellen APIs bereit, die mit Datasets über beitragende Faktoren für die Gesundheit verbunden sind. Beispiel: Luftqualitätsdaten können aus API-Services wie dem World Air Quality Index abgerufen werden. Diese Daten sind für Menschen mit Lungenbeeinträchtigungen wie Lungenentzündung von entscheidender Bedeutung, da Luftqualität oder Toxizitätsniveaus einen signifikanten Verschlimmerungsfaktor darstellen und auch in kurzen Abständen zwischen jedem Sensor aufgrund erheblicher Varianz schwer zu beurteilen sein können. Die Daten können mit einer Kombination aus Oracle Integration Cloud Service, API-Gateway, Oracle Functions (oder Oracle Container Engine for Kubernetes), Autonomous Database (strukturierter Inhalt) und Oracle Cloud Infrastructure Object Storage (unstrukturierter Inhalt) bewertet werden. Datenvorbereitungs- oder Bereinigungsprozesse können Oracle Cloud Infrastructure Data Science, Oracle Cloud Infrastructure Data Flow oder Oracle Cloud Infrastructure Data Integration verwenden, um den Datenfluss in die bzw. aus der Plattform zu regulieren. Streams stellt dann eine Kafka-API-Komplementierungsfunktion bereit, da wir damit Daten als eine Reihe von Ereignissen verarbeiten können. Wenn ein externer Service Daten in hochkonzentrierten Daten-Bursts bereitstellt, können die Daten so lange zwischengespeichert werden, bis sie in das Data Lakehouse geladen werden können.

Um dies zu erreichen, müssen wir:

  • Erfassen und bereinigen Sie relevante Daten, um "Abfälle" zu vermeiden.
  • Übersetzen Sie unstrukturierte Daten in halbstrukturierte Daten, um die Suche und Abfrage zu vereinfachen.

Die Verwendung von Standards wie HL7, FHIR, SNOMED (klinische Terminologie) und Übungen von HIE zur Darstellung der Daten ermöglicht eine bessere Interoperabilität mit DICOM für die Bildgebung. Diese Domainstandards basieren auf allgemeinen Branchentechnologien wie XML, JSON, REST usw. Daher können Oracle-Produkte die Daten out-of-the-box mit domainspezifischen Lösungen verarbeiten, die auf diesen Technologien bereitgestellt werden.