Analysieren und visualisieren Sie Gesundheitsdaten und wenden Sie KI auf OCI an, um reale Herausforderungen zu lösen
Oracle Cloud Infrastructure (OCI) und Services bieten viele Optionen zum Erstellen, Bereitstellen und Überwachen skalierbarer und leistungsstarker Analyselösungen über Electronic Health Record- und Patientenüberwachungsdaten und bieten einfachen Zugriff auf umsetzbare Informationen über eine nahtlose Benutzererfahrung über eine einfache und intuitive Weboberfläche.
Daten aus medizinischen Geräten können analysiert werden, um Alarmparameter zu optimieren, und KI kann helfen, intelligente Anwendungen zur Verbesserung der klinischen Effizienz und zur Risikominderung zu entwickeln.
Für diese Referenzarchitektur präsentieren wir einen Kunden-Anwendungsfall, der Snowflake und Snowpark zum Speichern und Analysieren von Daten verwendete. Dies verursachte Herausforderungen bei steigenden Kosten und reduzierte den allgemeinen Preis-Leistungs-Vorteil. Da sich immer mehr Krankenhäuser und Gesundheitsdienstleister für den Dienst angemeldet hatten, wuchsen die Daten exponentiell an, und die Kosten für die Analyse von Hunderten von Terabyte an Daten wuchsen exponentiell. Der Lösung fehlte die Flexibilität, zweckmäßige Datenanalyselösungen bereitzustellen.
Ineffizientes Daten- und Modellmanagement behinderte die Fähigkeit, Kunden schnell zu integrieren und Produkte auf den Markt zu bringen. Die Sicherheit des Systems war nachträglich und erforderte oft einen manuellen Prozess, um auf jeder Ebene des Deployments die richtigen Sicherheitskontrollen zu implementieren. Aufgrund fehlender Unterstützung für Open-Source-Tools und -Bibliotheken wurden Anbietersperren geschaffen und die Portabilität verhindert.
Architektur
OCI unterstützt Open-Source-Tools, und sein Framework macht es nahtlos, die Architektur mit internen qualifizierten Ressourcen zu implementieren und gleichzeitig Portabilität bereitzustellen.
In dieser Referenzarchitektur werden wir ein Lösungsdesign diskutieren, das für Anwendungsfälle implementiert werden kann, einschließlich der Verbesserung der Patientenversorgung und der Prävention von Krankheiten, der evidenzbasierten Entscheidungsfindung in der Vorautorisierung und der Erkennung, Analyse und Optimierung medizinischer Alarmparameter für Krankenhäuser und Gesundheitsdienstleister.
Datenanalysen und maschinelles Lernen:
Für Kunden im Gesundheitswesen war Oracle Autonomous Data Warehouse eine ideale Lösung, da der Kunde Streamingdaten von Sensoren verwendete, bei denen die Skalierbarkeit und die Lakehouse-Funktionen von Oracle Autonomous Data Warehouse optimal waren. Die einfache Integration von Oracle Autonomous Data Warehouse mit Oracle Machine Learning half dem Kunden, seine Daten in der Vorverarbeitungsphase besser vorzubereiten und zu verstehen. Oracle Machine Learning unterstützt auch den Export von Daten in und aus Jupyter Notebooks, sodass Data Scientists das datenbankinterne ML von Oracle mit anderen gängigen Data Science-Bibliotheken kombinieren können. Oracle Machine Learning bietet viele Vorteile, darunter: einfache Installation, Verwendung von datenbankinternem Computing, reduzierter Verwaltungsaufwand, leistungsstarke und skalierbare Datenbank-Computing für SQL, Python-basierte Analysen in großem Maßstab.
Mit Oracle Machine Learning konnte der Kunde eine Vielzahl von Python-basierten Bibliotheken (einschließlich Panda, NumPy) installieren und testen, die vorhandene Julia-Anwendung und Analysen in großem Maßstab ausführen. Oracle Machine Learning bietet auch die automatische Modellbereitstellung, bei der Modelle nach dem Training und der Vereinfachung des Deployment-Prozesses sofort für die Bewertung in Anwendungen oder Analyse-Dashboards verfügbar sind. Der Kunde konnte dieselben Python-UDFs und UDTFs sowie dieselben SQL-Abfragen von Snowflake zu Oracle Autonomous Data Warehouse portieren, ohne dass Code umgeschichtet werden musste. Für das ML-Modell nutzte der Kunde die Funktion AutoML, wodurch der Modelltrainingsprozess erheblich vereinfacht wurde, sodass Benutzer mit minimalem maschinellem Lernen die gewünschte Genauigkeit erreichen und Erkenntnisse aus medizinischen Gerätedaten generieren konnten.
KI-Anwendung mit GPU-Compute auf OCI:
OCI bietet eine optimale Performance für KI-Anwendungen mit modernster Cloud-Infrastruktur, die auf Nvidia- und AMD-GPUs basiert. OCI hilft Ihnen, Ihre KI-Lösung mit Modelltraining, Inferenzierung und KI-Analyse zu beschleunigen. OCI arbeitet mit Nvidia zusammen, um Nvidia Nemo für die End-to-End-Entwicklung generativer KI zu bringen, und nutzt Nvidia Inference Microservices (NIM), um die KI-Inferenzierung von KI-Modellen zu beschleunigen. Um KI-Anwendungen auf der OCI-KI-Infrastruktur auszuführen, stellt OCI GPU-Compute-Instanzen entweder mit einem HPC-Slurm-Cluster oder mit Oracle Cloud Infrastructure Kubernetes Engine (OCI Kubernetes Engine oder OKE) mit unseren angepassten und skalierbaren Terraform-Stacks bereit, einschließlich verschiedener Speicheroptionen.
KI-basiertes medizinisches Diagnose- und klinisches Datenmanagement besteht aus NLP/LLM für EHR-Daten, medizinische Bildgebung, klinische Daten und Laborergebnisse. Nvidia-Anwendungs-Frameworks wie BioNemo, MONAI, Triton Inference Server und Cohere bieten eine Lösung, die den Einsatz von KI beschleunigt.
Data Science-Notizbücher und -Integration:
Diese Referenzarchitektur verwendet den Oracle Cloud Infrastructure Data Science-Service, eine vollständig verwaltete Plattform, mit der Data Scientists Modelle für maschinelles Lernen (ML) mit Python mit integriertem Framework wie Pytorch, TensorFlow und einem anderen Open-Source-Framework Ihrer Wahl erstellen, trainieren, bereitstellen und verwalten können. Mit diesem Service kann eine Open-Source-Jupyter-basierte Entwicklungsumgebung mit integrierter Integration mit GitHub erstellt werden. Nvidia A10 GPU-Compute kann zum Trainieren der LLM-Modelle, zum Erstellen einer mit mlfow integrierten MLOps-Pipeline und schließlich zum Bereitstellen aus dem Notebook in einem skalierbaren und latenzarmen gesicherten Endpunkt und zur Überwachung der Modellperformance verwendet werden. Der Kunde kann aus einer Vielzahl von unterstützten Nvidia-GPUs auf Bare-Metal- oder virtuellen Instanzen wählen, um KI-Modelle in großem Maßstab zu trainieren und bereitzustellen.
Backup und Disaster Recovery:
Für das Gesundheitswesen ist der Schutz und die Verfügbarkeit von Kundendaten äußerst wichtig. Aufgrund verschiedener Vorschriften müssen Daten geschützt und auf Anfrage zur Verfügung gestellt werden. Oracle Autonomous Database bietet Optionen für automatisiertes Backup und Recovery und kann eine Replikatdatenbank mit Oracle Cloud Guard erstellen. Das Datenbankreplikat kann auch als schreibgeschützte Standbykopie der Datenbank verwendet werden, um die Belastung der Primärdatenbank zu reduzieren und somit die Datenbankperformance und das Load Balancing zu verbessern.
Sicherheits- und Zugriffsverwaltung:
Diese Architektur implementiert Best Practices für die OCI Zero Trust-Sicherheit mithilfe von Netzwerk-, Daten- und Anwendungssicherheitsfunktionen in allen Schichten der Architektur. Zur Netzwerksicherheit wird Compute im privaten Netzwerk mit Virtual Cloud Network (VCN) implementiert, und der Trafficfilter wird mit der Sicherheitsliste (SLs) und Netzwerksicherheitsgruppe (NSGs) angewendet. Daten werden immer im Ruhezustand (AES256) und während der Übertragung (TLS 2.0) mit einfacher vom Kunden bereitgestellter Zertifikatsverwaltung verschlüsselt.
Oracle Data Safe, das in Oracle Autonomous Database enthalten ist, bietet ein einheitliches Control Center, mit dem Sie die täglichen Sicherheits- und Complianceanforderungen von Oracle-Datenbanken verwalten können. Oracle Data Safe bietet erweiterte Datensicherheitsfeatures, die für das Gesundheitswesen erforderlich sind, wie Datenmaskierung, Datenverschleierung, Aktivitätsauditing und SQL-Firewallmanagement.
Oracle Cloud Infrastructure Identity and Access Management (OCI Identity and Access Management) implementiert das Prinzip der geringsten Berechtigung und der OAuth 2.0-Authentifizierung des Endbenutzerzugriffs mit Identität. Es bietet auf sichere Weise erweiterte Funktionen wie Multi-Faktor-Authentifizierung und tokenbasierte Authentifizierung (JWT).
Das folgende Diagramm veranschaulicht diese Referenzarchitektur.
OCI-ai-healthcare_arch-oracle.zip
Die Architektur umfasst die folgenden Komponenten:
- API-Gateway
Mit Oracle Cloud Infrastructure API Gateway können Sie APIs mit privaten Endpunkten veröffentlichen, auf die Sie über Ihr Netzwerk zugreifen können, und die Sie bei Bedarf im öffentlichen Internet verfügbar machen können. Die Endpunkte unterstützen API-Validierung, Anforderungs- und Antworttransformation, CORS, Authentifizierung und Autorisierung sowie Anforderungsbegrenzung.
- Objektspeicher
Mit Oracle Cloud Infrastructure Object Storage können Sie schnell auf große Mengen an strukturierten und unstrukturierten Daten eines beliebigen Inhaltstyps zugreifen, darunter Datenbankbackups, Analysedaten und umfangreiche Inhalte, wie Bilder und Videos. Sie können Daten sicher im Internet oder in der Cloud-Plattform speichern und abrufen. Sie können den Speicher skalieren, ohne dass die Performance oder Servicezuverlässigkeit beeinträchtigt wird. Verwenden Sie Standardspeicher für "guten" Speicher, auf den Sie schnell, sofort und häufig zugreifen müssen. Verwenden Sie Archivspeicher für "Cold Storage", den Sie über lange Zeiträume beibehalten und auf den Sie nur selten zugreifen.
- Web Application Firewall (WAF)
Oracle Cloud Infrastructure Web Application Firewall (WAF) ist ein mit der Zahlungskartenindustrie (PCI) konformer, regionaler Edge-Enforcement-Service, der an einen Enforcement Point angehängt ist, wie einen Load Balancer oder einen Domainnamen einer Webanwendung. WAF schützt Anwendungen vor schädlichem und unerwünschtem Internettraffic. WAF kann alle internetseitigen Endpunkt schützen und bietet eine konsistente Regeldurchsetzung über alle Anwendungen eines Kunden hinweg.
- Dynamisches Routinggateway (DRG)
Das DRG ist ein virtueller Router, der einen Pfad für privaten Netzwerktraffic zwischen VCNs in derselben Region zwischen einem VCN und einem Netzwerk außerhalb der Region bereitstellt, z.B. ein VCN in einer anderen Oracle Cloud Infrastructure-Region, ein On-Premise-Netzwerk oder ein Netzwerk in einem anderen Cloud-Provider.
- Sicherheitsliste
Für jedes Subnetz können Sie Sicherheitsregeln erstellen, die Quelle, Ziel und Typ des Traffics angeben, der im Subnetz und aus dem Subnetz zugelassen werden muss.
Empfehlungen
- OCI Data Integration ist ein vollständig verwalteter, mehrmandantenfähiger Service, der Data Engineers und Entwickler bei Aufgaben zum Verschieben von Daten und zum Laden von Daten unterstützt. Die Lösung kann den Dataload-Service für die Datenintegration verwenden, um Daten aufzunehmen und in eine Staging Area im Objektspeicher zu laden, um eine kostengünstige, dauerhafte und hoch skalierbare langfristige Datenaufbewahrung zu ermöglichen. Massendatenübertragungen können mit gesicherten FTP-, HL7v2-über-MLP- und Standardwebservices für Fast Healthcare Interoperability Resources (FHIR) erfolgen. Zwischengespeicherte Daten können weiterverarbeitet, vorbereitet und kuratiert werden, um sie in einer Oracle Autonomous Data Warehouse-Datenbank für die Anwendungs- und Benutzerverwendung über die Webschnittstelle und Ad-hoc-Abfrage aufzufüllen.
Unterstützt durch Spark-ETL- oder ELT-Prozesse kann eine große Datenmenge aus einer Vielzahl von Datenassets aufgenommen, bereinigt, transformiert, umgestaltet und effizient in Oracle Autonomous Data Warehouse geladen werden. Die Oracle Autonomous Data Warehouse-Datenbank ist eine branchenführende, vollständig verwaltete und automatisierte Datenbank für analytische Workloads, einschließlich Data Marts, Data Warehouse und Data Lakes. Es ist selbstoptimierend und stellt automatisiertes Provisioning, Patching und Wartung bereit, wodurch die Performance optimiert wird.
Weitere Daten können mit dem Oracle Cloud Infrastructure Data Science-Service analysiert werden. KI-Modelle können mit leistungsstarkem, kostengünstigem GPU-Compute erstellt, trainiert und bereitgestellt werden. Benutzerdefinierte ausgehende Web-Hooks werden erstellt, um Datenassets über einen gesicherten Endpunkt und einen Identitätsservice an Endbenutzer zu übertragen.
- Verwenden Sie ein privates virtuelles Cloud-Netzwerk, um Services bereitzustellen, und verwenden Sie eine Sicherheitsliste und NSGs, um den unbeabsichtigten Zugriff einzuschränken.
- Verwenden Sie OCI Identity and Access Management, um den Principal für geringste Berechtigungen und rollenbasierte Zugriffskontrollen anzuwenden.
- Mit OCI-API-Gateway können Sie APIs mit privaten Endpunkten veröffentlichen, auf die Sie über Ihr Netzwerk zugreifen können. Sie können jedoch bei Bedarf dem öffentlichen Internet zur Verfügung gestellt werden. Die Endpunkte unterstützen API-Validierung, Anforderungs- und Antworttransformation, CORS, Authentifizierung und Autorisierung sowie Anforderungsbegrenzung.
- OCI stellt die Einhaltung wichtiger Standards wie HIPAA und FedRAMP sicher und bietet eine sichere Grundlage für den Schutz sensibler Daten.
- Verwenden Sie Open-Source-Technologie, um eine Abhängigkeit von Anbietern auf OCI zu vermeiden, wie LangChain, REST-API, Functions, und erstellen Sie darüber hinaus eine Abstraktionsschicht, um Innovation und Transformation zu beschleunigen.