Scopri in che modo l'intelligenza artificiale e il machine learning di OCI migliorano l'esperienza dei pazienti
Come accade con qualsiasi azienda, il settore sanitario deve poter accedere, analizzare, manipolare e archiviare grandi volumi di dati. Questo tipo di elaborazione dati è centrale per le tecnologie alla base di Oracle Cloud Infrastructure Lakehouse (data Lakehouse), che agevola l'intelligenza artificiale (AI) e il Machine Learning per migliorare l'esperienza dei pazienti.
La configurazione di un sistema sanitario, in termini di esperienza del paziente, dovrebbe considerare:
- Ottenere informazioni accurate sui pazienti ai medici il più rapidamente possibile, con una facilità che rimuove i costi inutili, consentendo al veterinario di trascorrere il più tempo possibile sul caso del paziente.
- Ottenere il paziente dai sintomi al recupero il più rapidamente possibile.
- Garantire il processo è il più efficiente possibile in termini di costi, indipendentemente dal fatto che i costi siano sostenuti dal paziente, dalla sua assicurazione medica o da un servizio sanitario pubblico (e.g, Servizio sanitario nazionale nel Regno Unito).
Ad esempio, un medico generico (GP) o un medico di base (PCP) ritiene che il paziente presenti segni di polmonite. Hanno riferito il paziente a un centro medico (ospedale o centro di imaging) per una radiografia toracica per indagare se la polmonite o qualcos'altro sta causando i sintomi del paziente. Il primo passo in questo processo è quello di fissare un appuntamento con il centro medico e condividere la documentazione medica elettronica del paziente (EMR) o la documentazione sanitaria elettronica (EHR). Idealmente, questi dati sarebbero incorporati nel data lakehouse.
Il personale radiologico del centro medico avrebbe preso i raggi X, ma da quel punto in avanti, il data lakehouse e le tecnologie correlate svolgono un ruolo attivo nel processo di diagnosi. L'immagine a raggi X viene creata utilizzando il sistema RIS (Radiology Information System) e memorizzata utilizzando il sistema di archiviazione e comunicazione delle immagini (PACS) o una nuova generazione di storage di dati come il Vendor Neutral Archive (VNA). Le immagini sono probabilmente memorizzate utilizzando un formato di imaging medico come Digital Imaging and Communications in Medicine (DICOM), che memorizza un'immagine ad alta risoluzione con i relativi metadati associati, come i dettagli su dove e quando l'immagine è stata generata e il tipo di modalità (come l'immagine è stata catturata). Questi metadati sono collegati al paziente corretto e ai relativi record.
Una volta acquisite le immagini, un medico esamina e interpreta ciascuna per determinare le esigenze cliniche del paziente. Si tratta di un processo che richiede molto tempo, che spesso porta il paziente ad attendere ulteriori informazioni a casa.
Questo playbook si concentrerà su come una data lakehouse partecipa a soluzioni che forniscono i risultati che abbiamo descritto.
Questo playbook si concentrerà sui sistemi coinvolti in un caso d'uso che coinvolge un ospedale regionale e chiamerà aree correlate, ma non entrerà nei dettagli della soluzione.
Architettura
Questa architettura mostra un centro medico che accede e utilizza un data lakehouse OCI.
- È probabile che la configurazione iniziale richieda l'utilizzo del servizio di trasferimento dati come metodo efficiente, conveniente e rapido per eseguire la migrazione di tutti i dati esistenti dalla soluzione PACS a Oracle Cloud Infrastructure (OCI) per l'elaborazione. Se le prestazioni della connettività per le operazioni in corso sono state problematiche, questo potrebbe essere esteso ai trasferimenti giornalieri. Oltre ai dati dei PAC, questo può essere un mezzo per spedire in blocco le registrazioni dei pazienti e le informazioni associate.
- Ulteriori fonti di dati come la collaborazione sulla condivisione di EMR tra i fornitori di servizi sanitari potrebbero includere il GP o il PCP del paziente.
- Vengono fornite funzioni per eseguire complesse manipolazioni dei dati. Ad esempio, estraggono i metadati da un'immagine DICOM. Questi processi sono troppo complessi per essere efficacemente attuati all'interno degli strumenti di persistenza e della business logic. Ciò significa che ogni volta che viene introdotto un nuovo oggetto dati non strutturato complesso, ad esempio un nuovo tipo di immagine, è possibile inserirlo in una nuova logica.
- I dati in entrata e in uscita dai servizi supportano la condivisione del paziente EHR/EMR.
- Come indicato nello scenario, più dati che possono essere ottenuti in relazione ai casi d'uso, come ulteriori approfondimenti sui pazienti, consentono di ottenere ulteriori approfondimenti. Ad esempio, il set di dati CDC Social Determinants of Health (SDOH) fornisce API per indicatori socioeconomici per varie condizioni di salute.
- Ciò riflette il numero di servizi utilizzati direttamente o indirettamente per supportare la sicurezza e l'operabilità della piattaforma e della soluzione.
- I servizi data lakehouse sono raggruppati. In base allo specifico caso d'uso, potrebbero non essere necessari tutti i servizi.
- Si presume che l'aspettativa principale sia incentrata sul servizio Web poiché i terzi nasconderanno il modo in cui i loro dati vengono gestiti. Ciò riflette anche la direzione dello sviluppo di standard come FHIR.
Come mostra il diagramma, il flusso di dati tra il centro medico e l'ambiente OCI viene protetto attraverso una VPN e garantito in termini di prestazioni utilizzando Oracle Cloud Infrastructure FastConnect (FastConnect), nonostante l'elevato volume di dati di imaging che si spostano avanti e indietro.
La soluzione PACS o VNA può essere integrata in diversi modi a seconda delle funzionalità della soluzione PACS, dalla semplice esposizione dello storage PACS a un server FTP limitato che può essere sottoposto a regolari polling (e.g, ogni 10-15 minuti), alle specifiche API allineate al modello di comunicazione DICOM per lo scambio di messaggi. Nel diagramma dell'architettura possiamo notare che l'utilizzo di funzionalità di OCI per spostare il PACS on-premise è anche una possibilità.
Vengono fornite funzioni personalizzate che possono estrarre i metadati correlati alle immagini in DICOM. I metadati estratti possono essere memorizzati separatamente per supportare la ricerca rapida dei contenuti in quanto le immagini non devono essere interrogate ogni volta che viene eseguita una ricerca.
Sebbene l'integrazione con altre origini dati possa avvenire utilizzando vari protocolli e tecnologie, il meccanismo preferito è l'adozione delle API REST FHIR. Tuttavia, gli strumenti di integrazione disponibili offrono una vasta gamma di tecnologie e protocolli di integrazione. Si noti che l'imaging non può essere supportato con FHIR in quanto lo standard attualmente non supporta tali dati.
Sebbene i dati siano centralizzati per sfruttare il provisioning del database, l'uso di Oracle Cloud Infrastructure Data Catalog e del gateway API consente alle organizzazioni di svilupparsi verso le idee di una rete di dati. In particolare, il decentramento della proprietà dei dati esponendo i dati in un modo in cui i proprietari dei dati sono confortevoli. Inoltre, l'API offre uno strumento per ottenere un accesso efficiente ai dati applicando al contempo il controllo dell'accesso. Ciò significa che gli stessi dati possono essere messi a disposizione di diversi consumatori per scopi diversi, pur rimanendo senza impatto dal comportamento e dalle esigenze dei consumatori (e.g., i dati sono resi disponibili sia al personale mobile che ai medici con pazienti su piattaforme di visualizzazione medica).
Questa architettura supporta i servizi specifici di data lakehouse riportati di seguito.
- Storage oggetto
Lo storage degli oggetti ti consente di accedere rapidamente a grandi quantità di dati strutturati e non strutturati di qualsiasi tipo di contenuto, inclusi i backup del database, i dati analitici e i contenuti avanzati quali immagini e video. Puoi archiviare e recuperare i dati in modo sicuro direttamente da Internet o dall'interno della piattaforma cloud. Puoi ridimensionare lo storage in modo trasparente senza subire cali di prestazioni o affidabilità dei servizi. Puoi utilizzare lo storage standard per lo storage "hot" a cui hai bisogno per accedere in modo rapido, immediato e frequente. Utilizzare lo storage di archivio per lo storage in grassetto conservato per lunghi periodi di tempo e accesso raramente eseguito.
In questo contesto, lo storage degli oggetti viene utilizzato per memorizzare contenuti non strutturati, ad esempio le immagini x-ray e a cui viene fatto riferimento mediante dati più strutturati, inclusi i metadati dell'immagine, per rendere le immagini rapidamente ricercabili.
- Catalogo dati
Oracle Cloud Infrastructure Data Catalog è una soluzione di ricerca automatica e gestione del controllo dei dati self-service completamente gestita per i dati aziendali. Fornisce ai responsabili dei dati, ai data scientist, agli steward dati e ai Chief Data Officer un singolo ambiente collaborativo per gestire i metadati tecnici, aziendali e operativi dell'organizzazione.
Il Catalogo dati all'interno del contesto contribuirà a comprendere gli asset di dati e come potrebbero essere gestiti all'interno della casetta per fornire ulteriori informazioni. Ciò coprirebbe i dati detenuti internamente e le risorse di dati di terze parti che possono essere estratti in Lakehouse attraverso meccanismi quali il richiamo di API e il trasferimento di file. Sono disponibili altre tecnologie per includere i dati, ma API e file sono i modelli più comuni.
- Integrazione dei dati
Utilizza Oracle Cloud Infrastructure Data Integration per il flusso di dati ottimale tra i sistemi.
Supporta lo sviluppo di ETL e pipeline di dati dichiarativi e senza codice o con uso ridotto. Per la Lakehouse, questo sarebbe uno dei principali strumenti di manipolazione dei dati e di elaborazione.
È possibile applicare Integrazione dei dati anche per eseguire task quali la trasformazione di dati da semistrutturati a dati miniabili completamente strutturati. Esegui attività quali la pulizia dei dati in modo che i dati danneggiati o danneggiati non possano distorcere i risultati.
- Flusso di dati
Oracle Cloud Infrastructure Data Flow è un servizio Apache Spark completamente gestito che esegue task di elaborazione su data set di enorme entità: senza l'infrastruttura da distribuire o gestire. Gli sviluppatori possono anche utilizzare lo streaming Spark per eseguire ETL sul cloud sui dati di streaming prodotti continuamente. In questo modo, gli sviluppatori possono dedicarsi rapidamente allo sviluppo delle applicazioni e non alla gestione dell'infrastruttura.
Flusso di dati consente di elaborare i dati in un modo più ampio di eventi o serie di timer. In questo modo è possibile eseguire un'analisi più approfondita, anziché attendere la ricezione di tutti i dati.
- Servizio Big Data
Oracle Big Data Cloud Service aiuta i professionisti dei dati a gestire, catalogare ed elaborare i dati grezzi. Oracle offre lo storage degli oggetti e i data lake basati su Hadoop per la persistenza.
- Autonomous Database
Oracle Cloud Infrastructure Autonomous Database è un ambiente di database completamente gestito e preconfigurato che puoi utilizzare per i carichi di lavoro di elaborazione delle transazioni e data warehousing. Non è necessario configurare o gestire alcun componente hardware né installare software. Oracle Cloud Infrastructure gestisce la creazione del database, nonché il backup, l'applicazione di patch, l'aggiornamento e il tuning del database.
Suggerimenti
- Rete cloud virtuale (VCN) e subnet
Una VCN è una rete personalizzabile definita dal software che si imposta in un'area Oracle Cloud Infrastructure. Analogamente alle reti di data center tradizionali, i VCN offrono un controllo completo sull'ambiente di rete. Una VCN può avere più blocchi CIDR non sovrapposti che è possibile modificare dopo aver creato la VCN. Puoi suddividere una VCN in subnet, che possono essere definite in un'area o in un dominio di disponibilità. Ogni subnet è composta da un intervallo contiguo di indirizzi che non si sovrappongono alle altre subnet nella VCN. Puoi modificare la dimensione di una subnet dopo la creazione. Una subnet può essere pubblica o privata.
- Cloud Guard
È possibile utilizzare Oracle Cloud Guard per monitorare e gestire la sicurezza delle risorse in Oracle Cloud Infrastructure. Cloud Guard utilizza le ricette del rilevatore che puoi definire per esaminare le risorse in base ai punti deboli della sicurezza, nonché per monitorare gli operatori e gli utenti per le attività a rischio. Quando viene rilevata un'attività di configurazione errata o non sicura, Cloud Guard consiglia azioni correttive e supporta l'esecuzione di tali azioni in base alle ricette del rispondente che è possibile definire.
- Zona di sicurezza
Le zone di sicurezza garantiscono fin dall'inizio le procedure ottimali di sicurezza di Oracle applicando criteri quali la cifratura dei dati e la prevenzione dell'accesso pubblico alle reti per un intero compartimento. Una zona di sicurezza è associata a un compartimento con lo stesso nome e include i criteri della zona di sicurezza o un "recipe" che si applica al compartimento e ai relativi compartimenti secondari. Impossibile aggiungere o spostare un compartimento standard in un compartimento della zona di sicurezza.
- Gruppo di sicurezza di rete (NSG)
Il gruppo di sicurezza di rete (NSG) funge da firewall virtuale per le risorse cloud. Grazie al modello di sicurezza zero-trust di Oracle Cloud Infrastructure, tutto il traffico viene rifiutato e puoi controllare il traffico di rete all'interno di una VCN. Un gruppo NSG è composto da un set di regole di sicurezza in entrata e in uscita che si applicano solo a un set specificato di VNIC in una singola VCN.
- Load balancer
Il servizio Oracle Cloud Infrastructure Load Balancing offre la distribuzione automatica del traffico da un singolo punto di ingresso a più server nel backend.
Considerazioni
Durante la distribuzione di questa architettura di riferimento, prendere in considerazione queste opzioni.
- Origini dati
Stiamo assistendo alla possibilità di IoT soluzioni che monitorano e segnalano continuamente dati su un paziente, come la frequenza cardiaca, e applicazioni che consentono ai pazienti di registrare semplicemente eventi, come abitudini alimentari o eventi medici come attacchi e convulsioni. Queste informazioni possono fornire una grande quantità di informazioni aggiuntive, essere incorporate in cartelle cliniche e essere analizzate utilizzando le competenze mediche supportate da AI/ML. Questi feed di dati suggeriscono l'utilizzo di tecnologie a flusso di eventi come Kafka, che catturano questi eventi in modo rapido ed efficiente e possono memorizzare i dati in modo naturale serie temporale.
Quando si trovano modelli e anomalie che possono aiutare a diagnosticare, in generale, più dati su un paziente che può essere catturato e organizzato in (semi-)dati strutturati che possono essere facilmente consultati, meglio è. Quindi, raccogliere i dati dei pazienti, come la storia della famiglia e i dati detenuti da altre organizzazioni mediche, con il permesso del paziente, può rivelare insight senza necessariamente rivelare specifici fatti individuali.
- Prestazioni
La formazione sull'intelligenza artificiale richiede l'elaborazione di immagini ad alta risoluzione e dovrà avvenire periodicamente (ad esempio per accogliere formati di immagine più recenti o immagini di maggiore qualità). L'aggiornamento di questo modello deve essere eseguito in modo tale da non influire sui pazienti sottoposti a diagnosi o trattamento. A questo scopo, l'esecuzione degli aggiornamenti dei modelli in un ambiente isolato e la scalabilità dell'ambiente corrente in un punto in cui possono coesistere sia l'ambiente operativo che l'ambiente di formazione senza problemi di concorrenza nelle risorse o di allocazione delle risorse.
- Sicurezza
In un contesto clinico, la sicurezza sarà fondamentale in quanto tali requisiti sono altamente regolamentati. Non solo i dati possono essere considerati di valore, ma è fondamentale anche la capacità di interrompere l'accesso e l'uso dei dati attraverso azioni accidentali o deliberate. Pertanto, i servizi coinvolti in tali dati devono essere sicuri.
- Disponibilità
La migrazione dei servizi in ambienti cloud rimuove un certo numero di problemi a livello di resilienza e disponibilità dal centro medico. Il provider cloud non è in grado di garantire la disponibilità del networking. Di conseguenza, le opzioni di resilienza e fallback della rete devono essere di proprietà attiva per garantire una disponibilità continua in caso di guasto "ultimo miglio". Inoltre, è preferibile che un'organizzazione con dipendenze critiche in questi scenari di guasto eserciti periodicamente il cut-over e il cut-back. Quindi, in caso di necessità, il processo viene eseguito come se fosse un altro processo regolare.
- Costo
Eventuali casi d'uso particolari potrebbero non richiedere tutti i servizi localizzati nel lago. Questi riflettono le tecnologie di commento associate all'applicazione di un lago. Ad esempio, se Oracle Big Data Cloud Service non è necessario, non deve essere distribuito. Lo storage degli oggetti può essere usato in modo intelligente posizionando le immagini non necessarie in una configurazione di storage a prestazioni inferiori; quando si verifica un evento relativo al paziente, il contenuto viene spostato in una configurazione di storage a prestazioni più elevate. Questo è, per molti aspetti, simile ai medesimi principi che un database si applica ai suoi dati di storage-moving in e out of cache, storage rapido di accesso (e.g, NVMe) e dischi di rotazione più lenti.