Applicazione di un Data Lakehouse
Un data lakehouse può accelerare e migliorare il processo diagnostico, migliorando le possibilità di recupero di un paziente.
La differenza tra PACS e VNA è la capacità di gestire una maggiore varietà di formati di immagine oltre DICOM. Tuttavia, uno può presentare delle sfide. Le immagini richiedono una grande capacità di storage, quindi il sistema di storage spesso contiene le immagini del caso corrente. È probabile che le immagini meno recenti vengano spostate a un costo inferiore, possibilmente offline, rendendo l'accesso alla cronologia delle immagini di un paziente uno sforzo impegnativo e dispendioso in termini di tempo. È probabile che le soluzioni RIS e PACS/VNA risiedano on-premise presso il centro medico, pertanto potrebbe essere necessario accedere alla propria infrastruttura IT. Ciò significa anche che il centro medico deve impiegare specialisti di storage per garantire la sicurezza dei dati. Una soluzione VNA è più propensa a sostenere la partecipazione allo scambio di informazioni sulla salute (HIE), che consente ai fornitori di servizi sanitari di collaborare nella condivisione dei dati, nella creazione di reti sicure e nell'utilizzo di Fast Healthcare Interoperability Resources (FHIR) e degli standard correlati. Può trattarsi di una soluzione regolamentata in alcuni paesi, come la rete sanitaria e sociale (HSCN) nel Regno Unito. I regolamenti potrebbero comportare costi aggiuntivi per dimostrare la conformità.
Un data lakehouse può accelerare in modo significativo il processo paziente-viaggio. L'adozione di una soluzione di storage fornita dal cloud consente di accedere rapidamente a volumi di storage estremamente elevati (anche archiviati) a una scala economica che un centro medico difficilmente può abbinare a una soluzione on premise. Una soluzione cloud riduce o elimina anche la necessità per i centri medici di mantenere le competenze specialistiche necessarie per gestire i problemi di ridondanza e recupero per mantenere operativa la soluzione.
Un accesso più rapido alle immagini significa che i medici hanno più tempo per valutare le immagini, riducendo il tempo che un paziente trascorre in attesa di diagnosi e trattamento. Ciò significa anche che è possibile utilizzare grandi volumi di immagini per addestrare le funzionalità di intelligenza artificiale (AI) e apprendimento automatico (ML) (fornite da Oracle Cloud Infrastructure Vision e Oracle Cloud Infrastructure Data Science) su rendimenti sani e dannosi. Questo non solo consente all'AI/ML di indagare sul problema primario (i sintomi attuali del paziente), ma potrebbe anche rilevare altri problemi per i quali il paziente deve ancora sviluppare sintomi. Se l'AI/ML ha rilevato o meno problemi durante la valutazione dei raggi X, il messaggio finale dovrebbe sempre provenire da un essere umano. L'AI per l'elaborazione delle immagini può aiutarti in diversi modi in base alla sua valutazione:
- L'AI può dare priorità ai raggi X che suggeriscono problemi significativi dove un intervento rapido può fare la differenza alla prognosi del paziente. Ciò potrebbe portare al paziente essere ammesso immediatamente piuttosto che essere inviato a casa.
- L'AI può fungere da secondo paio di occhi evidenziando anomalie al medico valutatore. Questo può aiutare a identificare le sottigliezze per i problemi secondari che un essere umano potrebbe perdere. È possibile creare un'esperienza digitale utilizzando Oracle Functions (o Oracle Container Engine for Kubernetes) oppure un dashboard può essere visualizzato con Oracle Visual Builder, Oracle JET o servizio APEX.
- Il data lakehouse avrà una gamma diversificata di dati correlati che possono essere combinati con l'analisi medica per ricavare ulteriori approfondimenti dai dati del paziente. Questo può aiutare a scoprire tendenze o insight imprevisti di cui il medico potrebbe non essere a conoscenza.
Ad esempio, le note contenute nelle cartelle cliniche del paziente possono aggiungere variabili come se il paziente sia un fumatore, fosse un fumatore o provenisse da una famiglia che include fumatori; o i dati di contatto del paziente combinati con dati geografici possono aggiungere variabili associate a condizioni di vita che potrebbero avere fattori complicanti (e.g., presenza di umidità o amianto).
Senza questa assistenza, la valutazione di questi fattori richiederebbe al veterinario di pensare anche come un assistente sociale, un realtor, e aumenterebbe il tempo di rivedere la storia medica di un paziente in dettaglio oltre a concentrarsi sulla valutazione delle immagini.
Per ottenere questa combinazione di dati, memorizzeremmo i dati semistrutturati o totalmente strutturati in un database come il servizio Autonomous Database, utilizzando Integrazione dei dati per collegare tra loro i data set. I dati non strutturati e semistrutturati, ad esempio le immagini in Oracle Cloud Infrastructure Object Storage, verrebbero integrati aggiungendo collegamenti ai dati strutturati, quali i metadati associati alle immagini. Il processo di collegamento delle immagini ai dati ricercabili sarebbe supportato mediante il servizio Oracle Cloud Infrastructure Data Labeling (etichettatura dei dati). È possibile utilizzare l'etichettatura dei dati anche per assegnare etichette ai dati strutturati in modo che i record che rappresentano valori anomali possano essere facilmente contrassegnati e quindi inclusi o esclusi esplicitamente dai processi AI/ML.
- I risultati di AI/ML sarebbero stati segnalati come preliminari (o sottoposti a un controllo medico secondario) al paziente e al loro fornitore di servizi sanitari, quindi potrebbero essere esaminate altre cause dei sintomi. Il risultato netto di questo è che il paziente è un altro passo più vicino alla diagnosi. Questa comunicazione può essere ottenuta estraendo le informazioni di contatto dai record del paziente in Autonomous Database e utilizzando servizi come SMS, e-mail o notifica allo staff clinico tramite il dashboard o i frontend digitali menzionati in precedenza.
Poiché i dati del paziente non sono legati a vincoli IT fisici di un centro medico, possono essere riferiti da esperti medici esterni in altre sedi. Questo può accadere in modo rapido ed efficiente perché l'infrastruttura per lavorare con uno o più HIE sarà probabilmente in atto, aumentando così le capacità oltre le capacità di un unico fornitore di assistenza. Questo tipo di automazione può essere ottenuto tramite Oracle Integration Cloud Service (OIC) e un gateway API (in una posizione in uscita, per consentire il controllo e l'audit dei dati in uscita. Se le API esterne vengono utilizzate a pagamento per chiamata, la gestione in uscita consente il controllo di tali servizi e l'evasione degli addebiti eccedenza). La condivisione di dati ingombranti verrebbe gestita tramite FTP (fornita tramite OIC), ma la comunicazione di dati non API verrebbe firmata attraverso le chiamate API in prima istanza.
Figura - Scenario di esperienza del paziente senza data lakehouse su OCI
Figura - Scenario di esperienza del paziente con data lakehouse su OCI
Informazioni sul collegamento dei dati socioeconomici ai processi immagine clinica
I data lakehouse, che possono essere utilizzati per ingerire grandi volumi di dati, possono essere collegati ad altre fonti di dati per facilitare l'analisi efficiente per i medici che valutano i loro pazienti.
Abbiamo evidenziato come l'utilizzo di un data lakehouse ci permette di includere grandi volumi di dati e mescolare diverse fonti di dati per aiutare a fornire un trattamento clinico adeguato. La capacità di collegare dati non medici con i pazienti è fondamentale. Considerate la pandemia di COVID-19 o i focolai di Ebola in Africa occidentale, dove tali dati collegati hanno contribuito a identificare e limitare la diffusione di questi virus. I trattamenti ottimali per coloro che sono già infetti che migliorano le loro possibilità di recupero, la velocità di recupero e i problemi di salute post-infezione (condizioni dalla depressione e dall'ansia, all'esercizio di intolleranza e affaticamento) possono essere trovati analizzando contro altri pazienti con infezioni e malattie simili e i loro risultati.
Per ottenere questo tipo di collegamento, è necessario comprendere i dati disponibili, a cui si fa riferimento Oracle Cloud Infrastructure Data Catalog, non solo nel tracciamento dei dati memorizzati all'interno della casetta del lago, ma memorizzati in altre origini dati a cui è possibile accedere e utilizzare fonti come le API. Ciò può quindi essere utilizzato per gestire il contenuto della data lakehouse e per informare l'analisi dei dati eseguita con gli strumenti di Oracle Cloud Infrastructure Data Science per stabilire le relazioni tra i dati.
Le applicazioni più comuni di dati di miscelazione includono l'identificazione e l'isolamento di focolai come la malattia del legionario, che ha un tasso di mortalità del 10% e stimato 20.000 casi all'anno solo negli Stati Uniti. Questo tipo di identificazione comporta l'estrazione dei record EMR/EHR pertinenti nell'Autonomous Database e la digitalizzazione (Oracle Cloud Infrastructure Vision) delle note dei pazienti sui loro movimenti e la combinazione di tali record con i dati geografici mediante il set di strumenti Data Science e le funzionalità di visualizzazione di uno qualsiasi di questi prodotti: Oracle Analytics Cloud, Oracle Visual Builder, Oracle JET o APEX Service. La scelta degli strumenti dipende dall'esperienza utente e dai dati desiderati da presentare.
Organizzazioni come il Center for Disease Control (CDC) e l'Organizzazione Mondiale della Sanità (OMS) forniscono API connesse a set di dati sui fattori che contribuiscono alla salute. Ad esempio, i dati di qualità dell'aria possono essere recuperati da servizi API come il World Air Quality Index. Questi dati sono fondamentali per le persone con disabilità polmonari come la polmonite, in quanto la qualità dell'aria o i livelli di tossicità sono un fattore aggravante significativo e possono essere difficili da valutare a causa di una significativa varianza anche a brevi distanze tra ciascun sensore. I dati possono essere valutati utilizzando una combinazione di Oracle Integration Cloud Service, gateway API, Oracle Functions (o Oracle Container Engine for Kubernetes), Autonomous Database (contenuto strutturato) e Oracle Cloud Infrastructure Object Storage (contenuto non strutturato). I processi di preparazione o pulizia dei dati possono utilizzare Oracle Cloud Infrastructure Data Science, Oracle Cloud Infrastructure Data Flow o Oracle Cloud Infrastructure Data Integration per regolare il flusso di dati all'interno o all'esterno della piattaforma. In questo modo, Streams offrirebbe una funzionalità di integrazione API Kafka in quanto ci consente di gestire i dati sotto forma di serie di eventi. Ciò significa che se un servizio esterno fornisce dati in raffiche di dati altamente concentrate, allora i dati possono essere messi in scena fino a quando non siamo pronti a caricarli nel data lakehouse.
Per raggiungere questo obiettivo, dobbiamo:
- Acquisisci e cleanup dei dati pertinenti per evitare "garbage in, garbage out".
- Converti i dati non strutturati in dati semistrutturati per semplificare le ricerche e gli interrogativi.
Utilizzando standard come HL7, FHIR, SNOMED (terminologia clinica) e le pratiche dell'HIE per la rappresentazione dei dati consentono una maggiore interoperabilità con DICOM per l'imaging. Questi standard di dominio sono basati su tecnologie comuni del settore, ad esempio XML, JSON, REST e così via. Di conseguenza, i prodotti Oracle possono gestire i dati immediatamente integrati, con soluzioni specifiche per i domini pronte all'uso offerte da queste tecnologie.