Analizza e visualizza i dati sanitari e applica l'intelligenza artificiale su OCI per risolvere le sfide del mondo reale
Oracle Cloud Infrastructure (OCI) e i servizi offrono molte opzioni per creare, distribuire e monitorare soluzioni analitiche scalabili e ad alte prestazioni tramite Electronic Health Record e dati di monitoraggio dei pazienti e forniscono un facile accesso a informazioni utili utilizzando una user experience trasparente tramite un'interfaccia Web semplice e intuitiva.
I dati raccolti dai dispositivi medici possono essere analizzati per ottimizzare i parametri di allarme e l'intelligenza artificiale può aiutare a sviluppare applicazioni intelligenti per migliorare l'efficienza clinica e ridurre i rischi.
Per questa architettura di riferimento, stiamo presentando un caso d'uso del cliente che utilizzava Snowflake e Snowpark per archiviare e analizzare i dati. Ciò ha causato sfide legate alla crescita dei costi e alla riduzione del vantaggio complessivo in termini di rapporto prezzo/prestazioni. Poiché sempre più ospedali e operatori sanitari si stavano iscrivendo al servizio, i dati stavano crescendo a un ritmo esponenziale e il costo dell'analisi di centinaia di terabyte di dati stava crescendo in modo esponenziale. La soluzione mancava di flessibilità per fornire soluzioni analitiche adatte agli scopi.
La gestione inefficiente dei dati e dei modelli ha ostacolato la capacità di inserire rapidamente i clienti e commercializzare i prodotti. La sicurezza del sistema era un processo manuale ripensato e spesso richiesto per implementare controlli di sicurezza adeguati in ogni livello della distribuzione. La mancanza di supporto per strumenti e librerie open source ha creato blocchi dei fornitori e ha impedito la portabilità.
Architettura
OCI supporta strumenti open source e il suo framework semplifica l'implementazione dell'architettura utilizzando risorse qualificate interne, garantendo al contempo la portabilità.
In questa architettura di riferimento, discuteremo di una progettazione di soluzioni che può essere implementata per casi d'uso, tra cui il miglioramento dell'assistenza ai pazienti e la prevenzione delle malattie, il processo decisionale basato su prove in pre-autorizzazione e il rilevamento, l'analisi e l'ottimizzazione dei parametri di allarme medico per ospedali e operatori sanitari.
Analisi dei dati e Machine Learning:
Per il cliente del settore sanitario, Oracle Autonomous Data Warehouse era una soluzione ideale poiché il cliente utilizzava i dati in streaming da sensori in cui la scalabilità di Oracle Autonomous Data Warehouse e le funzionalità di Lakehouse erano ottimali. La facile integrazione di Oracle Autonomous Data Warehouse con Oracle Machine Learning ha aiutato il cliente a preparare e comprendere meglio i propri dati nella fase di pre-elaborazione. Oracle Machine Learning supporta anche l'esportazione dei dati da e verso i notebook Jupyter, consentendo ai data scientist di combinare il machine learning nel database di Oracle con altre popolari librerie di data science. Oracle Machine Learning offre molti vantaggi, tra cui: facilità di installazione, utilizzo dell'in-database computing, riduzione del sovraccarico di gestione, computazione di database potente e scalabile multiuso per SQL, analytics basati su Python su larga scala.
Utilizzando Oracle Machine Learning, il cliente è stato in grado di installare e testare una vasta gamma di librerie basate su Python (inclusi Panda, NumPy), eseguire l'applicazione Julia esistente e gli analytics su larga scala. Oracle Machine Learning offre anche la distribuzione automatica dei modelli, in cui i modelli sono immediatamente disponibili per il punteggio all'interno delle applicazioni o dei dashboard di analisi dopo la formazione e la semplificazione del processo di implementazione. Il cliente è stato in grado di eseguire il porting degli stessi UDF Python e UDTF e delle stesse query SQL da Snowflake a Oracle Autonomous Data Warehouse senza dover rifatturare il codice. Per il modello ML, il cliente ha utilizzato la funzionalità AutoML, semplificando notevolmente il processo di addestramento del modello, consentendo agli utenti con un'esperienza di apprendimento automatico minima di ottenere la precisione desiderata e generare insight dai dati dei dispositivi medici.
Applicazione AI che utilizza la computazione GPU su OCI:
OCI offre prestazioni ottimali per le applicazioni AI con un'infrastruttura cloud all'avanguardia basata su GPU Nvidia e AMD. OCI aiuta ad accelerare la tua soluzione AI con l'addestramento dei modelli, l'inferenza e l'analisi AI. OCI collabora con Nvidia per portare Nvidia Nemo per lo sviluppo end-to-end dell'AI generativa e utilizza Nvidia Inference Microservices (NIM) per accelerare l'inferenza AI dei modelli AI. Per eseguire applicazioni AI sull'infrastruttura AI OCI, OCI distribuisce istanze di computazione GPU con cluster HPC Slurm o Oracle Cloud Infrastructure Kubernetes Engine (OCI Kubernetes Engine o OKE) utilizzando i nostri stack di terraform personalizzati e scalabili, incluse varie opzioni di storage.
La diagnosi medica basata sull'intelligenza artificiale e la gestione dei dati clinici sono costituite da NLP/LLM per i dati EHR, imaging medico, dati clinici e risultati di laboratorio. I framework applicativi Nvidia, come BioNemo, MONAI, triton inference server, insieme a Cohere forniscono una soluzione che accelera l'adozione dell'AI.
Notebook e integrazione di Data Science:
Questa architettura di riferimento utilizza il servizio Oracle Cloud Infrastructure Data Science, una piattaforma completamente gestita che consente ai team di data scientist di creare, addestrare, distribuire e gestire modelli di Machine Learning (ML) utilizzando Python con framework integrati come Pytorch, TensorFlow e altri framework open source di tua scelta. Questo servizio può essere utilizzato per creare un ambiente di sviluppo open source basato su Jupyter con integrazione integrata con GitHub. La computazione GPU Nvidia A10 può essere utilizzata per l'addestramento dei modelli LLM, la creazione della pipeline MLOps integrata con mlfow e, infine, la distribuzione dal notebook in un endpoint protetto da inferenza scalabile e a bassa latenza e il monitoraggio delle prestazioni del modello. Il cliente può scegliere tra una vasta gamma di GPU Nvidia supportate su metalli bare o istanze virtuali per addestrare e distribuire modelli AI su larga scala.
Backup e Disaster Recovery:
Per il settore sanitario, la protezione e la disponibilità dei dati dei clienti sono estremamente importanti. A causa di varie normative, i dati devono essere protetti e resi disponibili su richiesta. Oracle Autonomous Database offre opzioni di backup e ripristino automatizzati e può creare un database di replica utilizzando Oracle Cloud Guard. La replica del database può anche funzionare come copia in standby di sola lettura del database per ridurre il carico sul database primario, migliorando quindi le prestazioni del database e il bilanciamento del carico.
Gestione della sicurezza e degli accessi:
Questa architettura implementa le best practice di sicurezza OCI Zero Trust utilizzando le funzioni di sicurezza di rete, dati e applicazioni in tutti i livelli dell'architettura. Per la sicurezza della rete, la computazione viene implementata nella rete privata utilizzando la rete VCN (Virtual Cloud Network) e il filtro del traffico viene applicato utilizzando la lista di sicurezza (SL) e il gruppo di sicurezza di rete (NSG). I dati vengono sempre cifrati in archivio (AES256) e in transito (TLS 2.0) con una facile gestione dei certificati fornita dal cliente.
Oracle Data Safe, incluso in Oracle Autonomous Database, offre un centro di controllo unificato che aiuta a gestire i requisiti quotidiani di sicurezza e conformità dei database Oracle. Oracle Data Safe fornisce funzioni avanzate di sicurezza dei dati richieste dal settore sanitario, ad esempio mascheramento dei dati, offuscamento dei dati, audit delle attività e gestione del firewall SQL.
Oracle Cloud Infrastructure Identity and Access Management (OCI Identity and Access Management) implementa il principio del privilegio minimo e dell'autenticazione OAuth 2.0 dell'accesso utente finale utilizzando l'identità. Fornisce in modo sicuro funzionalità avanzate come l'autenticazione a più fattori e l'autenticazione basata su token (JWT).
Il seguente diagramma illustra questa architettura di riferimento.
oci-ai-healthcare_arch-oracle.zip
L'architettura presenta i seguenti componenti:
- Gateway API
Oracle Cloud Infrastructure API Gateway ti consente di pubblicare le API con endpoint privati accessibili dall'interno della tua rete e che, se necessario, puoi esporre alla rete Internet pubblica. Gli endpoint supportano la convalida delle API, la trasformazione delle richieste e delle risposte, il CORS, l'autenticazione e l'autorizzazione e la limitazione delle richieste.
- Memorizzazione degli oggetti
Lo storage degli oggetti Oracle Cloud Infrastructure fornisce un accesso rapido a grandi quantità di dati strutturati e non strutturati di qualsiasi tipo di contenuto, inclusi backup del database, dati di analisi e contenuti avanzati come immagini e video. Puoi memorizzare e recuperare i dati direttamente da Internet o all'interno della piattaforma cloud in tutta sicurezza. Puoi ridimensionare lo storage senza alcun deterioramento delle prestazioni o dell'affidabilità del servizio. Utilizza lo storage standard per lo storage "caldo" a cui è necessario accedere rapidamente, immediatamente e frequentemente. Utilizza lo storage di archivio per lo storage "freddo" che conservi per lunghi periodi di tempo e a cui accedi raramente o raramente.
- Web Application Firewall (WAF)
Oracle Cloud Infrastructure Web Application Firewall (WAF) è un servizio di applicazione edge, basato su regionale e conforme al settore delle carte di pagamento (PCI) collegato a un punto di applicazione, come un load balancer o un nome di dominio dell'applicazione Web. WAF protegge le applicazioni dal traffico Internet dannoso e indesiderato. WAF è in grado di proteggere qualsiasi endpoint che si interfaccia con Internet, offrendo un'applicazione coerente delle regole in tutte le applicazioni di un cliente.
- Gateway di instradamento dinamico (DRG)
Il gateway DRG è un router virtuale che fornisce un percorso per il traffico di rete privato tra le reti VCN nella stessa area, tra una rete VCN e una rete esterna all'area, ad esempio una rete VCN in un'altra area Oracle Cloud Infrastructure, una rete on premise o una rete in un altro provider cloud.
- Lista di sicurezza
Per ogni subnet, puoi creare regole di sicurezza che specificano l'origine, la destinazione e il tipo di traffico che devono essere consentiti all'interno e all'esterno della subnet.
Suggerimenti
- OCI Data Integration è un servizio multi-tenant completamente gestito che consente a tecnici e sviluppatori di dati di eseguire attività di spostamento e caricamento dei dati. La soluzione può utilizzare il servizio di caricamento dei dati di integrazione dei dati per includere e caricare i dati in un'area intermedia nello storage degli oggetti per la conservazione dei dati a basso costo, duratura e altamente scalabile a lungo termine. I trasferimenti di dati in blocco possono essere effettuati utilizzando i servizi Web FTP protetti, HL7v2 su MLP e Fast Healthcare Interoperability Resources (FHIR). I dati posizionati nell'area intermedia possono essere ulteriormente elaborati, preparati e curati per essere inseriti in un database Oracle Autonomous Data Warehouse per l'utilizzo da parte di applicazioni e utenti tramite l'interfaccia Web e query ad hoc.
Basato su processi Spark ETL o ELT, è possibile includere un grande volume di dati da una vasta gamma di asset di dati, puliti, trasformati, rimodellati e caricati in modo efficiente in Oracle Autonomous Data Warehouse. Il database Oracle Autonomous Data Warehouse è un database completamente gestito e automatizzato leader del settore per carichi di lavoro analitici, tra cui data mart, data warehouse e data lake. Si tratta di un'ottimizzazione automatica e fornisce provisioning, applicazione di patch e manutenzione automatizzati, ottimizzando così le prestazioni.
Ulteriori dati possono essere analizzati utilizzando il servizio Oracle Cloud Infrastructure Data Science. I modelli AI possono essere creati, formati e distribuiti utilizzando la computazione GPU a basso costo ad alte prestazioni. Gli hook Web in uscita personalizzati vengono creati per eseguire il push degli asset di dati agli utenti finali utilizzando un endpoint protetto e un servizio di identità.
- Utilizzare una rete cloud virtuale privata per distribuire i servizi e utilizzare una lista di sicurezza e gruppi NSG per limitare l'accesso non intenzionale.
- Utilizzare OCI Identity and Access Management per applicare il principal dei controlli di accesso basati su privilegi e ruoli minimi.
- OCI API Gateway consente di pubblicare le API con endpoint privati accessibili dall'interno della rete e che, se necessario, è possibile esporre alla rete Internet pubblica. Gli endpoint supportano la convalida delle API, la trasformazione delle richieste e delle risposte, il CORS, l'autenticazione e l'autorizzazione e la limitazione delle richieste.
- OCI garantisce la compliance normativa ai principali standard, tra cui HIPAA e FedRAMP, fornendo una base sicura per proteggere i dati sensibili.
- Utilizza la tecnologia open source per evitare accordi esclusivi con i fornitori su OCI, come LangChain, API REST, Functions e crea un livello di astrazione in più per accelerare l'innovazione e la trasformazione.