Distribuisci le GPU NVIDIA per la modellazione molecolare e la ricerca automatica dei farmaci in Oracle Cloud

La piattaforma Envoy di GridMarkets viene eseguita su Oracle Cloud nei data center di tutto il mondo per ridurre drasticamente il tempo necessario per simulare la reazione di una molecola di farmaci a diverse proteine.

Con l'avvento della progettazione di farmaci assistiti da computer (CADD) come metodo di modellazione di composti medicinali più di quattro decenni fa, i ricercatori di droga sono stati in grado di controllare un numero maggiore di molecole e identificare i candidati più promettenti di droga più veloce e più economico di quanto avrebbero potuto in un laboratorio. Combinando progressi nelle tecniche di apprendimento automatico, potenza di calcolo, parallelizzazione e piattaforme di simulazione cloud-native come GridMarkets, i ricercatori del farmaco sono stati in grado di ridurre il tempo necessario per simulare la reazione di una molecola di droga a diverse proteine da diverse settimane o mesi a solo poche ore.

Utilizzando l'applicazione proprietaria Envoy GridMarkets, che si integra nelle più diffuse piattaforme di modellazione molecolare come AMBER, GROMACS, NAMD e MOE, i ricercatori di droga possono inviare migliaia di ligami, tutti funzionanti in parallelo entro un giorno, a seconda del numero di macchine e della loro potenza di elaborazione.

Fondata nel 2011 dagli imprenditori seriali Mark Ross e Hakim Karim, GridMarkets esegue la propria piattaforma di simulazione molecolare su server ad alte prestazioni posizionati su Oracle Cloud nei data center di tutto il mondo. Con Oracle Cloud Infrastructure, non è necessario mettere in coda le richieste o pianificare le simulazioni. Invece, i clienti di GridMarkets possono accedere a un numero (quasi) illimitato di macchine ogni volta che ne hanno bisogno, senza dover pagare la capacità inutilizzata quando non lo fanno.

In pochi secondi dopo che i clienti hanno selezionato il numero di computer su cui eseguire le simulazioni, GridMarkets configura il software e le risorse di calcolo, cifra i dati e sottomette la richiesta. Al termine del job, i risultati vengono restituiti automaticamente e i computer vengono chiusi, quindi non ci sono costi permanenti. Poiché il flusso di lavoro di GridMarkets non collega le risorse locali, i ricercatori di droga non devono sedersi e aspettare dietro il firewall di un'azienda per i loro risultati. Possono invece eseguire le loro simulazioni da un laptop ovunque nel mondo. Utilizzando metodi zero trust per una sicurezza approfondita della difesa, GridMarkets ha protetto la propria piattaforma su Oracle Cloud per proteggere il proprio ambiente, nonché la proprietà intellettuale dei propri clienti.

Architettura

GridMarkets è una piattaforma multicloud, accessibile tramite un'applicazione proprietaria denominata Envoy dal desktop di un utente finale.

Il client Envoy utilizza un'API per richiedere l'accesso all'area head-end ospitata su Oracle Cloud Infrastructure (OCI). Oracle Cloud Infrastructure Load Balancing offre alta disponibilità (HA) per il front-end, l'interfaccia utente e i microservizi che tengono traccia di utenti, job, task e fatturazione. Questi microservizi vengono gestiti in hosting nei container Docker. Oracle MySQL Database Service fornisce lo storage per i dati raccolti dal front-end insieme a redis e RabbitMQ per i dati transazionali effimeri da eseguire il servizio.

Dopo essere stati autenticati e aver stabilito una connessione con l'area head-end, gli utenti possono richiedere il numero di computer e CPU o GPU necessari per eseguire le proprie simulazioni. L'area head-end determina dove inviare la richiesta. La richiesta può essere inviata a qualsiasi provider di servizi cloud o a qualsiasi area geografica all'interno di OCI, a seconda della disponibilità dei tipi di computer richiesti dai client GridMarkets.

Al termine della richiesta, Envoy carica i dati da modellare, simulare o visualizzare nel blocco di creazione di Oracle Cloud Infrastructure Object Storage. I dati vengono quindi estratti dallo storage degli oggetti e memorizzati in Oracle Cloud Infrastructure Block Volumes collegato a un filer NAS (graffio e blocco di staging) per velocizzare l'accesso allo storage durante l'esecuzione dell'applicazione. In base alla forma di computazione richiesta, il server di gestione avvia l'applicazione per avviare l'elaborazione dei dati utilizzando il cluster HPC nell'area OCI richiesta (blocco di creazione CPU o GPU). Al termine della modellazione o delle simulazioni, il risultato viene ripristinato nello storage degli oggetti e viene scaricato automaticamente dall'utente tramite il client Envoy.

In background, il management server pianifica i processi, alloca le risorse, esegue la gestione di code e file e riporta le informazioni su disponibilità, utilizzo e fatturazione all'area head-end.

Il diagramma riportato di seguito illustra questa architettura di riferimento.



gridmarket-oci-arch-oracle.zip

Nella roadmap per GridMarkets si utilizza la GPU NVIDIA A10 Tensor Core sulle macchine virtuali quando tale opzione è disponibile. Gridmer sta anche esplorando le opzioni per l'integrazione dell'intelligenza artificiale (AI) e del machine learning (ML) per la gestione delle risorse.

L'architettura è dotata dei componenti elencati di seguito.

  • Tenancy

    Una tenancy è una partizione sicura e isolata che Oracle imposta all'interno di Oracle Cloud quando ti iscrivi a Oracle Cloud Infrastructure. Puoi creare, organizzare e amministrare le tue risorse in Oracle Cloud all'interno della tua tenancy. Una tenancy è sinonimo di azienda o organizzazione. In genere, un'azienda avrà una singola tenancy e ne rifletterà la struttura organizzativa all'interno di tale tenancy. Una singola tenancy in genere è associata a una singola sottoscrizione e una singola sottoscrizione in genere ha una sola tenancy.

  • Area

    Un'area Oracle Cloud Infrastructure è un'area geografica localizzata che contiene uno o più data center, definiti domini di disponibilità. Le regioni sono indipendenti da altre regioni e grandi distanze possono separarle (in tutti i paesi o anche in continenti).

  • Dominio di disponibilità

    I domini di disponibilità sono data center standalone indipendenti all'interno di un'area geografica. Le risorse fisiche in ciascun dominio di disponibilità sono isolate dalle risorse presenti negli altri domini di disponibilità, che offrono tolleranza agli errori. I domini di disponibilità non condividono l'infrastruttura, ad esempio l'alimentazione, il raffreddamento o la rete interna del dominio di disponibilità. È pertanto improbabile che l'eventuale guasto di un dominio di disponibilità influenzi gli altri domini di disponibilità nell'area.

  • Rete cloud virtuale (VCN) e subnet

    Una VCN è una rete personalizzabile e definita dal software configurata in un'area Oracle Cloud Infrastructure. Analogamente alle reti di data center tradizionali, i VCN offrono il controllo completo sull'ambiente di rete. Una VCN può avere più blocchi CIDR non sovrapposti che puoi modificare dopo aver creato la VCN. Puoi segmentare una VCN nelle subnet che possono essere definite nell'area o in un dominio di disponibilità. Ogni subnet è composta da un intervallo contiguo di indirizzi che non si sovrappongono alle altre subnet nella VCN. Puoi modificare le dimensioni di una subnet dopo la creazione. Una subnet può essere pubblica o privata.

  • Lista di sicurezza

    Per ogni subnet, puoi creare regole di sicurezza che specifichino l'origine, la destinazione e il tipo di traffico che deve essere consentito all'interno e all'esterno della subnet.

  • Tabella di instradamento

    Le tabelle di instradamento virtuale contengono regole per instradare il traffico dalle subnet alle destinazioni esterne a una VCN, in genere tramite gateway.

  • Gateway Internet

    Il gateway Internet consente il traffico tra le subnet pubbliche in una rete VCN e la rete Internet pubblica.

  • Gateway del servizio

    Il gateway di servizi fornisce l'accesso da una VCN ad altri servizi, come Oracle Cloud Infrastructure Object Storage. Il traffico dalla VCN al servizio Oracle viaggia sulla struttura di rete Oracle e non attraversa mai Internet.

  • Load balancer

    Il servizio Oracle Cloud Infrastructure Load Balancing offre la distribuzione automatica del traffico da un unico punto di accesso a più server nel back-end.

  • Calcolo

    Il servizio Oracle Cloud Infrastructure Compute consente di eseguire il provisioning e la gestione degli host di computazione nel cloud. Puoi avviare le istanze di computazione con forme che soddisfano i requisiti delle risorse per CPU, memoria, larghezza di banda di rete e storage. Dopo aver creato un'istanza di computazione, puoi accedervi in tutta sicurezza, riavviarla, collegare e scollegare i volumi e terminarla quando non ne hai più bisogno.

  • Bare Metal

    I server Bare Metal di Oracle offrono isolamento, visibilità e controllo utilizzando istanze di computazione dedicate. I server supportano applicazioni che richiedono conteggi di memorie centrali elevati, grandi quantità di memoria ed elevata larghezza di banda. Possono eseguire lo scale-up fino a 160 memorie centrali (la più grande del settore), 2 TB di RAM e fino a 1 PB di storage a blocchi. I clienti possono creare ambienti cloud sui server Bare Metal di Oracle con notevoli miglioramenti a livello di prestazioni su altri cloud pubblici e data center on premise.

  • Memoria oggetti

    Lo storage degli oggetti garantisce un accesso rapido a grandi quantità di dati strutturati e non strutturati di qualsiasi tipo di contenuto, inclusi backup del database, dati analitici e contenuti avanzati, ad esempio immagini e video. Puoi memorizzare i dati in tutta sicurezza e poi recuperarli direttamente da Internet o dall'interno della piattaforma cloud. Puoi ridimensionare lo storage in modo trasparente senza alcun peggioramento a livello di prestazioni o affidabilità dei servizi. Utilizza lo storage standard per lo storage "hot" a cui devi accedere in modo rapido, immediato e frequente. Utilizzare lo storage di archivio per lo storage "freddo" che si mantiene per lunghi periodi di tempo e raramente può accedere.

  • Volume a blocchi

    Grazie ai volumi di storage a blocchi, puoi creare, collegare, connettere e spostare volumi di storage, nonché modificare le prestazioni dei volumi per soddisfare i tuoi requisiti di storage, prestazioni e applicazioni. Dopo aver collegato e connesso un volume a un'istanza, puoi utilizzare il volume con una normale unità disco fisso. Inoltre, puoi disconnettere un volume e collegarlo a un'altra istanza senza perdere i dati.

  • Oracle MySQL Database Service

    Oracle MySQL Database Service è un servizio di database Oracle Cloud Infrastructure (OCI) completamente gestito che consente agli sviluppatori di sviluppare e distribuire rapidamente applicazioni cloud native sicure. Ottimizzato ed esclusivamente disponibile in OCI, Oracle MySQL Database Service è costruito, gestito e supportato al 100% dai team di progettazione OCI e MySQL.

    Oracle MySQL Database Service dispone di un motore di analitica integrato e ad alte prestazioni (HeatWave) per eseguire analisi sofisticate in tempo reale direttamente su un database MySQL operativo.

  • Monitoraggio

    Il servizio Oracle Cloud Infrastructure Monitoring monitora attivamente e passivamente le tue risorse cloud utilizzando le metriche per monitorare le risorse e gli allarmi per avvisarti quando queste metriche soddisfano trigger specificati dagli allarmi.

  • Log
    Logging è un servizio altamente scalabile e completamente gestito che fornisce l'accesso ai seguenti tipi di log delle risorse nel cloud:
    • Log di audit: log correlati agli eventi emessi dal servizio di audit.
    • Log dei servizi: log emessi da singoli servizi quali gateway API, eventi, funzioni, bilanciamento del carico, storage degli oggetti e log di flusso VCN.
    • Log personalizzati: log che contengono informazioni di diagnostica da applicazioni personalizzate, altri provider cloud o da un ambiente on premise.
  • Eventi

    I servizi Oracle Cloud Infrastructure emettono eventi, ovvero messaggi strutturati che descrivono i cambiamenti nelle risorse. Gli eventi vengono emessi per le operazioni di creazione, lettura, aggiornamento o eliminazione (CRUD), le modifiche allo stato del ciclo di vita delle risorse e gli eventi di sistema che influiscono sulle risorse cloud.

  • Consegna mediante posta elettronica

    Oracle Cloud Infrastructure Email Delivery è un servizio di consegna tramite e-mail altamente scalabile, conveniente e affidabile per inviare e-mail di alto volume generate dall'applicazione per comunicazioni di marketing mission critical, notifiche e transazionali come ricevute di ritorno, avvisi di rilevamento frodi, verifica delle identità a più fattori e reimpostazioni delle password.

Funzionalità integrate e distribuite

Vuoi mostrare cosa hai costruito su Oracle Cloud Infrastructure? Vuoi condividere le tue lezioni apprese, le migliori prassi e le architetture di riferimento con la nostra comunità globale di architetti cloud? Ti aiutiamo a iniziare.

  1. Scarica il modello (PPTX)

    Illustrare la propria architettura di riferimento trascinando e rilasciando le icone nel wireframe di esempio.

  2. Guarda l'esercitazione sull'architettura

    Istruzioni dettagliate su come creare un'architettura di riferimento.

  3. Invia il tuo diagramma

    Inviaci un'e-mail con il tuo diagramma. I nostri architetti cloud esamineranno il tuo diagramma e ti contatteranno per discutere della tua architettura.

Conferme

  • Autori: Robert Huie, Sasha Banks-Louie
  • Collaboratori: Brad Goodwin, Anup Ojah, Robert Lies

    Team esteso Oracle: James Michels

    GridMarkets Team: Hakim Karim