UniQreate: Distribuzione piattaforma di gestione dati su Oracle Cloud Infrastructure
UniQreate è una società di automazione dell'estrazione dati che aiuta le aziende a massimizzare il valore dei dati non organizzati utilizzando i flussi di lavoro più efficienti e le interazioni meno intrusive.
Molte organizzazioni dispongono di dati distribuiti su milioni di documenti che variano in struttura, contesto, layout e formati. Estrarre dati rilevanti da questi dati non organizzati utilizzando risorse manuali o altri strumenti richiede molto tempo e ha una scalabilità limitata. UniQreate risolve questo problema utilizzando intelligenza artificiale, flussi di lavoro intelligenti e interfacce Web per migliorare i modelli di apprendimento approfondito. Con questo approccio, poiché i dati dell'organizzazione hanno un contesto e una rappresentazione migliori e possono essere utilizzati prontamente senza dipendere dall'elaborazione manuale o da strumenti personalizzati.
UniQreate stava cercando di creare la propria piattaforma di gestione dei dati e ha scelto Oracle Cloud at Customer (OCI) per i seguenti motivi:
- Agilità durante la scalabilità della larghezza di banda di calcolo e storage
- Off-the-shelf maggiore potenza di calcolo ad un costo competitivo
- Memorizzazione file scalabile e servizi MySQL gestiti
- La memorizzazione degli oggetti soddisfa tutte le esigenze di memorizzazione del progetto
- La funzione Compartment fornisce un modo pulito per separare e gestire ambienti separati
UniQreate fa parte del programma di avvio di Oracle Cloud at Customer da 2020 ed esegue 16 istanze OCPU e 3 istanze GPU per più ambienti client. Questa impostazione consente loro di eseguire 200 cicli di estrazione al giorno con un allenamento modello in esecuzione ogni 24 ore.
Grazie alle funzioni, alle funzionalità e ai costi competitivi forniti da Oracle Cloud at Customer, UniQreate è stata in grado di ottenere risparmi mensili del 20% sui costi complessivi.
Architettura
Questa architettura mostra l'architettura di recupero da catastrofi multiregione di UniQreate su Oracle Cloud Infrastructure.
- Server Web: fornisce l'interfaccia utente di estrazione e le capacità amministrative
- Code Manager: Determina le forme delle macchine virtuali che devono essere lanciate per il motore di previsione
- Motore di previsione: esegue moduli di intelligenza artificiale (AI) e machine learning (ML)
- Server di monitoraggio: monitorare lo stato e le prestazioni dell'intera soluzione.
- File system: fornisce una memorizzazione scalabile a bassa latenza per i metadati di modello e documento, indipendente dai server Web e dai database server
- Database server: fornisce la memorizzazione persistente per i server Web
L'automazione viene ottenuta utilizzando gli script Ansible per avviare dinamicamente il motore di previsione con la forma preferita. Questo motore di previsione scalabile aiuta ad affrontare l'elaborazione di documenti di grandi dimensioni in base alle esigenze del cliente.
La rete cloud virtuale (VCN) in cui sono ospitate le virtual machine (VM) viene segmentata in due subnet: una subnet pubblica per l'host bastion (per la connettività SSH) e una subnet privata per le VM, ad esempio code manager, motore di previsione, memorizzazione file e database server MySQL. La subnet pubblica ospita inoltre un server Jenkins per i requisiti di integrazione e distribuzione continua (CI/CD).
Le risorse vengono distribuite in più domini di errore per un'elevata disponibilità.
Lo storage degli oggetti viene utilizzato come backup per l'intero ambiente, incluse le immagini di ogni VM. Un load balancer pubblico distribuisce il carico di traffico tra VM. L'ambiente utilizza due livelli di sicurezza: uno per la sicurezza di rete implementato utilizzando liste di sicurezza di rete e l'altro specifico dell'applicazione, implementato utilizzando un gruppo di sicurezza di rete (NSG) per ciascun segmento di rete. Per la distribuzione vengono utilizzati domini di disponibilità separati e domini di errore separati all'interno di ciascun dominio di disponibilità, che forniscono un'elevata disponibilità e una maggiore tolleranza agli errori all'interno dell'area. L'intero ambiente è ospitato anche in un'altra regione per il recupero delle catastrofi. L'accesso utente viene gestito utilizzando i criteri Identity and Access Management (IAM).
L'intera impostazione è stata distribuita su Oracle Cloud Infrastructure in quattro giorni, fornendo la massima disponibilità e tempo di attività. Per le distribuzioni future, UniQreate utilizza la GPU di Oracle Cloud Infrastructure per migliorare e perfezionare i modelli di apprendimento approfondito che i clienti possono utilizzare per elaborare i propri documenti a $5– 10M all'anno per client e generare un contesto e una rappresentazione molto migliori del testo.
Il seguente diagramma illustra questa architettura di riferimento.
L'architettura ha i seguenti componenti:
- Area
Un'area Oracle Cloud Infrastructure è un'area geografica localizzata che contiene uno o più data center, denominati domini di disponibilità. Le regioni sono indipendenti da altre regioni, e vaste distanze possono separarle (tra paesi o addirittura continenti).
Tutte le risorse di questa architettura vengono distribuite in un'unica area.
- Domini di disponibilità
I domini di disponibilità sono data center indipendenti e autonomi all'interno di un'area. Le risorse fisiche in ogni dominio di disponibilità vengono isolate dalle risorse negli altri domini di disponibilità, il che fornisce tolleranza agli errori. I domini di disponibilità non condividono un'infrastruttura come l'alimentazione o il raffreddamento oppure la rete interna del dominio di disponibilità. È improbabile che l'eventuale guasto di un dominio di disponibilità influenzi gli altri domini di disponibilità della regione.
Tutte le risorse di questa architettura vengono distribuite in un singolo dominio di disponibilità.
- Dominio di errore
Un dominio di errore è un raggruppamento di hardware e infrastruttura all'interno di un dominio di disponibilità. Ogni dominio di disponibilità ha tre domini di guasto con alimentazione e hardware indipendenti. Quando si distribuiscono risorse su più domini di errore, le applicazioni possono tollerare errori fisici del server, la manutenzione del sistema e gli errori di alimentazione all'interno di un dominio di errore.
- Compartimento
I compartimenti sono partizioni logiche tra aree all'interno di una tenancy di Oracle Cloud Infrastructure. Utilizzare i compartimenti per organizzare le risorse in Oracle Cloud, controllare l'accesso alle risorse e impostare le quote di utilizzo. Per controllare l'accesso alle risorse in un determinato compartimento, è possibile definire i criteri che specificano chi può accedere alle risorse e quali azioni possono eseguire.
- Rete cloud virtuale (VCN) e subnet
Un VCN è una rete customizzabile e definita dal software impostata in un'area Oracle Cloud Infrastructure. Come le reti di data center tradizionali, offre controllo completo sull'ambiente di rete. Un VCN può avere più blocchi CIDR non sovrapposti che è possibile modificare dopo la creazione di VCN. È possibile segmentare un VCN in subnet, che possono essere definite in un'area o in un dominio di disponibilità. Ogni subnet è costituita da un intervallo contiguo di indirizzi che non si sovrappongono alle altre subnet in VCN. È possibile modificare le dimensioni di una subnet dopo la creazione. Una subnet può essere pubblica o privata.
- Liste di sicurezza
Per ogni subnet è possibile creare regole di sicurezza che specifichino l'origine, la destinazione e il tipo di traffico che devono essere consentiti all'interno e all'esterno della subnet.
- Peering remoto
Il peering remoto consente alle risorse delle VCN di comunicare utilizzando indirizzi IP privati senza instradare il traffico su Internet o tramite la rete locale. Il peering remoto elimina la necessità di un gateway Internet e di indirizzi IP pubblici per le istanze che devono comunicare con un altro VCN in un'area diversa.
- Host bastion
L'host bastion è un'istanza di calcolo che funge da punto di accesso sicuro e controllato alla topologia dall'esterno del cloud. L'host bastione viene eseguito in genere in una zona demilitarizzata (DMZ). Consente di proteggere le risorse sensibili inserendole in reti private a cui non è possibile accedere direttamente dall'esterno del cloud. La topologia dispone di un singolo punto di accesso noto che è possibile monitorare e controllare regolarmente. Così, è possibile evitare di esporre i componenti più sensibili della topologia senza compromettere l'accesso a loro.
- Load balancer
Il servizio Oracle Cloud Infrastructure Load Balancing fornisce la distribuzione automatica del traffico da un singolo punto di accesso a più server nel backend.
Questa architettura include un load balancer pubblico.
- Storage degli oggetti
Lo storage degli oggetti consente un accesso rapido a grandi quantità di dati strutturati e non strutturati di qualsiasi tipo di contenuto, inclusi backup del database, dati analitici e contenuti avanzati quali immagini e video. Puoi memorizzare e quindi recuperare i dati direttamente da Internet o dall'interno della piattaforma cloud. È possibile scalare perfettamente lo storage senza compromettere le prestazioni o l'affidabilità dei servizi. Utilizzare lo storage standard per lo storage "hot" necessario per accedere rapidamente, immediatamente e di frequente. Utilizzare lo storage di archivio per lo storage "freddo" che si conserva per lunghi periodi di tempo e raramente o raramente si accede.
- Archiviazione file
Il servizio Oracle Cloud Infrastructure File Storage fornisce un file system di rete durevole, scalabile, sicuro e di livello enterprise. È possibile connettersi a un file system del servizio di memorizzazione file da qualsiasi istanza bare metal, virtual machine o container in un VCN. È inoltre possibile accedere a un file system esterno a VCN utilizzando Oracle Cloud Infrastructure FastConnect e IPSec VPN.
- Oracle MySQL Database Service
Oracle MySQL Database Service è un servizio di database Oracle Cloud Infrastructure (OCI) completamente gestito che consente agli sviluppatori di sviluppare e distribuire rapidamente applicazioni cloud native sicure. Ottimizzato ed esclusivamente disponibile in OCI, Oracle MySQL Database Service è progettato, gestito e supportato dai team di progettazione OCI e MySQL al 100%.
Oracle MySQL Database Service dispone di un motore di analisi dei dati integrato ad alte prestazioni (HeatWave) in grado di eseguire sofisticate analisi in tempo reale direttamente su un database MySQL operativo.
Acquisito e distribuito in primo piano
Vuoi mostrare cosa hai costruito su Oracle Cloud Infrastructure? Ti invitiamo a condividere le lezioni apprese, le best practice e le architetture di riferimento con la nostra community globale di architetti cloud? Vi aiutiamo a iniziare.
- Scarica il modello (PPTX)
Illustrare l'architettura di riferimento trascinando le icone nel wireframe di esempio.
- Guarda l'esercitazione sull'architettura
Ottieni istruzioni dettagliate su come creare un'architettura di riferimento.
- Sottomettere il diagramma
Inviaci un'e-mail con il tuo diagramma. I nostri architetti cloud esamineranno il diagramma e ti contatteranno per discutere della tua architettura.
