Informazioni sull'uso di Oracle AI Database 26ai per l'AI aziendale
- Accelera il time-to-value per l'intelligenza artificiale attivando i dati esistenti residenti da Oracle
- Migliora la qualità e la coerenza delle risposte con un contesto curato e allineato alle politiche
- Garantisci la massima sicurezza su performance, disponibilità e sicurezza di livello Enterprise di Oracle
- Riduci la complessità dell'architettura unificando lo storage dei dati e la gestione dei vettori
Architettura
L'architettura seguente mostra una distribuzione a tre livelli tipica di Dify su OCI all'interno di un'area OCI e una singola VCN che si estende su tre domini di disponibilità per l'alta disponibilità:
oracle-adb-dify-arch-oracle.zip
L'elenco seguente riepiloga la distribuzione e la connettività:
- Un utente on-premise si connette all'applicazione tramite Internet.
- Le richieste vengono terminate in un load balancer pubblico fornito da OCI Load Balancer (LB) in una VCN.
- Affrontare la piattaforma con un controller in entrata e un load balancer OCI per l'accesso esterno alla console e ai servizi Dify.
- Gli LB pubblici richiedono due sottoreti pubbliche in domini di disponibilità (AD) diversi per High Availability (HA).
- Distribuire Dify Enterprise Edition su OKE all'interno di una VCN che si estende su più AD.
- Il cluster espone un endpoint API (Application Programming Interface) di kubernetes ed esegue diversi nodi di lavoro.
- Ogni nodo ospita i pod dell'applicazione. Utilizza una subnet pod privata dedicata con gateway NAT in modo che i pod si connettano a Internet senza essere esposti pubblicamente.
- Le immagini dei container vengono estratte da OCI Container Registry su Oracle Services Network (OSN) utilizzando un gateway del servizio.
- Utilizza Oracle AI Database 26ai come database vettoriale, sfruttando il suo storage vettoriale nativo/recupero e le funzioni aziendali (partizionamento, RAC, partizionamento orizzontale, ottimizzazione Exadata) per garantire scalabilità e affidabilità.
L'architettura ha i seguenti componenti:
- Area OCI
Un'area geografica OCI è un'area geografica localizzata che contiene uno o più data center, che ospitano domini di disponibilità. Le regioni sono indipendenti da altre regioni e vaste distanze possono separarle (tra paesi o addirittura continenti).
- Dominio di disponibilità
I domini di disponibilità sono data center autonomi e indipendenti all'interno di un'area. Le risorse fisiche in ogni dominio di disponibilità sono isolate dalle risorse negli altri domini di disponibilità, il che fornisce tolleranza agli errori. I domini di disponibilità non condividono l'infrastruttura, ad esempio alimentazione o raffreddamento, o la rete interna del dominio di disponibilità. Pertanto, un errore in un dominio di disponibilità non dovrebbe influire sugli altri domini di disponibilità nell'area.
- Rete e subnet cloud virtuale OCI
Una rete cloud virtuale (VCN, virtual cloud network) è una rete personalizzabile e definita dal software impostata in un'area OCI. Come le reti di data center tradizionali, le reti VCN ti danno il controllo sul tuo ambiente di rete. Una VCN può avere più blocchi CIDR (Classless Inter-Domain Routing) non sovrapposti che è possibile modificare dopo aver creato la VCN. È possibile segmentare una VCN in subnet, che possono essere definite in un'area o in un dominio di disponibilità. Ogni subnet è costituita da un intervallo contiguo di indirizzi che non si sovrappongono alle altre subnet nella VCN. È possibile modificare le dimensioni di una sottorete dopo la creazione. Una subnet può essere pubblica o privata.
- Load balancer
Oracle Cloud Infrastructure Load Balancer fornisce una distribuzione automatica del traffico da un singolo punto di accesso a più server.
- Motore Kubernetes OCI
Oracle Cloud Infrastructure Kubernetes Engine (OCI Kubernetes Engine o OKE) è un servizio completamente gestito, scalabile e ad alta disponibile da utilizzare per distribuire le applicazioni containerizzate nel cloud. È possibile specificare le risorse di computazione richieste dalle applicazioni e OKE le esegue il provisioning su OCI in una tenancy esistente. OKE utilizza Kubernetes per automatizzare l'implementazione, il ridimensionamento e la gestione di applicazioni containerizzate tra cluster di host.
- Oracle AI Database 26ai
Oracle AI Database 26ai con AI Vector Search ti consente di eseguire query sui dati in base al significato anziché alle parole chiave. Le rappresentazioni vettoriali (embeddings) catturano la semantica di testo, immagini, audio e altro ancora in modo da poter trovare contenuti simili in modo efficiente. Le funzioni di distanza SQL integrate consentono ricerche di somiglianza utilizzando vettori. È possibile combinare la somiglianza semantica e altri criteri di ricerca per fondare modelli linguistici di grandi dimensioni (RAG) per ottenere risposte più accurate e pertinenti.
- Oracle Autonomous AI Database
Oracle Autonomous AI Database fornisce un database facile da usare, completamente autonomo, dotato di scalabilità elastica e in grado di offrire prestazioni rapide alle query. Come servizio, non richiede l'amministrazione del database. Non è necessario configurare o gestire alcun hardware né installare alcun software. Gestisce automaticamente il provisioning, il backup, l'applicazione di patch e l'upgrade, la crescita o la riduzione del database ed è un servizio elastico. Sviluppa app scalabili basate sull'intelligenza artificiale con qualsiasi dato utilizzando funzionalità AI integrate. Utilizza il modello linguistico di grandi dimensioni (LLM, large language model) che preferisci e distribuisci nel cloud o nel tuo data center.
Casi d'uso
As enterprises implement AI development plans based on large language models (LLM) models and private data, Oracle AI Database 26ai, with its dual advantages of native vector management and mature enterprise-class features, provides a stable, efficient, and low-threshold data platform solution for the Dify Oracle AI Database Agent development framework and AI applications built on Dify.
- Riutilizzo delle risorse e ottimizzazione dei costi: le aziende non hanno più bisogno di acquistare database vettoriali dedicati e possono riutilizzare completamente le risorse esistenti di Oracle AI Database, riducendo notevolmente i costi di approvvigionamento e manutenzione dell'hardware.
- Scalabilità della capacità: man mano che i dati multimodali (come immagini industriali e log audio) diventano sempre più comuni nelle applicazioni AI aziendali, Oracle AI Database 26ai può espandere ulteriormente le funzionalità di recupero vettoriale multimodale, fornendo un supporto AI più completo per scenari come la produzione intelligente e la diagnosi medica.
- Garanzia di stabilità: sfruttando gli anni di esperienza di Oracle AI Database nel partizionamento, in RAC e nell'ottimizzazione Exadata, Oracle AI Database 26ai può gestire facilmente volumi di dati a livello di petabyte e scenari ad alta concorrenza, garantendo un funzionamento stabile 24/7 per le applicazioni AI aziendali.
Oracle AI Database 26ai non è solo il vettore principale della gestione dei dati vettoriali aziendali, ma anche la base tecnica chiave per promuovere la trasformazione delle aziende dallo storage dei dati al value mining AI, fornendo un solido supporto tecnico per gli aggiornamenti intelligenti aziendali.
Considerazioni
Quando si integra Dify con OCI, prendi in considerazione queste opzioni.
- Utilizza subnet private per livelli di app/dati, gruppi NSG rispetto alle liste di sicurezza, ove possibile.
- Utilizzare OCI Vault per i segreti (chiavi API, credenziali DB), i criteri IAM con privilegi minimi e OCI Logging, Monitoraggio e allarmi per l'osservabilità.
- Prendi in considerazione più pool di nodi del dominio di disponibilità e controlli dello stato del load balancer per garantire alta disponibilità e scalabilità automatica.
Informazioni sui servizi e i ruoli richiesti
Questa soluzione richiede i seguenti servizi e ruoli:
- Infrastruttura Oracle Cloud
- Oracle Autonomous AI Database
- Motore Kubernetes OCI
- Dify Enterprise Edition
Questi sono i ruoli necessari per ogni servizio.
| Nome servizio: ruolo | Obbligatorio per... |
|---|---|
| Dificazione: utente | Creare un utente Difica identificato dalla tablespace predefinita con la quota utenti unlimited.
|
Dify: DB_DEVELOPER_ROLE |
Consenti agli amministratori di assegnare rapidamente i privilegi necessari agli sviluppatori per progettare, creare e distribuire applicazioni per Oracle Database. |
Consulta i prodotti, le soluzioni e i servizi Oracle per ottenere ciò di cui hai bisogno.
