Informazioni sull'uso di Oracle AI Database 26ai per l'AI aziendale

Consenti alla tua azienda di trasformare i dati aziendali gestiti in Oracle AI Database 26ai in conoscenze gestite e di alta qualità che alimentano le applicazioni AI senza aggiungere memorie di vettore separate. Utilizzando Dify Knowledge Pipeline di Enterprise Edition, puoi orchestrare l'inclusione, l'arricchimento e l'indicizzazione di dati multimodali (testo, immagini, audio) direttamente in Oracle AI Database 26ai. È quindi possibile rendere operativo un recupero rapido e affidabile per casi d'uso quali i copiloti dell'assistenza clienti, la ricerca delle conoscenze e i flussi di lavoro assistiti dagli agenti con i seguenti vantaggi:
  • Accelera il time-to-value per l'intelligenza artificiale attivando i dati esistenti residenti da Oracle
  • Migliora la qualità e la coerenza delle risposte con un contesto curato e allineato alle politiche
  • Garantisci la massima sicurezza su performance, disponibilità e sicurezza di livello Enterprise di Oracle
  • Riduci la complessità dell'architettura unificando lo storage dei dati e la gestione dei vettori
In questo playbook sulla soluzione, scopri come integrare Dify con Oracle AI Database per fornire un riferimento ripetibile per la creazione di applicazioni di Retrieval-Augmented Generation (RAG) e knowledge che vengono eseguite su scala di produzione.

Architettura

Dify viene eseguito su Oracle Cloud Infrastructure Kubernetes Engine (OKE) su più domini di disponibilità all'interno di una singola rete cloud virtuale (VCN) in seguito a una progettazione di rete a tre livelli.

L'architettura seguente mostra una distribuzione a tre livelli tipica di Dify su OCI all'interno di un'area OCI e una singola VCN che si estende su tre domini di disponibilità per l'alta disponibilità:



oracle-adb-dify-arch-oracle.zip

L'elenco seguente riepiloga la distribuzione e la connettività:

  • Un utente on-premise si connette all'applicazione tramite Internet.
  • Le richieste vengono terminate in un load balancer pubblico fornito da OCI Load Balancer (LB) in una VCN.
  • Affrontare la piattaforma con un controller in entrata e un load balancer OCI per l'accesso esterno alla console e ai servizi Dify.
  • Gli LB pubblici richiedono due sottoreti pubbliche in domini di disponibilità (AD) diversi per High Availability (HA).
  • Distribuire Dify Enterprise Edition su OKE all'interno di una VCN che si estende su più AD.
  • Il cluster espone un endpoint API (Application Programming Interface) di kubernetes ed esegue diversi nodi di lavoro.
  • Ogni nodo ospita i pod dell'applicazione. Utilizza una subnet pod privata dedicata con gateway NAT in modo che i pod si connettano a Internet senza essere esposti pubblicamente.
  • Le immagini dei container vengono estratte da OCI Container Registry su Oracle Services Network (OSN) utilizzando un gateway del servizio.
  • Utilizza Oracle AI Database 26ai come database vettoriale, sfruttando il suo storage vettoriale nativo/recupero e le funzioni aziendali (partizionamento, RAC, partizionamento orizzontale, ottimizzazione Exadata) per garantire scalabilità e affidabilità.

L'architettura ha i seguenti componenti:

  • Area OCI

    Un'area geografica OCI è un'area geografica localizzata che contiene uno o più data center, che ospitano domini di disponibilità. Le regioni sono indipendenti da altre regioni e vaste distanze possono separarle (tra paesi o addirittura continenti).

  • Dominio di disponibilità

    I domini di disponibilità sono data center autonomi e indipendenti all'interno di un'area. Le risorse fisiche in ogni dominio di disponibilità sono isolate dalle risorse negli altri domini di disponibilità, il che fornisce tolleranza agli errori. I domini di disponibilità non condividono l'infrastruttura, ad esempio alimentazione o raffreddamento, o la rete interna del dominio di disponibilità. Pertanto, un errore in un dominio di disponibilità non dovrebbe influire sugli altri domini di disponibilità nell'area.

  • Rete e subnet cloud virtuale OCI

    Una rete cloud virtuale (VCN, virtual cloud network) è una rete personalizzabile e definita dal software impostata in un'area OCI. Come le reti di data center tradizionali, le reti VCN ti danno il controllo sul tuo ambiente di rete. Una VCN può avere più blocchi CIDR (Classless Inter-Domain Routing) non sovrapposti che è possibile modificare dopo aver creato la VCN. È possibile segmentare una VCN in subnet, che possono essere definite in un'area o in un dominio di disponibilità. Ogni subnet è costituita da un intervallo contiguo di indirizzi che non si sovrappongono alle altre subnet nella VCN. È possibile modificare le dimensioni di una sottorete dopo la creazione. Una subnet può essere pubblica o privata.

  • Load balancer

    Oracle Cloud Infrastructure Load Balancer fornisce una distribuzione automatica del traffico da un singolo punto di accesso a più server.

  • Motore Kubernetes OCI

    Oracle Cloud Infrastructure Kubernetes Engine (OCI Kubernetes Engine o OKE) è un servizio completamente gestito, scalabile e ad alta disponibile da utilizzare per distribuire le applicazioni containerizzate nel cloud. È possibile specificare le risorse di computazione richieste dalle applicazioni e OKE le esegue il provisioning su OCI in una tenancy esistente. OKE utilizza Kubernetes per automatizzare l'implementazione, il ridimensionamento e la gestione di applicazioni containerizzate tra cluster di host.

  • Oracle AI Database 26ai

    Oracle AI Database 26ai con AI Vector Search ti consente di eseguire query sui dati in base al significato anziché alle parole chiave. Le rappresentazioni vettoriali (embeddings) catturano la semantica di testo, immagini, audio e altro ancora in modo da poter trovare contenuti simili in modo efficiente. Le funzioni di distanza SQL integrate consentono ricerche di somiglianza utilizzando vettori. È possibile combinare la somiglianza semantica e altri criteri di ricerca per fondare modelli linguistici di grandi dimensioni (RAG) per ottenere risposte più accurate e pertinenti.

  • Oracle Autonomous AI Database

    Oracle Autonomous AI Database fornisce un database facile da usare, completamente autonomo, dotato di scalabilità elastica e in grado di offrire prestazioni rapide alle query. Come servizio, non richiede l'amministrazione del database. Non è necessario configurare o gestire alcun hardware né installare alcun software. Gestisce automaticamente il provisioning, il backup, l'applicazione di patch e l'upgrade, la crescita o la riduzione del database ed è un servizio elastico. Sviluppa app scalabili basate sull'intelligenza artificiale con qualsiasi dato utilizzando funzionalità AI integrate. Utilizza il modello linguistico di grandi dimensioni (LLM, large language model) che preferisci e distribuisci nel cloud o nel tuo data center.

Casi d'uso

As enterprises implement AI development plans based on large language models (LLM) models and private data, Oracle AI Database 26ai, with its dual advantages of native vector management and mature enterprise-class features, provides a stable, efficient, and low-threshold data platform solution for the Dify Oracle AI Database Agent development framework and AI applications built on Dify.

  • Riutilizzo delle risorse e ottimizzazione dei costi: le aziende non hanno più bisogno di acquistare database vettoriali dedicati e possono riutilizzare completamente le risorse esistenti di Oracle AI Database, riducendo notevolmente i costi di approvvigionamento e manutenzione dell'hardware.
  • Scalabilità della capacità: man mano che i dati multimodali (come immagini industriali e log audio) diventano sempre più comuni nelle applicazioni AI aziendali, Oracle AI Database 26ai può espandere ulteriormente le funzionalità di recupero vettoriale multimodale, fornendo un supporto AI più completo per scenari come la produzione intelligente e la diagnosi medica.
  • Garanzia di stabilità: sfruttando gli anni di esperienza di Oracle AI Database nel partizionamento, in RAC e nell'ottimizzazione Exadata, Oracle AI Database 26ai può gestire facilmente volumi di dati a livello di petabyte e scenari ad alta concorrenza, garantendo un funzionamento stabile 24/7 per le applicazioni AI aziendali.

Oracle AI Database 26ai non è solo il vettore principale della gestione dei dati vettoriali aziendali, ma anche la base tecnica chiave per promuovere la trasformazione delle aziende dallo storage dei dati al value mining AI, fornendo un solido supporto tecnico per gli aggiornamenti intelligenti aziendali.

Considerazioni

Quando si integra Dify con OCI, prendi in considerazione queste opzioni.

  • Utilizza subnet private per livelli di app/dati, gruppi NSG rispetto alle liste di sicurezza, ove possibile.
  • Utilizzare OCI Vault per i segreti (chiavi API, credenziali DB), i criteri IAM con privilegi minimi e OCI Logging, Monitoraggio e allarmi per l'osservabilità.
  • Prendi in considerazione più pool di nodi del dominio di disponibilità e controlli dello stato del load balancer per garantire alta disponibilità e scalabilità automatica.

Informazioni sui servizi e i ruoli richiesti

Questa soluzione richiede i seguenti servizi e ruoli:

  • Infrastruttura Oracle Cloud
  • Oracle Autonomous AI Database
  • Motore Kubernetes OCI
  • Dify Enterprise Edition

Questi sono i ruoli necessari per ogni servizio.

Nome servizio: ruolo Obbligatorio per...
Dificazione: utente Creare un utente Difica identificato dalla tablespace predefinita con la quota utenti unlimited.
Dify: DB_DEVELOPER_ROLE Consenti agli amministratori di assegnare rapidamente i privilegi necessari agli sviluppatori per progettare, creare e distribuire applicazioni per Oracle Database.

Consulta i prodotti, le soluzioni e i servizi Oracle per ottenere ciò di cui hai bisogno.