Seleziona AI con Retrieval Augmented Generation (RAG)

Selezionare AI con RAG per aumentare il prompt del linguaggio naturale recuperando il contenuto dalla memoria di vettore specificata utilizzando la ricerca di somiglianza semantica. Ciò riduce le allucinazioni utilizzando contenuti specifici e aggiornati e fornisce risposte al linguaggio naturale più pertinenti ai prompt.

Select AI automatizza il processo di Retrieval Augmented Generation (RAG). Questa tecnica recupera i dati dalle origini aziendali utilizzando la ricerca vettoriale AI e aumenta i prompt utente per il modello linguistico di grandi dimensioni (LLM, large language model) specificato. Sfruttando le informazioni provenienti dai data store aziendali, la RAG riduce le allucinazioni e genera risposte di base.

RAG utilizza la ricerca vettoriale AI su un indice vettoriale per trovare dati semanticamente simili per la domanda specificata. La memoria di vettore elabora incorporamenti vettoriali, che sono rappresentazioni matematiche di vari datapoint come testo, immagini e audio. Queste integrazioni acquisiscono il significato dei dati, consentendo un'elaborazione e un'analisi efficienti. Per ulteriori dettagli sulle integrazioni vettoriali e sulla ricerca vettoriale AI, vedere Panoramica di AI Vector Search.

Select AI si integra con la ricerca vettoriale AI disponibile in Oracle Autonomous Database 23ai per la ricerca di somiglianza utilizzando le integrazioni vettoriali.

Argomenti

Crea il tuo Vector Store

Select AI automatizza la creazione e la popolazione della memoria di vettore convertendo i documenti di input (ad esempio PDF, DOC, JSON, XML o HTML) dall'area di memorizzazione degli oggetti in testo normale. Oracle Text supporta circa 150 tipi di file. Per un elenco completo di tutti i formati di documento supportati, vedere Formati di documento supportati.

Select AI elabora automaticamente i documenti in chunk, genera incorporamenti, li memorizza nella memoria di vettore specificata e aggiorna l'indice vettoriale all'arrivo di nuovi dati.

Di seguito viene descritto come viene utilizzato l'input dello storage degli oggetti con Select AI RAG.

  1. Input: i dati vengono inizialmente memorizzati in uno storage degli oggetti.
  2. Oracle Autonomous Database recupera i dati di input o il documento, li raggruppa e invia i chunk a un modello di incorporamento.
  3. Il modello di incorporamento elabora i dati di chunk e restituisce incorporamenti vettoriali.
  4. Le integrazioni vettoriali vengono quindi archiviate in una memoria di vettore per l'uso con RAG. Quando il contenuto viene aggiunto, l'indice vettoriale viene aggiornato automaticamente.

RAG recupera le informazioni pertinenti dal database aziendale per rispondere alla domanda di un utente. Queste informazioni vengono fornite al modello linguistico di grandi dimensioni specificato insieme al prompt utente. Select AI utilizza queste informazioni aziendali aggiuntive per migliorare il prompt, migliorando la risposta dell'LLM. RAG può migliorare la qualità delle risposte con informazioni aziendali aggiornate dalla memoria di vettore.



Selezionare AI per implementare RAG come indicato di seguito.
  1. Input: l'utente pone una domanda (specifica un prompt) utilizzando l'azione Seleziona AI narrate.

  2. La selezione AI genera incorporamenti vettoriali del prompt utilizzando il modello di incorporamento specificato nel profilo AI.

  3. L'indice di ricerca vettoriale utilizza l'incorporamento vettoriale della domanda per trovare il contenuto corrispondente dai dati aziendali del cliente (ricerca della memoria di vettore) che è stato indicizzato.

  4. La ricerca vettoriale restituisce i primi testi K simili all'input per l'istanza di Autonomous Database.
  5. Autonomous Database invia quindi questi risultati di query K principali con la domanda dell'utente all'LLM.
  6. LLM restituisce la propria risposta all'istanza di Autonomous Database.
  7. Autonomous Database Select AI fornisce la risposta all'utente.

Utilizzare DBMS_CLOUD_AI per creare e gestire indici vettoriali

Utilizzare il package DBMS_CLOUD_AI per creare e gestire gli indici vettoriali e configurare i parametri JSON del database vettoriale.

Dopo aver creato le credenziali e fornito l'accesso di rete al database vettoriale e al provider AI, l'istanza di Autonomous Database utilizza i profili AI per configurare l'accesso agli LLM. Vedere Esempio: impostazione e utilizzo di Select AI with RAG per un esempio completo di impostazione e utilizzo delle istruzioni Select AI.
Nota

Se non si desidera che i dati di tabella o i documenti di ricerca vettoriale vengano inviati a un LLM, un utente con privilegi di amministratore può disabilitare tale accesso per tutti gli utenti del database specificato. Questa operazione disabilita l'azione narrate per la RAG.

È possibile configurare i profili AI per i provider elencati in Seleziona provider AI e LLM tramite il package DBMS_CLOUD_AI.

Vedere anche:

Usa modelli trasformatore nel database

Select AI RAG consente di utilizzare modelli di trasformatori ONNX pre-addestrati importati nel database nell'istanza di Oracle Database 23ai per generare vettori di incorporamento da blocchi di documenti e prompt utente.

Nota

È necessario importare un modello di trasformatore in formato ONNX pre-addestrato nell'istanza di Oracle Database 23ai per utilizzare Select AI RAG con il modello di trasformatore in database importato. Puoi anche utilizzare altri modelli di trasformatori dei provider AI supportati.

Per esplorare la funzione, vedere Esempio: selezione dell'intelligenza artificiale con modelli di trasformatore nel database.

Vantaggi di Select AI RAG

Semplifica l'esecuzione delle query, migliora l'accuratezza delle risposte con i dati attuali e ottieni trasparenza esaminando le fonti utilizzate dal LLM.

Select AI RAG offre i seguenti vantaggi:
  • Semplifica l'esecuzione di query sui dati e aumenta l'accuratezza delle risposte: consenti agli utenti di eseguire query sui dati aziendali utilizzando il linguaggio naturale e fornisci ai LLM un contesto dettagliato dai dati aziendali per generare risposte più accurate e pertinenti, riducendo le istanze di allucinazioni LLM.

  • Informazioni aggiornate: fornisci agli LLM l'accesso alle informazioni aziendali attuali utilizzando le memorie di vettore, eliminando la necessità di un'ottimizzazione costosa e dispendiosa in termini di tempo degli LLM addestrati su set di dati statici.

  • Integrazione perfetta: integra con Oracle AI Vector Search per una gestione semplificata dei dati e prestazioni migliorate.

  • Orchestrazione automatizzata dei dati: automatizza i passi di orchestrazione con una pipeline Vector Index completamente gestita, garantendo un'elaborazione efficiente dei nuovi dati.

  • Risultati contestuali comprensibili: ha accesso e recupera le fonti utilizzate dall'LLM dalle memoria di vettore, garantendo trasparenza e fiducia nei risultati. Visualizza ed estrae i dati in testo in linguaggio naturale o in formato JSON per semplificare l'integrazione e lo sviluppo delle applicazioni.