Seleziona AI con recupero generazione aumentata (RAG)

Select AI with RAG aumenta il prompt del linguaggio naturale recuperando il contenuto dall'area di memorizzazione vettoriali specificata utilizzando la ricerca di somiglianza semantica. Ciò riduce le allucinazioni utilizzando contenuti specifici e aggiornati e fornisce risposte più pertinenti al linguaggio naturale.

Selezionare AI per automatizzare il processo Retrieval Augmented Generation (RAG). Questa tecnica recupera i dati dalle origini aziendali utilizzando la ricerca di vettori AI e aumenta i prompt utente per il modello LLM (Large Language Model) specificato. Sfruttando le informazioni provenienti dai data store aziendali, RAG riduce le allucinazioni e genera risposte mirate.

RAG utilizza la ricerca di vettori AI su un indice vettoriale per trovare dati semanticamente simili per la domanda specificata. Vector archivia processi di incorporamenti vettoriali, che sono rappresentazioni matematiche di vari punti dati come testo, immagini e audio. Queste integrazioni catturano il significato dei dati, consentendo un'elaborazione e un'analisi efficienti. Per ulteriori dettagli sulle incorporazioni di vettori e sulla ricerca di vettori AI, vedere Panoramica della ricerca di vettori AI.

Select AI si integra con la ricerca vettoriale AI disponibile in Oracle Autonomous Database 23ai per la ricerca di somiglianze utilizzando incorporamenti vettoriali.

Argomenti

Crea il tuo Vector Store

Select AI automatizza la creazione e la popolazione dell'area di memorizzazione vettoriale convertendo i documenti di input (ad esempio, PDF, DOC, JSON, XML o HTML) dall'area di memorizzazione degli oggetti in testo normale. Oracle Text supporta circa 150 tipi di file. Per un elenco completo di tutti i formati di documento supportati, vedere Formati di documento supportati.

Select AI elabora automaticamente i documenti da chunk, genera incorporamenti, li memorizza nell'area di memorizzazione dei vettori specificata e aggiorna l'indice dei vettori quando arrivano nuovi dati.

Ecco come viene utilizzato l'input dallo storage degli oggetti con Select AI RAG:

  1. Input: i dati vengono inizialmente memorizzati in uno storage degli oggetti.
  2. Oracle Autonomous Database recupera i dati di input o il documento, lo chunk e invia i chunk a un modello di incorporamento.
  3. Il modello di incorporamento elabora i dati di chunk e restituisce incorporamenti vettoriali.
  4. Le incorporazioni vettoriali vengono quindi memorizzate in un negozio di vettori per l'uso con RAG. Quando il contenuto viene aggiunto, l'indice vettoriale viene aggiornato automaticamente.

RAG recupera le informazioni rilevanti dal database aziendale per rispondere alla domanda di un utente. Queste informazioni vengono fornite al modello di lingua di grandi dimensioni specificato insieme al prompt utente. Select AI utilizza queste informazioni aziendali aggiuntive per migliorare il prompt, migliorando la risposta dell'LLM. RAG può migliorare la qualità delle risposte con le informazioni aziendali aggiornate dall'archivio vettoriale.



Selezionare AI per implementare RAG come indicato di seguito.
  1. Input: l'utente pone una domanda (specifica un prompt) utilizzando l'azione Seleziona AI narrate.

  2. Select AI genera incorporamenti vettoriali del prompt utilizzando il modello di incorporamento specificato nel profilo AI.

  3. L'indice di ricerca vettoriale utilizza l'incorporamento vettoriale della domanda per trovare il contenuto corrispondente dai dati aziendali del cliente (ricercando l'archivio vettoriale) che è stato indicizzato.

  4. La ricerca vettoriale restituisce i primi testi K simili all'input nell'istanza di Autonomous Database.
  5. Autonomous Database invia quindi questi primi risultati di query K con una domanda utente all'LLM.
  6. LLM restituisce la risposta all'istanza di Autonomous Database.
  7. Autonomous Database Select AI fornisce la risposta all'utente.

Utilizzare DBMS_CLOUD_AI per creare e gestire gli indici dei vettori

Utilizzare il package DBMS_CLOUD_AI per creare e gestire gli indici vettoriali e configurare i parametri JSON del database vettoriale.

Dopo aver creato le credenziali e fornito l'accesso di rete al database vettoriale e al provider AI, l'istanza di Autonomous Database utilizza i profili AI per configurare l'accesso AI LLM. Per un esempio completo sull'impostazione e l'utilizzo delle istruzioni Select AI, vedere Esempio: impostazione e uso di Select AI con RAG.
Nota

Se non si desidera che i dati di tabella o i documenti di ricerca vettoriali vengano inviati a un LLM, un utente con privilegi di amministratore può disabilitare tale accesso per tutti gli utenti del database specificato. Questa operazione disabilita l'azione narrate per l'aggregazione RAG.

È possibile configurare i profili AI per i provider elencati nella sezione Selezionare il provider AI e gli LLM mediante il package DBMS_CLOUD_AI.

Vedere anche:

Usa modelli Transformer nel database

Select AI RAG consente di utilizzare modelli di trasformatori ONNX pre-addestrati importati nel database nell'istanza di Oracle Database 23ai per generare vettori di incorporamento da blocchi di documenti e prompt utente.

Nota

È necessario importare un modello di trasformatore in formato ONNX pre-addestrato nell'istanza di Oracle Database 23ai per utilizzare Select AI RAG con il modello di trasformatore in database importato. Puoi anche utilizzare altri modelli di trasformatore dei provider AI supportati.

Vedere Esempio: selezione dell'intelligenza artificiale con modelli di trasformatore nel database per esplorare la funzione.

Vantaggi di Select AI RAG

Semplifica l'esecuzione delle query, migliora l'accuratezza delle risposte con i dati correnti e acquisisci trasparenza esaminando le fonti utilizzate dall'LLM.

Seleziona AI RAG offre i seguenti vantaggi:
  • Semplifica l'esecuzione di query sui dati e aumenta l'accuratezza delle risposte: consenti agli utenti di eseguire query sui dati aziendali utilizzando il linguaggio naturale e fornisci agli LLM un contesto dettagliato dai dati aziendali per generare risposte più accurate e pertinenti, riducendo le istanze di allucinazioni LLM.

  • Informazioni aggiornate: fornire agli LLM l'accesso alle informazioni aziendali correnti utilizzando archivi vettoriali, eliminando la necessità di una messa a punto costosa e dispendiosa in termini di tempo di LLM addestrati su set di dati statici.

  • Integrazione perfetta: integrazione con Oracle AI Vector Search per una gestione dei dati semplificata e prestazioni ottimizzate.

  • Orchestrazione automatizzata dei dati: automatizza i passaggi di orchestrazione con una pipeline completamente gestita di Vector Index, garantendo un'elaborazione efficiente dei nuovi dati.

  • Risultati contestuali comprensibili: ha accesso e recupera le fonti utilizzate dall'LLM dai negozi vettoriali, garantendo trasparenza e fiducia nei risultati. Visualizza ed estrae i dati in testo in linguaggio naturale o in formato JSON per semplificare l'integrazione e lo sviluppo delle applicazioni.