Creazione di una pipeline RAG per la ricerca con OpenSearch

Genera automaticamente il codice per impostare e utilizzare un connettore AI generativa OCI con Search with OpenSearch per una pipeline RAG (Retrieval-Augmented Generation) end-to-end.

Prima di iniziare, esaminare e implementare i prerequisiti per l'uso di un connettore AI generativa OCI con Search with OpenSearch.

Potrebbe essere necessario impostare un numero maggiore di reti per consentire all'applicazione di richiamare la funzione che comunica con il cluster OpenSearch. La rete richiede una delle seguenti opzioni:

Per una subnet pubblica, un gateway Internet e due regole nella lista di sicurezza: una regola di uscita con conservazione dello stato e una regola di entrata che consente al traffico TCP di utilizzare la porta 9200.
Per una subnet privata, un gateway di servizi e una regola di uscita con conservazione dello stato nella lista di sicurezza.

Per informazioni su come impostare queste opzioni, vedere Creazione della VCN e delle subnet da utilizzare con le funzioni OCI, se non esistono già.

L'applicazione deve essere eseguita da un'istanza VM all'interno della stessa subnet del cluster oppure è possibile impostare l'inoltro delle porte per eseguire il codice localmente. Per esempi di queste opzioni, vedere Task 5: Esegui query su OCI Search Service.

Da Oracle Enterprise Manager Console

Aprire il menu di navigazione e fare clic su Database. In OpenSearch, fare clic su Cluster.
In Ambito lista, selezionare il compartimento che contiene il cluster.
Nella lista Cluster fare clic sul nome del cluster per il quale si desidera creare la pipeline RAG.
Nella pagina dei dettagli del cluster fare clic su Crea pipeline RAG.
Nella pagina Configura pipeline RAG, in Informazioni generali, immettere un nome, una descrizione e un tag per la pipeline, quindi specificare uno o più campi di contesto.
I campi di contesto specificano il testo che viene tradotto in incorporamenti per l'indice. I valori specificati qui devono corrispondere ai campi esistenti nell'indice.
Per utilizzare la funzionalità per generare automaticamente il codice per il connettore AI generativa dalla console, la password del cluster deve essere memorizzata utilizzando un segreto con il servizio Vault OCI. Se la password è già memorizzata come segreto vault, specificare il nome utente in Credenziali vault cluster, quindi selezionare il vault, il segreto vault e la versione segreta per il cluster.
Se la password non viene memorizzata come segreto del vault, selezionare Crea un vault e un segreto ed eseguire i task riportati di seguito.
1. Creare un vault.
2. Dopo l'attivazione del vault, creare una chiave per il vault.
3. Per il vault, creare un segreto con le specifiche indicate di seguito:
  - Selezionare la chiave creata nel passo precedente.
  - Immettere manualmente la password per il cluster OpenSearch con il seguente formato:
    - Modello tipo di segreto: Plain-Text
    - Sommario segreto: <OpenSearch-password>
In Gruppo di modelli immettere un nome e una descrizione per il gruppo di modelli. Se si immette il nome di un gruppo di modelli esistente, il codice generato utilizza l'ID del gruppo di modelli per il gruppo di modelli esistente, altrimenti verrà creato un nuovo gruppo di modelli.
Selezionare Next.
Nella pagina Configura connettore AI generativa, in Connettore AI generativa, immettere un nome e una descrizione per il connettore.
Selezionare l'azione, quindi selezionare il modello da utilizzare per il connettore.
I campi della sezione Parametri del modello di intelligenza artificiale generativa vengono popolati con valori predefiniti, in base al modello selezionato nel passo precedente. È possibile modificare i valori dei parametri. È possibile inserire solo parametri validi e i valori dei parametri consentiti si basano sul modello selezionato. Un valore di parametro che funziona per un modello potrebbe non funzionare se si seleziona un modello diverso.
In Modello di registrazione AI generativa, immettere un nome e una descrizione per il modello AI generativa.
Selezionare Next.

La pagina Genera codice contiene il codice utilizzato per creare la pipeline RAG, in base alle opzioni specificate nelle pagine precedenti nel workflow Crea pipeline RAG. Per il codice standalone che è possibile copiare o scaricare, selezionare Java o Python dall'elenco a discesa Lingua. È quindi possibile copiare o scaricare il codice nella prima area di testo in un'applicazione.

Se si seleziona Kibana, il codice generato non può essere eseguito come applicazione standalone. Il codice generato viene invece suddiviso in passi sequenziali da copiare per essere eseguito dal dashboard OpenSearch del cluster.

La seconda area di testo contiene il codice del modello che mostra come eseguire le query dopo la creazione della pipeline.

Documentazione dell'infrastruttura Oracle Cloud

Creazione di una pipeline RAG per la ricerca con OpenSearch

Da Oracle Enterprise Manager Console