Creación de un pipeline de RAG para la búsqueda con OpenSearch

Genere automáticamente código para configurar y utilizar un conector de OCI Generative AI con Search con OpenSearch para un pipeline integral de generación aumentada de recuperación (RAG).

Antes de empezar, revise e implemente los requisitos para utilizar un conector de OCI Generative AI con Search con OpenSearch.

Puede que necesite configurar más de la red para que la aplicación llame a la función que se comunica con el cluster OpenSearch. La red requiere una de las siguientes opciones:

Para una subred pública, un gateway de Internet y dos reglas de la lista de seguridad: una regla de salida con estado y una regla de entrada que permite al tráfico TCP utilizar el puerto 9200.
Para una subred privada, un gateway de servicio y una regla de salida con estado en la lista de seguridad.

Para obtener información sobre cómo configurar estas opciones, consulte Creación de subredes y VCN para su uso con OCI Functions, si aún no existen.

La aplicación se debe ejecutar desde una instancia de VM dentro de la misma subred que el cluster, o bien puede configurar el reenvío del puerto para ejecutar el código localmente. Consulte Tarea 5: Consultar el servicio de búsqueda de OCI para obtener ejemplos de estas opciones.

Desde la consola

Abra el menú en Bases de datos y haga clic en él. En OpenSearch, haga clic en Clusters.
En Ámbito de lista, seleccione el compartimento que contiene el cluster.
En la lista Clusters, haga clic en el nombre del cluster para el que desea crear el pipeline de RAG.
En la página de detalles del cluster, haga clic en Crear pipeline de RAG.
En la página Configurar pipeline de RAG, en Información general, introduzca un nombre, una descripción y una etiqueta para el pipeline y, a continuación, especifique uno o más campos de contexto.
Los campos de contexto especifican el texto que se traduce en incrustaciones para el índice. Los valores especificados aquí deben coincidir con los campos que existen en el índice.
Para utilizar la funcionalidad para generar automáticamente el código para el conector de IA generativa desde la consola, la contraseña del cluster se debe almacenar mediante un secreto con el servicio OCI Vault. Si la contraseña ya está almacenada como un secreto de almacén, especifique el nombre de usuario en Credenciales de almacén de cluster y, a continuación, seleccione el almacén, el secreto de almacén y la versión del secreto para el cluster.
Si la contraseña no se almacena como un secreto de almacén, seleccione Crear un almacén y un secreto y realice las siguientes tareas:
1. Crear un almacén.
2. Después de que el almacén esté activo, cree una clave para el almacén.
3. Para el almacén, cree un secreto con los siguientes detalles:
  - Seleccione la clave que ha creado en el paso anterior.
  - Introduzca manualmente la contraseña para el cluster OpenSearch con el siguiente formato:
    - Secret Type Template: Plain-Text
    - Secret Contents: <OpenSearch-password>
En Grupo de modelos, introduzca un nombre y una descripción para el grupo de modelos. Si introduce el nombre de un grupo de modelos existente, el código generado utiliza el ID de grupo de modelos para el grupo de modelos existente; de lo contrario, se crea un nuevo grupo de modelos.
Seleccione Next (Siguiente).
En la página Configurar conector de IA generativa, en Conector de IA generativa, introduzca un nombre y una descripción para el conector.
Seleccione la acción y, a continuación, el modelo que se va a utilizar para el conector.
Los campos de la sección Parámetros de modelo de Gen AI se rellenan con valores por defecto, en función del modelo seleccionado en el paso anterior. Puede cambiar los valores de los parámetros. Solo puede introducir parámetros válidos y los valores de parámetros permitidos se basan en el modelo que seleccione. Es posible que un valor de parámetro que funcione para un modelo no funcione si selecciona un modelo diferente.
En Modelo de registro de IA generativa, introduzca un nombre y una descripción para el modelo de IA generativa.
Seleccione Next (Siguiente).

La página Generar código contiene el código que utiliza para crear el pipeline de RAG, en función de las opciones especificadas en las páginas anteriores en el flujo de trabajo Crear pipeline de RAG. Para el código independiente que puede copiar o descargar, seleccione Java o Python en la lista desplegable Idioma. A continuación, puede copiar o descargar el código de la primera área de texto en una aplicación.

Si selecciona Kibana, el código generado no se puede ejecutar como una aplicación independiente. En su lugar, el código generado se divide en pasos secuenciales que se copian para ejecutarse desde el panel de control OpenSearch del cluster.

La segunda área de texto contiene código de plantilla que muestra cómo realizar consultas después de crear el pipeline.

Documentación de Oracle Cloud Infrastructure

Creación de un pipeline de RAG para la búsqueda con OpenSearch

Desde la consola