Creación de una base de conocimientos en agentes de IA generativa
Cree una base de conocimientos en el servicio Generative AI Agents.
-
En la página de lista Bases de conocimientos, seleccione Crear base de conocimientos.
Si necesita ayuda para buscar la página de lista, consulte Listado de bases de conocimientos.
-
Introduzca la siguiente información:
- Nombre: nombre que empieza por una letra o guion bajo, seguido de letras, números, guiones o guiones bajos. La longitud puede oscilar entre 1 y 255 caracteres.
- Compartimento: compartimento en el que desea almacenar la base de conocimientos
- Descripción: Descripción opcional
-
En Tipo de almacén de datos, seleccione una de las siguientes opciones:
- Almacenamiento de objetos. Consulte Requisitos de datos para Object Storage.
- OCI OpenSearch:
Debe tener documentos fragmentados en archivos con menos de 512 tokens cada uno, y debe haber ingerido e indexado esos documentos en OpenSearch antes de continuar. Consulte RAG Tool OCI Search with OpenSearch Guidelines for Generative AI Agents.
- Búsqueda de vectores con IA de Oracle:
Esta opción es para datos de Oracle Database 23ai. Consulte RAG Tool Oracle Database Guidelines for Generative AI Agents para obtener la configuración necesaria.
-
Si ha seleccionado Almacenamiento de objetos, realice las siguientes acciones:
- En Orígenes de datos, seleccione Especificar origen de datos e introduzca un nombre y una descripción opcional para el origen de datos.
-
Seleccione el cubo que contiene los datos de la base de conocimientos. Cambie el compartimento si el cubo está en otro compartimento.
Consulte Requisitos de datos para Object Storage para asegurarse de que los archivos de los cubos cumplen los requisitos para los agentes de IA generativa.
-
Después de mostrar el contenido del cubo, realice una de las siguientes acciones para seleccionar los archivos que desea utilizar:
- Para incluir todos los elementos en el cubo, seleccione Seleccionar todo en el cubo.
- Seleccione los archivos y las carpetas que desea incluir.
- Amplíe Agregar prefijos de objeto manualmente para escribir los prefijos para los archivos y carpetas que desea incluir.
- (Opcional) Seleccione Mostrar opciones de etiquetado y agregue una o más etiquetas al origen de datos. Si tiene permisos para crear un recurso, tiene permiso para actualizar sus etiquetas. Si necesita ayuda, consulte Conceptos de espacios de nombres de etiquetas y etiquetas.
- Haga clic en Crear.
- (Opcional) Seleccione Iniciar automáticamente trabajo de ingestión para orígenes de datos anteriores.
Si no selecciona esta opción, debe ingerir los datos más tarde para que el agente los utilice.
Nota
Solo puede tener un origen de datos por base de conocimientos. Consulte Limits and Limitations for Generative AI Agents. -
Si ha seleccionado OCI OpenSearch para el tipo de origen de datos, introduzca la siguiente información. Para obtener directrices, consulte RAG Tool OCI Search with OpenSearch Guidelines for Generative AI Agents.
- Cluster OpenSearch: seleccione el cluster que contiene los datos de la base de conocimientos. Cambie el compartimento si el cluster está en otro compartimento.
- Índice OpenSearch: introduzca los detalles del índice OpenSearch. Consulte RAG Tool OCI Search with OpenSearch Guidelines for Generative AI Agents.
- Detalles del secreto: seleccione una de las siguientes opciones:
- Secreto de autenticación básico: para esta opción, seleccione el secreto de almacén para OCI Search con OpenSearch.
- Secreto de IDCS: para esta opción, introduzca la siguiente información para la aplicación confidencial de IDCS que desea utilizar para el agente:
- Dominio de identidad: seleccione el dominio de identidad que desea utilizar para acceder al cluster. Cambie el compartimento si el dominio de identidad está en otro compartimento.
- ID de cliente: introduzca el ID de la aplicación cliente IDCS del cluster OpenSearch.
- Almacén de secretos de cliente: seleccione el almacén que contiene el secreto de cliente. Cambie el compartimento si el secreto está en otro compartimento.
- URL de ámbito: introduzca la URL que es el punto final de API para la aplicación del servidor de recursos del dominio de identidad e incluye el ámbito del agente. Por ejemplo, para el ámbito
genaiagent
, la URL eshttps://*.agent.aiservice.us-chicago-1.oci.oraclecloud.com/genaiagent
.
Para obtener más información sobre los clusters OpenSearch, consulte la página de detalles de un cluster OpenSearch.
-
Si ha seleccionado Oracle AI Vector Search para el tipo de origen de datos, seleccione la conexión a la herramienta de base de datos y, a continuación, seleccione Probar conexión para confirmar una conexión correcta a la base de datos. Si se realiza correctamente, se muestran el nombre y la versión de la base de datos. A continuación, introduzca la función de búsqueda vectorial para la conexión de la herramienta de base de datos.
Nota
Consulte las Directrices de Oracle Database de la herramienta RAG para agentes de IA generativa para introducir los valores de este paso. - (Opcional) Seleccione Mostrar opciones de etiquetado y agregue una o más etiquetas a la base de conocimientos. Si tiene permisos para crear un recurso, tiene permiso para actualizar sus etiquetas. Si necesita ayuda, consulte Conceptos de espacios de nombres de etiquetas y etiquetas.
-
Haga clic en Crear.
La base de conocimientos tarda un tiempo en crearse. Después de crear la base de conocimientos, si no ha ingerido datos para un origen de datos de Object Storage, siga los pasos de Ingesta de datos de origen de datos en agentes de IA generativa.
Nota
Después de que se ejecute un trabajo de ingesta de datos para un origen de datos de Object Storage, revise los logs de estado para confirmar que todos los archivos actualizados se hayan ingerido correctamente.
Si el trabajo de ingestión falla (por ejemplo, porque un archivo era demasiado grande), solucione el problema y reinicie el trabajo.
Al reiniciar un trabajo de ingestión ejecutado anteriormente, el pipeline detecta los archivos que se han ingerido anteriormente correctamente y los omite. El pipeline solo ingiere archivos que han fallado antes y que se han actualizado desde entonces. Por ejemplo, tiene 20 archivos para ingerir y la ejecución del trabajo inicial da como resultado 2 archivos fallidos. Al reiniciar el trabajo, el pipeline reconoce que ya se han ingerido correctamente 18 archivos y los ignora. Ingiere solo los 2 archivos que han fallado anteriormente y que se han actualizado desde entonces.