Creación de una base de conocimientos en agentes de IA generativa

Cree una base de conocimientos en el servicio Generative AI Agents.

En la página de lista Bases de conocimientos, seleccione Crear base de conocimientos. Si necesita ayuda para encontrar la página de lista, consulte Lista de bases de conocimientos.
Introduzca la siguiente información:
- Nombre: nombre que empieza por una letra o guion bajo, seguido de letras, números, guiones o guiones bajos. La longitud puede oscilar entre 1 y 255 caracteres.
- Compartimento: compartimento en el que desea almacenar la base de conocimientos
- Descripción: Descripción opcional
En Tipo de almacén de datos, seleccione una de las siguientes opciones:
- Almacenamiento de objetos. Consulte RAG Tool Object Storage Guidelines.
- OCI OpenSearch:
  Debe tener documentos fragmentados en archivos con menos de 512 tokens cada uno, y debe haber ingerido e indexado esos documentos en OpenSearch antes de continuar. Consulte RAG Tool OCI Search with OpenSearch Guidelines.
- Búsqueda vectorial de IA en bases de datos:
  - Para datos en Oracle AI Database 26ai. Consulte RAG Tool Oracle Database Guidelines para obtener la configuración necesaria.
  - Para datos en MySQL HeatWave MySQL. Consulte RAG Tool Heatwave MySQL Guidelines para obtener la configuración necesaria.
Si ha seleccionado Almacenamiento de objetos, realice las siguientes acciones:
1. En Orígenes de datos, seleccione Especificar origen de datos e introduzca un nombre y una descripción opcional para el origen de datos.
2. Seleccione el cubo que contiene los datos de la base de conocimientos. Cambie el compartimento si el cubo está en otro compartimento.
  Consulte RAG Tool Object Storage Guidelines para asegurarse de que los archivos de los cubos cumplan los requisitos para los agentes de IA generativa.
3. Después de mostrar el contenido del cubo, realice una de las siguientes acciones para seleccionar los archivos que desea utilizar:
  - Para incluir todos los elementos del cubo, haga clic en Seleccionar todo en el cubo.
  - Seleccione los archivos y las carpetas que desea incluir.
  - Amplíe Agregar prefijos de objeto manualmente para escribir los prefijos para los archivos y carpetas que desea incluir.
4. (Opcional) Seleccione Iniciar automáticamente trabajo de ingestión para orígenes de datos anteriores.
  Si no selecciona esta opción, debe ingerir los datos más tarde para que el agente los utilice.
Nota

Solo puede tener un origen de datos por base de conocimientos. Consulte Límites y limitaciones para agentes de IA generativa.
Si ha seleccionado OCI OpenSearch para el tipo de origen de datos, introduzca la siguiente información. Para obtener directrices, consulte RAG Tool OCI Search with OpenSearch Guidelines.
1. En Cluster OpenSearch, seleccione el cluster que contiene los datos para la base de conocimientos. Cambie el compartimento si el cluster está en otro compartimento.
  
  Para obtener más información sobre los clusters OpenSearch, consulte la página de detalles de un cluster OpenSearch.
2. En índice OpenSearch, introduzca los detalles del índice OpenSearch. Consulte RAG Tool OCI Search with OpenSearch Guidelines.
3. Para Detalles del secreto, seleccione una de las opciones siguientes:
  - Secreto de autenticación básico: para esta opción, seleccione el secreto de almacén para OCI Search con OpenSearch.
  - Secreto de IDCS: para esta opción, introduzca la siguiente información para la aplicación confidencial de IDCS que desea utilizar para el agente:
    - Dominio de identidad: seleccione el dominio de identidad que desea utilizar para acceder al cluster. Cambie el compartimento si el dominio de identidad está en otro compartimento.
    - ID de cliente: introduzca el ID de la aplicación cliente IDCS del cluster OpenSearch.
    - Almacén de secretos de cliente: seleccione el almacén que contiene el secreto de cliente. Cambie el compartimento si el secreto está en otro compartimento.
    - URL de ámbito: introduzca la URL que es el punto final de API para la aplicación del servidor de recursos del dominio de identidad e incluye el ámbito del agente. Por ejemplo, para el ámbito genaiagent, la URL es https://*.agent.aiservice.us-chicago-1.oci.oraclecloud.com/genaiagent.
Si ha seleccionado Oracle AI Vector Search para el tipo de origen de datos, seleccione la conexión de la herramienta de base de datos y, a continuación, seleccione Probar conexión para confirmar una conexión correcta a la base de datos. Si se realiza correctamente, se muestran el nombre y la versión de la base de datos. A continuación, introduzca la función o el procedimiento de búsqueda vectorial para la conexión de la herramienta de base de datos.

Nota

Consulte RAG Tool Oracle Database Guidelines o RAG Tool Heatwave MySQL Guidelines para obtener información sobre la función o el procedimiento.
(Opcional) Seleccione Mostrar opciones de etiquetado y agregue una o más etiquetas a este recurso. Si tiene permisos para crear un recurso, también tiene permisos para aplicar etiquetas de formato libre a dicho recurso. Para aplicar una etiqueta definida, debe tener permisos para utilizar el espacio de nombres de la etiqueta. Para obtener más información sobre el etiquetado, consulte Etiquetas de recursos. Si no está seguro de si desea aplicar etiquetas, omita esta opción o pregunte a un administrador. Puede aplicar etiquetas más tarde.
Haga clic en Crear.

La base de conocimientos tarda un tiempo en crearse. Después de crear la base de conocimientos, si no ha ingerido datos para un origen de datos de Object Storage, siga los pasos de Ingesta de datos de origen de datos en agentes de IA generativa.

Nota

Después de ejecutar un trabajo de ingesta de datos para un origen de datos de Object Storage, revise los logs de estado y de estado para confirmar que todos los archivos actualizados se han ingerido correctamente.

Para conocer el significado de un estado de trabajo de ingestión y la acción que se debe realizar si hay un problema de fallo, consulte Ingesta de datos de origen de datos, paso 6.

Si el trabajo de ingestión falla (por ejemplo, porque un archivo era demasiado grande), solucione el problema y reinicie el trabajo.

Al reiniciar un trabajo de ingestión ejecutado anteriormente, el pipeline detecta los archivos que se han ingerido anteriormente correctamente y los omite. El pipeline solo ingiere archivos que han fallado antes y que se han actualizado desde entonces. Por ejemplo, tiene 20 archivos para ingerir y la ejecución del trabajo inicial da como resultado 2 archivos fallidos. Al reiniciar el trabajo, el pipeline reconoce que ya se han ingerido correctamente 18 archivos y los ignora. Ingiere solo los 2 archivos que han fallado anteriormente y que se han actualizado desde entonces.

Documentación de Oracle Cloud Infrastructure

Creación de una base de conocimientos en agentes de IA generativa