Bases de conocimientos

Las bases de conocimientos aprovechan la capacidad de búsqueda vectorial de Oracle Database 26ai para almacenar incrustaciones vectoriales de documentos almacenados en AI Data Platform Workbench.

A través de las capacidades de búsqueda vectorial de Oracle Database 26ai, las bases de conocimientos permiten a los agentes de IA realizar búsquedas semánticas y recuperar documentos semánticamente relevantes. En AI Data Platform Workbench, las bases de conocimientos se crean en un esquema de un catálogo con el tipo Bases de conocimientos.

Página de catálogo maestro del área de trabajo de plataforma de datos de IA abierta con un catálogo seleccionado y bases de conocimientos resaltadas

En AI Data Platform Workbench, las bases de conocimientos se crean en esquemas de catálogos estándar con el tipo Base de conocimientos. La ingestión de archivos PDF, DOCX y TXT almacenados en volúmenes gestionados o externos está soportada en bases de conocimientos. Por defecto, los vectores se almacenan en la instancia de Oracle Database 26ai Vector Search que se aprovisiona en su arrendamiento cuando se crea su instancia de AI Data Platform.

AI Data Platform Workbench admite dos modelos de incrustaciones:

ALL_MINILM_L12_V2: Modelo de transformadores de oraciones que asigna oraciones y párrafos a un espacio vectorial denso de 384 dimensiones. Se utiliza para tareas como la agrupación en clusters o la búsqueda semántica.
MULTILINGUAL_E5_SMALL: Genera incrustaciones vectoriales para texto en varios idiomas. Su diseño compacto permite un rendimiento eficaz en varios idiomas, adecuado para diversos conjuntos de datos y escenarios multilingües.

Note:

Por sí solo, no se puede consultar directamente un objeto de la base de conocimientos en AI Data Platform Workbench. Para realizar consultas en una base de conocimientos, cree una herramienta RAG asociada a un agente en un flujo de agente y seleccione la base de conocimientos relevante. Para obtener más información sobre las herramientas de RAG, consulte RAG Tool. Para obtener más información sobre los agentes de IA, consulte Agentes de IA.

Ingestión de orígenes de datos

Después de crear una base de conocimientos en AI Data Platform Workbench, debe ir a esa base de conocimientos y especificar un origen de datos desde el que ingerir datos. Puede seleccionar un volumen completo o una carpeta de un volumen como origen para la ingesta, pero no puede seleccionar archivos individuales.

Puede ver los orígenes de datos en el separador Origen de datos de la base de conocimientos y ver la información sobre ese origen de datos haciendo clic en su nombre. El separador Parámetros proporciona información sobre el volumen, la ruta de archivo, el cluster asociado y los tipos de archivo seleccionados.

Note:

El área de trabajo de AI Data Platform no admite trabajos de ingesta programados. Puede ingerir datos inmediatamente haciendo clic en Ingerir ahora en el separador Parámetros del origen de datos.

Puede ver información más detallada sobre el origen de datos en el separador Detalles y ver un historial de trabajos de ingesta de datos en el separador Ejecuciones de trabajos.

Crear una base de conocimientos

La creación de una base de conocimientos en AI Data Platform Workbench es una configuración puntual que permite registrar un origen de documento, fragmentar, embeber e indexar archivos automáticamente y permitir la búsqueda semántica y la recuperación de RAG a través de flujos de agente.

No puede consultar directamente bases de conocimientos en AI Data Platform Workbench. Puede consultar bases de conocimientos mediante la creación de una herramienta RAG asociada a un agente AI. Para obtener más información, consulte AI Agents.

Haga clic en Catálogo maestro.
Vaya al catálogo y al esquema estándar en los que desea crear la base de conocimientos.
Haga clic en Bases de conocimientos.
Haga clic en Crear base de conocimiento.
Proporcione un nombre y una descripción para la base de conocimientos.
Seleccione un espacio de trabajo y un cluster de Spark para la ingesta de archivos. Si no se selecciona ningún cluster, se utiliza el cálculo del catálogo maestro predeterminado.
Seleccione el modelo de incrustación utilizado, si es necesario.
Si es necesario, proporcione el tamaño del fragmento y la superposición del fragmento.
Haga clic en Create.

Editar una base de conocimientos

Puede modificar el nombre, la descripción, el cluster, el modelo o los detalles de fragmentación de una base de conocimientos existente si tiene los permisos correspondientes.

Vaya a la carpeta de la base de conocimientos.
Junto a la base de conocimientos que desea editar, haga clic en Acciones y, a continuación, en Editar.
Realice cualquier cambio en los atributos de la base de conocimientos.
Haga clic en Guardar.

Suprimir una base de conocimientos

Puede suprimir bases de conocimientos que ya no necesite ni utilice de su catálogo.

Vaya a la carpeta de la base de conocimientos.
Junto a la base de conocimientos que desea suprimir, haga clic en Acciones y, a continuación, en Suprimir.
Haga clic en Suprimir.

Agregar un origen de datos a una base de conocimientos

Después de crear una base de conocimientos, debe asignarle un origen de datos para la ingesta.

Navegue a la base de conocimientos.
Haga clic en el separador Origen de datos.
Haga clic en Agregar origen de datos a la base de conocimientos.
En el catálogo maestro, seleccione el volumen o la carpeta de un volumen que desea ingerir en la base de conocimientos. No puede seleccionar archivos individuales.
Si es necesario, seleccione el cluster de recursos informáticos que se utilizará para la ingestión de datos.
Seleccione los tipos de archivo que desea ingerir. Los tipos de archivo admitidos son PDF, TXT y DOCX.
Seleccione Iniciar trabajo de ingesta al agregar para iniciar la ingesta inmediatamente después de agregar el origen de datos.
Haga clic en Agregar.

Ingestión de datos en una base de conocimientos

Una vez que se agrega un origen de datos a una base de conocimientos, puede iniciar manualmente una ejecución de trabajo de ingesta de datos desde el separador Parámetros.

Navegue a la base de conocimientos.
En el separador Origen de datos, haga clic en el nombre del origen de datos para el que desea ejecutar un trabajo de datos de ingesta.
En el separador Parámetros, haga clic en Ingerir ahora.

Ver estado de ejecución de trabajo de ingesta

Puede ver una lista de todos los trabajos de ingesta para el origen de datos en el separador Ejecuciones de trabajos del origen de datos.

Navegue a la base de conocimientos.
En el separador Origen de datos, haga clic en el nombre del origen de datos para el que desea ver el estado.
Haga clic en el separador Ejecuciones de trabajos.
Utilice los filtros para restringir la lista de ejecuciones de trabajos mostradas.

Supresión de un origen de datos

Puede suprimir los orígenes de datos que ya no necesita o utilizar de la base de conocimientos.

La supresión de un origen de datos también suprime las incrustaciones vectoriales correspondientes de su plataforma de datos de IA.

Vaya a su base de conocimientos. Haga clic en el separador Orígenes de datos.
Junto al origen de datos que desea suprimir, haga clic en Acciones y, a continuación, en Suprimir.
Haga clic en Suprimir.