Seleccionar conceptos de IA

Explora los conceptos y términos relacionados con Select AI.

Acciones

Una acción en Select AI es una palabra clave que indica a Select AI que realice un comportamiento diferente al actuar en la petición de datos. Al especificar una acción, los usuarios pueden indicar a Select AI que procese su petición de datos en lenguaje natural para generar código SQL, responder a una petición de datos de chat, narrar la salida, mostrar la sentencia SQL o explicar el código SQL, aprovechando los LLM para interactuar eficazmente con los datos dentro de su entorno de base de datos.

Consulte Use AI Keyword to Enter Prompts para ver las acciones de selección de IA admitidas.

Perfil de AI

Un perfil de AI es una especificación que incluye el proveedor de AI que se debe utilizar y otros detalles relacionados con los metadatos y los objetos de base de datos necesarios para generar respuestas a las peticiones de datos en lenguaje natural. Consulte Procedimiento CREATE_PROFILE y Atributos de perfil.

Proveedor de IA

Un proveedor de IA en Select AI se refiere al proveedor de servicios que proporciona el LLM o el transformador, o ambos, para procesar y generar respuestas a peticiones de datos en lenguaje natural. Estos proveedores ofrecen modelos que pueden interpretar y convertir el lenguaje natural para los casos de uso resaltados en el concepto de LLM. Consulte Select your AI Provider and LLMs para conocer los proveedores admitidos.

Conversaciones

Las conversaciones en Select AI representan un intercambio interactivo entre el usuario y el sistema, lo que permite a los usuarios consultar o interactuar con la base de datos a través de una serie de peticiones de datos en lenguaje natural. Select AI incorpora hasta 10 peticiones de datos anteriores a la solicitud actual a través de conversaciones basadas en sesiones, lo que crea una petición de datos aumentada enviada al LLM. Seleccionar IA admite varias conversaciones personalizables que se pueden configurar mediante API de conversación desde el paquete DBMS_CLOUD_AI. Consulte Seleccionar conversaciones de IA.

Credenciales de Base de Datos

Las credenciales de base de datos son credenciales de autenticación que se utilizan para acceder e interactuar con las bases de datos. Normalmente consisten en un nombre de usuario y una contraseña, a veces complementados por factores de autenticación adicionales como tokens de seguridad. Estas credenciales se utilizan para establecer una conexión segura entre una aplicación o un usuario y una base de datos, de modo que solo las personas o los sistemas autorizados puedan acceder y manipular los datos almacenados en la base de datos.

Alucinación en LLM

La alucinación en el contexto de los grandes modelos de lenguaje se refiere a un fenómeno en el que el modelo genera texto que es incorrecto, sin sentido o no relacionado con la petición de datos de entrada. A pesar de ser el resultado del intento del modelo de generar texto coherente, estas respuestas pueden contener información que es fabricada, engañosa o puramente imaginativa. La alucinación puede ocurrir debido a sesgos en los datos de entrenamiento, falta de comprensión adecuada del contexto o limitaciones en el proceso de entrenamiento del modelo.

IAM

Oracle Cloud Infrastructure Identity and Access Management (IAM) le permite controlar quién tiene acceso a sus recursos en la nube. Puede controlar qué tipo de acceso tiene un grupo de usuarios y a qué recursos específicos. Para obtener más información, consulte Visión general de Identity and Access Management.

Refinación iterativa

El refinamiento iterativo es un proceso de mejorar gradualmente una solución o un modelo a través de ciclos repetidos de ajustes basados en la retroalimentación o evaluación. Comienza con una aproximación inicial, la refina paso a paso y continúa hasta que se logra la precisión o el resultado deseado. Cada iteración se basa en la anterior, incorporando correcciones u optimizaciones para acercarse al objetivo.

En la generación de resúmenes de texto, la acotación iterativa puede ser útil para procesar archivos o documentos grandes. El proceso divide el texto en fragmentos de tamaño manejable, por ejemplo, que se ajustan a los límites de token de un LLM, genera un resumen para un fragmento y, a continuación, mejora el resumen mediante la incorporación secuencial de los siguientes fragmentos.

Casos de uso para la acotación iterativa:

  • Se adapta mejor a situaciones donde la precisión contextual y la coherencia son críticas, como cuando se resumen textos complejos o altamente interconectados donde cada parte se basa en el anterior.
  • Ideal para tareas de menor escala donde el procesamiento secuencial es aceptable.

Consulte Técnicas de resumen.

Modelo de Lenguaje Grande (LLM)

Un modelo de lenguaje grande (LLM) se refiere a un tipo avanzado de modelo de inteligencia artificial que se entrena en cantidades masivas de datos de texto para admitir una serie de casos de uso en función de sus datos de entrenamiento. Esto incluye comprender y generar lenguaje similar al humano, así como consultas de código de software y bases de datos. Estos modelos son capaces de realizar una amplia gama de tareas de procesamiento de lenguaje natural, incluida la generación de texto, la traducción, el resumen, la respuesta a preguntas, el análisis de sentimientos y más. Los LLM suelen basarse en sofisticados modelos de redes neuronales de aprendizaje profundo que aprenden patrones, contexto y semántica a partir de los datos de entrada, lo que les permite generar texto coherente y contextualmente relevante.

MapReduce

En general, el modelo de programación MapReduce permite procesar datos de gran volumen dividiendo las tareas en dos fases: Map y Reduce.
  • Asignación: procesa los datos de entrada y los transforma en pares clave-valor.
  • Reducir: agrega y resume los datos asignados según las claves. MapReduce realiza el procesamiento paralelo de grandes juegos de datos.

En el caso de Select AI Summarize, MapReduce divide el texto en varios fragmentos y los procesa en paralelo e independientemente, generando resúmenes individuales para cada fragmento. A continuación, estos resúmenes se combinan para formar un resumen global coherente.

Los casos de uso para la asignación reducen:

  • Ideal para tareas paralelas a gran escala donde la velocidad y la escalabilidad son prioridades, como resumir conjuntos de datos o documentos muy grandes.
  • Ideal para situaciones en las que la independencia de fragmentos es aceptable y los resúmenes se pueden agregar más tarde.

Consulte Técnicas de resumen.

Metadatos

Los metadatos de base de datos hacen referencia a los datos que describen la estructura, la organización y las propiedades de las tablas y vistas de base de datos.

Clonación de metadatos

Una clonación de metadatos o una clonación de Autonomous Database crea una copia de los metadatos que definen la base de datos o el esquema, que contiene solo la estructura, no los datos reales. Esta clonación incluye tablas, índices, vistas, estadísticas, procedimientos y disparadores sin filas de datos. Los desarrolladores, probadores o aquellos que crean plantillas de base de datos encuentran esto útil. Para obtener más información, consulte Clonación, movimiento o cambio de versión de una instancia de Autonomous Database.

Peticiones de datos de lenguaje natural

Las peticiones de datos de lenguaje natural son instrucciones o solicitudes legibles por humanos que se proporcionan para guiar los modelos de IA generativa, como los modelos de lenguaje grande. En lugar de utilizar lenguajes de programación o comandos específicos, los usuarios pueden interactuar con estos modelos introduciendo peticiones de datos en una forma de lenguaje más conversacional o natural. A continuación, los modelos generan una salida basada en la petición de datos proporcionada.

Lista de Control de Acceso a la Red (ACL)

Una lista de control de acceso de red es un conjunto de reglas o permisos que definen qué tráfico de red puede pasar a través de un dispositivo de red, como un enrutador, un firewall o una puerta de enlace. Las ACL se utilizan para controlar y filtrar el tráfico entrante y saliente en función de diversos criterios, como direcciones IP, números de puerto y protocolos. Desempeñan un papel crucial en la seguridad de la red al permitir a los administradores gestionar y restringir el tráfico de red para evitar el acceso no autorizado, posibles ataques y violaciones de datos.

Generación aumentada de recuperación (RAG)

La generación aumentada de recuperación (RAG) es una técnica que implica recuperar información relevante para la consulta de un usuario y proporcionar esa información a un modelo de lenguaje grande (LLM) para mejorar las respuestas y reducir la alucinación.

Normalmente, RAG implica la búsqueda vectorial, pero más generalmente, incluye aumentar una petición de datos de contenido de base de datos (ya sea manual o automáticamente), como metadatos de esquema para la generación SQL o contenido de base de datos consultado explícitamente. Otras formas de aumento pueden incluir tecnologías como el análisis de gráficos y el aprendizaje automático tradicional.

Búsqueda de similitud semántica

La búsqueda de similitud semántica identifica y recupera puntos de datos que coinciden estrechamente con una consulta determinada mediante la comparación de vectores de funciones en un almacén de vectores.

Distancia de vector

La distancia vectorial mide la similitud o disimilitud entre vectores de características mediante el cálculo de la distancia entre ellos en un espacio multidimensional.

Índice de vector

Un índice vectorial organiza y almacena vectores para permitir una búsqueda de similitud eficiente y la recuperación de datos relacionados.

Tienda de vectores

Un almacén de vectores incluye sistemas que almacenan, gestionan y permiten la búsqueda de similitud semántica con incrustaciones vectoriales. Esto incluye bases de datos vectoriales independientes y Oracle Database 23ai AI Vector Search.