Seleccionar conceptos de IA

Explora los conceptos y términos relacionados con Select AI.

Acciones

Una acción en Select AI es una palabra clave que indica a Select AI que realice un comportamiento diferente al actuar en la petición de datos. Al especificar una acción, los usuarios pueden indicar a Select AI que procese su petición de datos en lenguaje natural para generar código SQL, responder a una petición de datos de chat, narrar la salida, mostrar la sentencia SQL o explicar el código SQL, aprovechando los LLM para interactuar eficazmente con los datos dentro de su entorno de base de datos.

Consulte Use AI Keyword to Enter Prompts para ver las acciones de selección de IA admitidas.

Agente de IA

Modelo de IA

Término general que abarca varios tipos de modelos de inteligencia artificial, incluidos los grandes modelos de lenguaje (LLM) y los transformadores (también conocidos como modelos de incorporación), utilizados para tareas como la generación de texto, la traducción y el reconocimiento de imágenes. Un modelo de IA es un programa entrenado en datos que detecta patrones y toma predicciones o decisiones basadas en nuevas entradas. En el contexto de Oracle, el modelo de IA se refiere específicamente a los diversos modelos de aprendizaje automático y lenguaje de gran tamaño (LLM) disponibles a través de los servicios de Oracle. Consulte Conceptos para la IA generativa para obtener más información.

Perfil de AI

Un perfil de AI es una especificación que incluye el proveedor de AI que se debe utilizar y otros detalles relacionados con los metadatos y los objetos de base de datos necesarios para generar respuestas a las peticiones de datos en lenguaje natural. Consulte Procedimiento CREATE_PROFILE y Atributos de perfil.

Proveedor de IA

Un proveedor de IA en Select AI se refiere al proveedor de servicios que proporciona el LLM o el transformador, o ambos, para procesar y generar respuestas a peticiones de datos en lenguaje natural. Estos proveedores ofrecen modelos que pueden interpretar y convertir el lenguaje natural para los casos de uso resaltados en el concepto de LLM. Consulte Select your AI Provider and LLMs para conocer los proveedores admitidos.

Bots conversacionales

Agente conversacional basado en inteligencia artificial diseñado para interactuar con los usuarios en lenguaje natural, usado frecuentemente para dar servicio al cliente o recuperar información. En el contexto de Select AI, el chatbot Preguntar a Oracle ayuda a los usuarios a hacer preguntas en lenguaje natural y recibir respuestas generadas por IA respaldadas por su base de datos y contenido privado. Mediante esta interfaz de usuario, los usuarios pueden:
  • Haga preguntas en lenguaje natural y obtenga SQL generado automáticamente (NL2SQL).
  • Ejecute consultas en tablas y vistas de base de datos mediante Select AI.
  • Utilice la generación con recuperación aumentada (RAG) para incluir contenido de documentos privados almacenados en la base de datos de IA autónoma.
  • Interactúe con los equipos de agentes que haya definido con Select AI Agent.

Consulte Preguntar a Oracle para obtener más información.

Enlace en la nube

Un enlace a la nube establece una conectividad segura y privada entre Oracle Cloud Infrastructure y proveedores de nube externos o redes locales, lo que facilita un intercambio de datos fluido. En Select AI, los enlaces a la nube permiten a Autonomous AI Database incorporar datos externos en las interacciones de NL2SQL sin exposición pública, lo que permite a los usuarios consultar entornos híbridos de forma conversacional, al tiempo que se adhieren a los estándares de seguridad de Oracle, como el cifrado y los controles de acceso, para la analítica basada en IA compatible. Consulte Uso de enlaces en la nube para acceder a datos de solo lectura en una base de datos de IA autónoma para obtener más información.

Conversaciones

Las conversaciones en Select AI representan un intercambio interactivo entre el usuario y el sistema, lo que permite a los usuarios consultar o interactuar con la base de datos a través de una serie de peticiones de datos en lenguaje natural. Select AI incorpora conversaciones a corto plazo basadas en sesiones para generar respuestas adaptadas al contexto para la petición de datos actual en función de interacciones anteriores. Se incorporan hasta 10 peticiones de datos anteriores a la solicitud actual con conversaciones a corto plazo, lo que crea una petición de datos aumentada que se envía al LLM. Select AI admite el uso de conversaciones personalizables a largo plazo, lo que le permite utilizar Select AI con diferentes temas sin mezclar contexto, que se puede configurar mediante API de conversación desde el paquete DBMS_CLOUD_AI. Consulte Seleccionar conversaciones de IA.

Credenciales de Base de Datos

Las credenciales de base de datos son credenciales de autenticación que se utilizan para acceder e interactuar con las bases de datos. Normalmente consisten en un nombre de usuario y una contraseña, a veces complementados por factores de autenticación adicionales como tokens de seguridad. Estas credenciales se utilizan para establecer una conexión segura entre una aplicación o un usuario y una base de datos, de modo que solo las personas o los sistemas autorizados puedan acceder y manipular los datos almacenados en la base de datos.

Enlace de Base de Datos

Un enlace de base de datos conecta una base de datos Oracle a bases de datos remotas, lo que permite un acceso transparente a los datos externos como si fueran locales. En Select AI, los enlaces de base de datos se integran con Autonomous AI Database u Oracle AI Database local para ampliar las capacidades de NL2SQL a orígenes federados, lo que admite consultas en lenguaje natural que abarcan entornos locales u otros entornos en la nube de forma segura. Consulte CREATE DATABASE LINK y Use DATABASE Links with Autonomous AI DATABASE para obtener más información.

Modelo de incrustación

Modelo de IA que convierte datos de entrada en incrustaciones vectoriales para capturar relaciones semánticas, a menudo utilizadas en tareas como comprensión del lenguaje y reconocimiento de imágenes. Select AI utiliza modelos de incrustación para calcular incrustaciones para sus documentos, tablas y texto de consulta. Estas integraciones potencian la búsqueda semántica, los flujos de trabajo de RAG, la puntuación de similitud y la clasificación de relevancia dentro de la base de datos de IA autónoma.

Alucinación en LLM

La alucinación en el contexto de los grandes modelos de lenguaje se refiere a un fenómeno en el que el modelo genera texto que es incorrecto, sin sentido o no relacionado con la petición de datos de entrada. A pesar de ser el resultado del intento del modelo de generar texto coherente, estas respuestas pueden contener información que es fabricada, engañosa o puramente imaginativa. La alucinación puede ocurrir debido a sesgos en los datos de entrenamiento, falta de comprensión adecuada del contexto o limitaciones en el proceso de entrenamiento del modelo.

IAM

Oracle Cloud Infrastructure Identity and Access Management (IAM) le permite controlar quién tiene acceso a sus recursos en la nube. Puede controlar qué tipo de acceso tiene un grupo de usuarios y a qué recursos específicos. Para obtener más información, consulte Visión general de Identity and Access Management.

Refinación iterativa

El refinamiento iterativo es un proceso de mejorar gradualmente una solución o un modelo a través de ciclos repetidos de ajustes basados en la retroalimentación o evaluación. Comienza con una aproximación inicial, la refina paso a paso y continúa hasta que se logra la precisión o el resultado deseado. Cada iteración se basa en la anterior, incorporando correcciones u optimizaciones para acercarse al objetivo.

En la generación de resúmenes de texto, la acotación iterativa puede ser útil para procesar archivos o documentos grandes. El proceso divide el texto en fragmentos de tamaño manejable, por ejemplo, que se ajustan a los límites de token de un LLM, genera un resumen para un fragmento y, a continuación, mejora el resumen mediante la incorporación secuencial de los siguientes fragmentos.

Casos de uso para la acotación iterativa:

  • Se adapta mejor a situaciones donde la precisión contextual y la coherencia son críticas, como cuando se resumen textos complejos o altamente interconectados donde cada parte se basa en el anterior.
  • Ideal para tareas de menor escala donde el procesamiento secuencial es aceptable.

Consulte Técnicas de resumen.

Modelo de Lenguaje Grande (LLM)

Un modelo de lenguaje grande (LLM) se refiere a un tipo avanzado de modelo de inteligencia artificial que se entrena en cantidades masivas de datos de texto para admitir una serie de casos de uso en función de sus datos de entrenamiento. Esto incluye comprender y generar lenguaje similar al humano, así como consultas de código de software y bases de datos. Estos modelos son capaces de realizar una amplia gama de tareas de procesamiento de lenguaje natural, incluida la generación de texto, la traducción, el resumen, la respuesta a preguntas, el análisis de sentimientos y más. Los LLM suelen basarse en sofisticados modelos de redes neuronales de aprendizaje profundo que aprenden patrones, contexto y semántica a partir de los datos de entrada, lo que les permite generar texto coherente y contextualmente relevante.

MapReduce

En general, el modelo de programación MapReduce permite procesar datos de gran volumen dividiendo las tareas en dos fases: Map y Reduce.
  • Asignación: procesa los datos de entrada y los transforma en pares clave-valor.
  • Reducir: agrega y resume los datos asignados según las claves. MapReduce realiza el procesamiento paralelo de grandes juegos de datos.

En el caso de Select AI Summarize, MapReduce divide el texto en varios fragmentos y los procesa en paralelo e independientemente, generando resúmenes individuales para cada fragmento. A continuación, estos resúmenes se combinan para formar un resumen global coherente.

Los casos de uso para la asignación reducen:

  • Ideal para tareas paralelas a gran escala donde la velocidad y la escalabilidad son prioridades, como resumir conjuntos de datos o documentos muy grandes.
  • Ideal para situaciones en las que la independencia de fragmentos es aceptable y los resúmenes se pueden agregar más tarde.

Consulte Técnicas de resumen.

Metadatos

Los metadatos son datos que describen los datos. En el caso de Select AI, los metadatos son metadatos de base de datos, que hacen referencia a los datos que describen la estructura, la organización y las propiedades de las tablas y vistas de base de datos.

Para las tablas y vistas de la base de datos, los metadatos incluyen nombres y tipos de columnas, restricciones y claves, definiciones de vistas, relaciones, linaje, indicadores de calidad y frescura, clasificaciones de seguridad y políticas de acceso. Los metadatos bien gestionados permiten la capacidad de detección, el uso correcto, el ajuste del rendimiento y la conformidad. Seleccione AI aumenta las peticiones de datos NL2SQL con metadatos de tabla que incluyen la definición de tabla (nombre de tabla, nombres de columnas y sus tipos de dato), y, opcionalmente, comentarios, anotaciones y restricciones de tabla y columna.

Clonación de metadatos

Una clonación de metadatos o una clonación de base de datos de IA autónoma crea una copia de los metadatos que definen la base de datos o el esquema, que contiene solo la estructura, no los datos reales. Esta clonación incluye tablas, índices, vistas, estadísticas, procedimientos y disparadores sin filas de datos. Los desarrolladores, probadores o aquellos que crean plantillas de base de datos encuentran esto útil. Para obtener más información, consulte Clonación, movimiento o cambio de versión de una instancia de base de datos de IA autónoma.

Enriquecimiento de metadatos

Práctica de aumentar los esquemas de la base de datos con descripciones, comentarios y anotaciones de alta calidad para que un LLM pueda comprender mejor la intención de las tablas y columnas, aclarar el significado empresarial y generar SQL más preciso. Convierte los nombres de tablas o columnas con hardware dedicado en activos bien documentados con intenciones, relaciones y restricciones claras.

Información del candidato para incluir:

  • Descripciones de tablas y columnas: finalidad, definiciones de negocio, unidades y rangos de valores permitidos
  • Claves y relaciones: claves primarias/extranjeras, rutas de acceso de unión
  • Semántica de datos: granularidad de tiempo, dimensiones que cambian lentamente, reglas de desduplicación
  • Restricciones y calidad: nulidad, unicidad, reglas de validación, frescura de datos
  • Sinónimos y alias: términos de negocio comunes que se asignan a nombres técnicos
  • Ejemplos y patrones: valores de ejemplo, filtros comunes o agregaciones

Consulte Visión general del enriquecimiento de IA para obtener más información sobre la adición de dichos metadatos mediante Oracle SQL Developer for VS Code a través de Visual Studio Code.

Petición de datos de lenguaje natural

Una petición de datos en lenguaje natural consiste en instrucciones, preguntas o declaraciones de entrada expresadas en el lenguaje humano cotidiano (como el inglés) que guían la respuesta de un LLM. En lugar de requerir código o sintaxis especializada, los usuarios interactúan con el LLM escribiendo oraciones o frases que describen su intención, solicitan información o especifican una tarea.

Por ejemplo:

  • "¿Cuáles son los ingresos en el último trimestre de cada región corporativa?"
  • "¿Cuál es nuestra política corporativa interna sobre el permiso parental?"
  • "Resume este artículo".
  • "Escribe un correo electrónico a un cliente que se disculpe por un envío retrasado".
  • "¿Cuáles son las diferencias clave entre las bases de datos SQL y NoSQL?"

Estas peticiones aprovechan la comprensión del lenguaje humano por parte del modelo para generar resultados útiles y contextualmente relevantes. Las peticiones de datos en lenguaje natural son fundamentales para el uso del LLM, lo que hace que las capacidades avanzadas de IA sean accesibles para los usuarios sin experiencia técnica.

Lista de Control de Acceso a la Red (ACL)

Una lista de control de acceso de red es un conjunto de reglas o permisos que definen qué tráfico de red puede pasar a través de un dispositivo de red, como un enrutador, un firewall o una puerta de enlace. Las ACL se utilizan para controlar y filtrar el tráfico entrante y saliente en función de diversos criterios, como direcciones IP, números de puerto y protocolos. Desempeñan un papel crucial en la seguridad de la red al permitir a los administradores gestionar y restringir el tráfico de red para evitar el acceso no autorizado, posibles ataques y violaciones de datos.

NL2SQL

Natural Language to SQL (NL2SQL) convierte las preguntas de lenguaje natural en sentencias SQL mediante IA generativa.

Select AI utiliza activamente NL2SQL para interpretar las peticiones de datos de los usuarios y generar SQL correcto y ejecutable en su base de datos de IA autónoma u orígenes externos conectados. Esto permite a los usuarios de negocio hacer preguntas como "Mostrarme los ingresos del último trimestre por región" y recibir consultas y resultados SQL precisos sin experiencia en SQL.

NEXO

ONNX (Open Neural Network Exchange) es un formato estándar abierto para representar modelos de aprendizaje automático y aprendizaje profundo. ONNX estandariza la representación y el intercambio de modelos de aprendizaje automático entre marcos, lo que permite una implementación e interoperabilidad perfectas. Consulte ONNX para obtener más información.

Select AI puede utilizar modelos de IA generativa exportados en formato ONNX para ejecutar cargas de trabajo de IA directamente dentro de la base de datos de IA autónoma o a través de tiempos de ejecución soportados, lo que permite a las organizaciones aprovechar modelos preentrenados para tareas de procesamiento de lenguaje natural como la generación de consultas. Mediante el uso de modelos ONNX, mantiene la inferencia cerca de los datos, reduce el movimiento de datos y permite un procesamiento de modelos coherente en diferentes herramientas y entornos, lo que garantiza operaciones de IA conformes.

Tiempo de ejecución ONNX

ONNX Runtime ejecuta modelos con formato ONNX de manera eficiente en las plataformas de hardware, optimizando la inferencia para aplicaciones de IA en tiempo real.

Los usuarios de IA seleccionados pueden especificar modelos de formato ONNX en la base de datos en su perfil de IA para soportar RAG. La base de datos incorpora el tiempo de ejecución ONNX en Oracle AI Database 26ai y Autonomous AI Database. El uso de ONNX Runtime en la base de datos evita el envío de contenido a un motor externo para producir, por ejemplo, incrustaciones vectoriales. ONNX Runtime impulsa la evaluación en tiempo de ejecución de modelos basados en transformadores dentro de Autonomous AI Database, lo que facilita a los desarrolladores cargar modelos ONNX, acelerar las conversiones de lenguaje natural a SQL (NL2SQL), calcular incrustaciones, clasificar datos o ejecutar inferencia dentro del motor de la base de datos sin enviar datos al servicio externo, lo que mejora el rendimiento de las consultas y la seguridad, la latencia y gobernanza. Consulte Ejemplo: selección de IA con modelos de transformadores en la base de datos y ONNX Runtime para obtener más información.

Punto final privado

Punto de comunicación seguro y dedicado que permite el acceso restringido a servicios o recursos específicos. Un punto final privado establece una conexión segura y dedicada que restringe el acceso a servicios o recursos específicos, lo que garantiza una comunicación aislada. En Select AI, las organizaciones pueden configurar puntos finales privados en Oracle Cloud Infrastructure (OCI) para conectarse con LLM alojados de forma privada como Ollama o Llama.cpp en máquinas virtuales (VM), abordando las necesidades de seguridad mediante el procesamiento de cargas de trabajo de IA dentro de Oracle Virtual Cloud Network. Esta configuración incluye una subred pública con un servidor de salto para acceso controlado y una subred privada que aloja los modelos de base de datos de IA autónoma e IA, lo que evita la exposición a Internet y mantiene todos los componentes en conformidad con los requisitos de aislamiento empresarial. Consulte Acceso de punto final privado para seleccionar modelos de IA para obtener más información.

Generación aumentada de recuperación (RAG)

La generación aumentada de recuperación (RAG) es una técnica que implica recuperar información relevante para la consulta de un usuario y proporcionar esa información a un modelo de lenguaje grande (LLM) para mejorar las respuestas y reducir la alucinación.

Normalmente, RAG implica la búsqueda vectorial, pero más generalmente, incluye aumentar una petición de datos de contenido de base de datos (ya sea manual o automáticamente), como metadatos de esquema para la generación SQL o contenido de base de datos consultado explícitamente. Otras formas de aumento pueden incluir tecnologías como el análisis de gráficos y el aprendizaje automático tradicional.

Búsqueda de similitud semántica

La búsqueda de similitud semántica identifica y recupera puntos de datos que coinciden estrechamente con una consulta determinada mediante la comparación de vectores de funciones en un almacén de vectores.

Sidecar

La arquitectura sidecar permite que una base de datos actúe como repositorio de metadatos central para orígenes de datos locales y remotos, es decir, Oracle y no Oracle. Select AI utiliza esta arquitectura aprovechando los metadatos para crear una petición de datos aumentada que se envía al LLM elegido por el usuario, que luego genera una consulta SQL federada. Una ventaja clave del sidecar es que permite que los datos permanezcan en su ubicación original, eliminando la necesidad de duplicación de datos o procesos ETL complejos.

Admite el acceso federado a diversos sistemas externos, como BigQuery, Redshift, bases de datos multinube o locales, al unir de forma segura estos orígenes a Autonomous AI Database.

Umbral de similitud

Un umbral de similitud establece una puntuación mínima para clasificar dos elementos como relacionados, filtrando los resultados en función de su proximidad o distancia vectorial. En Select AI, el umbral de similitud ayuda a filtrar los resultados que están por debajo de un nivel requerido de cercanía semántica, lo que garantiza que solo se devuelvan fragmentos, filas o incrustaciones de documentos altamente relacionados.

Generación de datos sintéticos

En el contexto de Select AI, la generación de datos sintéticos es la capacidad de generar automáticamente datos artificiales que se ajusten a su esquema de base de datos, lo que le permite rellenar tablas para escenarios de desarrollo, prueba, entrenamiento o prueba de concepto sin utilizar datos confidenciales o de producción. Select AI proporciona la función PL/SQL DBMS_CLOUD_AI.GENERATE_SYNTHETIC_DATA para producir juegos de datos sintéticos. Consulte Generación de datos sintéticos para obtener más información.

Transformador

Tipo de arquitectura de modelo de aprendizaje profundo comúnmente utilizada para tareas de procesamiento de lenguaje natural, tales como generación de inserción de vector o generación y traducción de texto. En Select AI, los LLM basados en transformadores controlan la conversión de consultas de usuario en consultas SQL que se pueden ejecutar en la base de datos.

Vector

En el contexto de la búsqueda de similitud semántica, un vector es una representación matemática que captura el significado semántico de los puntos de datos, como palabras, documentos o imágenes, en un espacio multidimensional.

En el contexto de Select AI, los vectores soportan la recuperación aumentada al capturar el significado del contenido de texto para permitir una recuperación semántica rápida de la base de datos.

Vector Database

Base de datos que almacena incrustaciones vectoriales, que son representaciones matemáticas de puntos de datos utilizados en aplicaciones de IA para admitir una búsqueda eficiente de similitudes semánticas. Oracle Autonomous AI Database y Oracle AI Database sirven como base de datos vectorial con índices vectoriales optimizados.

En Select AI, el componente de base de datos vectorial (con tecnología de Oracle AI Vector Search) indexa las incrustaciones generadas a partir de datos empresariales. Esto permite que las consultas en lenguaje natural recuperen resultados semánticamente similares, mejora la relevancia para los flujos de trabajo de búsqueda y RAG basados en IA y proporciona una integración perfecta con los entornos de Oracle Cloud.

Distancia de vector

La distancia vectorial mide la similitud o disimilitud entre vectores de características mediante el cálculo de la distancia entre ellos en un espacio multidimensional.

Índice de vector

Un índice vectorial organiza y almacena vectores para permitir una búsqueda de similitud eficiente y la recuperación de datos relacionados.

Tienda de vectores

Un almacén de vectores incluye sistemas que almacenan, gestionan y permiten la búsqueda de similitud semántica con incrustaciones vectoriales. Esto incluye bases de datos vectoriales independientes y Oracle AI Database 26ai AI Vector Search.