Almacenes de vectores

Un almacén de vectores es un almacén de datos especializado que indexa y recupera datos por significado (similitud semántica) en lugar de coincidencias exactas de palabras clave.

Acerca de Vector Stores

Almacén de vectores
  • Qué almacena:Vectores (también denominados embeddings), que son representaciones numéricas del contenido, como documentos, pasajes, mensajes de chat, código o imágenes, además de metadatos (ID, registro de hora, origen, etc.).
  • Qué hace: admite una búsqueda de similitud rápida (y, a menudo, una búsqueda híbrida), para que pueda recuperar los datos más relevantes de los datos proporcionados.
Tienda de vectores en IA generativa
  • Generación aumentada por recuperación de poderes (RAG): embeba orígenes de conocimiento con un almacén de vectores, recupera los fragmentos más similares en el momento de la consulta y, a continuación, los proporciona al LLM como contexto con conexión a tierra.
  • Analiza las respuestas: mejora la relevancia de la información recuperada y reduce las posibilidades de utilizar información alucinada al poner en tierra las respuestas en el contenido empresarial recuperado.
Ejemplos de casos prácticos
  • Búsqueda de documentos relevantes que coincidan con las preguntas del usuario.
  • Impulsando la búsqueda contextual en bots conversacionales.
Flujo de trabajo de ejemplo
  1. Fragmente un PDF en párrafos.
  2. Crear un vector de incrustación para cada párrafo.
  3. Almacene vectores + texto de párrafo + metadatos en el almacén de vectores.
  4. Cuando un usuario hace una pregunta, incruste la pregunta y recupere los párrafos más cercanos para incluirlos como contexto para el modelo.

Configuración de cliente

from oci_openai import OciOpenAI, OciSessionAuth

cp_client = OciOpenAI(
            base_url="https://generativeai.<region-code>.oci.oraclecloud.com/20231130/openai/v1",
            auth=OciSessionAuth(profile_name="DEFAULT"),
            compartment_id="ocid1.compartment.oc1..aaaaaaaaexample",
        )