Vektorspeicher

Ein Vektorspeicher ist ein spezieller Datenspeicher, der Daten nach Bedeutung (semantische Ähnlichkeit) und nicht nach genauen Stichwortübereinstimmungen indiziert und abruft.

Über Vector Stores

Vektorspeicher
  • Speicherung:Vektoren (auch als Einbettungen bezeichnet), die numerische Darstellungen von Inhalten wie Dokumenten, Passagen, Chatnachrichten, Code oder Bildern sowie Metadaten (ID, Zeitstempel, Quelle usw.) darstellen.
  • Was es tut: Unterstützt eine schnelle Ähnlichkeitssuche (und oft eine hybride Suche), damit Sie die relevantesten Informationen aus den bereitgestellten Daten abrufen können.
Vektorspeicher in generativer KI
  • Powers Retrieval-Augmented Generation (RAG): Integrieren Sie Wissensquellen in einen Vektorspeicher, rufen Sie die ähnlichsten Chunks zur Abfragezeit ab, und stellen Sie sie dann dem LLM als geerdeten Kontext zur Verfügung.
  • Rundet die Antworten: Verbessert die Relevanz der abgerufenen Informationen und verringert die Wahrscheinlichkeit, halluzinierte Informationen zu verwenden, indem Antworten in abgerufenen Unternehmensinhalten geerdet werden.
Beispielanwendungsfälle
  • Suche nach relevanten Dokumenten, die den Fragen eines Benutzers entsprechen.
  • Unterstützung der kontextbezogenen Suche in Chatbots.
Beispielworkflow
  1. Ein PDF in Absätze zerlegen.
  2. Erstellen Sie einen Einbettungsvektor für jeden Absatz.
  3. Speichern Sie Vektoren + Absatztext + Metadaten im Vektorspeicher.
  4. Wenn ein Benutzer eine Frage stellt, betten Sie die Frage ein, und rufen Sie die nächsten Absätze ab, die als Kontext für das Modell aufgenommen werden sollen.

Clientsetup

from oci_openai import OciOpenAI, OciSessionAuth

cp_client = OciOpenAI(
            base_url="https://generativeai.<region-code>.oci.oraclecloud.com/20231130/openai/v1",
            auth=OciSessionAuth(profile_name="DEFAULT"),
            compartment_id="ocid1.compartment.oc1..aaaaaaaaexample",
        )