Vektorspeicher
Ein Vektorspeicher ist ein spezieller Datenspeicher, der Daten nach Bedeutung (semantische Ähnlichkeit) und nicht nach genauen Stichwortübereinstimmungen indiziert und abruft.
Über Vector Stores
- Vektorspeicher
-
- Speicherung:Vektoren (auch als Einbettungen bezeichnet), die numerische Darstellungen von Inhalten wie Dokumenten, Passagen, Chatnachrichten, Code oder Bildern sowie Metadaten (ID, Zeitstempel, Quelle usw.) darstellen.
- Was es tut: Unterstützt eine schnelle Ähnlichkeitssuche (und oft eine hybride Suche), damit Sie die relevantesten Informationen aus den bereitgestellten Daten abrufen können.
- Vektorspeicher in generativer KI
-
- Powers Retrieval-Augmented Generation (RAG): Integrieren Sie Wissensquellen in einen Vektorspeicher, rufen Sie die ähnlichsten Chunks zur Abfragezeit ab, und stellen Sie sie dann dem LLM als geerdeten Kontext zur Verfügung.
- Rundet die Antworten: Verbessert die Relevanz der abgerufenen Informationen und verringert die Wahrscheinlichkeit, halluzinierte Informationen zu verwenden, indem Antworten in abgerufenen Unternehmensinhalten geerdet werden.
- Beispielanwendungsfälle
-
- Suche nach relevanten Dokumenten, die den Fragen eines Benutzers entsprechen.
- Unterstützung der kontextbezogenen Suche in Chatbots.
- Beispielworkflow
-
- Ein PDF in Absätze zerlegen.
- Erstellen Sie einen Einbettungsvektor für jeden Absatz.
- Speichern Sie Vektoren + Absatztext + Metadaten im Vektorspeicher.
- Wenn ein Benutzer eine Frage stellt, betten Sie die Frage ein, und rufen Sie die nächsten Absätze ab, die als Kontext für das Modell aufgenommen werden sollen.
Clientsetup
from oci_openai import OciOpenAI, OciSessionAuth
cp_client = OciOpenAI(
base_url="https://generativeai.<region-code>.oci.oraclecloud.com/20231130/openai/v1",
auth=OciSessionAuth(profile_name="DEFAULT"),
compartment_id="ocid1.compartment.oc1..aaaaaaaaexample",
)