Knowledge Base in generativen KI-Agents erstellen
Erstellen Sie eine Wissensdatenbank im Service für generative KI-Agents.
- Wählen Sie auf der Listenseite Knowledge-Bases die Option Knowledge-Base erstellen aus. Wenn Sie Hilfe beim Suchen der Listenseite benötigen, finden Sie weitere Informationen unter Knowledge Bases auflisten.
-
Geben Sie folgende Informationen ein:
- Name: Ein Name, der mit einem Buchstaben oder Unterstrich beginnt, gefolgt von Buchstaben, Zahlen, Bindestrichen und Unterstrichen. Sie können zwischen 1 und 255 Zeichen lang sein.
- Compartment: Das Compartment, in dem Sie die Wissensdatenbank speichern möchten
- Beschreibung: Eine optionale Beschreibung
-
Wählen Sie unter Datenspeichertyp eine der folgenden Optionen aus:
- Objektspeicher. Siehe RAG Tool Object Storage - Richtlinien. Gehen Sie zu Schritt 4
- OCI OpenSearch:
Sie müssen Dokumente in Dateien mit jeweils weniger als 512 Token chunked haben, und Sie müssen diese Dokumente in OpenSearch aufgenommen und indexiert haben, bevor Sie fortfahren. Siehe RAG-Tool OCI Search with OpenSearch Guidelines. Schritt 5.
- Datenbank-KI-Vektorsuche:
-
Für Daten in Oracle Database 23ai. Informationen zum erforderlichen Setup finden Sie unter Oracle Database-Richtlinien für RAG Tool. Gehen Sie zu Schritt 6
-
Für Daten in HeatWave MySQL. Informationen zum erforderlichen Setup finden Sie unter RAG Tool Heatwave MySQL Guidelines. Gehen Sie zu Schritt 6
-
-
Wenn Sie Object Storage ausgewählt haben, führen Sie die folgenden Aktionen aus:
- Wählen Sie unter Datenquellen die Option Datenquelle angeben aus, und geben Sie einen Namen und eine optionale Beschreibung für die Datenquelle ein.
-
Wählen Sie den Bucket aus, der die Daten für die Wissensdatenbank enthält. Ändern Sie das Compartment, wenn sich der Bucket in einem anderen Compartment befindet.
Informationen dazu, ob die Dateien in den Buckets die Anforderungen für generative KI-Agents erfüllen, finden Sie unter Datenanforderungen für Object Storage.
-
Nachdem der Inhalt des Buckets aufgelistet wurde, führen Sie eine der folgenden Aktionen aus, um die zu verwendenden Dateien auszuwählen:
- Um alle Artikel in den Bucket aufzunehmen, wählen Sie Alle im Bucket auswählen aus.
- Wählen Sie die einzuschließenden Dateien und Ordner aus.
- Blenden Sie Objektpräfixe manuell hinzufügen ein, um die Präfixe für die aufzunehmenden Dateien und Ordner einzugeben.
- (Optional) Wählen Sie Taggingoptionen anzeigen aus, und fügen Sie der Datenquelle mindestens ein Tag hinzu. Wenn Sie über Berechtigungen zum Erstellen von Ressourcen verfügen, sind Sie berechtigt, die zugehörigen Tags zu aktualisieren. Wenn Sie Hilfe benötigen, finden Sie weitere Informationen unter Tags und Tag-Namespace-Konzepte.
- Klicken Sie auf Erstellen.
- (Optional) Wählen Sie Aufnahmejob für die oben genannten Datenquellen automatisch starten aus.
Wenn Sie diese Option nicht auswählen, müssen Sie die Daten später aufnehmen, damit der Agent sie verwenden kann.
Hinweis
Pro Wissensdatenbank ist nur eine Datenquelle zulässig. Siehe Limits und Einschränkungen für generative KI-Agents. -
Wenn Sie OCI OpenSearch als Datenquellentyp ausgewählt haben, geben Sie die folgenden Informationen ein. Richtlinien finden Sie unter RAG Tool OCI Search with OpenSearch Guidelines for Generative AI Agents.
- OpenSearch-Cluster: Wählen Sie das Cluster aus, das die Daten für die Wissensdatenbank enthält. Ändern Sie das Compartment, wenn sich das Cluster in einem anderen Compartment befindet.
- OpenSearch-Index: Geben Sie die Details des OpenSearch-Index ein. Siehe RAG-Tool OCI Search with OpenSearch Guidelines for Generative AI Agents.
- Secret-Details: Wählen Sie eine der folgenden Optionen aus:
- Grundlegendes Authentifizierungs-Secret: Wählen Sie für diese Option das Vault Secret für die OCI-Suche mit OpenSearch aus.
- IDCS-Secret: Geben Sie für diese Option die folgenden Informationen für die vertrauliche IDCS-Anwendung ein, die Sie für den Agent verwenden möchten:
- Identitätsdomain: Wählen Sie die Identitätsdomain aus, mit der auf das Cluster zugegriffen werden soll. Ändern Sie das Compartment, wenn sich die Identitätsdomain in einem anderen Compartment befindet.
- Client-ID: Geben Sie die ID für die IDCS-Clientanwendung des Clusters OpenSearch ein.
- Client Secret Vault: Wählen Sie den Vault aus, der das Client Secret enthält. Ändern Sie das Compartment, wenn sich das Secret in einem anderen Compartment befindet.
- Geltungsbereichs-URL: Geben Sie die URL ein, die der API-Endpunkt für die Ressourcenserveranwendung der Identitätsdomain ist und den Agent-Geltungsbereich enthält. Beispiel: Für den Geltungsbereich
genaiagent
lautet die URLhttps://*.agent.aiservice.us-chicago-1.oci.oraclecloud.com/genaiagent
.
Weitere Informationen zu OpenSearch-Clustern finden Sie auf der Detailseite eines OpenSearch-Clusters.
-
Wenn Sie Oracle AI Vector Search als Datenquellentyp ausgewählt haben, wählen Sie die Datenbanktoolverbindung aus, und wählen Sie Verbindung testen aus, um eine erfolgreiche Verbindung zur Datenbank zu bestätigen. Wenn dies erfolgreich ist, werden der Name und die Version der Datenbank angezeigt. Geben Sie dann die Vektorsuchfunktion oder -prozedur für die Verbindung mit dem Datenbanktool ein.
Hinweis
Weitere Informationen zur Funktion oder Prozedur finden Sie unter Oracle Database Guidelines oder RAG Tool Heatwave MySQL Guidelines. - (Optional) Wählen Sie Taggingoptionen anzeigen aus, und fügen Sie der Wissensdatenbank mindestens ein Tag hinzu. Wenn Sie über Berechtigungen zum Erstellen von Ressourcen verfügen, sind Sie berechtigt, die zugehörigen Tags zu aktualisieren. Wenn Sie Hilfe benötigen, finden Sie weitere Informationen unter Tags und Tag-Namespace-Konzepte.
-
Klicken Sie auf Erstellen.
Die Erstellung der Wissensdatenbank dauert eine Weile. Wenn Sie nach der Erstellung der Wissensdatenbank keine Daten für eine Object Storage-Datenquelle aufgenommen haben, führen Sie die Schritte unter Datenquelldaten in Generative AI Agents aufnehmen aus.
Hinweis
Nachdem ein Datenaufnahmejob für eine Object Storage-Datenquelle ausgeführt wurde, prüfen Sie die Status- und Statuslogs, um zu bestätigen, dass alle aktualisierten Dateien erfolgreich aufgenommen wurden.
Die Bedeutung eines Aufnahmejobstatus und die auszuführende Aktion bei einem Fehlerproblem finden Sie unter Datenquelldaten aufnehmen, Schritt 6.
Wenn der Aufnahmejob nicht erfolgreich war (z.B. weil eine Datei zu groß war), beheben Sie das Problem, und starten Sie den Job neu.
Wenn Sie einen zuvor ausgeführten Aufnahmejob neu starten, erkennt die Pipeline Dateien, die zuvor erfolgreich aufgenommen wurden, und überspringt sie. Die Pipeline nimmt nur Dateien auf, die vorher nicht erfolgreich waren und seitdem aktualisiert wurden. Beispiel: Sie müssen 20 Dateien aufnehmen, und der anfängliche Joblauf führt zu 2 nicht erfolgreichen Dateien. Wenn Sie den Job neu starten, erkennt die Pipeline, dass bereits 18 Dateien erfolgreich aufgenommen wurden, und ignoriert sie. Es nimmt nur die 2 Dateien auf, die früher nicht erfolgreich waren und seitdem aktualisiert wurden.