Knowledge Base in generativen KI-Agents erstellen
Erstellen Sie eine Wissensdatenbank im Service für generative KI-Agents.
- Wählen Sie auf der Listenseite Knowledge-Bases die Option Knowledge-Base erstellen aus. Wenn Sie Hilfe beim Suchen der Listenseite benötigen, finden Sie weitere Informationen unter Knowledge Bases auflisten.
-
Geben Sie folgende Informationen ein:
- Name: Ein Name, der mit einem Buchstaben oder Unterstrich beginnt, gefolgt von Buchstaben, Zahlen, Bindestrichen und Unterstrichen. Sie können zwischen 1 und 255 Zeichen lang sein.
- Compartment: Das Compartment, in dem Sie die Wissensdatenbank speichern möchten
- Beschreibung: Eine optionale Beschreibung
-
Wählen Sie unter Datenspeichertyp eine der folgenden Optionen aus:
- Objektspeicher. Siehe RAG Tool Object Storage - Richtlinien.
- OCI OpenSearch:
Sie müssen Dokumente in Dateien mit jeweils weniger als 512 Token chunked haben, und Sie müssen diese Dokumente in OpenSearch aufgenommen und indexiert haben, bevor Sie fortfahren. Siehe RAG-Tool OCI Search with OpenSearch Guidelines.
- Datenbank-KI-Vektorsuche:
-
Für Daten in Oracle Database 23ai. Informationen zum erforderlichen Setup finden Sie unter Oracle Database-Richtlinien für RAG Tool.
-
Für Daten in HeatWave MySQL. Informationen zum erforderlichen Setup finden Sie unter RAG Tool Heatwave MySQL Guidelines.
-
-
Wenn Sie Object Storage ausgewählt haben, führen Sie die folgenden Aktionen aus:
- Wählen Sie unter Datenquellen die Option Datenquelle angeben aus, und geben Sie einen Namen und eine optionale Beschreibung für die Datenquelle ein.
-
Wählen Sie den Bucket aus, der die Daten für die Wissensdatenbank enthält. Ändern Sie das Compartment, wenn sich der Bucket in einem anderen Compartment befindet.
Informationen dazu, ob die Dateien in den Buckets die Anforderungen für Generative AI Agents erfüllen, finden Sie unter RAG Tool Object Storage-Richtlinien.
-
Nachdem der Inhalt des Buckets aufgelistet wurde, führen Sie eine der folgenden Aktionen aus, um die zu verwendenden Dateien auszuwählen:
- Um alle Elemente in den Bucket einzuschließen, klicken Sie auf Alle im Bucket auswählen.
- Wählen Sie die einzuschließenden Dateien und Ordner aus.
- Blenden Sie Objektpräfixe manuell hinzufügen ein, um die Präfixe für die aufzunehmenden Dateien und Ordner einzugeben.
- (Optional) Wählen Sie Aufnahmejob für die oben genannten Datenquellen automatisch starten aus.
Wenn Sie diese Option nicht auswählen, müssen Sie die Daten später aufnehmen, damit der Agent sie verwenden kann.
Hinweis
Pro Wissensdatenbank ist nur eine Datenquelle zulässig. Siehe Limits und Einschränkungen für generative KI-Agents. -
Wenn Sie OCI OpenSearch als Datenquellentyp ausgewählt haben, geben Sie die folgenden Informationen ein. Richtlinien finden Sie unter RAG Tool OCI Search with OpenSearch Guidelines.
-
Wählen Sie unter OpenSearch cluster das Cluster aus, das die Daten für die Wissensdatenbank enthält. Ändern Sie das Compartment, wenn sich das Cluster in einem anderen Compartment befindet.
Weitere Informationen zu OpenSearch-Clustern finden Sie auf der Detailseite eines OpenSearch-Clusters.
- Geben Sie unter OpenSearch index die Details des Index OpenSearch ein. Siehe RAG-Tool OCI Search with OpenSearch Guidelines.
-
Wählen Sie unter Secret-Details eine der folgenden Optionen:
- Grundlegendes Authentifizierungs-Secret: Wählen Sie für diese Option das Vault Secret für die OCI-Suche mit OpenSearch aus.
- IDCS-Secret: Geben Sie für diese Option die folgenden Informationen für die vertrauliche IDCS-Anwendung ein, die Sie für den Agent verwenden möchten:
- Identitätsdomain: Wählen Sie die Identitätsdomain aus, mit der auf das Cluster zugegriffen werden soll. Ändern Sie das Compartment, wenn sich die Identitätsdomain in einem anderen Compartment befindet.
- Client-ID: Geben Sie die ID für die IDCS-Clientanwendung des Clusters OpenSearch ein.
- Client Secret Vault: Wählen Sie den Vault aus, der das Client Secret enthält. Ändern Sie das Compartment, wenn sich das Secret in einem anderen Compartment befindet.
- Geltungsbereichs-URL: Geben Sie die URL ein, die der API-Endpunkt für die Ressourcenserveranwendung der Identitätsdomain ist und den Agent-Geltungsbereich enthält. Beispiel: Für den Geltungsbereich
genaiagent
lautet die URLhttps://*.agent.aiservice.us-chicago-1.oci.oraclecloud.com/genaiagent
.
-
Wählen Sie unter OpenSearch cluster das Cluster aus, das die Daten für die Wissensdatenbank enthält. Ändern Sie das Compartment, wenn sich das Cluster in einem anderen Compartment befindet.
-
Wenn Sie Oracle AI Vector Search als Datenquellentyp ausgewählt haben, wählen Sie die Datenbanktoolverbindung aus, und wählen Sie Verbindung testen aus, um eine erfolgreiche Verbindung zur Datenbank zu bestätigen. Wenn dies erfolgreich ist, werden der Name und die Version der Datenbank angezeigt. Geben Sie dann die Vektorsuchfunktion oder -prozedur für die Verbindung mit dem Datenbanktool ein.
Hinweis
Weitere Informationen zur Funktion oder Prozedur finden Sie unter Oracle Database Guidelines oder RAG Tool Heatwave MySQL Guidelines. - (Optional) Wählen Sie Taggingoptionen anzeigen aus, und fügen Sie dieser Ressource ein oder mehrere Tags hinzu. Wenn Sie über Berechtigungen zum Erstellen von Ressourcen verfügt, sind Sie auch berechtigt: Freiformtags auf diese Ressource anwenden. Um ein definiertes Tag anzuwenden, müssen Sie über die Berechtigungen zum Verwenden des Tag-Namespace verfügen. Weitere Informationen zum Tagging finden Sie unter Ressourcentags. Wenn Sie nicht sicher sind, ob Tags angewendet werden sollen, überspringen Sie diese Option, oder fragen Sie einen Administrator. Sie können Tags später anwenden.
-
Klicken Sie auf Erstellen.
Die Erstellung der Wissensdatenbank dauert eine Weile. Wenn Sie nach der Erstellung der Wissensdatenbank keine Daten für eine Object Storage-Datenquelle aufgenommen haben, führen Sie die Schritte unter Datenquelldaten in Generative AI Agents aufnehmen aus.
Hinweis
Nachdem ein Datenaufnahmejob für eine Object Storage-Datenquelle ausgeführt wurde, prüfen Sie die Status- und Statuslogs, um zu bestätigen, dass alle aktualisierten Dateien erfolgreich aufgenommen wurden.
Die Bedeutung eines Aufnahmejobstatus und die auszuführende Aktion bei einem Fehlerproblem finden Sie unter Datenquelldaten aufnehmen, Schritt 6.
Wenn der Aufnahmejob nicht erfolgreich war (z.B. weil eine Datei zu groß war), beheben Sie das Problem, und starten Sie den Job neu.
Wenn Sie einen zuvor ausgeführten Aufnahmejob neu starten, erkennt die Pipeline Dateien, die zuvor erfolgreich aufgenommen wurden, und überspringt sie. Die Pipeline nimmt nur Dateien auf, die vorher nicht erfolgreich waren und seitdem aktualisiert wurden. Beispiel: Sie müssen 20 Dateien aufnehmen, und der anfängliche Joblauf führt zu 2 nicht erfolgreichen Dateien. Wenn Sie den Job neu starten, erkennt die Pipeline, dass bereits 18 Dateien erfolgreich aufgenommen wurden, und ignoriert sie. Es nimmt nur die 2 Dateien auf, die früher nicht erfolgreich waren und seitdem aktualisiert wurden.