Knowledge Base in generativen KI-Agents erstellen

Erstellen Sie eine Wissensdatenbank im Service für generative KI-Agents.

  1. Wählen Sie auf der Listenseite Knowledge-Bases die Option Knowledge-Base erstellen aus. Wenn Sie Hilfe beim Suchen der Listenseite benötigen, finden Sie weitere Informationen unter Knowledge Bases auflisten.
  2. Geben Sie folgende Informationen ein:
    • Name: Ein Name, der mit einem Buchstaben oder Unterstrich beginnt, gefolgt von Buchstaben, Zahlen, Bindestrichen und Unterstrichen. Sie können zwischen 1 und 255 Zeichen lang sein.
    • Compartment: Das Compartment, in dem Sie die Wissensdatenbank speichern möchten
    • Beschreibung: Eine optionale Beschreibung
  3. Wählen Sie unter Datenspeichertyp eine der folgenden Optionen aus:
  4. Wenn Sie Object Storage ausgewählt haben, führen Sie die folgenden Aktionen aus:
    1. Wählen Sie unter Datenquellen die Option Datenquelle angeben aus, und geben Sie einen Namen und eine optionale Beschreibung für die Datenquelle ein.
    2. Wählen Sie den Bucket aus, der die Daten für die Wissensdatenbank enthält. Ändern Sie das Compartment, wenn sich der Bucket in einem anderen Compartment befindet.
      Informationen dazu, ob die Dateien in den Buckets die Anforderungen für generative KI-Agents erfüllen, finden Sie unter Datenanforderungen für Object Storage.
    3. Nachdem der Inhalt des Buckets aufgelistet wurde, führen Sie eine der folgenden Aktionen aus, um die zu verwendenden Dateien auszuwählen:
      • Um alle Artikel in den Bucket aufzunehmen, wählen Sie Alle im Bucket auswählen aus.
      • Wählen Sie die einzuschließenden Dateien und Ordner aus.
      • Blenden Sie Objektpräfixe manuell hinzufügen ein, um die Präfixe für die aufzunehmenden Dateien und Ordner einzugeben.
    4. (Optional) Wählen Sie Taggingoptionen anzeigen aus, und fügen Sie der Datenquelle mindestens ein Tag hinzu. Wenn Sie über Berechtigungen zum Erstellen von Ressourcen verfügen, sind Sie berechtigt, die zugehörigen Tags zu aktualisieren. Wenn Sie Hilfe benötigen, finden Sie weitere Informationen unter Tags und Tag-Namespace-Konzepte.
    5. Klicken Sie auf Erstellen.
    6. (Optional) Wählen Sie Aufnahmejob für die oben genannten Datenquellen automatisch starten aus.
      Wenn Sie diese Option nicht auswählen, müssen Sie die Daten später aufnehmen, damit der Agent sie verwenden kann.
    Hinweis

    Pro Wissensdatenbank ist nur eine Datenquelle zulässig. Siehe Limits und Einschränkungen für generative KI-Agents.
  5. Wenn Sie OCI OpenSearch als Datenquellentyp ausgewählt haben, geben Sie die folgenden Informationen ein. Richtlinien finden Sie unter RAG Tool OCI Search with OpenSearch Guidelines for Generative AI Agents.
    • OpenSearch-Cluster: Wählen Sie das Cluster aus, das die Daten für die Wissensdatenbank enthält. Ändern Sie das Compartment, wenn sich das Cluster in einem anderen Compartment befindet.
    • OpenSearch-Index: Geben Sie die Details des OpenSearch-Index ein. Siehe RAG-Tool OCI Search with OpenSearch Guidelines for Generative AI Agents.
    • Secret-Details: Wählen Sie eine der folgenden Optionen aus:
      • Grundlegendes Authentifizierungs-Secret: Wählen Sie für diese Option das Vault Secret für die OCI-Suche mit OpenSearch aus.
      • IDCS-Secret: Geben Sie für diese Option die folgenden Informationen für die vertrauliche IDCS-Anwendung ein, die Sie für den Agent verwenden möchten:
        • Identitätsdomain: Wählen Sie die Identitätsdomain aus, mit der auf das Cluster zugegriffen werden soll. Ändern Sie das Compartment, wenn sich die Identitätsdomain in einem anderen Compartment befindet.
        • Client-ID: Geben Sie die ID für die IDCS-Clientanwendung des Clusters OpenSearch ein.
        • Client Secret Vault: Wählen Sie den Vault aus, der das Client Secret enthält. Ändern Sie das Compartment, wenn sich das Secret in einem anderen Compartment befindet.
        • Geltungsbereichs-URL: Geben Sie die URL ein, die der API-Endpunkt für die Ressourcenserveranwendung der Identitätsdomain ist und den Agent-Geltungsbereich enthält. Beispiel: Für den Geltungsbereich genaiagent lautet die URL https://*.agent.aiservice.us-chicago-1.oci.oraclecloud.com/genaiagent.

      Weitere Informationen zu OpenSearch-Clustern finden Sie auf der Detailseite eines OpenSearch-Clusters.

  6. Wenn Sie Oracle AI Vector Search als Datenquellentyp ausgewählt haben, wählen Sie die Datenbanktoolverbindung aus, und wählen Sie Verbindung testen aus, um eine erfolgreiche Verbindung zur Datenbank zu bestätigen. Wenn dies erfolgreich ist, werden der Name und die Version der Datenbank angezeigt. Geben Sie dann die Vektorsuchfunktion oder -prozedur für die Verbindung mit dem Datenbanktool ein.
    Hinweis

    Weitere Informationen zur Funktion oder Prozedur finden Sie unter Oracle Database Guidelines oder RAG Tool Heatwave MySQL Guidelines.
  7. (Optional) Wählen Sie Taggingoptionen anzeigen aus, und fügen Sie der Wissensdatenbank mindestens ein Tag hinzu. Wenn Sie über Berechtigungen zum Erstellen von Ressourcen verfügen, sind Sie berechtigt, die zugehörigen Tags zu aktualisieren. Wenn Sie Hilfe benötigen, finden Sie weitere Informationen unter Tags und Tag-Namespace-Konzepte.
  8. Klicken Sie auf Erstellen.

    Die Erstellung der Wissensdatenbank dauert eine Weile. Wenn Sie nach der Erstellung der Wissensdatenbank keine Daten für eine Object Storage-Datenquelle aufgenommen haben, führen Sie die Schritte unter Datenquelldaten in Generative AI Agents aufnehmen aus.

    Hinweis

    Nachdem ein Datenaufnahmejob für eine Object Storage-Datenquelle ausgeführt wurde, prüfen Sie die Status- und Statuslogs, um zu bestätigen, dass alle aktualisierten Dateien erfolgreich aufgenommen wurden.

    Die Bedeutung eines Aufnahmejobstatus und die auszuführende Aktion bei einem Fehlerproblem finden Sie unter Datenquelldaten aufnehmen, Schritt 6.

    Wenn der Aufnahmejob nicht erfolgreich war (z.B. weil eine Datei zu groß war), beheben Sie das Problem, und starten Sie den Job neu.

    Wenn Sie einen zuvor ausgeführten Aufnahmejob neu starten, erkennt die Pipeline Dateien, die zuvor erfolgreich aufgenommen wurden, und überspringt sie. Die Pipeline nimmt nur Dateien auf, die vorher nicht erfolgreich waren und seitdem aktualisiert wurden. Beispiel: Sie müssen 20 Dateien aufnehmen, und der anfängliche Joblauf führt zu 2 nicht erfolgreichen Dateien. Wenn Sie den Job neu starten, erkennt die Pipeline, dass bereits 18 Dateien erfolgreich aufgenommen wurden, und ignoriert sie. Es nimmt nur die 2 Dateien auf, die früher nicht erfolgreich waren und seitdem aktualisiert wurden.