RAG-Tool Object Storage - Richtlinien für generative KI-Agents

In den folgenden Abschnitten wird beschrieben, wie Sie Object Storage-Daten für RAG-Tools in Generative AI Agents vorbereiten.

Allgemeine Richtlinien

Befolgen Sie die folgenden Richtlinien, um Daten für Datenquellen von Generative AI Agents vorzubereiten, bevor Sie sie in Object Storage hochladen:

  • Datenquellen: Daten für generative AI-Agents müssen als Dateien in einen Objektspeicher-Bucket hochgeladen werden.
  • Anzahl Buckets: Pro Datenquelle ist nur ein Bucket zulässig.
  • Unterstützte Dateitypen: Die Dateien PDF, txt, JSON, HTML und Markdown (MD) werden unterstützt.
  • Limit für Dateigröße: Jede Datei darf nicht größer als 100 MB sein. Alle Dateien, die den Grenzwert überschreiten, werden ignoriert. Weitere Anforderungen finden Sie unter Dateitypanforderungen und Support.
  • URLs: Alle in den Dokumenten vorhandenen Hyperlinks werden extrahiert und als Hyperlinks in der Chatantwort angezeigt.
  • Daten nicht bereit: Wenn Ihre Daten noch nicht verfügbar sind, erstellen Sie einen leeren Ordner für die Datenquelle, und füllen Sie ihn später auf. Auf diese Weise können Sie Daten in die Quelle aufnehmen, nachdem der Ordner aufgefüllt wurde.
Hinweis

Richten Sie die folgenden Object Storage-Berechtigungen ein, bevor Sie fortfahren.

  • Benutzerzugriff auf Object Storage-Dateien
  • Zugriff auf Datenaufnahmejobs auf Object Storage-Dateien für Jobs mit langer Ausführungszeit

Die Berechtigungen finden Sie unter Zugriff erhalten.

Dateitypanforderungen und Support

Datenquellendateien müssen in Object Storage hochgeladen werden. Stellen Sie sicher, dass die Anforderungen für den Typ der aufzunehmenden Datei erfüllt sind.

PDF

Folgende Anforderungen und Unterstützung für die Aufnahme von PDF-Dateien sind erforderlich:

  • Dateierweiterung: Muss .pdf lauten
  • Dateigröße: Eine einzelne Datei darf 100 MB nicht überschreiten.
  • Dateikennwort: Wenn eine PDF-Datei passwortgeschützt ist, wird ein Dateifehler in den Statuslogs aufgezeichnet.
  • Inhalt: Eine PDF-Datei kann Bilder, Diagramme und Referenztabellen enthalten, darf jedoch 8 MB nicht überschreiten.
  • Diagrammvorbereitung: Für Diagramme ist keine spezielle Vorbereitung erforderlich, solange sie zweidimensional mit beschrifteten Achsen sind. Das Modell kann Fragen zu den Diagrammen ohne explizite Erklärungen beantworten.
  • Tabellenvorbereitung: Verwenden Sie Referenztabellen mit mehreren Zeilen und Spalten. Beispiel: Der Agent kann die Tabelle auf der Seite Limits lesen.

txt

Folgende Anforderungen und Unterstützung für die Aufnahme von txt-Dateien sind erforderlich:

  • Dateierweiterung: Muss .txt lauten
  • Dateigröße: Eine einzelne Datei darf 100 MB nicht überschreiten.

JSON

Folgende Anforderungen und Unterstützung für die Aufnahme von JSON-Dateien sind erforderlich:

  • Dateierweiterung: Muss .json lauten
  • Dateigröße: Eine einzelne Datei darf 100 MB nicht überschreiten.
  • Codierung: Nur UTF-8-Codierung in Englisch wird unterstützt. Die strukturierten JSON-Daten können Schlüssel/Wert-Paare, Arrays und verschachtelte Objekte enthalten.
  • Verschachtelungstiefe: Die Strukturtiefe darf 50 nicht überschreiten.
  • Listenlimit: Eine Liste innerhalb der JSON-Struktur darf nicht länger als 10000 Elemente sein.

HTML

Folgende Anforderungen und Unterstützung für die Aufnahme von HTML-Dateien sind erforderlich:

  • Dateierweiterung: Muss .html lauten
  • Dateigröße: Eine einzelne Datei darf 100 MB nicht überschreiten.
  • Inhalt: Nur sichtbarer Inhalt wird aufgenommen. Dynamischer Inhalt wird nicht aufgenommen, und Skripttags werden entfernt.
  • Bilder: Images, die in einer Datei referenziert werden, können verarbeitet werden, wenn die Bildquelle kein externer HTTP- oder absoluter Pfad ist. Bilder, die folgende Anforderungen nicht erfüllen, werden ignoriert.
    • Nur JPEG-Images (.jpg oder .jpeg) werden unterstützt.
    • Ein einzelnes Bild darf 6 MB nicht überschreiten. Alle Bilder, die den Grenzwert überschreiten, werden ignoriert.
    • Bilder müssen auf derselben Ebene wie die hochgeladene HTML-Datei oder darunter in Object Storage hochgeladen werden.
    • Der Quellpfad (Attribut src) zu jedem Bild muss ein Pfad relativ zur übergeordneten HTML-Datei sein. Beispiel:
      <img src="./my-image.jpg">
      <img src="./myfolder/my-imagetwo.jpg">
      
    • Der Quellpfad (Attribut src) zu jedem Image darf keine URLs (http, https oder data) angeben

MD (Preisabschrift)

Folgende Anforderungen und Unterstützung für die Aufnahme von MD-(Markdown-)Dateien sind erforderlich:

  • Dateierweiterung: Muss .md lauten
  • Dateigröße: Eine einzelne Datei darf 100 MB nicht überschreiten.
  • Bilder: Bilder werden ignoriert und nicht verarbeitet.

Erweiterte Tabellen verstehen

Ein verbessertes Tabellenverständnis, ein Feature von RAG-Tools, zielt darauf ab, die Genauigkeit von Antworten auf Abfragen mit Antworten zu verbessern, die in PDF-Tabellendaten eingebettet sind. Diese Tabellen werden verarbeitet, um genauere und relevantere Antworten zu generieren, die auf die enthaltenen Informationen abgestimmt sind. Im Allgemeinen können die RAG-Tools die Tabellen lesen. Damit das RAG-Tool die Tabellen mit verbessertem Tabellenverständnis lesen kann, stellen Sie sicher, dass die Tabellen über die folgenden Features verfügen:

  • Alle Zellen der Tabelle sind durch sichtbare Linien oder Objektgrenzen von anderen Zellen getrennt, einschließlich der Headernamen in der ersten Zeile.
  • Alle Spalten, einschließlich der ersten Spalte, haben einen Headernamen.
  • Jede Tabelle enthält mehr als eine Spalte und mehr als eine Zeile, wobei die Zeile mit Headernamen ausgeschlossen wird.
Tabellen, die mit verbessertem Tabellenverständnis aufgenommen werden, werden aufgeführt, wenn Sie die Daten aufnehmen. Beispielmeldung:
Count of tables that support enhanced table understanding in following PDFs:
      - enhanced_table_test_data/2025_Report1.pdf has 4 tables processed successfully
      - enhanced_table_test_data/2025_Report2.pdf has 3 tables processed successfully
      - enhanced_table_test_data/2025_Report3.pdf has 3 tables processed successfully

Antworten mit Metadatenfilterung verbessern

Verwenden Sie vordefinierte Metadaten, um Filter während eines Chats anzuwenden. Wenn Filter angewendet werden, sind die Suchvorgänge eines Agent in einer Chatsession auf Datendateien beschränkt, die mit den Metadaten verknüpft sind. So kann das Modell Antworten generieren, die für den Inhaltsumfang relevant sind, und so die Antwortgenauigkeit und Relevanz des Agent verbessern.

In den folgenden Schritten wird ein Überblick über die Verwendung der Metadatenfilterfunktion beschrieben. Nachdem Sie die Workflowübersicht verstanden haben, prüfen Sie die Details für Ihren Anwendungsfall in den Abschnitten, die nach den Überblickschritten bereitgestellt wurden.

  1. Erstellen Sie in einem Texteditor das Metadatenschema, das für die Filter erforderlich ist, die Sie zur Verfügung stellen möchten. Schreiben Sie das Schema im JSON-Format. Geben Sie der Datei den Namen _metadata_schema.json.

    Beispiel:

    {
        "metadataSchema": [
            {
                "name": "publication_year",
                "type": "integer"
            },
            {
                "name": "title",
                "type": "string"
            }
    	]
    }
  2. Laden Sie die in Schritt 1 erstellte Datei _metadata_schema.json auf die Stammebene des Objektspeicher-Buckets hoch, der die Datendateien für eine Wissensdatenbank enthält.
  3. Erstellen Sie JSON-Dateien, um Datendateien mit den vordefinierten Metadaten zu verknüpfen und die Metadatenwerte bereitzustellen.

    Beispiel:

    {
        "metadataAttributes": {
            "publication_year": 2020
        }
    } 

    Sie können eine oder mehrere Datendateien oder alle Dateien in einem Bucket mit den Metadaten verknüpfen. Einzelheiten zu den JSON-Dateinamenskonventionen, die für die ausgewählten Optionen verwendet werden sollen, finden Sie unter Metadatenfilteroptionen (Dateiname und Speicherort).

  4. Laden Sie die in Schritt 3 erstellten JSON-Dateien in den Objektspeicher-Bucket hoch, der die Datendateien für eine Wissensdatenbank enthält. Stellen Sie für jede Option sicher, dass Sie die Datei am richtigen Speicherort in der Hierarchie speichern.
  5. Erstellen Sie eine Wissensdatenbank. Wählen Sie Object Storage als Datenspeichertyp und die Option, den Aufnahmejob automatisch zu starten.

    Wenn die Datendateien aufgenommen werden, erstellt Generative AI Agents eine Liste der Metadatennamen und der Werte, die in einem Chat ausgewählt werden können. Informationen zum Anzeigen der aufgenommenen Metadatennamen und -werte finden Sie unter Details einer Knowledge Base in Generative AI Agents abrufen.

  6. Erstellen Sie einen Agent mit einem RAG-Tool, und wählen Sie die in Schritt 5 erstellte Wissensdatenbank aus. Wählen Sie im Agent die Option zum automatischen Erstellen eines Endpunkts aus. Wenn Sie Hilfe benötigen, lesen Sie Agent erstellen und RAG-Tool erstellen.
  7. Fügen Sie in einem Chatfenster einen oder mehrere vordefinierte Metadatenfilter hinzu, und wählen Sie die anzuwendenden Werte aus. Siehe Metadatenfilter in einem Chat verwenden.
Hinweis

In den folgenden Abschnitten erfahren Sie, wie Sie Metadaten-JSON-Dateien für Ihren Anwendungsfall vorbereiten und Metadatenfilter in einer Chatsession hinzufügen und anwenden.
Metadatenfilteroptionen (Dateiname und Speicherort)

Wählen Sie eine oder mehrere der folgenden Methoden, die für Sie am besten geeignet sind.

Methode Dateiname und Speicherort Verwendung
Fügen Sie Metadaten für alle Dateien in einem Bucket ein, ohne die Dateinamen zu nennen. Erstellen Sie eine _common.metadata.json-Datei auf der Object Storage-Root-Ebene. Verwenden Sie diese Datei für Metadaten, die für alle Dateien im Bucket gelten. Mit dieser Methode wird verhindert, dass objektübergreifend Metadaten doppelt eingegeben werden.
Erstellen Sie in einer Datei einen Metadateneintrag für jede Datei in einem Bucket, und fügen Sie die Dateinamen ein. Erstellen Sie eine _all.metadata.json-Datei auf der Object Storage-Root-Ebene. Verwenden Sie diese Methode, wenn Sie viele Dateien haben, und das Erstellen einer Datei, die alle Dateinamen enthält, ist für Sie bequemer als das Erstellen einer Metadatendatei pro Datei.
Erstellen Sie eine Metadatendatei für jede Datei in einem Bucket. Erstellen Sie eine <file-name>.metadata.json-Datei für jede Datei auf Dateiebene.

<file-name> muss mit dem Namen der Datendatei im Bucket übereinstimmen.

Verwenden Sie diese Methode, wenn die Metadaten für jede Datei unterschiedlich sind und es nicht viele Dateien gibt, für die eine Metadatendatei erstellt werden kann, oder wenn Sie die Erstellung der Metadatendateien automatisieren.
Fügen Sie jeder Datei Object Storage-Metadatenheader hinzu. Fügen Sie einen Metadatenheader über die Object Storage-Metadateneigenschaft jeder Datei hinzu. Verwenden Sie diese Methode, wenn Sie nur wenige Metadateneigenschaften enthalten müssen. Wir empfehlen Ihnen, die anderen Methoden mit JSON-Dateien zu verwenden, da Dateien einfacher zu aktualisieren und zu verwalten sind und Metadatenheader schwer zu aktualisieren sind.

Für alle Methoden müssen Sie eine Metadaten-Schemadatei mit dem Namen _metadata_schema.json auf der Root-Ebene des Object Storage-Buckets definieren.

Im Folgenden finden Sie eine Beispielhierarchie, in der Sie die benötigten Metadatendateien speichern.

Eine Abbildung, in der die Hierarchie für Metadatendateien in Object Storage angezeigt wird. Die bucket_root enthält die folgenden Dateien: _all.metadata.json, _common.metadata.json, _metadata_schema.json, file_0.pdf, file_0.pdf.metadata.json, folder_1 und folder_2. Dann enthält folder_1 file_1.pdf und file_1.pdf.metadata.json und folder_2 file_2.pdf und file_2.pdf.metadata.json.

Beispiele für Metadaten-JSON-Dateien

Die folgenden Schritte zeigen anhand von Beispielen, wie die Metadaten-JSON-Dateien formatiert werden. Siehe auch Limits für Metadatenfilterung.

  1. Erstellen Sie eine Metadatenschemadatei namens _metadata_schema.json, und speichern Sie sie auf der Object Storage-Root-Ebene. Beispiel:
    {
        "metadataSchema": [
            {
                "name": "field_1",
                "type": "integer"
            },
            {
                "name": "field_2",
                "type": "string"
            },
            {
                "name": "field_3",
                "type": "list_of_string"
            },
            {
                "name": "field_4",
                "type": "double"
            }  
        ]
    }

    Jeder Metadatenfilter hat eine name und eine type.

    Die zulässigen Werte für type sind integer, string, list_of_string und double.

    Beispiel:

    {
        "metadataSchema": [
            {
                "name": "rating",
                "type": "double"
            },
            {
                "name": "publication_year",
                "type": "integer"
            },
            {
                "name": "title",
                "type": "string"
            },
            {
                "name": "topic",
                "type": "list_of_string"
            }
        ]
    }
    Beispielindexzuordnung für OpenSearch, integer:
    "publication_year": {
      "type": "integer"         
    }
    Beispielindexzuordnung für OpenSearch, string:
    "title": {
      "type": "text",
      "fields": {
          "keyword": {
              "type": "keyword"
          },
          "search_as_you_type": {
              "type": "search_as_you_type"
          }
       }
    }
    Beispielindexzuordnung für OpenSearch, list_of_string:
    "publishers": {
        "type": "text",
        "fields": {
        "keyword": {
            "type": "keyword"
        },
        "search_as_you_type": {
            "type": "search_as_you_type"
        }
      }
    }
    Beispielindexzuordnung für OpenSearch, double:
    "rating": {
      "type": "double"
    }
  2. (Optional) Erstellen Sie eine JSON-Datei mit dem Namen _commmon.metadata.json für Metadaten, die allen Dateien in einem Bucket gemeinsam sind. Beispiel:
    {
        "metadataAttributes": {
            "field_1": value_1,
            "field_2": value_2,
            "field_3": value_3,
            ......,
            "field_n": value_n
        }
    }

    Beispiel:

    {
        "metadataAttributes": {
            "rating": 3.3,
            "publication_year": "2020",
            "topic": [
                "cooking",
                "health",
                "gardening"
            ]
        }
    }
  3. (Optional) Erstellen Sie eine JSON-Datei mit dem Namen _all.metadata.json. Fügen Sie in dieser Datei Metadaten für jede Datei nach Namen hinzu. Beispiel:
    {
        "folder_1/file_1.pdf" : {
            "metadataAttributes": {
                "field_1": value_1,
                "field_2": value_2,
                "field_3": value_3,
                ......,
                "field_n": value_n
            }
        },
        "folder_2/file_2.pdf": {
            "metadataAttributes": {
                "field_1": value_1,
                "field_2": value_2,
                "field_3": value_3,
                ......,
                "field_n": value_n
            }
        }
    }
  4. (Optional) Fügen Sie Metadaten für Dateien im Bucket separat hinzu, indem Sie eine JSON-Datei mit dem Namen <file-name>.metadata.json für eine Datei erstellen.

    <file-name> muss mit dem Namen der Datendatei im Bucket übereinstimmen. Beispiel: Die Datendatei file1.pdf ist mit Metadaten verknüpft, die in der JSON-Datei file1.pdf.metadata.json definiert sind.

    {
        "metadataAttributes": {
            "field_1": value_1,
            "field_2": value_2,
            "field_3": value_3
        }
    }
Hinweis

Sie können die Metadatenfelder nicht ändern oder entfernen, nachdem die Wissensdatenbankdaten aufgenommen wurden. Sie können neue Felder mit dem zulässigen Limit hinzufügen. Um ein Feld zu entfernen oder zu aktualisieren, erstellen Sie die Wissensdatenbank neu.

Metadatenfilter in einem Chat verwenden

Bei der folgenden Prozedur wird davon ausgegangen, dass Sie das erforderliche Metadatenschema und die optionalen Metadatenfilter-JSON-Dateien, eine Wissensdatenbank und einen Agent mit einem RAG-Tool und einem Endpunkt erstellt haben.

  1. Einen Chat starten.
  2. Blenden Sie im Bereich auf der rechten Seite Metadatenfilter ein, und wählen Sie Filter hinzufügen aus, um einen oder mehrere Filter hinzuzufügen.
    1. Wählen Sie im Bereich Filter hinzufügen die Option Filter hinzufügen aus, und wählen Sie in den Menüs einen vordefinierten Metadatenfilter nach Name, Bedingungsoperator und Metadatenwert aus.

      Beispiel: Sie können den Filter topic contains cooking hinzufügen, wobei topic der Metadatenfiltername, contains der Bedingungsoperator und cooking der Metadatenwert ist.

    2. Wählen Sie Filter hinzufügen aus, um nach Bedarf weitere Filter hinzuzufügen.

      Um einen Filter zu entfernen, wählen Sie das Symbol X am Ende der Zeile aus.

    3. Wählen Sie anschließend Hinzufügen aus.

      Die hinzugefügten Filter werden unter Metadatenfilter im Chatfenster angezeigt. Ein Häkchen neben einem Filter bedeutet, dass der Filter angewendet wird. Wenn Sie keinen Filter anwenden möchten, deaktivieren Sie das Kontrollkästchen neben dem Filter.

  3. Starten Sie eine Unterhaltung, indem Sie eine Nachricht eingeben und Weiterleiten auswählen.

    Während einer Chatsession können Sie Metadatenfilter hinzufügen oder entfernen und Filter löschen oder anwenden, um die Unterhaltung fortzusetzen.

Limits für die Metadatenfilterung
Beschreibung Grenzwert
Maximale Anzahl Einträge in _all.metadata.json 10.000
Maximale Anzahl Metadatenfelder, die für jede Datei angegeben werden können 20
Maximale Anzahl von Elementen in einer list_of_string type 10
Maximale Länge eines einzelnen Elements in einem list_of_string-Typ 50
Maximale Länge eines Metadatenschlüssels in Zeichen 25
Maximale Länge des Metadatenwerts in Zeichen 50

Metadaten zu einem Object Storage-Metadatenheader hinzufügen

Erstellen Sie einen Objektspeicher-Bucket, und laden Sie Quelldateien für RAG-Antworten in OCI Generative AI-Agents hoch. Optional können Sie jeder Datei eine benutzerdefinierte URL zum Zitieren hinzufügen.
  1. Wählen Sie in der Navigationsleiste der Konsole eine Region aus, in der generative KI-Agents gehostet werden, z.B. US Midwest (Chicago). Wenn Sie nicht wissen, welche Region ausgewählt werden soll, finden Sie weitere Informationen unter Regionen mit generativen KI-Agents.
  2. Öffnen Sie das Navigationsmenü , und wählen Sie Speicher aus. Wählen Sie unter Object Storage und Archive Storage die Option Buckets aus.
  3. Wählen Sie das Compartment aus, in dem Sie einen Bucket erstellen möchten, oder das Compartment, das den gewünschten Bucket enthält. Sie müssen die folgende Berechtigung bereits besitzen, um Object Storage-Ressourcen zu diesem Compartment hinzuzufügen.
    allow group <your-group-name> to manage object-family in compartment <compartment-with-bucket>
  4. So erstellen Sie einen Bucket:
    1. Wählen Sie Bucket erstellen aus.
    2. Geben Sie einen für Ihre Region eindeutigen Namen für den Bucket ein.
    3. Wählen Sie für andere Felder die Links Weitere Informationen aus, und wählen Sie Optionen aus, die für Ihre Daten gelten. Siehe auch Objektspeicher-Bucket erstellen.
    4. Klicken Sie auf Erstellen.
      Standardmäßig ist ein neuer Bucket privat. Sie können die Sichtbarkeit eines Buckets ändern, nachdem Sie ihn erstellt haben.
  5. Wählen Sie den Namen des Buckets aus, den Sie verwenden möchten.
  6. Wählen Sie auf der Seite mit den Bucket-Details unter Objekte die Option Hochladen aus.
  7. (Optional) Wählen Sie Optionale Header und Metadaten anzeigen aus, und geben Sie die folgenden Werte ein.
    • Typ: Metadaten
    • Name: gaas-metadata-filtering-field-<metadata-name>
    • Wert: <metadata-value>
    Wichtig

    Damit die Metadatenfilterung funktioniert, müssen Sie das Präfix gaas-metadata-filtering-field- für den Namen der Metadaten verwenden.

    Object Storage stellt dem Metadatennamen dann opc-meta- voran, sodass der Header als opc-meta-gaas-metadata-filtering-field-<metadata-name> angezeigt wird.

    Beispiel: Um Metadaten mit dem Namen publication_year hinzuzufügen, fügen Sie einen Metadatenheader mit dem Namen gaas-metadata-filtering-field-publication_year hinzu. Wenn Sie die Details für diese Datei abrufen, wird der Metadatenname als opc-meta-gaas-metadata-filtering-field-publication_year angezeigt.

    Verwenden Sie für Listenwerte das folgende Format:

    _LIST_OF_STRING_|list_value_1|list_value_2, wobei _LIST_OF_STRING_ fest ist und jedes Listenelement durch ein Pipe-Zeichen '|' getrennt ist. Dieses Format wird als Werteliste dekodiert: {list_value_1, list_value_2}

  8. Fügen Sie eine oder mehrere Dateien für die Datenquelle hinzu, und wählen Sie Hochladen aus.
    Hinweis

    • Sie können die Eigenschaft metadata vorhandener Objekte nicht aktualisieren. Stattdessen können Sie eine Datei kopieren, dieser Datei neue Metadaten hinzufügen und dann die alte Datei löschen.

    • Sie können Ihrer Chatunterhaltung mit einem Agent Filter hinzufügen, indem Sie die Metadatenfilterung verwenden, nachdem die Knowledge-Base-Daten aus Object Storage und die zugehörigen Metadaten aufgenommen wurden. Weitere Informationen zum Hinzufügen von Filtern finden Sie in Schritt 11 unter Mit Agents in generativen KI-Agents chatten. Sie können auch Details zu Metadatenwerten anzeigen, nachdem Sie die Daten in einer Wissensdatenbank aufgenommen haben. Weitere Informationen finden Sie in der Ressource Metadaten unter Details einer Knowledge Base in generativen KI-Agents abrufen.

Daten mit benutzerdefinierter URL zu einem Object Storage-Bucket hinzufügen

Erstellen Sie einen Objektspeicher-Bucket, und laden Sie Quelldateien für RAG-Antworten in OCI Generative AI-Agents hoch. Optional können Sie jeder Datei eine benutzerdefinierte URL zum Zitieren hinzufügen.
  1. Wählen Sie in der Navigationsleiste der Konsole eine Region aus, in der generative KI-Agents gehostet werden, z.B. US Midwest (Chicago). Wenn Sie nicht wissen, welche Region ausgewählt werden soll, finden Sie weitere Informationen unter Regionen mit generativen KI-Agents.
  2. Öffnen Sie das Navigationsmenü , und wählen Sie Speicher aus. Wählen Sie unter Object Storage und Archive Storage die Option Buckets aus.
  3. Wählen Sie das Compartment aus, in dem Sie einen Bucket erstellen möchten, oder das Compartment, das den gewünschten Bucket enthält. Sie müssen die folgende Berechtigung bereits besitzen, um Object Storage-Ressourcen zu diesem Compartment hinzuzufügen.
    allow group <your-group-name> to manage object-family in compartment <compartment-with-bucket>
  4. So erstellen Sie einen Bucket:
    1. Wählen Sie Bucket erstellen aus.
    2. Geben Sie einen für Ihre Region eindeutigen Namen für den Bucket ein.
    3. Wählen Sie für andere Felder die Links Weitere Informationen aus, und wählen Sie Optionen aus, die für Ihre Daten gelten. Siehe auch Objektspeicher-Bucket erstellen.
    4. Klicken Sie auf Erstellen.
      Standardmäßig ist ein neuer Bucket privat. Sie können die Sichtbarkeit eines Buckets ändern, nachdem Sie ihn erstellt haben.
  5. Wählen Sie den Namen des Buckets aus, den Sie verwenden möchten.
  6. Wählen Sie auf der Seite mit den Bucket-Details unter Objekte die Option Hochladen aus.
  7. (Optional) Wählen Sie Optionale Header und Metadaten anzeigen aus, und geben Sie die folgenden Werte ein.
    • Typ: Metadaten
    • Name: customized_url_source
    • Wert: <Custom-URL-for-the-file>
    Wichtig

    Damit das Überschreiben des Zitierlinks funktioniert, müssen Sie Name verwenden: customized_url_source.
  8. Fügen Sie eine oder mehrere Dateien für die Datenquelle hinzu, und wählen Sie Hochladen aus.
    Hinweis

    Wenn Sie im 7. Schritt einem Objekt die customized_url_source-Metadaten hinzugefügt haben, gilt diese benutzerdefinierte URL für alle Dateien, die Sie für dieses Objekt hochladen. Sie können die Eigenschaft metadata vorhandener Objekte nicht aktualisieren. Stattdessen können Sie eine Datei kopieren, dieser Datei neue Metadaten hinzufügen und dann die alte Datei löschen. Informationen zum Hinzufügen oder Aktualisieren einer Datei mit den customized_url_source-Metadaten mit der OCI-CLI finden Sie unter Benutzerdefinierte URL einem Zitat zuweisen.
Hinweis

Beta-Kunden:

Wenn Sie in der Beta-Phase eine Wissensdatenbank erstellt haben, müssen Sie möglicherweise die Datenquelle löschen und neu erstellen, damit das URL-Handling-Feature funktioniert.

Einem Zitat eine benutzerdefinierte URL zuweisen

Wenn ein Agent die RAG für seine Antworten verwendet, können Sie Zitate erhalten. Standardmäßig verweisen die Zitate auf Object Storage, in dem die Dateien gespeichert sind. Um eine URL anstelle der referenzierten Datei zu referenzieren, können Sie dem Objekt metadata eine benutzerdefinierte URL für diese Datei hinzufügen.

In diesem Thema wird gezeigt, wie Sie das Objekt metadata über die OCI-CLI hinzufügen oder aktualisieren.

  1. Starten Sie die OCI-CLI in einer Umgebung oder in Cloud Shell. Es wird empfohlen, dass Sie es zuerst in Cloud Shell verwenden, um sich mit den Befehlen vertraut zu machen.
  2. Rufen Sie den Objektnamen für die Datei ab, der Sie eine benutzerdefinierte URL hinzufügen möchten, um:
    oci os object list --bucket-name <the-bucket-name> 
    --file <the-file-name>
    Beispielausgabe:
    "data": [
        {
          "archival-state": null,
          "etag": "xxx",
          "md5": "xxx==",
          "name": "<the-object-name>",
          "size": 1117630,
          "storage-tier": "Standard",
          "time-created": "2025-03-12T22:21:26.991000+00:00",
          "time-modified": "2025-03-12T22:38:10.217000+00:00"
        },
    Other objects are listed similarly after this comma.

    Sie finden den Objektnamen auch in der Konsole. Wählen Sie auf der Seite mit den Bucket-Details das Menü Aktionen (drei Punkte) für das Objekt aus, wählen Sie Objektdetails anzeigen aus, und kopieren Sie den Namen.

    Hinweis

    Wenn sich eine Datei in einem Ordner befindet, unterscheiden sich der Dateiname und der zugehörige Objektname. Beispiel: Für eine Datei mit dem Namen file1.pdf könnte der Objektname folder1/file1.pdf lauten. Andernfalls sind der Dateiname und der zugehörige Objektname identisch.
  3. Laden Sie die Datei in das aktuelle Arbeitsverzeichnis herunter.

    Um das Objekt metadata einer Datei hinzuzufügen oder zu aktualisieren, ersetzen Sie die Datei durch dieselbe Datei mit dem neuen Objekt metadata. Deshalb kopieren Sie die Datei zuerst in das aktuelle Arbeitsverzeichnis.

    oci os object get 
    --bucket-name <the-bucket-name> 
    --file <the-file-name>
    --name <the-object-name>
  4. Suchen Sie die metadata-Objektwerte für die aktuelle Datei.
    oci os object head 
    --bucket-name <the-bucket-name> 
    --name <the-object-name>
    Beispielausgabe:
    {
     some data
    
      "opc-client-request-id": "xxx",
      "opc-meta-key1": "value1",
      "opc-meta-key2": "value2",
      "opc-request-id": "xxx",
     ...
    }
    

    Dieses Beispiel zeigt, dass der Objektwert metadata '{"key1":"value1","key2":"value2"}' ist. Der Name metadata wird mit dem Präfix opc-meta- gespeichert. Sie müssen dieses Präfix jedoch nicht hinzufügen, wenn Sie den Namen metadata in den nächsten Schritten hinzufügen. Dieses Präfix wird jedem metadata-Namen automatisch hinzugefügt.

  5. Ersetzen Sie die Datei in Object Storage durch die Datei im aktuellen Arbeitsverzeichnis, und fügen Sie ein neues metadata-Objekt hinzu.

    Um die aktuellen Metadaten beizubehalten und den Namen und die Werte der benutzerdefinierten URL hinzuzufügen, "{"customized_url_source":"<the-custom-url>"" zum Objekt metadata:

    oci os object put 
    --bucket-name <the-bucket-name> 
    --file <the-file-name> 
    --name <the-object-name>
    --force --metadata 
    '{"customized_url_source":"<the-custom-url>",
    "<existing-metadata-name-1>":"<existing-metadata-value-1>"
    "<existing-metadata-name-2>":"<existing-metadata-value-2>"}'

    Beispiel: So behalten Sie die metadata-Namen und -Werte bei, die im Beispiel für Schritt 4 angezeigt werden:

    oci os object put 
    --bucket-name <the-bucket-name> 
    --file <the-file-name> 
    --name <the-object-name>
    --force --metadata 
    '{"customized_url_source":"<the-custom-url>",
    "key1":"value1",
    "key2":"value2"}'

    Um das vorhandene metadata-Objekt zu ersetzen, um nur die benutzerdefinierte URL aufzunehmen führen Sie den folgenden Befehl aus:

    oci os object put 
    --bucket-name <the-bucket-name> 
    --file <the-file-name> 
    --name <the-object-name>
    --force --metadata '{"customized_url_source":"<the-custom-url>"}'
  6. Stellen Sie sicher, dass das Objekt metadata für die benutzerdefinierte URL ersetzt wird.
    oci os object head 
    --bucket-name <the-bucket-name> 
    --name <the-object-name>
    Beispielausgabe:
    {
     some data
    
      "opc-meta-customized_url_source": "some-new-link",
     ...
    }
    
Wichtig

  • Das Objekt metadata, das die Standardzitation außer Kraft setzt, muss den Namen customized_url_source haben.
  • Sie können ein metadata-Objekt mit dem Namen customized_url_source verwenden.
  • Jede customized_url_source kann nur eine URL haben.
  • Die Befehle im 5. Schritt können das Objekt metadata hinzufügen und aktualisieren, da sie den Wert des aktuellen Objekts metadata ersetzen.
  • Stellen Sie sicher, dass Sie die Werte für das Objekt --metadata mit dem Format übergeben, das in den Befehlen im 5. Schritt angezeigt wird.
Links