RAG-Pipeline für die Suche mit OpenSearch erstellen

Generieren Sie automatisch Code, um einen OCI Generative AI-Connector mit Search with OpenSearch für eine End-to-End-Pipeline einer Retrieval-Augmented Generation (RAG) einzurichten und zu verwenden.

Prüfen und implementieren Sie vor dem Start die Voraussetzungen für die Verwendung eines OCI Generative AI-Connectors mit der Suche mit OpenSearch.

Möglicherweise müssen Sie mehr Netzwerk einrichten, damit die Anwendung die Funktion aufrufen kann, die mit dem Cluster OpenSearch kommuniziert. Für das Netzwerk ist eine der folgenden Optionen erforderlich:

  • Für ein öffentliches Subnetz, ein Internetgateway und zwei Regeln in der Sicherheitsliste: eine Regel für zustandsbehafteten Egress und eine Ingress-Regel, mit der TCP-Traffic Port 9200 verwenden kann.
  • Für ein privates Subnetz, ein Servicegateway und eine Regel für zustandsbehafteten Egress in der Sicherheitsliste.

Informationen zum Einrichten dieser Optionen finden Sie unter VCN und Subnetze für OCI Functions erstellen, falls noch nicht vorhanden.

Die Anwendung muss von einer VM-Instanz in demselben Subnetz wie das Cluster ausgeführt werden, oder Sie können die Portweiterleitung einrichten, um den Code lokal auszuführen. Beispiele für diese Optionen finden Sie unter Aufgabe 5: OCI Search Service abfragen.

Von der Konsole aus

  1. öffnen Sie das Navigationsmenü, und klicken Sie auf Datenbanken. Klicken Sie unter OpenSearch auf Cluster.
  2. Wählen Sie unter Listengeltungsbereich das Compartment aus, das das Cluster enthält.
  3. Klicken Sie in der Liste Cluster auf den Namen des Clusters, für das Sie die RAG-Pipeline erstellen möchten.
  4. Klicken Sie auf der Seite mit den Clusterdetails auf RAG-Pipeline erstellen.
  5. Geben Sie auf der Seite RAG-Pipeline konfigurieren unter Allgemeine Informationen einen Namen, eine Beschreibung und ein Tag für die Pipeline ein, und geben Sie dann ein oder mehrere Kontextfelder an.
    Kontextfelder geben den Text an, der in Einbettungen für den Index übersetzt wird. Die hier angegebenen Werte müssen mit Feldern übereinstimmen, die im Index vorhanden sind.

    Um den Code für den Connector für generative KI automatisch über die Konsole zu generieren, muss das Kennwort des Clusters mit einem Secret mit dem OCI Vault-Service gespeichert werden. Wenn das Kennwort bereits als Vault Secret gespeichert ist, geben Sie den Benutzernamen in Cluster Vault-Zugangsdaten an, und wählen Sie dann den Vault, das Vault Secret und die Secret-Version für das Cluster aus.

    Wenn das Kennwort nicht als Vault Secret gespeichert ist, wählen Sie Vault und Secret erstellen aus, und führen Sie die folgenden Aufgaben aus:

    1. Vault erstellen.
    2. Nachdem der Vault aktiv ist, erstellen Sie einen Schlüssel für den Vault.
    3. Erstellen Sie für den Vault ein Secret mit den folgenden Details:
      • Wählen Sie den Schlüssel aus, den Sie im vorherigen Schritt erstellt haben.
      • Geben Sie das Kennwort für das Cluster OpenSearch im folgenden Format manuell ein:
        • Secret-Typvorlage: Plain-Text
        • Secret-Inhalt: <OpenSearch-password>
  6. Geben Sie unter Modellgruppe einen Namen und eine Beschreibung für die Modellgruppe ein. Wenn Sie den Namen einer vorhandenen Modellgruppe eingeben, verwendet der generierte Code die Modellgruppen-ID für die vorhandene Modellgruppe. Andernfalls wird eine neue Modellgruppe erstellt.
  7. Wählen Sie Weiter.
  8. Geben Sie auf der Seite Connector für generative KI konfigurieren unter Connector für generative KI einen Namen und eine Beschreibung für den Connector ein.
  9. Wählen Sie die Aktion aus, und wählen Sie das Modell aus, das für den Connector verwendet werden soll.
    Die Felder im Abschnitt Parameter des Gen-AI-Modells werden basierend auf dem im vorherigen Schritt ausgewählten Modell mit Standardwerten aufgefüllt. Sie können die Parameterwerte ändern. Sie können nur gültige Parameter eingeben. Zulässige Parameterwerte basieren auf dem ausgewählten Modell. Ein Parameterwert, der für ein Modell funktioniert, funktioniert möglicherweise nicht, wenn Sie ein anderes Modell auswählen.
  10. Geben Sie unter Gen AI Register Model einen Namen und eine Beschreibung für das Generative AI Model ein.
  11. Wählen Sie Weiter.
Die Seite Code generieren enthält Code, mit dem Sie die RAG-Pipeline erstellen. Grundlage hierfür sind die Optionen, die Sie auf den vorherigen Seiten im Workflow RAG-Pipeline erstellen angegeben haben. Wählen Sie für Standalone-Code, den Sie kopieren oder herunterladen können, in der Dropdown-Liste Sprache Java oder Python aus. Anschließend können Sie den Code im ersten Textbereich in eine Anwendung kopieren oder herunterladen.

Wenn Sie Kibana auswählen, kann der generierte Code nicht als Standalone-Anwendung ausgeführt werden. Stattdessen wird der generierte Code in sequenzielle Schritte aufgeteilt, die Sie kopieren, um sie aus dem OpenSearch-Dashboard des Clusters auszuführen.

Der zweite Textbereich enthält Vorlagencode, der zeigt, wie Abfragen nach der Pipeline erstellt werden.