Vektorsuche im Datenanalysetool

Sie können Oracle AI Vector Search-Funktionen verwenden, um relevanten Text aus Ihren Quelldaten in einer bestimmten Spalte zu suchen.

Mit der Vektorsuche können Sie schnell Daten finden und abgleichen, die dem Text ähneln, den Sie als Sucheingabe angeben.

Voraussetzungen

Für die Verwendung der Vektorsuchfunktion im Datenanalysetool benötigen Sie Folgendes:
  • Sie benötigen 23ai-Datenbank mit Vector-Unterstützung.
  • Die ORDS-REST-APIs müssen den Datentyp VECTOR unterstützen.
  • Auf der Seite "Data Studio-Einstellungen" müssen Sie dieselben Zugangsdaten auswählen, die Sie für die Vektorsuche verwenden.
  • Die Quelldaten müssen bereits eine nicht-numerische Spalte aufweisen, damit sie zuerst eingebettet werden können.
  • Um die Vektorsuche im Datenanalysetool zu verwenden, müssen Sie über Folgendes verfügen:
    • Ein OpenAI- oder Cohere- oder Azure OpenAI-Accountservice mit Gutschrift
    • Ein Zugriff auf das Package DBMS_VECTOR und DBMS_VECTOR_CHAIN.UTL_TO_EMBEDDING.
    Hinweis

    • Sie müssen Ihr KI-Profil festlegen. Befolgen Sie die in diesem Kapitel beschriebenen Schritte unter Select AI to Generate SQL from Natural Language Prompts verwenden.
    • Nachdem Sie Ihr AI-Profil erstellt und konfiguriert haben, legen Sie Ihr AI-Profil im Assistenten für Data Studio-Einstellungen im Data Studio-Navigationsmenü so fest, dass KI-Features wie das Generieren von SQL aus Natural Language und Vector Search im Data Studio-Tool verwendet werden.

Das Datenanalysetool verwendet das PL/SQL-Package DBMS_VECTOR und DBMS_VECTOR_CHAIN.UTL_TO_EMBEDDING des Vector Utilitys, um die REST-APIs von Drittanbietern bereitzustellen, mit denen Sie mit externen Einbettungsmodellen wie Cohere, Google AI, Hugging Face, Oracle Cloud Infrastructure (OCI) Generative AI, OpenAI oder Vertex AI interagieren können. Sie müssen die Bedingungen für die Verwendung von Einbettungsmodellen von Drittanbietern verstehen.

Hinweis

Bestimmte Funktionen der Datenbank können Ihnen den Zugriff auf Services ermöglichen, die separat von Drittanbietern angeboten werden, z.B. durch die Verwendung von JSON-Spezifikationen, die Ihren Zugriff auf REST-APIs erleichtern.

Ihre Nutzung dieser Funktionen erfolgt ausschließlich auf Ihr eigenes Risiko, und Sie sind allein dafür verantwortlich, alle Bedingungen im Zusammenhang mit der Nutzung solcher Dienste Dritter einzuhalten. Ungeachtet anderer Vertragsbedingungen in Bezug auf die Services Dritter stellt Ihre Nutzung dieser Datenbankfunktionen Ihre Annahme dieses Risikos dar und schließt die Verantwortung oder Haftung von Oracle für Schäden aus, die sich aus diesem Zugriff ergeben.

Angenommen, Sie sind ein Finanzenthusiast und möchten über Finanzen durch Nachrichten lernen, um ein besseres Gefühl für Finanzprodukte und -investitionen zu gewinnen. In diesem Beispiel können Sie die Funktion "Vektorsuche" verwenden, um Neuigkeiten zu dem Wort Bank zu finden.

Betrachten Sie eine Tabelle mit den Spalten CATEGORY, FILENAME, TITLE, CONTENT und einer anderen Spalte mit der Bezeichnung VECTOR, in der die Vektordarstellung der Spalte CONTENT enthalten ist. Da wir die Vektorsuche auf Quellspalten mit nicht numerischen Daten (Bild oder Text) verwenden können, kann jede der nicht numerischen Spalten als Vektorspalte eingebettet und gespeichert werden. In diesem Beispiel müssen wir jedoch nach relevantem Text aus der Spalte CONTENT suchen.

Sie können das Datenanalyse-Tool verwenden, um eine Vektorsuche durchzuführen.

Um anzugeben, welche Spalte in der Vektorspalte eingebettet ist, müssen Sie zuerst die entsprechende Spalte mit dem entsprechenden Vektor mit dem Datenanalysetool mappen, nach ähnlichem Text suchen und dann die Abfrage ausführen. Auf der Registerkarte "Abfrageergebnis" wird der Inhalt ähnlich wie Bank angezeigt.

  1. Klicken Sie im Datenanalysetool unter "Analysen" auf +, um eine neue Analyse zu erstellen.
  2. Wählen Sie das Schema in der Dropdown-Liste Schema und die Abfrage in der Dropdown-Liste Typ aus.
  3. Wählen Sie die Tabelle aus, die Sie im Tabellenbrowser abfragen möchten. In diesem Beispiel wählen Sie BBCNEWS_DATA_ENCODE aus.



  4. Geben Sie die Select-Anweisung im SQL Worksheet-Bearbeitungsbereich ein, um alle Spalten aus der Tabelle BBCNEWS_DATA_ENCODE abzurufen.

    Geben Sie den folgenden Befehl an:
    Select * from BBCNEWS_DATA_ENCODE;
  5. Klicken Sie auf Ausführen.



    Sie können alle Spalten der Tabelle BBCNEWS_DATA_ENCODE auf der Registerkarte "Abfrageergebnisse" anzeigen.

  6. Wählen Sie die tabellarische Ansicht des Modus aus den Symbolen, die verschiedene Modi zur Visualisierung des Abfrageergebnisses anzeigen.



  7. Ziehen Sie die Spalte CONTENT per Drag-and-Drop in den Drop-Bereich "Spalte", und klicken Sie darauf, um die Vektorspalte zuzuordnen.



  8. Geben Sie im Assistenten für Map Vector Column die folgenden Feldwerte an:
    • Kartenvektor: Wählen Sie die Spalte aus, die aus den Vektoreinbettungen der ausgewählten Spalte besteht, aus der Dropdown-Liste. In diesem Beispiel ist es VECTOR.
    • Service auswählen: Wählen Sie den AI-Service aus, mit dem Sie dieses Feature des Tools verwenden. In diesem Beispiel ist es OCI Generative AI.
    • Zugangsdaten auswählen: Geben Sie die Zugangsdaten ein, die Sie in den Data Studio-Einstellungen erstellen, um auf den Drittanbieter-Serviceprovider zuzugreifen. Sie benötigen diese Zugangsdaten, um den Zugriff während REST-API-Aufrufen an den ausgewählten Drittanbieterserviceanbieter zu aktivieren.
    • URL für generative KI: Geben Sie die URL für generative KI an, mit der Sie den externen Serviceprovider aufrufen, wie Cohere, Google AI, Hugging Face, Oracle Cloud Infrastructure (OCI) Generative AI, OpenAI oder Vertex AI.
    • Modell auswählen: Geben Sie das Einbettungsmodell an, mit dem Sie Einbettungen aus dem Text generieren. In diesem Beispiel geben Sie cohere.embed-english-light-v2.0 ein.

    Klicken Sie auf Speichern, um die Zuordnung zu speichern. Wählen Sie Löschen aus, um die Feldwerte zu löschen, die Sie in diesem Schritt angeben.

  9. In den Facettenfiltern können Sie das Textfeld unter der Spalte "Inhalt" anzeigen. Klicken Sie auf das +-Zeichen, um das Textfeld einzublenden.



  10. Geben Sie den folgenden Text in das Textfeld ein, um den Inhalt ähnlich dem Wort Bank in der Spalte CONTENT anzuzeigen:
    BANK

    Klicken Sie auf Suchen.



  11. Auf der Registerkarte "Abfrageergebnisse" des Ausgabebereichs wird die Inhaltsspalte angezeigt, die aus Inhalten besteht, die sich auf Bank beziehen.



    Sie können den Mauszeiger über jeden Inhalt bewegen, um das erweiterte Formular anzuzeigen.