Vektorsuche im Datenanalyse-Tool

Mit den Oracle AI Vector Search-Funktionen können Sie nach relevantem Text aus Ihren Quelldaten in einer bestimmten Spalte suchen.

Mit der Vektorsuche können Sie schnell Daten finden und abgleichen, die dem Text ähneln, den Sie als Sucheingabe angeben.

Voraussetzungen

Für die Verwendung der Vektorsuchfunktion im Datenanalysetool benötigen Sie Folgendes:
  • Sie müssen eine 23ai-Datenbank mit Vector-Unterstützung haben.
  • Die ORDS-REST-APIs müssen den Datentyp VECTOR unterstützen.
  • Auf der Seite "Data Studio-Einstellungen" müssen Sie dieselben Zugangsdaten auswählen, die Sie für die Vektorsuche verwenden.
  • Die Quelldaten müssen bereits eine nicht numerische Spalte aufweisen, damit sie zuerst eingebettet werden können.
  • Um die Vektorsuche im Datenanalysetool verwenden zu können, benötigen Sie:
    • Ein OpenAI-, Cohere- oder Azure OpenAI-Kontodienst mit Gutschrift
    • Zugriff auf das Package DBMS_VECTOR und DBMS_VECTOR_CHAIN.UTL_TO_EMBEDDING.
    Hinweis

Das Datenanalysetool verwendet das PL/SQL-Package Vector Utility DBMS_VECTOR und DBMS_VECTOR_CHAIN.UTL_TO_EMBEDDING, um die REST-APIs von Drittanbietern bereitzustellen, mit denen Sie mit externen Einbettungsmodellen wie Cohere, Google AI, Hugging Face, Oracle Cloud Infrastructure (OCI) Generative AI, OpenAI oder Vertex AI interagieren können. Sie müssen die Bedingungen für die Verwendung von Einbettungsmodellen von Drittanbietern verstehen.

Hinweis

Bestimmte Funktionen der Datenbank können Ihnen den Zugriff auf Services ermöglichen, die separat von Drittanbietern angeboten werden, z. B. durch die Verwendung von JSON-Spezifikationen, die Ihren Zugriff auf REST-APIs erleichtern.

Ihre Nutzung dieser Funktionen erfolgt ausschließlich auf eigene Gefahr und Sie sind allein verantwortlich für die Einhaltung der Bedingungen im Zusammenhang mit der Nutzung solcher Dienste Dritter. Ungeachtet anderer Geschäftsbedingungen im Zusammenhang mit den Diensten Dritter stellt Ihre Nutzung dieser Datenbankfunktionen Ihre Zustimmung zu diesem Risiko dar und schließt ausdrücklich die Verantwortung oder Haftung von Oracle für Schäden aus, die sich aus diesem Zugriff ergeben.

Angenommen, Sie sind ein Finanzenthusiast und möchten mehr über Finanzen durch Nachrichten erfahren, um ein besseres Gefühl für Finanzprodukte und Investitionen zu gewinnen. In diesem Beispiel können Sie mit der Vektorsuche nach Neuigkeiten zum Wort Bank suchen.

Eine Tabelle mit den Spalten CATEGORY, FILENAME, TITLE, CONTENT und einer anderen Spalte mit dem Label VECTOR enthält die Vektordarstellung der Spalte CONTENT. Da wir Vektorsuche für Quellspalten mit nichtnumerischen Daten (Bild oder Text) verwenden können, kann jede der nichtnumerischen Spalten eingebettet und als Vektorspalte gespeichert werden. In diesem Beispiel müssen wir jedoch nach relevantem Text aus der Spalte CONTENT suchen.

Mit dem Datenanalysetool können Sie eine Vektorsuche durchführen.

Um anzugeben, welche Spalteneinbettung in der Vektorspalte beibehalten wird, müssen Sie zuerst die entsprechende Spalte mit dem entsprechenden Vektor mit dem Datenanalysetool zuordnen, nach ähnlichem Text suchen und dann die Abfrage ausführen. Auf der Registerkarte "Abfrageergebnis" wird der Inhalt ähnlich Bank angezeigt.

  1. Klicken Sie im Datenanalysetool unter "Analysen" auf +, um eine neue Analyse zu erstellen.
  2. Wählen Sie das Schema aus der Dropdown-Liste Schema und die Abfrage aus der Dropdown-Liste Typ.
  3. Wählen Sie die Tabelle, die Sie abfragen möchten, im Tabellenbrowser aus. In diesem Beispiel wählen Sie BBCNEWS_DATA_ENCODE aus.



  4. Geben Sie die SELECT-Anweisung im SQL Worksheet-Bearbeitungsbereich ein, um alle Spalten aus der Tabelle BBCNEWS_DATA_ENCODE abzurufen.

    Geben Sie den folgenden Befehl an:
    Select * from BBCNEWS_DATA_ENCODE;
  5. Klicken Sie auf Ausführen.



    Sie können alle Spalten der Tabelle BBCNEWS_DATA_ENCODE auf der Registerkarte "Abfrageergebnisse" anzeigen.

  6. Wählen Sie die Tabellenansicht des Modus aus den Symbolen, die verschiedene Modi zur Visualisierung des Abfrageergebnisses anzeigen.



  7. Verschieben Sie die Spalte CONTENT per Drag-and-Drop in den Dropdown-Bereich "Spalte", und klicken Sie darauf, um die Vektorspalte zuzuordnen.



  8. Geben Sie im Assistenten für Kartenvektorspalten die folgenden Feldwerte an:
    • Kartenvektor: Wählen Sie die Spalte aus, die aus den Vektoreinbettungen der ausgewählten Spalte besteht, aus der Dropdown-Liste. In diesem Beispiel ist es VECTOR.
    • Service auswählen: Wählen Sie den AI-Service aus, mit dem Sie dieses Feature des Tools verwenden möchten. In diesem Beispiel ist es OCI Generative AI.
    • Zugangsdaten auswählen: Geben Sie die Zugangsdaten ein, die Sie in den Data Studio-Einstellungen für den Zugriff auf den externen Serviceprovider erstellen. Sie benötigen diese Zugangsdaten, um den Zugriff bei REST-API-Aufrufen an den ausgewählten externen Serviceprovider zu aktivieren.
    • URL für generative KI: Geben Sie die generative KI-URL an, mit der Sie den Drittanbieter aufrufen, wie Cohere, Google AI, Hugging Face, Oracle Cloud Infrastructure (OCI) Generative AI, OpenAI oder Vertex AI.
    • Modell auswählen: Geben Sie das Einbettungsmodell an, mit dem Sie Einbettungen aus dem Text generieren möchten. In diesem Beispiel geben Sie cohere.embed-deutsch-licht-v2.0 ein.

    Klicken Sie auf Speichern, um die Zuordnung zu speichern. Wählen Sie Löschen aus, um die in diesem Schritt erwähnten Feldwerte zu löschen.

  9. In den Facettenfiltern können Sie das Textfeld unter der Spalte "Inhalt" anzeigen. Um das Textfeld einzublenden, klicken Sie auf das Zeichen +.



  10. Geben Sie den folgenden Text in das Textfeld ein, der dem Wort Bank in der Spalte CONTENT ähnelt:
    BANK

    Klicken Sie auf Suchen.



  11. Auf der Registerkarte "Abfrageergebnisse" des Bereichs "Ausgabe" wird die Inhaltsspalte angezeigt, die aus Inhalt besteht, der sich auf Bank bezieht.



    Sie können den Mauszeiger über jeden Inhalt bewegen, um das eingeblendete Formular anzuzeigen.