Knowledge Bases

Knowledge Bases nutzen die Oracle Database 26ai Vector Search-Funktion, um Vektoreinbettungen aus Dokumenten zu speichern, die in AI Data Platform Workbench gespeichert sind.

Mit den Vektorsuchfunktionen von Oracle Database 26ai ermöglichen Wissensdatenbanken KI-Agenten semantische Suchen und das Abrufen semantisch relevanter Dokumente. In AI Data Platform Workbench werden Wissensdatenbanken in einem Schema eines Katalogs unter dem Typ "Knowledge Bases" erstellt.


Die Masterkatalogseite von AI Data Platform Workbench wird geöffnet, wobei ein Katalog ausgewählt und Knowledge Bases hervorgehoben sind

In AI Data Platform Workbench werden Wissensdatenbanken in Schemas von Standardkatalogen mit dem Typ Knowledge Base erstellt. Die Aufnahme von PDF-, DOCX- und TXT-Dateien, die in verwalteten oder externen Volumes gespeichert sind, wird in Knowledge Bases unterstützt. Standardmäßig werden Vektoren in der Oracle Database 26ai Vector Search-Instanz gespeichert, die in Ihrem Mandanten bereitgestellt wird, wenn Ihre Instanz von AI Data Platform erstellt wird.

AI Data Platform Workbench unterstützt zwei Einbettungsmodelle:
  • ALL_MINILM_L12_V2: Ein Satztransformator-Modell, das Sätze und Absätze einem 384 dimensionalen dichten Vektorraum zuordnet. Wird für Aufgaben wie Clustering oder semantische Suche verwendet.
  • MULTILINGUAL_E5_SMALL: Generiert Vektoreinbettungen für Text in mehreren Sprachen. Sein kompaktes Design ermöglicht eine effektive Leistung in verschiedenen Sprachen, die für verschiedene Datensätze und mehrsprachige Szenarien geeignet ist.

Hinweis:

Ein Knowledge-Base-Objekt in AI Data Platform Workbench kann nicht direkt abgefragt werden. Sie fragen eine Wissensdatenbank ab, indem Sie ein RAG-Tool erstellen, das einem Agent in einem Agent-Ablauf zugeordnet ist, und die relevante Wissensdatenbank auswählen. Weitere Informationen zu RAG-Tools finden Sie unter RAG-Tool. Weitere Informationen zu AI-Agents finden Sie unter AI-Agents.

Datenquellen aufnehmen

Nachdem Sie eine Wissensdatenbank in AI Data Platform Workbench erstellt haben, müssen Sie diese Wissensdatenbank aufrufen und eine Datenquelle angeben, aus der Daten aufgenommen werden sollen. Sie können ein ganzes Volume oder einen Ordner in einem Volume als Quelle für die Aufnahme auswählen, jedoch keine einzelnen Dateien.

Sie können Ihre Datenquellen in der Registerkarte Datenquelle Ihrer Wissensdatenbank anzeigen und die Informationen zu dieser Datenquelle anzeigen, indem Sie auf ihren Namen klicken. Die Registerkarte Parameter enthält Informationen über das ausgewählte Volume, den Dateipfad, das angehängte Cluster und die Dateitypen.

Hinweis:

AI Data Platform Workbench unterstützt keine geplanten Aufnahmejobs. Sie können Daten sofort aufnehmen, indem Sie auf der Registerkarte Parameter der Datenquelle auf Jetzt aufnehmen klicken.

Ausführlichere Informationen zu Ihrer Datenquelle finden Sie auf der Registerkarte Details. Eine Historie der Datenaufnahmejobs wird auf der Registerkarte Jobläufe angezeigt.

Knowledge Base erstellen

Die Erstellung einer Wissensdatenbank in AI Data Platform Workbench ist ein einmaliges Setup, mit dem Sie eine Dokumentquelle registrieren, Dateien automatisch chunkieren, einbetten und indexieren sowie semantische Suche und RAG-Abruf über Agent-Abläufe ermöglichen können.

Knowledge Bases können in AI Data Platform Workbench nicht direkt abgefragt werden. Sie können Wissensdatenbanken abfragen, indem Sie ein RAG-Tool erstellen, das an einen AI-Agent angehängt ist. Weitere Informationen finden Sie unter KI-Agents.
  1. Klicken Sie auf Masterkatalog.
  2. Navigieren Sie zu dem Standardkatalog und -schema, in dem Sie Ihre Wissensdatenbank erstellen möchten.
  3. Klicken Sie auf Knowledge Bases.
  4. Klicken Sie auf Symbol "Knowledge Base erstellen" Knowledge Base erstellen.

    Dialogfeld "Knowledge Base erstellen"

  5. Geben Sie einen Namen und die Beschreibung für die Wissensdatenbank an.
  6. Wählen Sie einen Workspace und ein Spark-Cluster für die Dateiaufnahme aus. Wenn kein Cluster ausgewählt ist, wird das Standard-Masterkatalog-Compute verwendet.
  7. Wählen Sie bei Bedarf das verwendete Einbettungsmodell aus.
  8. Geben Sie bei Bedarf die Chunk-Größe und die Chunk-Überlappung an.
  9. Klicken Sie auf Create.

Knowledge Base bearbeiten

Sie können den Namen, die Beschreibung, das Cluster, das Modell oder die Chunking-Details für eine vorhandene Wissensdatenbank ändern, wenn Sie über die entsprechenden Berechtigungen verfügen.

  1. Navigieren Sie zu Ihrem Knowledge-Base-Ordner.
  2. Klicken Sie neben der Wissensdatenbank, die Sie bearbeiten möchten, auf Aktionssymbol mit drei Punkten Aktionen und dann auf Bearbeiten.
  3. Nehmen Sie Änderungen an den Attributen der Wissensdatenbank vor.
  4. Klicken Sie auf Speichern.

Knowledge Base löschen

Sie können Wissensdatenbanken löschen, die Sie nicht mehr benötigen oder aus Ihrem Katalog verwenden.

  1. Navigieren Sie zu Ihrem Knowledge-Base-Ordner.
  2. Klicken Sie neben der Wissensdatenbank, die Sie löschen möchten, auf Aktionssymbol mit drei Punkten Aktionen und dann auf Löschen.
  3. Klicken Sie auf Löschen.

Datenquelle zu einer Knowledge Base hinzufügen

Nachdem Sie eine Wissensdatenbank erstellt haben, müssen Sie ihr eine Datenquelle für die Aufnahme zuweisen.

  1. Navigieren Sie zu Ihrer Wissensdatenbank.
  2. Klicken Sie auf die Registerkarte Datenquelle.
  3. Klicken Sie auf Datenquelle zur Wissensdatenbank hinzufügen Datenquelle zur Wissensdatenbank hinzufügen.

    Datenquelle zum Dialogfeld "Knowledge Base" hinzufügen

  4. Wählen Sie im Masterkatalog den Datenträger oder Ordner in einem Volume aus, das Sie in die Wissensdatenbank aufnehmen möchten. Sie können keine einzelnen Dateien auswählen.
  5. Wählen Sie bei Bedarf das Compute-Cluster aus, das für die Datenaufnahme verwendet werden soll.
  6. Wählen Sie aus, welche Dateitypen aufgenommen werden sollen. Unterstützte Dateitypen sind PDF, TXT und DOCX.
  7. Wählen Sie Aufnahmejob beim Hinzufügen starten aus, um die Aufnahme unmittelbar nach dem Hinzufügen der Datenquelle zu starten.
  8. Klicken Sie auf "Hinzufügen".

Daten in eine Knowledge Base aufnehmen

Nachdem eine Datenquelle zu einer Wissensdatenbank hinzugefügt wurde, können Sie einen Datenaufnahmejob manuell über die Registerkarte Parameter starten.

  1. Navigieren Sie zu Ihrer Wissensdatenbank.
  2. Klicken Sie auf der Registerkarte Datenquelle auf den Namen der Datenquelle, für die Sie einen Datenaufnahmejob ausführen möchten.
  3. Klicken Sie auf der Registerkarte "Parameter" auf Jetzt aufnehmen.

Status des Aufnahmejoblaufs anzeigen

Auf der Registerkarte Jobläufe der Datenquelle können Sie eine Liste aller Aufnahmejobs für die Datenquelle anzeigen.

  1. Navigieren Sie zu Ihrer Wissensdatenbank.
  2. Klicken Sie auf der Registerkarte Datenquelle auf den Namen der Datenquelle, für die Sie den Status anzeigen möchten.
  3. Klicken Sie auf die Registerkarte Jobläufe.
  4. Mit den Filtern können Sie die Liste der angezeigten Jobläufe eingrenzen.

Datenquelle löschen

Sie können Datenquellen löschen, die Sie nicht mehr benötigen oder aus Ihrer Wissensdatenbank verwenden.

Wenn Sie eine Datenquelle löschen, werden auch die entsprechenden Vektoreinbettungen aus Ihrer AI Data Platform gelöscht.
  1. Navigieren Sie zur Wissensdatenbank. Klicken Sie auf das Register Datenquellen.
  2. Klicken Sie neben der Datenquelle, die Sie löschen möchten, auf Aktionssymbol mit drei Punkten Aktionen und dann auf Löschen.
  3. Klicken Sie auf Löschen.