Machine Learning-(ML-)Modelle verwenden

Datentransformationen unterstützen die Verwendung von ML-Modellen in einem Datenfluss. Erfahren Sie, wie Sie Modelle für maschinelles Lernen (ML) in Datenflüssen erstellen und verwenden.

Themen

ML-Modelldatenentity im Datenflusseditor erstellen

Um ML-Modelle in Datentransformationen zu verwenden, müssen Sie zwei Datenflüsse erstellen. Sie müssen zuerst die Datenentity des ML-Modells mit dem Data Flow-Editor erstellen. Anschließend können Sie die Datenentity in einem Datenfluss verwenden, um Daten aus einer Quellverbindung zu generieren und auf einen Zielserver zu laden.

So erstellen Sie eine ML-Modelldatenentity im Datenflusseditor:

  1. Ziehen Sie die Datenentity, auf der Sie das ML-Modell erstellen möchten, auf die Design Canvas.
  2. Wählen Sie die Komponente, und klicken Sie auf das Symbol "Datenentity hinzufügen" Symbol "Datenentity hinzufügen", das in der oberen rechten Ecke der Zielkomponente vorhanden ist.
  3. Die Seite Datenentity hinzufügen wird angezeigt, auf der Sie die folgenden Details der Zielkomponente konfigurieren können:

    Registerkarte Allgemein

    • Geben Sie im Textfeld Name den Namen der neu erstellten Datenentity ein.
    • Wählen Sie in der Dropdown-Liste Entitytyp als Datenentitytyp ML-Modell aus.
      Wenn Sie diesen Entitytyp auswählen, ändert sich die Benutzeroberfläche wie folgt:
      • In der Dropdown-Liste Verbindung werden nur die von Ihnen erstellten Oracle-Verbindungen aufgeführt.
      • Der Assistent "Datenentity hinzufügen" zeigt die Registerkarte Eigenschaften an, auf der Sie den Lerntyp, die Funktion, den Algorithmus auswählen und Parameter zur Definition des ML-Modells konfigurieren können. Weitere Informationen finden Sie unter Datenentityeigenschaften des ML-Modells.
    • Wählen Sie in der Dropdown-Liste Verbindungstyp die erforderliche Verbindung aus, aus der Sie die neu erstellte Datenentity hinzufügen möchten. Bei ML-Modelldatenentitys wird in der Dropdown-Liste Verbindungstyp nur Oracle als Option aufgeführt.
    • Die Dropdown-Liste "Verbindung" wird mit den Verbindungen gefüllt, die Sie mit dem zugehörigen Verbindungstyp erstellt haben. Wählen Sie in der Dropdown-Liste Verbindung den Servernamen aus, auf dem die Datenentity des ML-Modells beibehalten werden soll.
    • In der Dropdown-Liste Schema werden alle Schemas, die der ausgewählten Verbindung entsprechen, in zwei Gruppen aufgelistet.
      • Neues Datenbankschema (von dem Sie noch nicht importiert haben) und
      • Vorhandenes Datenbankschema (Eins, aus dem Sie zuvor importiert haben und die möglicherweise Datenentitys ersetzen).
      Wählen Sie in der Dropdown-Liste Schema das gewünschte Schema aus.
    • Geben Sie im Textfeld Tags ein Tag Ihrer Wahl ein. Mit Tags können Sie die Datenentitys filtern, die auf der Seite "Datenentity" angezeigt werden.
    • Wenn Sie diese Datenentity als Featuregruppe markieren möchten, blenden Sie Erweiterte Optionen ein, und klicken Sie auf das Kontrollkästchen Als Featuregruppe behandeln.
    • Klicken Sie auf Weiter.

    Registerkarte Eigenschaften

    • Wählen Sie den Lernaktivitätstyp, die Funktion und den Algorithmus aus, mit dem Sie diese Datenentity erstellen möchten. Weitere Informationen zu den Optionen finden Sie unter Datenentityeigenschaften des ML-Modells.
    • Basierend auf den ausgewählten Optionen wird der Abschnitt Parameter mit der Liste der Parameter aufgefüllt, die als "Wichtig" und "Hoch" markiert sind. Mit dem Symbol Symbol "Parameter hinzufügen" können Sie weitere erforderliche Parameter hinzufügen.

      Sie müssen einen Wert für jeden Parameter angeben, damit der Datenfluss erfolgreich ausgeführt werden kann.

    Registerkarte Spalten

    • Klicken Sie auf das Symbol Symbol "Spalten hinzufügen" "Spalten hinzufügen", um der neu erstellten Datenentity neue Spalten hinzuzufügen.

      Der angezeigten Tabelle wird eine neue Spalte hinzugefügt.

    • In der Tabelle werden die folgenden Spalten angezeigt:
      • Name
      • Datentyp: Klicken Sie auf die Zelle, um den erforderlichen Datentyp zu konfigurieren.
      • Skalierung
      • Länge
      • Aktionen - Klicken Sie auf das Kreuzsymbol, um die erstellte Spalte zu löschen.
    • Um die Spalten im Bulkverfahren zu löschen, wählen Sie die Spalten aus, und klicken Sie auf das Symbol Symbol "Löschen" Löschen.
    • Um nach den erforderlichen Spaltendetails zu suchen, geben Sie im Textfeld "Suchen" den erforderlichen Spaltennamen ein, und klicken Sie auf "Eingabe". Die Details der erforderlichen Spalte werden angezeigt.
    • Klicken Sie auf Weiter.

    Registerkarte Vorschau von Datenentity anzeigen

    Es zeigt eine Vorschau aller erstellten Spalten und ihrer konfigurierten Details an. Wenn die Datenentity zu einer Oracle-Datenbank gehört, können Sie auch Statistiken der Tabelle anzeigen. Weitere Informationen finden Sie unter Statistiken von Datenentitys anzeigen.

  4. Klicken Sie auf Speichern, um die Konfiguration zu speichern und den Assistenten zu beenden.
  5. Speichern Sie den Datenfluss, und führen Sie ihn aus.

    Die neue Datenentity wird erstellt. Sie wird auf der Seite "Datenentitys" angezeigt.

ML-Modell - Datenentityeigenschaften

Die Registerkarte Eigenschaften des Assistenten Datenentity hinzufügen bietet Data Mining-Optionen, mit denen Sie die Datenentity des ML-Modells definieren können.

In diesem Thema werden Vorkenntnisse über Oracle Machine Learning-Konzepte wie Data Mining-Funktionen und -Algorithmen vorausgesetzt. Weitere Informationen finden Sie in der Dokumentation Oracle Machine Learning for SQL API Guide.

Lerntyp Funktion Algorithmus
Überwacht Klassifizierung Entscheidungsbaum
Explizite semantische Analyse
Generalisierte lineare Modelle
Naive Bayes
Random Forest
Neuronales Netzwerk
Support Vector Machines
Verschlechterung Generalisierte lineare Modelle
Neuronales Netzwerk
Support Vector Machines
Zeitreihen Exponentielle Glättung
Attributbedeutung Minimum Description Length
Unüberwacht Assoziation A priori
Attributbedeutung CUR-Matrixzerlegung
Anomaly Detection Eine Klasse Unterstützung Vektor-Maschinen
Clustering Erwartungsmaximierung
k-Means
Orthogonales Partitionierungsclustering
Featureextraktion Explizite semantische Analyse
Non-Negative Matrix Factorization
Singulärwertzerlegung

ML-Modell in einem Datenfluss verwenden

Mit der Datenbankfunktion Vorhersagemodell können Sie ML-Modellalgorithmen für Quelldaten ausführen und die Ausgabe in eine Zieldatenbank laden.

Bevor Sie ein ML-Modell in einem Datenfluss verwenden, müssen Sie das ML-Modell erstellen. Anweisungen zum Erstellen eines ML-Modells finden Sie unter ML-Modelldatenentity im Datenflusseditor erstellen.

So verwenden Sie ein ML-Modell in einem Datenfluss:

  1. Befolgen Sie die Anweisungen unter Datenfluss erstellen, um einen neuen Datenfluss zu erstellen.
  2. Ziehen Sie im Data Flow Editor die Tabellen, die Sie als Quelle verwenden möchten, in den Datenfluss, und legen Sie sie auf der Designleinwand ab.
  3. Klicken Sie in der Symbolleiste "Datenbankfunktionen" auf Maschinelles Lernen, und ziehen Sie die Transformationskomponente Vorhersagemodell per Drag-and-Drop auf die Entwurfsleinwand.
  4. Klicken Sie auf die Transformationskomponente Vorhersagemodell, um ihre Eigenschaften anzuzeigen.
  5. Geben Sie in der Registerkarte Allgemein Folgendes an:
    • Verbindung: In der Dropdown-Liste werden alle verfügbaren Oracle-Verbindungen aufgeführt. Wählen Sie die Oracle-Verbindung, die Sie verwenden möchten.
    • Schema: Wählen Sie das Schema.
    • ML-Modell - In der Dropdown-Liste werden alle verfügbaren ML-Modelle aufgeführt. Anweisungen zum Erstellen eines ML-Modells finden Sie unter ML-Modelldatenentity im Datenflusseditor erstellen.
  6. Ordnen Sie in der Registerkarte Spaltenzuordnung die Quellspalte, die Sie einbetten möchten, dem INPUT-Attribut des Operators zu. Die einzige in den Spaltenzuordnungen verfügbare Spalte ist prediction parameters. Ziehen Sie eine Textspalte aus den verfügbaren Spalten in die Spalte "Ausdruck".
  7. Ziehen Sie die Tabelle, die Sie als Ziel verwenden möchten, in den Datenfluss, und legen Sie sie auf der Entwurfsleinwand ab.
  8. Speichern Sie den Datenfluss, und führen Sie ihn aus.

    Datentransformationen führen das Vorhersagemodell für die Quelldaten aus und schreiben die Ausgabe in die Zieltabelle.