Machine Learning-(ML-)Modelle verwenden
Datentransformationen unterstützen die Verwendung von ML-Modellen in einem Datenfluss. Erfahren Sie, wie Sie Modelle für maschinelles Lernen (ML) in Datenflüssen erstellen und verwenden.
Themen
- Erstellen Sie eine ML-Modelldatenentity im Datenflusseditor
Um ML-Modelle in Datentransformationen zu verwenden, müssen Sie zwei Datenflüsse erstellen. Sie müssen zuerst die Datenentity des ML-Modells mit dem Data Flow-Editor erstellen. Anschließend können Sie die Datenentity in einem Datenfluss verwenden, um Daten aus einer Quellverbindung zu generieren und auf einen Zielserver zu laden. - Datenentityeigenschaften des ML-Modells
Die Registerkarte Eigenschaften des Assistenten Datenentity hinzufügen bietet Data-Mining-Optionen, mit denen Sie die Datenentity des ML-Modells definieren können. - ML-Modell in einem Datenfluss verwenden
Mit der Datenbankfunktion Vorhersagemodell können Sie ML-Modellalgorithmen für Quelldaten ausführen und die Ausgabe in eine Zieldatenbank laden.
Übergeordnetes Thema: Seite "Datentransformationen"
ML-Modelldatenentity im Datenflusseditor erstellen
Um ML-Modelle in Datentransformationen zu verwenden, müssen Sie zwei Datenflüsse erstellen. Sie müssen zuerst die Datenentity des ML-Modells mit dem Data Flow-Editor erstellen. Anschließend können Sie die Datenentity in einem Datenfluss verwenden, um Daten aus einer Quellverbindung zu generieren und auf einen Zielserver zu laden.
So erstellen Sie eine ML-Modelldatenentity im Datenflusseditor:
- Ziehen Sie die Datenentity, auf der Sie das ML-Modell erstellen möchten, auf die Design Canvas.
- Wählen Sie die Komponente, und klicken Sie auf das Symbol "Datenentity hinzufügen"
, das in der oberen rechten Ecke der Zielkomponente vorhanden ist.
- Die Seite Datenentity hinzufügen wird angezeigt, auf der Sie die folgenden Details der Zielkomponente konfigurieren können:
Registerkarte Allgemein
- Geben Sie im Textfeld Name den Namen der neu erstellten Datenentity ein.
- Wählen Sie in der Dropdown-Liste Entitytyp als Datenentitytyp ML-Modell aus.
Wenn Sie diesen Entitytyp auswählen, ändert sich die Benutzeroberfläche wie folgt:
- In der Dropdown-Liste Verbindung werden nur die von Ihnen erstellten Oracle-Verbindungen aufgeführt.
- Der Assistent "Datenentity hinzufügen" zeigt die Registerkarte Eigenschaften an, auf der Sie den Lerntyp, die Funktion, den Algorithmus auswählen und Parameter zur Definition des ML-Modells konfigurieren können. Weitere Informationen finden Sie unter Datenentityeigenschaften des ML-Modells.
- Wählen Sie in der Dropdown-Liste Verbindungstyp die erforderliche Verbindung aus, aus der Sie die neu erstellte Datenentity hinzufügen möchten. Bei ML-Modelldatenentitys wird in der Dropdown-Liste Verbindungstyp nur Oracle als Option aufgeführt.
- Die Dropdown-Liste "Verbindung" wird mit den Verbindungen gefüllt, die Sie mit dem zugehörigen Verbindungstyp erstellt haben. Wählen Sie in der Dropdown-Liste Verbindung den Servernamen aus, auf dem die Datenentity des ML-Modells beibehalten werden soll.
- In der Dropdown-Liste Schema werden alle Schemas, die der ausgewählten Verbindung entsprechen, in zwei Gruppen aufgelistet.
- Neues Datenbankschema (von dem Sie noch nicht importiert haben) und
- Vorhandenes Datenbankschema (Eins, aus dem Sie zuvor importiert haben und die möglicherweise Datenentitys ersetzen).
- Geben Sie im Textfeld Tags ein Tag Ihrer Wahl ein. Mit Tags können Sie die Datenentitys filtern, die auf der Seite "Datenentity" angezeigt werden.
- Wenn Sie diese Datenentity als Featuregruppe markieren möchten, blenden Sie Erweiterte Optionen ein, und klicken Sie auf das Kontrollkästchen Als Featuregruppe behandeln.
- Klicken Sie auf Weiter.
Registerkarte Eigenschaften
- Wählen Sie den Lernaktivitätstyp, die Funktion und den Algorithmus aus, mit dem Sie diese Datenentity erstellen möchten. Weitere Informationen zu den Optionen finden Sie unter Datenentityeigenschaften des ML-Modells.
- Basierend auf den ausgewählten Optionen wird der Abschnitt Parameter mit der Liste der Parameter aufgefüllt, die als "Wichtig" und "Hoch" markiert sind. Mit dem Symbol
können Sie weitere erforderliche Parameter hinzufügen.
Sie müssen einen Wert für jeden Parameter angeben, damit der Datenfluss erfolgreich ausgeführt werden kann.
Registerkarte Spalten
- Klicken Sie auf das Symbol
"Spalten hinzufügen", um der neu erstellten Datenentity neue Spalten hinzuzufügen.
Der angezeigten Tabelle wird eine neue Spalte hinzugefügt.
- In der Tabelle werden die folgenden Spalten angezeigt:
- Name
- Datentyp: Klicken Sie auf die Zelle, um den erforderlichen Datentyp zu konfigurieren.
- Skalierung
- Länge
- Aktionen - Klicken Sie auf das Kreuzsymbol, um die erstellte Spalte zu löschen.
- Um die Spalten im Bulkverfahren zu löschen, wählen Sie die Spalten aus, und klicken Sie auf das Symbol
Löschen.
- Um nach den erforderlichen Spaltendetails zu suchen, geben Sie im Textfeld "Suchen" den erforderlichen Spaltennamen ein, und klicken Sie auf "Eingabe". Die Details der erforderlichen Spalte werden angezeigt.
- Klicken Sie auf Weiter.
Registerkarte Vorschau von Datenentity anzeigen
Es zeigt eine Vorschau aller erstellten Spalten und ihrer konfigurierten Details an. Wenn die Datenentity zu einer Oracle-Datenbank gehört, können Sie auch Statistiken der Tabelle anzeigen. Weitere Informationen finden Sie unter Statistiken von Datenentitys anzeigen.
- Klicken Sie auf Speichern, um die Konfiguration zu speichern und den Assistenten zu beenden.
- Speichern Sie den Datenfluss, und führen Sie ihn aus.
Die neue Datenentity wird erstellt. Sie wird auf der Seite "Datenentitys" angezeigt.
Übergeordnetes Thema: Modelle für maschinelles Lernen (ML) verwenden
ML-Modell - Datenentityeigenschaften
Die Registerkarte Eigenschaften des Assistenten Datenentity hinzufügen bietet Data Mining-Optionen, mit denen Sie die Datenentity des ML-Modells definieren können.
In diesem Thema werden Vorkenntnisse über Oracle Machine Learning-Konzepte wie Data Mining-Funktionen und -Algorithmen vorausgesetzt. Weitere Informationen finden Sie in der Dokumentation Oracle Machine Learning for SQL API Guide.
Lerntyp | Funktion | Algorithmus |
---|---|---|
Überwacht | Klassifizierung | Entscheidungsbaum |
Explizite semantische Analyse | ||
Generalisierte lineare Modelle | ||
Naive Bayes | ||
Random Forest | ||
Neuronales Netzwerk | ||
Support Vector Machines | ||
Verschlechterung | Generalisierte lineare Modelle | |
Neuronales Netzwerk | ||
Support Vector Machines | ||
Zeitreihen | Exponentielle Glättung | |
Attributbedeutung | Minimum Description Length | |
Unüberwacht | Assoziation | A priori |
Attributbedeutung | CUR-Matrixzerlegung | |
Anomaly Detection | Eine Klasse Unterstützung Vektor-Maschinen | |
Clustering | Erwartungsmaximierung | |
k-Means | ||
Orthogonales Partitionierungsclustering | ||
Featureextraktion | Explizite semantische Analyse | |
Non-Negative Matrix Factorization | ||
Singulärwertzerlegung |
Übergeordnetes Thema: Modelle für maschinelles Lernen (ML) verwenden
ML-Modell in einem Datenfluss verwenden
Mit der Datenbankfunktion Vorhersagemodell können Sie ML-Modellalgorithmen für Quelldaten ausführen und die Ausgabe in eine Zieldatenbank laden.
Bevor Sie ein ML-Modell in einem Datenfluss verwenden, müssen Sie das ML-Modell erstellen. Anweisungen zum Erstellen eines ML-Modells finden Sie unter ML-Modelldatenentity im Datenflusseditor erstellen.
So verwenden Sie ein ML-Modell in einem Datenfluss:
- Befolgen Sie die Anweisungen unter Datenfluss erstellen, um einen neuen Datenfluss zu erstellen.
- Ziehen Sie im Data Flow Editor die Tabellen, die Sie als Quelle verwenden möchten, in den Datenfluss, und legen Sie sie auf der Designleinwand ab.
- Klicken Sie in der Symbolleiste "Datenbankfunktionen" auf Maschinelles Lernen, und ziehen Sie die Transformationskomponente Vorhersagemodell per Drag-and-Drop auf die Entwurfsleinwand.
- Klicken Sie auf die Transformationskomponente Vorhersagemodell, um ihre Eigenschaften anzuzeigen.
- Geben Sie in der Registerkarte Allgemein Folgendes an:
- Verbindung: In der Dropdown-Liste werden alle verfügbaren Oracle-Verbindungen aufgeführt. Wählen Sie die Oracle-Verbindung, die Sie verwenden möchten.
- Schema: Wählen Sie das Schema.
- ML-Modell - In der Dropdown-Liste werden alle verfügbaren ML-Modelle aufgeführt. Anweisungen zum Erstellen eines ML-Modells finden Sie unter ML-Modelldatenentity im Datenflusseditor erstellen.
- Ordnen Sie in der Registerkarte Spaltenzuordnung die Quellspalte, die Sie einbetten möchten, dem INPUT-Attribut des Operators zu. Die einzige in den Spaltenzuordnungen verfügbare Spalte ist
prediction parameters
. Ziehen Sie eine Textspalte aus den verfügbaren Spalten in die Spalte "Ausdruck". - Ziehen Sie die Tabelle, die Sie als Ziel verwenden möchten, in den Datenfluss, und legen Sie sie auf der Entwurfsleinwand ab.
- Speichern Sie den Datenfluss, und führen Sie ihn aus.
Datentransformationen führen das Vorhersagemodell für die Quelldaten aus und schreiben die Ausgabe in die Zieltabelle.
Übergeordnetes Thema: Modelle für maschinelles Lernen (ML) verwenden