Datenflüsse

Mit Datenflüssen können Sie Daten anordnen und integrieren, um kuratierte Datasets zu erzeugen, die Benutzer visualisieren können.

Mit Datenflüssen können Sie Ihre Daten visuell ändern, ohne dass Sie dafür manuelle Programmierkenntnisse benötigen.

Beispiele für mögliche Verwendungen von Datenflüssen:

Zum Erstellen eines Datasets

Zum Kombinieren von Daten aus verschiedenen Quellen
Zum Aggregieren von Daten
Zum Trainieren von Modellen für maschinelles Lernen oder Anwenden eines ML-Vorhersagemodells auf Daten
Zum Durchführen von Objekterkennung, Bildklassifizierung oder Texterkennung mit künstlicher Intelligenz über den OCI Vision-Service

Sie erstellen Datenflüsse im Bereich für das Datenflussdesign.
Beschreibung von GUID-2B831D4B-0478-4EAC-917D-EA910D9FFFE3-default.png folgt
.png

Zum Erstellen eines Datenflusses fügen Sie Schritte hinzu. Jeder Schritt führt eine bestimmte Funktion aus (z.B. Daten hinzufügen, Tabellen verknüpfen, Spalten zusammenführen oder Daten transformieren). Im Datenflusseditor können Sie Schritte hinzufügen und konfigurieren. Jeder Schritt wird beim Hinzufügen oder Ändern validiert. Nach dem Konfigurieren des Datenflusses führen Sie diesen aus, um ein Dataset zu erstellen oder zu aktualisieren.

Beim Hinzufügen eigener Spalten oder Transformieren von Daten können Sie zahlreiche SQL-Operatoren (wie BETWEEN, LIKE, IN), Bedingungsausdrücke (wie CASE) und Funktionen (wie Durchschnitt, Median, Perzentil) verwenden.

Von Datenflüssen generierte Datasets aktualisieren

Sie können Datenflüsse erneut ausführen, damit Datasets stets aktuelle Daten verwenden.

Hinweis:

Wenn Sie einen Datenfluss erneut ausführen, gehen alle Transformationen verloren, die außerhalb des Datenflusses direkt auf das Ausgabe-Dataset angewendet wurden. Das Dataset wird komplett neu erstellt.

Datenflusslimits

Wenn Sie große Datenmengen verarbeiten, beachten Sie die Datenflusslimits. Siehe Datenflusslimits.

Datenbankunterstützung für Datenflüsse

Mit Datenflüssen können Sie Daten aus Datasets und Themenbereichen kuratieren.

Sie können Datenflüsse individuell oder in einer bestimmten Abfolge ausführen. Sie können mehrere Datenquellen in einen Datenfluss aufnehmen und angeben, wie diese verbunden werden sollen.

Mit dem Schritt Daten hinzufügen können Sie Daten zu einem Datenfluss hinzufügen. Mit dem Schritt Daten speichern können Sie Ausgabedaten aus einem Datenfluss speichern.

Sie können die Ausgabedaten aus einem Datenfluss in einem Dataset oder einem der unterstützten Datenbanktypen speichern. Wenn Sie Daten in einer Datenbank speichern, können Sie die Datenquelle transformieren, indem Sie sie mit Daten aus dem Datenfluss überschreiben. Die Datenquellen- und die Datenflusstabelle müssen sich in derselben Datenbank befinden und denselben Namen aufweisen. Erstellen Sie zunächst eine Verbindung zu einem der unterstützten Datenbanktypen.

Hinweis:

Sie können Daten aus Remotedatenbanken hinzufügen, die mit Data Gateway verbunden sind. Allerdings können Daten nicht wieder in Remotedatenbanken, die mit Data Gateway verbunden sind, zurückgespeichert werden.

Datenausgabe

Sie können Ausgabedaten aus Datenflüssen in den folgenden Datenbanktypen speichern:

Oracle Autonomous AI Lakehouse
Oracle Autonomous AI Transaction Processing
Oracle Database
Apache Hive
Hortonworks Hive
MapR Hive
Spark

Informationen zur Datenbankversion finden Sie unter Unterstützte Datenquellen.

Dateneingabe

In Datenflüssen können Sie Daten aus Datasets und Themenbereichen verarbeiten. Sie können Daten nicht direkt aus Datenbanken abrufen. Sie müssen zuerst ein Dataset aus den Datenbanktabellen erstellen.

Im Datenflussdesigner arbeiten

Mit dem Datenflussdesigner können Sie Ihre Daten in einer grafischen Designumgebung kuratieren und transformieren.

Im Datenflussdesigner arbeiten:

Mit dem Datenflussdesigner können Sie die Datenflussschritte organisieren und konfigurieren, die Ihre Daten transformieren.

Beschreibung von GUID-2B831D4B-0478-4EAC-917D-EA910D9FFFE3-default.png folgt

.png

Verwenden Sie diese Features im Datenflussdesigner.

Feature	Symbol	Beschreibung
Kompaktes Layout		Gruppieren Sie Schritte in einem kleineren Ansichtsbereich, um Scrolling zu reduzieren.
Erweitertes Layout		Richten Sie die Schritte der Eingabedatenquelle links aus, um die Lesbarkeit zu verbessern.
Unvollständiger Join- oder Union-Vorgang		Gibt eine Datenquelle an, für die kein Join- oder Union-Vorgang ausgeführt wurde. Bewegen Sie den Mauszeiger über das blaue Linksymbol , um ein vorgeschlagenes Join-Ziel (gepunktete Linie) anzuzeigen, und klicken Sie erneut, um den Join- oder Union-Vorgang abzuschließen (durchgezogene Linie). Um eine Verbindung zu entfernen, klicken Sie mit der rechten Maustaste auf den Join-Schritt oder den Union-Schritt , und wählen Sie Löschen aus.
Zoomverbesserungen		Vergrößern und verkleinern.