Datenflüsse

Mit Datenflüssen können Sie Daten anordnen und integrieren, um kuratierte Datasets zu erzeugen, die Benutzer visualisieren können.

Mit Datenflüssen können Sie Ihre Daten visuell ändern, ohne dass Sie dafür manuelle Programmierkenntnisse benötigen.

Beispiele für mögliche Verwendungen von Datenflüssen:

Zum Erstellen eines Datasets

Zum Kombinieren von Daten aus verschiedenen Quellen
Zum Aggregieren von Daten
Zum Trainieren von Modellen für maschinelles Lernen oder Anwenden eines ML-Vorhersagemodells auf Daten
Zum Durchführen von Objekterkennung, Bildklassifizierung oder Texterkennung mit künstlicher Intelligenz über den OCI Vision-Service

Sie erstellen Datenflüsse im Datenflusseditor.

Zum Erstellen eines Datenflusses fügen Sie Schritte hinzu. Jeder Schritt führt eine bestimmte Funktion aus (z.B. Daten hinzufügen, Tabellen zusammenführen, Spalten zusammenführen, Daten transformieren, Daten speichern). Im Datenflusseditor können Sie Schritte hinzufügen und konfigurieren. Jeder Schritt wird beim Hinzufügen oder Ändern validiert. Nach dem Konfigurieren des Datenflusses führen Sie diesen aus, um ein Dataset zu erzeugen oder zu aktualisieren.

Beim Hinzufügen eigener Spalten oder Transformieren von Daten können Sie zahlreiche SQL-Operatoren (wie BETWEEN, LIKE, IN), Bedingungsausdrücke (wie CASE) und Funktionen (wie Durchschnitt, Median, Perzentil) verwenden.

Datenbankunterstützung für Datenflüsse

Mit Datenflüssen können Sie Daten aus Datasets, Themenbereichen oder Datenbankverbindungen kuratieren.

Mit dem Schritt Daten hinzufügen können Sie Daten zu einem Datenfluss hinzufügen. Mit dem Schritt Daten speichern können Sie Ausgabedaten aus einem Datenfluss speichern.

Sie können die Ausgabedaten aus einem Datenfluss in einem Dataset oder einem der unterstützten Datenbanktypen speichern. Wenn Sie Daten in einer Datenbank speichern, können Sie die Datenquelle transformieren, indem Sie sie mit Daten aus dem Datenfluss überschreiben. Die Datenquellen- und die Datenflusstabelle müssen sich in derselben Datenbank befinden und denselben Namen aufweisen. Erstellen Sie zunächst eine Verbindung zu einem der unterstützten Datenbanktypen.

Datenausgabe

Sie können Ausgabedaten aus Datenflüssen in den folgenden Datenbanktypen speichern:

Oracle Autonomous Data Warehouse
Oracle Autonomous Transaction Processing
Oracle Database
Apache Hive
Hortonworks Hive
MapR Hive
Spark

Dateneingabe

Sie können Daten aus den meisten Datenbanktypen in Datenflüsse eingeben (außer Oracle Essbase und EPM Cloud).