Datenflüsse

Mit Datenflüssen können Sie Daten anordnen und integrieren, um kuratierte Datasets zu erzeugen, die Benutzer visualisieren können.

Mit Datenflüssen können Sie Ihre Daten visuell ändern, ohne dass Sie dafür manuelle Programmierkenntnisse benötigen.

Beispiele für mögliche Verwendungen von Datenflüssen:

  • Zum Erstellen eines Datasets
  • Zum Kombinieren von Daten aus verschiedenen Quellen
  • Zum Aggregieren von Daten
  • Zum Trainieren von Modellen für maschinelles Lernen oder Anwenden eines ML-Vorhersagemodells auf Daten
  • Zum Durchführen von Objekterkennung, Bildklassifizierung oder Texterkennung mit künstlicher Intelligenz über den OCI Vision-Service

Sie erstellen Datenflüsse im Datenflusseditor.
Datenflusseditor

Zum Erstellen eines Datenflusses fügen Sie Schritte hinzu. Jeder Schritt führt eine bestimmte Funktion aus (z.B. Daten hinzufügen, Tabellen zusammenführen, Spalten zusammenführen, Daten transformieren, Daten speichern). Im Datenflusseditor können Sie Schritte hinzufügen und konfigurieren. Jeder Schritt wird beim Hinzufügen oder Ändern validiert. Nach dem Konfigurieren des Datenflusses führen Sie diesen aus, um ein Dataset zu erzeugen oder zu aktualisieren.

Beim Hinzufügen eigener Spalten oder Transformieren von Daten können Sie zahlreiche SQL-Operatoren (wie BETWEEN, LIKE, IN), Bedingungsausdrücke (wie CASE) und Funktionen (wie Durchschnitt, Median, Perzentil) verwenden.

Datenbankunterstützung für Datenflüsse

Mit Datenflüssen können Sie Daten aus Datasets, Themenbereichen oder Datenbankverbindungen kuratieren.

Mit dem Schritt Daten hinzufügen können Sie Daten zu einem Datenfluss hinzufügen. Mit dem Schritt Daten speichern können Sie Ausgabedaten aus einem Datenfluss speichern.

Sie können die Ausgabedaten aus einem Datenfluss in einem Dataset oder einem der unterstützten Datenbanktypen speichern. Wenn Sie Daten in einer Datenbank speichern, können Sie die Datenquelle transformieren, indem Sie sie mit Daten aus dem Datenfluss überschreiben. Die Datenquellen- und die Datenflusstabelle müssen sich in derselben Datenbank befinden und denselben Namen aufweisen. Erstellen Sie zunächst eine Verbindung zu einem der unterstützten Datenbanktypen.

Datenausgabe

Sie können Ausgabedaten aus Datenflüssen in den folgenden Datenbanktypen speichern:
  • Oracle Autonomous Data Warehouse
  • Oracle Autonomous Transaction Processing
  • Oracle Database
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • Spark

Dateneingabe

Sie können Daten aus den meisten Datenbanktypen in Datenflüsse eingeben (außer Oracle Essbase und EPM Cloud).