Datenflüsse

Mit Datenflüssen können Sie Daten anordnen und integrieren, um kuratierte Datasets zu erzeugen, die Benutzer visualisieren können.

Mit Datenflüssen können Sie Ihre Daten visuell ändern, ohne dass Sie dafür manuelle Programmierkenntnisse benötigen.

Beispiele für mögliche Verwendungen von Datenflüssen:

  • Zum Erstellen eines Datasets
  • Zum Kombinieren von Daten aus verschiedenen Quellen
  • Zum Aggregieren von Daten
  • Zum Trainieren von Modellen für maschinelles Lernen oder Anwenden eines ML-Vorhersagemodells auf Daten
  • Zum Durchführen von Objekterkennung, Bildklassifizierung oder Texterkennung mit künstlicher Intelligenz über den OCI Vision-Service

Sie erstellen Datenflüsse im Bereich für das Datenflussdesign.
Beschreibung von GUID-2B831D4B-0478-4EAC-917D-EA910D9FFFE3-default.png folgt
.png

Zum Erstellen eines Datenflusses fügen Sie Schritte hinzu. Jeder Schritt führt eine bestimmte Funktion aus (z.B. Daten hinzufügen, Tabellen verknüpfen, Spalten zusammenführen oder Daten transformieren). Im Datenflusseditor können Sie Schritte hinzufügen und konfigurieren. Jeder Schritt wird beim Hinzufügen oder Ändern validiert. Nach dem Konfigurieren des Datenflusses führen Sie diesen aus, um ein Dataset zu erstellen oder zu aktualisieren.

Beim Hinzufügen eigener Spalten oder Transformieren von Daten können Sie zahlreiche SQL-Operatoren (wie BETWEEN, LIKE, IN), Bedingungsausdrücke (wie CASE) und Funktionen (wie Durchschnitt, Median, Perzentil) verwenden.

Von Datenflüssen generierte Datasets aktualisieren

Sie können Datenflüsse erneut ausführen, damit Datasets stets aktuelle Daten verwenden.

Hinweis:

Wenn Sie einen Datenfluss erneut ausführen, gehen alle Transformationen verloren, die außerhalb des Datenflusses direkt auf das Ausgabe-Dataset angewendet wurden. Das Dataset wird komplett neu erstellt.

Datenbankunterstützung für Datenflüsse

Mit Datenflüssen können Sie Daten aus Datasets, Themenbereichen oder Datenbankverbindungen kuratieren.

Sie können Datenflüsse individuell oder in einer bestimmten Abfolge ausführen. Sie können mehrere Datenquellen in einen Datenfluss aufnehmen und angeben, wie diese verbunden werden sollen.

Mit dem Schritt Daten hinzufügen können Sie Daten zu einem Datenfluss hinzufügen. Mit dem Schritt Daten speichern können Sie Ausgabedaten aus einem Datenfluss speichern.

Sie können die Ausgabedaten aus einem Datenfluss in einem Dataset oder einem der unterstützten Datenbanktypen speichern. Wenn Sie Daten in einer Datenbank speichern, können Sie die Datenquelle transformieren, indem Sie sie mit Daten aus dem Datenfluss überschreiben. Die Datenquellen- und die Datenflusstabelle müssen sich in derselben Datenbank befinden und denselben Namen aufweisen. Erstellen Sie zunächst eine Verbindung zu einem der unterstützten Datenbanktypen.

Hinweis:

Sie können Daten aus Remotedatenbanken hinzufügen, die mit Data Gateway verbunden sind. Allerdings können Daten nicht wieder in Remotedatenbanken, die mit Data Gateway verbunden sind, zurückgespeichert werden.

Datenausgabe

Sie können Ausgabedaten aus Datenflüssen in den folgenden Datenbanktypen speichern:
  • Oracle Autonomous Data Warehouse
  • Oracle Autonomous Transaction Processing
  • Oracle Database
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • Spark

Informationen zur Datenbankversion finden Sie unter Unterstützte Datenquellen.

Dateneingabe

Sie können Daten aus den meisten Datenbanktypen in Datenflüsse eingeben (außer Oracle Essbase und EPM Cloud).