データ・フローについて
データ・フローでは、データを整理および統合して、ユーザーがビジュアル化できるキュレートされたデータセットを作成できます。
データ・フローを使用すると、手動コーディングのスキルがなくてもデータを視覚的に操作できます。
たとえば、データ・フローを使用して、次のことを実行できます:
- データセットの作成。
- ソースが異なるデータの結合。
- データの集計。
- 機械学習モデルのトレーニングまたはデータへの予測機械学習モデルの適用。
- OCI Visionサービスによる人工知能を使用した、オブジェクト検出、イメージ分類またはテキスト検出の実行。
データ・フローは、データ・フロー設計ペインに作成します。
図data-flow-designer-new.pngの説明
データ・フローを構築するには、ステップを追加します。各ステップでは、データの追加、表の結合、列のマージ、データの変換など、特定の機能を実行します。ステップを追加して構成するには、データ・フロー・エディタを使用します。各ステップは、追加または変更時に検証されます。データ・フローを構成したら、それを実行してデータセットを作成または更新します。
独自の列を追加したりデータを変換する際には、様々なSQL演算子(BETWEEN、LIKE、INなど)、条件式(CASEなど)、および関数(Avg、Median、Percentileなど)を使用できます。
データ・フローによって生成されたデータセットの更新
データ・フローを再実行して、データセットを最新の状態に保つことができます。
ノート:
データ・フローを再実行すると、データ・フローの外部の出力データセットに直接適用された変換はすべて失われます。データセットは最初から再作成されます。データ・フローの制限
大量のデータを処理する場合は、データ・フローの制限があることに注意してください。「データ・フローの制限」を参照してください。
データ・フローのデータベース・サポート
データ・フローを使用すると、データセットおよびサブジェクト領域からデータをキュレートできます。
データ・フローにデータを追加するには「データの追加」ステップを使用し、データ・フローの出力データを保存するには「データの保存」ステップを使用します。
データ・フローからの出力データは、データセットまたはサポートされるデータベース・タイプのいずれかに保存できます。データベースにデータを保存する場合、データ・フローのデータで上書きすることにより、データ・ソースを変換できます。データ・ソースおよびデータ・フローの各表は同一データベースに含まれ、同じ名前である必要があります。開始する前に、サポートされているデータベース・タイプのいずれかへの接続を作成します。
データ出力
- Oracle Autonomous Data Warehouse
- Oracle Autonomous Transaction Processing
- Oracle Database
- Apache Hive
- Hortonworks Hive
- MapR Hive
- スパーク
データ入力
データ・フローでは、データセットおよびサブジェクト領域からのデータを処理できます。データベースから直接データをプルすることはできません。最初にデータベース表からデータセットを作成する必要があります。