データ・フローについて

データ・フローでは、データを整理および統合して、ユーザーが分析できるキュレートされたデータ・セットを作成できます。

たとえば、オーダー・データを含む2つのデータ・セットをマージし、不要な列を削除し、オーダーの値を集計して、その結果をOrder Summaryという名前の新しいデータ・セットに保存できます。

図10-1 データ・フロー・エディタのデータ・フロー

図10-1の説明が続きます
「図10-1 データ・フロー・エディタのデータ・フロー」の説明

データ・セット、サブジェクト領域またはデータベース接続からデータをキュレートできます。データ・フローは、個別または順番に実行できます。データ・フローに複数のデータ・ソースを含め、それらの結合方法を指定できます。

データ・フローを構築するには、ステップを追加します。各ステップでは、データの追加、表の結合、列のマージ、データの変換、データの保存など、特定の機能を実行します。ステップを追加して構成するには、データ・フロー・エディタを使用します。各ステップは、追加または変更時に検証されます。データ・フローを構成したら、それを実行してデータ・セットを作成します。

ステップを追加するには、既存のステップを右クリックして「ステップの追加」をクリックするか、左側の「データ・フロー・ステップ」ペインからステップをドラッグしてデータ・フロー・エディタにドロップします。

独自の列を追加したりデータを変換する際には、様々なSQL演算子(BETWEEN、LIKE、INなど)、条件式(CASEなど)、および関数(Avg、Median、Percentileなど)を使用できます。

データ・フローからの出力データは、データ・セットまたはサポートされるデータベース・タイプのいずれかに保存できます。データベースにデータを保存する場合、データ・フローのデータで上書きすることにより、データ・ソースを変換できます。データ・ソースおよびデータ・フローの各表は同一データベースに含まれ、同じ名前である必要があります。開始する前に、サポートされているデータベース・タイプの1つへの接続を作成します。