データ・フローを使用すると、キュレートされた(結合、整理および統合された)データ・セットを作成できます。
ここでは、キュレートされたデータ・セットをデータ・フローを使用して作成するための一般的なタスクを示します。
タスク | 説明 | 詳細情報 |
---|---|---|
データ・フローの作成 | 1つ以上のデータ・セットからデータ・フローを作成します。 | データ・フローの作成 |
フィルタの追加 | データ・フロー出力でのデータを制限するには、フィルタを使用します。 | データ・フローへのフィルタの追加 |
集計の追加 | データ・フロー内のデータをグループ化するには、集計関数を適用します。 | データ・フローへの集計の追加 |
データ・セットの列と行のマージ | データ・フロー内のデータ・セットの2つ以上の列と行を結合します。 | |
ビン化列の作成 | データ・セットにビン化列を追加するには、値を割り当てます。 | データ・フローでのビン化列の作成 |
データ・フローのシーケンスの作成 | データ・フローの順序リストを作成して保存します。 | データ・フローのシーケンスの作成 |
グループの作成 | データ・セット内の属性値のグループ列を作成します。 | データ・フローでのグループの作成 |
累積値の追加 | データ・フロー内で累積集計関数を適用することでデータをグループ化します。 | データ・フローへの累積値の追加 |
データベースへの出力データの保存 | データベースに接続し、データ・フローからデータベース内の表に出力データを保存します。 | データ・フローからデータベースへの出力データの保存 |
データ・フローの実行 | データ・セットを作成するには、データ・フローを実行します。 | データ・フローの実行 |
データ・フローの実行 | データ・セットを作成するかデータ・セット内のデータをリフレッシュするには、保存済データ・フローを実行します。 | データ・フローの実行 |
データ・フローでは、1つ以上のデータ・セットを取得し、整理および統合して、効果的なビジュアライゼーションを簡単に作成するために使用できるキュレートされたデータ・セットを作成できます。
Data Visualizationのデータ・フロー・エディタを使用して、既存のデータ・セットからの特定データの選択、変換の適用、結合およびフィルタの追加、不要な列の除去、新規派生メジャーの追加、派生列の追加、その他の操作の追加を行えます。次に、データ・フローを実行して、複雑なビジュアライゼーションを作成するために使用できるデータ・セットを作成します。
「データ・フローの作成」および「データ・フローの実行」を参照してください。
データを選択、制限およびカスタマイズするステップを追加して、データ・フローを作成します。
データ・フロー・エディタで実行できること
列の選択、追加および名前変更
集計の追加または調整
フィルタの追加
マージ列の作成
行のマージ
ビン化列の作成
シーケンスの追加
グループの作成
累積値の追加
ステップ名のカスタマイズ
データ・フローのスケジュール
別のデータ・セットの追加
次のヒントは、「ステップ・エディタ」ペインをより効果的に使用するために役立ちます。
「データ・フロー」エディタの下部にある「ステップ・エディタ」をクリックすることで、「ステップ・エディタ」ペインを表示または非表示にできます。
「データ・フロー」エディタの下部にある「データのプレビュー」をクリックすることで、「データのプレビュー」列ペインを表示または非表示にできます。
データ・フローに変更を加えると、「データのプレビュー」列ペインが自動的に更新されます。
たとえば、「列の選択」ステップを追加し、いくつかの列を削除してから、「集計」ステップを追加できます。「集計」ステップでの作業中は、「データのプレビュー」列ペインに、先ほど「列の選択」ステップで指定した列およびデータがすでに表示されています。
「自動適用」をクリックすることで、「データのプレビュー」列ペインでステップ変更を自動的にリフレッシュするかどうかを指定できます。
「データ・フロー・ステップ」パネルで「データの追加」を選択することで、別のデータ・セットを追加し、それをデータ・フロー内の既存のデータ・セットと結合できます。
データ・セットを追加すると結合が自動的に作成されますが、「結合」ダイアログで結合の詳細を編集できます。
Oracle Data Visualizationでは、データ・フローに対してステップを追加または削除すると、それらのデータ・フロー・ステップが検証されます。
(「列の追加」ステップまたは「フィルタ」ステップで)式を追加する場合は、「適用」をクリックしてステップを確定する必要があります。
「適用」をクリックせずに新規ステップをワークフロー・ダイアグラムに追加すると、式は適用されず、追加する次のステップで正しいデータが使用されません。
1つ以上のデータ・セットからデータ・フローを作成できます。データ・フローではキュレートされたデータ・セットが作成され、これを使用すると、わかりやすいビジュアライゼーションを簡単かつ効率的に作成できます。
フィルタを使用して、データ・フロー出力に含まれるデータの量を制限できます。たとえば、列の売上収益データを2010年から2017年までに制限します。
カウント、合計および平均などの集計関数を適用して、データをグループ化できます。
2つ以上の列を組み合せて1つの列として表示できます。たとえば、データ・フローの出力を使用して、番地、番地名、都道府県および郵便番号の列がビジュアライゼーションに1つの項目として表示されるように、これらの列をマージできます。
2つのデータ・セットの行をマージできます。結果には、両方のデータ・セットのすべての行、各データ・セットの一意の行、両方のデータ・セットで重複する行、または片方のデータ・セットの一意の行を含めることができます。
行をマージする前に、次を実行します。
各データ・セットの列の数が同じであることを確認します。
データ・セットの対応する列のデータ型が一致することを確認します。たとえば、データ・セット1の列1はデータ・セット2の列1と同じデータ型である必要があります。
メジャーをビン化すると、メジャーの値に基づいて新しい列が作成されます。一定の数の等しいサイズのビン(各ビンに同じ数の値など)を作成するか、各ビンに値の範囲を明示的に指定することによって、ビンに値を動的に割り当てることができます。
シーケンスは、指定されたデータ・フローの保存済順序リストであり、複数のデータ・フローを単一のトランザクションとして実行する場合に役立ちます。シーケンス内のいずれかのフローが失敗した場合、シーケンス内で行われたすべての変更がロールバックされます。
移動集計や累積集計などの累積集計関数を適用してデータをグループ化できます。移動集計では、ある行とその前の一定数の行の値を集計します。累積集計では、その前のすべての行の値を集計します。移動集計と累積集計はどちらもその前の行に基づいているため、行のソート順が重要です。この順序は集計の一部として指定できます。
データ・フロー・ステップの名前変更や、説明の追加または編集ができます。
データベースに接続し、データ・フローからそのデータベース内の表に出力データを保存できます。
保存済のデータ・フローを実行して、対応するデータ・セットを作成したり、データ・フローから作成されたデータ・セットのデータをリフレッシュしたりできます。
データ・フローの実行に関するノート:
保存済のデータ・フローを実行するには、最後のステップとして「データの保存」ステップを指定する必要があります。このステップをデータ・フローに追加するには、データ・フローの「アクション・メニュー」をクリックして、「開く」を選択します。ステップを追加した後、データ・フローを保存して、実行を再試行します。
新規データベース・データ・ソースを作成するときは、データベースの問合せモードを「ライブ」に設定します。問合せモードを「ライブ」に設定すると、データ・フローが(テータ・キャッシュではなく)データベースからのデータにアクセスできるようになり、結合などの負荷が高い操作をデータベースにプッシュできます。データ・セットの管理を参照してください。
データベース・ソースからのデータを使用するデータ・フローを更新する場合、データは、ソース・データベースの問合せモードに応じて、キャッシュされるかライブになります。
複雑なデータ・フローを実行すると長い時間がかかります。データ・フローの実行中に、アプリケーションの他の部分に移動して使用し、「データ・フロー」ペインに戻って、データ・フローのステータスを確認できます。
長時間実行中のデータ・フローを取り消せます。これを行うには、「データ・フロー」セクションに移動し、データ・フローの「アクション・メニュー」をクリックし、「取消」を選択します。
初めてデータ・フローを実行すると、新規データ・セットが作成されます。「データ」ページの「データ・セット」セクションでこれを確認できます。データ・セットには、データ・フローの「データの保存」ステップで指定した名前が含まれています。以前にデータ・フローを実行したことがある場合は、結果のデータ・ソースがすでに存在するため、そのデータがリフレッシュされます。