ビジュアライゼーション・データの融合


オプション



始める前に

目的

このチュートリアルでは、Oracle Visual Analyzerを使用して外部データ・ソースのデータと、ビジュアライゼーション・プロジェクト内の既存データ・ソースのデータを融合する方法について学びます。

所要時間

約30分

背景

Oracle Data Visualizationを使用して、すべてのビジネス・ユーザーがアクセスできる内容の濃い強力な視覚的表現の分析を作成できます。組織内のあらゆる階層のユーザーが、たった数回のクリック操作でデータを融合し分析できるため、雑然としたデータを効果的に探索し、データに隠されているパターンや対応につながる洞察を素早く見出し、共有できます。

Oracle Data VisualizationはOracle Data Visualization Cloud Service (DVCS)およびOracle Business Intelligence Cloud Service (BICS)の一部として利用できます。

このチュートリアルではOracle BICSに含まれるOracle Data Visualizationの使用方法について学びます。このチュートリアルで習得したスキルはOracle DVCSのOracle Data Visualizationでも活用できます。Oracle DVCSまたはOracle BICSにサインインし、新しいプロジェクトを作成する最初のステップを完了すれば、それより後のOracle Data Visualization機能について相違はありません。

あらかじめ用意されているサブジェクト領域データ・ソースに加え、自分のExcelスプレッドシートのデータもVisual Analyzerで探索できます。スプレッドシートからデータをアップロードし、ビジネスに関する洞察を高めるためのビジュアライゼーションを作成します。それらのデータは単独でも探索できますが、一致するデータ要素があればサブジェクト領域データに融合できます。

このチュートリアルで使用するスプレッドシートには、既存ソースの属性を拡張する新規ディメンションと、ソース内の既存メジャーと一緒に使用できる新規ファクトが含まれています。

ファクト・スプレッドシートの列には定義に組み込まれている集計を持つメジャーが含まれています。メジャーは通常、売上額や販売数量のような計算データで、ディメンションに関して指定できます。たとえば、特定の期間の特定の市場における特定の製品に関するドル合計を確認できます。各メジャーには、SUM、AVG、MIN、MAXなど、独自の集計ルールがあります。

ディメンション・スプレッドシートの列には、ビジネスを定義する属性のカテゴリが含まれています。ビジネスでは、ファクトを使用して、時間、製品、市場など、確立済のディメンションごとにパフォーマンスを測定します。各ディメンションには、一連の説明属性があります。ディメンション表には、ビジネス・エンティティ(顧客名、地域、住所、国など)を説明する属性が格納されています。

シナリオ

Electronics事業の販売ファクト・データをSampleAppサブジェクト領域にモデル化し、Oracle BI Cloud Service上に保管しています。Fitness and Sports事業の販売ファクト・データはスプレッドシートに保存されています。業績を比較するため、Electronics事業のファクト・データとFitness and Sports事業のファクト・データを融合します。Visual Analyzerを使用して、スプレッドシートに保存されているFitness and Sports事業のファクト・データをロードし、サブジェクト領域ファクトを追加メジャーで拡張して、2つのデータ・セットを探索できるビジュアライゼーションを作成します。

スプレッドシートには追加となるディメンション・データも含まれています。Electronics事業のディメンション・データとFitness and Sports事業のディメンション・データを融合し、SampleAppサブジェクト領域ディメンションを追加の属性で拡張します。Visual Analyzerを使用して、スプレッドシートに保存されているFitness and Sportsのディメンション・データをロードし、サブジェクト領域ディメンションを追加属性で拡張して、2つのデータ・セットを探索できるビジュアライゼーションを作成します。製品のブランド変更と新しいブランドの追加も行っています。古いブランドと新しいブランドの比較も実施しようと考えています。

コンテキスト

このチュートリアルはシリーズ構成の一部分です。チュートリアルは単独でも実施できますが、次の順序で実施することをお薦めします。

この順序でチュートリアルを実施する場合、次の順序でタスクが提示されます。

タスク・フロー

前提条件

このチュートリアルを開始する前に、次の前提条件を確認してください。

  • Visual Analyzerが含まれているOracle BI Cloud Serviceにアクセスできることを確認してください。
  • データ・ソース・スプレッドシートをコンピュータ上に用意しておく必要があります。ここからfiles.zipをダウンロードします。files.zipをコンピュータ上のフォルダに解凍します。フォルダ・パスをメモしておきます。SportsSales.xlsxXSA_ World_Statistics_v2.xlsxXSA Dim Rebrand.xlsxの3つのスプレッドシートが手元にあることを確認してください。

Visual Analyzerプロジェクトの作成

この項では、Oracle Cloud Serviceにサインインし、SampleAppデータ・ソースを使用して新しいVisual Analyzerプロジェクトを作成します。

  1. ブラウザにOracle CloudページのURLを入力し、ドメイン名を入力します。ドメイン名を保存する場合は、将来のサインインのためアイデンティティ・ドメインの選択を保存するをクリックします。「実行」をクリックします。

  2. ユーザー名およびパスワードを入力します。

    Oracle BI Cloud Serviceのホーム・ページが表示されます。

  3. 右側の「VAプロジェクト」をクリックします。

  4. 「Visual Analyzerプロジェクト」セクションで、右側にある「プロジェクトの作成」をクリックします。

  5. 「データ・ソースの追加」ウィンドウで「SampleApp」サブジェクト領域を選択し、「プロジェクトに追加」をクリックします。

  6. 「データ要素」ペインにSampleAppデータ要素が表示されます。これらのデータ要素を使用してデータ・ビジュアライゼーションを作成します。「プロジェクトの保存」をクリックします。

新規メジャーの追加によるファクトの拡張

データ・ソースは、属性を追加することでディメンションを拡張するか、またはメジャーおよびオプション属性を追加することでファクトを拡張できます。この項では、新規メジャーを持つデータ・ソースを追加してファクトを拡張します。これらのメジャーはSampleAppソース内の既存のメジャーと一緒に使用できます。

  1. 「データ・ソース」ペインを選択します。

  2. ページ下部の「データ・ソースの追加」リンクをクリックします。

  3. 事前にアップロードして保存したファイルがないため、「新規データ・ソースの作成」をクリックします。プロジェクトで使用できるファイルが前もって追加されている場合は、「データ・セット」をクリックします。

  4. 「新規データ・ソースの作成」ダイアログで「ファイルから」をクリックします。

  5. files.zip (このチュートリアルの前提条件の項を参照)を解凍した場所にナビゲートし、SportsSales.xlsxスプレッドシートを開きます。ファイルのソース名と説明を変更するオプションを使用できます。メジャーを追加するため、「ファイル・データにより次の処理が実行されます」「ファクトの追加」はそのままにしておきます。

  6. スクロールしてデータのサンプルをプレビューします。列は、メジャーまたは属性として追加されるか、既存のプロジェクト・データ・ソースの列とマッチングされます。ファクトを追加するため、メジャー列は属性に変換されません。

  7. このスプレッドシートには、SampleAppサブジェクト領域のCust NumberAddress KeyおよびDateと一致する3つの列があります。名前およびデータ型がサブジェクト領域内の列と一致するため、これらの列はマッチング列として自動的に選択されます。プロジェクトに追加をクリックします。

  8. ファイルの追加後、ソース・ダイアグラムを使用して両データ・ソースのマッチング列を確認できます。SportsSalesを右クリックし、「ソース・ダイアグラム」を選択します。

  9. ソース・ダイアグラムが表示されます。ソースを接続する線上の数字をクリックし、「ソースの接続」ダイアログを表示します。

  10. 「ソースの接続」ダイアログが表示されます。「ソースの接続」ダイアログで、必要な変更を加えます。たとえば、列の照合の変更や、照合の追加と削除、メジャー列の集計タイプの指定などを実行できます。この例では変更は加えません。列をそのままの状態にしておきます。「取消」をクリックし、「ソースの接続」ダイアログを閉じます。

    「ソースの接続」ダイアログ
  11. ソース・ダイアグラムを閉じます。

  12. プロジェクトを保存します。

  13. 「データ要素」ペインに、SampleAppデータ要素と並んでSportSalesデータ要素が表示されます。サブジェクト領域から作成するのと同じ方法で、これらの列を使用してビジュアライゼーションを作成できます。

拡張されたファクトを使用したビジュアライゼーションの作成

この項では、様々なタイプのビジュアライゼーションを使用してデータを探索します。

    事業に与える割引効果の探索

    SportsSalesスプレッドシートからアップロードしたデータ要素を使用してビジュアライゼーションを作成します。

    1. SportsSalesサブジェクト領域から次のデータ要素を選択し、キャンバスにドラッグします。

      • SP Revenue
      • SP Units
      • SP Product

      「探索」ペインが表示され、直感的に最良であると思われるビジュアライゼーションがOracle Visual Analyzerによって作成され、属性とメジャーも最良と思われる場所に自動的に配置されます。この例では、このデータ要素セットの最良のビジュアライゼーションは散布図となりました。

    2. 売上が最も大きかった製品を確認するには、最高位にあるバブル上にカーソルを重ねると、最高のSP RevenueSP Unitsが表示されます。

    3. 利幅の少ない安価な製品を確認するには、次に示すようにSP Unitsの位置が2番目に高く、SP Revenueが小さいバブルにマウスを重ねます。

    4. 割引によって販売が増えるかどうかを確認するため、「SP Discount」「サイズ」領域にドラッグします。割引が大きいと売上が伸びることがわかります。

    5. 売上上位5製品を選択し、「アクション」メニューで使用できるオプションを確認します。

    6. 業績が好調なチャネルを確認するには、「SP Channel」「形状」領域にドラッグします。販売が好調なチャネルは店舗だったことがわかります。

    各顧客セグメントの業績の探索

    SportsSalesサブジェクト領域からのメジャーおよび属性と、SampleAppサブジェクト領域からの属性を使用してビジュアライゼーションを作成します。

    1. SportsSalesおよびSampleAppサブジェクト領域の次のデータ要素をキャンバスにドラッグします。

      • SP Revenue
      • SP Product Type
      • Cust Segment

      デフォルトで、このデータ要素セットのビジュアライゼーションは積上げ横棒グラフです。Seniorsの売上への貢献は低いことがわかります。

    2. 「SP Discount」「サイズ」領域にドラッグし、その他のタイプのビジュアライゼーションを探索します。

    3. 特定の製品タイプの販売を確認するには、「SP Product Type」を上部のフィルタ・バーにドラッグし、SP Product Typeのフィルタを追加します。

    4. 次の製品タイプを選択します。

      • Comps
      • InGym
      • Strength
    5. 散布図から、これらの3製品が事業の50%以上を占めていることが簡単にわかります。

    6. フィルタを削除します。

    年成長の探索

    SportsSalesおよびSampleAppサブジェクト領域からのデータ要素を使用してビジュアライゼーションを作成します。

    1. SportsSalesおよびSampleAppサブジェクト領域の次のデータ要素をキャンバスにドラッグします。

      • SP Revenue
      • Time > Month#

      このデータ要素セットのデフォルトのビジュアライゼーションは散布図です。関連性をより明確にするため、ビジュアライゼーションを折れ線グラフに変更します。

    2. Time > Month#Time > Monthに置換します。2011年以降、目覚ましい成長を遂げていることがわかります。

    3. この成長に大きく寄与した顧客セグメントを調べます。「Customer > Cust Segment」「色」として追加します。売上拡大をけん引したのはActive Singlesだったことが明確にわかります。

    トレリス・ビューを使用した探索

    SportsSalesからのメジャーとSampleAppサブジェクト領域からのメジャーと属性を使用して、ビジュアライゼーションを作成します。

    1. SportsSalesおよびSampleAppサブジェクト領域の次のデータ要素をキャンバスにドラッグします。

      • SP Revenue
      • Revenue Metrics > Revenue
      • Customers > Cust Segment

      このデータ要素セットのデフォルトのビジュアライゼーションは散布図です。必要であれば次のように、キャンバスの左側にビジュアライゼーションをドラッグします。

    2. 「Time >Year」「トレリス行」領域にドラッグし、「Cust Segment」「色」領域にドラッグします。グラフにこれらの3年間のトレリス・ビューが表示されます。

新規属性の追加によるディメンションの拡張

データ・ソースは、属性を追加することでディメンションを拡張するか、またはメジャーおよびオプション属性を追加することでファクトを拡張できます。この項では、新規の属性を持つデータ・ソースを追加してディメンションを拡張します。これらの属性はSampleAppソース内の既存の属性と一緒に使用できます。

  1. Geographyディメンションに対する追加属性が含まれているスプレッドシートをロードします。左上隅の「データ・ソース」をクリックします。

  2. 下にある「データ・ソースの追加」リンクをクリックします。

  3. 事前にアップロードして保存したファイルがないため、「新規データ・ソースの作成」をクリックします。プロジェクトで使用できるファイルが前もって追加されている場合は、「データ・セット」をクリックします。

  4. スプレッドシートを「新規ソースの作成」ウィンドウにドラッグできます。または、「ファイルから」ボタンをクリックし、スプレッドシートを選択します。

  5. 前提条件の項で説明したfiles.zipの解凍先フォルダから、XSA World Statistics_v2.xlsxスプレッドシートを開きます。

  6. アップロードされたファイルの「ソース名」「説明」をわかりやすい記述に変更します。たとえば、ソース名としてWorld Statisticsと指定します。スプレッドシート・ファイルに複数のシートが含まれている場合は、「シート」リストから適切なシートを選択できます。このアップロード済のファイルにはWorld Statisticsという名前のシートしか含まれていません。

  7. 「ファイル・データにより次の処理が実行されます」の横のリンクをクリックし、「ファクトの追加」ではなく「ディメンションの拡張」に設定します。このファイルを使用してGeographyディメンションに属性を追加します。

  8. ソースを変更してディメンションを拡張すると、すべてのデータ要素が属性として処理されます。右にスクロールして、列が属性に変換されていることを確認します。削除する列がある場合は、列を選択し、列の横にあるアイコンをクリックします。列が使用できなくなります。「GDP(nominal) in M USD」列をロード対象から除外します。

  9. 既存サブジェクト領域内の列と同じ名前およびデータ型の列が外部データ・ソースに含まれている場合、それらの列はマッチング列として自動的にマークが付きます。スプレッドシート内の「Name」列には一意の国名が格納されていますが、一致していることが明白である列はサブジェクト領域にありません。どの列が「Name」列と一致するのかは自分では理解しています。「照合」オプションを選択します。

  10. 「照合」オプションを選択し、「列の選択」ドロップダウン・リストを使用してSampleAppサブジェクト領域の列を選択し、スプレッドシート内の「Name」列にマッチングさせます。

  11. 「列の選択」ドロップダウン・リストで「Geography」を展開し、「Country Name」を選択します。プロジェクトに追加をクリックします。

  12. スプレッドシートがアップロードされると、ファイルがサブジェクト領域に接続されていることを確認できます。「データ要素」ペインで「World Statistics」データ・セットを選択し、右クリック・メニューから「ソース・ダイアグラム」を選択します。

    「ソース・ダイアグラム」ダイアログ・ボックスが表示されます。

  13. 「ソース・ダイアグラム」ダイアログ・ボックス内の数字をクリックし、「ソースの接続」ダイアログ・ボックスを表示します。

  14. 必要であれば、「ソースの接続」ダイアログ・ボックスでさらに照合を追加して、「OK」をクリックします。「ソースの接続」ダイアログ・ボックスを閉じます。

  15. スプレッドシートが列とともに「データ・ソース」リストに表示されるため、サブジェクト領域の列を使用する場合と同じように、それらの列を使用できます。データ・ソースの追加時にGDP (nominal) in M USD列は除外したため、この列は表示されません。

拡張されたディメンションを使用したビジュアライゼーションの作成

この項では、様々なビジュアライゼーションを使用してデータを探索します。

    スプレッドシートおよびサブジェクト領域の列を使用したピボット表の作成

    次のデータ項目を使用して、ピボット表を作成します。

    • World Statistics > Name
    • World Statistics > Language
    • World Statistics > Capital City
    • World Statistics > Currency
    • World Statistics > GDP Band $B
    • SampleApp > Revenue Metrics > Revenue
    1. スプレッドシートから列を選択し、キャンバスにドラッグします。すべての列を一度に選択するには、[Ctrl]キーを使用します。

      選択されたデータ要素に最適なビジュアライゼーションがVisual Analyzerによって選択されます。この場合、データはピボット表に表示されます。

    2. 「探索」ペインで、「列」領域のすべてのデータ要素を「行」領域にドラッグします。

    3. これらの国の売上を調べます。サブジェクト領域の「Revenue」をキャンバスにドラッグします。

      Visual Analyzerで「Revenue」は値として処理されています。

    スプレッドシートおよびサブジェクト領域からの列を使用したマップの作成

    次のデータ項目を使用してマップを作成します。

    • World Statistics > Name
    • SampleApp > Revenue Metrics > Revenue
    1. スプレッドシートから列を選択し、キャンバスにドラッグします。すべての列を一度に選択するには、[Ctrl]キーを使用します。

    2. 右クリックして、「ビジュアライゼーションの選択」を選択します。

    3. 「マップ」ビジュアライゼーションを選択します。

    4. マップのプロパティを変更します。

    5. 「ズーム制御」を有効化します。

    6. ズーム制御を使用してマップを拡大します。

さらに学習するには