コンテキスト・インサイトによって生成されるビジュアライゼーションの理解
コンテキスト・インサイト・アルゴリズムは、様々なインサイトをレンダリングするための様々なタイプのビジュアライゼーションを生成し、機能上の関心のレベル別にランク付けします。
これらのインサイトをランク付けするために、アルゴリズムは、関連する列を利用して様々な分析を実行し、選択したデータと他のデータとの間の重要なコントラストを示すデータを選択します。 インサイトが表示される順序は、データによって異なります。 各インサイトでは、選択内容がオレンジ色で表示され、残りのデータは青色で表示されます。
属性別内訳
コンテキスト・インサイトには、3つのタイプのブレークダウン・ビジュアライゼーションがあります。 ディストリビューションの全体的なシェイプは、選択したメンバーと他のデータとの比較をすばやく確認するのに役立ちます。
内訳は、棒が選択したデータの内訳を表し、線が残りのすべてのデータの内訳を表す二重軸棒グラフとして表すことができます。 メンバーは、残りのデータに基づいて最高から最低の順にソートされます。
たとえば、このインサイトでは、製品コンテナ別に売上が分類されます。 記載されている説明は、Small Box製品コンテナの場合、選択したデータの売上が他のデータと比較して大幅に低いことを示しています。 また、選択したデータのジャンボ・ドラムとジャンボ・ボックスの製品コンテナの売上は、他のデータよりもはるかに高いことも指摘しています。
「
図ci_breakdown_example.pngの説明」
ディメンション内訳は、各ドットが選択したデータの内訳を表し、線が残りのデータの内訳を表す二重軸散布図としても表すことができます。 メンバーは、残りのデータに基づいて最高から最低の順にソートされます。
たとえば、このインサイトでは、利益が製品サブカテゴリ別に分類されます。 利益のために選択されたデータは、電話および通信、バインダおよびバインダ・アクセサリ、椅子&チェアマットなどの製品サブカテゴリに大きな違いを示しています。
「
図ci_breakdown_example_2.pngの説明」
内訳はレーダー折れ線グラフとして表すこともできます。レーダー折れ線グラフでは、選択したデータ線と残りのデータ線の内訳が正規化されたスケールにインデックス付けされます。
たとえば、このインサイトでは、売上が出荷モード別に分類されます。 選択したデータのシェイプと残りのデータは、Delivery TruckとRegular Airの出荷モードに大きな違いを示しています。
「
図ci_breakdown_example_3.pngの説明」
傾向
トレンド・ビジュアライゼーションでは、選択したメトリックの相対的な増加と、各メトリックの進化を示す線を使用して残りのデータが比較されます。 アルゴリズムでは、「文法」ペインの「関連列」セクションに表示される最初の日付列を使用します。
各行は、初期期間に設定された1.00のベース索引値で始まります。 時間の経過に伴うメトリックの展開は、初期期間の1.00の索引値と比較した次の期間の相対値を示します。 メトリックの絶対値を確認する場合、値の不一致により、時間の経過とともに成長または低下を適切に比較することが困難になります。
たとえば、このインサイトでは、出荷日別の売上のトレンドが表示されます。 この説明は、時間の経過に伴う販売の全体的なパフォーマンスに関する追加のインサイトを提供します。 また、この説明では、データの選択と残りのデータ(この場合は2014年から2015年)の間のトレンドに大きな違いがあるデータの間隔も強調されています。
「
図ci_trending_example.pngの説明」
値のトレンド
このタイプのトレンド・ビジュアライゼーションは、導出された「日付」列または「時間」列別のメトリックのトレンドを示します。 トレンド・チャートは開始値で索引付けされますが、値のトレンド・チャートは索引付き以外の二重軸チャートです。 値トレンド・チャートは、選択したデータと、選択した導出日時列の残りのデータとの差異を識別するのに役立ちます。
たとえば、このインサイトでは、出荷日(Month of Year)という導出された日付列に対する利益の値トレンドが表示されます。
「
図ci_value_trending_example.pngの説明」
相関
このタイプのチャートでは、選択したデータを他のデータと比較することで、様々なメトリックが別の特定のメトリックとどのように相関しているかをビジュアル化します。 相関を並べて表示することで、このビジュアライゼーションでは、2つのデータ・グループ間の顕著な類似点および相違点が強調表示されます。 相関ビジュアライゼーションは、少なくとも1つのメトリックが、選択したデータと残りのデータの間の相関に有意な差異を示している場合にのみ使用できます。 これらのメトリックの相関は、ソース・ビジュアライゼーションの最も詳細なレベルのデータで計算されます。
たとえば、このインサイトでは、売上と他の使用可能なビジネス・メトリック(Profit、Quantity Ordered、Shipping CostおよびGross Unit Price)との相関パターンが示されます。
「
図ci_metric_correlation_example.pngの説明」
上位差異
これはブレークダウン・チャートのタイプです。 選択したデータと残りのデータの間のメトリックのパターンを比較し、最も大きな差異がある上位10のケースに焦点を当てます。 市区町村や製品など、カーディナリティが高い属性を処理する場合、このチャートではメトリックの最も重要なバリエーションが強調表示されます。
たとえば、このインサイトには、選択したデータと残りのデータの間で売上が最も(高いか低いかに関係なく)異なる10の都市が表示されます。
「
図ci_top_differences_example.pngの説明」
80/20
このタイプのビジュアライゼーションでは、メトリック値がレコードの上位20%で構成されている割合と、メトリックでデータが順序付けられている場合のレコードの下位80%で構成される割合が示されます。 ビジュアライゼーションは、残りのデータについても同じように表示されます。 これは、ソース・ビジュアライゼーション内の最も詳細なレベルのデータで計算されます。
たとえば、このインサイトでは、2つのバーを使用して80/20の比率が売上でソートされて表示されます: 1つ目は残りのデータ用、2つ目は選択したデータ用です。 説明は、2つの間で比例が著しく異なるという事実を強調しています。
「
図ci_80_20_example.pngの説明」