Omówienie wizualizacji generowanych przez funkcję "Spostrzeżenia kontekstowe"

Algorytm funkcji "Spostrzeżenia kontekstowe" generuje wiele typów wizualizacji w celu renderowania różnych spostrzeżeń, które są szeregowane na podstawie poziomu przydatności.

Aby uszeregować te spostrzeżenia, algorytm uruchamia różne analizy, wykorzystując powiązane kolumny, i wybiera te, w których dane wykazują istotny z analitycznego punktu widzenia kontrast między wyborem użytkownika a resztą danych. Kolejność wyświetlania spostrzeżeń zależy od danych. W każdym spostrzeżeniu dane wybrane przez użytkownika wyświetlane są na pomarańczowo, a pozostałe na niebiesko.

Rozkład wg atrybutu

W spostrzeżeniach kontekstowych są prezentowane trzy typy wizualizacji rozkładu. Ogólny kształt rozkładu pozwala szybko zauważyć, które elementy w danych wybranych przez użytkownika znacznie kontrastują z pozostałymi danymi.

Rozkład może być przedstawiany jako dwuosiowy wykres słupkowy, na którym słupki reprezentują rozkład wybranych danych, a linia - rozkład wszystkich pozostałych danych. Elementy są sortowane malejąco na podstawie pozostałych danych.

Na przykład w tym spostrzeżeniu sprzedaż jest podzielona według pojemnika produktu. Z podanego opisu wynika, że w przypadku pojemnika produktu "Small Box" wybrane dane charakteryzują się znacznie niższą sprzedażą w porównaniu z pozostałymi danymi. Wskazuje też, że pojemniki produktów "Jumbo Drum" i "Jumbo Box" dla wybranych danych wykazują znacznie wyższą sprzedaż niż w przypadku pozostałych danych.
Opis "GUID-83A2EFAB-B373-44A5-822B-864E69DD5711-default.png" znajduje się poniżej
.png"

Rozkład wymiarowy może być również przedstawiany jako dwuosiowy wykres punktowy, gdzie każdy punkt reprezentuje rozkład wybranych danych, a linia - rozkład pozostałych danych. Elementy są sortowane malejąco na podstawie pozostałych danych.

Na przykład w tym spostrzeżeniu przedstawiany jest rozkład zysku według podkategorii produktu. W danych wybranych dla wartości "Profit" są widoczne istotne różnice dla takich podkategorii produktów jak "Telephones and Communication", "Binders and Binder Accessories" oraz "Chairs & Chairmats".
Opis "GUID-23A0AB0F-1994-4D39-A1E3-A4E6AA2C184B-default.png" znajduje się poniżej
.png"

Rozkład może być również przedstawiony jako liniowy wykres radarowy, na którym rozkład linii wybranych danych i linii pozostałych danych jest indeksowany do znormalizowanej skali.

Na przykład to spostrzeżenie przedstawia rozkład wartości "Sales" według parametru "Ship Mode". Kształty wybranych danych i pozostałych danych wskazują na znaczące różnice dla trybów wysyłki "Delivery Truck" i "Regular Air".
Opis "GUID-C42B2C08-9E1A-4773-8A2E-2E0E14EA3CAF-default.png" znajduje się poniżej
.png"

Trendy

Wizualizacje trendów umożliwiają porównywanie względnego wzrostu miary w czasie dla danych wybranych przez użytkownika i pozostałych danych, używając linii w celu przedstawienia ewolucji każdego z tych rodzajów danych. Algorytm wykorzystuje pierwszą kolumnę daty, która pojawia się w sekcji "Powiązane kolumny" w okienku "Gramatyka".

Każda linia rozpoczyna się od wartości bazowej indeksu wynoszącej 1.00, ustalonej dla okresu początkowego. Ewolucja miary w czasie pokazuje wartość względną w następnych okresach w porównaniu z wartością indeksu wynoszącą 1.00 w okresie początkowym. W przypadku analizowania wartości bezwzględnych miary rozbieżności w wartościach utrudniają prawidłowe porównanie wzrostu lub spadku w czasie.

Na przykład w tym spostrzeżeniu pokazano trend sprzedaży według daty wysyłki. Opis zawiera dodatkowe spostrzeżenia na temat ogólnych wyników sprzedaży w czasie. W opisie zaznaczono również interwały w ramach danych, w których występuje znacząca różnica w trendzie między danymi wybranymi przez użytkownika a pozostałymi danymi, w tym przypadku od 2014 r. do 2015 r.
Opis "GUID-86D4AD9F-CB88-45DE-BC41-E1E52FFEDD3F-default.png" znajduje się poniżej
.png"
.

Trendy wartości

W tego typu wizualizacji trendów jest przedstawiany trend miary według kolumn pochodnej daty lub godziny. Podczas gdy wykresy trendów są indeksowane w wartościach początkowych, wykresy trendów wartości są nieindeksowanymi wykresami dwuosiowymi. Wykresy trendów wartości są przydatne do identyfikowania różnic między wybranymi danymi a pozostałymi danymi w wybranej kolumnie pochodnej daty lub godziny.

Na przykład to spostrzeżenie przedstawia trend wartości "Profit" w kolumnie daty pochodnej o nazwie "Ship Date (Month of Year)".
Opis "GUID-2C0247D5-7827-49ED-B40D-6AF251C32F89-default.png" znajduje się poniżej
.png"

Korelacja

Na wykresie tego typu przedstawiany jest sposób, w jaki różne miary korelują z inną określoną miarą, poprzez porównanie wybranych danych z pozostałymi danymi. Wyświetlając te korelacje obok siebie, wizualizacja ta podkreśla wszelkie zauważalne podobieństwa i różnice między tymi dwiema grupami danych. Wizualizacje korelacji są dostępne tylko wtedy, gdy co najmniej jedna miara wykazuje istotną różnicę w korelacji między wybranymi danymi a pozostałymi danymi. Korelacje dla tych miar są obliczane na najbardziej szczegółowym poziomie danych dla wizualizacji źródłowej.

Na przykład to spostrzeżenie przedstawia wzorce korelacji między wartością "Sales" a innymi dostępnymi miarami biznesowymi o nazwach "Profit", "Quantity Ordered", "Shipping Cost" i "Gross Unit Price".
Opis "GUID-FA7404C9-A2EF-429F-8D43-DE7059E7872C-default.png" znajduje się poniżej
.png"

Największe różnice

Jest to rodzaj wykresu rozkładu. Umożliwia porównywanie wzorców miary między wybranymi danymi a pozostałymi danymi, koncentrując się na 10 czołowych przypadkach o największych różnicach. W przypadku atrybutów o wysokiej kardynalności, na przykład miast lub produktów, na wykresie tym wyróżniane są najbardziej znaczące różnice w metryce.

Na przykład w tym spostrzeżeniu jest wyświetlanych dziesięć miast, w których sprzedaż wykazuje największe różnice (niezależnie od tego, czy są to różnice na plus czy na minus) między wybranymi danymi a resztą danych.
Opis "GUID-2E0228F5-B335-4771-9158-4D68A36FD246-default.png" znajduje się poniżej
.png"

80/20

Ten typ wizualizacji pokazuje, w jakiej proporcji wartość miary składa się z górnych 20% rekordów, a w jakiej proporcji z dolnych 80% rekordów w przypadku uporządkowania danych według określonej miary. W wizualizacji widoczne są również analogiczne wyniki dla pozostałych danych. Obliczenia są wykonywane na najbardziej szczegółowym poziomie danych w wizualizacji źródłowej.

Na przykład to spostrzeżenie pokazuje proporcje 80/20, posortowane według sprzedaży, przy użyciu dwóch słupków: pierwszy dotyczy pozostałych danych, a drugi danych wybranych przez użytkownika. W opisie podkreślono fakt, że obie proporcje znacząco się różnią.
Opis "GUID-EE1240F2-7986-42F4-A139-CCDC472D6396-default.png" znajduje się poniżej
.png"