Wzbogacanie wizualizacji o analizy statystyczne

Analizy statystyczne pozwalają wyróżniać klastry (zgrupowania) lub wartości odstające w skoroszytach, dodawać prognozy oraz pokazywać linie trendu i odniesienia.

Przed rozpoczęciem analizy statystycznej

Aby dodać do swoich skoroszytów analizy statystyczne, takie jak prognozy, wartości odstające czy linie trendu, można albo skorzystać z analiz gotowych do użycia, które są dostępne w okienku "Analizy" panelu "Dane", albo - chcąc mieć większą kontrolę nad konfiguracją - użyć funkcji w konstruktorze wyrażeń.

Oracle Analytics umożliwia dodawanie wielu analiz statystycznych z okienka "Analizy" panelu "Dane"; analizy te są w pełni skonfigurowane, tak że nie trzeba być specjalistą w dziedzinie statystyki, aby uzyskać odpowiednie wyniki.
Opis "GUID-F6772E69-9E99-49A9-9DFE-0679A982807A-default.png" znajduje się poniżej
.png"

Podstawowe opcje tych analiz można skonfigurować w okienku "Właściwości". Na przykład, jeśli wizualizacja analizuje wg miesiąca wydatki niespełniające zasad, można użyć opcji Okresy w celu określenia liczby miesięcy objętych prognozą; w tym przykładzie dla ustawienia 3 są prognozowane trzy miesiące (styczeń, luty i marzec), licząc od końcowego punkty danych dla grudnia.

Aby mieć większą kontrolę nad ustawieniami analizy statystycznej albo aby móc użyć analizy w innych wizualizacjach, warto rozważyć dodanie obliczenia i zdefiniowanie równoważnej funkcji za pomocą konstruktora wyrażeń. W tym celu należy w okienku "Dane" kliknąć Dodaj (+), po czym kliknąć Utwórz obliczenie, aby wyświetlić konstruktor wyrażeń. Na przykład można użyć funkcji FORECAST().
Opis "GUID-9C973284-481F-4C20-A5FE-390B986ABE0A-default.png" znajduje się poniżej
.png"

Zob. Tworzenie obliczanych elementów danych.

Dostęp do opcji analiz statystycznych można także uzyskać, klikając prawym przyciskiem myszy wizualizację, a następnie wybierając Dodaj statystyki.
Opis "GUID-F6872B62-DAFE-473D-AB9C-7E9C16446988-default.png" znajduje się poniżej
.png"

Jakie analizy statystyczne można dodać do wizualizacji?

Do swoich wizualizacji można dodać poniższe statystyki w celu zapewnienia lepszych spostrzeżeń dotyczących danych
Opis "GUID-F6772E69-9E99-49A9-9DFE-0679A982807A-default.png" znajduje się poniżej
.png"

Forecast

Funkcja forecast używa regresji liniowej do prognozowania przyszłych wartości na podstawie istniejących wartości z użyciem trendu liniowego.

Można określić liczbę okresów w przyszłości, dla których ma być prognozowana wartość na podstawie istniejących danych z ciągów czasowych. Zob. Dodawanie prognozy do wizualizacji.

Oracle obsługuje następujące typy modeli prognozy:

  • ARIMA (autoregresyjna zintegrowana średnia ruchoma) - Do użycia, jeśli wcześniejsze dane z ciągów czasowych są niesezonowe, ale dostarczają odpowiednią liczbę obserwacji (przynajmniej 50, lecz preferowane jest więcej niż 100 obserwacji) umożliwiających wyjaśnienie i przewidywanie przyszłości.
  • Sezonowa ARIMA - Do użycia, jeśli dane cechuje regularny wzorzec zmian, powtarzający się w poszczególnych okresach. Na przykład w danych miesięcznych może występować sezonowość, gdy większe wartości pojawiają się w miesiącach letnich, a mniejsze - w zimowych.
  • ETS (potrójne wygładzanie wykładnicze) - służy do analizowania powtarzających się danych z ciągów czasowych, które (dane) nie mają jasnego wzorca. Ten typ modelu tworzy wykładniczą średnią ruchomą, uwzględniającą tendencję danych do powtarzania się w czasie, w pewnych interwałach.

Aby mieć większą kontrolę nad ustawieniami lub aby używać prognozy w innych wizualizacjach, można utworzyć niestandardowe obliczenie z użyciem funkcji FORECAST. Zob. Funkcje analityczne.

Cluster

Funkcja cluster grupuje zestaw obiektów w taki sposób, aby obiekty z tej samej grupy były do siebie podobne i zbliżone bardziej niż do obiektów należących do innych grup. Na przykład na wykresie punktowym można za pomocą kolorów wyróżnić klastry różnych grup. Zob. Tworzenie klastra lub wartości odstającej w wizualizacji.

  • Klasteryzacja z użyciem algorytmu centroidów (K-Means) - Dzieli "n" obserwacji na "k" klastrów, w których każda obserwacja należy do klastra z najbliższą średnią, służąc jako prototyp klastra.
  • Klasteryzacja hierarchiczna - Tworzy hierarchię klastrów konstruowanych aglomeracyjnie (od dołu do góry) lub różnicująco (od góry do dołu).

Aby mieć większą kontrolę nad ustawieniami lub aby używać klastra w innych wizualizacjach, można utworzyć niestandardowe obliczenie z użyciem funkcji CLUSTER. Zob. Funkcje analityczne.

Outliers

Funkcja outliers wyświetla rekordy danych, które są najbardziej oddalone od oczekiwanych średnich poszczególnych wartości. Na przykład do tej kategorii zaliczają się wartości ekstremalne, najbardziej odstające od innych obserwacji. Wartości odstające mogą sygnalizować zmienność pomiaru, błędy eksperymentalne lub nowości. Jeśli do wykresu, w którym jest już używana funkcja cluster, zostanie dodana funkcja outliers, to wartości odstające będą obrazowane przy użyciu innych kształtów.

Dla funkcji outliers może być używana klasteryzacja z użyciem algorytmu centroidów lub klasteryzacja hierarchiczna. Zob. Tworzenie klastra lub wartości odstającej w wizualizacji.

Aby mieć większą kontrolę nad ustawieniami lub aby używać odstających w innych wizualizacjach, można utworzyć niestandardowe obliczenie z użyciem funkcji OUTLIER. Zob. Funkcje analityczne.

Linie odniesienia

Linie odniesienia definiują poziome lub pionowe linie na wykresie, odpowiadające wartościom z osi X lub Y. Zob. Dodawanie linii odniesienia do wizualizacji.

  • Linia - Można wybrać dla linii odniesienia obliczenie wartości średniej, minimalnej lub maksymalnej. Na przykład w branży lotniczej, jeśli liczba pasażerów zostanie przedstawiona na wykresie w funkcji czasu, to linia odniesienia może pokazywać, czy liczba pasażerów danym miesiącu jest powyżej czy poniżej średniej.
  • Przedział - Przedział reprezentuje górny i dolny zakres punktów danych. Można wybrać przedział niestandardowy lub funkcję odchylenia standardowego oraz wartość średnią, maksymalną lub minimalną. Na przykład, jeśli jest analizowana sprzedaż wg miesiąca i jest używany niestandardowy przedział referencyjny od wartości średniej do maksymalnej, można zidentyfikować miesiące, w których sprzedaż jest większa niż średnia, ale mniejsza niż maksymalna.

Linie trendu

Linia trendu pokazuje ogólny przebieg analizowanej miary. Jest to linia prosta łącząca pewną liczbę punktów na wykresie. Linia trendu pomaga przeanalizować określony kierunek grupy zbiorów wartości w wizualizacji. Zob. Dodawanie analiz statystycznych do wizualizacji.

  • Liniowy - Do użycia z danymi liniowymi. Dane są liniowe, jeśli wzorzec punktów danych przypomina linię prostą. Linia trendu liniowego pokazuje, że miara się zwiększa lub zmniejsza ze stałą szybkością.
  • Wielomianowy - Do użycia, gdy dane zmieniają się nieregularnie. Na przykład jest przydatny do analizowania zysków i strat z użyciem dużego zbioru danych.
  • Wykładniczy - Do użycia, gdy wartości danych zwiększają się lub zmniejszają z coraz to większą szybkością. Linii trendu wykładniczego nie można utworzyć, jeśli w danych występują wartości zerowe lub ujemne.

Aby mieć większą kontrolę nad ustawieniami lub aby używać linii trendu w innych wizualizacjach, można utworzyć niestandardowe obliczenie z użyciem funkcji TRENDLINE. Zob. Funkcje analityczne.

Dodawanie analiz statystycznych do wizualizacji

Analizy statystyczne pozwalają wyróżniać klastry (zgrupowania) lub wartości odstające w skoroszytach, dodawać prognozy oraz pokazywać linie trendu i odniesienia. Wybiera się je na karcie "Analizy" w okienku "Dane" w edytorze skoroszytu.

Alternatywnie do skoroszytu można dodawać prognozy, linie trendów i klastry przy użyciu funkcji analitycznych typu "tylko tekst". Zob. Funkcje analityczne.

  1. Na stronie startowej wskazać kursorem skoroszyt, kliknąć Czynności i wybrać Otwórz.
  2. Należy się upewnić, że w wizualizacji istnieją dane wymagane dla dodawanego typu analizy.
    Na przykład dla prognozy jest potrzeby przynajmniej jeden wymiar "czas" oraz miara.
  3. W panelu "Dane" lub "Gramatyka" kliknąć ikonę Analizy Użyć ikony "Analizy" z panelu "Dane" lub z panelu "Gramatyka", aby wyświetlić dostępne metody analizy statystycznej..

  4. Przeciągnąć i upuścić element Klaster lub Wartość odstająca z okienka Analizy do wizualizacji.
  5. Aby skonfigurować funkcję analityczną, kliknąć Właściwości w panelu "Gramatyka" i użyć opcji w okienku "Analizy".
Do opcji dotyczących analiz można również uzyskać dostęp, klikając wizualizację prawym przyciskiem myszy i wybierając polecenie Dodaj statystyki.

Dodawanie prognozy do wizualizacji

Do skoroszytów można dodawać prognozy na podstawie algorytmu ARIMA (autoregresyjna zintegrowana średnia ruchoma), Sezonowa ARIMA lub ETS (potrójne wygładzanie wykładnicze). Można na przykład prognozować temperatury w lecie na podstawie danych z poprzednich okresów letnich.

  1. Na stronie startowej wskazać kursorem skoroszyt, kliknąć Czynności i wybrać Otwórz.
  2. Należy się upewnić, że w wizualizacji istnieją dane wymagane dla dodawanego typu analizy.
    Na przykład dla prognozy jest potrzeby przynajmniej jeden wymiar "czas" oraz miara.
  3. W okienku "Dane" lub w okienku "Właściwości" kliknąć ikonę Analizy Aby wyświetlić dostępne metody analizy statystycznej, użyć ikony "Analizy" w okienku "Dane" lub w okienku "Właściwości".

  4. Przeciągnąć i upuścić element Prognoza z okienka Analizy do wizualizacji.
  5. Aby skonfigurować prognozę, kliknąć Analizy w okienku "Właściwości".
    Jeśli na przykład jest dodawana prognoza, można zmienić typ modelu lub liczbę okresów objętych prognozą.

Dodawanie linii odniesienia do wizualizacji

Linie odniesienia ułatwiają identyfikowanie średnich, median centyli i podobnych informacji w wizualizacji.

Do tworzenia linii i przedziałów odniesienia można używać kolumn miar, atrybutów, dat oraz dat pochodnych.

Daty pochodne to kolumny o różnych poziomach szczegółowości takich jak rok, kwartał, miesiąc i dzień. Oracle Analytics automatycznie generuje kolumny dat pochodnych dla dowolnych kolumn daty, godziny lub znacznika czasu w zbiorach danych.

Można powiązać parametr z wartością linii odniesienia lub zakresem przedziału odniesienia w wizualizacji, jeśli wartość parametru ma być wykorzystywana do umieszczania linii lub przedziału odniesienia w wizualizacji. Zob. Wiązanie parametru z linią lub przedziałem odniesienia.

Podczas konfigurowania linii odniesienia w okienku "Analizy" w okienku "Właściwości" w panelu "Gramatyka" można na przykład wybrać opcję Typ, aby wyświetlić linię lub przedział, opcję Funkcja, aby zmienić linię domyślną na "Średnia", "Centyl" lub "N czołowych", albo opcję Porządek Z dla kolumn daty i porządku daty, aby umieścić linię odniesienia przed lub za wizualizacją. W przypadku wybrania kolumny z atrybutem innym niż data, na przykład "Miasto", można wybrać Wartość, na przykład "Chicago", według której ma być wyświetlana linia odniesienia.

  1. Na stronie startowej wskazać kursorem skoroszyt, kliknąć Czynności i wybrać Otwórz.
  2. W okienku "Dane" kliknąć ikonę Analizy Ikona "Analizy" służy do dodawania zaawansowanych funkcji analitycznych.
  3. Kliknąć Dodaj statystyki Ikona "Dodaj statystyki" służy do dodawania analizy statystycznej., po czym wybrać Linia odniesienia.
  4. Użyć opcji Kolumna w celu wyboru miary, daty lub atrybutu innego niż data.
  5. W okienku "Analizy" wybrać właściwości do zaktualizowania.
  6. Kliknąć Zapisz.

Tworzenie klastra lub wartości odstającej w wizualizacji

Dodawanie klastrów lub wartości odstających do skoroszytów.

  1. Na stronie startowej wskazać kursorem skoroszyt, kliknąć Czynności i wybrać Otwórz.
  2. Należy się upewnić, że w wizualizacji istnieją dane wymagane dla dodawanego typu analizy.
    Na przykład dla prognozy jest potrzeby przynajmniej jeden wymiar "czas" oraz miara.
  3. W panelu "Dane" kliknąć Analizy Aby wyświetlić dostępne metody analizy statystycznej, użyć ikony "Analizy" w panelu "Dane" lub w okienku "Właściwości"..

  4. Przeciągnąć elementy Klastry lub Wartości odstające z okienka "Analizy" i upuścić na wizualizację.
  5. Aby skonfigurować funkcję analityczną, w okienku "Właściwości" kliknąć Analizy.