Jakie analizy statystyczne można dodać do wizualizacji?

Do swoich wizualizacji można dodać poniższe statystyki w celu zapewnienia lepszych spostrzeżeń dotyczących danych
Opis "GUID-F6772E69-9E99-49A9-9DFE-0679A982807A-default.png" znajduje się poniżej
.png"

Forecast

Funkcja forecast używa regresji liniowej do prognozowania przyszłych wartości na podstawie istniejących wartości z użyciem trendu liniowego.

Można ustawić przyszłe okresy w celu przewidywania wartości na podstawie szeregów czasowych w danych. Zob. Dodawanie prognozy do wizualizacji.

Oracle obsługuje następujące typy modeli prognozy:

  • ARIMA (autoregresyjna zintegrowana średnia ruchoma) - ten typ jest odpowiedni, jeśli wcześniejsze dane z szeregów czasowych są niesezonowe, ale dostarczają odpowiednią liczbę obserwacji (co najmniej 50, ale preferowane jest więcej niż 100 obserwacji) umożliwiających wyjaśnienie i przewidywanie przyszłości.
  • Sezonowa ARIMA - ten typ jest odpowiedni, jeśli dane mają regularny wzorzec zmian, który jest powtarzany w poszczególnych okresach. Na przykład w danych miesięcznych może występować sezonowość, gdy większe wartości pojawiają się w miesiącach letnich, a mniejsze - w zimowych.
  • Potrójne wygładzanie wykładnicze (ETS) - ten typ jest odpowiedni do analizowania powtarzalnych danych szeregów czasowych, które nie mają wyraźnego wzorca. Ten typ modelu tworzy wykładniczą średnią ruchomą, uwzględniającą tendencję danych do powtarzania się w czasie, w pewnych interwałach.
  • Prophet - ten typ jest odpowiedni, jeśli zbiór danych obejmuje wydłużone okresy, zawiera wiele silnych sezonowości lub obejmuje wcześniej znane nieregularne zdarzenia albo brakuje w nim punktów danych lub zawiera duże wartości odstające.

Aby mieć większą kontrolę nad ustawieniami lub używać prognozy w innych wizualizacjach, można także utworzyć niestandardowe obliczenie z użyciem funkcji FORECAST. Zob. Funkcje analityczne.

Cluster

Funkcja "cluster" grupuje zestaw obiektów w taki sposób, aby obiekty z tej samej grupy były do siebie podobne i zbliżone bardziej niż do obiektów należących do innych grup. Na przykład na wykresie punktowym można za pomocą kolorów wyróżnić klastry różnych grup. Zob. Tworzenie klastra lub wartości odstającej w wizualizacji.

  • Klasteryzacja z użyciem algorytmu centroidów (K-Means) - Dzieli "n" obserwacji na "k" klastrów, w których każda obserwacja należy do klastra z najbliższą średnią, służąc jako prototyp klastra.
  • Klasteryzacja hierarchiczna - Tworzy hierarchię klastrów konstruowanych aglomeracyjnie (od dołu do góry) lub różnicująco (od góry do dołu).
Aby mieć większą kontrolę nad ustawieniami lub używać prognozy w innych wizualizacjach, można także utworzyć niestandardowe obliczenie z użyciem funkcji CLUSTER. Zob. Funkcje analityczne.

Outliers

Funkcja outliers wyświetla rekordy danych, które są najbardziej oddalone od oczekiwanych średnich poszczególnych wartości. Na przykład do tej kategorii zaliczają się wartości ekstremalne, najbardziej odstające od innych obserwacji. Wartości odstające mogą sygnalizować zmienność pomiaru, błędy eksperymentalne lub nowości. Jeśli do wykresu, w którym jest już używana funkcja "cluster", zostanie dodana funkcja "outliers", to wartości odstające będą obrazowane przy użyciu innych kształtów.

Dla funkcji outliers może być używana klasteryzacja z użyciem algorytmu centroidów lub klasteryzacja hierarchiczna. Zob. Tworzenie klastra lub wartości odstającej w wizualizacji.

Aby mieć większą kontrolę nad ustawieniami lub używać prognozy w innych wizualizacjach, można także utworzyć niestandardowe obliczenie z użyciem funkcji OUTLIER. Zob. Funkcje analityczne.

Linie odniesienia

Linie odniesienia definiują poziome lub pionowe linie na wykresie, odpowiadające wartościom z osi X lub Y. Zob. Dodawanie linii odniesienia do wizualizacji.

  • Linia - Można wybrać dla linii odniesienia obliczenie wartości średniej, minimalnej lub maksymalnej. Na przykład w branży lotniczej, jeśli liczba pasażerów zostanie przedstawiona na wykresie w funkcji czasu, to linia odniesienia może pokazywać, czy liczba pasażerów danym miesiącu jest powyżej czy poniżej średniej.
  • Przedział - Przedział reprezentuje górny i dolny zakres punktów danych. Można wybrać przedział niestandardowy lub funkcję odchylenia standardowego oraz wartość średnią, maksymalną lub minimalną. Na przykład, jeśli jest analizowana sprzedaż wg miesiąca i jest używany niestandardowy przedział referencyjny od wartości średniej do maksymalnej, można zidentyfikować miesiące, w których sprzedaż jest większa niż średnia, ale mniejsza niż maksymalna.

Linie trendu

Linia trendu pokazuje ogólny przebieg analizowanej miary. Jest to linia prosta łącząca pewną liczbę punktów na wykresie. Linia trendu pomaga przeanalizować określony kierunek grupy zbiorów wartości w wizualizacji. Zob. Dodawanie analiz statystycznych do wizualizacji.

  • Liniowy - Do użycia z danymi liniowymi. Dane są liniowe, jeśli wzorzec punktów danych przypomina linię prostą. Linia trendu liniowego pokazuje, że miara się zwiększa lub zmniejsza ze stałą szybkością.
  • Wielomianowy - Do użycia, gdy dane zmieniają się nieregularnie. Na przykład jest przydatny do analizowania zysków i strat z użyciem dużego zbioru danych.
  • Wykładniczy - Do użycia, gdy wartości danych zwiększają się lub zmniejszają z coraz to większą szybkością. Linii trendu wykładniczego nie można utworzyć, jeśli w danych występują wartości zerowe lub ujemne.

Aby mieć większą kontrolę nad ustawieniami lub używać prognozy w innych wizualizacjach, można także utworzyć niestandardowe obliczenie z użyciem funkcji TRENDLINE. Zob. Funkcje analityczne.