Analizy statystyczne pozwalają wyróżniać klastry (zgrupowania) lub wartości odstające w skoroszytach, dodawać prognozy oraz pokazywać linie trendu i odniesienia.
Aby dodać do swoich skoroszytów analizy statystyczne, takie jak prognozy, wartości odstające czy linie trendu, można albo skorzystać z analiz gotowych do użycia, które są dostępne w okienku "Analizy" panelu "Dane", albo - chcąc mieć większą kontrolę nad konfiguracją - użyć funkcji w konstruktorze wyrażeń.
Oracle Analytics umożliwia dodawanie wielu analiz statystycznych z okienka "Analizy" panelu "Dane"; analizy te są w pełni skonfigurowane, tak że nie trzeba być specjalistą w dziedzinie statystyki, aby uzyskać odpowiednie wyniki.
.png"
Aby mieć większą kontrolę nad ustawieniami analizy statystycznej albo aby móc użyć analizy w innych wizualizacjach, warto rozważyć dodanie obliczenia i zdefiniowanie równoważnej funkcji za pomocą konstruktora wyrażeń. W tym celu należy w okienku "Dane" kliknąć Dodaj (+), po czym kliknąć Utwórz obliczenie, aby wyświetlić konstruktor wyrażeń. Na przykład można użyć funkcji FORECAST().
.png"
Zob. Tworzenie obliczanych elementów danych.
Dostęp do opcji analiz statystycznych można także uzyskać, klikając prawym przyciskiem myszy wizualizację, a następnie wybierając Dodaj statystyki.
.png"
Do swoich wizualizacji można dodać poniższe statystyki w celu zapewnienia lepszych spostrzeżeń dotyczących danych
.png"
Forecast
Funkcja forecast używa regresji liniowej do prognozowania przyszłych wartości na podstawie istniejących wartości z użyciem trendu liniowego.
Można określić liczbę okresów w przyszłości, dla których ma być prognozowana wartość na podstawie istniejących danych z ciągów czasowych. Zob. Dodawanie prognozy do wizualizacji.
Oracle obsługuje następujące typy modeli prognozy:
Aby mieć większą kontrolę nad ustawieniami lub aby używać prognozy w innych wizualizacjach, można utworzyć niestandardowe obliczenie z użyciem funkcji FORECAST
. Zob. Funkcje analityczne.
Cluster
Funkcja cluster grupuje zestaw obiektów w taki sposób, aby obiekty z tej samej grupy były do siebie podobne i zbliżone bardziej niż do obiektów należących do innych grup. Na przykład na wykresie punktowym można za pomocą kolorów wyróżnić klastry różnych grup. Zob. Tworzenie klastra lub wartości odstającej w wizualizacji.
Aby mieć większą kontrolę nad ustawieniami lub aby używać klastra w innych wizualizacjach, można utworzyć niestandardowe obliczenie z użyciem funkcji CLUSTER
. Zob. Funkcje analityczne.
Outliers
Funkcja outliers wyświetla rekordy danych, które są najbardziej oddalone od oczekiwanych średnich poszczególnych wartości. Na przykład do tej kategorii zaliczają się wartości ekstremalne, najbardziej odstające od innych obserwacji. Wartości odstające mogą sygnalizować zmienność pomiaru, błędy eksperymentalne lub nowości. Jeśli do wykresu, w którym jest już używana funkcja cluster, zostanie dodana funkcja outliers, to wartości odstające będą obrazowane przy użyciu innych kształtów.
Dla funkcji outliers może być używana klasteryzacja z użyciem algorytmu centroidów lub klasteryzacja hierarchiczna. Zob. Tworzenie klastra lub wartości odstającej w wizualizacji.
Aby mieć większą kontrolę nad ustawieniami lub aby używać odstających w innych wizualizacjach, można utworzyć niestandardowe obliczenie z użyciem funkcji OUTLIER
. Zob. Funkcje analityczne.
Linie odniesienia
Linie odniesienia definiują poziome lub pionowe linie na wykresie, odpowiadające wartościom z osi X lub Y. Zob. Dodawanie linii odniesienia do wizualizacji.
Linie trendu
Linia trendu pokazuje ogólny przebieg analizowanej miary. Jest to linia prosta łącząca pewną liczbę punktów na wykresie. Linia trendu pomaga przeanalizować określony kierunek grupy zbiorów wartości w wizualizacji. Zob. Dodawanie analiz statystycznych do wizualizacji.
Aby mieć większą kontrolę nad ustawieniami lub aby używać linii trendu w innych wizualizacjach, można utworzyć niestandardowe obliczenie z użyciem funkcji TRENDLINE
. Zob. Funkcje analityczne.
Analizy statystyczne pozwalają wyróżniać klastry (zgrupowania) lub wartości odstające w skoroszytach, dodawać prognozy oraz pokazywać linie trendu i odniesienia. Wybiera się je na karcie "Analizy" w okienku "Dane" w edytorze skoroszytu.
Alternatywnie do skoroszytu można dodawać prognozy, linie trendów i klastry przy użyciu funkcji analitycznych typu "tylko tekst". Zob. Funkcje analityczne.
Do skoroszytów można dodawać prognozy na podstawie algorytmu ARIMA (autoregresyjna zintegrowana średnia ruchoma), Sezonowa ARIMA lub ETS (potrójne wygładzanie wykładnicze). Można na przykład prognozować temperatury w lecie na podstawie danych z poprzednich okresów letnich.
Linie odniesienia ułatwiają identyfikowanie średnich, median centyli i podobnych informacji w wizualizacji.
Do tworzenia linii i przedziałów odniesienia można używać kolumn miar, atrybutów, dat oraz dat pochodnych.
Daty pochodne to kolumny o różnych poziomach szczegółowości takich jak rok, kwartał, miesiąc i dzień. Oracle Analytics automatycznie generuje kolumny dat pochodnych dla dowolnych kolumn daty, godziny lub znacznika czasu w zbiorach danych.
Można powiązać parametr z wartością linii odniesienia lub zakresem przedziału odniesienia w wizualizacji, jeśli wartość parametru ma być wykorzystywana do umieszczania linii lub przedziału odniesienia w wizualizacji. Zob. Wiązanie parametru z linią lub przedziałem odniesienia.
Podczas konfigurowania linii odniesienia w okienku "Analizy" w okienku "Właściwości" w panelu "Gramatyka" można na przykład wybrać opcję Typ, aby wyświetlić linię lub przedział, opcję Funkcja, aby zmienić linię domyślną na "Średnia", "Centyl" lub "N czołowych", albo opcję Porządek Z dla kolumn daty i porządku daty, aby umieścić linię odniesienia przed lub za wizualizacją. W przypadku wybrania kolumny z atrybutem innym niż data, na przykład "Miasto", można wybrać Wartość, na przykład "Chicago", według której ma być wyświetlana linia odniesienia.