Używanie funkcji wyjaśniania do identyfikowania najbardziej znaczących segmentów rekordów w zbiorze danych

W Oracle Analytics kliknąć prawym przyciskiem myszy kolumnę w zbiorze danych, wybrać Wyjaśnij, po czym wybrać kartę "Segmenty". W ciągu kilku sekund zostanie wyświetlona lista segmentów, z których każdy będzie przedstawiany jako pojedynczy słupek na górnym wykresie słupkowym.

Segmenty to grupy rekordów w zbiorze danych, które algorytm funkcji wyjaśniania zidentyfikował jako mające różne wartości w kolumnie docelowej w porównaniu ze średnią dla całego zbioru danych. Szczegółowe wyniki będą odmienne w przypadku miar i w przypadku atrybutów.

W przypadku wyjaśniania dotyczącego kolumny miary

W przypadku miar algorytm segmentacji funkcji wyjaśniania wyszukuje w zbiorze danych grupy rekordów, dla których wartość średnia znacząco różni się od wartości średniej dla całego zbioru danych. Na przykład jeśli miarą docelową jest wiek, a średni wiek dla całego zbioru danych wynosi 23 lata, segmentem może być grupa rekordów w danych, w których wiek wynosi 55 lat, czyli znacznie więcej niż średnia z całego zbioru danych. Pojedynczy segment jest definiowany przez kilka filtrów w zbiorze danych, które identyfikują grupę rekordów mającą nietypową średnią wartość w kolumnie przetwarzanej aktualnie przez funkcję wyjaśniania. Na przykład takimi filtrami mogą być "Miejscowość" i "Typ zlecenia".
Opis "GUID-83744C61-9978-4F83-9E38-9EF06C7A8061-default.png" znajduje się poniżej
.png"

Na pionowym wykresie słupkowym u góry pokazywany jest rozmiar każdego z segmentów wyrażony jako liczba rekordów (wysokość słupka), podczas gdy nasycenie koloru wskazuje, jak bardzo średnia wartość dla danego segmentu odbiega od średniej wartości dla całego zbioru danych.

Wykresy pociskowe w dolnej części panelu przedstawiają szczegółowe informacje o pojedynczych segmentach. Opisy informują o średniej wartości miary dla segmentu (miara docelowa), łącznej liczbie rekordów w segmencie oraz kryteriach definiujących segment. Na tym wykresie wielkość pęcherzyka reprezentuje liczbę rekordów w segmencie, podczas gdy kolor i położenie na osi x wskazują, jak bardzo średnia wartość dla segmentu odbiega od średniej wartości dla całego zbioru danych (linia przerywana). Można wskazać kursorem wykres, aby została wyświetlona etykietka z tymi szczegółowymi danymi. Można również dostosować sortowanie wszystkich tych segmentów lub wyświetlić listę szczegółowych segmentów jako tabelę, zmieniając w tym celu opcję sortowania panelu lub typ wizualizacji panelu w prawym górnym rogu panelu.

Jeśli jakiś segment ma zostać użyty, należy go kliknąć, aby dodać go do kanwy skoroszytu. Po dodaniu segmentu do kanwy skoroszytu:

  • Tworzona jest wizualizacja tabeli zawierająca liczbę wierszy w segmencie i poza segmentem.
  • Tworzone jest niestandardowe obliczenie definiujące elementy znajdujące się w segmencie lub poza segmentem, którego można używać do agregowania dowolnej miary w zbiorze danych według tego kryterium. Tego obiektu można również używać jako zaawansowanego filtra dla kanwy, który pozwoli porównywać rekordy znajdujące się w segmencie z rekordami poza segmentem.

W przypadku wyjaśniania dotyczącego kolumny atrybutu

W przypadku, gdy celem jest atrybut, każda dystynktywna wartość tego atrybutu występująca we wszystkich danych będzie gromadzić proporcjonalną liczbę rekordów. Na przykład kolumna z dwiema wartościami "Tak" i "Nie" może zawierać 20% wartości "Tak" i 80% wartości "Nie". Algorytm segmentacji identyfikuje w danych takie grupy rekordów, dla których te proporcje znacząco różnią się od średniego rozkładu. Na przykład "Segment 1" może być grupą rekordów w danych, w której wartość "Tak" występuje w 55% rekordów (zamiast w 20%, jak dla całego zbioru danych), a wartość "Nie" występuje w 45% rekordów (zamiast w 80%, jak dla całego zbioru danych). Pojedynczy segment jest definiowany przez kilka filtrów w zbiorze danych, które identyfikują grupę rekordów o nietypowym rozkładzie w odniesieniu do kolumny przetwarzanej aktualnie przez funkcję wyjaśniania. Na przykład "Segment 1" może być zdefiniowany jako wszystkie rekordy w danej miejscowości i o określonej wartości wieku.
Opis "GUID-30051023-F52C-49D3-8324-47C12A219B9A-default.png" znajduje się poniżej
.png"

Funkcja wyjaśniania skanuje dane i identyfikuje wiele różnych segmentów. Są one niekumulatywne, co oznacza, że dany rekord może należeć do dwóch różnych segmentów. Na pionowym wykresie słupkowym u góry pokazywany jest rozmiar każdego z segmentów wyrażony w rekordach (wysokość słupka), podczas gdy kolor słupka wskazuje analizowaną wartość elementu. Można odfiltrowywać określone wartości elementów, klikając hiperłącze w tekście u góry strony.

Poziome wykresy słupkowe w dolnej części panelu przedstawiają szczegółowe informacje o pojedynczych segmentach. Opisy informują o wartości analizowanego elementu (na przykład "Tak" lub "Nie"), łącznej liczbie rekordów w danym segmencie oraz kryteriach definiujących segment. Wykres przedstawia następnie odsetek tej wartości w segmencie (kolorowy obszar) w porównaniu do średniego odsetka dla całego zbioru danych (linia przerywana). Można wskazać kursorem wykres, aby została wyświetlona etykietka zawierająca te informacje w bardziej szczegółowej postaci. Można również sortować segmenty i zmieniać sposób ich wyświetlania, zmieniając w tym celu opcję sortowania panelu lub typ wizualizacji panelu w prawym górnym rogu panelu.

Jeśli jakiś segment ma zostać użyty, należy go kliknąć, aby dodać go do kanwy skoroszytu. Po dodaniu segmentu do kanwy skoroszytu:

  • Tworzona jest wizualizacja tabeli zawierająca liczbę wierszy w segmencie i poza segmentem.
  • Tworzone jest niestandardowe obliczenie definiujące elementy znajdujące się w segmencie lub poza segmentem, którego można używać do agregowania dowolnej miary w zbiorze danych według tego kryterium. Tego obiektu można również używać jako zaawansowanego filtra dla kanwy, który pozwoli porównywać rekordy znajdujące się w segmencie z rekordami poza segmentem.