Utilizarea opţiunii Explain pentru identificarea celor mai importante segmente de înregistrări din setul de date

În Oracle Analytics, faceţi clic dreapta pe o coloană ţintă din setul de date, selectaţi Explain, apoi selectaţi fila Segmente. În câteva secunde, puteţi vedea o listă a segmentelor, fiecare reprezentat de o bară individuală în diagrama cu bare din partea superioară.

Segmentele sunt grupuri de înregistrări din setul dvs. de date, pe care algoritmul Explain le-a identificat ca având valori diferite faţă de media generală a setului de date pentru coloana ţintă. Rezultatele detaliate diferă pentru subindicatori şi atribute.

Dacă explicaţi o coloană Subindicator

Pentru subindicatori, algoritmul de segmentare Explain caută grupuri de înregistrări în setul dvs. de date a căror valoare medie este semnificativ diferită de valoarea medie a întregului set de date. De exemplu, dacă subindicatorul dvs. ţintă este Vârstă, iar vârsta medie pentru întregul set de date este 23, un segment ar putea fi un grup de înregistrări din datele dvs. în care vârsta este 55, semnificativ mai mare decât media întregului set de date. Un segment individual este definit de câteva filtre din setul de date care identifică un grup de înregistrări cu o valoare medie neobişnuită pentru coloana explicată. De exemplu, filtrele ar putea fi Localitate şi Tip de post.
Urmează descrierea GUID-83744C61-9978-4F83-9E38-9EF06C7A8061-default.png
.png

Diagrama cu bare verticale din partea superioară indică dimensiunea fiecărui segment din numărul de înregistrări (înălţimea barei), în timp ce densitatea culorii indică cât de departe este valoarea medie a segmentului faţă de valoarea medie a întregului set de date.

Diagramele cu marcatori din partea inferioară a panoului reprezintă fiecare un segment individual în detaliu. Descrierile indică valoarea medie a subindicatorului pentru un segment (subindicatorul ţintă), numărul total de înregistrări dintr-un segment şi criteriile care definesc un segment. Pe diagramă, dimensiunea bulei reprezintă numărul de înregistrări din segment, în timp ce culoarea şi poziţia pe axa X reprezintă cât de departe este valoarea medie a segmentului faţă de valoarea medie a întregului set de date (linia punctată). Puteţi ţine cursorul deasupra diagramei pentru a vedea sugestia care afişează aceste detalii. De asemenea, puteţi ajusta sortarea tuturor acestor segmente sau puteţi afişa lista segmentelor detaliate sub formă de tabel, prin editarea sortării panoului sau a tipului de vizualizare a panoului în partea dreaptă sus a panoului.

Dacă vă interesează un anumit segment, faceţi clic pe acesta pentru a-l adăuga la canvasul registrului de lucru. Când adăugaţi un segment la canvasul registrului de lucru:

  • Se creează o vizualizare tip tabel cu numărul de rânduri din segment şi din afara segmentului.
  • Se creează un calcul personalizat care defineşte valorile care sunt În segment şi În afara segmentului, care poate fi utilizat pentru a agrega orice subindicatori din setul de date în funcţie de acest criteriu. Acest obiect poate fi utilizat, de asemenea, ca filtru puternic pentru canvasul dvs., arătând o comparaţie între înregistrările dintr-un segment şi cele din afara segmentului.

Dacă explicaţi o coloană Atribute

Dacă ţinta dvs. este un atribut, în datele generale, fiecare valoare distinctă a atributului respectiv adună o anumită proporţie a înregistrărilor. De exemplu, o coloană cu două valori, Da sau Nu, ar putea avea 20% Da şi 80% Nu. Algoritmul segmentului identifică grupurile de înregistrări din datele dvs. pentru care aceste proporţii diferă semnificativ faţă de distribuţia medie. De exemplu, Segmentul 1 ar putea fi un grup de înregistrări din datele dvs. unde Da este 55% (faţă de 20% cât este pentru întregul set de date), iar Nu este 45% (faţă de 80% cât este pentru întregul set de date). Un segment individual este definit de câteva filtre din setul de date care identifică un grup de înregistrări cu o distribuţie neobişnuită pentru coloana explicată. De exemplu, Segmentul 1 ar putea fi definit ca toate înregistrările dintr-o localitate dată şi o valoare dată pentru vârstă.
Urmează descrierea GUID-30051023-F52C-49D3-8324-47C12A219B9A-default.png
.png

Algoritmul Explain scanează datele dvs. şi identifică multe segmente diferite. Acestea sunt non-cumulative, adică, este posibil ca o înregistrare dată să facă parte din două segmente diferite. Diagrama cu bare verticale din partea superioară indică dimensiunea fiecărui segment din înregistrări (înălţimea barei), în timp ce culoarea barei indică valoarea membrului analizat. Puteţi filtra anumite valori ale membrilor prin clic pe hyperlinkul din textul din partea superioară a paginii.

Diagrama cu bare orizontale din partea inferioară a panoului reprezintă câte un segment individual în detaliu. Descrierile indică valoarea (de exemplu, Da sau Nu) membrului analizat, numărul total de înregistrări din segmentul respectiv şi criteriile care definesc segmentul. Diagrama reprezintă apoi proporţia acestei valori în segment (zona colorată), în comparaţie cu proporţia medie pentru întregul set de date (linia punctată). Puteţi trece cu cursorul peste diagramă pentru a vedea caseta care afişează aceste informaţii mai detaliat. De asemenea, puteţi sorta aceste segmente şi puteţi modifica modul în care sunt listate prin editarea sortării panoului sau a tipului de vizualizare a panoului din partea dreaptă sus a panoului.

Dacă vă interesează un anumit segment, faceţi clic pe acesta pentru a-l adăuga la canvasul registrului de lucru. Când adăugaţi un segment la canvasul registrului de lucru:

  • Se creează o vizualizare tip tabel cu numărul de rânduri din segment şi din afara segmentului.
  • Se creează un calcul personalizat care defineşte valorile care sunt În segment şi În afara segmentului, care poate fi utilizat pentru a agrega orice subindicatori din setul de date în funcţie de acest criteriu. De asemenea, acest obiect poate fi utilizat ca filtru puternic pentru canvasul dvs., arătând o comparaţie între înregistrările dintr-un segment şi cele din afara segmentului.