Interacţiunea cu statisticile automate pentru a vă concentra pe ceea ce vă interesează

Statisticile automate permit autorilor de conţinut să ajusteze direct algoritmii AI şi să îi concentreze doar pe anumite tipuri de statistici sau pe anumite coloane din setul de date.

Setări de utilizator pentru statisticile automate

Faceţi clic pe Setări statistică în partea din dreapta sus a panoului Statistici. Este afişată o casetă de dialog, care oferă două tipuri de setări:
  • Selectaţi tipul de statistici

    În partea superioară a panoului Setări statistici automate, vedeţi un set de 10 pictograme care listează tipurile de statistici pe care le pot genera Statisticile automate. Fiecare dintre aceste tipuri reprezintă un anumit tip de analiză de efectuat asupra setului de date. Selectaţi sau deselectaţi tipurile de statistici prin clic pe diferite pictograme şi apoi pe Aplicare. Statisticile automate ţin cont de această opţiune la următoarea rulare şi caută numai statistici din tipurile selectate. În mod prestabilit, toate tipurile posibile sunt selectate.
    Urmează descrierea GUID-C87480E2-18E3-437A-962B-095E777850EF-default.png
    .png

    Unele statistici sunt afişate numai dacă există anumite coloane în setul dvs. de date. Chiar dacă aţi selectat toate pictogramele, s-ar putea să nu fie afişate, deoarece setul dvs. de date (sau coloanele selectate) nu includ tipul necesar de coloane. De exemplu, statisticile corelate cu timpul sunt afişate numai dacă există o coloană pentru timp în selecţia dvs. Alt exemplu: hărţile de importanţe necesită cel puţin două dimensiuni în definiţia lor, deci, dacă este prezentă o singură dimensiune, nu sunt afişate hărţi de importanţe.

  • Selectaţi coloanele din setul de date care să fie incluse în statisticile automate
    În mod prestabilit, statisticile automate identifică ce coloane din setul dvs. de date oferă cele mai valoroase statistici. Acest proces de selecţie iniţială a coloanelor se bazează pe algoritmi interni, dar puteţi suprascrie selecţia iniţială a coloanelor şi selecta în schimb anumite coloane pentru a fi utilizate de statisticile automate. Algoritmii statisticilor automate de ierarhizare a vizualizării pot consuma simultan până la 11 coloane diferite din orice set de date:
    • Subindicatori - Până la trei subindicatori diferiţi pot fi utilizaţi de fiecare dată când rulaţi statisticile automate. Dacă nu sunt selectate coloane cu subindicatori, statisticile automate se concentrează pe statistici care numără înregistrările din setul dvs. de date.
    • Calcule generalizate - Această setare indică faptul că Statisticile automate calculează şi o metrică de contorizare a rândurilor (contorizarea numărului de înregistrări) pentru a găsi statistici despre acestea. Dacă nu doriţi să vedeţi statistici despre contorizarea numărului de rânduri, deselectaţi opţiunea respectivă.
    • Atribute pentru timp - Numai un singur atribut este acceptat la un moment dat când rulaţi statisticile automate. Selectaţi o coloană de tip Date din datele dvs. Dacă nu aveţi nicio dimensiune Timp selectată, statisticile automate nu vor afişa tipul de statistici corelate cu timpul.
    • Atribute de dimensiune mică - Acestea sunt coloane de atribute cu cardinalitate scăzută, adică coloane care conţin un număr mic de valori diferite, de exemplu, mai puţin de 10 valori diferite. Aceste atribute sunt utile pentru a reprezenta statistici şi analize agregate de nivel ridicat. Puteţi selecta cel mult cinci astfel de atribute simultan într-o singură rulare a Statisticilor automate.
    • Atribute de dimensiune medie - Acestea sunt coloane de atribute care conţin un număr mediu de valori diferite, de exemplu, 200 de valori diferite. Aceste coloane sunt utile pentru a reprezenta date în diagrame de dispersie sau diagrame Boxplot. Puteţi selecta cel mult două astfel de atribute simultan într-o singură rulare a Statisticilor automate.
    • Coloane excluse - Aceste coloane au fost identificate ca neintuitive pentru tipurile de vizualizare a statisticilor automate, de exemplu: coloane cu o cardinalitate foarte ridicată, cum ar fi ID de rând sau coloane cu o proporţie foarte ridicată de valori necompletate. Dacă reprezentaţi direct aceste coloane în vizualizări, este posibil să nu puteţi extrage statistici lizibile uşor. Regulile specificate de agregare (numărare sau numărare valori diferite) pot fi, de asemenea, un motiv pentru excluderea unei coloane.

    Uitaţi-vă la setările coloanei şi alcătuiţi o selecţie semnificativă de coloane pentru scenariul dvs. de business, apoi faceţi clic pe Aplicare. Motorul de inteligenţă artificială pentru ierarhizarea statisticilor rulează şi returnează rapid o serie de statistici ordonate în funcţie de probabilitatea ca acestea să prezinte o valoare interesantă. Pe măsură ce selectaţi tot mai multe coloane pentru a le include în algoritmul statisticilor automate, reduceţi probabilitatea de a vedea statistici despre toate aceste coloane simultan. Numai cele mai semnificative statistici sunt afişate în panou, în funcţie de probabilitatea de interes a algoritmului. Dacă selectaţi mai multe coloane din setări, este puţin probabil ca toate să fie incluse în statisticile selectate. Invers, dacă selectaţi doar câteva coloane, creşte probabilitatea de a vedea statistici special pentru coloanele respective în panou.

    Selecţia pe care o efectuaţi pentru un anumit set de date rămâne în memoria sistemului data următoare când deschideţi setul de date, deci, nu este necesar să selectaţi din nou aceleaşi obiecte.

Calcule personalizate şi limitări pentru alte coloane

Calculele personalizate pentru registrul de lucru nu sunt afişate ca opţiuni pentru selecţiile pentru statistici automate. Pentru a rula statistici automate pentru o anumită formulă personalizată, trebuie să generaţi formula în stadiul de pregătire a datelor. Adică, prin editarea definiţiei setului de date în Oracle Analytics şi adăugarea unei coloane calculate acolo. Aceste obiecte personalizate calculate sunt apoi incluse în punctarea Statisticilor automate, la fel ca orice alte coloane din setul de date.

Unele tipuri de coloane nu sunt încă acceptate de statisticile automate, cum ar fi metricile cu reguli de agregare pentru numărare sau numărarea valorilor diferite sau coloane cu tipul de date Geometrii din Oracle Analytics.