Transformácia tabuľkových dát do kociek

Kocku môžete vytvoriť z tabuľkových dát extrakciou tabuliek faktov zo vzťahovej databázy do súboru programu Excel a následným nasadením kocky.

Na účely nasadenia multidimenzionálnej kocky sa zisťujú vzory vo vzťahoch medzi hlavičkami stĺpcov a dátami. Proces transformácie tabuľkových dát do štruktúry, ktorú možno použiť v multidimenzionálnej kocke, zahŕňa tieto koncepcie:

  • Korelácie medzi stĺpcami

  • Korelácie medzi typmi stĺpcov (napríklad dátum, číslo a text)

  • Analýza textu hlavičky z hľadiska bežných prefixov a pojmov súvisiacich s business intelligence (napríklad náklady, cena, účet)

  • Štruktúra zostavy (napríklad zlúčené bunky alebo prázdne bunky)

  • (voliteľné) Hlavičky s vynúteným označením, ktoré sa používajú na explicitné definovanie tvaru kocky a môžu zahŕňať vzorce na vytvorenie dimenzií mier.

  • Hierarchie Miery (ktoré sa môžu generovať aj v sekcii Transformovať dáta v návrhárovi kociek).

K dispozícii sú vzorové súbory programu Excel s tabuľkovými dátami na ukážku koncepcií vnútorných hlavičiek a hlavičiek s vynúteným označením.

Keď pracujete s tabuľkovými dátami, mali by ste ich analyzovať predtým, ako z nich vytvoríte kocku. Potom by ste po vytvorení kocky mali určiť, či je štruktúra kocky taká, akú chcete.

Kocku môžete vytvoriť z tabuľkových dát v inštancii Essbase alebo v návrhárovi kociek. Pozrite si časť Vytvorenie a aktualizácia kocky z tabuľkových dát.

Používanie vnútorných hlavičiek na transformáciu tabuľkových dát na kocky

Vnútorné hlavičky používajú formát tabuľka.stĺpec, ktorého ukážku nájdete v súbore Sample_Table.xlsx. V tomto vzorovom súbore majú hlavičky stĺpcov názvy ako Units, Discounts, Time.Month, Regions.Region a Product.Brand.

Proces transformácie vytvorí túto hierarchiu:

Units
Discounts
Fixed Costs
Variable Costs
Revenue
Time
   Month
   Quarter
Years
Regions
   Region
   Area
   Country
Channel
Product
   Brand
...

Používanie hlavičiek s vynúteným označením na transformáciu tabuľkových dát na kocky

Pomocou hlavičiek s vynúteným označením (pomôckami) môžete zadať, ako sa má zaobchádzať s tabuľkovými dátami počas procesu transformácie.

Môžete si napríklad vynútiť, aby sa so stĺpcom zaobchádzalo ako s mierami alebo dimenziou s atribútmi. Väčšina hlavičiek s vynúteným označením si vyžaduje kľúčové slovo v hranatých zátvorkách [ ]. Ukážky hlavičiek s vynúteným označením nájdete v šablónach Unstr_Hints.xlsx a Sample_Table.xlsx (k dispozícii v galérii).

Podporované formáty hlavičky s vynúteným označením:

Tabuľka 6-1 Formáty hlavičky s vynúteným označením

Označenie Formát hlavičky Príklad

Dimension generation

ParentGeneration.CurrentGeneration

Category.Product

Alias

ReferenceGeneration.Generation[alias]

Year.ShortYearForm[alias]

Attribute

ReferenceGeneration.AttributeDimName[attr]

Product.Discounted[attr]

Measures

MeasureName[measure]

Price[measure]

Measure generation

Parent.child[measure]

Najvyššia nadradená položka, ak je jednoznačná, je názov dimenzie účtu. Ak nie je jednoznačná, tento člen sa automaticky generuje v dimenzii účtu.

Measures.profit[measure]

profit.cost[measure]

cost.price[measure]

Measures formula

MeasureName[=formula_syntax;]

profit[="price"-"cost";]

profit[="D1"-"E1";]

price[=IF ("S1" == #MISSING) "R1"; ELSE "S1"; ENDIF;]

Measures consolidation

MeasureName[+]: pripočítať k nadradenej hodnote

MeasureName[-]: odčítať od nadradenej hodnoty

MeasureName[~]: bez konsolidácie (ekvivalent pre [measure])

Predvolené je bez konsolidácie.

price.shipment[+]

Konsolidácia môže byť definovaná iba pre dimenziu miery

Formula consolidation

FormulaName[+=<formula>]: pripočítať k nadradenej hodnote

FormulaName[-=<formula>]: odčítať od nadradenej hodnoty

profit[+=price-cost]

cost.external[+=ExternalWork+ExternalParts]

UDA

ReferenceGeneration[uda]

Product[uda]

Skip

Stĺpec sa neprečíta.

ColumnName[skip]

column[skip]

Recur

Pre prázdne bunky sa použije hodnota bunky posledného stĺpca

Opakovanie možno kombinovať s inými vynútenými označeniami. Obsahuje zoznam vynútených označení oddelených čiarkou v hranatej zátvorke - ColumnName[designationA,recur].

ColumnName[recur]

Product[recur]

Product[uda,recur]

Môžete zadať, aby stĺpce boli dimenziami mier, a môžete použiť vzorce na vytváranie dimenzií mier s vypočítanými dátami počas procesu transformácie. Hlavičky s vynúteným označením pre miery a vzorce mier sa zadávajú s názvom dimenzie miery, za ktorým nasleduje kľúčové slovo alebo vzorec v hranatých zátvorkách pripojené k názvu dimenzie miery.

Miery a vzorce môžete konsolidovať aj tak, že ich pripočítate k nadradeným hodnotám alebo od nich odčítate.

Ak chcete zadať, aby bol stĺpec rozmerom mier, do hlavičky stĺpca zadajte názov dimenzie mier a potom pripojte kľúčové slovo [measure]. Môžete napríklad zadať stĺpce Units a Fixed Costs ako dimenzie mier s použitím tejto syntaxe: Units[measure] a Fixed Costs[measure].

Proces transformácie vytvorí túto hierarchiu s mierami Units, Discounts, Fixed Costs, Variable Costs a Revenue:

Time
   Year
      Quarter
         Month
Regions
   Region
      Area
         Country
...
Product
   Brand
...
Units
Discounts
Fixed Costs
Variable Costs
Revenue

Môžete vytvoriť hierarchiu generácií mier (hierarchia parent.child[measure]) podobným spôsobom, akým vytvárate bežné generácie dimenzií.

Ak chcete napríklad vytvoriť hierarchiu mier, zadáte Measures.profit[measure], profit.cost[measure] a cost.price[measure], čím sa vytvorí nasledujúca hierarchia:

Measures
      profit
            cost
                price

Ak chcete vytvoriť dimenzie mier zo vzorcov, do hlavičky stĺpca zadajte názov dimenzie mier a potom pripojte syntax vzorca do hranatých zátvoriek []. V hranatých zátvorkách začnite vzorec znamienkom rovnosti (=) a ukončite bodkočiarkou (;). Argumenty vo vzorci zodpovedajú názvom stĺpcov alebo súradniciam buniek, ktoré musia byť v úvodzovkách. Vo vzorci môžete použiť výpočtové funkcie a príkazy Essbase.

Predpokladajme, že máte súbor programu Excel s názvom Spend_Formulas.xlsx s tabuľkovými dátami v pracovnom hárku SpendHistory, ktorý má mnoho stĺpcov. Sú tam napríklad dimenzie s názvami Year (stĺpec A) a Quarter (stĺpec B) a dimenzie mier s názvami Spend (stĺpec J) a Addressable Spend (stĺpec K). Tieto stĺpce obsahujú dáta. Potom sú tu hlavičky stĺpcov, ktoré na vytvorenie dimenzií mier používajú vzorce. Tieto stĺpce neobsahujú dáta. Napríklad na vytvorenie dimenzie Total Spend sa v hlavičke stĺpca O použije tento vzorec Essbase: Measure.Total Spend[="Addressable Spend" + "Non-Addressable Spend";]. Na vytvorenie dimenzie AddSpendPercent sa v hlavičke stĺpca P použije tento vzorec Essbase: Measure.AddSpendPercent[="Addressable Spend"/"Total Spend";].

Proces transformácie vytvorí túto hierarchiu:


Obrázok ukážky transformácie tabuľkových dát.

Proces transformácie dokáže identifikovať aj dimenzie mier, keď sa duplikuje názov dimenzie. Predpokladajme, že máte hlavičku stĺpca, ktorá používa vzorec Meas.profit[="a1"-"b1";] na vytvorenie dimenzie Meas. Ak v inej hlavičke stĺpca použijete názov dimenzie Meas ako najvyššiu nadradenú položku, napríklad Meas.Sales, dimenzia Sales sa takisto bude považovať za dimenziu mier.