Dáta môžete usporiadať, integrovať a transformovať pomocou nasledujúcich krokov v dátových tokoch. Môžete napríklad zlúčiť dátové zdroje, agregovať dáta alebo vykonať geopriestorovú analýzu.
Kroky umožňujú transformovať dáta vizuálne aj bez skúseností s kódovaním.
Na pridanie krokov do dátových tokov použite editor dátového toku.
.png
Pridať stĺpce
Pridajte vlastné stĺpce do cieľovej množiny dát. Napríklad vynásobením počtu jednotiek v stĺpci UNITS
predajnou cenou v stĺpci RETAIL_PRICE
(čiže UNITS
* RETAIL_PRICE
) môžete vypočítať hodnotu zásob.
Pridať dáta
Pridajte dátové zdroje do dátového toku. Ak napríklad zlučujete dve množiny dát, pridajte obe množiny dát do dátového toku. Pozrite si časť Podpora dátových tokov v databáze.
Agregát
Vytvorí celkové hodnoty skupiny pomocou agregačných funkcií. Môžete použiť napríklad počet, súčet alebo priemer.
Analyzovať sentiment
Zistí sentiment pre daný textový stĺpec (len v angličtine). Môžete analyzovať napríklad spätnú väzbu od zákazníka a určiť, či je pozitívna alebo negatívna. Analýza sentimentu vyhodnocuje text na základe slov a fráz, ktoré označujú pozitívne, neutrálne alebo negatívne emócie. Na základe výstupu analýzy nový stĺpec obsahuje hodnotu Kladný, Neutrálny alebo Záporný.
Použiť model AI
Analyzujte dáta pomocou modelu umelej inteligencie. Môžete napríklad vykonať detekciu objektov, klasifikáciu obrázkov alebo detekciu textu pomocou modelu vytvoreného v službe OCI Vision. Pozrite si časť Používanie modelov služby Oracle Cloud Infrastructure Vision v službe Oracle Analytics. Pomocou modelov vytvorených v službe OCI Language môžete vykonať aj analýzu jazyka, napríklad analýzu sentimentu a detekciu jazyka.
Použiť model
Analyzujte dáta pomocou modelu strojového učenia z prostredia Oracle Machine Learning alebo zo služby OCI Výskum dát. Môžete napríklad vytvoriť model klasifikácie na predikciu, či v prípade e-mailov ide o nevyžiadanú poštu. Pozrite si časť Používanie prediktívneho alebo zaregistrovaného modelu strojového učenia Oracle v množine dát.
Použiť vlastný skript
Transformujte dáta pomocou funkcie, napríklad pomocou funkcie definovanej v infraštruktúre Oracle Cloud Infrastructure (OCI). Môžete napríklad použiť funkciu na konverziu textu v angličtine do španielčiny alebo nemčiny. Administrátor služby Oracle Analytics tieto funkcie zaregistruje, aby ste ich mohli používať.
AutoML
Funkcia AutoML databázy Oracle Autonomous Data Warehouse vám môže odporučiť a natrénovať prediktívny model. V kroku AutoML sa analyzujú dáta, vypočítava sa najvhodnejší algoritmus na použitie a registruje sa prediktívny model v službe Oracle Analytics. Analytické výpočty prebiehajú v databáze, nie v službe Oracle Analytics. Tento krok je k dispozícii v selektore krokov, keď sa pripojíte k množine dát databázy Oracle Autonomous Data Warehouse.
Pozrite si časť Trénovanie prediktívneho modelu pomocou režimu AutoML v databáze Oracle Autonomous Data Warehouse.
Bin
Rozdelí dátové hodnoty do kategórií, ako sú vysoká, nízka a stredná. Môžete napríklad kategorizovať hodnoty pre RISK
a rozdeliť ich do troch množín bin pre nízku, strednú a vysokú hodnotu.
Vetva
Vytvorí viacero výstupov z dátového toku. Ak máte napríklad dáta o transakciách predaja podľa krajiny, v prvej vetve môžete uložiť dáta pre USA a v druhej vetve dáta pre Kanadu.
Vytvoriť kocku Essbase
Vytvorte kocku Essbase z tabuľky alebo databázy.
Kumulatívna hodnota
Vypočíta kumulatívne hodnoty, ako je pohyblivý agregát alebo priebežný agregát.
Analytika databázy
Vykoná rozšírenú analýzu a analýzu dolovania dát. Môžete napríklad zisťovať anomálie, klastrovať dáta, vzorkovať dáta a analyzovať afinitu. Tento krok je k dispozícii v selektore krokov, keď sa pripojíte k množine dát databázy Oracle Database alebo Oracle Autonomous Data Warehouse. Analytické výpočty prebiehajú v databáze, nie v službe Oracle Analytics. Pozrite si časť Funkcie analytiky databázy.
Filter
Vyberie iba dáta, ktoré vás zaujímajú. Môžete napríklad vytvoriť filter na obmedzenie dát výnosov z predaja na roky 2020 až 2022.
Analytika grafu
Vykonanie geopriestorovej analýzy, ako je napríklad výpočet vzdialenosti alebo počet skokov medzi dvoma vrcholmi. Tento krok je k dispozícii v selektore krokov, keď sa pripojíte k množine dát databázy Oracle Database alebo Oracle Autonomous Data Warehouse. Analytické výpočty prebiehajú v databáze, nie v službe Oracle Analytics. Pozrite si časť Funkcie analytiky grafov.
Skupina
Kategorizuje nenumerické dáta do skupín, ktoré definujete. Napríklad objednávky pre odvetvia Telekomunikácie
a Digitálne
môžete spojiť do skupiny s názvom Technológie
a objednávky z odvetví Hry
a Streamovanie
do skupiny s názvom Zábava
.
Spojenie
Skombinuje dáta z viacerých dátových zdrojov pomocou databázového spojenia na základe spoločného stĺpca. Môžete napríklad spojiť množinu dát Orders
s množinou dát Customer_orders
s použitím poľa ID zákazníka.
Zlúčiť
Skombinuje viacero stĺpcov do jedného stĺpca. Môžete napríklad zlúčiť stĺpce poštovej adresy, názvu ulice, štátu a PSČ do jedného stĺpca.
Premenovať stĺpce
Zmeňte názov stĺpca na zmysluplnejší názov. Môžete napríklad zmeniť CELL na číslo bunky kontaktu.
Zmeniť poradie stĺpcov
Zmeňte poradie stĺpcov vo výstupnej množine dát. Stĺpce môžete zoradiť napríklad abecedne podľa názvu stĺpca alebo podľa typu dát (znak, celé číslo a pod.).
Uložiť dáta
Zadajte, kam sa majú uložiť dáta generované dátovým tokom. Dáta môžete uložiť v množine dát v službe Oracle Analytics alebo v databáze. Môžete zadať aj parametre času behu alebo zmeniť predvolený názov množiny dát. Pozrite si časť Podpora dátových tokov v databáze.
Vybrať stĺpce
Zadajte stĺpce, ktoré sa majú zahrnúť do dátového toku alebo vylúčiť z dátového toku (predvolené je zahrnutie všetkých dátových stĺpcov).
Rozdeliť stĺpce
Extrahujte dáta zo stĺpcov. Ak napríklad obsah stĺpca je 001011Black
, môžete tieto dáta rozdeliť do dvoch samostatných stĺpcov, 001011
a Black
.
Prognóza časovej série
Vypočíta prognózované hodnoty na základe historických dát. Prognóza použije stĺpec času a cieľový stĺpec z danej množiny dát a vypočíta prognózované hodnoty pre cieľový stĺpec.
Trénovať <typ modelu>
Trénuje modely strojového učenia pomocou algoritmov pre numerickú predikciu, viacnásobnú klasifikáciu, binárnu klasifikáciu a klastrovanie. Pozrite si časť Kroky dátového toku na trénovanie modelov strojového učenia
Keď je model strojového učenia natrénovaný, môžete ho použiť pre svoje dáta pomocou kroku Použiť model.
Transformovať stĺpec
Zmeňte formát, štruktúru alebo hodnoty dát. Môžete napríklad konvertovať text na text napísaný veľkými písmenami, odstrániť z dát úvodné a koncové medzery alebo vypočítať percentuálny nárast hodnoty.
Zjednotiť riadky
Zlúči riadky dvoch dátových zdrojov (v terminológii SQL je to príkaz UNION). Stĺpce môžete párovať podľa poradia alebo názvu.