Ktoré kroky môžem použiť na usporiadanie a integrovanie svojich dát?

Dáta môžete usporiadať, integrovať a transformovať pomocou nasledujúcich krokov v dátových tokoch. Môžete napríklad zlúčiť dátové zdroje, agregovať dáta alebo vykonať geopriestorovú analýzu.

Kroky umožňujú transformovať dáta vizuálne aj bez skúseností s kódovaním.

Na pridanie krokov do dátových tokov použite editor dátového toku.
Popis GUID-A3C23A5E-F96B-4EC3-9E7F-5917492D8368-default.png je uvedený nižšie
.png

Pridať stĺpce

Pridajte vlastné stĺpce do cieľovej množiny dát. Napríklad vynásobením počtu jednotiek v stĺpci UNITS predajnou cenou v stĺpci RETAIL_PRICE (čiže UNITS * RETAIL_PRICE) môžete vypočítať hodnotu zásob.

Pridať dáta

Pridajte dátové zdroje do dátového toku. Ak napríklad zlučujete dve množiny dát, pridajte obe množiny dát do dátového toku. Pozrite si časť Podpora dátových tokov v databáze.

Agregát

Vytvorí celkové hodnoty skupiny pomocou agregačných funkcií. Môžete použiť napríklad počet, súčet alebo priemer.

Analyzovať sentiment

Zistí sentiment pre daný textový stĺpec (len v angličtine). Môžete analyzovať napríklad spätnú väzbu od zákazníka a určiť, či je pozitívna alebo negatívna. Analýza sentimentu vyhodnocuje text na základe slov a fráz, ktoré označujú pozitívne, neutrálne alebo negatívne emócie. Na základe výstupu analýzy nový stĺpec obsahuje hodnotu Kladný, Neutrálny alebo Záporný.

Použiť model AI

Analyzujte dáta pomocou modelu umelej inteligencie. Môžete napríklad vykonať detekciu objektov, klasifikáciu obrázkov alebo detekciu textu pomocou modelu vytvoreného v službe OCI Vision. Pozrite si časť Používanie modelov služby Oracle Cloud Infrastructure Vision v službe Oracle Analytics. Pomocou modelov vytvorených v službe OCI Language môžete vykonať aj analýzu jazyka, napríklad analýzu sentimentu a detekciu jazyka.

Použiť model

Analyzujte dáta pomocou modelu strojového učenia z prostredia Oracle Machine Learning alebo zo služby OCI Výskum dát. Môžete napríklad vytvoriť model klasifikácie na predikciu, či v prípade e-mailov ide o nevyžiadanú poštu. Pozrite si časť Používanie prediktívneho alebo zaregistrovaného modelu strojového učenia Oracle v množine dát.

Použiť vlastný skript

Transformujte dáta pomocou funkcie, napríklad pomocou funkcie definovanej v infraštruktúre Oracle Cloud Infrastructure (OCI). Môžete napríklad použiť funkciu na konverziu textu v angličtine do španielčiny alebo nemčiny. Administrátor služby Oracle Analytics tieto funkcie zaregistruje, aby ste ich mohli používať.

AutoML

Funkcia AutoML databázy Oracle Autonomous Data Warehouse vám môže odporučiť a natrénovať prediktívny model. V kroku AutoML sa analyzujú dáta, vypočítava sa najvhodnejší algoritmus na použitie a registruje sa prediktívny model v službe Oracle Analytics. Analytické výpočty prebiehajú v databáze, nie v službe Oracle Analytics. Tento krok je k dispozícii v selektore krokov, keď sa pripojíte k množine dát databázy Oracle Autonomous Data Warehouse.

Pozrite si časť Trénovanie prediktívneho modelu pomocou režimu AutoML v databáze Oracle Autonomous Data Warehouse.

Ikona tutoriálu Tutoriál

Bin

Rozdelí dátové hodnoty do kategórií, ako sú vysoká, nízka a stredná. Môžete napríklad kategorizovať hodnoty pre RISK a rozdeliť ich do troch množín bin pre nízku, strednú a vysokú hodnotu.

Vetva

Vytvorí viacero výstupov z dátového toku. Ak máte napríklad dáta o transakciách predaja podľa krajiny, v prvej vetve môžete uložiť dáta pre USA a v druhej vetve dáta pre Kanadu.

Vytvoriť kocku Essbase

Vytvorte kocku Essbase z tabuľky alebo databázy.

Kumulatívna hodnota

Vypočíta kumulatívne hodnoty, ako je pohyblivý agregát alebo priebežný agregát.

Analytika databázy

Vykoná rozšírenú analýzu a analýzu dolovania dát. Môžete napríklad zisťovať anomálie, klastrovať dáta, vzorkovať dáta a analyzovať afinitu. Tento krok je k dispozícii v selektore krokov, keď sa pripojíte k množine dát databázy Oracle Database alebo Oracle Autonomous Data Warehouse. Analytické výpočty prebiehajú v databáze, nie v službe Oracle Analytics. Pozrite si časť Funkcie analytiky databázy.

Filter

Vyberie iba dáta, ktoré vás zaujímajú. Môžete napríklad vytvoriť filter na obmedzenie dát výnosov z predaja na roky 2020 až 2022.

Analytika grafu

Vykonanie geopriestorovej analýzy, ako je napríklad výpočet vzdialenosti alebo počet skokov medzi dvoma vrcholmi. Tento krok je k dispozícii v selektore krokov, keď sa pripojíte k množine dát databázy Oracle Database alebo Oracle Autonomous Data Warehouse. Analytické výpočty prebiehajú v databáze, nie v službe Oracle Analytics. Pozrite si časť Funkcie analytiky grafov.

Skupina

Kategorizuje nenumerické dáta do skupín, ktoré definujete. Napríklad objednávky pre odvetvia Telekomunikácie a Digitálne môžete spojiť do skupiny s názvom Technológie a objednávky z odvetví Hry a Streamovanie do skupiny s názvom Zábava.

Spojenie

Skombinuje dáta z viacerých dátových zdrojov pomocou databázového spojenia na základe spoločného stĺpca. Môžete napríklad spojiť množinu dát Orders s množinou dát Customer_orders s použitím poľa ID zákazníka.

Zlúčiť

Skombinuje viacero stĺpcov do jedného stĺpca. Môžete napríklad zlúčiť stĺpce poštovej adresy, názvu ulice, štátu a PSČ do jedného stĺpca.

Premenovať stĺpce

Zmeňte názov stĺpca na zmysluplnejší názov. Môžete napríklad zmeniť CELL na číslo bunky kontaktu.

Zmeniť poradie stĺpcov

Zmeňte poradie stĺpcov vo výstupnej množine dát. Stĺpce môžete zoradiť napríklad abecedne podľa názvu stĺpca alebo podľa typu dát (znak, celé číslo a pod.).

Uložiť dáta

Zadajte, kam sa majú uložiť dáta generované dátovým tokom. Dáta môžete uložiť v množine dát v službe Oracle Analytics alebo v databáze. Môžete zadať aj parametre času behu alebo zmeniť predvolený názov množiny dát. Pozrite si časť Podpora dátových tokov v databáze.

Vybrať stĺpce

Zadajte stĺpce, ktoré sa majú zahrnúť do dátového toku alebo vylúčiť z dátového toku (predvolené je zahrnutie všetkých dátových stĺpcov).

Rozdeliť stĺpce

Extrahujte dáta zo stĺpcov. Ak napríklad obsah stĺpca je 001011Black, môžete tieto dáta rozdeliť do dvoch samostatných stĺpcov, 001011 a Black.

Prognóza časovej série

Vypočíta prognózované hodnoty na základe historických dát. Prognóza použije stĺpec času a cieľový stĺpec z danej množiny dát a vypočíta prognózované hodnoty pre cieľový stĺpec.

Trénovať <typ modelu>

Trénuje modely strojového učenia pomocou algoritmov pre numerickú predikciu, viacnásobnú klasifikáciu, binárnu klasifikáciu a klastrovanie. Pozrite si časť Kroky dátového toku na trénovanie modelov strojového učenia

Keď je model strojového učenia natrénovaný, môžete ho použiť pre svoje dáta pomocou kroku Použiť model.

Transformovať stĺpec

Zmeňte formát, štruktúru alebo hodnoty dát. Môžete napríklad konvertovať text na text napísaný veľkými písmenami, odstrániť z dát úvodné a koncové medzery alebo vypočítať percentuálny nárast hodnoty.

Zjednotiť riadky

Zlúči riadky dvoch dátových zdrojov (v terminológii SQL je to príkaz UNION). Stĺpce môžete párovať podľa poradia alebo názvu.