Przedstawione tu etapy mogą być używane w przepływach danych w celu organizacji, integracji i transformacji danych. Na przykład można scalać źródła danych, agregować dane lub przeprowadzać analizy geoprzestrzenne.
Korzystając z etapów, można wizualnie przekształcać dane bez konieczności posiadania umiejętności w zakresie kodowania.
Do dodawania etapów do przepływów danych służy edytor przepływu danych.
.png"
Dodawanie kolumn
Dodawanie niestandardowych kolumn do docelowego zbioru danych. Na przykład można obliczyć wartość akcji, mnożąc liczbę jednostek z kolumny UNITS
przez cenę sprzedaży z kolumny RETAIL_PRICE
(UNITS
* RETAIL_PRICE
).
Dodawanie danych
Dodawanie źródeł danych do przepływu danych. Na przykład, scalając dwa zbiory danych, można te zbiory dodać do przepływu danych. Zob. Obsługa baz danych dla przepływów danych.
Agregacja
Tworzenie podsumowań grup przez zastosowanie funkcji agregacji. Na przykład licznik, suma lub średnia.
Analizowanie odczuć
Wykrywanie odczuć do danej kolumny tekstowej (tylko w języku angielskim). Na przykład można analizować informacje zwrotne od klienta w celu ustalenia, czy są one pozytywne czy negatywne. Analiza odczuć ocenia tekst na podstawie wyrazów i fraz sygnalizujących emocje pozytywne, obojętne lub negatywne. Bazując na wynikach analizy, nowa kolumna zawiera "Pozytywne", "Obojętne" lub "Negatywne".
Stosowanie modelu AI
Analiza danych za pomocą modelu sztucznej inteligencji. Na przykład można wykryć obiekt, sklasyfikować obraz lub wykryć tekst za pomocą modelu utworzonego w usłudze OCI Vision. Zob. Używanie modeli Oracle Cloud Infrastructure Vision w Oracle Analytics. Korzystając z modeli utworzonych w usłudze OCI Language, można także przeprowadzać analizy językowe, takie jak analiza odczuć czy wykrywanie języka.
Stosowanie modelu
Dane można analizować poprzez zastosowanie modelu uczenia maszynowego z usług Oracle Machine Learning lub OCI Data Science. Na przykład można utworzyć model klasyfikacji służący do przewidywania, czy e-maile są czy nie są spamem. Zob. Stosowanie modelu predykcyjnego lub zarejestrowanego modelu Oracle Machine Learning do zbioru danych.
Stosowanie skryptu niestandardowego
Transformacja danych za pomocą funkcji, takich jak zdefiniowane w OCI (Oracle Cloud Infrastructure). Na przykład można użyć funkcji w celu przekształcenia tekstu angielskiego na hiszpański lub niemiecki. Aby te funkcje były dostępne dla użytkownika, administrator Oracle Analytics rejestruje je.
AutoML
Funkcji AutoML z Oracle Autonomous Data Warehouse można używać do zalecenia i wytrenowania modelu predykcyjnego. AutoML analizuje dane, ustala najlepszy do użycia algorytm oraz rejestruje model predykcyjny w Oracle Analytics, tak aby można było tworzyć prognozy na podstawie swoich danych. Analizy są obliczane nie w Oracle Analytics, lecz w bazie danych. Etap ten jest dostępny w selektorze etapów, gdy jest ustanowione połączenie ze zbiorem danych opartym na Oracle Autonomous Data Warehouse.
Zob. Trenowanie modelu predykcyjnego przy użyciu funkcji AutoML z Oracle Autonomous Data Warehouse.
Przypisywanie do pojemników
Przydzielanie wartości danych do kategorii, takich jak wysokie, niskie lub średnie. Na przykład można zaklasyfikować wartości ryzyka do trzech pojemników: małe, średnie i duże.
Rozgałęzienie
Można utworzyć wiele wyjść z przepływu danych. Na przykład, mając oparte na kraju dane obejmujące transakcje sprzedaży, można w pierwszej gałęzi zapisać dane dla Stanów Zjednoczonych, a w drugiej - dla Kanady.
Tworzenie kostki Essbase
Kostkę Essbase można utworzyć, używając arkusza kalkulacyjnego lub bazy danych.
Wartość kumulowana
Obliczanie podsumowania skumulowanego, takiego jak agregacja ruchoma lub agregacja kumulacyjna.
Analizy bazy danych
Wykonywanie zaawansowanych analiz i analiz eksploracji danych. Pozwala to na przykład wykrywać anomalie, grupować dane, próbkować dane i analizować powinowactwo. Etap ten jest dostępny w selektorze etapów, gdy jest ustanowione połączenie ze zbiorem danych opartym na bazie danych Oracle lub na Oracle Autonomous Data Warehouse. Analizy są obliczane nie w Oracle Analytics, lecz w bazie danych. Zob. Funkcje analizy bazy danych.
Filtrowanie
Wybór tylko interesujących danych. Na przykład można utworzyć filtr, aby ograniczyć dane, przedstawiające przychód ze sprzedaży, do lat od 2020 do 2022.
Analizy grafów
Wykonywanie analiz geoprzestrzennych, takich jak obliczanie odległości lub liczby przeskoków między dwoma wierzchołkami. Etap ten jest dostępny w selektorze etapów, gdy jest ustanowione połączenie ze zbiorem danych opartym na bazie danych Oracle lub na Oracle Autonomous Data Warehouse. Analizy są obliczane nie w Oracle Analytics, lecz w bazie danych. Zob. Funkcje analizy grafów.
Grupowanie
Klasyfikowanie danych nieliczbowych do grup definiowanych przez użytkownika. Na przykład można przydzielić zamówienia z kategorii Komunikacja
i Cyfrowe
do grupy o nazwie Technologia
, a zamówienia z kategorii Gry
i Strumieniowane
do grupy o nazwie Rozrywka
.
Złączenie
Łączenie danych pochodzących z różnych źródeł danych przy użyciu złączenia opartego na wspólnej kolumnie. Na przykład można złączyć zbiór danych Zamówienia
ze zbiorem danych Zamówienia klientów
, używając unikatowego pola "ID klienta".
Scalanie
Łączenie kilku kolumn w jedną kolumnę. Na przykład można scalić kolumny z nazwą ulicy, numerem domu, województwem i kodem pocztowym, tworząc z nich jedną kolumnę.
Zmienianie nazw kolumn
Zmienianie nazwy kolumny na bardziej opisową. Na przykład można zmienić "CELL" na "Nr telefonu komórkowego osoby kontaktowej".
Zmienianie kolejności kolumn
Zmienianie kolejności kolumn w wyjściowym zbiorze danych. Na przykład kolumny można uporządkować na podstawie nazwy kolumny (alfabetycznie) lub na podstawie typu danych (znakowe, napisowe itd.).
Zapisywanie danych
Określanie, gdzie mają zostać zapisane dane wygenerowane przez przepływ danych. Dane można zapisać albo w zbiorze danych w Oracle Analytics, albo w bazie danych. Można także określić parametry wykonawcze lub zmienić domyślną nazwę zbioru danych. Zob. Obsługa baz danych dla przepływów danych.
Wybór kolumn
Określenie, które kolumny mają być uwzględniane w przepływie danych lub z niego wykluczane (domyślnie są uwzględniane wszystkie kolumny danych).
Rozdzielanie kolumn
Wyodrębnianie danych z kolumn. Na przykład, jeśli kolumna zawiera dane 001011Black
, to można je rozdzielić na dwie osobne kolumny: 001011
i Black
.
Prognoza ciągów czasowych
Obliczanie prognozowanych wartości na podstawie historycznych danych. Prognoza przyjmuje kolumnę czasu i docelową kolumnę z danego zbioru danych, po czym oblicza prognozowane wartości dla docelowej kolumny.
Szkolenie <typ modelu>
Szkolenie modeli uczenia maszynowego z użyciem algorytmów predykcji liczbowej, klasyfikacji wieloklasowej, klasyfikacji dwójkowej i klastrowania. Zob. Etapy przepływu danych dotyczące szkolenia modeli uczenia maszynowego.
Wyszkolony model uczenia maszynowego można zastosować do danych, używając etapu Stosowanie modelu.
Transformacja kolumny
Zmiana formatu, struktury lub wartości danych. Na przykład można przekształcić tekst w pisany wielkimi literami, usunąć z danych początkowe i końcowe spacje lub obliczyć procentowy wzrost wartości.
Tworzenie unii wierszy
Scalanie wierszy dwóch źródeł danych (polecenie UNION w terminologii SQL). Kolumny można uzgadniać według kolejności lub nazwy.