Jakich etapów można używać do organizowania i integrowania swoich danych?

Przedstawione tu etapy mogą być używane w przepływach danych w celu organizacji, integracji i transformacji danych. Na przykład można scalać źródła danych, agregować dane lub przeprowadzać analizy geoprzestrzenne.

Korzystając z etapów, można wizualnie przekształcać dane bez konieczności posiadania umiejętności w zakresie kodowania.

Do dodawania etapów do przepływów danych służy edytor przepływu danych.
Opis "GUID-A3C23A5E-F96B-4EC3-9E7F-5917492D8368-default.png" znajduje się poniżej
.png"

Dodawanie kolumn

Dodawanie niestandardowych kolumn do docelowego zbioru danych. Na przykład można obliczyć wartość akcji, mnożąc liczbę jednostek z kolumny UNITS przez cenę sprzedaży z kolumny RETAIL_PRICE (UNITS * RETAIL_PRICE).

Dodawanie danych

Dodawanie źródeł danych do przepływu danych. Na przykład, scalając dwa zbiory danych, można te zbiory dodać do przepływu danych. Zob. Obsługa baz danych dla przepływów danych.

Agregacja

Tworzenie podsumowań grup przez zastosowanie funkcji agregacji. Na przykład licznik, suma lub średnia.

Analizowanie odczuć

Wykrywanie odczuć do danej kolumny tekstowej (tylko w języku angielskim). Na przykład można analizować informacje zwrotne od klienta w celu ustalenia, czy są one pozytywne czy negatywne. Analiza odczuć ocenia tekst na podstawie wyrazów i fraz sygnalizujących emocje pozytywne, obojętne lub negatywne. Bazując na wynikach analizy, nowa kolumna zawiera "Pozytywne", "Obojętne" lub "Negatywne".

Stosowanie modelu AI

Analiza danych za pomocą modelu sztucznej inteligencji. Na przykład można wykryć obiekt, sklasyfikować obraz lub wykryć tekst za pomocą modelu utworzonego w usłudze OCI Vision. Zob. Używanie modeli Oracle Cloud Infrastructure Vision w Oracle Analytics. Korzystając z modeli utworzonych w usłudze OCI Language, można także przeprowadzać analizy językowe, takie jak analiza odczuć czy wykrywanie języka.

Stosowanie modelu

Dane można analizować poprzez zastosowanie modelu uczenia maszynowego z usług Oracle Machine Learning lub OCI Data Science. Na przykład można utworzyć model klasyfikacji służący do przewidywania, czy e-maile są czy nie są spamem. Zob. Stosowanie modelu predykcyjnego lub zarejestrowanego modelu Oracle Machine Learning do zbioru danych.

Stosowanie skryptu niestandardowego

Transformacja danych za pomocą funkcji, takich jak zdefiniowane w OCI (Oracle Cloud Infrastructure). Na przykład można użyć funkcji w celu przekształcenia tekstu angielskiego na hiszpański lub niemiecki. Aby te funkcje były dostępne dla użytkownika, administrator Oracle Analytics rejestruje je.

AutoML

Funkcji AutoML z Oracle Autonomous Data Warehouse można używać do zalecenia i wytrenowania modelu predykcyjnego. AutoML analizuje dane, ustala najlepszy do użycia algorytm oraz rejestruje model predykcyjny w Oracle Analytics, tak aby można było tworzyć prognozy na podstawie swoich danych. Analizy są obliczane nie w Oracle Analytics, lecz w bazie danych. Etap ten jest dostępny w selektorze etapów, gdy jest ustanowione połączenie ze zbiorem danych opartym na Oracle Autonomous Data Warehouse.

Zob. Trenowanie modelu predykcyjnego przy użyciu funkcji AutoML z Oracle Autonomous Data Warehouse.

Ikona samouczka Samouczek

Przypisywanie do pojemników

Przydzielanie wartości danych do kategorii, takich jak wysokie, niskie lub średnie. Na przykład można zaklasyfikować wartości ryzyka do trzech pojemników: małe, średnie i duże.

Rozgałęzienie

Można utworzyć wiele wyjść z przepływu danych. Na przykład, mając oparte na kraju dane obejmujące transakcje sprzedaży, można w pierwszej gałęzi zapisać dane dla Stanów Zjednoczonych, a w drugiej - dla Kanady.

Tworzenie kostki Essbase

Kostkę Essbase można utworzyć, używając arkusza kalkulacyjnego lub bazy danych.

Wartość kumulowana

Obliczanie podsumowania skumulowanego, takiego jak agregacja ruchoma lub agregacja kumulacyjna.

Analizy bazy danych

Wykonywanie zaawansowanych analiz i analiz eksploracji danych. Pozwala to na przykład wykrywać anomalie, grupować dane, próbkować dane i analizować powinowactwo. Etap ten jest dostępny w selektorze etapów, gdy jest ustanowione połączenie ze zbiorem danych opartym na bazie danych Oracle lub na Oracle Autonomous Data Warehouse. Analizy są obliczane nie w Oracle Analytics, lecz w bazie danych. Zob. Funkcje analizy bazy danych.

Filtrowanie

Wybór tylko interesujących danych. Na przykład można utworzyć filtr, aby ograniczyć dane, przedstawiające przychód ze sprzedaży, do lat od 2020 do 2022.

Analizy grafów

Wykonywanie analiz geoprzestrzennych, takich jak obliczanie odległości lub liczby przeskoków między dwoma wierzchołkami. Etap ten jest dostępny w selektorze etapów, gdy jest ustanowione połączenie ze zbiorem danych opartym na bazie danych Oracle lub na Oracle Autonomous Data Warehouse. Analizy są obliczane nie w Oracle Analytics, lecz w bazie danych. Zob. Funkcje analizy grafów.

Grupowanie

Klasyfikowanie danych nieliczbowych do grup definiowanych przez użytkownika. Na przykład można przydzielić zamówienia z kategorii Komunikacja i Cyfrowe do grupy o nazwie Technologia, a zamówienia z kategorii Gry i Strumieniowane do grupy o nazwie Rozrywka.

Złączenie

Łączenie danych pochodzących z różnych źródeł danych przy użyciu złączenia opartego na wspólnej kolumnie. Na przykład można złączyć zbiór danych Zamówienia ze zbiorem danych Zamówienia klientów, używając unikatowego pola "ID klienta".

Scalanie

Łączenie kilku kolumn w jedną kolumnę. Na przykład można scalić kolumny z nazwą ulicy, numerem domu, województwem i kodem pocztowym, tworząc z nich jedną kolumnę.

Zmienianie nazw kolumn

Zmienianie nazwy kolumny na bardziej opisową. Na przykład można zmienić "CELL" na "Nr telefonu komórkowego osoby kontaktowej".

Zmienianie kolejności kolumn

Zmienianie kolejności kolumn w wyjściowym zbiorze danych. Na przykład kolumny można uporządkować na podstawie nazwy kolumny (alfabetycznie) lub na podstawie typu danych (znakowe, napisowe itd.).

Zapisywanie danych

Określanie, gdzie mają zostać zapisane dane wygenerowane przez przepływ danych. Dane można zapisać albo w zbiorze danych w Oracle Analytics, albo w bazie danych. Można także określić parametry wykonawcze lub zmienić domyślną nazwę zbioru danych. Zob. Obsługa baz danych dla przepływów danych.

Wybór kolumn

Określenie, które kolumny mają być uwzględniane w przepływie danych lub z niego wykluczane (domyślnie są uwzględniane wszystkie kolumny danych).

Rozdzielanie kolumn

Wyodrębnianie danych z kolumn. Na przykład, jeśli kolumna zawiera dane 001011Black, to można je rozdzielić na dwie osobne kolumny: 001011 i Black.

Prognoza ciągów czasowych

Obliczanie prognozowanych wartości na podstawie historycznych danych. Prognoza przyjmuje kolumnę czasu i docelową kolumnę z danego zbioru danych, po czym oblicza prognozowane wartości dla docelowej kolumny.

Szkolenie <typ modelu>

Szkolenie modeli uczenia maszynowego z użyciem algorytmów predykcji liczbowej, klasyfikacji wieloklasowej, klasyfikacji dwójkowej i klastrowania. Zob. Etapy przepływu danych dotyczące szkolenia modeli uczenia maszynowego.

Wyszkolony model uczenia maszynowego można zastosować do danych, używając etapu Stosowanie modelu.

Transformacja kolumny

Zmiana formatu, struktury lub wartości danych. Na przykład można przekształcić tekst w pisany wielkimi literami, usunąć z danych początkowe i końcowe spacje lub obliczyć procentowy wzrost wartości.

Tworzenie unii wierszy

Scalanie wierszy dwóch źródeł danych (polecenie UNION w terminologii SQL). Kolumny można uzgadniać według kolejności lub nazwy.