Dataflöden

Med dataflöden kan du organisera och integrera data för att skapa kuraterade datamängder som dina användare kan visualisera.

Använd dataflöden till att manipulera data visuellt utan kunskap om manuell kodning.

Med ett dataflöde kan du till exempel:

  • skapa en datamängd
  • kombinera data från olika källor
  • aggregera data
  • träna modeller för maskininlärning eller använda en förutsägelsemodell för maskininlärning på dina data.
  • Utför objektavkänning, bildklassificering eller textavkänning med hjälp av artificiell intelligens via OCI Vision-tjänsten.

Du skapar dataflöden i dataflödesredigeraren.
Dataflödesredigeraren

Du bygger ett dataflöde genom att lägga till steg. Varje steg utför en specifik funktion, till exempel lägger till data, kopplar tabeller, slår samman kolumner, transformerar data eller sparar data. Använd dataflödesredigeraren för att lägga till och konfigurera stegen. Varje steg valideras när du lägger till eller ändrar det. När du har konfigurerat dataflödet exekverar du det för att producera eller uppdatera en datamängd.

När du lägger till egna kolumner eller transformerar data kan du använda en mängd olika SQL-operatorer (till exempel BETWEEN, LIKE, IN), villkorsuttryck (till exempel CASE) och funktioner (till exempel Avg, Median, Percentile).

Databasstöd för dataflöden

Med dataflöden kan du bearbeta data från datamängder, ämnesområden eller databasanslutningar.

Du kan exekvera dataflöden individuellt eller i en sekvens. Du kan inkludera flera datakällor i ett dataflöde och ange hur de ska kopplas.

Med steget Lägg till data lägger du till data i ett dataflöde och med steget Spara data sparar du utdata från ett dataflöde.

Du kan spara utdata från ett dataflöde antingen i en datamängd eller i någon av de databastyper som stöds. Om du sparar data i en databas kan du transformera datakällan genom att skriva över den med data från dataflödet. Datakällan och dataflödestabellerna måste finnas i samma databas och ha samma namn. Innan du börjar ska du skapa en anslutning till någon av de databastyper som stöds.

Obs!:

Du kan lägga till data från fjärrdatabaser som är anslutna till Data Gateway. Du kan däremot inte spara data tillbaka till fjärrdatabaser som är anslutna till Data Gateway.

Utdata

Du kan spara utdata från dataflöden i dessa typer av databaser:
  • Oracle Autonomous Data Warehouse
  • Oracles autonoma transaktionsbearbetning
  • Oracle Database
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • Spark

Information om databasversion finns i Datakällor som stöds.

Indata

Du kan lägga till data i dataflöden från de flesta databastyper (förutom Oracle Essbase och EPM-molnet).

Arbeta i dataflödesredigeraren

Du förbereder data för analys genom att skapa dataflöden i dataflödesredigeraren. Du kan till exempel transformera eller slå samman kolumner eller kategorisera data i behållare. Ta reda på hur du använder dataflödesredigeraren till att snabbt komma igång med att förbereda data.

Arbeta i dataflödesredigeraren:

Namn Ikon Vad de gör
Data

Ikonen Datapanel

Visa datapanelen, där du kan dra och släppa datakolumner till dataflödesredigeraren.

Dataflödessteg Ikonen Dataflödessteg

Visa rutan med steg, där du kan dra och släppa steg till dataflödesredigeraren.

Dataförhandsgranskning

Ikonen Dataförhandsgranskning

Dölj eller visa kolumnrutan Förhandsgranska data genom att klicka på Växla dataförhandsgranskning längst ned till höger i dataflödesredigeraren. Den här rutan uppdateras automatiskt när du gör ändringar i dataflödet. Du kan ange om stegändringar ska förnyas automatiskt i panelen Förhandsgranska data, genom att klicka på Använd automatiskt.

Kör dataflöde Kör dataflöde Exekvera (eller "kör") dataflödet.
Visa tillgängliga funktioner/dölj funktioner

Ikonen Visa tillgängliga funktioner/Dölj funktioner

Visa eller dölj urvalslistan för uttryck. Den här ikonen visas endast för steg som gör det möjligt att bygga egna uttryck, t.ex. steget "Lägg till kolumner" eller steget "Transformera kolumn".

Redigera steg

Ikonen Redigera steg

Dölj eller visa rutan Stegredigeraren genom att klicka på ikonen Växla stegredigerare längst ned till höger i dataflödesredigeraren.

Växla autoförnyelse Växla autoförnyelse för data i dataflöden Aktivera om du vill förnya dataförhandsgranskningen direkt när du gör ändringar i dataflödet. Om du till exempel har ett steg för kolumntransformering som ändrar text från gemener till versaler visas texten i versaler i dataförhandsgranskningen. Om du stänger av funktionen förnyas dataförhandsgranskningen bara om du klickar på Förnya förhandsgranskning av data.