1 Kom igång med datakällor i Oracle Analytics

Avsnitt

Datakällor

Du kan ansluta till många typer av datakällor, som molndatabaser och lokala databaser, och till många vanligt använda applikationer som Dropbox, Google Drive och Amazon Hive.

Du skapar en anslutning för varje datakälla som du vill få åtkomst till i Oracle Analytics. När du har anslutit kan du visualisera data och skapa insikter.

En datakälla är en tabellstruktur. Du ser datakällvärden när du har laddat en fil eller skickat en fråga till en tjänst som returnerar resultat.

En datakälla kan innehålla något av följande:

  • Matchningskolumner – dessa innehåller värden som finns i matchningskolumnen i en annan källa, som relaterar den här källan till den andra källan, till exempel kund-id eller produkt-id.
  • Attributkolumner – dessa innehåller text, datum eller tal som krävs individuellt och som inte aggregeras, till exempel år, kategoriland, typ eller namn.
  • Måttkolumner – dessa kolumner innehåller värden som ska aggregeras, exempelvis intäkt och körsträcka.

Du kan analysera en datakälla på egen hand, alternativt så kan du analysera två eller flera datakällor tillsammans, beroende på vad datakällan innehåller. Om du använder flera källor tillsammans måste det finnas minst en matchningskolumn i varje källa. Kraven för matchning är:

  • Källorna innehåller gemensamma värden, till exempel kund-id eller produkt-id.
  • Matchningen måste vara av samma datatyp, till exempel tal med tal, datum med datum eller text med text.

När du sparar en arbetsbok synkroniseras behörigheterna mellan arbetsboken och de externa källor som används. Om du delar arbetsboken med andra användare delas även de externa källorna med de användarna.

Alla data du laddar upp (som en datamängd) lagras på ett säkert sätt i Oracle Cloud.

Datakällor och ämnesområden

Du kan kombinera datakällor med ämnesområden för att utforska och analysera data.

Ett ämnesområde utökar antingen en dimension genom att lägga till attribut eller utökar fakta genom att lägga till mått och valfria attribut. Du kan inte definiera hierarkier i datakällor.

Ett ämnesområde organiserar attribut i dimensioner, ofta med hierarkier, och en uppsättning mått, ofta med komplexa beräkningar, som kan analyseras mot dimensionsattributen, t.ex. måttet nettointäkt per kundsegment för det aktuella kvartalet och samma kvartal för ett år sedan.

När du använder data från en källa, t.ex. en Excel-fil, lägger filen till information som är ny i ämnesområdet. Anta till exempel att du har köpt demografisk information för postnummerområden eller kreditriskinformation och vill använda dessa data i en analys innan du lägger till data i databasen eller ett befintligt ämnesområde.

Om en källa används fristående innebär det att data från källan används oberoende av ett ämnesområde. Den är antingen en enstaka fil eller flera filer som används tillsammans och i båda fallen är inget ämnesområde involverat.

Du kan utöka en dimension genom att lägga till attribut från en datakälla i ett ämnesområde:

  • Du kan endast göra matchningar på en enda dimension.

  • Uppsättningen värden i matchade kolumner är unika i datakällan. Om datakällan till exempel matchas per postnummer så är postnumren i källan unika.

  • Du kan göra matchningar mellan enstaka eller sammansatta kolumner. Ett exempel på en enkolumnsmatchning är att produktnyckel matchar produktnyckel. För sammansatta kolumner matchas till exempel företag med företag och affärsenhet med affärsenhet.

  • Alla övriga kolumner måste vara attribut.

Du kan lägga till mått från en datakälla i ett ämnesområde:

  • Du kan göra matchningar mot en eller flera dimensioner.

  • Uppsättningen värden i matchade kolumner är inte nödvändigtvis unika i datakällan. Om datakällan till exempel är en uppsättning försäljningar matchade per datum, kund och produkt kan du ha flera försäljningar av en produkt till en kund under samma dag.

  • Du kan göra matchningar mellan enstaka eller sammansatta kolumner. Ett exempel på en enkolumnsmatchning är att produktnyckel matchar produktnyckel. Ett exempel för sammansatta kolumner är att ort och delstat från separata kolumner skapar sammansättningen City_State i en kundadress.

En datakälla som lägger till mått kan innehålla attribut. Du kan använda de här attributen tillsammans med de externa måtten och inte tillsammans med de bearbetade måtten i visualiseringar. När du t.ex. lägger till en källa med försäljningssiffrorna för en ny verksamhet kan du matcha den nya verksamhetens försäljning med en befintlig tidsdimension och ingenting annat. Data kan innehålla information om produkterna som säljs av den här nya verksamheten. Du kan visa försäljningen för det befintliga företaget med det nya företagets efter tid, men du kan inte visa intäkten för det gamla företaget per nya affärsprodukter. Du kan inte heller visa intäkten för den nya verksamheten per gamla affärsprodukter. Du kan visa intäkt för den nya verksamheten per tid och nya affärsprodukter.

Datakällor och måttkolumner

Du kan arbeta med datakällor som antingen inkluderar eller inte inkluderar en måttkolumn.

  • Du kan matcha tabeller med mått med andra tabeller med ett mått, en dimension, eller båda delarna.

  • När du matchar tabeller med andra tabeller med mått behöver tabellerna inte ha samma detaljnivå. Du kan t.ex. matcha en tabell över daglig försäljning med en tabell över kvartalsvis försäljning.

En tabell utan mått behandlas som en dimension.

  • Matchningar kan göras mellan enstaka eller sammansatta kolumner. En enstaka kolumnmatchning skulle kunna vara produktnyckeln i en tabell som matchar produktnyckeln i en annan. En sammansatt kolumnmatchning skulle kunna vara när företag och affärsenhet i en tabell matchar företag och affärsenhet i en annan tabell.

  • Alla övriga kolumner måste vara attribut.

Dimensionstabeller kan matchas med andra dimensioner eller matchas med tabeller med mått. En tabell med kundattribut kan till exempel matchas med en tabell med demografiska attribut, förutsatt att båda dimensionerna har unika kundnyckelkolumner och demografiska nyckelkolumner.