Info over gegevensstromen

Met gegevensstromen kunt u gegevens organiseren en integreren om beheerde gegevenssets te genereren die uw gebruikers kunnen visualiseren.

Gebruik gegevensstromen om uw gegevens visueel te manipuleren. U hebt hiervoor geen handmatige coderingsvaardigheden nodig.

U kunt een gegevensstroom bijvoorbeeld gebruiken om:

  • een gegevensset te maken.
  • gegevens uit verschillende bronnen te combineren.
  • gegevens te aggregeren.
  • machine learning-modellen te trainen of een voorspellend machine learning-model op uw gegevens toe te passen.
  • Voer objectdetectie, afbeeldingsclassificatie of tekstdetectie uit met behulp van kunstimatige intelligentie via de service OCI Vision.

In de gegevensstroomeditor maakt u gegevensstromen.
Gegevensstroomeditor

U voegt stappen toe als u een gegevensstroom wilt maken. Met elke stap wordt een bepaalde functie uitgevoerd, bijvoorbeeld het toevoegen van gegevens, samenvoegen van tabellen, samenvoegen van kolommen, transformeren van gegevens of opslaan van uw gegevens. Met de gegevensstroomeditor kunt u stappen toevoegen en configureren. Elke stap die u toevoegt of wijzigt, wordt gevalideerd. Als u de gegevensstroom hebt geconfigureerd, voert u deze uit om een gegevensset te genereren of bij te werken.

Als u uw eigen kolommen toevoegt of gegevens transformeert, kunt u kiezen uit een groot aantal SQL-operatoren (bijvoorbeeld BETWEEN, LIKE, IN), voorwaardelijke uitdrukkingen (bijvoorbeeld CASE) en functies (bijvoorbeeld Gemiddelde, Mediaan, Percentiel).

Ondersteuning van database voor gegevensstromen

Met gegevensstromen kunt u gegevens uit gegevenssets, onderwerpgebieden of databaseverbindingen beheren.

Gegevensstromen kunnen afzonderlijk of als reeks worden uitgevoerd. U kunt meerdere gegevensbronnen opnemen in een gegevensstroom en aangeven hoe ze moeten worden samengevoegd.

Gebruik de stap Gegevens toevoegen om gegevens toe te voegen aan een gegevensstroom en gebruik de stap Gegevens opslaan om uitvoergegevens van een gegevensstroom op te slaan.

U kunt de uitvoergegevens van de gegevensstroom opslaan in een gegevensset of in een van de ondersteunde typen databases. Als u gegevens opslaat in een database, kunt u de gegevensbron transformeren door deze te overschrijven met de gegevens van de gegevensstroom. De tabellen voor de gegevensbron en de gegevensstroom moeten in dezelfde database staan en dezelfde naam hebben. Voordat u begint, moet u een verbinding met een van de ondersteunde databasetypen maken.

Opmerking:

U kunt gegevens uit externe databases toevoegen die zijn verbonden met Data Gateway. U kunt gegevens echter niet meer opslaan in externe databases die zijn verbonden met Data Gateway.

Gegevensuitvoer

U kunt uitvoergegevens van gegevensstromen opslaan in de volgende typen databases:
  • Oracle Autonomous Data Warehouse
  • Oracle Autonomous Transaction Processing
  • Oracle Database
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • Spark

Zie Ondersteunde gegevensbronnen voor informatie over databaseversies.

Gegevensinvoer

U kunt gegevens invoeren in gegevensstromen vanuit de meeste databasetypen (behalve Oracle Essbase en EPM Cloud).

Werken in de gegevensstroomeditor

U bereidt uw gegevens voor analyse voor door gegevensstromen op te bouwen in de gegevensstroomeditor. U kunt bijvoorbeeld kolommen transformeren, kolommen samenvoegen of gegevens in containers categoriseren. Ontdek hoe u de gegevensstroomeditor gebruikt om snel aan de slag te gaan met het voorbereiden van gegevens.

Werken in de gegevensstroomeditor:

Naam Pictogram Resultaat
Gegevens

Pictogram deelvenster Gegevens

Hiermee wordt het gegevensdeelvenster weergegeven, waarin u gegevenskolommen naar de gegevensstroomeditor kunt slepen.

Stappen gegevensstroom Pictogram deelvenster Stappen gegevensstroom

Hiermee wordt het stappendeelvenster weergegeven, waarin u stappen naar de gegevensstroomeditor kunt slepen.

Voorbeeld van gegevens

Pictogram 'Voorbeeld van gegevens'

U kunt het deelvenster 'Voorbeeld' voor gegevenskolommen weergeven of verbergen door op Voorbeeld van gegevens in-/uitschakelen in de rechterbenedenhoek van de gegevensstroomeditor te klikken. Dit deelvenster wordt automatisch bijgewerkt wanneer u wijzigingen aanbrengt in de gegevensstroom. U kunt opgeven of stapwijzigingen al dan niet automatisch moeten worden vernieuwd in het deelvenster 'Voorbeeld van gegevens' door op Automatisch toepassen te klikken.

Gegevensstroom uitvoeren Gegevensstroom uitvoeren De gegevensstoom uitvoeren (ook bekend als 'run').
Beschikbare functies tonen/functies verbergen

Pictogram Beschikbare functies tonen/Functies verbergen

Hiermee kunt u de uitdrukkingenkeuzelijst weergeven of verbergen. Dit pictogram wordt alleen weergegeven voor stappen waarmee u uw eigen uitdrukking kunt maken, bijvoorbeeld de stap 'Kolommen toevoegen' of de stap 'Kolom transformeren'.

Stapeditor

Pictogram Stapeditor

U kunt het deelvenster 'Stapeditor' weergeven of verbergen door op het pictogram Stapeditor in-/uitschakelen in de rechterbenedenhoek van de gegevensstroomeditor te klikken.

Automatisch vernieuwen in-/uitschakelen Automatisch vernieuwen voor gegevens in gegevensstromen in-/uitschakelen U kunt dit inschakelen om het voorbeeld van gegevens te vernieuwen als u de gegevensstroom wijzigt. Als u bijvoorbeeld een stap voor het transformeren van een kolom hebt waarmee tekst van kleine letters wordt veranderd in hoofdletters, ziet u de tekst in het gegevensvoorbeeld in hoofdletters. Als dit is uitgeschakeld wordt het voorbeeld van de gegevens alleen vernieuwd als u op Voorbeeld van gegevens vernieuwen klikt.

(Voorbeeld) Werken in de uitgebreide gegevensstroomontwerper

Met de nieuwste gegevensstroomontwerper kunt u eenvoudiger gegevensstromen maken met behulp van verbeterde functies. Deze gebruikersinterface biedt nieuwe pictogrammen, verbeterde join- en vereniging-creatie en twee afzonderlijke lay-outs voor naadloze navigatie.

Werken in de verbeterde gegevensstroomontwerper:

Vraag de beheerder de nieuwe ontwerper te activeren als u deze wilt gebruiken.

De nieuwe ontwerper beschikt over nieuwe pictogrammen en verbeteringen.


Beschrijving van GUID-2B831D4B-0478-4EAC-917D-EA910D9FFFE3-default.png volgt hierna
.png

Functie Pictogram Beschrijving
Compacte lay-out Pictogram 'Compacte lay-out' Groepeer stappen in een kleiner weergavegebied om schuiven te verminderen.
Uitgebreide lay-out Pictogram 'Uitgebreide lay-out' Stappen voor invoergegevensbronnen links uitlijnen om de leesbaarheid te verbeteren.
Onvolledige join of vereniging

Pictogram 'Onvolledige join of vereniging'

Hiermee wordt een gegevensbron zonder join of vereniging aangegeven. Beweeg met de muis over het blauwe koppelingspictogram om een voorgesteld join-doel (stippellijn) te zien en klik opnieuw om de join of vereniging (vaste lijn) te voltooien.

Zoomverbeteringen Pictogram 'Zoomen' Hiermee zoomt u in en uit.