Info over gegevensstromen

Met gegevensstromen kunt u gegevens organiseren en integreren om beheerde gegevenssets te genereren die uw gebruikers kunnen visualiseren.

Gebruik gegevensstromen om uw gegevens visueel te manipuleren. U hebt hiervoor geen handmatige coderingsvaardigheden nodig.

U kunt een gegevensstroom bijvoorbeeld gebruiken om:

  • een gegevensset te maken.
  • gegevens uit verschillende bronnen te combineren.
  • gegevens te aggregeren.
  • machine learning-modellen te trainen of een voorspellend machine learning-model op uw gegevens toe te passen.
  • Voer objectdetectie, afbeeldingsclassificatie of tekstdetectie uit met behulp van kunstimatige intelligentie via de service OCI Vision.

In het deelvenster met het stroomontwerp maakt u stromen.
Beschrijving van GUID-2B831D4B-0478-4EAC-917D-EA910D9FFFE3-default.png volgt hierna
.png

U voegt stappen toe als u een gegevensstroom wilt maken. Met elke stap wordt een bepaalde functie uitgevoerd, bijvoorbeeld het toevoegen van gegevens, samenvoegen van tabellen, samenvoegen van kolommen of transformeren van gegevens. Met de gegevensstroomeditor kunt u stappen toevoegen en configureren. Elke stap die u toevoegt of wijzigt, wordt gevalideerd. Als u de stroom hebt geconfigureerd, voert u deze uit om een gegevensset te maken of bij te werken.

Als u uw eigen kolommen toevoegt of gegevens transformeert, kunt u kiezen uit een groot aantal SQL-operatoren (bijvoorbeeld BETWEEN, LIKE, IN), voorwaardelijke uitdrukkingen (bijvoorbeeld CASE) en functies (bijvoorbeeld Gemiddelde, Mediaan, Percentiel).

Gegevenssets bijwerken die door stromen zijn gegenereerd

U kunt stromen opnieuw uitvoeren om uw gegevenssets up-to-date te houden.

Opmerking:

Wanneer u een stroom opnieuw runt, gaan alle transformaties verloren die rechtstreeks op de gegevensset van de uitvoer buiten de stroom worden toegepast. De gegevensset wordt helemaal opnieuw gemaakt.

Ondersteuning van database voor gegevensstromen

Met gegevensstromen kunt u gegevens uit gegevenssets, onderwerpgebieden of databaseverbindingen beheren.

Gegevensstromen kunnen afzonderlijk of als reeks worden uitgevoerd. U kunt meerdere gegevensbronnen opnemen in een gegevensstroom en aangeven hoe ze moeten worden samengevoegd.

Gebruik de stap Gegevens toevoegen om gegevens toe te voegen aan een gegevensstroom en gebruik de stap Gegevens opslaan om uitvoergegevens van een gegevensstroom op te slaan.

U kunt de uitvoergegevens van de gegevensstroom opslaan in een gegevensset of in een van de ondersteunde typen databases. Als u gegevens opslaat in een database, kunt u de gegevensbron transformeren door deze te overschrijven met de gegevens van de gegevensstroom. De tabellen voor de gegevensbron en de gegevensstroom moeten in dezelfde database staan en dezelfde naam hebben. Voordat u begint, moet u een verbinding met een van de ondersteunde databasetypen maken.

Opmerking:

U kunt gegevens uit externe databases toevoegen die zijn verbonden met Data Gateway. U kunt gegevens echter niet meer opslaan in externe databases die zijn verbonden met Data Gateway.

Gegevensuitvoer

U kunt uitvoergegevens van gegevensstromen opslaan in de volgende typen databases:
  • Oracle Autonomous Data Warehouse
  • Oracle Autonomous Transaction Processing
  • Oracle Database
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • Spark

Zie Ondersteunde gegevensbronnen voor informatie over databaseversies.

Gegevensinvoer

U kunt gegevens invoeren in gegevensstromen vanuit de meeste databasetypen (behalve Oracle Essbase en EPM Cloud).