Acerca de los Flujos de Datos

Los flujos de datos permiten organizar e integrar los datos para generar juegos de datos curados que los usuarios pueden visualizar.

Use los flujos de datos para cambiar los datos visualmente sin que sea necesario tener conocimientos de codificación manual.

Por ejemplo, puede usar un flujo de datos para:

  • Crear un juego de datos.
  • Combinar datos de diferentes orígenes.
  • Agregar datos.
  • Entrenar modelos de Machine Learning o aplicar un modelo de Machine Learning predictivo a sus datos.
  • Realice la detección de objetos, la clasificación de imágenes o la detección de texto utilizando la inteligencia artificial a través del servicio OCI Vision.

Los flujos de datos se crean en el editor de flujos de datos.
Editor de flujos de datos

Para crear un flujo de datos, es necesario agregar pasos. Cada paso realiza una función específica; por ejemplo, agregar datos, unir tablas, fusionar columnas, transformar los datos, guardar los datos. Utilice el editor de flujos de datos para agregar y configurar pasos. Cada paso se valida cuando se agrega o se modifica. Una vez que ha configurado un flujo de datos, debe ejecutarlo para producir o actualizar un juego de datos.

Si agrega sus propias columnas o transforma los datos, puede utilizar una amplia variedad de operadores SQL (por ejemplo, BETWEEN, LIKE, IN), expresiones condicionales (por ejemplo, CASE) y funciones (por ejemplo, media, mediana, percentil).

Soporte de base de datos para flujos de datos

Con los flujos de datos, puede curar datos de juegos de datos, áreas temáticas o conexiones de bases de datos.

Utilice el paso Agregar datos para agregar datos a un flujo de datos, y utilice el paso Guardar datos para guardar los datos de salida de un flujo de datos.

Puede guardar los datos de salida de un flujo de datos en un juego de datos o en uno de los tipos de base de datos admitidos. Si guarda datos en una base de datos, puede transformar el origen de datos sobrescribiéndolo con datos del flujo de datos. Las tablas del flujo de datos y del origen de datos deben estar en la misma base de datos y tener el mismo nombre. Antes de empezar, cree una conexión a uno de los tipos de base de datos soportados.

Salida de datos

Puede guardar los datos de salida de los flujos de datos en estos tipos de base de datos:
  • Oracle Autonomous Data Warehouse
  • Oracle Autonomous Transaction Processing
  • Oracle Database
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • Spark

Entrada de datos

Puede introducir datos en flujos de datos desde la mayoría de tipos de base de datos (excepto Oracle Essbase y EPM Cloud).