Acerca de los Flujos de Datos

Los flujos de datos permiten organizar e integrar los datos para generar juegos de datos curados que los usuarios pueden visualizar.

Use los flujos de datos para cambiar los datos visualmente sin que sea necesario tener conocimientos de codificación manual.

Por ejemplo, puede usar un flujo de datos para:

  • Crear un juego de datos.
  • Combinar datos de diferentes orígenes.
  • Agregar datos.
  • Entrenar modelos de aprendizaje automático o aplicar un modelo de aprendizaje automático predictivo a sus datos.
  • Realice la detección de objetos, la clasificación de imágenes o la detección de texto utilizando la inteligencia artificial a través del servicio OCI Vision.

Los flujos de datos se crean en el editor de flujos de datos.
Editor de flujos de datos

Para crear un flujo de datos, es necesario agregar pasos. Cada paso realiza una función específica; por ejemplo, agregar datos, unir tablas, fusionar columnas, transformar los datos, guardar los datos. Utilice el editor de flujos de datos para agregar y configurar pasos. Cada paso se valida cuando se agrega o se modifica. Una vez que ha configurado un flujo de datos, debe ejecutarlo para producir o actualizar un juego de datos.

Si agrega sus propias columnas o transforma los datos, puede utilizar una amplia variedad de operadores SQL (por ejemplo, BETWEEN, LIKE, IN), expresiones condicionales (por ejemplo, CASE) y funciones (por ejemplo, media, mediana, percentil).

Soporte de base de datos para flujos de datos

Con los flujos de datos, puede curar datos de juegos de datos, áreas temáticas o conexiones de bases de datos.

Puede ejecutar flujos de datos de forma individual o en una secuencia. Puede incluir varios orígenes de datos en un flujo de datos y especificar cómo unirse a ellos.

Utilice el paso Agregar datos para agregar datos a un flujo de datos, y utilice el paso Guardar datos para guardar los datos de salida de un flujo de datos.

Puede guardar los datos de salida de un flujo de datos en un juego de datos o en uno de los tipos de base de datos admitidos. Si guarda datos en una base de datos, puede transformar el origen de datos sobrescribiéndolo con datos del flujo de datos. Las tablas del flujo de datos y del origen de datos deben estar en la misma base de datos y tener el mismo nombre. Antes de empezar, cree una conexión a uno de los tipos de base de datos soportados.

Nota:

Puede agregar datos de bases de datos remotas conectadas a Data Gateway. Sin embargo, no puede guardar datos en bases de datos remotas conectadas a Data Gateway.

Salida de datos

Puede guardar los datos de salida de los flujos de datos en estos tipos de base de datos:
  • Oracle Autonomous Data Warehouse
  • Oracle Autonomous Transaction Processing
  • Oracle Database
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • Spark

Para conocer la información de la versión de base de datos, consulte Orígenes de datos soportados.

Entrada de datos

Puede introducir datos en flujos de datos desde la mayoría de tipos de base de datos (excepto Oracle Essbase y EPM Cloud).

Cómo trabajar en el editor de flujos de datos

Prepare los datos para análisis creando flujos de datos en el editor de flujos de datos. Por ejemplo, podría transformar columnas, fusionar columnas o clasificar los datos en bins. Descubra cómo usar el editor de flujos de datos para empezar a preparar los datos rápidamente.

Cómo trabajar en el editor de flujos de datos:

Nombre Icono Función
Datos

Icono Panel de datos

Mostrar el panel de datos, donde puede arrastrar y solar columnas de datos en el editor de flujos de datos.

Pasos de flujo de datos Icono del panel Pasos de flujos de datos

Mostrar el panel de pasos, donde puede arrastrar y solar pasos en el editor de flujos de datos.

Vista previa de datos

Icono Vista previa de datos

Ocultar o mostrar el panel de columnas de Vista previa de datos haciendo clic en Conmutar vista previa de datos en la esquina inferior derecha del editor de flujos de datos. Este panel se actualiza automáticamente al realizar cambios en el flujo de datos. Puede especificar si desea que las modificaciones de los pasos se refresquen o no automáticamente en el panel Vista previa de datos haciendo clic en Aplicación automática.

Ejecutar flujo de datos Ejecutar flujo de datos Ejecute el flujo de datos.
Mostrar funciones disponibles/ocultar funciones

Icono Mostrar funciones disponibles/Ocultar funciones

Mostrar u ocultar la lista de selección de expresiones. Este icono solo se muestra para los pasos que le permiten crear sus propias expresiones; por ejemplo, el paso "Agregar columnas" o el paso "Transformar columna".

Editor de pasos

Icono Editor de pasos

Ocultar o mostrar el panel Editor de pasos haciendo clic en el icono Conmutar editor de pasos en la esquina inferior derecha del editor de flujos de datos.

Conmutar el refrescamiento automático Conmutar el refrescamiento automático de los datos en flujos de datos Actívelo para refrescar la vista previa de los datos en cuanto haga cambios en el flujo de datos. Por ejemplo, si tiene un paso de columna de transformación que cambia el texto de minúsculas a mayúsculas, verá el texto en mayúsculas en la vista previa de datos. Si la desactiva, la vista previa de datos solo se refresca si hace clic en Refrescar vista previa de datos.