Antes de empezar a usar Data Flow

Antes de empezar a utilizar Data Flow, debe tener:

Cuenta de de Oracle Cloud Infrastructure. Las cuentas de prueba se pueden utilizar para realizar una demostración de Data Flow.
Rol de administrador de servicio para sus servicios de Oracle Cloud. Cuando el servicio está activado, Oracle envía las credenciales y la URL al administrador de cuentas seleccionado. El administrador de cuentas crea una cuenta para cada usuario que necesite acceder al servicio.
Un explorador soportado, como:
- Microsoft Internet Explorer 11.x+
- Mozilla Firefox ESR 38+
- Google Chrome 42+
Una aplicación de Spark cargada en Object Storage. No lo proporcione en formato comprimido, como .zip o .gzip.
Datos para el procesamiento cargado en Oracle Cloud Infrastructure Object Storage. Los datos se pueden leer desde nubes u orígenes de datos externos. Data Flow optimiza el rendimiento y la seguridad de los datos almacenados en un almacén de objetos de Oracle Cloud Infrastructure.
Los tipos de aplicación soportados son:
- Java
- Scala
- SparkSQL
- PySpark (solo Python 3)

En esta tabla se muestran las versiones de Spark soportadas por Data Flow.

Versiones de Spark soportadas
Versión de Spark	Hadoop	Java	Python	Scala	oci-hdfs	oci-java-sdk	Documentación de Spark
Spark 3.5.0	3,3	17	3,11	2,12	3.3.4.1.4.2	3,34	Guía de Spark versión 3.5.0
Spark 3.2.1	3.3.1	11	3.8.13	2.12.15	3.3.1.0.3.2	2,45	Guía de Spark versión 3.2.1
Spark 3.0.2	3.2.0	1.8.0_321	3.6.8	2.12.10	3.2.1.3	1.25.2	Guía de Spark versión 3.0.2
Spark 2.4.4	2,9	1,8_162	3.6.8	2.11.12	2.9.2.6	1,25	Guía de Spark versión 2.4.4

Esta tabla es solo para referencia y no está destinada a ser completa.

Nota

Evite introducir información confidencial al asignar descripciones, etiquetas o nombres fáciles de recordar a los recursos de la nube mediante la consola, la API o la CLI de Oracle Cloud Infrastructure. Esto se aplica a la hora de crear o editar una aplicación en Data Flow.

Documentación de Oracle Cloud Infrastructure

Antes de empezar a usar Data Flow