Antes de empezar a usar Data Flow
Antes de empezar a utilizar Data Flow, debe tener:
- Cuenta de de Oracle Cloud Infrastructure. Las cuentas de prueba se pueden utilizar para realizar una demostración de Data Flow.
- Rol de administrador de servicio para sus servicios de Oracle Cloud. Cuando el servicio está activado, Oracle envía las credenciales y la URL al administrador de cuentas seleccionado. El administrador de cuentas crea una cuenta para cada usuario que necesite acceder al servicio.
- Un explorador soportado, como:
-
Microsoft Internet Explorer 11.x+
-
Mozilla Firefox ESR 38+
-
Google Chrome 42+
-
- Una aplicación de Spark cargada en Object Storage. No lo proporcione en formato comprimido, como
.zip
o.gzip
. - Datos para el procesamiento cargado en Oracle Cloud Infrastructure Object Storage. Los datos se pueden leer desde nubes u orígenes de datos externos. Data Flow optimiza el rendimiento y la seguridad de los datos almacenados en un almacén de objetos de Oracle Cloud Infrastructure.
- Los tipos de aplicación soportados son:
- Java
- Scala
- SparkSQL
- PySpark (solo Python 3)
- En esta tabla se muestran las versiones de Spark soportadas por Data Flow.
Esta tabla es solo para referencia y no está destinada a ser completa.
Versiones de Spark soportadas Versión de Spark Hadoop Java Python Scala oci-hdfs oci-java-sdk Documentación de Spark Spark 3.5.0 3,3 17 3,11 2,12 3.3.4.1.4.2 3,34 Guía de Spark versión 3.5.0 Spark 3.2.1 3.3.1 11 3.8.13 2.12.15 3.3.1.0.3.2 2,45 Guía de Spark versión 3.2.1 Spark 3.0.2 3.2.0 1.8.0_321 3.6.8 2.12.10 3.2.1.3 1.25.2 Guía de Spark versión 3.0.2 Spark 2.4.4 2,9 1,8_162 3.6.8 2.11.12 2.9.2.6 1,25 Guía de Spark versión 2.4.4
Nota
Evite introducir información confidencial al asignar descripciones, etiquetas o nombres fáciles de recordar a los recursos de la nube mediante la consola, la API o la CLI de Oracle Cloud Infrastructure. Esto se aplica a la hora de crear o editar una aplicación en Data Flow.
Evite introducir información confidencial al asignar descripciones, etiquetas o nombres fáciles de recordar a los recursos de la nube mediante la consola, la API o la CLI de Oracle Cloud Infrastructure. Esto se aplica a la hora de crear o editar una aplicación en Data Flow.