Conceitos Básicos do Script Spark-Submit e do SDK
Um tutorial que ajuda a usar o código SDK Java para executar um aplicativo Spark no serviço Data Flow usando o script spark-submit com a string execute
.
Comece a usar o script spark-submit no serviço Data Flow usando SDK. Siga o tutorial existente para Conceitos Básicos do Oracle Cloud Infrastructure Data Flow, mas use o Java SDK para executar comandos spark-submit.
Antes de Começar
Cumpra os pré-requisitos para que você possa usar comandos spark-submit no serviço Data Flow com Java SDK.
1. ETL com Java
Use o Spark-submit e o Java SDK para executar ETL com Java.
2: Aprendizado de Máquina com o PySpark
Usando o script Spark-submit e o SDK Java, execute o machine learning com PySpark.
O Que Vem a Seguir
Use o script Spark-submit e a CLI em outras situações.
Você pode usar o script spark-submit e o SDK Java para criar e executar aplicativos Java, Python ou SQL com o Data Flow e explorar os resultados. O serviço Data Flow trata de todos os detalhes de implantação, shutdown, gerenciamento de logs, segurança e acesso à interface do usuário. Com o serviço Data Flow, você se concentra no desenvolvimento de aplicativos Spark sem se preocupar com a infraestrutura.