Ejercicio 3: Ejecución de una aplicación PySpark
- Ejecute la aplicación desde la lista Aplicación.
Cuando la ejecución termine, ábrala y desplácese a los logs.
- Abra el archivo spark_application_stdout.log.gz. La salida debe ser idéntica a la siguiente:
En esta salida vemos que el ID de anuncio 690578 es la mejor oferta con un precio previsto de 313,70 $ frente al precio de lista de 35,00 $ con una superficie en pies cuadrados de 4.639 pies cuadrados. Si esto suena demasiado bien como para ser verdad, el ID único nos permite ir retrocediendo en los datos para comprender mejor si se trata a ciencia cierta del trato del siglo o no. De nuevo, un analista de negocio sin duda podría utilizar la salida de este algoritmo de aprendizaje automático para un análisis más detallado.