Nota
- Questa esercitazione richiede l'accesso a Oracle Cloud. Per iscriverti a un account gratuito, consulta Inizia a utilizzare Oracle Cloud Infrastructure Free Tier.
- Utilizza valori di esempio per le credenziali, la tenancy e i compartimenti di Oracle Cloud Infrastructure. Al termine del laboratorio, sostituisci questi valori con quelli specifici del tuo ambiente cloud.
Abilita editor Trino in Oracle Big Data Service Hue per cluster ad alta disponibilità senza Kerberos
Introduzione
Oracle Big Data Service (BDS) è un servizio basato su cloud che consente agli utenti di creare e gestire cluster Hadoop, cluster Spark, Trino e altri servizi Big Data. Nel mondo dell'analisi dei big data, Trino si distingue come motore di query SQL distribuito ad alte prestazioni progettato per eseguire query analitiche interattive su data set di grandi dimensioni. Trino consente di eseguire query sui dati su più origini, tra cui HDFS (Hadoop Distributed File System), bucket OCI e database relazionali tradizionali, il tutto all'interno di un'interfaccia SQL unificata. La sua capacità di gestire dati su larga scala con bassa latenza lo rende un potente strumento per data engineer e analisti.
L'integrazione di Trino con BDS Hue può migliorare notevolmente le funzionalità di interrogazione dei dati fornendo un'interfaccia trasparente per l'esecuzione di query sui dati. In questa esercitazione verranno descritti i passi per abilitare l'editor Trino in un ambiente cluster HA (High Availability) utilizzando Hue, supponendo che non sia stata eseguita alcuna autenticazione Kerberos. Seguendo queste attività, sarai in grado di configurare il tuo ambiente Hue per connetterti con Trino e sfruttare le sue potenti funzionalità di query in modo efficace.
Obiettivi
-
Scopri come configurare l'editor Trino in Hue per un ambiente cluster HA.
-
Comprendere l'impostazione necessaria per abilitare una connettività perfetta tra Hue e Trino.
-
Verificare e risolvere i problemi della configurazione per garantire la corretta esecuzione delle query.
Prerequisiti
-
Un cluster Oracle Big Data Service in esecuzione su Oracle Cloud Infrastructure (OCI) con Trino e Hue abilitati.
-
Accesso al server Hue e autorizzazioni necessarie per modificare le configurazioni.
-
File JAR (Java Database Connectivity) del driver Trino scaricato e accessibile.
Nota: questa esercitazione presuppone che si stia utilizzando un cluster HA non Kerberos. Se si utilizza un ambiente Kerberizzato, saranno necessari ulteriori passi di configurazione correlati all'autenticazione Kerberos.
Task 1: Scaricare e installare il driver JDBC Trino
-
Scaricare il file JAR del driver JDBC Trino da Maven e salvare il file JAR nel nodo UNO (dove Hue è in esecuzione) nell'ambiente BDS, ma ai fini di questa esercitazione, viene posizionato nella directory
/tmp
. -
Configura tonalità per integrazione Trino.
-
Eseguire il login ad Apache Ambari e passare a Hue, config e Advanced.
-
Fare clic su Pseudo-distributed.ini avanzato e cercare gli interpreti.
-
-
Per modificare la configurazione, aggiungere la configurazione seguente all'interno della sezione interpreti.
Assicurarsi che l'URL JDBC corrisponda al nome dominio completo (FQDN) del coordinatore Trino e che il nome della classe del driver sia corretto
Task 2: Aggiorna configurazione Python per tonalità
-
Individua e modifica la configurazione del gateway Python.
Sul server Hue (UNO), passare al file
/usr/odh/2.0.7/hue/build/env/lib/python2.7/site-packages/py4j-0.9-py2.7.egg/py4j/java_gateway.py
.Nota: prima di modificare, creare un backup di questo file.
-
Modificare il file Python.
-
Aprire
java_gateway.py
e individuare la posizione in cui è definito il classpath. -
Aggiungere le righe seguenti per includere il percorso del driver JDBC. Ciò garantisce che Hue possa individuare e utilizzare il driver JDBC Trino.
-
Task 3: Riavviare il servizio Hue
-
Tornare ad Apache Ambari e riavviare il servizio Hue per applicare le nuove configurazioni.
-
Verificare l'abilitazione dell'editor in tonalità.
-
Dopo il riavvio, aprire l'interfaccia del server Hue e verificare se nel menu viene visualizzato l'editor Trino.
-
Quando vengono richieste le credenziali, immettere Nome utente come
trino
e Password cometrino
.
-
Task 4: Esegui query sui dati utilizzando l'editor Trino
-
Accedere all'editor Trino ed eseguire query SQL.
-
Passare all'editor Trino e scegliere il database su cui eseguire la query.
-
È ora possibile eseguire query SQL sull'istanza Trino da Hue.
-
Risoluzione dei problemi e suggerimenti
-
Problemi del driver: assicurarsi che il file JAR sia posizionato correttamente nella directory con autorizzazione e che il percorso del file nella configurazione Python sia accurato.
-
Errori di connessione: verificare l'URL JDBC e assicurarsi che sia accessibile dal server Hue.
-
Verifica della configurazione: controllare due volte tutte le modifiche alla configurazione in Apache Ambari e confermare che il servizio Hue viene riavviato correttamente.
Passi successivi
Seguendo questi task, dovresti aver integrato con successo l'editor Trino nel tuo ambiente BDS Hue. Questa integrazione migliora le funzionalità di query dei dati, consentendoti di sfruttare le funzionalità avanzate di query di Trino direttamente da Hue. In caso di problemi, consultare i suggerimenti per la risoluzione dei problemi o richiedere ulteriore assistenza dalla documentazione o dai forum della community.
Collegamenti correlati
Riconoscimenti
- Autori - Pavan Upadhyay (Principal Cloud Engineer), Saket Bihari (Principal Cloud Engineer)
Altre risorse di apprendimento
Esplora altri laboratori su docs.oracle.com/learn o accedi a più contenuti gratuiti sulla formazione su Oracle Learning YouTube channel. Inoltre, visita education.oracle.com/learning-explorer per diventare un Oracle Learning Explorer.
Per la documentazione del prodotto, visita l'Oracle Help Center.
Enable Trino Editor in Oracle Big Data Service Hue for High Availability Clusters Without Kerberos
G13961-01
September 2024