Note :
- Ce tutoriel nécessite l'accès à Oracle Cloud. Pour vous inscrire à un compte gratuit, voir Introduction à l' niveau gratuit d'Oracle Cloud Infrastructure.
- Il utilise des exemples de valeurs pour les données d'identification, la location et les compartiments Oracle Cloud Infrastructure. À la fin de votre laboratoire, remplacez ces valeurs par celles propres à votre environnement en nuage.
Activer l'éditeur Trino dans Oracle Big Data Service Hue pour les grappes à haute disponibilité sans Kerberos
Présentation
Oracle Big Data Service (BDS) est un service en nuage qui permet aux utilisateurs de créer et de gérer des grappes Hadoop, des grappes Spark, Trino et d'autres services de mégadonnées. Dans le monde de l'analyse de mégadonnées, Trino se distingue comme un moteur d'interrogation SQL distribué haute performance conçu pour exécuter des interrogations analytiques interactives sur de grands jeux de données. Trino permet d'interroger des données provenant de plusieurs sources, dont le système de fichiers distribué (HDFS) Hadoop, le seau OCI et les bases de données relationnelles traditionnelles, le tout dans une interface SQL unifiée. Sa capacité à gérer des données à grande échelle avec une faible latence en fait un outil puissant pour les ingénieurs de données et les analystes.
L'intégration de Trino à BDS Hue peut grandement améliorer vos capacités d'interrogation de données en fournissant une interface transparente pour l'interrogation de données. Dans ce tutoriel, nous vous présenterons les étapes à suivre pour activer l'éditeur Trino dans un environnement de cluster haute disponibilité à l'aide de Hue, en supposant qu'aucune authentification Kerberos n'est en place. En suivant ces tâches, vous pourrez configurer votre environnement Hue pour vous connecter à Trino et exploiter efficacement ses puissantes fonctionnalités d'interrogation.
Objectifs
-
Voyez comment configurer l'éditeur Trino dans Hue pour un environnement de grappe hautement disponible.
-
Comprendre la configuration requise pour permettre une connectivité transparente entre Hue et Trino.
-
Vérifiez et dépannez la configuration pour garantir la réussite de l'interrogation.
Préalables
-
Grappe Oracle Big Data Service s'exécutant sur Oracle Cloud Infrastructure (OCI) avec Trino et Hue activés.
-
Accès au serveur Hue et autorisations nécessaires pour modifier les configurations.
-
Le fichier d'archives Java (JAR) du pilote Trino Java Database Connectivity (JDBC) téléchargé et accessible.
Note : Ce tutoriel suppose que vous utilisez une grappe hautement disponible non Kerberos. Si vous utilisez un environnement Kerberized, des étapes de configuration supplémentaires liées à l'authentification Kerberos seront requises.
Tâche 1 : Télécharger et installer le pilote JDBC Trino
-
Téléchargez le fichier JAR du pilote JDBC Trino à partir de Maven et enregistrez le fichier JAR sur le noeud UNO (où Hue est en cours d'exécution) dans l'environnement BDS, mais aux fins de ce tutoriel, il est placé dans le répertoire
/tmp
. -
Configurer Hue pour l'intégration Trino.
-
Connectez-vous à Apache Ambari et naviguez jusqu'à Hue, config et Advanced (Avancé).
-
Cliquez sur Pseudo-distributed.ini avancé et recherchez interpréteurs.
-
-
Pour modifier la configuration, ajoutez la configuration suivante dans la section Interpréteurs.
Assurez-vous que l'URL JDBC correspond au nom de domaine complet (FQDN) de votre coordinateur Trino et que le nom de classe de pilote est correct
Tâche 2 : Mettre à jour la configuration Python pour Hue
-
Localisez et modifiez la configuration de la passerelle Python.
Sur le serveur Hue (UNO), accédez au fichier
/usr/odh/2.0.7/hue/build/env/lib/python2.7/site-packages/py4j-0.9-py2.7.egg/py4j/java_gateway.py
.Note : Avant de modifier, créez une sauvegarde de ce fichier.
-
Modifiez le fichier Python.
-
Ouvrez
java_gateway.py
et recherchez où la variable classpath est définie. -
Ajoutez les lignes suivantes pour inclure le chemin du pilote JDBC. Cela garantit que Hue peut localiser et utiliser le pilote JDBC Trino.
-
Tâche 3 : Redémarrer le service Hue
-
Revenez à Apache Ambari et redémarrez le service Hue pour appliquer les nouvelles configurations.
-
Vérifiez l'activation de l'éditeur dans Hue.
-
Après le redémarrage, ouvrez l'interface du serveur Hue et vérifiez si l'éditeur Trino apparaît dans le menu.
-
Lorsque vous êtes invité à entrer des données d'identification, entrez Nom d'utilisateur comme
trino
et Mot de passe commetrino
.
-
Tâche 4 : Interroger des données à l'aide de l'éditeur Trino
-
Accédez à l'éditeur Trino et exécutez des interrogations SQL.
-
Naviguez jusqu'à l'éditeur Trino et choisissez la base de données sur laquelle exécuter l'interrogation.
-
Vous pouvez maintenant exécuter des interrogations SQL sur votre instance Trino à partir de Hue.
-
Dépannage et conseils
-
Problèmes liés au pilote : Assurez-vous que le fichier JAR est correctement placé dans le répertoire avec autorisation et que le chemin d'accès dans la configuration Python est exact.
-
Erreurs de connexion : Vérifiez l'URL JDBC et assurez-vous qu'elle est accessible à partir du serveur Hue.
-
Vérification de la configuration : Vérifiez toutes les modifications de configuration dans Apache Ambari et vérifiez que le service Hue a été redémarré correctement.
Étapes suivantes
En suivant ces tâches, vous devriez avoir intégré avec succès l'éditeur Trino dans votre environnement BDS Hue. Cette intégration améliore vos capacités d'interrogation de données, vous permettant d'exploiter les fonctions d'interrogation avancées de Trino directement à partir de Hue. Si vous rencontrez des problèmes, consultez les conseils de dépannage ou demandez de l'aide auprès de la documentation ou des forums communautaires.
Liens connexes
Remerciements
- Auteurs - Pavan Upadhyay (ingénieur en nuage principal), Saket Bihari (ingénieur en nuage principal)
Autres ressources d'apprentissage
Explorez d'autres laboratoires sur la page docs.oracle.com/learn ou accédez à plus de contenu d'apprentissage gratuit sur le canal YouTube d'Oracle Learning. De plus, visitez education.oracle.com/learning-explorer pour devenir un explorateur Oracle Learning.
Pour obtenir de la documentation sur le produit, visitez Oracle Help Center.
Enable Trino Editor in Oracle Big Data Service Hue for High Availability Clusters Without Kerberos
G13959-01
September 2024