Note :

Activer l'éditeur Trino dans Oracle Big Data Service Hue pour les grappes à haute disponibilité sans Kerberos

Présentation

Oracle Big Data Service (BDS) est un service en nuage qui permet aux utilisateurs de créer et de gérer des grappes Hadoop, des grappes Spark, Trino et d'autres services de mégadonnées. Dans le monde de l'analyse de mégadonnées, Trino se distingue comme un moteur d'interrogation SQL distribué haute performance conçu pour exécuter des interrogations analytiques interactives sur de grands jeux de données. Trino permet d'interroger des données provenant de plusieurs sources, dont le système de fichiers distribué (HDFS) Hadoop, le seau OCI et les bases de données relationnelles traditionnelles, le tout dans une interface SQL unifiée. Sa capacité à gérer des données à grande échelle avec une faible latence en fait un outil puissant pour les ingénieurs de données et les analystes.

L'intégration de Trino à BDS Hue peut grandement améliorer vos capacités d'interrogation de données en fournissant une interface transparente pour l'interrogation de données. Dans ce tutoriel, nous vous présenterons les étapes à suivre pour activer l'éditeur Trino dans un environnement de cluster haute disponibilité à l'aide de Hue, en supposant qu'aucune authentification Kerberos n'est en place. En suivant ces tâches, vous pourrez configurer votre environnement Hue pour vous connecter à Trino et exploiter efficacement ses puissantes fonctionnalités d'interrogation.

Objectifs

Préalables

Note : Ce tutoriel suppose que vous utilisez une grappe hautement disponible non Kerberos. Si vous utilisez un environnement Kerberized, des étapes de configuration supplémentaires liées à l'authentification Kerberos seront requises.

Tâche 1 : Télécharger et installer le pilote JDBC Trino

  1. Téléchargez le fichier JAR du pilote JDBC Trino à partir de Maven et enregistrez le fichier JAR sur le noeud UNO (où Hue est en cours d'exécution) dans l'environnement BDS, mais aux fins de ce tutoriel, il est placé dans le répertoire /tmp.

  2. Configurer Hue pour l'intégration Trino.

    1. Connectez-vous à Apache Ambari et naviguez jusqu'à Hue, config et Advanced (Avancé).

    2. Cliquez sur Pseudo-distributed.ini avancé et recherchez interpréteurs.

    Sélectionner une configuration de teinte

  3. Pour modifier la configuration, ajoutez la configuration suivante dans la section Interpréteurs.

    Modifier la configuration de teinte

    Assurez-vous que l'URL JDBC correspond au nom de domaine complet (FQDN) de votre coordinateur Trino et que le nom de classe de pilote est correct

Tâche 2 : Mettre à jour la configuration Python pour Hue

  1. Localisez et modifiez la configuration de la passerelle Python.

    Sur le serveur Hue (UNO), accédez au fichier /usr/odh/2.0.7/hue/build/env/lib/python2.7/site-packages/py4j-0.9-py2.7.egg/py4j/java_gateway.py.

    Note : Avant de modifier, créez une sauvegarde de ce fichier.

  2. Modifiez le fichier Python.

    1. Ouvrez java_gateway.py et recherchez où la variable classpath est définie.

    2. Ajoutez les lignes suivantes pour inclure le chemin du pilote JDBC. Cela garantit que Hue peut localiser et utiliser le pilote JDBC Trino.

      Mettre à jour la configuration python

Tâche 3 : Redémarrer le service Hue

  1. Revenez à Apache Ambari et redémarrez le service Hue pour appliquer les nouvelles configurations.

  2. Vérifiez l'activation de l'éditeur dans Hue.

    1. Après le redémarrage, ouvrez l'interface du serveur Hue et vérifiez si l'éditeur Trino apparaît dans le menu.

      Menu Éditeur Trino

    2. Lorsque vous êtes invité à entrer des données d'identification, entrez Nom d'utilisateur comme trino et Mot de passe comme trino.

      Authentication

Tâche 4 : Interroger des données à l'aide de l'éditeur Trino

  1. Accédez à l'éditeur Trino et exécutez des interrogations SQL.

    1. Naviguez jusqu'à l'éditeur Trino et choisissez la base de données sur laquelle exécuter l'interrogation.

    2. Vous pouvez maintenant exécuter des interrogations SQL sur votre instance Trino à partir de Hue.

      Exécuter les interrogations

Dépannage et conseils

Étapes suivantes

En suivant ces tâches, vous devriez avoir intégré avec succès l'éditeur Trino dans votre environnement BDS Hue. Cette intégration améliore vos capacités d'interrogation de données, vous permettant d'exploiter les fonctions d'interrogation avancées de Trino directement à partir de Hue. Si vous rencontrez des problèmes, consultez les conseils de dépannage ou demandez de l'aide auprès de la documentation ou des forums communautaires.

Remerciements

Autres ressources d'apprentissage

Explorez d'autres laboratoires sur la page docs.oracle.com/learn ou accédez à plus de contenu d'apprentissage gratuit sur le canal YouTube d'Oracle Learning. De plus, visitez education.oracle.com/learning-explorer pour devenir un explorateur Oracle Learning.

Pour obtenir de la documentation sur le produit, visitez Oracle Help Center.