Remarques :

Activation de l'éditeur Trino dans Oracle Big Data Service Hue pour les clusters haute disponibilité sans Kerberos

Introduction

Oracle Big Data Service (BDS) est un service cloud qui permet aux utilisateurs de créer et de gérer des clusters Hadoop, des clusters Spark, Trino et d'autres services Big Data. Dans le monde de l'analyse du Big Data, Trino se distingue comme un moteur de requêtes SQL distribué hautes performances conçu pour exécuter des requêtes analytiques interactives sur de grands ensembles de données. Trino permet d'interroger des données sur plusieurs sources, y compris le système de fichiers distribué Hadoop (HDFS), le bucket OCI et les bases de données relationnelles traditionnelles, le tout dans une interface SQL unifiée. Sa capacité à gérer des données à grande échelle avec une faible latence en fait un outil puissant pour les ingénieurs de données et les analystes.

L'intégration de Trino à BDS Hue peut grandement améliorer vos capacités d'interrogation de données en fournissant une interface transparente pour l'interrogation de données. Dans ce tutoriel, nous vous présenterons les étapes à suivre pour activer l'éditeur Trino dans un environnement de cluster haute disponibilité à l'aide de Hue, en supposant qu'aucune authentification Kerberos n'est en place. En suivant ces tâches, vous serez en mesure de configurer votre environnement Hue pour qu'il se connecte à Trino et tirez parti de ses puissantes fonctionnalités d'interrogation efficacement.

Objectifs

Prérequis

Remarque : ce tutoriel suppose que vous travaillez avec un cluster HA non Kerberos. Si vous utilisez un environnement Kerberized, des étapes de configuration supplémentaires liées à l'authentification Kerberos seront requises.

Tâche 1 : téléchargement et installation du pilote JDBC Trino

  1. Téléchargez le fichier JAR du pilote JDBC Trino à partir de Maven et enregistrez le fichier JAR sur le noeud UNO (où Hue est en cours d'exécution) dans l'environnement BDS. Toutefois, dans le cadre de ce tutoriel, il est placé dans le répertoire /tmp.

  2. Configurez l'intégration de Hue pour Trino.

    1. Connectez-vous à Apache Ambari et accédez à Hue, config et Advanced.

    2. Cliquez sur Pseudo-distributed.ini avancé et recherchez des interpréteurs.

    Sélectionner la configuration de teinte

  3. Pour modifier la configuration, ajoutez la configuration suivante dans la section interpréteurs.

    Modifier la configuration de teinte

    Assurez-vous que l'URL JDBC correspond au nom de domaine qualifié complet de votre coordinateur Trino et que le nom de classe de pilote est correct

Tâche 2 : mise à jour de la configuration Python pour Hue

  1. Localisez et modifiez la configuration de passerelle Python.

    Sur le serveur Hue (UNO), accédez au fichier /usr/odh/2.0.7/hue/build/env/lib/python2.7/site-packages/py4j-0.9-py2.7.egg/py4j/java_gateway.py.

    Remarque : avant de modifier, créez une sauvegarde de ce fichier.

  2. Modifiez le fichier Python.

    1. Ouvrez java_gateway.py et recherchez l'emplacement de définition de la variable d'environnement CLASSPATH.

    2. Ajoutez les lignes suivantes pour inclure le chemin du pilote JDBC. Cela garantit que Hue peut localiser et utiliser le pilote JDBC Trino.

      Mettre à jour la configuration python

Tâche 3 : redémarrage du service Hue

  1. Revenez à Apache Ambari et redémarrez le service Hue pour appliquer les nouvelles configurations.

  2. Vérifiez l'activation de l'éditeur dans Hue.

    1. Après le redémarrage, ouvrez l'interface du serveur Hue et vérifiez si l'éditeur Trino apparaît dans le menu.

      Menu de l'éditeur Trino

    2. Lorsque vous êtes invité à saisir des informations d'identification, entrez Nom utilisateur sous trino et Mot de passe sous trino.

      Authentifier

Tâche 4 : Interroger les données à l'aide de l'éditeur Trino

  1. Accédez à l'éditeur Trino et exécutez des requêtes SQL.

    1. Accédez à l'éditeur Trino et choisissez la base de données sur laquelle vous souhaitez exécuter la requête.

    2. Vous pouvez désormais exécuter des requêtes SQL sur votre instance Trino à partir de Hue.

      Exécution des requêtes

Dépannage et conseils

Etapes suivantes

En suivant ces tâches, vous devriez avoir intégré avec succès l'éditeur Trino dans votre environnement BDS Hue. Cette intégration améliore vos capacités de requête de données, vous permettant de tirer parti des fonctionnalités de requête avancées de Trino directement à partir de Hue. Si vous rencontrez des problèmes, consultez les conseils de dépannage ou demandez de l'aide auprès de la documentation ou des forums communautaires.

Remerciements

Ressources de formation supplémentaires

Explorez d'autres ateliers sur docs.oracle.com/learn ou accédez à d'autres contenus de formation gratuits sur le canal Oracle Learning YouTube. De plus, visitez le site education.oracle.com/learning-explorer pour devenir un explorateur Oracle Learning.

Pour obtenir la documentation produit, consultez le site Oracle Help Center.