Hinweis:

Dieses Tutorial erfordert Zugriff auf Oracle Cloud. Informationen zur Registrierung für einen kostenlosen Account finden Sie unter Erste Schritte mit Oracle Cloud Infrastructure Free Tier.
Es verwendet Beispielwerte für Oracle Cloud Infrastructure-Zugangsdaten, -Mandanten und -Compartments. Ersetzen Sie diese Werte nach Abschluss der Übung durch Werte, die für Ihre Cloud-Umgebung spezifisch sind.

Aktivieren Sie den Trino Editor in Oracle Big Data Service Hue für High Availability-Cluster ohne Kerberos

Einführung

Oracle Big Data Service (BDS) ist ein cloud-basierter Service, mit dem Benutzer Hadoop-Cluster, Spark-Cluster, Trino und andere Big Data-Services erstellen und verwalten können. In der Welt der Big Data-Analysen zeichnet sich Trino als leistungsstarke, verteilte SQL-Abfrage-Engine aus, die für die Ausführung interaktiver analytischer Abfragen auf großen Datensätzen entwickelt wurde. Trino ermöglicht die Abfrage von Daten über mehrere Quellen hinweg, einschließlich Hadoop Distributed File System (HDFS), OCI-Bucket und traditionellen relationalen Datenbanken, alles innerhalb einer einheitlichen SQL-Schnittstelle. Die Fähigkeit, große Datenmengen mit geringer Latenz zu verarbeiten, macht sie zu einem leistungsstarken Tool für Data Engineers und Analysten gleichermaßen.

Durch die Integration von Trino mit BDS Hue können Sie Ihre Datenabfragefunktionen erheblich verbessern, indem Sie eine nahtlose Schnittstelle für die Abfrage von Daten bereitstellen. In diesem Tutorial werden wir Sie durch die Schritte führen, um den Trino-Editor in einer High Availability-(HA-)Clusterumgebung mit Hue zu aktivieren, vorausgesetzt, es ist keine Kerberos-Authentifizierung vorhanden. Wenn Sie diese Aufgaben ausführen, können Sie Ihre Hue-Umgebung so konfigurieren, dass sie sich mit Trino verbindet und die leistungsstarken Abfragefunktionen effektiv nutzt.

Ziele

Erfahren Sie, wie Sie den Trino-Editor in Hue für eine HA-Clusterumgebung konfigurieren.
Machen Sie sich mit dem Setup vertraut, das für eine nahtlose Konnektivität zwischen Hue und Trino erforderlich ist.
Prüfen Sie die Konfiguration, und beheben Sie Fehler, um eine erfolgreiche Abfrage sicherzustellen.

Voraussetzungen

Ein Oracle Big Data Service-Cluster, das auf Oracle Cloud Infrastructure (OCI) mit aktiviertem Trino und Hue ausgeführt wird.
Zugriff auf den Hue-Server und die erforderlichen Berechtigungen zum Ändern von Konfigurationen.
Die JDBC-(Trino Java Database Connectivity-)Treiberdatei für das Java-Archiv (JAR) wurde heruntergeladen und ist zugänglich.

Hinweis: In diesem Tutorial wird davon ausgegangen, dass Sie mit einem Nicht-Kerberos-HA-Cluster arbeiten. Wenn Sie eine Kerberized-Umgebung verwenden, sind zusätzliche Konfigurationsschritte für die Kerberos-Authentifizierung erforderlich.

Aufgabe 1: JDBC-Treiber von Trino herunterladen und installieren

Laden Sie die JAR-Datei des Trino-JDBC-Treibers aus Maven herunter, und speichern Sie die JAR-Datei auf dem UNO-Knoten (auf dem Hue ausgeführt wird) in der BDS-Umgebung. Für die Zwecke dieses Tutorials wird sie jedoch im Verzeichnis /tmp abgelegt.
Konfigurieren Sie Hue für die Trino-Integration.
1. Melden Sie sich bei Apache Ambari an, und navigieren Sie zu Hue, config und Advanced.
2. Klicken Sie auf Erweitertes Pseudo-distributed.ini, und suchen Sie nach Interpretern.
Um die Konfiguration zu bearbeiten, fügen Sie die folgende Konfiguration im Abschnitt Interpreter hinzu.

Stellen Sie sicher, dass die JDBC-URL mit dem vollqualifizierten Domainnamen (FQDN) des Trino-Koordinators übereinstimmt und dass der Name der Treiberklasse korrekt ist

Aufgabe 2: Python-Konfiguration für Hue aktualisieren

Suchen und ändern Sie die Python-Gatewaykonfiguration.

Navigieren Sie auf dem Hue-Server (UNO) zur Datei /usr/odh/2.0.7/hue/build/env/lib/python2.7/site-packages/py4j-0.9-py2.7.egg/py4j/java_gateway.py.

Hinweis: Erstellen Sie vor der Bearbeitung ein Backup dieser Datei.
Bearbeiten Sie die Python-Datei.
1. Öffnen Sie java_gateway.py, und suchen Sie, wo der Classpath definiert ist.
2. Fügen Sie die folgenden Zeilen hinzu, um den JDBC-Treiberpfad einzuschließen. Dadurch wird sichergestellt, dass Hue den Trino JDBC-Treiber lokalisieren und verwenden kann.

Aufgabe 3: Hue-Service neu starten

Kehren Sie zu Apache Ambari zurück, und starten Sie den Hue-Service neu, um die neuen Konfigurationen anzuwenden.
Prüfen Sie die Editor-Aktivierung in Hue.
1. Öffnen Sie nach dem Neustart die Hue-Serveroberfläche und prüfen Sie, ob der Trino-Editor im Menü angezeigt wird.
2. Wenn Sie zur Eingabe von Zugangsdaten aufgefordert werden, geben Sie Benutzername als trino und Kennwort als trino ein.

Aufgabe 4: Daten mit dem Trino Editor abfragen

Rufen Sie den Trino-Editor auf, und führen Sie SQL-Abfragen aus.
1. Navigieren Sie zum Trino-Editor, und wählen Sie die Datenbank aus, für die Sie die Abfrage ausführen möchten.
2. Sie können jetzt SQL-Abfragen für Ihre Trino-Instanz in Hue ausführen.

Troubleshooting und Tipps

Treiberprobleme: Stellen Sie sicher, dass die JAR-Datei mit der entsprechenden Berechtigung korrekt im Verzeichnis gespeichert ist und der Dateipfad in der Python-Konfiguration korrekt ist.
Verbindungsfehler: Prüfen Sie die JDBC-URL, und stellen Sie sicher, dass von Ihrem Hue-Server aus darauf zugegriffen werden kann.
Konfigurationsverifizierung: Prüfen Sie alle Konfigurationsänderungen in Apache Ambari, und bestätigen Sie, dass der Hue-Service ordnungsgemäß neu gestartet wurde.

Nächste Schritte

Durch Befolgen dieser Aufgaben sollten Sie den Trino Editor erfolgreich in Ihre BDS Hue Umgebung integriert haben. Diese Integration verbessert Ihre Datenabfragefunktionen, sodass Sie die erweiterten Abfragefunktionen von Trino direkt aus Hue nutzen können. Wenn Probleme auftreten, lesen Sie die Tipps zur Fehlerbehebung oder wenden Sie sich an die Dokumentation oder an Community-Foren.

Danksagungen

Autoren - Pavan Upadhyay (Principal Cloud Engineer), Saket Bihari (Principal Cloud Engineer)

Weitere Lernressourcen

Sehen Sie sich andere Übungen zu docs.oracle.com/learn an, oder greifen Sie im Oracle Learning YouTube-Channel auf weitere kostenlose Lerninhalte zu. Besuchen Sie außerdem education.oracle.com/learning-explorer, um Oracle Learning Explorer zu werden.

Die Produktdokumentation finden Sie im Oracle Help Center.

Titel und Copyright-Informationen

Enable Trino Editor in Oracle Big Data Service Hue for High Availability Clusters Without Kerberos

G13957-01

September 2024

Oracle und/oder verbundene Unternehmen.