Hinweis:

Aktivieren Sie den Trino Editor in Oracle Big Data Service Hue für High Availability-Cluster ohne Kerberos

Einführung

Oracle Big Data Service (BDS) ist ein cloud-basierter Service, mit dem Benutzer Hadoop-Cluster, Spark-Cluster, Trino und andere Big Data-Services erstellen und verwalten können. In der Welt der Big Data-Analysen zeichnet sich Trino als leistungsstarke, verteilte SQL-Abfrage-Engine aus, die für die Ausführung interaktiver analytischer Abfragen auf großen Datensätzen entwickelt wurde. Trino ermöglicht die Abfrage von Daten über mehrere Quellen hinweg, einschließlich Hadoop Distributed File System (HDFS), OCI-Bucket und traditionellen relationalen Datenbanken, alles innerhalb einer einheitlichen SQL-Schnittstelle. Die Fähigkeit, große Datenmengen mit geringer Latenz zu verarbeiten, macht sie zu einem leistungsstarken Tool für Data Engineers und Analysten gleichermaßen.

Durch die Integration von Trino mit BDS Hue können Sie Ihre Datenabfragefunktionen erheblich verbessern, indem Sie eine nahtlose Schnittstelle für die Abfrage von Daten bereitstellen. In diesem Tutorial werden wir Sie durch die Schritte führen, um den Trino-Editor in einer High Availability-(HA-)Clusterumgebung mit Hue zu aktivieren, vorausgesetzt, es ist keine Kerberos-Authentifizierung vorhanden. Wenn Sie diese Aufgaben ausführen, können Sie Ihre Hue-Umgebung so konfigurieren, dass sie sich mit Trino verbindet und die leistungsstarken Abfragefunktionen effektiv nutzt.

Ziele

Voraussetzungen

Hinweis: In diesem Tutorial wird davon ausgegangen, dass Sie mit einem Nicht-Kerberos-HA-Cluster arbeiten. Wenn Sie eine Kerberized-Umgebung verwenden, sind zusätzliche Konfigurationsschritte für die Kerberos-Authentifizierung erforderlich.

Aufgabe 1: JDBC-Treiber von Trino herunterladen und installieren

  1. Laden Sie die JAR-Datei des Trino-JDBC-Treibers aus Maven herunter, und speichern Sie die JAR-Datei auf dem UNO-Knoten (auf dem Hue ausgeführt wird) in der BDS-Umgebung. Für die Zwecke dieses Tutorials wird sie jedoch im Verzeichnis /tmp abgelegt.

  2. Konfigurieren Sie Hue für die Trino-Integration.

    1. Melden Sie sich bei Apache Ambari an, und navigieren Sie zu Hue, config und Advanced.

    2. Klicken Sie auf Erweitertes Pseudo-distributed.ini, und suchen Sie nach Interpretern.

    Farbtonkonfiguration auswählen

  3. Um die Konfiguration zu bearbeiten, fügen Sie die folgende Konfiguration im Abschnitt Interpreter hinzu.

    Farbtonkonfiguration bearbeiten

    Stellen Sie sicher, dass die JDBC-URL mit dem vollqualifizierten Domainnamen (FQDN) des Trino-Koordinators übereinstimmt und dass der Name der Treiberklasse korrekt ist

Aufgabe 2: Python-Konfiguration für Hue aktualisieren

  1. Suchen und ändern Sie die Python-Gatewaykonfiguration.

    Navigieren Sie auf dem Hue-Server (UNO) zur Datei /usr/odh/2.0.7/hue/build/env/lib/python2.7/site-packages/py4j-0.9-py2.7.egg/py4j/java_gateway.py.

    Hinweis: Erstellen Sie vor der Bearbeitung ein Backup dieser Datei.

  2. Bearbeiten Sie die Python-Datei.

    1. Öffnen Sie java_gateway.py, und suchen Sie, wo der Classpath definiert ist.

    2. Fügen Sie die folgenden Zeilen hinzu, um den JDBC-Treiberpfad einzuschließen. Dadurch wird sichergestellt, dass Hue den Trino JDBC-Treiber lokalisieren und verwenden kann.

      python-Konfiguration aktualisieren

Aufgabe 3: Hue-Service neu starten

  1. Kehren Sie zu Apache Ambari zurück, und starten Sie den Hue-Service neu, um die neuen Konfigurationen anzuwenden.

  2. Prüfen Sie die Editor-Aktivierung in Hue.

    1. Öffnen Sie nach dem Neustart die Hue-Serveroberfläche und prüfen Sie, ob der Trino-Editor im Menü angezeigt wird.

      Trino Editor-Menü

    2. Wenn Sie zur Eingabe von Zugangsdaten aufgefordert werden, geben Sie Benutzername als trino und Kennwort als trino ein.

      Authentifizieren

Aufgabe 4: Daten mit dem Trino Editor abfragen

  1. Rufen Sie den Trino-Editor auf, und führen Sie SQL-Abfragen aus.

    1. Navigieren Sie zum Trino-Editor, und wählen Sie die Datenbank aus, für die Sie die Abfrage ausführen möchten.

    2. Sie können jetzt SQL-Abfragen für Ihre Trino-Instanz in Hue ausführen.

      Abfragen ausführen

Troubleshooting und Tipps

Nächste Schritte

Durch Befolgen dieser Aufgaben sollten Sie den Trino Editor erfolgreich in Ihre BDS Hue Umgebung integriert haben. Diese Integration verbessert Ihre Datenabfragefunktionen, sodass Sie die erweiterten Abfragefunktionen von Trino direkt aus Hue nutzen können. Wenn Probleme auftreten, lesen Sie die Tipps zur Fehlerbehebung oder wenden Sie sich an die Dokumentation oder an Community-Foren.

Danksagungen

Weitere Lernressourcen

Sehen Sie sich andere Übungen zu docs.oracle.com/learn an, oder greifen Sie im Oracle Learning YouTube-Channel auf weitere kostenlose Lerninhalte zu. Besuchen Sie außerdem education.oracle.com/learning-explorer, um Oracle Learning Explorer zu werden.

Die Produktdokumentation finden Sie im Oracle Help Center.