ノート:
- このチュートリアルでは、Oracle Cloudへのアクセスが必要です。無料アカウントにサインアップするには、Oracle Cloud Infrastructure Free Tierの開始を参照してください。
- Oracle Cloud Infrastructureの資格証明、テナンシおよびコンパートメントの値の例を使用します。演習を完了するときに、これらの値をクラウド環境に固有の値に置き換えます。
Kerberosを使用しない高可用性クラスタでのOracle Big Data Service HueでのTrinoエディタの有効化
イントロダクション
Oracle Big Data Service (BDS)は、ユーザーがHadoopクラスタ、Sparkクラスタ、Trinoおよびその他のビッグ・データ・サービスを作成および管理できるようにするクラウドベースのサービスです。ビッグ・データ分析の世界では、Trinoは、大規模なデータセットに対してインタラクティブな分析クエリを実行するために設計された、高パフォーマンスの分散SQLクエリエンジンとして際立っています。Trinoは、Hadoop Distributed File System (HDFS)、OCIバケット、従来のリレーショナル・データベースなど、複数のソースにわたるデータの問合せをすべて統合SQLインタフェース内で可能にします。大規模なデータを低レイテンシで処理できるため、データ・エンジニアやアナリストにとっても強力なツールとなります。
TrinoをBDS Hueと統合すると、データを問い合せるためのシームレスなインタフェースを提供することで、データ問合せ機能を大幅に強化できます。このチュートリアルでは、Kerberos認証が行われていないことを前提として、Hueを使用した高可用性(HA)クラスタ環境でTrinoエディタを有効にするステップについて説明します。これらのタスクに従うことで、Hue環境を構成してTrinoに接続し、その強力な問合せ機能を効果的に活用できます。
目的
-
HAクラスタ環境用にHueでTrinoエディタを構成する方法を学習します。
-
HueとTrino間のシームレスな接続を可能にするために必要な設定を理解します。
-
構成を検証してトラブルシューティングし、問合せが成功したことを確認します。
前提条件
-
TrinoおよびHueが有効なOracle Cloud Infrastructure (OCI)で実行されているOracle Big Data Serviceクラスタ。
-
Hueサーバーへのアクセスおよび構成の変更に必要な権限。
-
ダウンロードしてアクセス可能なTrino Java Database Connectivity (JDBC)ドライバのJavaアーカイブ(JAR)ファイル。
ノート:このチュートリアルでは、Kerberos以外のHAクラスタを使用していることを前提としています。Kerberized環境を使用している場合は、Kerberos認証に関連する追加の構成ステップが必要になります。
タスク1: Trino JDBCドライバのダウンロードとインストール
-
MavenからTrino JDBCドライバJARファイルをダウンロードし、BDS環境のUNOノード(Hueが実行されている場所)にJARファイルを保存しますが、このチュートリアルでは、
/tmp
ディレクトリに配置します。 -
Trino統合のHueを構成します。
-
Apache Ambariにログインし、「Hue」、「config」および「Advanced」に移動します。
-
「拡張擬似distributed.ini」をクリックし、インタプリタを探します。
-
-
構成を編集するには、「インタプリタ」セクションに次の構成を追加します。
JDBC URLがTrinoコーディネータの完全修飾ドメイン名(FQDN)と一致し、ドライバ・クラス名が正しいことを確認してください
タスク2: HueのPython構成の更新
-
Pythonゲートウェイ構成を見つけて変更します。
Hueサーバー(UNO)で、
/usr/odh/2.0.7/hue/build/env/lib/python2.7/site-packages/py4j-0.9-py2.7.egg/py4j/java_gateway.py
ファイルに移動します。ノート:編集する前に、このファイルのバックアップを作成します。
-
Pythonファイルを編集します。
-
java_gateway.py
を開き、クラスパスが定義されている場所を検索します。 -
次の行を追加して、JDBCドライバ・パスを含めます。これにより、HueはTrino JDBCドライバを見つけて使用できます。
-
タスク3: Hueサービスの再起動
-
Apache Ambariに戻り、Hueサービスを再起動して新しい構成を適用します。
-
Hueでエディタの有効化を確認します。
-
再起動後、Hueサーバー・インタフェースを開き、メニューにTrinoエディタが表示されているかどうかを確認します。
-
資格証明の入力を求められたら、「ユーザー名」に
trino
と入力し、「パスワード」にtrino
と入力します。
-
タスク4: Trinoエディタを使用したデータの問合せ
-
Trinoエディタにアクセスし、SQL問合せを実行します。
-
Trinoエディタに移動し、問合せを実行するデータベースを選択します。
-
Hue内からTrinoインスタンスに対してSQL問合せを実行できるようになりました。
-
トラブルシューティングとヒント
-
ドライバの問題: JARファイルが権限のあるディレクトリに正しく配置され、Python構成のファイル・パスが正確であることを確認します。
-
接続エラー: JDBC URLを確認し、Hueサーバーからアクセスできることを確認します。
-
構成の検証: Apache Ambariのすべての構成変更をダブルチェックし、Hueサービスが適切に再起動されていることを確認します。
次のステップ
これらのタスクに従うことで、TrinoエディタをBDS Hue環境に正常に統合できました。この統合により、データ問合せ機能が強化され、Trinoの高度な問合せ機能をHueから直接活用できます。問題が発生した場合は、トラブルシューティングのヒントを確認するか、ドキュメントまたはコミュニティ・フォーラムからさらに支援を求めてください。
関連リンク
謝辞
- 著者 - Pavan Upadhyay (プリンシパル・クラウド・エンジニア)、Saket Bihari (プリンシパル・クラウド・エンジニア)
その他の学習リソース
docs.oracle.com/learnの他のラボを確認するか、Oracle Learning YouTubeチャネルで無料のラーニング・コンテンツにアクセスしてください。また、education.oracle.com/learning-explorerにアクセスしてOracle Learning Explorerになります。
製品ドキュメントは、Oracle Help Centerを参照してください。
Enable Trino Editor in Oracle Big Data Service Hue for High Availability Clusters Without Kerberos
G13962-01
September 2024