在不使用 Kerberos 的高可用性叢集啟用 Oracle Big Data Service Hue 中的 Trino 編輯器

簡介

Oracle Big Data Service (BDS) 此一雲端服務可讓使用者建立與管理 Hadoop 叢集、Spark 叢集、Trino 及其他大數據服務。在大數據分析的世界中，Trino 扮演高效能分散式 SQL 查詢引擎，專為在大型資料集上執行互動式分析查詢所設計。Trino 可在統一 SQL 介面內跨多個來源查詢資料，包括 Hadoop 分散式檔案系統 (HDFS)、OCI 儲存桶及傳統關聯式資料庫。它能夠以低延遲處理大規模資料，使其成為資料工程師和分析師的強大工具。

整合 Trino 與 BDS Hue 可為資料查詢提供無縫接軌的介面，大幅提升資料查詢能力。在本教學課程中，我們將逐步介紹使用 Hue 在高可用性 (HA) 叢集環境中啟用 Trino 編輯器的步驟，假設沒有 Kerberos 認證。透過追蹤這些工作，您將能夠配置 Hue 環境以與 Trino 連線，並有效運用其強大的查詢功能。

目標

瞭解如何在 Hue 中為 HA 叢集環境設定 Trino 編輯器。
瞭解在 Hue 和 Trino 之間實現無縫連接所需的設置。
驗證組態並進行疑難排解，以確保順利查詢。

必要條件

在啟用 Trino 和 Hue 的 Oracle Cloud Infrastructure (OCI) 上執行的 Oracle Big Data Service 叢集。
存取 Hue 伺服器，以及修改配置所需的權限。
已下載並可供存取的 Trino Java 資料庫連線 (JDBC) 驅動程式 Java 存檔 (JAR) 檔案。

注意：此教學課程假設您正在使用非 Kerberos HA 叢集。如果您使用 Kerberized 環境，則需要執行與 Kerberos 認證相關的其他組態步驟。

作業 1：下載並安裝 Trino JDBC 驅動程式

從 Maven 下載 Trino JDBC 驅動程式 JAR 檔案，然後將 JAR 檔案儲存到 BDS 環境中的 UNO 節點 (執行 Hue 的位置)，但為了本教學課程，該檔案會放置在 /tmp 目錄中。
設定 Trino 整合的 Hue。
1. 登入 Apache Ambari 並瀏覽至 Hue 、 config 以及 Advanced 。
2. 按一下進階虛擬 -distributed.ini ，然後尋找解譯器。
若要編輯組態，請在解譯器區段中新增下列組態。

確定 JDBC URL 與您的 Trino 協調器的完整網域名稱 (FQDN) 相符，而且驅動程式類別名稱正確無誤

工作 2：更新 Hue 的 Python 組態

尋找並修改 Python 閘道組態。

在 Hue 伺服器 (UNO) 上，瀏覽至 /usr/odh/2.0.7/hue/build/env/lib/python2.7/site-packages/py4j-0.9-py2.7.egg/py4j/java_gateway.py 檔案。

注意：編輯之前，請先建立此檔案的備份。
編輯 Python 檔案。
1. 開啟 java_gateway.py，然後尋找類別路徑的定義位置。
2. 新增下列行以包含 JDBC 驅動程式路徑。這可確保 Hue 可以找到並使用 Trino JDBC 驅動程式。

工作 3：重新啟動 Hue 服務

返回 Apache Ambari 並重新啟動 Hue 服務以套用新的配置。
驗證 Hue 中的編輯器啟用。
1. 重新啟動之後，請開啟 Hue 伺服器介面，然後檢查 Trino 編輯器是否出現在功能表中。
2. 提示輸入證明資料時，請將使用者名稱輸入為 trino，將密碼輸入為 trino。

工作 4：使用 Trino 編輯器查詢資料

存取 Trino 編輯器並執行 SQL 查詢。
1. 瀏覽至 Trino 編輯器，然後選擇要執行查詢的資料庫。
2. 您現在可以從 Hue 對 Trino 執行處理執行 SQL 查詢。

疑難排解與秘訣

驅動程式問題：請確定 JAR 檔案已正確放置在目錄中，而且 Python 組態中的檔案路徑是正確的。
連線錯誤：驗證 JDBC URL，並確定可從 Hue 伺服器存取。
組態驗證：再次檢查 Apache Ambari 中的所有組態變更，並確認 Hue 服務已正確重新啟動。

接下來的步驟

透過追蹤這些工作，您應該已成功將 Trino 編輯器整合到您的 BDS Hue 環境中。此整合增強了您的資料查詢功能，可讓您直接從 Hue 運用 Trino 的進階查詢功能。如果您遇到任何問題，請檢閱疑難排解秘訣，或從文件或社群論壇尋求進一步的協助。

致謝

作者 - Pavan Upadhyay (Principal Cloud Engineer)、Saket Bihari (Principal Cloud Engineer)

其他學習資源

探索 docs.oracle.com/learn 上的其他實驗室，或存取 Oracle Learning YouTube 頻道上的更多免費學習內容。此外，請造訪 education.oracle.com/learning-explorer 以成為 Oracle Learning Explorer。

如需產品文件，請造訪 Oracle Help Center 。

標題與著作權資訊

Enable Trino Editor in Oracle Big Data Service Hue for High Availability Clusters Without Kerberos

G13966-01

September 2024

Oracle 和 (或) 其關係企業。