附註:

在不使用 Kerberos 的高可用性叢集啟用 Oracle Big Data Service Hue 中的 Trino 編輯器

簡介

Oracle Big Data Service (BDS) 此一雲端服務可讓使用者建立與管理 Hadoop 叢集、Spark 叢集、Trino 及其他大數據服務。在大數據分析的世界中,Trino 扮演高效能分散式 SQL 查詢引擎,專為在大型資料集上執行互動式分析查詢所設計。Trino 可在統一 SQL 介面內跨多個來源查詢資料,包括 Hadoop 分散式檔案系統 (HDFS)、OCI 儲存桶及傳統關聯式資料庫。它能夠以低延遲處理大規模資料,使其成為資料工程師和分析師的強大工具。

整合 Trino 與 BDS Hue 可為資料查詢提供無縫接軌的介面,大幅提升資料查詢能力。在本教學課程中,我們將逐步介紹使用 Hue 在高可用性 (HA) 叢集環境中啟用 Trino 編輯器的步驟,假設沒有 Kerberos 認證。透過追蹤這些工作,您將能夠配置 Hue 環境以與 Trino 連線,並有效運用其強大的查詢功能。

目標

必要條件

注意:此教學課程假設您正在使用非 Kerberos HA 叢集。如果您使用 Kerberized 環境,則需要執行與 Kerberos 認證相關的其他組態步驟。

作業 1:下載並安裝 Trino JDBC 驅動程式

  1. 從 Maven 下載 Trino JDBC 驅動程式 JAR 檔案,然後將 JAR 檔案儲存到 BDS 環境中的 UNO 節點 (執行 Hue 的位置),但為了本教學課程,該檔案會放置在 /tmp 目錄中。

  2. 設定 Trino 整合的 Hue。

    1. 登入 Apache Ambari 並瀏覽至 Hueconfig 以及 Advanced

    2. 按一下進階虛擬 -distributed.ini ,然後尋找解譯器

    選取色調組態

  3. 若要編輯組態,請在解譯器區段中新增下列組態。

    編輯色調設定

    確定 JDBC URL 與您的 Trino 協調器的完整網域名稱 (FQDN) 相符,而且驅動程式類別名稱正確無誤

工作 2:更新 Hue 的 Python 組態

  1. 尋找並修改 Python 閘道組態。

    在 Hue 伺服器 (UNO) 上,瀏覽至 /usr/odh/2.0.7/hue/build/env/lib/python2.7/site-packages/py4j-0.9-py2.7.egg/py4j/java_gateway.py 檔案。

    注意:編輯之前,請先建立此檔案的備份。

  2. 編輯 Python 檔案。

    1. 開啟 java_gateway.py,然後尋找類別路徑的定義位置。

    2. 新增下列行以包含 JDBC 驅動程式路徑。這可確保 Hue 可以找到並使用 Trino JDBC 驅動程式。

      更新 python 組態

工作 3:重新啟動 Hue 服務

  1. 返回 Apache Ambari 並重新啟動 Hue 服務以套用新的配置。

  2. 驗證 Hue 中的編輯器啟用。

    1. 重新啟動之後,請開啟 Hue 伺服器介面,然後檢查 Trino 編輯器是否出現在功能表中。

      Trino 編輯器功能表

    2. 提示輸入證明資料時,請將使用者名稱輸入為 trino,將密碼輸入為 trino

      認證

工作 4:使用 Trino 編輯器查詢資料

  1. 存取 Trino 編輯器並執行 SQL 查詢。

    1. 瀏覽至 Trino 編輯器,然後選擇要執行查詢的資料庫。

    2. 您現在可以從 Hue 對 Trino 執行處理執行 SQL 查詢。

      執行查詢

疑難排解與秘訣

接下來的步驟

透過追蹤這些工作,您應該已成功將 Trino 編輯器整合到您的 BDS Hue 環境中。此整合增強了您的資料查詢功能,可讓您直接從 Hue 運用 Trino 的進階查詢功能。如果您遇到任何問題,請檢閱疑難排解秘訣,或從文件或社群論壇尋求進一步的協助。

致謝

其他學習資源

探索 docs.oracle.com/learn 上的其他實驗室,或存取 Oracle Learning YouTube 頻道上的更多免費學習內容。此外,請造訪 education.oracle.com/learning-explorer 以成為 Oracle Learning Explorer。

如需產品文件,請造訪 Oracle Help Center