瞭解叢集架構
Oracle Cloud Infrastructure 上的 Enterprise Data Hub 和 CDP 資料中心叢集架構遵循 Cloudera 支援的參照架構。基本叢集包含公用程式主機、主要主機、工作主機以及選擇性基礎主機。
瞭解主機類型
您的 Cloudera acrhitecture 包含下列主機:
主機類型 | 描述 |
公用程式主機 | 這是用於核心管理服務之叢集中的主要主機。它主控 Cloudera Manager、Hue 伺服器以及「工作歷史記錄」伺服器 UI。它也會在起始叢集設定時使用,並執行叢集服務協調的 ZooKeeper 協助程式。 |
主要主機 | 這些主機會針對 NameNode、容錯移轉控制器、資源管理員、HBase 以及 ZooKeeper,執行核心叢集服務協助程式。這些協助程式會驅動工作主機上的工作負載。 |
工作主機 | 這些主機會執行 HDFS 和 Apache Hadoop YARN,以及叢集內所有工作的目標。這些主機可協助計算和記憶體資源執行所有工作,以及用於檔案儲存和複製的 HDFS。 |
基本主機 | 此主機會作為叢集之使用者互動與工作送出的邊緣節點。此外,也應該安裝協力廠商軟體以與 Cloudera 叢集搭配使用。 |
基本和公用程式主機應該要有公用 IP 位址,才可以在 VCN 外部存取這些位址,而且應透過安全清單限制存取。主要與工作主機必須建置在專用網路上,無法直接從網際網路存取。
瞭解每個主機類型執行哪些服務
許多在各種主機 Cloudera 支援執行的服務。下列服務清單描述這些關係。
- HDFS
- 公用程式主機:日記帳節點、HTTP 檔案伺服器
- 主要主機:NameNode、日誌節點、容錯移轉控制器
- 工作主機:資料主機
- 基本主機:n/a
- YARN
- 公用程式主機:工作歷史記錄伺服器
- 主要主機:資源管理程式
- 工作主機:主機管理程式
- 基本主機:n/a
- Hive
- 公用程式主機:MetaStore、WebHCat、Hive Server 2
- 主要主機:n/a
- 工作主機:n/a
- 基本主機:n/a
- 色調
- 公用程式主機:色調伺服器
- 主要主機:n/a
- 工作主機:n/a
- 基本主機:n/a
- Spark
- 公用程式主機:歷史記錄伺服器
- 主要主機:n/a
- 工作主機:n/a
- 基本主機:n/a
- Impala
- 公用程式主機:目錄伺服器
- 主要主機:n/a
- 職工主機:Impala 協助程式
- 基本主機:n/a
- Cloudera 搜尋
- 公用程式主機:n/a
- 主要主機:n/a
- 職工主機:Soir
- 基本主機:n/a
- HBase
- 公用程式主機:Thrift 伺服器
- 主要主機:HBase 主要
- 工作主機:區域伺服器
- 基本主機:n/a
- ZooKeeper
- 公用程式主機:ZooKeeper 服務
- 主要主機:ZooKeeper 服務
- 工作主機:n/a
- 基本主機:n/a
- Flume
- 公用程式主機:n/a
- 主要主機:n/a
- 工作主機:n/a
- 基本主機:Flume 代理程式
- 閘道角色
- 公用程式主機:n/a
- 主要主機:n/a
- 工作主機:n/a
- 基本主機:HDFS、YARN、Hive、Sqoop、Hue
- 管理角色
- 公用程式主機:Cloudera Manager 和 Service Cloudera Manager 代理程式 Oozie
- 主要主機:Cloudera Manager 代理程式
- 工作主機:Cloudera Manager 代理程式
- 基本主機:Cloudera Manager 代理程式