瞭解叢集架構

Oracle Cloud Infrastructure 上的 Enterprise Data Hub 和 CDP 資料中心叢集架構遵循 Cloudera 支援的參照架構。基本叢集包含公用程式主機、主要主機、工作主機以及選擇性基礎主機。

瞭解主機類型

您的 Cloudera acrhitecture 包含下列主機:

基本和公用程式主機應該要有公用 IP 位址,才可以在 VCN 外部存取這些位址,而且應透過安全清單限制存取。主要與工作主機必須建置在專用網路上,無法直接從網際網路存取。

瞭解每個主機類型執行哪些服務

許多在各種主機 Cloudera 支援執行的服務。下列服務清單描述這些關係。

  • HDFS
    • 公用程式主機:日記帳節點、HTTP 檔案伺服器
    • 主要主機:NameNode、日誌節點、容錯移轉控制器
    • 工作主機:資料主機
    • 基本主機:n/a
  • YARN
    • 公用程式主機:工作歷史記錄伺服器
    • 主要主機:資源管理程式
    • 工作主機:主機管理程式
    • 基本主機:n/a
  • Hive
    • 公用程式主機:MetaStore、WebHCat、Hive Server 2
    • 主要主機:n/a
    • 工作主機:n/a
    • 基本主機:n/a
  • 色調
    • 公用程式主機:色調伺服器
    • 主要主機:n/a
    • 工作主機:n/a
    • 基本主機:n/a
  • Spark
    • 公用程式主機:歷史記錄伺服器
    • 主要主機:n/a
    • 工作主機:n/a
    • 基本主機:n/a
  • Impala
    • 公用程式主機:目錄伺服器
    • 主要主機:n/a
    • 職工主機:Impala 協助程式
    • 基本主機:n/a
  • Cloudera 搜尋
    • 公用程式主機:n/a
    • 主要主機:n/a
    • 職工主機:Soir
    • 基本主機:n/a
  • HBase
    • 公用程式主機:Thrift 伺服器
    • 主要主機:HBase 主要
    • 工作主機:區域伺服器
    • 基本主機:n/a
  • ZooKeeper
    • 公用程式主機:ZooKeeper 服務
    • 主要主機:ZooKeeper 服務
    • 工作主機:n/a
    • 基本主機:n/a
  • Flume
    • 公用程式主機:n/a
    • 主要主機:n/a
    • 工作主機:n/a
    • 本主機:Flume 代理程式
  • 閘道角色
    • 公用程式主機:n/a
    • 主要主機:n/a
    • 工作主機:n/a
    • 基本主機:HDFS、YARN、Hive、Sqoop、Hue
  • 管理角色
    • 公用程式主機:Cloudera Manager 和 Service Cloudera Manager 代理程式 Oozie
    • 主要主機:Cloudera Manager 代理程式
    • 工作主機:Cloudera Manager 代理程式
    • 本主機:Cloudera Manager 代理程式