瞭解 Cloudera 組態建議

Oracle Cloud Infrastructure 上部署 Cloudera 時,下列建議將被視為最佳做法。

瞭解設定 HDFS

為裸機 Enterprise Data Hub 或 CDP 資料中心叢集設定具有三個複製因素的 Hadoop 分散檔案系統 (HDFS)。由於裸機主機使用本機 NVMe 儲存體來儲存 HDFS,因此必須將冗餘內建到 HDFS 拓樸,以確保高可用性和失敗容錯。

瞭解設定 ZooKeeper

預設會在公用程式主機和主要主機上設定 ZooKeeper。請一律維護奇數的 ZooKeeper 執行處理,以防止在選擇服務時進行分割。

瞭解設定 NameNodes

為了提供高可用性,請在 Enterprise Data Hub 或 CDP 資料中心部署時,佈建多個 NameNodes。這通常包含作業組態中的主要和次要 NameNode。