HADB 透過複製鏡像節點上的資料實現錯誤容錯。在生產環境中,鏡像節點位於其鏡像之節點的獨立 DRU 上,如「Sun Java System Application Server 9.1 部署規劃指南」中所述。
故障指未預期事件,例如硬體故障、電源故障或作業系統重新開機。HADB 可容錯個體故障:即故障發生在一個節點、一台機器 (無鏡像節點對)、屬於同一 DRU 的一台或多台機器或甚至一個完整 DRU 上。但是,HADB 不會自動從雙重故障回復,即一個或多個鏡像節點對同時發生的故障。如果發生雙重故障,則必須清除 HADB,並重新建立其作業事件存放區 (清除其所有資料)。
有不同的維護程序,取決於您需要在一台機器還是多台機器上工作。
此程序適用於規劃的和未規劃的維護,不會中斷 HADB 可用性。
執行維護程序,並使機器啟動和執行。
確定 ma 正在執行。
如果 ma 以 Windows 服務的形式或在 init.d 程序檔 (建議用於部署) 下執行,則應該已由作業系統啟動。如果沒有,請手動啟動。請參閱啟動管理代理程式。
啟動機器上的所有節點。
如需更多資訊,請參閱啟動節點。
檢查節點是否為使用中且正在執行。
如需更多資訊,請參閱取得 HADB 的狀態
規劃的維護包括硬體和軟體升級等作業。此程序不會中斷 HADB 可用性。
對於第一個 DRU 中的每台備用機器,請逐台重複單一機器程序,如在一台機器上執行維護中所述。
對於第一個 DRU 中的每台使用中機器,逐台重複單一機器程序,如在一台機器上執行維護中所述。
為第二個 DRU 重複步驟 1 和步驟 2。
此程序在 HADB 位於一台或多台機器上時適用。在維護程序期間會中斷 HADB 服務。
檢查資料庫狀態。
請參閱取得 HADB 的狀態
如果資料庫狀態為可作業或更佳:
需要執行未規劃維護的機器不包含鏡像節點。為每台出現故障的機器執行單一機器程序,每次一個 DRU。HADB 伺服器不中斷。
如果資料庫狀態為不可作業:
需要執行未規劃維護的機器包含鏡像節點。此類情況之一為整個 HADB 都在一台出現故障的機器上時。首先啟動並執行所有機器。然後清除 HADB,並重新建立階段作業存放區。請參閱清除資料庫。這會中斷 HADB 服務。
HADB 歷史檔案會記錄所有資料庫作業和錯誤訊息。HADB 附加至現有歷史檔案的結尾,因此檔案隨著時間而增長。若要節省磁碟空間並防止檔案變得過大,請定期清除和歸檔歷史檔案。
若要清除資料庫的歷史檔案,請使用 hadbm clearhistory 指令。
指令語法為:
hadbm clearhistory [--saveto=path] [dbname] [--adminpassword=password | --adminpasswordfile=file] [--agent=maurl]
dbname 運算元指定資料庫名稱。預設為 hadb。
使用 --saveto 選項 (短形式 -o) 可指定在其中儲存舊的歷史檔案之目錄。此目錄必須具有相應的寫入權限。請參閱一般選項,以取得其他指令選項說明。
如需更多資訊,請參閱 hadbm-clearhistory(1)。
hadbm create 指令的 --historypath 選項可確定歷史檔案的位置。歷史檔案的名稱格式為 dbname.out. nodeno。如需有關 hadbm create 的資訊,請參閱建立資料庫
歷史檔案中的各訊息包含以下資訊:
產生訊息之 HADB 程序的縮寫名稱。
訊息類型為:
INF - 一般資訊
WRN - 警告
ERR - 錯誤
DBG - 除錯資訊
時間戳記。時間為主機電腦系統時鐘時間。
節點停止或啟動時,在系統中發生服務設定變更。
有關資源短缺的訊息包含字串「HIGH LOAD」。
無需詳細瞭解歷史檔案中的所有項目。如果出於任何原因您需要更加詳細地研究歷史檔案,請與 Sun 客戶支援連絡。