Sun Java System Application Server 9.1 高可用性管理指南

維護 HADB 機器

HADB 透過複製鏡像節點上的資料實現錯誤容錯。在生產環境中,鏡像節點位於其鏡像之節點的獨立 DRU 上,如「Sun Java System Application Server 9.1 部署規劃指南」中所述。

故障指未預期事件,例如硬體故障、電源故障或作業系統重新開機。HADB 可容錯個體故障:即故障發生在一個節點、一台機器 (無鏡像節點對)、屬於同一 DRU 的一台或多台機器或甚至一個完整 DRU 上。但是,HADB 不會自動從雙重故障回復,即一個或多個鏡像節點對同時發生的故障。如果發生雙重故障,則必須清除 HADB,並重新建立其作業事件存放區 (清除其所有資料)。

有不同的維護程序,取決於您需要在一台機器還是多台機器上工作。

Procedure在一台機器上執行維護

此程序適用於規劃的和未規劃的維護,不會中斷 HADB 可用性。

  1. 執行維護程序,並使機器啟動和執行。

  2. 確定 ma 正在執行。

    如果 ma 以 Windows 服務的形式或在 init.d 程序檔 (建議用於部署) 下執行,則應該已由作業系統啟動。如果沒有,請手動啟動。請參閱啟動管理代理程式

  3. 啟動機器上的所有節點。

    如需更多資訊,請參閱啟動節點

  4. 檢查節點是否為使用中且正在執行。

    如需更多資訊,請參閱取得 HADB 的狀態

Procedure在所有 HADB 機器上執行規劃的維護

規劃的維護包括硬體和軟體升級等作業。此程序不會中斷 HADB 可用性。

  1. 對於第一個 DRU 中的每台備用機器,請逐台重複單一機器程序,如在一台機器上執行維護中所述。

  2. 對於第一個 DRU 中的每台使用中機器,逐台重複單一機器程序,如在一台機器上執行維護中所述。

  3. 為第二個 DRU 重複步驟 1 和步驟 2。

Procedure在所有 HADB 機器上執行規劃的維護

此程序在 HADB 位於一台或多台機器上時適用。在維護程序期間會中斷 HADB 服務。

  1. 停止 HADB。請參閱停止資料庫

  2. 執行維護程序,並使所有機器啟動和執行。

  3. 確定 ma 正在執行。

  4. 啟動 HADB。

    如需更多資訊,請參閱啟動資料庫

    完成最後一步後,HADB 資料再次變得可用。

Procedure發生故障時進行臨時維護

  1. 檢查資料庫狀態。

    請參閱取得 HADB 的狀態

    • 如果資料庫狀態為可作業或更佳:

      需要執行未規劃維護的機器包含鏡像節點。為每台出現故障的機器執行單一機器程序,每次一個 DRU。HADB 伺服器不中斷。

    • 如果資料庫狀態為不可作業:

      需要執行未規劃維護的機器包含鏡像節點。此類情況之一為整個 HADB 都在一台出現故障的機器上時。首先啟動並執行所有機器。然後清除 HADB,並重新建立階段作業存放區。請參閱清除資料庫。這會中斷 HADB 服務。

清除和歸檔歷史檔案

HADB 歷史檔案會記錄所有資料庫作業和錯誤訊息。HADB 附加至現有歷史檔案的結尾,因此檔案隨著時間而增長。若要節省磁碟空間並防止檔案變得過大,請定期清除和歸檔歷史檔案。

若要清除資料庫的歷史檔案,請使用 hadbm clearhistory 指令。

指令語法為:

hadbm clearhistory  
[--saveto=path]  
[dbname]  
[--adminpassword=password | --adminpasswordfile=file]  
[--agent=maurl]

dbname 運算元指定資料庫名稱。預設為 hadb

使用 --saveto 選項 (短形式 -o) 可指定在其中儲存舊的歷史檔案之目錄。此目錄必須具有相應的寫入權限。請參閱一般選項,以取得其他指令選項說明。

如需更多資訊,請參閱 hadbm-clearhistory(1)

hadbm create 指令的 --historypath 選項可確定歷史檔案的位置。歷史檔案的名稱格式為 dbname.out. nodeno。如需有關 hadbm create 的資訊,請參閱建立資料庫

歷史檔案格式

歷史檔案中的各訊息包含以下資訊:

有關資源短缺的訊息包含字串「HIGH LOAD」。

無需詳細瞭解歷史檔案中的所有項目。如果出於任何原因您需要更加詳細地研究歷史檔案,請與 Sun 客戶支援連絡。