用於 Sun Java System Application Server EE (HADB) 的 Sun Cluster 資料服務指南 (適用於 Solaris 作業系統)

調校 Sun Cluster HA for Sun Java System Application Server EE (HADB) 的故障監視器

Sun Cluster HA for Sun Java System Application Server EE (HADB) 的故障監視器包含在代表 Sun Java System Application Server EE (HADB) 的資源中。您在註冊與配置 Sun Cluster HA for Sun Java System Application Server EE (HADB) 時建立該資源。如需更多資訊,請參閱註冊與配置 Sun Cluster HA for Sun Java System Application Server EE (HADB)

此資源的系統特性和延伸特性可以控制故障監視器的運作方式。這些特性的預設值可以決定故障監視器的預設運作方式。預設運作方式應適用於大多數 Sun Cluster 安裝。因此,您應在需要修改此預設運作方式時調校故障監視器。

如需更多資訊,請參閱以下小節。

故障監視器在探測期間執行的作業

HADB 資源的啟動方法可啟動配置為在本機 Sun Cluster 節點上執行的 HADB 節點 (如果它們不在執行中)。然後,此方法會嘗試啟動 HADB 資料庫。如果發生故障,則會在稍後的探測中啟動資料庫。

故障監視器探測會定期檢查 HADB 資料庫和 HADB 節點的狀態。探測會啟動發生故障的 HADB 節點。如果 HADB 資源在執行啟動方法期間未準備好啟動資料庫,則探測也會啟動 HADB 資料庫。每次循環執行此程序時,該探測都將執行以下步驟:

  1. 該探測透過執行 hadbm statushadbm status --nodes 指令擷取 HADB 資料庫和 HADB 節點目前的狀態。

  2. 如果資料庫未在執行,該探測會檢查本機 Sun Cluster 節點上是否存在與此資料庫相對應的 HADB stopstate 檔案。啟動資料庫時,hadbm start 指令會參照 stopstate 檔案,以進行節點角色指定。

  3. 如果 stopstate 檔案存在,HADB 資源將對其進行檢查以決定是否可以啟動資料庫。

    • 如果可以啟動資料庫,則測試將啟動該資料庫並將資源狀態設定為 Online

    • 如果無法啟動資料庫,則探測將資源狀態設定為 Online Degraded

  4. 如果資料庫正在執行,則探測將啟動配置為在本機 Sun Cluster 節點上執行的 HADB 節點。

  5. 如果資料庫和本機 HADB 節點正在執行,則探測會將資源狀態設定為 Online (如果它是 Online Degraded)。

  6. 如果 HADB 資源群組中的所有 Sun Cluster 節點在 Online Degraded 狀態下執行 HADB 資源的時間均超過了 Stop_timeout 秒,則 HADB 資源將認定無法啟動該資料庫。如需有關 Stop_timeout 特性的描述,請參閱「Sun Cluster Data Services Planning and Administration Guide for Solaris OS」中的附錄 A「Standard Properties」中的 method_timeout 資源特性。

  7. 如果將 Auto_recovery 延伸特性設定為 TRUE,則 HADB 資源會嘗試恢復資料庫。

  8. 如果嘗試恢復資料庫,則探測將執行以下步驟:

    • 在資源群組節點清單中的一個 Sun Cluster 節點上,發出 hadbm clear --fast 指令。該指令將清除資料庫內容,並重新初始化和重新啟動資料庫。

    • 如果 hadbm clear 指令成功,將於發出 hadbm clear 指令的同一 Sun Cluster 節點上發出在 Auto_recovery_command 中指定的指令。該指令通常為包含 asadmin create-session-store 指令的程序檔。該指令還可以採取其他動作。例如,該指令可能會傳送郵件給 Application Server 管理員。

    • 如果兩個步驟均執行成功,則探測會將資源狀態設定為 Online