用於 Sun Java System HADB 的 Sun Cluster 資料服務指南 (適用於 Solaris 作業系統)

Sun Cluster HA for Sun Java System HADB 故障監視器的作業

本節說明 Sun Cluster HA for Sun Java System HADB 故障監視器的作業。

HADB 資源的啟動方法可啟動配置為在本機 Sun Cluster 節點上執行的 HADB 節點 (如果它們不在執行中)。 然後,該方法嘗試啟動 HADB 資料庫,如果失敗,稍後將在探測中啟動該資料庫。

Sun Cluster HA for Sun Java System HADB 故障監視器探測定期檢查 HADB 資料庫與 HADB 節點的狀態。 如果在啟動方法執行期間,HADB 資源沒有準備好啟動 HADB 資料庫,該探測將重新啟動出現故障的 HADB 節點並啟動 HADB 資料庫。 每次循環執行此程序時,該探測都將執行以下步驟:

  1. 首先,探測將休息一段時間 (時間長度為在 Thorough_Probe_Interval 中設定的秒數)。

  2. 探測透過執行 hadbm statushadbm status --nodes 指令來擷取 HADB 資料庫與 HADB 節點的目前狀態。

  3. 如果資料庫未執行,則探測將檢查在本機 Sun Cluster 節點上與該資料庫對應的 HADB stopstate 檔案。 hadbm start 指令在啟動資料庫時參考 stopstate 檔案以指定節點的角色。

  4. 如果 stopstate 檔案存在,HADB 資源將對其進行檢查以決定是否可以啟動資料庫。

    • 如果可以啟動資料庫,則探測將啟動該資料庫並將資源狀態設定為 Online

    • 如果無法啟動資料庫,則探測將資源狀態設定為 Online Degraded

  5. 如果資料庫正在執行,則探測將啟動配置為在本機 Sun Cluster 節點上執行的 HADB 節點。

  6. 如果資料庫與本機 HADB 節點正在執行,則探測將資源狀態設定為 Online (如果資源狀態為 Online Degraded)。

  7. 如果 HADB 資源群組中的所有 Sun Cluster 節點均使 HADB 資源在 Online Degraded 狀態下執行的時間超過 Stop_timeout 秒,則 HADB 資源會認為無法啟動資料庫。

  8. 如果已將 Auto_recovery 延伸屬性設定為 TRUE,則 HADB 資源將嘗試恢復資料庫。

  9. 如果嘗試恢復資料庫,則探測將執行以下步驟:

    • 在資源群組之節點清單中的一個 Sun Cluster 節點上發出 hadbm clear --fast 指令。 該指令將清除資料庫內容,並重新初始化和重新啟動資料庫。

    • 如果 hadbm clear 指令成功,將於發出 hadbm clear 指令的同一 Sun Cluster 節點上發出在 Auto_recovery_command 中指定的指令。 該指令通常為包含 asadmin create-session-store 指令的程序檔。 該指令還可以採取其他動作。 例如,它可以將郵件傳送至應用程式伺服器管理員。

    • 如果這兩個步驟均成功,則探測將資源的狀態設定為線上。

  10. 繼續從第一步開始循環。


註解 –

Thorough_Probe_IntervalStop_timeout 參數可由 scrgadm 指令調整。 如需詳細資訊,請參閱Sun Cluster Data Services Planning and Administration Guide for Solaris OS中的「Standard Properties」