Sun Cluster 3.0 12/01 系統管理手冊

2.1 關閉與啟動叢集概觀

Sun Cluster scshutdown(1M) 指令可依序停止叢集服務並完全關閉整個叢集。 當您要將叢集從某個位置移到另一個位置,或因應用程式錯誤導致資料毀損時,便可能需要這樣做。


註解 -

請使用 scshutdown,而非 shutdownhalt 指令來確保整個叢集正常關機。Solaris shutdown 指令是連同使用 scswitch 指令來關閉個別的節點。 請參閱 "2.1.1 如何關閉叢集""2.2 關閉與啟動單一叢集節點",以取得詳細資訊。


scshutdown 指令以下列方式停止叢集中所有節點:

  1. 使所有執行中的資源群組進入離線狀態。

  2. 卸載所有的叢集檔案系統。

  3. 關閉作用中的裝置服務。

  4. 執行 init 0 並使所有節點回到 OBP ok 提示符號。


註解 -

如有需要,您可在非叢集模式下啟動節點,如此該節點便不會以叢集成員身份參與。 這在安裝叢集軟體或執行某些管理程序時,非常有用。 請參閱 "2.2.4 如何以非叢集模式啟動叢集節點",以取得詳細資訊。


表 2-1 作業清單:關閉與啟動叢集

作業 

如需相關說明,請參閱... 

停止節點 

- 使用 scshutdown

"2.1.1 如何關閉叢集"

以啟動所有節點的方式來啟動叢集。  

節點和叢集交互連接之間必須有運轉中的連線,才能夠成為叢集成員。 

"2.1.2 如何啟動叢集"

關閉並重新啟動叢集 

- 使用 scshutdown

ok 提示處,請使用 boot 指令個別啟動每個節點。

節點和叢集交互連接之間必須有運轉中的連線,才能夠成為叢集成員。 

"2.1.3 如何重新啟動叢集"

2.1.1 如何關閉叢集


小心 - 小心 -

請勿在叢集主控台上使用 send brk 來關閉叢集節點。 叢集中並不支援此種功能。 如果您使用 send brk 然後輸入go ok 提示符號處來重新啟動,則節點會產生混亂的狀況。


  1. 如果您的叢集正在執行 Oracle(R) Parallel Server/Real Application Clusters,請關閉所有資料庫實例。

    請參閱 Oracle Parallel Server/Real Application Clusters 產品文件,以取得關機程序的說明。

  2. 成為叢集中任何節點的超級使用者。

  3. 立刻關閉叢集為 OBP。

    從叢集中的單一節點,輸入下列指令。


    # scshutdown -g0 -y
    

  4. 確認所有節點都顯示於 ok 提示符號處。

    在所有叢集節點都出現於 ok 提示符號之前,請勿關閉任何節點的電源。

  5. 必要的話,關閉節點的電源。

2.1.1.1 範例-關閉叢集

以下範例顯示先停止叢集正常作業,然後關閉所有節點使其顯示 ok 提示時顯示的主控台輸出。 -g 0 選項可將關機寬限期設成零,-y 提供自動的 yes 回應,以確認問題。關機訊息還會顯示在叢集中其它節點的主控台上。


# scshutdown -g0 -y
May 2 10:08:46 phys-schost-1 cl_runtime: WARNING: CMM monitoring disabled.
phys-schost-1# 
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
/etc/rc0.d/K05initrgm: Calling scswitch -S (evacuate)
The system is down.
syncing file systems... done
Program terminated
ok 

2.1.1.2 下一步

請參閱 "2.1.2 如何啟動叢集",以重新啟動已經關機的叢集。

2.1.2 如何啟動叢集

  1. 要啟動其節點已經停止並顯示 ok 提示的叢集,請啟動每一個節點。

    如果您在關機期間變更任何配置,請先以最近的配置來啟動節點。 除此情形外,節點的啟動順序並無影響。


    ok boot
    

    當叢集元件啟動時,訊息會出現在啟動節點的主控台上。


    註解 -

    叢集節點和叢集交互連接之間必須有運轉中的連線,才能夠成為叢集成員。


  2. 確認節點啟動成功而且是在線上狀態。

    scstat(1M) 指令可報告節點的狀態。


    # scstat -n
    


    註解 -

    如果叢集節點的 /var 檔案系統已滿,Sun Cluster 可能無法在該節點上重新啟動。 如果發生此問題,請參閱 "2.3.1 如何修復整個 /var 檔案系統"


2.1.2.1 範例-啟動叢集

以下範例顯示 phys-schost-1 節點啟動為叢集時的主控台輸出。 類似的訊息會出現在叢集中其它節點的主控台上。


ok boot
Rebooting with command: boot 
...
Hostname: phys-schost-1
Booting as part of a cluster
NOTICE: Node 1 with votecount = 1 added.
NOTICE: Node 2 with votecount = 1 added.
NOTICE: Node 3 with votecount = 1 added.
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 2 (incarnation # 937690106) has become reachable.
NOTICE: Node 3 (incarnation # 937690290) has become reachable.
NOTICE: cluster has reached quorum.
NOTICE: node 1 is up; new incarnation number = 937846227.
NOTICE: node 2 is up; new incarnation number = 937690106.
NOTICE: node 3 is up; new incarnation number = 937690290.
NOTICE: Cluster members:   1  2  3
...

2.1.3 如何重新啟動叢集

請執行 scshutdown(1M) 指令來關閉叢集,接著在每一個節點上使用 boot 指令來啟動叢集。

  1. (可選用)。 對於正在執行 Oracle Parallel Server/Real Application Clusters 的叢集,請關閉所有資料庫實例。

    請參閱 Oracle Parallel Server/Real Application Clusters 產品文件,以取得關機程序的說明。

  2. 成為叢集中任何節點的超級使用者。

  3. 關閉叢集為 OBP。

    從叢集中的單一節點,輸入下列指令。


    # scshutdown -g0 -y 
    

    這樣會關閉每一個節點使其顯示 ok 提示符號。


    註解 -

    叢集節點和叢集交互連接之間必須有運轉中的連線,才能夠成為叢集成員。


  4. 啟動每一個節點。

    節點的啟動順序沒有任何影響,除非您在兩次關機之間進行配置變更。 在這種情況時,您必須先啟動最後配置的節點。


    ok boot
    

    當叢集元件啟動時,訊息會出現在啟動節點的主控台上。

  5. 確認節點啟動成功而且是在線上狀態。

    scstat 指令可報告節點的狀態。


    # scstat -n
    


    註解 -

    如果叢集節點的 /var 檔案系統已滿,Sun Cluster 可能無法在該節點上重新啟動。 如果發生此問題,請參閱 "2.3.1 如何修復整個 /var 檔案系統"


2.1.3.1 範例-重新啟動叢集

以下範例顯示先停止叢集正常作業並關閉所有節點使其顯示 ok 提示,然後重新啟動叢集時的主控台輸出。 -g 0 選項可將寬限期設成零,-y 提供自動的 yes 回應,以確認問題。 關機訊息還會出現在叢集中其它節點的主控台上。


# scshutdown -g0 -y
May 2 10:08:46 phys-schost-1 cl_runtime: WARNING: CMM monitoring disabled.
phys-schost-1# 
INIT: New run level: 0
The system is coming down.  Please wait.
...
The system is down.
syncing file systems... done
Program terminated
ok boot
Rebooting with command: boot 
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 2 (incarnation # 937690106) has become reachable.
NOTICE: Node 3 (incarnation # 937690290) has become reachable.
NOTICE: cluster has reached quorum.
...
NOTICE: Cluster members:   1  2  3
...
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login:
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login: