Sun Cluster 軟體安裝指南 (適用於 Solaris 作業系統)

完成升級

本節提供以下資訊,以完成所有 Sun Cluster 3.2 軟體升級方法:

Procedure如何驗證 Sun Cluster 3.2 軟體的升級

請執行此程序以驗證是否已成功將叢集升級至 Sun Cluster 3.2 軟體。在 Solaris 10 作業系統上,僅從全域區域執行所有步驟。


備註 –

此程序提供了 Sun Cluster 指令的較長格式。大多指令也有短的形式。這些指令除了指令名稱的格式不同外,其他都是相同的。如需查看這些指令與其簡短格式的清單,請參閱「Sun Cluster 系統管理指南(適用於 Solaris 作業系統)」中的附錄 A「Sun Cluster 以物件為導向的指令」


開始之前

確定對要升級的所有叢集節點已完成全部升級程序。

  1. 在每個節點上,成為超級使用者。

  2. 請在每個已升級的節點上,檢視已安裝的 Sun Cluster 軟體的層級。


    phys-schost# clnode show-rev -v
    

    輸出的第一行指明節點正在執行的 Sun Cluster 軟體之版本。此版本應與剛升級至的版本相符。

  3. 從任一節點,驗證所有已升級的叢集節點正執行於叢集模式中 (Online)。


    phys-schost# clnode status
    

    請參閱 clnode(1CL) 線上手冊,以取得有關顯示叢集狀態的更多資訊。

  4. SPARC:若是從 Solaris 8 升級到 Solaris 9 軟體,請驗證儲存配置的一致性。

    1. 在每個節點上,執行下列指令以驗證儲存配置的一致性。


      phys-schost# cldevice check
      

      注意 – 注意 –

      請在配置通過此一致性檢查之後,再繼續執行步驟 b。如果未通過此檢查,則可能導致裝置識別錯誤及資料毀壞。


      下表列出來自 cldevice check 指令的可能輸出,以及必須採取的動作 (若有的話)。

      範例訊息 

      動作 

      device id for 'phys-schost-1:/dev/rdsk/c1t3d0' does not match physical device's id, device may have been replaced

      請至從未完成的升級回復並執行適當的修復程序。

      device id for 'phys-schost-1:/dev/rdsk/c0t0d0' needs to be updated, run cldevice repair to update

      無。請在步驟 b 中更新此裝置 ID。

      無輸出訊息 

      無。 

      請參閱 cldevice(1CL) 線上手冊以得知更多資訊。

    2. 在每個節點上,遷移 Sun Cluster 儲存資料庫到 Solaris 9 裝置 ID。


      phys-schost# cldevice repair
      
    3. 在每個節點上,執行下列指令以驗證儲存資料庫已成功遷移至 Solaris 9 裝置 ID。


      phys-schost# cldevice check
      
      • 如果 cldevice 指令顯示訊息,請返回至步驟 a,以進一步校正儲存配置或儲存資料庫。

      • 如果 cldevice 指令未顯示任何訊息,則裝置 ID 遷移成功。當已在所有叢集節點上驗證裝置 ID 已遷移後,請至如何結束升級到 Sun Cluster 3.2 軟體


範例 8–2 驗證是否升級到 Sun Cluster 3.2 軟體

以下範例顯示用來驗證升級雙節點叢集至 Sun Cluster 3.2 軟體的指令。這兩個叢集節點的名稱為 phys-schost-1phys-schost-2


phys-schost# clnode show-rev -v
3.2
…
phys-schost# clnode status
=== Cluster Nodes ===

--- Node Status ---

Node Name                                          Status
---------                                          ------
phys-schost-1                                      Online
phys-schost-2                                      Online

接下來的步驟

請至如何結束升級到 Sun Cluster 3.2 軟體

Procedure如何結束升級到 Sun Cluster 3.2 軟體

執行此程序來結束 Sun Cluster 升級。在 Solaris 10 作業系統上,僅從全域區域執行所有步驟。首先,重新註冊已從升級中收到新版本的所有資源類型。其次,修改合格的資源,以使用資源所使用的新版本資源類型。再次,重新啟用資源。最後,將資源群組返回線上狀態。

開始之前

確認已完成如何驗證 Sun Cluster 3.2 軟體的升級中的所有步驟。

  1. 將 一般代理程式容器 的安全性檔案複製到所有叢集節點上。

    此步驟可確保所有叢集節點上的 一般代理程式容器 的安全性檔案均相同,且所複製的檔案會保留正確的檔案權限。

    1. 在每個節點上,停止 Sun Java Web Console 代理程式。


      phys-schost# /usr/sbin/smcwebserver stop
      
    2. 在每個節點上,停止安全性檔案代理程式。


      phys-schost# /usr/sbin/cacaoadm stop
      
    3. 在節點上,變更到 /etc/cacao/instances/default/ 目錄。


      phys-schost-1# cd /etc/cacao/instances/default/
      
    4. 建立 /etc/cacao/SUNWcacao/security/ 目錄的 tar 檔案。


      phys-schost-1# tar cf /tmp/SECURITY.tar security
      
    5. /tmp/SECURITY.tar 檔案複製到其餘的每一個叢集節點。

    6. 在向其複製了 /tmp/SECURITY.tar 檔案的每一個節點上,擷取安全性檔案。

      已存在於 /etc/cacao/instances/default/ 目錄的任何安全性檔案會被覆寫。


      phys-schost-2# cd /etc/cacao/instances/default/
      phys-schost-2# tar xf /tmp/SECURITY.tar
      
    7. 從叢集的每個節點中刪除 /tmp/SECURITY.tar 檔案。

      您必須刪除 tar 檔案的每個副本以避免安全性風險。


      phys-schost-1# rm /tmp/SECURITY.tar
      phys-schost-2# rm /tmp/SECURITY.tar
      
    8. 在每個節點上,啟動安全性檔案代理程式。


      phys-schost# /usr/sbin/cacaoadm start
      
    9. 在每個節點上,啟動 Sun Java Web Console 代理程式。


      phys-schost# /usr/sbin/smcwebserver start
      
  2. 如果您已升級產品媒體上未提供的任何資料服務,請為這些資料服務註冊新的資源類型。

    遵照隨附於資料服務提供的文件。

  3. 若要將 Sun Cluster HA for SAP liveCache 從 Sun Cluster 3.0 或 3.1 版升級到 Sun Cluster 3.2 版,請修改 /opt/SUNWsclc/livecache/bin/lccluster 配置檔。

    1. 在將主控 liveCache 資源的節點上成為超級使用者。

    2. 將新的 /opt/SUNWsclc/livecache/bin/lccluster 檔案複製到 /sapdb/LC_NAME/db/sap/ 目錄。

      從資料服務的之前配置中,覆寫已存在的 lccluster 檔案。

    3. 依照「Sun Cluster Data Service for SAP liveCache Guide for Solaris OS」中的「How to Register and Configure Sun Cluster HA for SAP liveCache」的說明,配置此 /sapdb/LC_NAME/db/sap/lccluster 檔案。

  4. 若已升級 Solaris 作業系統,而且您的配置是為 Solaris Volume Manager 軟體使用雙串聯中介程式。請復原中介程式配置。

    1. 確定對要向其增加中介程式主機的磁碟組具有所有權的節點。


      phys-schost# metaset -s setname
      
      -s setname

      指定磁碟組名稱。

    2. 在控制或將要控制磁碟組的節點上,成為超級使用者。

    3. 如果無節點具有所有權,則取得磁碟組的所有權。


      phys-schost# cldevicegroup switch -n node devicegroup
      
      節點

      指定要成為磁碟組之主要節點的節點名稱。

      devicegroup

      指定磁碟組的名稱。

    4. 重新建立中介程式。


      phys-schost# metaset -s setname -a -m mediator-host-list
      
      -a

      增加至磁碟組。

      -m mediator-host-list

      指定要增加為磁碟組的中繼程式主機的節點之名稱。

    5. 對叢集中使用中介程式的每個磁碟組重複執行這些步驟。

  5. 若已升級了 VxVM,請升級所有的磁碟群組。

    1. 讓要升級的磁碟群組上線運作,並取得其所有權。


      phys-schost# cldevicegroup switch -n node devicegroup
      
    2. 請執行以下指令,將磁碟群組升級至由已安裝的 VxVM 發行版本支援的最高版本。


      phys-schost# vxdg upgrade dgname
      

      請參閱您的 VxVM 管理說明文件,以取得關於升級磁碟群組的詳細資訊。

    3. 對叢集中剩餘的每個 VxVM 磁碟群組重複執行此作業。

  6. 將資源遷移至新的資源類型版本。

    您必須將所有資源遷移到 Sun Cluster 3.2 資源類型版本。


    備註 –

    Sun Cluster HA for SAP Web Application Server,若是使用 J2EE 引擎資源或網路應用伺服器元件資源,或兩者皆是,就必須先刪除資源,然後使用新的網路應用伺服器元件資源重新建立資源。針對新網路應用伺服器元件資源的變更包含了 J2EE 功能的整合。如需更多相關資訊,請參閱「Sun Cluster Data Service for SAP Web Application Server Guide for Solaris OS 」


    請參閱「Sun Cluster Data Services Planning and Administration Guide for Solaris OS」中的「Upgrading a Resource Type」,其中包含使用指令行的程序。或者,您可以使用 clsetup 公用程式的 [資源群組] 功能表來執行相同的作業。此程序包含執行以下作業:

    • 註冊新資源類型。

    • 將合適的資源遷移至其資源類型的新版本。

    • 「Sun Cluster 3.2 版本說明 (適用於 Solaris 作業系統)」中所述,修改資源類型的延伸特性。


      備註 –

      Sun Cluster 3.2 發行版本介紹一些延伸特性的新預設值,例如 Retry_interval 特性。這些變更會影響使用該類特性預設值之任何現有資源的運作方式。若您要為某資源使用之前的預設值,請修改已遷移的資源來將特性設為之前的預設值。


  7. 若在開始雙分割區升級之前,叢集是執行 Sun Cluster HA for Sun Java System Application Server EE (HADB) 資料服務且您關閉了 HADB 資料庫,那麼,請重新啟用資源並啟動資料庫。


    phys-schost# clresource enable hadb-resource
    phys-schost# hadbm start database-name
    

    詳情請參閱 hadbm(1m) 線上手冊。

  8. 若已升級了 Solaris 10 作業系統,而且 Apache httpd.conf 檔案位於叢集檔案系統上,請確認 Apache 控制程序檔中的 HTTPD 項目仍然指向該位置。

    1. 檢視 /usr/apache/bin/apchectl 檔中的 HTTPD 項目。

      以下範例顯示 httpd.conf 檔案位於 /global 叢集檔案系統上。


      phys-schost# cat /usr/apache/bin/apchectl | grep HTTPD=/usr
      HTTPD="/usr/apache/bin/httpd -f /global/web/conf/httpd.conf"
    2. 若檔案沒有顯示正確的 HTTPD 項目,請更新檔案。


      phys-schost# vi /usr/apache/bin/apchectl
      #HTTPD=/usr/apache/bin/httpd
      HTTPD="/usr/apache/bin/httpd -f /global/web/conf/httpd.conf"
      
  9. 從任一節點啟動 clsetup 公用程式。


    phys-schost# clsetup
    

    螢幕將顯示 clsetup 主功能表。

  10. 重新啟用所有停用的資源。

    1. 輸入與資源群組的選項相對應之數字,然後按 Return 鍵。

      之後會出現 [Resource Group Menu]。

    2. 輸入與啟用/停用資源選項對應之編號,然後按 Return 鍵。

    3. 選擇要啟用的資源,並依照提示執行。

    4. 對每個已停用的資源重複步驟 c

    5. 當所有資源都重新啟用時,輸入 q 回到 Resource Group Menu。

  11. 使每個資源群組返回線上狀態。

    此步驟包含在非全域區域中將資源群組連線。

    1. 輸入與連線/離線或切換資源群組的選項相對應的數字,然後按 Return 鍵。

    2. 依照提示將每個資源群組置於受管理狀態,然後使資源群組上線。

  12. 當所有資源群組返回線上狀態後,請結束 clsetup 公用程式。

    輸入 q 退出每一個子功能表,或按 Ctrl-C

  13. 若在升級前,您於全部監視磁碟路徑故障時啟用自動節點重新啟動,請確認該功能是否仍啟用。

    若您是首次配置自動重新啟動,請同時執行此作業。

    1. 判定自動重新啟動功能為已啟用或停用。


      phys-schost# clnode show
      
      • 若將 reboot_on_path_failure 特性設為 enabled,就不需要再進行其餘動作。

      • 若將 reboot_on_path_failure 特性設為 disabled,請至下個步驟來重新啟用特性。

    2. 啟用自動重新啟動功能。


      phys-schost# clnode set -p reboot_on_path_failure=enabled
      
      -p

      指定要設定的特性

      reboot_on_path_failure=enable

      若至少有一個磁碟可以從叢集的不同節點存取時,指定為如果所有監視的磁碟路徑失敗時節點會重新啟動。

    3. 驗證在磁碟路徑失敗而自動重新啟動的功能已啟用。


      phys-schost# clnode show
      === Cluster Nodes ===                          
      
      Node Name:                                      節點
      …
        reboot_on_path_failure:                          enabled
      …
  14. (可選擇) 擷取磁碟分割資訊以備未來不時之需。


    phys-schost# prtvtoc /dev/rdsk/cNtXdYsZ > 檔案名稱
    

    將檔案儲存在叢集以外的位置。若您變更了任何磁碟配置,請再次執行此指令來擷取變更後的配置。若磁碟故障需要更換,就可以使用此資訊來復原磁碟分割區配置。如需得知更多資訊,請參閱 prtvtoc(1M) 線上手冊。

  15. (可選擇) 為叢集配置建立備份。

    為叢集配置建立歸檔備份有助於讓叢集配置回復更加容易。

    如需更多資訊,請參閱「Sun Cluster 系統管理指南(適用於 Solaris 作業系統)」中的「如何備份叢集配置」

疑難排解

資源類型遷移失敗 - 一般而言,在資源離線時,您會將資源遷移到新的資源類型。但是,有些資源必須為連線,資源類型遷移 才會成功。若資料類型遷移因為此原因而失敗,會顯示類似以下的錯誤訊息:

phys-schost - Resource depends on a SUNW.HAStoragePlus type resource that is not online anywhere. (C189917) VALIDATE on resource nfsrs, resource group rg, exited with non-zero exit status. (C720144) Validation of resource nfsrs in resource group rg on node phys-schost failed.

若資源類型遷移因為資源離線而失敗,請使用 clsetup 公用程式來重新啟用資源,然後將其相關資源群組連線。然後,為資源重複遷移程序。

Java 二進位位置變更 - 若在共用元件升級期間變更了 Java 二進位,您也許會在嘗試執行 cacaoadm startsmcwebserver start 指令時看見類似以下的錯誤訊息:

# /opt/SUNWcacao/bin/cacaoadm startNo suitable Java runtime found. Java 1.4.2_03 or higher is required.Jan 3 17:10:26 ppups3 cacao: No suitable Java runtime found. Java 1.4.2_03 or higher is required.Cannot locate all the dependencies

# smcwebserver start/usr/sbin/smcwebserver: /usr/jdk/jdk1.5.0_04/bin/java: not found

因為啟動指令無法找到 Java 二進位的目前位置,所以會產生這些錯誤。JAVA_HOME 特性仍然指向舊版 Java 所在的目錄,但是舊版已在升級期間移除。

若要修正此問題,請變更以下配置檔中的 JAVA_HOME 設定來使用目前的 Java 目錄:

/etc/webconsole/console/config.properties/etc/opt/SUNWcacao/cacao.properties

接下來的步驟

如果您使用的是基於 SPARC 的系統,並使用 Sun Management Center 監視叢集,請移至SPARC: 如何升級 Sun Management Center 的 Sun Cluster 模組軟體

若要安裝或完成 Sun Cluster Geographic Edition 3.2 軟體的升級,請參閱「Sun Cluster Geographic Edition Installation Guide 」

否則,便完成了叢集升級。