Solaris 10 版本說明

Sun Enterprise 中階系統上的動態重新配置

本節包含有關下列執行 Solaris 10 軟體的中階伺服器的動態重新配置 (DR) 功能的最新資訊:

如需有關 Sun Enterprise 伺服器動態重新配置的更多資訊,請參閱「Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems」。Solaris 10 發行版本包含對上述清單所提及的系統中所有 CPU/記憶體板以及多數 I/O 板的支援。

支援的硬體

在繼續之前,請先確定系統支援動態重新配置。如果您的系統屬於較舊的設計,則在您的主控台或是主控台記錄中會顯示下列訊息。此系統不適合進行動態重新配置。


Hot Plug not supported in this system

目前不再支援下列 I/O 板:

軟體備註

本節提供有關 DR 的一般軟體資訊。

啟用動態重新配置

若要啟用動態重新配置,您必須在 /etc/system 檔案中設定兩個變數。您必須再設定一個其他的變數以移除 CPU/記憶體板。執行下列步驟:

  1. 以超級使用者身份登入。

  2. 透過增加以下行來編輯 /etc/system 檔案:


    set pln:pln_enable_detach_suspend=1
    set soc:soc_enable_detach_suspend=1
    
  3. 如果要移除 CPU/記憶體板,請將此行加到檔案中:


    set kernel_cage_enable=1
    

    設定這個變數可啟動記憶體取消配置的操作。

  4. 重新啟動系統以套用變更。

靜止測試

可以使用下列指令來啟動靜止測試:


 # cfgadm -x quiesce-test sysctr10:slot number

在較大的系統中,靜止測試最多可能會執行一分鐘。如果 cfgadm 沒發現不相容的驅動程式,則這段期間不會顯示任何訊息。

已停用的主機板清單

嘗試連線已停用的主機板清單中的主機板,可能會產生此錯誤訊息:


# cfgadm -c connect sysctrl0:slotnumber






cfgadm: Hardware specific failure: connect failed:
board is disabled: must override with [-f][-o enable-at-boot]

如果要置換停用條件,您可以使用兩個選項:

如果要從已停用的主機板清單移除所有主機板,請依據您發出指令後出現的提示從兩個選項中選擇一個:

如需有關 disabled-board-list 設定的更多資訊,請參閱「Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems」手冊中的「Specific NVRAM Variables」小節。該手冊是此發行版本文件集中的一部分。

已停用的記憶體清單

OpenBoot PROM disabled-memory-list 設定的相關資訊已發佈於此發行版本中。請參閱 Sun 硬體文件中 Solaris 部分之「 Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems」中的「Specific NVRAM Variables」。

卸載不支援分離的驅動程式

如果您必須卸載不支援分離的驅動程式,請使用 modinfo 行指令來尋找驅動程式的模組 ID。然後您可以使用 modunload 指令中的模組 ID 來卸載不支援分離的驅動程式。

在連接序列期間發生自我測試執行失敗

如果在 DR 連接序列期間顯示下列錯誤訊息,請盡快從系統移除板。


cfgadm: Hardware specific failure: connect failed: firmware operation error

該板無法自我測試,而移除板可避免在下次重新啟動時可能發生的重新配置錯誤。

無法自我測試狀態使您無法進行下一步作業。因此,如果您想立即重試失敗的作業,您必須先移除板,而後再重新插入板。

已知的錯誤

下列為隨時會變更的主題。

程式保持裝置開啟時,網路裝置移除失敗 (5054195)

如果某個程序正保持某個網路裝置為開啟狀態,則任一與該裝置有關的 DR 作業都會失敗。保持參照計數的常駐程式及程序會使 DR 作業停止而無法完成。

解決方法:以超級使用者身份執行下列步驟:

  1. 移除或重新命名 /rplboot 路徑。

  2. 關閉 NFS 服務。


    # sh /etc/init.d/nfs.server stop
    
  3. 關閉啟動伺服器服務。


    # sh /etc/init.d/boot.server stop
    
  4. 執行 DR 分離作業。

  5. 重新啟動 NFS 服務。


    # sh /etc/init.d/nfs.server start
    
  6. 重新啟動啟動伺服器服務。


    # sh /etc/init.d/boot.server start
    

在重大重新設定後,記憶體交錯設定錯誤 (4156075)

Sun Enterprise5 x500 伺服器在重大重新設定後重新啟動,記憶體交錯會出現錯誤狀態。接下來的 DR 操作失敗。只有在記憶體交錯設定為 min 的系統中才會發生此問題。

解決方法:請選擇以下選項之一:

無法對已具有交錯記憶體的 CPU/記憶體板取消配置 (4210234)

如果要取消配置並接著將帶有記憶體的 CPU 板或僅有記憶體的板中斷連線,首先要對記憶體取消配置。但是,如果板上的記憶體在其他板上交錯了記憶體,則該記憶體目前無法動態取消配置。

使用 prtdiagcfgadm 指令可以顯示記憶體交錯。

解決方法:在啟用板之前先關閉系統,然後重新啟動。若要允許在 CPU/記憶體板上進行更多的 DR 作業,請將 NVRAM memory-interleave 特性設定為 min。 另請參閱在重大重新設定後,記憶體交錯設定錯誤 (4156075),以取得有關交錯記憶體的相關說明。

無法對已具有永久記憶體的 CPU/記憶體板取消配置 (4210280)

如果要取消配置並接著將帶有記憶體的 CPU 板或僅有記憶體的板中斷連線,首先要對記憶體取消配置。但是,有些記憶體目前無法重新放置。這種記憶體則被視為永久的記憶體。

板上的永久記憶體會在 cfgadm 狀態顯示中標示為「permanent」:


# cfgadm -s cols=ap_id:type:info
Ap_Id Type Information
ac0:bank0 memory slot3 64Mb base 0x0 permanent
ac0:bank1 memory slot3 empty
ac1:bank0 memory slot5 empty
ac1:bank1 memory slot5 64Mb base 0x40000000

在這個範例中,slot3 中的板有永久記憶體,因此無法卸除。

解決方法:在啟用板之前先關閉系統,然後重新啟動。

執行同步運作的 cfgadm 指令時,cfgadm 中斷連線失敗 (4220105)

如果板中正在執行 cfgadm 程序時,嘗試同時將第二個板中斷連線將失敗。螢幕上將顯示以下錯誤訊息:


cfgadm: Hardware specific failure: 
disconnect failed: nexus error during detach:address

解決方法:一次只執行一個 cfgadm 作業。允許在對第二個板啟動 cfgadm 中斷連線作業之前,先完成某個板中執行中的 cfgadm 作業。