本節包含有關下列執行 Solaris 10 軟體的中階伺服器的動態重新配置 (DR) 功能的最新資訊:
Sun Enterprise 6x00
Sun Enterprise 5x00
Sun Enterprise 4x00
Sun Enterprise 3x00
如需有關 Sun Enterprise 伺服器動態重新配置的更多資訊,請參閱「Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems」。Solaris 10 發行版本包含對上述清單所提及的系統中所有 CPU/記憶體板以及多數 I/O 板的支援。
在繼續之前,請先確定系統支援動態重新配置。如果您的系統屬於較舊的設計,則在您的主控台或是主控台記錄中會顯示下列訊息。此系統不適合進行動態重新配置。
Hot Plug not supported in this system |
目前不再支援下列 I/O 板:
類型 2 (圖形)
類型 3 (PCI)
類型 5 (圖形和 SOC+)
本節提供有關 DR 的一般軟體資訊。
若要啟用動態重新配置,您必須在 /etc/system 檔案中設定兩個變數。您必須再設定一個其他的變數以移除 CPU/記憶體板。執行下列步驟:
以超級使用者身份登入。
透過增加以下行來編輯 /etc/system 檔案:
set pln:pln_enable_detach_suspend=1 set soc:soc_enable_detach_suspend=1 |
如果要移除 CPU/記憶體板,請將此行加到檔案中:
set kernel_cage_enable=1 |
設定這個變數可啟動記憶體取消配置的操作。
重新啟動系統以套用變更。
可以使用下列指令來啟動靜止測試:
# cfgadm -x quiesce-test sysctr10:slot number |
在較大的系統中,靜止測試最多可能會執行一分鐘。如果 cfgadm 沒發現不相容的驅動程式,則這段期間不會顯示任何訊息。
嘗試連線已停用的主機板清單中的主機板,可能會產生此錯誤訊息:
# cfgadm -c connect sysctrl0:slotnumber cfgadm: Hardware specific failure: connect failed: board is disabled: must override with [-f][-o enable-at-boot] |
如果要置換停用條件,您可以使用兩個選項:
使用強制旗標 (-f)
# cfgadm -f -c connect sysctrl0:slot number |
使用啟用選項 (-o enable-at-boot)
# cfgadm -o enable-at-boot -c connect sysctrl0:slot number |
如果要從已停用的主機板清單移除所有主機板,請依據您發出指令後出現的提示從兩個選項中選擇一個:
在超級使用者提示中,鍵入:
# eeprom disabled-board-list= |
在 OpenBoot PROM 提示中,鍵入:
OK set-default disabled-board-list |
如需有關 disabled-board-list 設定的更多資訊,請參閱「Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems」手冊中的「Specific NVRAM Variables」小節。該手冊是此發行版本文件集中的一部分。
OpenBoot PROM disabled-memory-list 設定的相關資訊已發佈於此發行版本中。請參閱 SUN 硬體文件中 Solaris 部分之「Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems」中的「Specific NVRAM Variables」。
如果您必須卸載不支援分離的驅動程式,請使用 modinfo 行指令來尋找驅動程式的模組 ID。然後您可以使用 modunload 指令中的模組 ID 來卸載不支援分離的驅動程式。
如果在 DR 連接序列期間顯示下列錯誤訊息,請盡快從系統移除板。
cfgadm: Hardware specific failure: connect failed: firmware operation error |
該板無法自我測試,而移除板可避免在下次重新啟動時可能發生的重新配置錯誤。
無法自我測試狀態使您無法進行下一步作業。因此,如果您想立即重試失敗的作業,您必須先移除板,而後再重新插入板。
下列為隨時會變更的主題。
如果某個程序正保持某個網路裝置為開啟狀態,則任一與該裝置有關的 DR 作業都會失敗。保持參照計數的常駐程式及程序會使 DR 作業停止而無法完成。
解決方法:以超級使用者身份執行下列步驟:
移除或重新命名 /rplboot 路徑。
關閉 NFS 服務。
# sh /etc/init.d/nfs.server stop |
關閉啟動伺服器服務。
# sh /etc/init.d/boot.server stop |
執行 DR 分離作業。
重新啟動 NFS 服務。
# sh /etc/init.d/nfs.server start |
重新啟動啟動伺服器服務。
# sh /etc/init.d/boot.server start |
Sun Enterprise5 x500 伺服器在重大重新設定後重新啟動時,記憶體交錯會出現錯誤狀態。接下來的 DR 操作失敗。只有在記憶體交錯設定為 min 的系統中才會發生此問題。
解決方法:請選擇以下選項之一:
若要解決此問題,請在 OK 提示符號處手動重新設定系統。
要避免此問題,請將 NVRAM memory-interleave 特性設定為 max。
第二個選項導致記憶體在系統一啟動就交錯。不過,此選項可能無法被接受,因為包含交錯記憶體的記憶體板無法動態取消配置。請參閱無法對已具有交錯記憶體的 CPU/記憶體板取消配置 (4210234)。
如果要取消配置並接著將帶有記憶體的 CPU 板或僅有記憶體的板中斷連線,首先要對記憶體取消配置。但是,如果板上的記憶體在其他板上交錯了記憶體,則該記憶體目前無法動態取消配置。
使用 prtdiag 或 cfgadm 指令可以顯示記憶體交錯。
解決方法:在啟用板之前先關閉系統,然後重新啟動。若要允許在 CPU/記憶體板上進行更多的 DR 作業,請將 NVRAM memory-interleave 特性設定為 min。 另請參閱在重大重新設定後,記憶體交錯設定錯誤 (4156075),以取得有關交錯記憶體的相關說明。
如果要取消配置並接著將帶有記憶體的 CPU 板或僅有記憶體的板中斷連線,首先要對記憶體取消配置。但是,有些記憶體目前無法重新放置。這種記憶體則被視為永久的記憶體。
板上的永久記憶體會在 cfgadm 狀態顯示中標示為「permanent」:
# cfgadm -s cols=ap_id:type:info Ap_Id Type Information ac0:bank0 memory slot3 64Mb base 0x0 permanent ac0:bank1 memory slot3 empty ac1:bank0 memory slot5 empty ac1:bank1 memory slot5 64Mb base 0x40000000 |
在這個範例中,slot3 中的板有永久記憶體,因此無法卸除。
解決方法:在啟用板之前先關閉系統,然後重新啟動。
如果板中正在執行 cfgadm 程序時,嘗試同時將第二個板中斷連線將失敗。螢幕上將顯示下列錯誤訊息:
cfgadm: Hardware specific failure: disconnect failed: nexus error during detach:address |
解決方法:一次只執行一個 cfgadm 作業。允許在對第二個板啟動 cfgadm 中斷連線作業之前,先完成某個板中執行中的 cfgadm 作業。