Sun Cluster 3.1 9/04 版本說明 (適用於 Solaris 作業系統)

已知問題和錯誤

下列已知問題和錯誤會影響 Sun Cluster 3.1 9/04 版次的作業。

當啟動裝置為多重路徑時，`scvxinstall` 會建立不正確的 `vfstab` 項目 (4639243)

問題摘要：當啟動裝置為多重路徑時，scvxinstall 會建立不正確的 vfstab 項目。

解決方法：運行 scvxinstall 並選擇封裝。當顯示下列訊息時，請鍵入 Ctrl-C 以中斷重新啟動：

This node will be re-booted in 20 seconds. Type Ctrl-C to abort.

編輯 vfstab 項目，以便 /global/.devices 使用 /dev/{r}dsk/cXtXdX 名稱，而非 /dev/did/{r}dsk 名稱。此修訂後的項目使得 VxVM 將其識別為根磁碟。重新運行 scvxinstall 並選擇封裝。vfstab 檔案已進行必要的更新。允許重新啟動執行。封裝正常進行。

HA Oracle 停止方法逾時 (4644289)

問題摘要：Sun Cluster for HA for Oracle 資料服務使用 su 指令啟動和停止資料庫。如果您執行的是 Solaris 8 或 Solaris 9，則當叢集節點的公用網路出現故障時，此網路服務可能會不可用。

解決方法：將以下項目包含在每個可以成為 oracle_server 資源或 oracle_listener 資源主節點之節點上的 /etc/nsswitch.conf 檔案中：

passwd: files
groups: files
publickey: files
project:  files

這些項目會確保 su 指令不參考 NIS/NIS+ 名稱服務，因此在網路故障期間，資料服務可正確地啟動與停止。

私有互連上的 `ce` 配接卡注意到逾時並導致節點當機 (4746175)

問題摘要：使用私有互連上的 ce 配接卡的叢集可能會注意到路徑逾時，並且如果一個或多個叢集節點具有的 CPU 多於 4 個，會發生後續節點當機。

解決方法：透過將下列一行加入所有叢集節點上的 /etc/system 檔案中，設定 ce 驅動程式中的 ce_taskq_disable 參數。

set ce:ce_taskq_disable=1

然後，重新啟動叢集節點。重新啟動叢集節點時，請考量最小配額。設定此參數可確保活動訊號 (和其他資料封包) 始終在中斷環境中得以傳送，從而消除路徑逾時和後續當機。

SAP liveCache 停止方法逾時 (4836272)

問題摘要：Sun Cluster HA for SAP liveCache 資料服務使用 dbmcli 指令來啟動與停止 liveCache。如果您執行的是 Solaris 9，則當叢集節點的公用網路發生故障時，網路服務可能會不可用。

解決方法：將 publickey 資料庫中的以下項目之一納入每個可能為 liveCache 資源的主節點之節點上的 /etc/nsswitch.conf 檔案中：

publickey: 
publickey:  files
publickey:  files [NOTFOUND=return] nis 
publickey:  files [NOTFOUND=return] nisplus

除了「Sun Cluster Data Service for SAP liveCache Guide for Solaris OS」中記錄的更新外，加入以上項目之一，可確保 su 指令與 dbmcli 指令不參考 NIS/NIS+ 名稱服務。繞過 NIS/NIS+ 名稱服務會確保在網路發生故障期間資料服務正確啟動與停止。

某些代理程式不使用設備 `LOG_DAEMON` (4897239)

問題摘要：由於內部錯誤，某些由 Sun 提供的叢集代理程式使用 LOG_USER 設備而非使用 LOG_DAEMON 將訊息寫入系統日誌檔 (請參閱 syslog(3C))。在配置為預設 syslog 設定 (請參閱 syslog.conf(4)) 的叢集上，嚴重性為 LOG_WARNING 或 LOG_NOTICE 的訊息通常會寫入系統日誌檔，而不會輸出。只有那些寫為 shell 程序檔的代理程式代碼才會出現此問題。

解決方法：

以下解決方法適用於編寫 shell 程序檔的代理程式開發人員：

在 shell 程序檔中，將設備明確傳送至 scds_sylog：

facility=`scha_cluster_get -O SYSLOG_FACILITY

'scds_syslog -p ${facility}.error -m "error message"
以下解決方法適用於叢集管理員：

在所有叢集節點上 /etc/syslog.conf 檔案接近開頭的部分加入以下項目：
```
user.warning		/var/adm/messages
```
此項目致使 user.warning 訊息得以記錄。您可以為 user.notice 訊息加入相似的項目，但這沒有必要，並且可能會致使日誌填充過快 (依賴於正在運行的應用程式混合)。

`nsswitch.conf` 需求不應套用至 `passwd` 資料庫 (4904975)

問題摘要：「Sun Cluster Data Service for SAP liveCache Guide for Solaris OS」的「準備節點與磁碟」中對 nsswitch.conf 檔案的需求不適用於 passwd 資料庫的項目。如果滿足這些需求，則當公用網路發生故障時，su 指令可能會在可以控制 liveCache 資源的每個節點上當機。

解決方法：在可以控制 liveCache 資源的每個節點上，確保 passwd 資料庫的 /etc/nsswitch.conf 檔案中的項目如下：

passwd: files nis [TRYAGAIN=0]

`sccheck` 當機 (4944192)

問題摘要：如果從多個節點同時啟動，sccheck 可能會當機。

解決方法：請勿從將指令傳送至多個節點的任何多重主控台啟動 sccheck。sccheck 可以重疊執行，但不應同時啟動。

連結到不正確 Java 版本的 Java 二進位會導致 HA-DB 代理程式發生故障 (4968899)

問題摘要：目前，HA-DB 資料服務不使用 JAVA_HOME 環境變數。因此，當透過 HA-DB 資料服務呼叫 HA-DB 時，HA-DB 會從 /usr/bin/ 取得 Java 二進位檔。/usr/bin/ 中的 Java 二進位檔需要連結至 Java 1.4 的適當版本及更高版本，以便 HA-DB 資料服務正常執行。

解決方法：如果您不介意變更提供的預設版本，請執行以下程序。作為範例，此解決方案假設 /usr/j2se 目錄即為最新的 Java 版本 (例如 1.4 及更高版本) 的位置。

目前在 /usr/ 目錄中有一個名為 java/ 的目錄嗎？如果有，請將其移至一個臨時位置。
從 /usr/ 目錄，將 /usr/bin/java 及所有其他與 Java 相關的二進位檔連結至 Java 的適當版本。
# ln -s j2se java

如果您不想變更可用的預設版本，請在 /opt/SUNWappserver7/SUNWhadb/4/bin/hadbm 程序檔中為 JAVA_HOME 環境變數指定 Java 的適當版本 (J2SE 1.4 及更高版本)。

HA-DB 在無備援的情況下重新初始化 (4973982)

問題摘要：由於錯誤 4974875，只要執行自動回復時，資料庫便會無任何備援地重新初始化。提及的錯誤已得到修正並整合至 HA-DB 版本 4.3。對於 HA-DB 4.2 及更低版本，請依照下列程序之一來變更 HA-DB 節點的角色。

解決方法：

自動回復成功後，識別已變更了自身角色的 HA-DB 節點。
於在步驟 1 中識別的所有節點上，依節點停用出現問題的 HA-DB 資源故障監視器。
# cladm noderole -db dbname -node nodeno -setrole role-before-auto_recovery
啟用出現問題的 HA-DB 資源故障監視器。

或者

自動回復成功後，識別已變更了自身角色的 HA-DB 節點。
在所有托管資料庫的節點上，停用出現問題的 HA-DB 資源故障監視器。
在任意一個節點上，對每個需要變更其自身角色的 HA-DB 節點執行以下指令。
# cladm noderole -db dbname -node nodeno -setrole role-before-auto_recovery

滾動升級期間無法透過其他節點存取 `pnmd` (4997693)

問題摘要：滾動升級期間，如果 scstat -i 指令在還未升級的叢集節點上運行，scstat 輸出將不會顯示已升級節點上托管之 IPMP 群組的狀態。

解決方法：從已升級的節點使用 scstat -i 輸出。

無法增加 LogicalHostname 資源 (5004611)

問題摘要：如果 LogicalHostname 資源需要使用其中有故障配接卡的 IPMP 群組，則無法將該資源增加至叢集。

解決方法：將有故障的配接卡從 IPMP 群組中移除，或在嘗試使用 LogicalHostname 資源中的 IPMP 群組之前排除故障。

SunPlex 管理程式不正確地儲存狀態的編碼資訊 (5012328)

問題摘要：資源群組狀態頁面中的兩個欄位 [狀態] 與 [類型] 會顯示用於檢視此頁面的第一個語言環境中的值。

解決方法：若要檢視不同語言環境中的值，請重新啟動 Web 伺服器。

重新封裝根磁碟之後，`uservol` 用於 `/global/.devices/node@2` (5028284)

問題摘要：封裝根磁碟之後，如果您將其解除封裝，然後重新封裝該根磁碟，則可能看到一個名為 uservol 的容體用於 /global/devices/node@nodeID 檔案系統。這將導致一些問題，因為每個節點的全域裝置檔案系統之容體名稱應該是唯一的。

解決方法：依照說明步驟解除封裝後，請於再次運行 scvxinstall 解除封裝根磁碟之前，結束 vxconfigd 常駐程式。

多重提交登入頁面至 Sun Web Console 導致各種登入失敗 (5039143)

問題摘要：登入 Sun Web Console 時，如果重複按 [登入] 或 [進入] 按鈕，多重登入請求可能會導致各種失敗，從而妨礙對 SunPlex Manager 的存取。

解決方法：成為叢集節點的超級使用者並重新啟動 Sun Web Console。

# /usr/sbin/smcwebserver restart

`Resource_dependencies_restart` 未按預期進行工作 (5041013)

問題摘要：當資源宣告 any node 資源群組間重新啟動對可延伸模式資源的附屬時，Resource_dependencies_restart 資源特性未如期起作用。大多數資料服務不受影響。

關於資源群組間附屬和重新啟動附屬的背景：

透過 Sun Cluster 3.1 9/04 中的資源群組間附屬功能，Sun Cluster 軟體支援可以跨越資源群組邊界的資源附屬。Sun Cluster 軟體還支援一種新的資源附屬類型，即restart dependency。如果附屬資源在線上，則當所依賴的資源啟動時，restart dependency 可使該附屬資源自動重新啟動。
關於 local node 與 any node 附屬的背景：

如果群組 RG1 中的資源 r1 對 RG2 中的 r2 具有附屬，並且如果 RG1 對 RG2 具有正關聯性，並且如果 RG1 和 RG2 都在同一節點上同時啟動或停止，那麼 r1 對 r2 的附屬就是 local node 附屬。例如，在同一節點啟動 RG1 和 RG2 時，r1 在該節點上啟動之前會等待 r2 在同一節點上啟動。其他節點上 r2 的狀態不會影響 r1 啟動的時間。

然而，如果 RG1 沒有宣告對 RG2 的正關聯性，或者如果有微弱的正關聯性，但是資源群組在不同的節點上啟動，那麼 r1 對 r2 的附屬就是 any node 附屬。此附屬意味著一旦 r2 在任意節點啟動，r1 就會啟動。
問題描述：

當資源群組 RG2 為可延伸模式 (即多重控制) 資源群組，並且 r1 對 r2 的附屬是 any node 重新啟動附屬時，會出現此問題。每當 r2 的任一實例啟動時，r1 就會重新啟動。應當僅依據啟動的第一個 r2 實例重新啟動 r1。

解決方法：當此錯誤得以修正時，目前的重新啟動附屬運作方式將如以上所述進行變更。請勿開發依據目前不正確運作方式的代碼或管理程序。

`sccheck` 缺少對 Sun Enterprise 15000 的支援 (5056534)

問題摘要：如果您使用 Sun Enterprise 15000 伺服器並運行 sccheck 指令，則檢查會失敗並報告一個錯誤，該錯誤表明 Sun Enterprise 15000 伺服器不受支援。該描述不正確。

解決方法：無需解決。Sun Cluster 軟體支援 Sun Enterprise 15000 伺服器。sccheck 指令報告的錯誤說明該檢查可能已過期。在這種情況下，sccheck 已過期。

未提供法語非 JES 資料服務代理程式 (5059963)

問題摘要：未提供法語 (fr) 作為資料服務代理程式 (不是 Sun Java Enterprise System 的一部分) 的一種語言選取。然而，這些套裝軟體的 GUI 安裝程式會建議用其他方法。

解決方法：忽略 GUI 安裝程式的不精確。未提供法語 (fr)。

`scinstall –u update` 不保留 `SUNWcacao` 安全鍵 (5068616)

問題摘要：在升級至 Sun Cluster 3.1 9/04 軟體期間，scinstall 指令會安裝新的一般代理程式容器套裝軟體 SUNWcacao 和 SUNWcacaocfg，但並不給所有叢集節點分發完全相同的安全鍵。

解決方法：請執行下列步驟，以確保所有叢集節點上的一般代理程式容器安全性檔案相同並且已複製檔案保留了正確的檔案權限。這些檔案是 Sun Cluster 軟體需要的。

在一個叢集節點上，變更至 /etc/opt/SUNWcacao/ 目錄。
phys-schost-1# cd /etc/opt/SUNWcacao/
建立 /etc/opt/SUNWcacao/security/ 目錄的 tar 檔案。
phys-schost-1# tar cf /tmp/SECURITY.tar security
將 /tmp/SECURITY.tar 檔案複製到其餘的每一個叢集節點。
在向其複製了 /tmp/SECURITY.tar 檔案的每一個節點上，擷取安全性檔案。

/etc/opt/SUNWcacao/ 目錄中已有的所有安全性檔案均會被覆寫。
phys-schost-2# cd /etc/opt/SUNWcacao/ phys-schost-2# tar xf /tmp/SECURITY.tar
從叢集的每個節點中刪除 /tmp/SECURITY.tar 檔案。

您必須刪除 tar 檔案的每個副本以避免安全性風險。
phys-schost-1# rm /tmp/SECURITY.tar phys-schost-2# rm /tmp/SECURITY.tar
在每個節點上，重新啟動安全性檔案代理程式。
# /opt/SUNWcacao/bin/cacaoadm start

不正確的 SunPlex Manager [進階過濾器] 面板日期格式 (5075018)

問題摘要：SunPlex Manager 的 [進階過濾器] 面板上的日期欄位僅接受 mm/dd/yyyy 格式。但是，在非英文語言環境中，日期格式不同於 mm/dd/yyyy，而從 [日曆] 面板回傳日期格式也不是 mm/dd/yyyy 格式。

解決方法：在 [進階過濾器] 面板中，以 mm/dd/yyyy 格式鍵入日期範圍。請勿使用 [設定] 按鈕來顯示日曆並選擇日期。

移除資源群組時，SunPlex Manager 中的錯誤訊息不可讀取 (5083147)

問題摘要：當您在 Solaris 8 上透過使用 SunPlex Manager 移除資源群組時，可能會收到不可讀取的錯誤訊息。該問題會於日文、韓文、繁體中文和簡體中文版本出現。

解決方法：運行英文的系統語言環境，以使用英文顯示錯誤訊息。

`SUNW.sapscs` 中不正確的副檔名特性描述 (5083259)

問題摘要：在資源類型註冊 (RTR) 檔案 SUNW.sapscs 中，對兩個副檔名特性的描述不正確。

解決方法：對 Scs_Startup_Script 的描述應該是 Startup script for the SCS. Defaults to /usr/sap/SAP_SID/SYS/exe/run/startsap。對 Scs_Shutdown_Script 的描述應該是 Shutdown script for the SCS. Defaults to /usr/sap/SAP_SID/SYS/exe/run/stopsap。

Sun Cluster 3.1 9/04 的 JumpStart 完成後，使用者無法存取 SunPlex Manager (5095638)

問題摘要：透過使用 JumpStart 方法安裝 Sun Cluster 軟體後，Sun Web Console 無法啟動 SunPlex Manager。JumpStart 安裝後處理無法將 SunPlex Manager 註冊到 Sun Web Console。

解決方法：於所有的節點上完成 Sun Cluster 軟體的 JumpStart 安裝之後，在每個叢集節點上運行以下程序檔。

# /var/sadm/pkg/SUNWscspmu/install/postinstall

該程序檔將 SunPlex Manager 註冊到 Sun Web Console。

從 CD-ROM 安裝 Sun Cluster Data Service for HA Oracle 失敗 (5098622)

問題摘要：Sun Cluster 3.1 9/04 資料服務 CD-ROM (適用於 x86) 上的安裝程式無法用於安裝 HA Oracle。以下是由安裝程式發出的訊息：

Could not find child archive ....

解決方法：使用 scinstall 來安裝 Sun Cluster Data Service for HA Oracle。

某些資料服務無法透過使用 `scinstall` 公用程式來進行升級

問題摘要：以下應用程式的資料服務無法透過使用 scinstall 公用程式來進行升級：

Apache Tomcat
DHCP
mySQL
Oracle E-Business Suite
Samba
SWIFTAlliance Access
WebLogic Server
WebSphere MQ
WebSphere MQ Integrator

解決方法：如果您計劃升級前面清單中應用程式的資料服務，請用以下步驟替代「Sun Cluster Software Installation Guide for Solaris OS」中的「Upgrading to Sun Cluster 3.1 9/04 Software (Rolling)」中有關升級資料服務的步驟。針對安裝資料服務的每個節點執行這些步驟。

如何升級無法透過使用 `scinstall` 升級的資料服務

步驟

移除要升級的資料服務的軟體套裝。

# pkgrm pkg-inst

pkg-inst 指定要升級的資料服務的軟體套裝名稱，如下表所列。

應用程式	資料服務軟體套裝
Apache Tomcat	`SUNWsctomcat`
DHCP	`SUNWscdhc`
mySQL	`SUNWscmys`
Oracle E-Business Suite	`SUNWscebs`
Samba	`SUNWscsmb`
SWIFTAlliance Access	`SUNWscsaa`
WebLogic Server (英文語言環境)	`SUNWscwls`
WebLogic Server (法語語言環境)	`SUNWfscwls`
WebLogic Server (日文語言環境)	`SUNWjscwls`
WebSphere MQ	`SUNWscmqs`
WebSphere MQ Integrator	`SUNWscmqi`

安裝要升級至該版本的資料服務版本的軟體套裝。

若要安裝軟體套裝，請依循 Sun Cluster 文件中有關要升級的資料服務的說明。此文件在 http://docs.sun.com/ 上有提供。

已知問題和錯誤

當啟動裝置為多重路徑時，scvxinstall 會建立不正確的 vfstab 項目 (4639243)

HA Oracle 停止方法逾時 (4644289)

私有互連上的 ce 配接卡注意到逾時並導致節點當機 (4746175)

SAP liveCache 停止方法逾時 (4836272)

某些代理程式不使用設備 LOG_DAEMON (4897239)

nsswitch.conf 需求不應套用至 passwd 資料庫 (4904975)

sccheck 當機 (4944192)