下列已知問題和錯誤會影響 Sun Cluster 3.1 9/04 版次的作業。
問題摘要:當啟動裝置為多重路徑時,scvxinstall 會建立不正確的 vfstab 項目。
解決方法:運行 scvxinstall 並選擇封裝。當顯示下列訊息時,請鍵入 Ctrl-C 以中斷重新啟動:
This node will be re-booted in 20 seconds. Type Ctrl-C to abort. |
編輯 vfstab 項目,以便 /global/.devices 使用 /dev/{r}dsk/cXtXdX 名稱,而非 /dev/did/{r}dsk 名稱。此修訂後的項目使得 VxVM 將其識別為根磁碟。重新運行 scvxinstall 並選擇封裝。vfstab 檔案已進行必要的更新。允許重新啟動執行。封裝正常進行。
問題摘要:Sun Cluster for HA for Oracle 資料服務使用 su 指令啟動和停止資料庫。如果您執行的是 Solaris 8 或 Solaris 9,則當叢集節點的公用網路出現故障時,此網路服務可能會不可用。
解決方法:將以下項目包含在每個可以成為 oracle_server 資源或 oracle_listener 資源主節點之節點上的 /etc/nsswitch.conf 檔案中:
passwd: files groups: files publickey: files project: files
這些項目會確保 su 指令不參考 NIS/NIS+ 名稱服務,因此在網路故障期間,資料服務可正確地啟動與停止。
問題摘要:使用私有互連上的 ce 配接卡的叢集可能會注意到路徑逾時,並且如果一個或多個叢集節點具有的 CPU 多於 4 個,會發生後續節點當機。
解決方法:透過將下列一行加入所有叢集節點上的 /etc/system 檔案中,設定 ce 驅動程式中的 ce_taskq_disable 參數。
set ce:ce_taskq_disable=1
然後,重新啟動叢集節點。重新啟動叢集節點時,請考量最小配額。設定此參數可確保活動訊號 (和其他資料封包) 始終在中斷環境中得以傳送,從而消除路徑逾時和後續當機。
問題摘要:Sun Cluster HA for SAP liveCache 資料服務使用 dbmcli 指令來啟動與停止 liveCache。如果您執行的是 Solaris 9,則當叢集節點的公用網路發生故障時,網路服務可能會不可用。
解決方法:將 publickey 資料庫中的以下項目之一納入每個可能為 liveCache 資源的主節點之節點上的 /etc/nsswitch.conf 檔案中:
publickey: publickey: files publickey: files [NOTFOUND=return] nis publickey: files [NOTFOUND=return] nisplus
除了「Sun Cluster Data Service for SAP liveCache Guide for Solaris OS」中記錄的更新外,加入以上項目之一,可確保 su 指令與 dbmcli 指令不參考 NIS/NIS+ 名稱服務。繞過 NIS/NIS+ 名稱服務會確保在網路發生故障期間資料服務正確啟動與停止。
問題摘要:由於內部錯誤,某些由 Sun 提供的叢集代理程式使用 LOG_USER 設備而非使用 LOG_DAEMON 將訊息寫入系統日誌檔 (請參閱 syslog(3C))。在配置為預設 syslog 設定 (請參閱 syslog.conf(4)) 的叢集上,嚴重性為 LOG_WARNING 或 LOG_NOTICE 的訊息通常會寫入系統日誌檔,而不會輸出。只有那些寫為 shell 程序檔的代理程式代碼才會出現此問題。
解決方法:
以下解決方法適用於編寫 shell 程序檔的代理程式開發人員:
在 shell 程序檔中,將設備明確傳送至 scds_sylog:
facility=`scha_cluster_get -O SYSLOG_FACILITY
'scds_syslog -p ${facility}.error -m "error message"
以下解決方法適用於叢集管理員:
在所有叢集節點上 /etc/syslog.conf 檔案接近開頭的部分加入以下項目:
user.warning /var/adm/messages
此項目致使 user.warning 訊息得以記錄。您可以為 user.notice 訊息加入相似的項目,但這沒有必要,並且可能會致使日誌填充過快 (依賴於正在運行的應用程式混合)。
問題摘要:「Sun Cluster Data Service for SAP liveCache Guide for Solaris OS」的「準備節點與磁碟」中對 nsswitch.conf 檔案的需求不適用於 passwd 資料庫的項目。如果滿足這些需求,則當公用網路發生故障時,su 指令可能會在可以控制 liveCache 資源的每個節點上當機。
解決方法:在可以控制 liveCache 資源的每個節點上,確保 passwd 資料庫的 /etc/nsswitch.conf 檔案中的項目如下:
passwd: files nis [TRYAGAIN=0]
問題摘要:如果從多個節點同時啟動,sccheck 可能會當機。
解決方法:請勿從將指令傳送至多個節點的任何多重主控台啟動 sccheck。sccheck 可以重疊執行,但不應同時啟動。
問題摘要:目前,HA-DB 資料服務不使用 JAVA_HOME 環境變數。因此,當透過 HA-DB 資料服務呼叫 HA-DB 時,HA-DB 會從 /usr/bin/ 取得 Java 二進位檔。/usr/bin/ 中的 Java 二進位檔需要連結至 Java 1.4 的適當版本及更高版本,以便 HA-DB 資料服務正常執行。
解決方法:如果您不介意變更提供的預設版本,請執行以下程序。作為範例,此解決方案假設 /usr/j2se 目錄即為最新的 Java 版本 (例如 1.4 及更高版本) 的位置。
目前在 /usr/ 目錄中有一個名為 java/ 的目錄嗎?如果有,請將其移至一個臨時位置。
從 /usr/ 目錄,將 /usr/bin/java 及所有其他與 Java 相關的二進位檔連結至 Java 的適當版本。
# ln -s j2se java |
如果您不想變更可用的預設版本,請在 /opt/SUNWappserver7/SUNWhadb/4/bin/hadbm 程序檔中為 JAVA_HOME 環境變數指定 Java 的適當版本 (J2SE 1.4 及更高版本)。
問題摘要:由於錯誤 4974875,只要執行自動回復時,資料庫便會無任何備援地重新初始化。提及的錯誤已得到修正並整合至 HA-DB 版本 4.3。對於 HA-DB 4.2 及更低版本,請依照下列程序之一來變更 HA-DB 節點的角色。
解決方法:
自動回復成功後,識別已變更了自身角色的 HA-DB 節點。
於在步驟 1 中識別的所有節點上,依節點停用出現問題的 HA-DB 資源故障監視器。
# cladm noderole -db dbname -node nodeno -setrole role-before-auto_recovery |
啟用出現問題的 HA-DB 資源故障監視器。
或者
自動回復成功後,識別已變更了自身角色的 HA-DB 節點。
在所有托管資料庫的節點上,停用出現問題的 HA-DB 資源故障監視器。
在任意一個節點上,對每個需要變更其自身角色的 HA-DB 節點執行以下指令。
# cladm noderole -db dbname -node nodeno -setrole role-before-auto_recovery |
問題摘要:滾動升級期間,如果 scstat -i 指令在還未升級的叢集節點上運行,scstat 輸出將不會顯示已升級節點上托管之 IPMP 群組的狀態。
解決方法:從已升級的節點使用 scstat -i 輸出。
問題摘要:如果 LogicalHostname 資源需要使用其中有故障配接卡的 IPMP 群組,則無法將該資源增加至叢集。
解決方法:將有故障的配接卡從 IPMP 群組中移除,或在嘗試使用 LogicalHostname 資源中的 IPMP 群組之前排除故障。
問題摘要:資源群組狀態頁面中的兩個欄位 [狀態] 與 [類型] 會顯示用於檢視此頁面的第一個語言環境中的值。
解決方法:若要檢視不同語言環境中的值,請重新啟動 Web 伺服器。
問題摘要:封裝根磁碟之後,如果您將其解除封裝,然後重新封裝該根磁碟,則可能看到一個名為 uservol 的容體用於 /global/devices/node@nodeID 檔案系統。這將導致一些問題,因為每個節點的全域裝置檔案系統之容體名稱應該是唯一的。
解決方法:依照說明步驟解除封裝後,請於再次運行 scvxinstall 解除封裝根磁碟之前,結束 vxconfigd 常駐程式。
問題摘要:登入 Sun Web Console 時,如果重複按 [登入] 或 [進入] 按鈕,多重登入請求可能會導致各種失敗,從而妨礙對 SunPlex Manager 的存取。
解決方法:成為叢集節點的超級使用者並重新啟動 Sun Web Console。
# /usr/sbin/smcwebserver restart |
問題摘要:當資源宣告 any node 資源群組間重新啟動對可延伸模式資源的附屬時,Resource_dependencies_restart 資源特性未如期起作用。大多數資料服務不受影響。
關於資源群組間附屬和重新啟動附屬的背景:
透過 Sun Cluster 3.1 9/04 中的資源群組間附屬功能,Sun Cluster 軟體支援可以跨越資源群組邊界的資源附屬。Sun Cluster 軟體還支援一種新的資源附屬類型,即restart dependency。如果附屬資源在線上,則當所依賴的資源啟動時,restart dependency 可使該附屬資源自動重新啟動。
關於 local node 與 any node 附屬的背景:
如果群組 RG1 中的資源 r1 對 RG2 中的 r2 具有附屬,並且如果 RG1 對 RG2 具有正關聯性,並且如果 RG1 和 RG2 都在同一節點上同時啟動或停止,那麼 r1 對 r2 的附屬就是 local node 附屬。例如,在同一節點啟動 RG1 和 RG2 時,r1 在該節點上啟動之前會等待 r2 在同一節點上啟動。其他節點上 r2 的狀態不會影響 r1 啟動的時間。
然而,如果 RG1 沒有宣告對 RG2 的正關聯性,或者如果有微弱的正關聯性,但是資源群組在不同的節點上啟動,那麼 r1 對 r2 的附屬就是 any node 附屬。此附屬意味著一旦 r2 在任意節點啟動,r1 就會啟動。
問題描述:
當資源群組 RG2 為可延伸模式 (即多重控制) 資源群組,並且 r1 對 r2 的附屬是 any node 重新啟動附屬時,會出現此問題。每當 r2 的任一實例啟動時,r1 就會重新啟動。應當僅依據啟動的第一個 r2 實例重新啟動 r1。
解決方法:當此錯誤得以修正時,目前的重新啟動附屬運作方式將如以上所述進行變更。請勿開發依據目前不正確運作方式的代碼或管理程序。
問題摘要:如果您使用 Sun Enterprise 15000 伺服器並運行 sccheck 指令,則檢查會失敗並報告一個錯誤,該錯誤表明 Sun Enterprise 15000 伺服器不受支援。該描述不正確。
解決方法:無需解決。Sun Cluster 軟體支援 Sun Enterprise 15000 伺服器。sccheck 指令報告的錯誤說明該檢查可能已過期。在這種情況下,sccheck 已過期。
問題摘要:未提供法語 (fr) 作為資料服務代理程式 (不是 Sun Java Enterprise System 的一部分) 的一種語言選取。然而,這些套裝軟體的 GUI 安裝程式會建議用其他方法。
解決方法:忽略 GUI 安裝程式的不精確。未提供法語 (fr)。
問題摘要:在升級至 Sun Cluster 3.1 9/04 軟體期間,scinstall 指令會安裝新的一般代理程式容器套裝軟體 SUNWcacao 和 SUNWcacaocfg,但並不給所有叢集節點分發完全相同的安全鍵。
解決方法:請執行下列步驟,以確保所有叢集節點上的 一般代理程式容器 安全性檔案相同並且已複製檔案保留了正確的檔案權限。這些檔案是 Sun Cluster 軟體需要的。
在一個叢集節點上,變更至 /etc/opt/SUNWcacao/ 目錄。
phys-schost-1# cd /etc/opt/SUNWcacao/ |
建立 /etc/opt/SUNWcacao/security/ 目錄的 tar 檔案。
phys-schost-1# tar cf /tmp/SECURITY.tar security |
將 /tmp/SECURITY.tar 檔案複製到其餘的每一個叢集節點。
在向其複製了 /tmp/SECURITY.tar 檔案的每一個節點上,擷取安全性檔案。
/etc/opt/SUNWcacao/ 目錄中已有的所有安全性檔案均會被覆寫。
phys-schost-2# cd /etc/opt/SUNWcacao/ phys-schost-2# tar xf /tmp/SECURITY.tar |
從叢集的每個節點中刪除 /tmp/SECURITY.tar 檔案。
您必須刪除 tar 檔案的每個副本以避免安全性風險。
phys-schost-1# rm /tmp/SECURITY.tar phys-schost-2# rm /tmp/SECURITY.tar |
在每個節點上,重新啟動安全性檔案代理程式。
# /opt/SUNWcacao/bin/cacaoadm start |
問題摘要:SunPlex Manager 的 [進階過濾器] 面板上的日期欄位僅接受 mm/dd/yyyy 格式。但是,在非英文語言環境中,日期格式不同於 mm/dd/yyyy,而從 [日曆] 面板回傳日期格式也不是 mm/dd/yyyy 格式。
解決方法:在 [進階過濾器] 面板中,以 mm/dd/yyyy 格式鍵入日期範圍。請勿使用 [設定] 按鈕來顯示日曆並選擇日期。
問題摘要:當您在 Solaris 8 上透過使用 SunPlex Manager 移除資源群組時,可能會收到不可讀取的錯誤訊息。該問題會於日文、韓文、繁體中文和簡體中文版本出現。
解決方法:運行英文的系統語言環境,以使用英文顯示錯誤訊息。
問題摘要:在資源類型註冊 (RTR) 檔案 SUNW.sapscs 中,對兩個副檔名特性的描述不正確。
解決方法:對 Scs_Startup_Script 的描述應該是 Startup script for the SCS. Defaults to /usr/sap/SAP_SID/SYS/exe/run/startsap。對 Scs_Shutdown_Script 的描述應該是 Shutdown script for the SCS. Defaults to /usr/sap/SAP_SID/SYS/exe/run/stopsap。
問題摘要:透過使用 JumpStart 方法安裝 Sun Cluster 軟體後,Sun Web Console 無法啟動 SunPlex Manager。JumpStart 安裝後處理無法將 SunPlex Manager 註冊到 Sun Web Console。
解決方法:於所有的節點上完成 Sun Cluster 軟體的 JumpStart 安裝之後,在每個叢集節點上運行以下程序檔。
# /var/sadm/pkg/SUNWscspmu/install/postinstall |
該程序檔將 SunPlex Manager 註冊到 Sun Web Console。
問題摘要:Sun Cluster 3.1 9/04 資料服務 CD-ROM (適用於 x86) 上的安裝程式無法用於安裝 HA Oracle。以下是由安裝程式發出的訊息:
Could not find child archive ....
解決方法:使用 scinstall 來安裝 Sun Cluster Data Service for HA Oracle。
問題摘要:以下應用程式的資料服務無法透過使用 scinstall 公用程式來進行升級:
Apache Tomcat
DHCP
mySQL
Oracle E-Business Suite
Samba
SWIFTAlliance Access
WebLogic Server
WebSphere MQ
WebSphere MQ Integrator
解決方法:如果您計劃升級前面清單中應用程式的資料服務,請用以下步驟替代「Sun Cluster Software Installation Guide for Solaris OS」中的「Upgrading to Sun Cluster 3.1 9/04 Software (Rolling)」中有關升級資料服務的步驟。針對安裝資料服務的每個節點執行這些步驟。
移除要升級的資料服務的軟體套裝。
# pkgrm pkg-inst |
pkg-inst 指定要升級的資料服務的軟體套裝名稱,如下表所列。
應用程式 |
資料服務軟體套裝 |
---|---|
Apache Tomcat |
SUNWsctomcat |
DHCP |
SUNWscdhc |
mySQL |
SUNWscmys |
Oracle E-Business Suite |
SUNWscebs |
Samba |
SUNWscsmb |
SWIFTAlliance Access |
SUNWscsaa |
WebLogic Server (英文語言環境) |
SUNWscwls |
WebLogic Server (法語語言環境) |
SUNWfscwls |
WebLogic Server (日文語言環境) |
SUNWjscwls |
WebSphere MQ |
SUNWscmqs |
WebSphere MQ Integrator |
SUNWscmqi |
安裝要升級至該版本的資料服務版本的軟體套裝。
若要安裝軟體套裝,請依循 Sun Cluster 文件中有關要升級的資料服務的說明。此文件在 http://docs.sun.com/ 上有提供。