下列已知問題和錯誤會影響 Sun Cluster 3.1 版本的作業。
在安裝 Solaris 與 Sun Cluster 之前,請先確認所有資料服務的需求。 如果您不確定這些要求,可能會錯誤地執行安裝程序,從而需要完整地重新安裝 Solaris 與 Sun Cluster 軟體。
例如,Oracle Parallel Server/Real Application Clusters 的 Oracle Parallel Fail Safe/Real Application Clusters Guard 選項對於在叢集中使用的主機名稱/節點名稱便有特殊需求。 您必須在安裝 Sun Cluster 軟體之前考慮到這些需求,因為在安裝 Sun Cluster 軟體後,便無法變更主機名稱。 如需有關主機名稱/節點名稱特殊需求的更多資訊,請參閱 Oracle Parallel Fail Safe/Real Application Clusters Guard 文件。
問題摘要: 有時,在 qfe 配接卡處結束的私有互連傳輸路徑無法上線。
使用 scstat -W,識別發生錯誤的配接卡。 輸出將顯示以該配接卡作為一個路徑端點 (處於已發生錯誤或等待中狀態) 的所有傳輸路徑。
使用 scsetup 從叢集配置中移除連線至該配接卡的所有電纜。
再次使用 scsetup 從叢集配置中移除該配接卡。
重新加入該配接卡與電纜。
驗證路徑是否顯示。 如果問題仍然存在,請重複幾次步驟 1–5。
驗證路徑是否顯示。 如果問題仍然存在,請重新啟動具有發生錯誤的配接卡之節點。 重新啟動該節點前,請確定其餘的叢集具有足夠的法定票數來承受節點重新啟動。
問題摘要: remove 程序檔無法解除註冊 SUNW.gds 資源類型,並顯示以下訊息:
資源類型已解除註冊。
解決方法: 使用 remove 程序檔之後,手動解除註冊 SUNW.gds。 或者,使用 scsetup 指令或 SunPlex Manager。
問題摘要: 使用私有互連上的 ce 配接卡的叢集可能會注意到路徑逾時,並且如果一個或多個叢集節點具有多於四個處理器,會發生後續節點當機。
解決方法: 透過將 set ce:ce_taskq_disable=1 加入至所有叢集節點上的 /etc/system 檔案,然後重新啟動叢集節點,設定 ce 驅動程式中的 ce_taskq_disable 參數。 這可確保始終在中斷環境中傳送心跳 (和其他資料封包),以便消除路徑逾時和後續節點當機。 重新啟動叢集節點時,應遵守法定注意事項。
問題摘要: 節點連結叢集時,如果裝置群組正處於切換過程中,則連結節點與切換作業可能會當機。 存取任何裝置服務的任何嘗試也將會當機。 在具有多於兩個節點的叢集上,如果裝置上掛載的檔案系統是 VxFS 檔案系統,則更有可能發生這種情況。
解決方法: 若要避免此情形,請勿在節點連結叢集時啟動裝置群組切換。 如果發生此情形,則必須重新啟動所有叢集節點以復原對裝置群組的存取。
問題摘要: SunPlex Manager 包含資料服務安裝精靈,該精靈可在叢集上設置高度可用的 DNS 服務。 如果使用者未提供現有 DNS 配置 (如 named.conf 檔案),精靈將透過自動偵測現有網路和名稱服務配置,嘗試產生有效的 DNS 配置。 但是,它會在某些網路環境中失敗,從而導致精靈出現故障而不發出錯誤訊息。
解決方法: 當系統提示時,請為 SunPlex Manager DNS 資料服務安裝精靈提供現有的、有效的 named.conf 檔案。 否則,請按照文件中所述的 DNS 資料服務程序,在叢集上手動配置高度可用的 DNS。
問題摘要: SunPlex Manager 包含資料服務安裝精靈,該精靈可以透過安裝與配置 Oracle 二進位檔案以及建立叢集配置,在叢集上設置高度可用的 Oracle 服務。 但是,該安裝精靈目前不可用,並會導致各種基於使用者的軟體配置的錯誤。
解決方法: 使用 Sun Cluster 文件中提供的程序,在叢集上手動安裝與配置 Oracle 資料服務。
問題摘要: 如果使用 SunPlex Manager 從多重配接卡 IPMP 群組中移除配接卡,則有時可能無法立即將此配接卡再次重新加入至同一個群組。
解決方法: 先移除 /etc/hostname.adapter,然後再嘗試將配接卡重新加入至同一個 IPMP 群組。
問題摘要: 由於內部錯誤,大多數由 Sun 提供的叢集代理程式使用 LOG_USER 工具而非使用 LOG_DAEMON 將訊息寫入系統記錄檔 (請參閱 syslog(3C))。 在配置有預設的系統記錄檔設定 (請參閱 syslog.conf(4)) 的叢集上,具有 LOG_WARNING 或 LOG_NOTICE 嚴重性的訊息通常被寫入系統記錄檔,而不會被輸出。
解決方法: 在所有叢集節點上的 /etc/syslog.conf 檔案接近開頭的部分加入以下行:
user.warning /var/adm/messages |
問題摘要: nssswitch.conf 檔案的需求 (位於「Sun Cluster Data Service for SAP liveCache Guide for Solaris OS」中的「Preparing the Nodes and Disks」) 不適用於 passwd 資料庫中的項目。 如果滿足這些需求,則當公用網路發生故障時,su 指令可能會在可以控制 liveCache 資源的每個節點上當機。
解決方法: 在每個可以控制 liveCache 資源的節點上,確保 passwd 資料庫的 /etc/nsswitch.conf 檔案中的項目如下:
passwd: files nis [TRYAGAIN=0]
問題摘要: 用於 Apache 和 Oracle 的 SunPlex Manager 資料服務安裝精靈不支援 Solaris 9 及更高版本。
解決方法: 使用 Sun Cluster 文件,在使用的叢集上手動安裝 Oracle。 如果要在 Solaris 9 (或更高版本) 上安裝 Apache,請在執行安裝精靈之前,手動加入 Solaris Apache 套裝軟體 SUNWapchr 和 SUNWapchu。
問題摘要: 根磁碟封裝期間,叢集節點重新啟動的不適當時序可能導致節點當機。
解決方法: 一次在一個節點上執行 scvxinstall ,一直等到該節點已完成其所有重新啟動後,再在另一個節點上啟動 scvxinstall。
問題摘要: 在非英文語言環境中執行 SunPlex Agent Builder 時,預設的視窗大小太小,某些控制項可能不會顯示在視窗中。 在德語和西班牙語語言環境中已經發現此問題。
解決方法: 依需要,手動調整 SunPlex Agent Builder 視窗的大小。
問題摘要: 如果從多個節點同時啟動,sccheck 可能會當機。
解決方法: 請勿從任何將指令傳送至多個節點的多重主控台啟動 sccheck。 sccheck 可以重疊執行,但不應同時啟動。
問題摘要: scinstall -r 不移除特定語言環境的資料服務套裝軟體。
解決方法: 節點啟動之後,請執行 pkginfo | grep -i cluster 以確定已移除所有資料服務套裝軟體。 若要移除列出的套裝軟體,請對每個套裝軟體執行 pkgrm。
問題摘要: 在繁體中文語言環境中,特定的 SunPlex Agent Builder 訊息以簡體中文顯示。
解決方法: 在 zh_TW 語言環境中執行 SunPlex Agent Builder,以繁體中文正確顯示訊息。
問題摘要: 從 HADB 代理程式呼叫 hadbm 時,它將從 /usr/bin 中取得 Java 二進位檔案。 由於 /usr/bin 中的 Java 二進位檔案需要連結至適當的版本 Java 1.4 (或更高版本),因此 HADB 代理程式無法正常工作。
解決方法: 在程序檔 /opt/SUNWappserver7/SUNWhadb/4/bin/hadbm 中,使用適當的版本 Java 1.4 (或更高版本) 指定 JAVA_HOME 環境變數。
問題摘要: 如果使用 scsetup 嘗試將第一個配接卡加入至包含單一節點的叢集,將產生以下錯誤訊息: 無法確定傳輸類型。
解決方法: 至少手動配置第一個配接卡:
# scconf -a -A trtype=type,name=nodename,node=nodename |
配置第一個配接卡後,進一步使用 scsetup 以按預期的方式配置互連工作。
問題摘要: 以下應用程式的資料服務無法透過使用 scinstall 公用程式來進行升級:
Apache Tomcat
DHCP
mySQL
Oracle E-Business Suite
Samba
SWIFTAlliance Access
WebLogic Server
WebSphere MQ
WebSphere MQ Integrator
解決方法: 如果您打算升級以上清單中某應用程式的資料服務,請使用以下步驟替代「Sun Cluster 軟體安裝指南 (適用於 Solaris 作業系統)」中的「升級至 Sun Cluster 3.1 4/04 軟體 (捲動)」中升級資料服務的步驟。 針對安裝資料服務的每個節點執行這些步驟。
移除要升級的資料服務的軟體套裝。
# pkgrm pkg-inst |
pkg-inst 指定要升級的資料服務的軟體套裝名稱,如下表所列。
應用程式 |
資料服務軟體套裝 |
---|---|
Apache Tomcat |
SUNWsctomcat |
DHCP |
SUNWscdhc |
mySQL |
SUNWscmys |
Oracle E-Business Suite |
SUNWscebs |
Samba |
SUNWscsmb |
SWIFTAlliance Access |
SUNWscsaa |
WebLogic Server (英文語言環境) |
SUNWscwls |
WebLogic Server (法語語言環境) |
SUNWfscwls |
WebLogic Server (日文語言環境) |
SUNWjscwls |
WebSphere MQ |
SUNWscmqs |
WebSphere MQ Integrator |
SUNWscmqi |
安裝要升級至該版本的資料服務版本的軟體套裝。
若要安裝軟體套裝,請依循 Sun Cluster 文件中有關要升級的資料服務的說明。 可以從 http://docs.sun.com 取得此文件。
問題摘要: Sun Cluster HA for Oracle 資料服務使用超級使用者指令 su(1M) 來啟動與停止資料庫。 如果您執行的是 Solaris 8 或 Solaris 9,則當叢集節點的公用網路出現故障時,此網路服務可能會不可用。
解決方法: 將以下項目納入每個可能為 oracle_server 或 oracle_listener 資源的主節點之節點上的 /etc/nsswitch.conf 配置檔案中:
passwd: files groups: files publickey: files project: files
這些項目會確保 su 指令不參考 NIS/NIS+ 名稱服務,從而在網路發生故障期間,資料服務會正確啟動與停止。
問題摘要: Sun Cluster HA for SAP liveCache 資料服務使用 dbmcli 指令來啟動與停止 liveCache。 如果您執行的是 Solaris 9,則當叢集節點的公用網路發生故障時,網路服務可能會不可用。
解決方法: 將 publickey 資料庫中的以下項目之一納入每個可能為 liveCache 資源的主節點之節點上的 /etc/nsswitch.conf 配置檔案中:
publickey: publickey: files publickey: files [NOTFOUND=return] nis publickey: files [NOTFOUND=return] nisplus
除了「Sun Cluster Data Service for SAP liveCache Guide for Solaris OS」中記錄的更新外,加入以上項目之一, 會確保 su 指令與 dbmcli 指令不參考 NIS/NIS+ 名稱服務。 繞過 NIS/NIS+ 名稱服務會確保在網路發生故障期間資料服務正確啟動與停止。
問題摘要: Sun Cluster HA for Siebel 不監視個別 Siebel 元件。 如果偵測到 Siebel 元件故障,則僅在 syslog 中記錄一條警示訊息。
解決方法: 使用指令 scswitch -R -h node -g resource_group,重新啟動其中元件離線的 Siebel 伺服器資源群組。