Sun Cluster 3.1 4/04 版本說明 (適用於 Solaris 作業系統)

已知問題和錯誤

下列已知問題和錯誤會影響 Sun Cluster 3.1 版本的作業。

資料服務: 安裝準則

在安裝 Solaris 與 Sun Cluster 之前,請先確認所有資料服務的需求。 如果您不確定這些要求,可能會錯誤地執行安裝程序,從而需要完整地重新安裝 Solaris 與 Sun Cluster 軟體。

例如,Oracle Parallel Server/Real Application Clusters 的 Oracle Parallel Fail Safe/Real Application Clusters Guard 選項對於在叢集中使用的主機名稱/節點名稱便有特殊需求。 您必須在安裝 Sun Cluster 軟體之前考慮到這些需求,因為在安裝 Sun Cluster 軟體後,便無法變更主機名稱。 如需有關主機名稱/節點名稱特殊需求的更多資訊,請參閱 Oracle Parallel Fail Safe/Real Application Clusters Guard 文件。

節點無法帶出 qfe 路徑 (4526883)

問題摘要: 有時,在 qfe 配接卡處結束的私有互連傳輸路徑無法上線。

解決方法: 請依循以下所示的步驟執行:

  1. 使用 scstat -W,識別發生錯誤的配接卡。 輸出將顯示以該配接卡作為一個路徑端點 (處於已發生錯誤等待中狀態) 的所有傳輸路徑。

  2. 使用 scsetup 從叢集配置中移除連線至該配接卡的所有電纜。

  3. 再次使用 scsetup 從叢集配置中移除該配接卡。

  4. 重新加入該配接卡與電纜。

  5. 驗證路徑是否顯示。 如果問題仍然存在,請重複幾次步驟 1–5。

  6. 驗證路徑是否顯示。 如果問題仍然存在,請重新啟動具有發生錯誤的配接卡之節點。 重新啟動該節點前,請確定其餘的叢集具有足夠的法定票數來承受節點重新啟動。

remove 程序檔未能撤銷註冊 SUNW.gds 資源類型 (4727699)

問題摘要: remove 程序檔無法解除註冊 SUNW.gds 資源類型,並顯示以下訊息:

資源類型已解除註冊。

解決方法: 使用 remove 程序檔之後,手動解除註冊 SUNW.gds。 或者,使用 scsetup 指令或 SunPlex Manager。

使用私有互連上的 ce 配接卡時路徑逾時 (4746175)

問題摘要: 使用私有互連上的 ce 配接卡的叢集可能會注意到路徑逾時,並且如果一個或多個叢集節點具有多於四個處理器,會發生後續節點當機。

解決方法: 透過將 set ce:ce_taskq_disable=1 加入至所有叢集節點上的 /etc/system 檔案,然後重新啟動叢集節點,設定 ce 驅動程式中的 ce_taskq_disable 參數。 這可確保始終在中斷環境中傳送心跳 (和其他資料封包),以便消除路徑逾時和後續節點當機。 重新啟動叢集節點時,應遵守法定注意事項。

在切換過程中,節點在重新啟動後當機 (4806621)

問題摘要: 節點連結叢集時,如果裝置群組正處於切換過程中,則連結節點與切換作業可能會當機。 存取任何裝置服務的任何嘗試也將會當機。 在具有多於兩個節點的叢集上,如果裝置上掛載的檔案系統是 VxFS 檔案系統,則更有可能發生這種情況。

解決方法: 若要避免此情形,請勿在節點連結叢集時啟動裝置群組切換。 如果發生此情形,則必須重新啟動所有叢集節點以復原對裝置群組的存取。

如果未提供現有 DNS 配置,DNS 精靈出現故障 (4839993)

問題摘要: SunPlex Manager 包含資料服務安裝精靈,該精靈可在叢集上設置高度可用的 DNS 服務。 如果使用者未提供現有 DNS 配置 (如 named.conf 檔案),精靈將透過自動偵測現有網路和名稱服務配置,嘗試產生有效的 DNS 配置。 但是,它會在某些網路環境中失敗,從而導致精靈出現故障而不發出錯誤訊息。

解決方法: 當系統提示時,請為 SunPlex Manager DNS 資料服務安裝精靈提供現有的、有效的 named.conf 檔案。 否則,請按照文件中所述的 DNS 資料服務程序,在叢集上手動配置高度可用的 DNS。

使用 SunPlex Manager 安裝 Oracle 服務 (4843605)

問題摘要: SunPlex Manager 包含資料服務安裝精靈,該精靈可以透過安裝與配置 Oracle 二進位檔案以及建立叢集配置,在叢集上設置高度可用的 Oracle 服務。 但是,該安裝精靈目前不可用,並會導致各種基於使用者的軟體配置的錯誤。

解決方法: 使用 Sun Cluster 文件中提供的程序,在叢集上手動安裝與配置 Oracle 資料服務。

從 IPMP 群組移除配接卡後,無法將其加入至該群組 (4884060)

問題摘要: 如果使用 SunPlex Manager 從多重配接卡 IPMP 群組中移除配接卡,則有時可能無法立即將此配接卡再次重新加入至同一個群組。

解決方法: 先移除 /etc/hostname.adapter,然後再嘗試將配接卡重新加入至同一個 IPMP 群組。

Shell 版本的 scds_syslog 不使用 LOG_DAEMON 工具 (4897239)

問題摘要: 由於內部錯誤,大多數由 Sun 提供的叢集代理程式使用 LOG_USER 工具而非使用 LOG_DAEMON 將訊息寫入系統記錄檔 (請參閱 syslog(3C))。 在配置有預設的系統記錄檔設定 (請參閱 syslog.conf(4)) 的叢集上,具有 LOG_WARNINGLOG_NOTICE 嚴重性的訊息通常被寫入系統記錄檔,而不會被輸出。

解決方法: 在所有叢集節點上的 /etc/syslog.conf 檔案接近開頭的部分加入以下行:


user.warning /var/adm/messages
這將導致 user.warning 訊息被記錄下來。 可以為 user.notice 訊息加入相似的行,但這沒有必要,並且可能會導致記錄檔迅速填滿,具體取決於正在執行的應用程式混合。

passwdnsswitch.conf 需求使 nis 不可用 (4904975)

問題摘要: nssswitch.conf 檔案的需求 (位於Sun Cluster Data Service for SAP liveCache Guide for Solaris OS」中的「Preparing the Nodes and Disks」) 不適用於 passwd 資料庫中的項目。 如果滿足這些需求,則當公用網路發生故障時,su 指令可能會在可以控制 liveCache 資源的每個節點上當機。

解決方法: 在每個可以控制 liveCache 資源的節點上,確保 passwd 資料庫的 /etc/nsswitch.conf 檔案中的項目如下:

passwd: files nis [TRYAGAIN=0]

用於 Oracle 和 Apache 的資料服務安裝精靈不支援 Solaris 9 及更高版本 (4906470)

問題摘要: 用於 Apache 和 Oracle 的 SunPlex Manager 資料服務安裝精靈不支援 Solaris 9 及更高版本。

解決方法: 使用 Sun Cluster 文件,在使用的叢集上手動安裝 Oracle。 如果要在 Solaris 9 (或更高版本) 上安裝 Apache,請在執行安裝精靈之前,手動加入 Solaris Apache 套裝軟體 SUNWapchrSUNWapchu

作為 scvxinstall 封裝的一部分重新啟動一個節點後,發生節點當機 (4931910)

問題摘要: 根磁碟封裝期間,叢集節點重新啟動的不適當時序可能導致節點當機。

解決方法: 一次在一個節點上執行 scvxinstall ,一直等到該節點已完成其所有重新啟動後,再在另一個節點上啟動 scvxinstall

非英文語言環境的 SunPlex Agent Builder 的預設視窗大小太小 (4937877)

問題摘要: 在非英文語言環境中執行 SunPlex Agent Builder 時,預設的視窗大小太小,某些控制項可能不會顯示在視窗中。 在德語和西班牙語語言環境中已經發現此問題。

解決方法: 依需要,手動調整 SunPlex Agent Builder 視窗的大小。

在多個節點上同時執行 sccheck 時,該指令當機 (4944192)

問題摘要: 如果從多個節點同時啟動,sccheck 可能會當機。

解決方法: 請勿從任何將指令傳送至多個節點的多重主控台啟動 scchecksccheck 可以重疊執行,但不應同時啟動。

scinstall -r 不移除資料服務語言環境套裝軟體 (4955294)

問題摘要: scinstall -r 不移除特定語言環境的資料服務套裝軟體。

解決方法: 節點啟動之後,請執行 pkginfo | grep -i cluster 以確定已移除所有資料服務套裝軟體。 若要移除列出的套裝軟體,請對每個套裝軟體執行 pkgrm

在繁體中文語言環境中語言顯示不正確 (4955538)

問題摘要: 在繁體中文語言環境中,特定的 SunPlex Agent Builder 訊息以簡體中文顯示。

解決方法: zh_TW 語言環境中執行 SunPlex Agent Builder,以繁體中文正確顯示訊息。

連結至不正確的 Java 版本的 Java 二進位檔案導致 HADB 代理程式發生故障 (4968899)

問題摘要: 從 HADB 代理程式呼叫 hadbm 時,它將從 /usr/bin 中取得 Java 二進位檔案。 由於 /usr/bin 中的 Java 二進位檔案需要連結至適當的版本 Java 1.4 (或更高版本),因此 HADB 代理程式無法正常工作。

解決方法: 在程序檔 /opt/SUNWappserver7/SUNWhadb/4/bin/hadbm 中,使用適當的版本 Java 1.4 (或更高版本) 指定 JAVA_HOME 環境變數。

scsetup 無法將第一個配接卡加入至包含單一節點的叢集 (4983095)

問題摘要: 如果使用 scsetup 嘗試將第一個配接卡加入至包含單一節點的叢集,將產生以下錯誤訊息: 無法確定傳輸類型。

解決方法: 至少手動配置第一個配接卡:


# scconf -a -A trtype=type,name=nodename,node=nodename

配置第一個配接卡後,進一步使用 scsetup 以按預期的方式配置互連工作。

某些資料服務無法透過使用 scinstall 公用程式來進行升級

問題摘要: 以下應用程式的資料服務無法透過使用 scinstall 公用程式來進行升級:

解決方法: 如果您打算升級以上清單中某應用程式的資料服務,請使用以下步驟替代「Sun Cluster 軟體安裝指南 (適用於 Solaris 作業系統)」中的「升級至 Sun Cluster 3.1 4/04 軟體 (捲動)」中升級資料服務的步驟。 針對安裝資料服務的每個節點執行這些步驟。

  1. 移除要升級的資料服務的軟體套裝。


    # pkgrm pkg-inst
    

    pkg-inst 指定要升級的資料服務的軟體套裝名稱,如下表所列。

    應用程式 

    資料服務軟體套裝 

    Apache Tomcat 

    SUNWsctomcat

    DHCP 

    SUNWscdhc

    mySQL 

    SUNWscmys

    Oracle E-Business Suite 

    SUNWscebs

    Samba 

    SUNWscsmb

    SWIFTAlliance Access 

    SUNWscsaa

    WebLogic Server (英文語言環境) 

    SUNWscwls

    WebLogic Server (法語語言環境) 

    SUNWfscwls

    WebLogic Server (日文語言環境) 

    SUNWjscwls

    WebSphere MQ 

    SUNWscmqs

    WebSphere MQ Integrator 

    SUNWscmqi

  2. 安裝要升級至該版本的資料服務版本的軟體套裝。

    若要安裝軟體套裝,請依循 Sun Cluster 文件中有關要升級的資料服務的說明。 可以從 http://docs.sun.com 取得此文件。

HA Oracle 停止方法逾時 (4644289)

問題摘要: Sun Cluster HA for Oracle 資料服務使用超級使用者指令 su(1M) 來啟動與停止資料庫。 如果您執行的是 Solaris 8 或 Solaris 9,則當叢集節點的公用網路出現故障時,此網路服務可能會不可用。

解決方法: 將以下項目納入每個可能為 oracle_serveroracle_listener 資源的主節點之節點上的 /etc/nsswitch.conf 配置檔案中:

passwd: files
groups: files
publickey: files
project:  files

這些項目會確保 su 指令不參考 NIS/NIS+ 名稱服務,從而在網路發生故障期間,資料服務會正確啟動與停止。

SAP liveCache 停止方法逾時 (4836272)

問題摘要: Sun Cluster HA for SAP liveCache 資料服務使用 dbmcli 指令來啟動與停止 liveCache。 如果您執行的是 Solaris 9,則當叢集節點的公用網路發生故障時,網路服務可能會不可用。

解決方法: publickey 資料庫中的以下項目之一納入每個可能為 liveCache 資源的主節點之節點上的 /etc/nsswitch.conf 配置檔案中:

publickey: 
publickey:  files
publickey:  files [NOTFOUND=return] nis 
publickey:  files [NOTFOUND=return] nisplus

除了Sun Cluster Data Service for SAP liveCache Guide for Solaris OS中記錄的更新外,加入以上項目之一, 會確保 su 指令與 dbmcli 指令不參考 NIS/NIS+ 名稱服務。 繞過 NIS/NIS+ 名稱服務會確保在網路發生故障期間資料服務正確啟動與停止。

HA-Siebel 不會自動重新啟動發生故障的 Siebel 元件 (4722288)

問題摘要: Sun Cluster HA for Siebel 不監視個別 Siebel 元件。 如果偵測到 Siebel 元件故障,則僅在 syslog 中記錄一條警示訊息。

解決方法: 使用指令 scswitch -R -h node -g resource_group,重新啟動其中元件離線的 Siebel 伺服器資源群組。