Sun Cluster 3.0 版次注意事項

第 1章 Sun Cluster 3.0 版次注意事項

本文件針對 SunTM Cluster 3.0 軟體版次提供下列資訊:

本文件的附錄附有安裝計劃工作底稿以及範例,可供計劃安裝 Sun Cluster 3.0 軟體與資料服務時使用。Sun Cluster 3.0 AnswerBooksTM 也含有這些工作底稿。

新功能

本版次含有下列新功能:

支援的產品

本節描述 Sun Cluster 3.0 支援的軟體以及記憶體需求。

安裝 Sun Cluster AnswerBooks

Sun Cluster 3.0 使用者說明文件為 AnswerBook2 格式,可用於 AnswerBook2 說明文件伺服器。Sun Cluster 3.0 AnswerBook2 說明文件集包含:

設定 AnswerBook2 說明文件伺服器

Solaris 作業環境版次含有 AnswerBook2 說明文件伺服器軟體。Solaris 說明文件 CD-ROM 和 Solaris 作業環境 CD-ROM 分開,其中含有說明文件伺服器軟體。您需要 Solaris 說明文件 CD-ROM 才能夠安裝 AnswerBook2 說明文件伺服器。

如果您所在位置安裝了 AnswerBook2 說明文件伺服器,您可以在同一個伺服器使用 Sun Cluster 3.0 AnswerBooks。如果您未安裝 AnswerBook2 說明文件伺服器,請在您所在位置的機器上安裝說明文件伺服器。您用來當作叢集的管理介面的管理主控台,是當作說明文件伺服器的好選擇。請不要使用叢集節點當作 AnswerBook2 說明文件伺服器。

有關如何安裝 AnswerBook2 說明文件伺服器的完整資訊,請將 Solaris 說明文件 CD-ROM 載入到伺服器,然後檢視 README 檔。

檢視 Sun Cluster AnswerBooks

請使用下列程序,從 AnswerBook2 說明文件伺服器檢視 Sun Cluster 3.0 AnswerBooks。請將 Sun Cluster AnswerBook2 文件,安裝到和安裝說明文件伺服器相同伺服器的檔案系統上。Sun Cluster 3.0 AnswerBooks 含有後置安裝指令集(script),可將文件自動加到現有的 AnswerBook 檔案庫。

要使用這個程序,您需要下列:

如何安裝 Sun Cluster AnswerBooks

請使用這個程序來安裝 Sun Cluster 3.0 聚集以及 Sun Cluster 3.0 資料服務聚集的 Sun Cluster AnswerBook 套裝軟體。

  1. 以高階使用者(superuser)登入安裝有 AnswerBook2 說明文件伺服器的伺服器。

  2. 如果您之前安裝 Sun Cluster AnswerBooks,請移除舊的套裝軟體。

    如果您未曾安裝 Sun Cluster AnswerBooks,請忽略這個步驟。


    # pkgrm SUNWscfab SUNWscdab
    
  3. 將 Sun Cluster CD-ROM 或 Sun Cluster Data Services CD-ROM 插入連到說明文件伺服器的 CD-ROM 光碟機。

    「音量管理」常駐程式 vold(1M) 應該自動裝載 CD-ROM。

  4. 切換到含有要安裝之 Sun Cluster AnswerBook 套裝軟體的 CD-ROM 所在目錄。

    下列目錄含有 Sun Cluster CD-ROM 的套裝軟體:suncluster_3_0/SunCluster_3.0/Packages

    下列目錄含有 Sun Cluster Data Services CD-ROM 的套裝軟體:scdataservices_3_0/components/SunCluster_Data_Service_Answer_Book_3.0/Packages。

  5. 使用 pkgadd(1) 指令來安裝套裝軟體。


    # pkgadd -d .
    
  6. 選取要安裝的套裝軟體。

    選取 Sun Cluster 3.0 Collection(SUNWscfab)以及 Sun Cluster 3.0 Data Services Collection(SUNWscdab)。

  7. pkgadd 安裝選項功能表,選擇 heavy 來新增完整的套裝軟體到系統同時更新 AnswerBook2 型錄。

    選取 Sun Cluster 3.0 Collection(SUNWscfab)或 Sun Cluster 3.0 Data Services Collection(SUNWscdab)。

每一片 CD-ROM 所附的文件集含有後置安裝指令集,可將文件集加到說明文件伺服器的資料庫並重新啟動伺服器。您現在應該可以使用說明文件伺服器來檢視 Sun Cluster AnswerBooks。

檢視 PDF 檔

現在,Sun Cluster CD-ROM 在 Sun Cluster 的說明文件集中,針對每一本書包含了一個 PDF 檔。

Sun Cluster CD-ROM 的下列目錄中,含有 PDF 檔:./suncluster_3_0/SunCluster_3.0/Docs/locale/C/PDF

Data Services CD-ROM 的下列目錄中,含有 PDF 檔:./scdataservices_3_0/components/SunCluster_Data_Service_Answer_Book_3.0/Docs/locale/C/PDF

和 Sun Cluster AnswerBooks 發送方式類似,Sun Cluster CD-ROM 含有六個 PDF 檔,Data Services CD-ROM 含有一個 PDF 檔。每一個 PDF 檔的檔名是檔案所含書籍的縮寫。

表 1-2, "對應 PDF 縮寫至書籍標題," 顯示 PDF 檔名縮寫與書籍標題的對應。

表 1-2 PDF 縮寫至書籍標題的對應

CD-ROM 

PDF 縮寫 

書籍標題 

Sun Cluster 

CLUSTINSTALL

Sun Cluster 3.0 安裝手冊

CLUSTNETHW

Sun Cluster 3.0 Hardware Guide

CLUSTAPIPG

Sun Cluster 3.0 Data Services Developers' Guide

CLUSTSYSADMIN

Sun Cluster 3.0 系統管理手冊

CLUSTCONCEPTS

Sun Cluster 3.0 概念

CLUSTERRMSG

Sun Cluster 3.0 Error Messages Manual

資料服務 

CLUSTDATASVC

Sun Cluster 3.0 Data Services Installation and Configuration Guide

Sun Cluster 3.0 限制

以下限制適用於 Sun Cluster 3.0 版次:

支援的 Solaris 版次與修補資訊

請造訪網頁 http://sunsolve.sun.com 來取得支援的 Solaris 作業環境列表以及 Sun Cluster 3.0 必要的修補。請指定 EarlyNotifier 聚集以及搜尋條件 "Sun Cluster 3.0." 來執行簡單的搜尋以尋找 Sun Cluster 頁。

在安裝 Sun Cluster 3.0 以及應用任何修補到叢集元件(Solaris 作業環境、Sun Cluster、容體管理者或磁碟韌體)之前,請先閱讀 EarlyNotifier 資訊。所有的叢集成員必須在相同的修補層次,叢集才能夠正常作業。

請參閱 Sun Cluster 3.0 系統管理手冊 來取得特定的修補程序以及如何管理修補的提示。

系統管理與程序更新

本節說明用於管理用戶端之程序的變更與更新。

syncdir 選項變更

在 Beta 版,新增至 /etc/vfstab 必須指定 syncdir 選項。在 GA 版則不需要這種指定。 請參閱 Sun Cluster 3.0 安裝手冊Sun Cluster 3.0 概念 文件來取得本變更的詳細資訊。

專用主機名稱

在配置並啟動資料服務後不要使用 scsetup 公用程式變更專用主機名稱。儘管 scsetup 公用程式容許您變更專用主機名稱,但執行時請務必和 Sun 業務服務代表連絡。

已知問題

下列已知問題會影響 Sun Cluster 3.0 GA 版次的作業。請到 http://docs.sun.com 存取線上版次注意事項 來取得最新的已知問題資訊。

錯誤 ID 4314698

問題摘要: 安裝好 Solstice Disksuite 軟體後,必須執行 scgdevs(1M) 指令,Solstice Disksuite 裝置連結才會出現在整體名稱空間中。

解決方法: 請手動執行 scgdevs 指令來確定 Solstice Disksuite 裝置節點已經建立。

錯誤 ID 4346123

問題摘要: 在重複失敗後啟動叢集節點時,叢集檔案系統可能無法從本身 /etc/vfstab 登錄自動裝載成功,啟動處理可能會將節點放置在管理 shell 中。在該裝置執行 fsck 指令可能會產生下列錯誤。


# fsck -y /dev/global/rdsk/d1s7
** /dev/global/rdsk/d1s7
Can't roll the log for /dev/global/rdsk/d1s7

解決方法: 這個問題可能會在整體裝置和錯誤的叢集檔案系統裝載關聯時發生。 請執行下列指令,檢查檔案系統是否以錯誤狀態顯示,來確定是否發生錯誤的裝載。


# /usr/bin/df -k

如果整體裝置和錯誤的叢集檔案系統裝載有關聯,請解除裝載整體裝置。請注意,如果叢集節點有任何檔案系統使用者存在,則解除裝載不會成功。請對每一個節點執行下列指令來識別目前的檔案系統使用者。


# /usr/sbin/fuser -c mountpoint

另外,請執行 share(1M) 指令來確認檔案系統在任何叢集節點上都不是 NFS 共用。

錯誤 ID 4358349

問題摘要: 不要在含有 SharedAddress 資源的資源群組中建立 Sun Cluster HA for NFS 資源。Sun Cluster 軟體不支援在資料服務使用 SharedAddress 資源。

解決方法: 請新增所要的邏輯主機名稱資源到失效移管資源群組。

您必須使用這個步驟設定 LogicalHostname 資源。用於The hostname used with Sun Cluster HA for NFS 的主機名稱不可以是 SharedAddress 資源。


# scrgadm -a -L -g resource-group-name -l hostname,...
-a -L -g resource-group-name

指定要將邏輯主機名稱資源放置到其中的失效移管資源群組。

-l hostname,...

指定要新增的網路資源(邏輯主機名稱)。

錯誤 ID 4358629

問題摘要: 如果對 Sun Cluster 2.2 軟體建立的邏輯主機是使用 IP位址的號碼而不是主機名稱,那麼從 Sun Cluster 2.2 升級至 Sun Cluster 3.0 軟體可能會失敗,。

解決方法: 這個問題有二個解決方法:

錯誤 ID 4359321

問題摘要: scinstall 公用程式供您指定整體裝置檔案系統的 /global 目錄。不過,因為整體裝置檔案系統的裝載點是 /global/.devices/node@nodeid,所以不應該啟用這個規格。

解決方法: 請使用整體裝置檔案系統的正確名稱重新安裝節點。

修改 /etc/vfstab 檔中的登錄、重新啟動叢集,然後執行 scgdevs 指令是可行的解決方法,但不建議使用。請檢查每一個/etc/vfstab 檔中每一個 /global/.devices/node@nodeid 登錄是否已經設定整體裝載選項。

錯誤 ID 4362435

問題摘要: 當 Sun Cluster 3.0 模組載入到 Sun Management Center 2.1 主控台,而且要存取「資源類型定義->屬性表」的情況下,如果表格長度超過一頁,則不會載入。

解決方法: 請執行 scrgadm -pvv 指令來查看所有的資源類型屬性。

錯誤 ID 4362925

問題摘要:


nodeA# scshutdown -g0 -y
scshutdown: Unmount of /dev/md/sc/dsk/d30 failed: Device busy.
scshutdown: Could not unmount all PxFS filesystems.

Networker 套裝軟體已經在安裝 Oracle 時併入並安裝。因此,nsrmmd 常駐程式會執行並裝載至 /global/oracle 目錄,並防止所有的叢集檔案系統被解除裝載。


nodeA# umount /global/oracle
umount: global/oracle busy
nodeA# fuser -c /global/oracle
/global/oracle: nodeA# umount /global/oracle
umount: global/oracle busy
nodeA# fuser -c /global/oracle
/global/oracle: 335co 317co 302co 273co 272co
nodeA# ps -ef|grep 335
 root 335 273 0 17:17:41 ?       0:00 /usr/sbin/nsrmmd -n 1
 root 448 397 0 17:19:37 console 0:00 grep 335

這個問題會在 Sun Cluster 關機期間發生 - 當關機試圖解除裝載 nsrmmd 仍在參考的其處理程序的叢集檔案系統時。

解決方法: 請在每一個節點執行 fuser(1M) 指令,對於仍在使用無法解除裝載叢集的檔案系統,建立所有處理的清單。在失敗的 scshutdown(1M) 指令第一次執行後,請檢查沒有重新啟動「資源群組管理員」資源。請使用 kill -9 指令來刪除所有這些處理。這個除去清單未含有「資源群組管理員」控制的任何處理。在所有這種處理都結束後,請重新執行 scshutdown 指令,應該關機以成功完成這些處理。

錯誤 ID 4365310

問題摘要: 如果資源狀態變成 STOP_FAILED,您必須手動清除資源的 STOP_FAILED 旗號。如果您指定清除多個資源的旗號而有一個資源不是處於 STOP_FAILED 的狀態,功能會提早返回而不會清除其他列出資源的 STOP_FAILED 旗號。

在這種情況時不會顯示任何錯誤訊息,但其他資源的旗號不會被清除。沒有錯誤訊息會造成誤導,以為沒有失敗發生,但實際上在指令中列出的所有資源的 STOP_FAILED 狀態都未被清除。

解決方法: 要避免這個問題,請個別清除每一個 STOP_FAILED 狀態之資源的 STOP_FAILED 旗號。


# scswitch -c -f STOP_FAILED -j stopfailres -h phys-schost-1

錯誤 ID 4365700

問題摘要: 在下列範例中,用單一的指令停用同一個資源群組中的多個資源。


# scswitch -n -j r1,r2,r3

如果第一個資源進入 STOP_FAILED 狀態,其他資源可能會被停用但仍在線上。這種線上狀態表示「資源群組管理員」常駐程式的內部狀態無效而且會導致「資源群組管理員」常駐程式無法執行。

解決方法: 在停用資源時,每一個 scswitch(1M) 指令請務必只停用一個資源。

錯誤 ID 4365729

問題摘要: 試圖使用下列指令將裝置群組設成維護模態時,如果檔案系統裝載在指定的群組裝置上,那麼指令就會失敗。


# scswitch -m -D device-group

解決方法: 將設成維護模態之裝置群組上的所有檔案系統解除裝載。在裝置群組其中的裝置都未被使用的情況下,才能夠設成維護模態,這表示該裝置群組中沒有任何作用中的使用者,且所有依存的檔案系統都未裝載。

錯誤 ID 4366840

問題摘要: 當某個節點關機時,若其叢集的電纜或關聯的配接卡或中繼連接被拔下,在節點重新啟動並試圖重新加入叢集時執行會失敗。

解決方法: 在更正這個錯誤之前,請在節點關機時拔下電纜、配接卡或中繼連接。如果您遇到這個錯誤,請稍後重新啟動節點。節點將可以加入叢集而不發生錯誤。

錯誤 ID 4366886

問題摘要: 系統負荷太重時可能會影響裝置群組進入線上狀態。出現這個問題的原因是 VERITAS 容體管理者(VxVM)必須執行許多作業如鏡映同步,才能夠匯入磁碟群組。負荷太重時,這些作業可能無法及時完成,因為其他作業仍在佔用重要的系統資源。由於裝置群組通常會在節點啟動時自動連線(例如,如果檔案系統設成自動裝載的話),這種線上當機可能會將本身明確標示為啟動時當機。

解決方法:降低系統負載或增加 vxconfigd 常駐程式的優先權。

錯誤 ID 4368034

問題摘要: 如果「資源群組管理員」常駐程式已經中止執行,或節點在遠程程序呼叫期間當機,系統主控台可能會顯示下列一個錯誤訊息。


COMM_FAILURE SystemException: COMM_FAILURE major 3 minor 0 Error 0 completed NO

INV_OBJREF SystemException: INV_OBJREF major 4 minor 9 Bad file number completed NO

這些訊息的目的是偵錯而不是困惑用戶。「資源群組管理員」常駐程式已經針對這些例外狀況寫下更清楚的 syslog 訊息,因此不需要偵測用的 printf

解決方法: 請忽略這些主控台訊息。請查詢與節點當機相關的 syslog 訊息。通常,「資源群組管理員」常駐程式可從這種事件自動回復。

錯誤 ID 4369228

問題摘要: Oracle 提供的 dbassist 公用程式無法直接在硬體 RAID 裝置建立 Oracle Parallel Server 資料庫。

解決方法: 請使用 Oracle Server Manager 行模態指令在 Sun Cluster 3.0 軟體建立 svrgmrl Oracle Parallel Server 資料庫。

錯誤 ID 4369565

問題摘要: nfs_upgrade 指令集不等冪。您不可以執行指令集二次。

解決方法: 如果您要執行指令集二次,請先移除第一次建立的 NFS 資源與 NFS 資源類型,然後再執行第二次指令集。

錯誤 ID 4369668

問題摘要: 當系統管理者在編輯受管理資源群組 Nodelist 的屬性時,「資源群組管理員」應該對資源群組中所有具有 Init_nodes=RG_PRIMARIES 屬性的資源,以及已經加到節點清單中的所有節點執行 INIT 方法。「資源群組管理員」應該對這些資源以及從 list.Similarly 刪除的節點執行 FINI 方法,如果資源類型的 Installed_nodes 屬性已經被編輯,則「資源群組管理員」應該對所有常駐在受管理資源群組以及具有 Init_nodes=RT_installed_nodes 屬性的資源,執行 INIT or FINI 方法。

目前,當執行這些更新時,「資源群組管理員」不會執行 INITFINI 方法。結果是,這些節點上的資源可能無法正確起始設定或清除。

解決方法: 請使用 scswitch 指令來解除管理,然後重新管理受影響的資源群組。不幸的是,這個程序要求管理者將資源群組設成離線。 另外,如果在文件裡有群組中資源類型的程序說明,管理者可以手動執行同義的 INITFINI 動作(不必解除管理資源群組)。

如果群組中沒有任何資源具有 INITFINI 方法,則這個解決方法是不必要的。唯一由 Sun 提供且使用 INITFINI 方法的資源類型如下:

用戶或協力廠商實作的資源類型也可能使用 INITFINI 方法。如果是這樣,則含有這種資源類型的資源群組都需要這個解決方法。


註解 -

所有可延伸服務都隱含使用 INITFINI 方法,即使是未對該資源類型明確宣告這種方法。


錯誤 ID 4370760

問題摘要: 您必須先將裝置群組設成離線,才能夠從中繼組(metaset)移除最後一個主機。

解決方法: 要從中繼組移除最後一個主機,請先將裝置群組設成離線。要移除最後一個主機,請從要移除的主機以高階使用者(superuser)身份執行以下二個指令。


# /usr/cluster/bin/scswitch -m -D disksetname
# metaset -s disksetname -d -h hostname

錯誤 ID 4371236

問題摘要: 有些 ge 切換要求某些 ge 裝置參數設定必須與預設值不同。Sun GigabitEthernet/P 2.0 Adapter Installation and User's Guide 的第 3 章說明 ge 裝置參數的變更程序。用於執行 Sun Cluster 3.0 軟體之節點的程序和手冊中的描述稍有差別。差異點在於 /etc/path_to_inst 檔中的裝置路徑名稱如何找出用於 ge.conf 檔的母項名稱。

解決方法: Sun GigabitEthernet/P 2.0 Adapter Installation and User's Guide 第 3 章說明透過 /kernel/drv/ge.conf 檔中的登錄來變更 ge 裝置參數值的程序。 從 /etc/path_to_inst 列表(用於 ge.conf 登錄)判斷母項名稱的程序出現在第 24 頁:"Setting Driver Parameters Using a ge.conf File"(使用 ge.conf 檔設定磁碟機參數)。例如,從下列 /etc/path_to_inst 行,您可以判斷 ge2 的母項名稱是 /pci@4,4000


"/pci@4,4000/network@4" 2 "ge"

在叢集節點,您必須先刪除 /etc/path_to_inst 中裝置路徑內的 /node@nodeid 字首,才能夠使用該字首當作母項名稱。 例如,在叢集節點,同義的 /etc/path_to_inst 登錄可能有下列登錄。


"/node@1/pci@4,4000/network@4" 2 "ge"

要用於 ge.confge2 的母項名稱仍然是 /pci@4,4000

錯誤 ID 4372369

問題摘要: Sun Cluster 2.2 軟體中配置多個邏輯主機時,nfs_upgrade 指令集不運作。

解決方法: 目前沒有解決方法。如果您遇到這個問題,請向 Sun Service 提供者要求修補。

錯誤 ID 4373498

問題摘要: LDAP 管理伺服器有區分主機名稱的大小寫。因此,在使用 LDAP 管理伺服器時,LDAP 配置中指定的所有主機名稱大小寫,必須和叢集節點上使用中之名稱服務中的 LDAP 指定相同。如果 DNS 是使用中的名稱服務,則這種大小寫相符非常重要,因為 DNS 領域名稱的大小寫必須和 LDAP 配置中的主機名稱指定完全相符。

解決方法: 請確定提供給 LDAP 之機器的完整領域名稱的大小寫,和解析器傳回的網路名稱的大小寫完全相符。

錯誤 ID 4373911

問題摘要: 如果您執行下列:

HA-NFS 失效監視器可能顯示下列警告訊息。


clnt_tp_create_timed of program statd failed:RPC:Program not registered

解決方法: 不必解決。您可以放心地忽略警告訊息。

錯誤 ID 4374194

問題摘要: Sun Management Center 代理程式可能會在具有 Sun StorEdge A5000 之 UltraTM 2 工作站非預期結束。 問題會在使用「Config Reader」設定 Sun Management Center 代理程式,而且 Config-Reader4udt 模組加到 /var/opt/SUNWsymon/cfg/base-modules-d.dat 檔後發生。Sun Management Center 代理程式會在啟動時讀取這個檔案,然後嘗試載入所有列出的模組。在嘗試載入 Config-Reader4udt 模組時,代理程式可能會發生分段錯誤。

解決方法: 要避免這個問題,請執行下列步驟:

錯誤 ID 4374648

問題摘要: scinstall 線上援助頁目前有一個範例使用 -s oracle 自動將 Sun Cluster HA for Oracle 資料服務從 Sun Cluster 2.2 升級至 Sun Cluster 3.0 軟體。目前不支援這個選項。

解決方法:請不要使用 -s oracle 選項將 Oracle 資料服務從 Sun Cluster 2.2 升級至 Sun Cluster 3.0 軟體。相反地,請改用手動升級程序 "Sun Cluster HA for Oracle 從 Sun Cluster 2.2 升級至 Sun Cluster 3.0 軟體"

錯誤 ID 4376171

問題摘要: 在同一個 SBus 上安裝 FC-AL SBus Card(FC100/S)與 Sun Quad FastEthernetTM 2.0(SQFE/S)可能會在 QFE 卡上造成非預期的重新設定。

解決方法: 請避免在同一個 SBus 上配置具有 FC-AL SBus Card(FC100/S)以及 Sun Quad FastEthernet 2.0(SQFE/S)的叢集節點。

錯誤 ID 4377303

問題摘要: 新建的 Sun StorEdge A3500 LUNs 不會在所有節點上以固定格式出現。

解決方法: 請在看不到新 LUNs 的節點執行 /etc/raid/bin/hot_add 指令。

錯誤 ID 4378553

問題摘要: 資源群組的 Nodelist 屬性是一個已排序的節點(可管理資源群組)列表,最偏好的節點排列在第一個。「資源群組管理員」應該永遠在可用之最偏好節點上主控資源群組。不過,當管理者重新啟動叢集(當所有節點立即啟動)時,受管理的資源群組可能會在最偏好以外的節點上停止主控。這個問題只會在重新啟動整個叢集時出現。

解決方法:在重新啟動叢集後,請使用 scswitch 指令將資源群組在所需的節點上切換。Nodelist只要叢集維持開機,喜好設定次序將從該點開始往前自動執行。

可延伸服務的嚴格負荷-平衡策略

目前,當您執行使用嚴格負荷-平衡策略的可延伸資料服務時,可能會遇到問題。如果服務是以依相對於特定節點建立的嚴格性執行,而且以後您在其他節點啟動同一服務的其他實例時,便會發生問題。啟動同一服務的其他實例可能會導致第一個實例失去本身的嚴格性。

第二個實例啟動時傳回的嚴格演算法可判斷第一個實例是否失去本身的嚴格性。在這種情況下,演算法不會變更嚴格的特性,但有時候演算法確實會變更嚴格的特性。

請參閱 Sun Cluster 3.0 概念 來取得嚴格負荷平衡策略的詳細資訊。

Sun Cluster HA for Oracle 從 Sun Cluster 2.2 升級至 Sun Cluster 3.0 軟體

請在使用 scinstall 升級程序升級 Sun Cluster 組織架構時執行這些程序。

條件與限制

下列條件與限制適用 Sun Cluster HA for Oracle 從 Sun Cluster 2.2 升級至 Sun Cluster 3.0 軟體。

如何儲存 Sun Cluster HA for Oracle 配置檔

請使用下列程序來儲存 Sun Cluster 2.2 配置的配置檔。

  1. 請依 scinstall 組織架構升級程序執行,直到您在每一個節點上完成升級-開始步驟(scinstall -F begin)為止。

  2. 以高階使用者(superuser)使用者身份執行下列指令。這個指令可儲存一份 /var/opt/oracle 目錄中所有檔案的副本。

    為了確保這個資訊不會漏失,請將 /var/opt/oracle 目錄中找到的結構備份到其他外部裝置。


    # cp -r /var/opt/oracle /var/cluster/logs/install/preserve/2.2/SUNWscor
    
  3. 完成組織架構升級的完成部份(scinstall -u finish)。


    註解 -

    請不要在 scinstall -u finish 指令使用 -s oracle 選項。這個選項會試圖執行 Sun Cluster HA for Oracle 自動化升級,但自動化升級會失敗。只有 NFS 才支援自動化升級。


完成組織架構升級後,請設定 Sun Cluster 3.0 環境。下一節 "設定 Sun Cluster 3.0 環境" 說明這個程序。

設定 Sun Cluster 3.0 環境

請執行下列步驟來設定 Sun Cluster 3.0 環境。

  1. 在一個開啟的節點執行下列指令來驗證:

    • 組織架構升級正確設定一個對應至每一個 Sun Cluster 2.2 邏輯主機的 Sun Cluster 3.0 資源群組。

    • 主機名稱網路資源在資源群組中,而且在線上狀態。


    # scstat -g
    
  2. 在某個節點上,執行下列指令來確認 VERITAS 磁碟群組或 Sun Cluster 2.2 中存有 Oracle 資料庫(可能是 Oracle 二進位資料)的 Solstice DiskSuite 磁碟組正確對映到 Sun Cluster 3.0 磁碟裝置群組。


    # scstat -D
    
  3. 在每一個節點,執行下列指令來驗證每一個 Oracle 實例所需的檔案系統都已裝載。


    # mount
    
  4. 在每一個節點,執行下列指令來回復儲存的 Oracle 配置檔到 /var/opt 目錄。

    如果您在程序中曾先儲存 /var/opt/oracle 目錄中的檔案,且檔案保持不變,那麼您可以略過這個步驟。


    # cp -r /var/cluster/logs/install/preserve/2.2/SUNWscor/oracle /var/opt
    # chown -R oracle:dba /var/opt/oracle
    

在 Sun Cluster 3.0 下 配置 Sun Cluster HA for Oracle

請使用下列程序配置 Sun Cluster 3.0 HA for Oracle。


註解 -

步驟 1 只要執行一次即可。


  1. 在某個節點上,使用下列指令登錄 Oracle 伺服器與接收程式資源類型。


    # scrgadm -a -t SUNW.oracle_server
    # scrgadm -a -t SUNW.oracle_listener
    

    請對 /var/opt/oracle/oratab 檔中列出的每一個Sun Cluster 2.2 HA for Oracle 實例執行 步驟 2步驟 5

  2. 判斷 oratab 檔中 ORACLE_HOME 變數的值。

    例如,假設 oratab 檔顯示下列資訊。


    ora32:/oracle/816_32:N

    這個資訊表示 ORACLE_SID ora32 實例ORACLE_HOME 變數的值為 /oracle/816_32

  3. ccd.database 檔取得每一個 Oracle 實例的參數值。

    這些參數會將 Sun Cluster 3.0 參數對應到 scrgadm。您在 Sun Cluster 3.0 下配置 Sun Cluster HA for Oracle 時必須使用這些參數。


    # grep ^HAORACLE: /var/cluster/logs/install/preserve/2.2/SUNWcluster/conf/ccd.database
    

    ccd.database 檔中的每一個 Oracle 實例的格式如下。


    HAORACLE:on:ora32:boots-1:60:10:120:300:scott/tiger:/oracle/816_32/dbs/initora32.ora:ORA_LIST

    這些參數對應到下列 Sun Cluster 3.0 格式。


    HAORACLE:STATE:ORACLE_SID:LOGICAL_HOSTNAME_IP_Resource:THOROUGH_PROBE_INTERVAL:
        CONNECT_CYCLE:PROBE_TIMEOUT:RETRY_INTERVAL:CONNECT_STRING:PARAMETER_FILE:LISTENER_NAME

    資源群組名稱 RG_NAME 將會是 ${LOGICAL_HOSTNAME_IP_Resource}-lh。請注意,-lh 將自動附加到 Sun Cluster 3.0 中的資源群組名稱中。

  4. $PARAMETER_FILE 變數中找到 background_dump_dest 值,同時將 ALERT_LOG_FILE 變數設成下列值。


    $background_dump_dest/alert_$ORACLE_SID.log

    例如,在 ORACLE_SID=ora32,假設在 $PARAMETER_FILE 檔中,background_dump_dest 的值如下。


    /oracle/816_32/admin/ora32/bdump

    在這個範例,ALERT_LOG_FILE 應該更新為下列值。


    /oracle/816_32/admin/ora32/bdump/alert_ora32.log
    

  5. 在某個節點上,執行下列指令來建立 Oracle 資源並設成連線。


    # scrgadm -a -t SUNW.oracle_server -g $RG_NAME -j $ORACLE_SID-serv \
    -x Oracle_sid=$ORACLE_SID -x Oracle_home=$ORACLE_HOME \ 
    -y Thorough_probe_interval=$THOROUGH_PROBE_INTERVAL \ 
    -x Connect_cycle=$CONNECT_CYCLE -x Probe_timeout=$PROBE_TIMEOUT \ 
    -y Retry_interval=$RETRY_INTERVAL -x Connect_string=$CONNECT_STRING \ 
    -x Parameter_file=$PARAMETER_FILE -x Alert_log_file=$ALERT_LOG_FILE
    # scrgadm -a -j $ORACLE_SID-list -t SUNW.oracle_listener -g $RG_name \ 
    -x Oracle_home=$ORACLE_HOME -x Listener_name=$LISTENER_NAME
    # scswitch -e -j $ORACLE_SID-serv
    # scswitch -e -j $ORACLE_SID-list
    # scswitch -e -M -j $ORACLE_SID-serv
    # scswitch -e -M -j $ORACLE_SID-list
    

    例如,使用 步驟 2步驟 3 以及 步驟 4 中描述的 Oracle 實例時,要執行下列指令。


    # scrgadm -a -t SUNW.oracle_server -g boots-1-lh -j ora32-serv \ 
    -x Oracle_sid=ora32 -x Oracle_home=/oracle/816_32 \ 
    -y Thorough_probe_interval=60 \ 
    -x Connect_cycle=10 -x Probe_timeout=120 \ 
    -y Retry_interval=300 -x Connect_string=scott/tiger \ 
    -x Parameter_file=/oracle/816_32/dbs/initora32.ora \ 
    -x Alert_log_file=/oracle/816_32/admin/ora32/bdump/alert_ora32.log
    # scrgadm -a -j ora32-list -t SUNW.oracle_listener -g boots-1-lh \ 
    -x Oracle_home=/oracle/816_32 -x Listener_name=ORA_LIST
    # scswitch -e -j ora32-serv
    # scswitch -e -j ora32-list
    # scswitch -e -M -j ora32-serv
    # scswitch -e -M -j ora32-list
    

驗證升級

請執行下列步驟來驗證升級已經成功完成。

  1. 使用下列指令來確認 Oracle 資源在線上。


    # scstat -g
    

  2. 驗證您可以使用下列指令來切換資源群組。


    # scswitch -z -g resource-group -h node
    

已知的說明文件的問題

本節討論說明文件可能的錯誤,以及更正這些錯誤的步驟。

安裝指南

Sun Cluster 3.0 安裝手冊 含有下列說明文件錯誤:

硬體指引

Sun Cluster 3.0 Hardware Guide,下列程序不正確或不存在:

如何移動磁碟電纜到新的配接卡

請使用下列程序,在一個節點內移動磁碟電纜到新的配接卡。

  1. 停止受影響磁碟的所有 I/O 活動。

  2. 拔下舊配接卡上的所有電纜。

  3. 在區域節點執行 cfgadm(1M) 指令來解除受移動影響之所有磁碟機的配置。

    或者,使用下列指令重新啟動節點。


    # reboot -- -r
    
  4. 在區域節點執行 devfsadm -C 指令來整理 Solaris 裝置連結。

  5. 在區域節點執行 scdidadm -C 指令來整理 DID 裝置路徑。

  6. 將電纜連線到新的配接卡。

  7. 在區域節點執行 cfgadm 指令,以便在新位置配置磁碟機。

    或者,使用下列指令重新啟動節點。


    # reboot -- -r
    
  8. 執行 scgdevs 指令來新增 DID 裝置路徑。

如何將磁碟電纜從某個節點移動至另一個

請使用下列程序將磁碟電纜從某個節點移到另一個節點。

  1. 從所有容體管理者以及資料服務配置中,刪除您要移除路徑的參照。

  2. 停止受影響磁碟的所有 I/O 活動。

  3. 拔下舊節點的電纜。

  4. 在舊的節點執行 cfgadm 指令來解除受移動影響之所有磁碟機的配置。

    或者,使用下列指令重新啟動節點。


    # reboot -- -r
    
  5. 在舊節點執行 devfsadm -C 指令來整理 Solaris 裝置連結。

  6. 在舊節點執行 scdidadm -C 指令來整理 DID 裝置路徑。

  7. 將電纜連到新的節點。

  8. 在新節點執行 cfgadm 指令,以便在新位置配置磁碟機。

    或者,使用下列指令重新啟動節點。


    # reboot -- -r
    
  9. 在新節點執行 devfsadm 指令來建立新的 Solaris 裝置連結。

  10. 在新節點執行 scgdevs 指令來新增新的 DID 裝置修補。

  11. 在新節點新增必要容體管理者的路徑以及資料服務配置。

    配置資料服務時,請檢查您的節點失效移管個人喜好已經設成反應新的配置。

如何更新叢集軟體來反應適當的裝置配置

如果您未正確依循上述程序,您下一次執行 scdidadm -r 指令或 scgdevs 指令時可能會有錯誤被記錄下來。要更新叢集軟體以反應適當的裝置配置,請執行下列步驟。

  1. 確定電纜配置符合您的需要。確定已從舊節點拔下電纜。

  2. 確定已經從必要的容體管理者或資料服務配置移除舊節點。

  3. 在舊的節點執行 cfgadm 指令來解除受移動影響之所有磁碟機的配置。

    或者,使用下列指令重新啟動節點。


    # reboot -- -r
    
  4. 在您拔下電纜的節點執行 devfsadm -C 指令。

  5. 在您拔下電纜的節點執行 scdidadm -C 指令。

  6. 在新節點執行 cfgadm 指令,以便在新位置配置磁碟機。

    或者,使用下列指令重新啟動節點。


    # reboot -- -r
    
  7. 在新節點執行 scgdevs 指令來新增新的 DID 裝置修補。

  8. 在新節點執行 scdidadm -R device 指令來確定 SCSI 的保留項目都在正確的狀態。

資料服務設計人員指南

Sun Cluster 3.0 Data Services Developers' Guide 的附錄 B 有二個已知問題:

概念指南

請注意下列 Sun Cluster 3.0 概念 相關各點:

使用應用程式通訊的叢集交互連接

叢集在節點之間必須具備多網路連接,以形成叢集交互連接。叢集軟體可使用多交互連接來達到高可用性以及增進效能。在內部通訊(例如,檔案系統資料或可延伸服務資料),訊息是以輪流的方式分送到所有可用的交互連接。.

叢集交互連接也可以用於應用程式,以便在節點之間建立高可用性通訊。例如,分散式應用程式可能會有元件在多個需要通訊的節點上執行。如果使用叢集交互連接而不是公用交互連接,可以防制個別連結的失效。

要在節點之間使用叢集交互連接進行通訊,應用程式必須使用安裝叢集時配置的專用主機名稱。例如,如果節點 1 的專用主機名稱是 clusternode1-priv,請使用該名稱當作節點 1 的叢集交互連接的通訊。使用這個名稱開啟的 TCP socket 可在叢集交互連接中被傳遞(route),如果網路失效還可以再被傳遞。

請注意,由於專用主機名稱可以在安裝時配置,因此叢集交互連接可使用當時選取的任何名稱。可使用 scha_privatelink_hostname_node 引數來從 scha_cluster_get(3HA) 取得實際名稱。

在應用程式層次使用叢集交互連接時,每一對節點之間使用單一的交互連接,但若可能的話,不同的節點配對之間應使用個別的交互連接。例如,考慮到有應用程式在三個節點上執行,而且透過叢集交互連接來進行通訊的狀況。節點 1 與 2 之間的通訊可能透過 hme0 介面,節點 1 與 3 之間的通訊則可能透過介面 qfe1。也就是說,任意二個節點之間的應用程式通訊將限制於單一交互連接,內部叢集通訊則散置在所有的交互連接。

請注意,應用程式和內部叢集通訊共用交互連接,因此應用程式可用的頻寬是由其他叢集通訊所使用的頻寬來決定。在發生失效時,內部通訊可以在其餘交互連接中做循環(round-robin),而失效連接上的應用程式也可以切換到運作的交互連接。

有二種類型的位址支援叢集交互連接,gethostbyname(3N) 上的專用主機名稱通常會傳回二個 IP 位址。第一個位址稱為邏輯 pairwise 位址,第二個位址稱為邏輯 pernode 位址

每一對節點會指派個別的邏輯 pairwise 位址。這個小型邏輯網路支援連接的失效移管。每一個節點還會指派一個固定的 pernode 位址。也就是說,每一個節點的 clusternode1-priv 的邏輯 pairwise 位址都不一樣,每一個節點上的 clusternode1-priv 的邏輯 pernode 位址都相同。節點沒有本身的 pairwise 節點,因此節點 1 上的 gethostbynameclusternode1-priv)將只傳回邏輯 pernode 位址。

請注意,接受透過叢集交互連接之通訊,並依安全理由而驗證 IP 位址的應用程式,必須針對 gethostbyname 傳回的所有 IP 位址進行檢查,而不只是針對第一個 IP 位址。

如果您要求應用程式各個點都是一致的 IP 位址,請將應用程式配置為在客戶端以及伺服器都是鏈結到 pernode 位址,這樣所有的連接看起來都會是透過 pernode 位址往來。

資料服務安裝與配置指南

Sun Cluster 3.0 Data Services Installation and Configuration Guide 的第 5 章 " 安裝與配置 Sun Cluster HA for Apache" 描述如何從 Apache 網站(http://www.apache.org)安裝 Apache Web Server 的程序。不過,您也可以從 Solaris 8 作業環境 CD-ROM 安裝「Apache Web Server」。

Apache 二進位檔案包含在三個套裝軟體中-SUNWapchrSUNWapchuSUNWapchd-它們構成 SUNWCapache 套裝軟體的中繼叢集。您必須先安裝 SUNWapchr 再安裝 SUNWapchu

請將全球資訊網伺服器二進檔,放置在每一個叢集節點的區域檔案系統,或叢集檔案系統上。

從 Solaris 8 CD-ROM 安裝 Apache

本程序敘述 Sun Cluster HA for Apache 資料服務用於 Solaris 8 作業環境 CD-ROM 上之 Apache Web Server 版本的必要步驟。

  1. 如果尚未安裝,請安裝 Apache 套裝軟體 SUNWapchrSUNWapchu 以及 SUNWapchd

    請使用 pkginfo(1) 來判斷套裝軟體是否已經裝妥。


    # pkgadd -d Solaris 8 Product directory SUNWapchr SUNWapchu SUNWapchd
    ...
    Installing Apache Web Server (root) as SUNWapchr
    ...
    [ verifying class initd ]
    /etc/rc0.d/K16apache linked pathname
    /etc/rc1.d/K16apache linked pathname
    /etc/rc2.d/K16apache linked pathname
    /etc/rc3.d/S50apache linked pathname
    /etc/rcS.d/K16apache linked pathname
    ...
  2. 我們剛剛安裝了控制指令集,作為 SUNWapchr 套裝軟體的一部份,現在將啟動及停止執行控制指令集關閉。

    停止這些指令集是必要的,因為 Sun Cluster HA for Apache 資料服務會在資料服務完成配置後啟動與停止 Apache 應用程式。請執行下列步驟:

    1. 列出 Apache 執行控制指令集。

    2. 變更 Apache 執行控制指令集的名稱。

    3. 確定所有 Apache 相關的指令集(script)都已經更名。


    註解 -

    以下範例將執行控制指令集名稱的第一個字母從大寫改成小寫。不過,您可以將指令集的名稱變更,使其與您實際管理時使用的名稱一致。



    # ls -1 /etc/rc?.d/*apache
    /etc/rc0.d/K16apache
    /etc/rc1.d/K16apache
    /etc/rc2.d/K16apache
    /etc/rc3.d/S50apache
    /etc/rcS.d/K16apache
    # mv /etc/rc0.d/K16apache /etc/rc0.d/k16apache
    # mv /etc/rc1.d/K16apache /etc/rc1.d/k16apache
    # mv /etc/rc2.d/K16apache /etc/rc2.d/k16apache
    # mv /etc/rc3.d/S50apache /etc/rc3.d/s50apache
    # mv /etc/rcS.d/K16apache /etc/rcS.d/k16apache
    # ls -1 /etc/rc?.d/*apache
    /etc/rc0.d/k16apache
    /etc/rc1.d/k16apache
    /etc/rc2.d/k16apache
    /etc/rc3.d/s50apache
    /etc/rcS.d/k16apache

線上援助頁

每一個和Sun Cluster 3.0軟體一起提供的資料服務都含有線上援助頁。資料服務線上援助頁包括:SUNW.apache(5)、 SUNW.dns(5)、 SUNW.iws(5)、 SUNW.nfs(5)、 SUNW.nsldap(5)、 SUNW.oracle_listener(5)、 SUNW.oracle_server(5)、 SUNW.HAStorage(5)以及scalable_service(5)。 這些線上援助頁說明這些資料服務使用的標準與擴充屬性。

Sun Management Center GUI 已知問題

本節說明 Sun Management Center GUI 的 Sun Cluster 3.0 模組已知問題。

Sun Management Center 無法辨識某些類型的 Ultra Server

症狀

問題確認/開始解決

  1. 關閉詳細資訊視窗。

  2. 從 Sun Management Center 視窗,選擇「檔案->主控台訊息」。

  3. 連按兩下表示無法辨識之叢集節點的圖像。

  4. 在主控台訊息視窗中尋找下列這一行 ...family definition file missing for...

解決方法

  1. 在 Sun Management Center 伺服器,切換到含有系列檔案的目錄。


    # cd /opt/SUNWsymon/classes/base/console/cfg
    

  2. 建立最接近之可用 family-j.x 檔的符號連接。

    例如,如果遺失檔案的該行顯示 ...missing for sun4u-Sun-Ultra-450-family-j.x...,請建立 sun4u-Sun-Enterprise-450-family-j.xsun4u-Sun-Ultra-450-family-j.x 的連結。


    # ln -s sun4u-Sun-Enterprise-450-family-j.x sun4u-Sun-Ultra-450-family-j.x
    
  3. 結束主控台並重新啟動。

判斷名稱與符號連接的替代方法

  1. 連按兩下無法辨識的叢集節點,來顯示其詳細資訊視窗。

  2. 按一下「資訊」標籤。

  3. 在「屬性」表中尋找「實體系列」登錄。

    值可能會被截斷,因此,請讓滑鼠指標停留在值欄位上。完整的名稱(例如,sun4u-Sun-Ultra-450)將會出現在工具提示中。

  4. 附加 -family-j.x 以判斷要建立的連結名稱。