計畫性和非計畫性停機解決方案
您的 PeopleSoft 環境中可能會發生計畫性和非計畫性停機。瞭解可用於將應用程式停機時間降到最低的 Oracle 解決方案。將 PeopleSoft 應用程式的停止工作時間降到最低是根據應用程式,而不是個別元件的停止工作時間。
非預定的中斷解決方案
下列是 PeopleSoft 環境中系統或人為故障可能造成的非計畫性停機類型,以及可用來復原和維持最短停機時間的技術解決方案。
我們建議您測試下方的基本案例,以確保這些案例在您的環境中正確設定,並讓您有信心能夠在發生緊急情況時採取行動。
中斷類型 | Oracle 解決方案 | 優點 | 復原時間 |
---|---|---|---|
負載平衡器 | 軟體負載平衡器,在本機複製組態 | 順暢地將連線移轉至存留的負載平衡器 | 無停止工作時間。 |
PeopleSoft PIA Web 伺服器節點或元件失敗 | 沒有 Coherence*Web 快取伺服器叢集的備援 Web 伺服器 | 連線會重新分配至存留的節點。存留的節點繼續處理。 | 無停止工作時間。可能需要重新驗證和重新提交工作。 |
PeopleSoft PIA Web 伺服器節點或元件失敗 | 具有 Coherence*Web 快取伺服器叢集的備援 Web 伺服器 | 連線會重新分配至存留節點,保留階段作業狀態。存留的節點繼續處理。 | 沒有停機時間,也沒有重新驗證或重新提交工作。 |
PeopleSoft 應用程式網域伺服器節點或元件失敗 |
備援的應用程式網域伺服器 PIA 伺服器在應用程式伺服器間設定主動連線負載平衡,將工作重新提交至存留的應用程式伺服器。 |
連線會重新分配至存留的節點。存留的節點會挑選要求,不會遺失相關資訊環境 | 無停止工作時間。 |
資料庫伺服器或執行處理失敗 | Oracle RAC、Application Continuity、FAN 事件 | 自動復原失敗執行處理上的工作 – 階段作業通透地容錯移轉,會自動重新送出更新 | 秒至分鐘。 |
站點失敗 | Oracle Data Guard, rsync | 最少到沒有資料遺失的完整網站容錯移轉 | 決策後不到 10 分鐘,適用於資料庫角色轉換、檔案系統掛載及 PeopleSoft 應用程式啟動。 |
儲存失敗 | ASM | 鏡射和自動重新平衡。 | 無停止工作時間。 |
儲存失敗 | Oracle RMAN 使用瞬間復原區域。 | 完整管理的資料庫復原和以磁碟為基礎的備份。 | 分鐘至小時。 |
儲存失敗 | 區域本機 Oracle 物件儲存 | 雲端管理的資料庫復原和以磁碟為基礎的備份 | 分鐘至小時。 |
儲存失敗 | Oracle Data Guard, rsync | 完整網站容錯移轉,只需最少的資料遺失即可。 | 決策後不到 10 分鐘,適用於資料庫角色轉換、檔案系統掛載及 PeopleSoft 應用程式啟動。 |
人為錯誤 | 具備倒溯資料庫的 Oracle Data Guard。 | 研究文案 (待命) | 小時 (透過資料修正進行研究)。 |
資料損毀 | Oracle RMAN 提供快速復原區域。 | 線上區塊媒體復原和受管理的磁碟式備份。 | 分鐘至小時。 |
資料損毀 | Oracle Active Data Guard | 使用實體待命資料庫自動偵測並修復損毀的區塊。 | 應用程式完全沒有停機時間。 |
資料損毀 | Oracle Data Guard | 自動驗證並重新傳輸損毀的重做區塊 | 應用程式完全沒有停機時間。 |
資料損毀 | Oracle Data Guard 中介 | 快速容錯移轉至本機待命資料庫,或將完整網站容錯移轉至 DR 網站。 |
本機待命:決定後不到 5 分鐘,適用於資料庫角色轉換、檔案系統掛載及 PeopleSoft 應用程式啟動。 完整網站容錯移轉:做出決策後不到 10 分鐘,適用於資料庫角色轉換、檔案系統掛載及 PeopleSoft。 |
附註:
可能從主要站台的故障快速復原,並在該處恢復操作,這可能比切換到次要站台更不會對整體操作造成干擾。因此,在上表中,我們提到了決定進行容錯移轉,以及在做出決策後,預期執行指令碼轉換的時間。如果您決定在容錯移轉至 DR 網站之前不需要人為決策,則會在資料庫中設定「快速啟動容錯移轉」。如果已設定「快速啟動容錯移轉」,且待命資料庫套用延遲在快速啟動容錯移轉延遲限制內,則啟動 DR 站台的時間只會新增快速啟動容錯移轉逾時臨界值至轉換至待命資料庫的整體時間。
是否自動採取動作,應完整編寫容錯移轉程序,以確保迅速且準確地執行。
計畫性維護解決方案
以下是通常在 PeopleSoft 環境中發生的計畫性維護活動摘要,以及將停機時間維持在最低的建議技術解決方案。
維護作業 | 解決方案 | PeopleSoft 停機 |
---|---|---|
中層作業系統或硬體升級 | 跨 Web 和 Tuxedo 應用程式伺服器的負載平衡、備援服務。 | 沒有停機時間,假設 Coherence*Web 正在執行。 |
PeopleSoft (應用程式和 PeopleTools) | PeopleSoft 異位修正。 | 小時 (不需要綱要變更) 的分鐘數 (不變更綱要) |
PeopleSoft 應用程式組態變更 | PeopleSoft 應用程式機動重新啟動。 | 無停止工作時間 |
PeopleSoft 升級 | PeopleSoft 異地升級。 | 小時至天數 (需要綱要變更;時間取決於資料庫大小) * |
資料庫層作業系統修正或硬體維護 | Oracle RAC 機動,待命優先。 | 無停止工作時間 |
Oracle Database 版本更新修正 | Oracle RAC 機動,待命優先。 | 無停止工作時間 |
Oracle Database 升級 | 「資料保全」暫時邏輯輪詢升級。請參閱:使用本機待命資料庫減少 PeopleSoft 停止工作時間。 | 秒至分鐘 |
Oracle Grid 和 Oracle Clusterware 升級和修正程式 | Oracle RAC 機動,待命優先。 | 無停止工作時間 |
* 在實務上,有幾個方法可以減輕延長升級停機的影響,例如提供唯讀複本。Oracle Consulting Services 可協助您規劃和執行升級。