使用 Oracle Cloud 主控台進行疑難排解

瞭解如何使用 Oracle Cloud 主控台中的指標對 OCI GoldenGate 進行疑難排解。

附註:

此資訊僅適用於資料複製部署。

建置資訊

您可以使用「建置資訊」頁籤中的下列資訊來協助您進行疑難排解:

  • OCPU 數目OCI GoldenGate 部署可使用的基本 Oracle Compute Unit (OCPU) 數目,無須自動調整。這也是 OCI GoldenGate 的最低計量表。
  • 自動調整:啟用時, OCI GoldenGate 部署最多可擴展至 OCPU 計數值的 3 倍。
  • 公用 IP :如果在建立 OCI GoldenGate 部署時啟用公用端點,則會顯示公用 IP。
  • 專用 IP :可從您 (客戶的) 子網路存取的專用 IP。
  • 主控台 URL :可用來透過公用或專用網路存取 OCI GoldenGate 建置主控台的 FQDN。若為專用,則必須從專用網路存取主控台 URL。
  • OCID :使用 Oracle Support 開啟服務要求 (SR) 所需的部署 Oracle Cloud Identifier (OCID)。

度量

附註:

請確定將部署升級至最新版本,以運用所有可用的指標。

每次部署每 5 分鐘收集一次度量。產生的資料可協助您排除可能遇到的問題。

  • CPU 使用量:所有 OCPU 的聚總。例如,如果您在建立部署時指定 3 作為 OCPU 數目並啟用「自動調整」,則可使用的 OCPU 總數為 9。使用率高於 33.333% 時,表示 9 個 OCPU 的 33.333%。
  • CPU 使用量:使用的 OCPU 聚總數目。例如,當 OCPU 使用量大於 9 個 OCPU 的 33.333% 時,系統會向您收取超過 33.333% 的整數值 (即 4 個 OCPU)。未啟用自動調整功能時,會向您收取基礎 OCPU 數目費用。
  • 記憶體使用量:聚總記憶體的百分比。每個 OCPU 會配置 16 GB 的記憶體。
  • 部署整體狀況:每個部署都有一個狀況分數,即基礎 OCI GoldenGate 部署處理作業的聚總狀況:管理服務、分配服務、接收者服務以及效能測量結果服務。
    • 健康:100%
    • 不健全:>100%

      例如,如果四個處理程序中有兩個狀況良好,則健康分數為 50%。

      附註:

      當您新增子處理作業 (例如「擷取」或「分送路徑」) 時,可以將它指定為部署狀況的重要性。如果子程序已停止,則「管理服務」會被視為不正常。
  • 部署內送延遲:指定為嚴重性的擷取可設定延遲。此度量是所有重要 Extract 的聚總值。
  • 部署外送延遲:會擷取指定為重要之「複本」的延遲。此度量是所有重要複本的聚總值。
  • 交換空間使用狀況:顯示部署正在使用的交換空間大小 (GB)。
  • 暫時空間使用狀況:顯示部署正在使用的暫時空間大小 (GB)。
  • 檔案系統使用狀況:顯示部署正在使用的檔案系統空間大小 (GB)。
  • 擷取狀態:顯示部署人員之 Extract 處理作業的整體狀況:
    • 處理作業執行時有 100%
    • 處理作業為「已放棄」或「已停止」時的 0%
  • Replicat 狀態:顯示建置之 Replicat 處理作業的整體狀況:
    • 處理作業執行時有 100%
    • 處理作業為「已放棄」或「已停止」時的 0%
  • 分送路徑狀態:顯示建置之「分送路徑」處理作業的整體狀況:
    • 處理作業執行時有 100%
    • 處理作業為「已放棄」或「已停止」時的 0%
  • 接收者路徑狀態:顯示建置之「接收者路徑」處理作業的整體狀況:
    • 處理作業執行時有 100%
    • 處理作業為「已放棄」或「已停止」時的 0%
  • 擷取延遲:顯示部署中 Extract 處理作業的平均延遲時間 (秒)。
  • 複製延遲:顯示建置中 Replicat 處理作業的平均延遲時間 (秒)。
  • 分送路徑延遲:顯示建置中「分送路徑」處理作業的平均延遲時間 (秒)。
  • 接收者路徑延遲:顯示建置中「接收者路徑」處理作業的平均延遲時間 (秒)。

如需詳細資訊,請參閱測量結果

範例:疑難排解部署狀況

此範例顯示當部署狀況不是 100% 時,如何進行疑難排解。

若要疑難排解 OCI GoldenGate 部署主控台中的部署狀況,請執行下列動作:

  1. 建立警示以評估「部署狀況」。

    部署狀況若小於 100%,您將會收到通知。

  2. 從「建置詳細資訊」頁面啟動 OCI GoldenGate 建置主控台,然後登入。
  3. OCI GoldenGate 部署主控台中,按一下效能測量結果服務,然後複查每個程序的狀態。

    如果已經停止 Extract 或 Replicat 等子處理作業,則會直接影響「管理服務」狀況,並將狀況分數設為 0 (狀況不良)。因此整體部署狀況為 75%,因為四個流程中只有三個狀況良好。

每個處理作業也可以使用記錄檔。如需有關如何使用 OCI GoldenGate 部署主控台日誌檔進行疑難排解的詳細資訊,請參閱使用部署主控台進行疑難排解

範例:疑難排解 OCPU 使用量

此範例顯示當 OCPU 使用量大於 90% 時,如何進行疑難排解。

Extract 和 Replicat 會在複寫資料時使用 OCPU 週期。平行 Replicat 會為每個 Replicat 處理作業建立許多套用程式處理作業。複查 OCI GoldenGate 部署主控台中的效能度量之後,可能需要將額外的 OCPU 新增至 OCI GoldenGate 部署,或啟用自動調整功能 (若未啟用)。

若要疑難排解 OCPU 使用量,請執行下列動作:

  1. 啟動 OCI GoldenGate 部署主控台並登入。
  2. 按一下效能測量結果服務
  3. 按一下每個處理以複查其明細,然後按一下執行緒效能以查看該處理中每個執行緒的狀態。

    執行緒效能範例
    threadperformance.png 圖解描述

    此資訊可用來疑難排解每個處理作業,包括每個繫線的 CPU 使用量。