使用 Oracle Cloud 控制台进行故障排除

了解如何使用 Oracle Cloud 控制台中的指标对 OCI GoldenGate 进行故障排除。

注:此信息仅适用于数据复制部署。

部署信息

您可以使用“部署信息”选项卡中的以下信息来帮助您进行故障排除:

度量

注:请确保将部署升级到最新版本,以利用所有可用度量。

每五分钟收集一次每个部署的度量。生成的数据可帮助您解决可能遇到的问题。

有关详细信息,请参阅度量

示例:对部署运行状况进行故障排除

此示例说明如何在部署运行状况不为 100% 时进行故障排除。

要对 OCI GoldenGate 部署控制台中的部署健康状况进行故障排除,请执行以下操作:

  1. 创建预警以评估部署健康状况。

    部署健康状况低于 100% 时,您将收到通知。

  2. 从“部署详细信息”页启动 OCI GoldenGate 部署控制台并登录。

  3. 在 OCI GoldenGate 部署控制台中,选择性能度量服务并查看每个流程的状态。

    后面是 processhealth.png 的说明

    插图 processhealth.png 的说明

    如果像“提取”或“复制”这样的子进程停止,则会直接影响管理服务的运行状况,从而给出健康状况评分 0(不健康)。因此,总体部署健康率为 75%,因为四个流程中只有三个是健康的。

日志文件也可用于每个进程。有关如何使用 OCI GoldenGate 部署控制台日志文件进行故障排除的更多信息,请参阅使用部署控制台进行故障排除

示例:OCPU 占用率故障排除

此示例说明如何在 OCPU 使用率大于 90% 时进行故障排除。

提取和复制在复制数据时会消耗 OCPU 周期。并行复制为每个复制进程创建多个应用程序进程。在 OCI GoldenGate 部署控制台中查看性能指标后,可能需要将其他 OCPU 添加到 OCI GoldenGate 部署,或者在未启用时启用自动缩放。

要对 OCPU 使用率进行故障排除,请执行以下操作:

  1. 启动 OCI GoldenGate 部署控制台并登录。

  2. 选择性能度量服务

  3. 选择每个进程以查看其详细信息,然后选择线程性能以查看该进程中每个线程的状态。

    线程性能示例

    插图 threadperformance.png 的说明

    此信息可用于对每个进程进行故障排除,包括每个线程的 CPU 消耗。