Oracle Cloud Infrastructure GoldenGate 度量

使用指标、预警和通知监视 Oracle Cloud Infrastructure GoldenGate 部署的部署健康状况、容量和整体性能。在 Oracle Cloud 控制台中,您可以在 OCI GoldenGate 部署详细信息页面上或使用度量浏览器监视度量。

资源:goldengate-deploymentsgoldengate-connectionsgoldengate-pipelines

概述

Oracle Cloud Infrastructure GoldenGate 指标可帮助您衡量源数据库和目标数据库之间复制的数据量。

以下术语有助于了解度量:

  • 名称空间:用于 Oracle Cloud Infrastructure GoldenGate 度量的容器。Oracle Cloud Infrastructure GoldenGate 的名称空间为 oci_goldengate
  • 度量:遥测和监视的基本概念。度量定义一组时间序列数据点。每个度量由名称空间、度量名称、区间标识符、一组一个或多个维和一个度量单位唯一定义。每个数据点都有一个时间戳、一个值以及与其关联的计数。
  • :用于定义与度量关联的特征的键 - 值对。例如,resourceId,即 Oracle Cloud Infrastructure GoldenGate 部署 OCID。
  • 统计信息:指定时段内的度量数据聚合。聚合使用指定时间段内的名称空间、度量名称、维和数据点度量单位完成。
  • 报警:用于自动执行操作监视和性能。报警会跟踪在特定时间段内发生的更改。它还根据为度量定义的规则执行一个或多个定义的操作。

Prerequisites

  • IAM 策略:要监视资源,无论您是将控制台或 REST API 与 SDK、CLI 还是其他工具结合使用,您都必须在管理员编写的策略中获得所需的访问类型。该策略必须使您能够访问监视服务以及所监视的资源。如果您尝试执行操作并收到您无权或未经授权的消息,请向管理员确认您已被授予的访问权限的类型以及您应该在哪个区间中工作。有关用于监视的用户授权的更多信息,请参阅监视通知
  • 此页上列出的度量将自动用于您创建的任何 Oracle Cloud Infrastructure GoldenGate 部署。您无需启用对资源的监视即可获取这些度量。

可用度量

注意:

确保将部署升级到最新版本以利用所有可用度量。

数据复制度量

Oracle Cloud Infrastructure GoldenGate 数据复制指标包括以下维度:

  • deploymentId:对于所有度量,deploymentId 是部署 OCID。
  • deploymentNameOracle Cloud Infrastructure GoldenGate 部署的名称。
  • ExtractNameOracle Cloud Infrastructure GoldenGate 部署中的提取进程的名称。
  • ReplicatNameOracle Cloud Infrastructure GoldenGate 部署中的复制进程的名称。
  • DistributionPathNameOracle Cloud Infrastructure GoldenGate 部署中的分发路径进程的名称。
  • ReceiverPathNameOracle Cloud Infrastructure GoldenGate 部署中的接收方路径进程的名称。
  • ageSeconds:脉动存在时间(秒)。
度量 度量说明 度量维 建议的操作
名称CpuUtilization

显示名称:CPU 占用率

所有使用者组的 CPU 总占用率百分比。检查存在提取或复制滞后时的 CPU 占用率。

deploymentId

deploymentName

如果 CPU 占用率很高,您可以:
  • 将 OCPU 添加到您的部署
  • 启用自动缩放(如果尚未启用)
  • 检查存储使用率和线索大小,如果线索文件高,则清除线索文件
名称OcpuConsumption

显示名称:OCPU 消耗

部署使用的 OCPU 总数。

当该计数小于最小 OCPU 数时,将显示最小数。

当 OCPU 数量大于最小数量时,将显示使用的实际 OCPU 数量。

deploymentId

deploymentName

如果 OPCU 消耗量很高,您可以:
  • 将 OCPU 添加到您的部署
  • 启用自动缩放(如果尚未启用)
名称MemoryUtilization

显示名称:内存使用率

使用的可用内存所占百分比。

对内存的需求与复制的数据的大小保持一致。如果分配了足够的内存,则每个打开的事务处理将保留在内存中,直到收到提交记录。

deploymentId

deploymentName

如果内存使用率很高,您可以:
  • 将 OCPU 添加到您的部署
  • 启用自动缩放(如果尚未启用)
名称DeploymentHealth

显示名称:总体部署健康状况

部署服务的总体健康状况百分比。

有四个服务:管理服务、配送服务、接收器服务和性能度量服务。如果这四个人都健康运行,预期得分是 100%。如果部署健康状况为 50%,则只有两个服务运行正常。

deploymentId

deploymentName

创建提取、复制、分发或接收器路径时,可以在“托管选项”下将该进程标记为“对部署运行状况至关重要”。如果部署健康状况 >100%,则检查标记为对部署健康状况至关重要的进程。
名称DeploymentInboundLag

显示名称:部署入站滞后

对部署健康状况至关重要的所有入站流的平均滞后(秒)

deploymentId

deploymentName

不适用
名称DeploymentOutboundLag

显示名称:部署出站滞后

所有对部署健康状况至关重要的出站流的平均滞后(秒)

deploymentId

deploymentName

不适用
名称SwapSpaceUsage

显示名称:交换空间使用情况

部署使用的交换空间百分比。

由于 OCI GoldenGate 仅将已提交的事务处理写入线索文件,因此所有未提交的事务处理都缓存到内存中。高速缓存同时使用物理内存和交换空间(虚拟内存)。交换空间位于硬盘驱动器上,以便在物理内存 (RAM) 满时提供额外的内存。

deploymentId

deploymentName

如果交换空间使用量增加,请考虑在部署中添加更多 OCPU 以增加物理内存 (RAM)。
名称TempSpaceUsage

显示名称:临时空间使用情况

部署使用的临时空间的百分比。

当高速缓存的事务处理数据总数超过高速缓存大小设置时,提取会将高速缓存数据写入临时文件。与提取文件写入临时文件相比,操作系统切换到磁盘的效率更高。

deploymentId

deploymentName

如果临时空间使用量增加,请考虑在部署中添加更多 OCPU 以增加物理内存 (RAM)。
名称FileSystemUsage

显示名称:

部署使用的文件系统空间量 (GB)

deploymentId

deploymentName

如果文件系统使用率较高:
  • 检查线索文件大小并清除不必要的线索文件
  • 检查临时空间使用情况以查看 OCI GoldenGate 是否运行了物理内存 (RAM)
名称ExtractStatus

显示名称:提取状态

部署中提取流程的运行状况百分比
  • 进程正在运行时达到 100%
  • 进程中止或停止时为 0%

deploymentId

deploymentName

ExtractName

如果提取进程异常终止或停止,请检查报告文件以找出根本原因或错误,从而解决问题。
名称ReplicatStatus

显示名称:复制状态

部署中复制进程的运行状况百分比
  • 进程正在运行时达到 100%
  • 进程中止或停止时为 0%

deploymentId

deploymentName

ReplicatName

如果某个复制已停止或异常终止,则检查该复制报告文件中的根本原因或错误以诊断问题。
名称DistributionPathStatus

显示名称:分配路径状态

部署中分发路径进程的运行状况百分比
  • 进程正在运行时达到 100%
  • 进程中止或停止时为 0%

deploymentId

deploymentName

DistributionPathName

如果异常终止或停止,则可能的原因如下:

  • 身份证明更改
  • 接收方服务已停止
  • 目标部署已停止
名称ReceiverPathStatus

显示名称:接收方路径状态

部署中接收方路径进程的运行状况百分比
  • 进程正在运行时达到 100%
  • 进程中止或停止时为 0%

deploymentId

deploymentName

ReceiverPathName

如果接收方路径状态已停止或异常终止:
  • 检查身份证明中的更改
  • 检查目标部署健康状况
  • 检查源部署与目标部署之间的网络问题
名称ExtractLag

显示名称:提取滞后

提取处理记录的时间(基于系统时钟)与数据源中该记录的时间戳之间的差异(以秒为单位)。

deploymentId

deploymentName

ExtractName

如果提取滞后很高,则:
  • 检查 CPU 占用率以查看部署是否已用完资源
  • 检查内存使用率以查看分配的资源是否可以处理提取大小
  • 如果数据源是内部部署数据库,请检查网络运行状况和延迟
  • 检查源数据库的性能问题
  • 检查文件系统存储
名称ReplicatLag

显示名称:复制滞后

复制程序处理最后一个记录的时间(基于系统时钟)与线索中记录的时间戳之间的差异(秒)。

deploymentId

deploymentName

ReplicatName

如果复制滞后较高:
  • 检查 CPU 和内存使用率以查看部署是否已用完资源
  • 检查提取滞后是否存在任何延迟问题
  • 检查分发路径实验室是否存在延迟问题
  • 检查 OCI GoldenGate 与目标数据库之间的网络延迟。推荐的往返 ping 是 5 毫秒或更短。
  • HANDLECOLLISIONS 可能会导致性能问题,不建议用于更改数据捕获 (CDC) 复制
名称DistributionPathLag

显示名称:分配路径滞后

部署中分发路径进程的平均滞后(以秒为单位)。例如,如果源部署和目标部署在两个不同的数据中心中运行,则网络延迟问题可能会影响延迟。

deploymentId

deploymentName

DistributionPathName

不适用
名称ReceiverPathLag

显示名称:接收方路径滞后

部署中接收方路径进程的平均滞后(以秒为单位)

deploymentId

deploymentName

ReceiverPathName

不适用
名称:HeartbeatLag

显示名称:脉动滞后

从源端点到目标端点的复制滞后(以秒为单位)。

ReplicatName

deploymentName

deploymentId

ageSeconds

如果脉动滞后很高,则:
  • 检查 CPU 占用率以查看部署是否已用完资源
  • 检查内存使用率以查看分配的资源是否可以处理提取大小
  • 如果数据源是内部部署数据库,请检查网络运行状况和延迟
  • 检查源数据库的性能问题
  • 检查文件系统存储
  • 检查提取滞后是否存在任何延迟问题
  • 检查分发路径实验室是否存在延迟问题
  • 检查 OCI GoldenGate 与目标数据库之间的网络延迟。推荐的往返 ping 是 5 毫秒或更短。
  • HANDLECOLLISIONS 可能会导致性能问题,不建议用于更改数据捕获 (CDC) 复制

流分析度量

Oracle Cloud Infrastructure GoldenGate 流分析指标包括以下维度:

  • deploymentId:对于所有度量,deploymentId 是部署 OCID。
  • deploymentNameOracle Cloud Infrastructure GoldenGate 部署的名称。
  • PipelineName:管道的名称。
  • component:管道运行时进程,驱动程序或执行程序。
度量 度量说明 度量维 建议的操作
名称PipelineHealth

显示名称:管道健康状况

流分析管道的总体运行状况百分比。
  • 当管道在时间范围内保持健康时,100%。
  • 当管道在时间范围内不健康或不运行时为 0%。
  • 当管道不健康并且正在恢复或将在时间范围内终止并需要注意时,在 0% 到 100% 之间。

deploymentId

deploymentName

PipelineName

不适用
名称PipelineProcessingRate

显示名称: Pipeline 处理速率

部署中管道每秒处理的平均事件数。

deploymentId

deploymentName

PipelineName

不适用
名称PipelineSchedulingDelay

显示名称: Pipeline 计划延迟

部署中管道的平均调度延迟(以毫秒为单位)(毫秒)。

deploymentId

deploymentName

PipelineName

不适用
名称PipelineTotalDelay

显示名称:管道总延迟

部署中管道的平均总延迟(毫秒)(毫秒)。

deploymentId

deploymentName

PipelineName

不适用
名称PipelineMemoryUsage

显示名称:管道内存使用情况

部署中管道驱动程序和执行程序的内存使用量 (MB)。

deploymentId

deploymentName

PipelineName

component

不适用

管道度量

Oracle Cloud Infrastructure GoldenGate 管道指标可能包括以下维度:

  • deploymentId:对于所有度量,deploymentId 是部署 OCID。
  • deploymentNameOracle Cloud Infrastructure GoldenGate 部署的名称。
  • PipelineName:管道的名称。
  • pipelineIdpipelineId 是管道 OCID。
  • ProcessName:系统生成的进程名称。
  • ageSeconds:脉动存在时间(秒)。
度量 度量说明 度量维 建议的操作
名称CpuUtilization

显示名称:CPU 占用率

所有使用者组的 CPU 总占用率百分比。检查存在提取或复制滞后时的 CPU 占用率。

deploymentId

deploymentName

如果 CPU 占用率在很长一段时间内保持在较高水平,请联系 Oracle 技术支持。
名称MemoryUtilization

显示名称:内存使用率

使用的可用内存所占百分比。

对内存的需求与复制的数据的大小保持一致。如果分配了足够的内存,则每个打开的事务处理将保留在内存中,直到收到提交记录。

deploymentId

deploymentName

如果 CPU 占用率在很长一段时间内保持在较高水平,请联系 Oracle 技术支持。
名称OcpuConsumption

显示名称:OCPU 消耗

部署使用的 OCPU 总数。

当该计数小于最小 OCPU 数时,将显示最小数。

当 OCPU 数大于最小数时,将显示使用的实际 OCPU 数。

deploymentId

deploymentName

如果 CPU 占用率在很长一段时间内保持在较高水平,请联系 Oracle 技术支持。
名称PipelineCaptureStatus

显示名称:Pipeline Capture 状态

捕获(提取)进程的运行状况百分比。

deploymentId

deploymentName

PipelineName

不适用
名称PipelineApplyStatus

显示名称:管道应用状态

应用(复制)进程的运行状况百分比。

deploymentId

deploymentName

PipelineName

不适用
名称PipelineCaptureLag

显示名称:管道捕获滞后

部署中捕获(提取)进程的平均滞后(秒)。

deploymentId

deploymentName

PipelineName

不适用
名称PipelineApplyLag

显示名称:管道应用滞后

部署中应用(复制)进程的平均滞后(以秒为单位)。

deploymentId

deploymentName

PipelineName

不适用
名称PipelineHealth

显示名称:管道健康状况

底层管道服务和进程的总体健康状况百分比。
  • 当管道在时间范围内保持健康时,100%。
  • 当管道在时间范围内不健康或不运行时为 0%。
  • 当管道不健康并且正在恢复或将在时间范围内终止并需要注意时,在 0% 到 100% 之间。

deploymentId

deploymentName

PipelineName

不适用
名称:HeartbeatLag

显示名称:脉动滞后

从源端点到目标端点的复制滞后(以秒为单位)。

pipelineId

pipelineName

ProcessName

ageSeconds

如果脉动滞后很高,则:
  • 检查 CPU 占用率以查看管道是否已用完资源
  • 检查内存使用率以查看分配的资源是否可以处理捕获大小
  • 如果数据源是内部部署数据库,请检查网络运行状况和延迟
  • 检查源数据库的性能问题
  • 检查文件系统存储
  • 检查捕获延迟是否存在任何延迟问题

使用 Console

要查看 Oracle Cloud Infrastructure GoldenGate 指标,请执行以下操作:
  1. 在控制台导航菜单中,选择观测和管理,然后在监视下,选择服务度量
  2. 对于区间,选择包含您感兴趣的 Oracle Cloud Infrastructure GoldenGate 部署的区间。
  3. 对于度量名称空间,选择 oci_goldengate

刷新浏览器以查看服务发出的最新度量。