使用自治 AI 数据库度量在专用 Exadata 基础结构上观察自治 AI 数据库
您可以通过指标、预警和通知来观察自治 AI 数据库的运行状况、容量和性能。您可以使用 Oracle Cloud Infrastructure 控制台或观测 API 来查看指标。
自治 AI 数据库度量可帮助您衡量有用的定量数据,例如 CPU 和存储利用率、成功和失败的数据库登录和连接尝试次数、数据库操作、SQL 查询和事务处理等。您可以使用度量数据来诊断自治 AI 数据库资源的问题并进行故障排除。
Prerequisites
要监视资源,无论您是将控制台还是 REST API 与 SDK、CLI 或其他工具结合使用,都必须在管理员编写的策略中为您提供所需的访问类型。
您需要以下策略来访问监视服务和要监视的资源:
Allow group <Group_Name>
to read metrics
in compartment <Compartment_Name>
Allow group <Group_Name>
to inspect work-requests
in compartment <Compartment_Name>
提示:如果您尝试执行某项操作并收到一条您无权或未经授权的消息,请向管理员确认您被授予的访问权限类型以及您应使用哪个区间。
有关为组授予度量访问权限的公用策略,请参阅允许用户查看区间中的度量定义和限制用户访问特定度量名称空间。
有关向组授予通知访问权限的常见策略,另请参阅允许组管理主题、允许组管理主题订阅以及允许组向主题发布消息。
使用 Console
您可以使用 Oracle Cloud Infrastructure 控制台执行以下操作:
使用 API
您可以使用以下 API 进行监视:
-
监视 API 以获取指标和预警。
-
通知的 Notifications API (用于预警)。
有关使用 API 和签名请求的信息,请参阅 REST API 和安全身份证明。有关 SDK 的信息,请参见 Software Development Kits and Command Line Interface 。
可用度量:oci_autonomous_database
本主题介绍了数据库服务在 oci_autonomous_database 名称空间中发出的度量。
自治 AI 数据库的数据库服务度量包括以下维:
-
自治数据库类型
Autonomous AI Database、Autonomous AI Lakehouse 或 Autonomous AI Transaction Processing 的类型。
-
部署类型
Exadata 基础结构类型,共享或专用。使用控制台查看多个自治 AI 数据库的默认度量图表时,必须指定此维。
-
显示名称
自治 AI 数据库的友好名称。
-
REGION
自治 AI 数据库所在的区域。
-
资源标识
自治 AI 数据库的 OCID 。
-
资源名称
自治 AI 数据库的名称。
下表列出的度量将自动可用于您创建的任何自治 AI 数据库。您无需对资源启用监视即可获取这些度量。
注:由于发出这些度量的频率,有效预警间隔为 5 分钟或更长。有关创建预警的详细信息,请参阅创建预警。
在下表中,只能在 Oracle Cloud Infrastructure 控制台的 Service Metrics(服务度量)页上查看标有星号 (*) 的度量。所有度量都可按本主题中介绍的维度进行筛选。
| 度量 | 度量显示名称 | 单位 | 说明 | 收集频率 |
|---|---|---|---|---|
ApplyLag |
应用滞后 | 秒 | 此度量显示备用数据库在采样时滞后于主数据库的时间(秒)。 统计:均值 时间间隔:5 分钟 |
5 分钟 |
BlockChanges |
数据库块更改数 | 每秒更改量 | 每秒更改的平均块数。 统计:均值 时间间隔:1 分钟 |
5 分钟 |
BlockingSessions |
阻塞会话计数 | count | 阻止其他会话超过 60 秒的会话数。 统计信息:最大值 时间间隔:1 分钟 |
5 分钟 |
CpuTime* |
CPU 时间 | 每秒的秒数 | 在时间间隔内在数据库中前台会话的累计 CPU 时间的平均比率。 统计:均值 时间间隔:1 分钟 |
5 分钟 |
CpuUtilization |
CPU 占用率 | 百分比 | 以百分比表示的 CPU 占用率,在所有使用者组中聚合。报告的占用率百分比基于允许数据库使用的 CPU 数量。 统计:均值 时间间隔:1 分钟 |
5 分钟 |
CurrentLogons* |
当前登录数 | count | 在所选间隔内的成功登录数。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
DBTime* |
数据库时间 | 每秒的秒数 | 数据库用户会话执行数据库代码所花费的时间(CPU 时间 + 等待时间)。数据库时间用于推断数据库调用延迟,因为数据库时间与数据库调用延迟(响应时间)和调用卷的直接成比例增加。 在时间间隔内,数据库中前台会话的累计数据库时间(CPU + 等待)平均比率。它也称为平均活动会话数。 统计:均值 时间间隔:1 分钟 |
5 分钟 |
ECPUsAllocated |
已分配的 ECPU | count | 服务在所选时间间隔内分配的实际 ECPU 数。 统计信息:计数 时间间隔:5 分钟 |
5 分钟 |
ExecuteCount |
执行计数 | count | 在所选间隔内执行了 SQL 语句的用户调用数和递归调用数。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
HardParseCount |
语法分析计数 (硬) | count | 当前分配的 CPU 计数。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
IOPS |
IOPS | 每秒操作数 | 每秒平均 I/O 操作数。 统计:均值 时间间隔:1 分钟 |
5 分钟 |
IOThroughput |
IO 吞吐量 | MB/秒 | 每秒平均吞吐量 (MB) 统计:均值 时间间隔:1 分钟 |
5 分钟 |
LogicalBlocksRead |
逻辑读取数 | 每秒读取数 | 每秒平均逻辑块读取数("db block gets"(数据库块获取数)加上 "consistent gets"(一致获取数))。包括缓冲和直接 I/O。 统计:均值 时间间隔:1 分钟 |
5 分钟 |
LogicalReads |
会话逻辑读取数 | count | 所选时间间隔内 "db block gets"(数据库块获取数)与 "consistent gets"(一致获取数)的总和。这包括从缓冲区高速缓存或进程专用内存中对数据库块的逻辑读取。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
OCPUsAllocated |
已分配的 OCPU | 整数 | 服务在所选时间间隔内分配的实际 OCPU 数。 统计信息:计数 时间间隔:1 分钟 |
5 分钟 |
ParsesByType |
按类型列出的语法分析数 | 每秒分析数 | 每秒的硬或软语法分析数。 统计:均值 时间间隔:1 分钟 |
5 分钟 |
ParseCount* |
语法分析计数(总计) | count | 在所选间隔内的硬语法分析和软语法分析次数。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
ParseFailureCount |
语法分析故障计数 | count | 所选时间间隔内的语法分析失败次数。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
PhysicalReads |
物理读取数 | count | 所选时间间隔内从磁盘读取的数据块数量。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
PhysicalReadTotalBytes |
物理读取总字节数 | count | 在所选时间间隔内,所有数据库实例活动(包括应用程序读取、备份和恢复以及其他实用程序)的磁盘读取大小(字节)。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
PhysicalWrites |
物理写入数 | count | 所选时间间隔内写入磁盘的数据块数量。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
PhysicalWriteTotalBytes |
物理写入总字节数 | count | 在所选时间间隔内,所有数据库实例(包括应用程序活动、备份和恢复以及其他实用程序)的所有磁盘写入的大小(字节数)。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
QueuedStatements |
已入队的语句 | count | 所选间隔内的排队 SQL 语句数,此值是所有使用者组的聚合。 统计信息:总和 时间间隔:1 分钟 |
1 分钟 |
RedoGenerated |
生成的重做 | count | 所选时间间隔内生成的重做量(字节数)。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
RedoSize |
生成的重做 | MB/秒 | 每秒生成的平均重做量 (MB)。 统计:均值 时间间隔:1 分钟 |
5 分钟 |
RunningStatements |
正在运行的语句 | count | 所选间隔内正在运行的 SQL 语句数,此值是所有使用者组的聚合值。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
Sessions |
会话 | count | 数据库中的会话数。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
SessionUtilization |
会话使用率 | Percent | 以百分比表示的最大会话利用率,在所有使用者组中聚合。 统计:均值 时间间隔:1 分钟 |
5 分钟 |
SQLNetBytesFromClient |
从客户端接收的 SQL 网络字节数 | count | 所选时间间隔内通过 Oracle Net Services 从客户端接收的字节数量。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
SQLNetBytesFromDBLink |
从 DBlink 接收的 SQL 网络字节数 | count | 所选时间间隔内通过 Oracle Net Services 从数据库链接接收的字节数量。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
SQLNetBytesToClient |
发送到客户端的 SQL 网络字节数 | count | 所选时间间隔内从前台进程发送到客户端的字节数量。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
SQLNetBytesToDBLink |
发送到 DBlink 的 SQL 网络字节数 | count | 所选时间间隔内通过数据库链接发送的字节数量。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
StorageAllocated* |
已分配的存储空间 | GB | 在时间间隔内分配给数据库的最大空间量。 统计信息:最大值 时间间隔:1 小时 |
1 小时 |
StorageAllocatedByTablespace* |
分配的存储空间(按表空间) | GB | 在时间间隔内为每个表空间分配的最大空间量。 统计信息:最大值 时间间隔:1 小时 |
1 小时 |
StorageUsed* |
最大存储空间 | GB | 在时间间隔内使用的最大空间量。 统计信息:最大值 时间间隔:1 小时 |
1 小时 |
StorageUsedByTablespace* |
已用存储空间(按表空间) | GB | 按表空间列出在时间间隔内使用的最大空间量。 统计信息:最大值 时间间隔:1 小时 |
1 小时 |
StorageUtilization |
存储使用率 | 百分比 | 当前正在使用的预配存储容量所占的百分比。 表示为所有表空间分配的总空间。 统计:均值 时间间隔:1 小时 |
1 小时 |
StorageUtilizationByTablespace* |
存储空间使用率(按表空间) | 百分比 | 每个表空间占用的空间百分比。 统计:均值 时间间隔:1 小时 |
1 小时 |
TransactionsByStatus |
按状态列出的事务处理数 | 每秒事务处理数 | 每秒提交或回退的事务处理数。 统计:均值 时间间隔:1 分钟 |
5 分钟 |
TransactionCount* |
事务处理数量 | count | 在所选间隔内用户提交数和用户回退数之和。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
TransportLag |
传输滞后 | 秒 | 重做在此备用数据库尚不可用的近似秒数(截至采样时间)。 统计:均值 时间间隔:5 分钟 |
5 分钟 |
UserCalls* |
用户调用 | count | 在所选间隔内登录次数、语法分析次数和执行调用次数之和。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
UserCommits |
用户提交数 | count | 所选时间间隔内的用户提交数。 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
UserRollbacks |
用户回退数 | count | 在所选时间间隔内,用户在用户事务处理期间手动发出 统计信息:总和 时间间隔:1 分钟 |
5 分钟 |
WaitTime* |
等待时间 | 每秒的秒数 | 在间隔时间内,数据库中前台会话的累计非空闲等待时间的平均比率。平均活动会话的等待时间部分。 统计:均值 时间间隔:1 分钟 |
5 分钟 |