JavaScript is required to for searching.
跳过导航链接
退出打印视图
适用于 Oracle Real Application Clusters 的 Oracle Solaris Cluster 数据服务指南     Oracle Solaris Cluster 3.3 3/13 (简体中文)
search filter icon
search icon

文档信息

前言

1.  安装 Support for Oracle RAC

2.  配置 Oracle 文件存储

3.  注册和配置资源组

4.  使 Oracle RAC 可在群集中运行

5.  管理 Support for Oracle RAC

Support for Oracle RAC 管理任务概述

自动生成的 Oracle Solaris Cluster 对象名称

通过 Oracle Solaris Cluster 软件管理 Oracle RAC 数据库

Oracle 10g R2、11g 或 12c RAC 数据库实例的 Oracle Solaris Cluster 资源状态更改所产生的影响

Oracle 9i RAC 数据库实例的 Oracle Solaris Cluster 资源状态更改所产生的影响

调优 Support for Oracle RAC

设置超时的准则

SPARC: VxVM 组件重新配置步骤 4 超时

保留步骤超时

SPARC: 为 UDLM 设置通信端口范围的准则

如何修改只有在禁用资源时才可调的扩展属性

调优 Support for Oracle RAC 故障监视器

可伸缩设备组故障监视器的操作

可伸缩文件系统挂载点故障监视器的操作

Oracle 9i RAC 服务器故障监视器的操作

主故障监视器操作

数据库客户机故障探测器的操作

监视归档重做日志分区的操作

确定数据库是否正常运行的操作

服务器故障监视器响应数据库事务故障时的操作

扫描服务器故障监视器记录的警报

Oracle 9i RAC 侦听器故障监视器的操作

获取用于 DBMS 超时故障排除的核心文件

定制 Oracle 9i RAC 服务器故障监视器

为错误定义定制行为

定制操作文件格式

更改对 DBMS 错误的响应

响应影响严重的错误

忽略影响轻微的错误

更改对记录的警报的响应

更改连续超时探测的最大次数

将定制操作文件传播到群集中的所有节点

指定服务器故障监视器应使用的定制操作文件

如何指定服务器故障监视器应使用的定制操作文件

6.  排除 Support for Oracle RAC 的故障

7.  修改 Support for Oracle RAC 的现有配置

8.  升级 Support for Oracle RAC

A.  此数据服务的配置样例

B.  DBMS 错误和记录的警报的预设操作

C.  Support for Oracle RAC 扩展属性

D.  命令行替代方案

索引

调优 Support for Oracle RAC 故障监视器

以下资源的故障监视器提供了对 Support for Oracle RAC 数据服务的故障监视:

每个故障监视器均包含在具有下表所显示资源类型的资源中。

表 5-4 Support for Oracle RAC 故障监视器的资源类型

故障监视器
资源类型
可伸缩设备组
SUNW.ScalDeviceGroup
可伸缩文件系统挂载点
SUNW.ScalMountPoint
Oracle 9i RAC 服务器
SUNW.scalable_rac_server
Oracle 9iRAC 侦听器
SUNW.scalable_rac_listener

这些资源的系统属性和扩展属性可控制故障监视器的行为。这些属性的默认值确定了故障监视器的预设行为。预设行为应适合大多数 Oracle Solaris Cluster 安装。因此,仅当需要修改此预设行为时,才应调优 Support for Oracle RAC 故障监视器。

调优 Support for Oracle RAC 故障监视器包括以下任务:

有关更多信息,请参见《Oracle Solaris Cluster Data Services Planning and Administration Guide》中的"Tuning Fault Monitors for Oracle Solaris Cluster Data Services"。以下各小节提供了有关执行这些任务所需的 Support for Oracle RAC 故障监视器的信息:

可伸缩设备组故障监视器的操作

默认情况下,故障监视器监视资源所代表设备组中的所有逻辑卷。如果只需要监视设备组中逻辑卷的子集,则设置 LogicalDeviceList 扩展属性。

设备组的状态是从监视的各个逻辑卷的状态中得出的。如果所有监视逻辑卷的运行状况良好,则设备组的运行状况良好。如果任何监视的逻辑卷出现故障,则设备组出现故障。如果发现设备组出现故障,将停止监视代表该组的资源并且该资源将被置于禁用状态。

通过查询单个逻辑卷的卷管理器,可以获得该逻辑卷的状态。如果无法通过查询确定 Solaris Volume Manager for Sun Cluster 卷的状态,故障监视器将执行文件输入/输出 (input/output, I/O) 操作来确定状态。


注 - 对于镜像磁盘,如果一个子镜像出现故障,设备组仍被视为运行状况良好。


如果重新配置用户级群集成员导致 I/O 错误,则在进行用户级群集成员监视器 (userland cluster membership monitor, UCMM) 重新配置时,将暂停故障监视器对设备组资源的监视。

可伸缩文件系统挂载点故障监视器的操作

要确定已挂载的文件系统是否可用,故障监视器将对文件系统上的测试文件执行 I/O 操作,如打开、读取和写入该测试文件。如果在超时期限内 I/O 操作未完成,故障监视器将报告错误。要为 I/O 操作指定超时,请设置 IOTimeout 扩展属性。

对错误的响应取决于文件系统的类型,如下所示:

Oracle 9i RAC 服务器故障监视器的操作

Oracle 9i RAC 服务器的故障监视器通过向服务器发出请求来查询服务器运行状况。

服务器故障监视器是通过 pmfadm 启动的,以便实现监视器的高可用性。如果因为任何原因导致监视器终止,进程监视器工具 (Process Monitor Facility, PMF) 将自动重新启动监视器。

服务器故障监视器包括以下进程。

本节包含有关服务器故障监视器的以下信息:

主故障监视器操作

主故障监视器可确定如果数据库联机且在事务处理期间未返回任何错误则操作成功。

数据库客户机故障探测器的操作

数据库客户机故障探测器执行以下操作:

  1. 监视归档重做日志的分区。请参见监视归档重做日志分区的操作

  2. 如果分区运行正常,则确定数据库是否正常运行。请参见确定数据库是否正常运行的操作

探测器使用在资源属性 Probe_timeout 中设置的超时值,确定需要为成功探测 Oracle 分配多少时间。

监视归档重做日志分区的操作

数据库客户机故障探测器将查询动态性能视图 v$archive_dest 来确定归档重做日志的所有可能目标。对于每个活动目标,探测器将确定目标是否正常运行,是否有足够的空闲空间可供存储归档重做日志。

确定数据库是否正常运行的操作

如果归档重做日志分区运行正常,则数据库客户机故障探测器将查询动态性能视图 v$sysstat 以获取数据库性能统计信息。这些统计信息的变化表示数据库正常运行。如果这些统计信息在连续查询之间保持不变,则故障探测器将执行数据库事务以确定数据库是否正常运行。这些事务涉及在用户表空间中创建、更新和删除表。

数据库客户机故障探测器以 Oracle 用户身份执行其所有事务。该用户的 ID 在节点或区域准备期间指定,如如何创建 DBA 组和 DBA 用户帐户中所述。

服务器故障监视器响应数据库事务故障时的操作

如果数据库事务发生故障,服务器故障监视器将执行按导致故障的错误确定的操作。要更改服务器故障监视器执行的操作,请按定制 Oracle 9i RAC 服务器故障监视器中的说明定制服务器故障监视器。

如果操作需要运行外部程序,该程序将在后台作为单独的进程运行。

可能的操作如下:

扫描服务器故障监视器记录的警报

Oracle 软件将警报记录在警报日志文件中。此文件的绝对路径由 SUNW.scalable_rac_server 资源的 alert_log_file 扩展属性指定。在以下情况下,服务器故障监视器将扫描警报日志文件以获取新警报:

如果为服务器故障监视器检测到的已记录警报定义了操作,服务器故障监视器将执行此操作以响应警报。

表 B-2 中列出了有关已记录警报的预设操作。要更改服务器故障监视器执行的操作,请按定制 Oracle 9i RAC 服务器故障监视器中的说明定制服务器故障监视器。

Oracle 9i RAC 侦听器故障监视器的操作

Oracle 9i RAC 侦听器故障监视器检查 Oracle 侦听器的状态。

如果侦听器正在运行,Oracle 9i RAC 侦听器故障监视器将认为探测成功。如果故障监视器检测到错误,将重新启动侦听器。


注 - 侦听器资源不提供侦听器密码设置机制。如果启用了 Oracle 侦听器安全设置,则侦听器故障监视器的探测可能会返回 Oracle 错误 TNS-01169。由于侦听器能够响应,因此侦听器故障监视器将认为探测成功。此操作不会导致漏检侦听器故障。侦听器故障会返回不同的错误或导致探测超时。


侦听器探测是通过 pmfadm 启动的,以便实现探测的高可用性。如果探测被终止,PMF 会自动重新启动探测器。

如果在探测期间侦听器出现问题,探测将尝试重新启动侦听器。为资源属性 retry_count 设置的值可确定探测器尝试重新启动的最大次数。在尝试了最大次数之后,如果探测仍不成功,探测将停止故障监视器。

获取用于 DBMS 超时故障排除的核心文件

为方便对情况不明的 DBMS 超时进行故障排除,可以让故障监视器在发生探测超时创建核心文件。核心文件的内容与故障监视器进程相关。故障监视器会在 / 目录下创建核心文件。要允许故障监视器创建核心文件,请使用 coreadm 命令启用 set-id 核心转储。有关更多信息,请参见 coreadm(1M) 手册页。