对配置更改故障进行故障排除

本文可帮助您对更改数据库系统配置时可能发生的问题进行故障排除和修复。

对于多节点 RAC 数据库系统,配置更改操作以滚动方式继续。根据配置更改操作中发生故障的位置,您可能可以使用控制台重新尝试该操作。

本文包含的信息可帮助您确定失败的原因并解决问题。根据错误条件,信息分为多个部分。

本文包含以下主题:

注意:

您还可以创建串行控制台连接,以在单用户模式下对数据库系统进行故障排除。有关在控制台中创建串行控制台连接的信息,请参见管理与数据库系统的串行控制台连接

使用 OCI 控制台进行故障排除

如果配置更改操作失败,则数据库系统详细信息页面上将显示一条消息标题,以提供有关失败的详细信息。如果故障发生在多节点系统的第一个节点上,并且操作已成功回退,则更改配置按钮将保持可用,并且系统保持联机状态。请与 Oracle 技术支持联系以获取有关故障的其他详细信息。您还可以使用 dbcli 了解有关故障以及需要解决的问题的更多信息。在确定没有问题时,可以再次尝试该操作。

如果故障使系统处于无法回退操作的状态,则系统状态为需要注意。在这种情况下,一旦您发现问题,请与 Oracle 技术支持联系,以便 Oracle 可以帮助您解决问题并完成配置更改操作。

使用 dbcli 进行故障排除

确定配置更改操作失败的阶段

  1. 以 root 用户身份登录到数据库系统。
  2. 导航到 /opt/oracle/dcs/bin

    cd /opt/oracle/dcs/bin
  3. 更新 CLI 工具:

    ./cliadm update-dbcli
  4. 列出失败的作业:

    dbcli list-jobs | grep -i failed

注意:

如果在 pre_actionaction post_action 阶段发生失败的作业(或作业)。另请注意失败作业的 job_id 值,您需要解决该问题。

排除 Pre_action 阶段中发生的故障

  1. 使用 job_id 值可获取有关故障的更多信息:

    dbcli describe-job -i <job_id>
  2. dcs-agent.logdcs-agent-debug.log 文件(位于 /opt/oracle/dcs/log/ 目录中)中搜索错误:

    例如:

    cd /opt/oracle/dcs/log
    grep -ir "DCS-10063:Failed to get node names from olsnodes." * 
  3. 使用有关日志文件中记录的错误的信息,尽可能更正系统配置。
  4. 重新尝试配置更改操作。如果操作仍然不成功,请按照 Get Additional Help 中的说明操作。

获取其他帮助

如果您的故障发生在 post_action 阶段,或者您无法解决在 pre_action 阶段中发生的故障,请执行以下操作:

  1. 收集 Diagnostic Data Collection for Oracle Database Cloud Service Instance 文档中列出的信息。
  2. 使用 My Oracle Support 打开支持请求。与 Oracle 技术支持联系。