对专用 Exadata 基础结构上的自治 AI 数据库进行故障排除

使用以下部分可帮助您解决 Oracle Public CloudExadata Cloud@Customer 平台上的 Oracle Autonomous AI Database on Dedicated Exadata Infrastructure 问题。

无法访问主加密密钥

适用于:适用 仅限 Oracle Public Cloud

潜在原因

自治 Exadata VM 集群 (AVMC) 无法访问主加密密钥。

建议操作

验证主加密密钥是否可从 AVMC 访问。

分辨率

  • 确保为具有 Destination:All IAD Services in Oracle Services Network 的 AVMC 子网启用了服务网关。
  • 确保为动态组定义了以下 IAM 策略:
    allow dynamic-group <dynamic-group-name> 
    to manage keys 
    in compartment <vaults-and-keys-compartment>
    where all {
        target.key.id='<key_ocid>',        
        request.permission!='KEY_DELETE',
        request.permission!='KEY_MOVE',
        request.permission!='KEY_IMPORT',
        request.permission!='KEY_BACKUP’
    }

无法访问 Vault

适用于:适用 仅限 Oracle Public Cloud

潜在原因

自治 Exadata VM 集群 (AVMC) 无法读取 Vault。

建议操作

验证 Vault 是否可从 AVMC 访问。

分辨率

  • 确保为具有目标:Oracle 服务网络中的所有 IAD 服务的 AVMC 子网启用服务网关
  • 确保为动态组定义了以下 IAM 策略
    allow dynamic-group <dynamic-group> 
    to read vaults 
    in tenancy | compartment <vaults-and-keys-compartment>

备份到网络文件系统 (NFS) 失败

适用于:适用 仅适用于 Exadata Cloud@Customer

潜在原因

由于网络问题,NFS 目标可能无法访问。

建议操作

验证 NFS 是否可以从自治 Exadata VM 集群 (AVMC) 网络访问。

分辨率

  • 验证网络路由并重试。所有 IP 地址都需要可通过 AVMC 的备份网络访问。
  • 断开并重新连接 NFS。
  • 附加共享的辅助 NFS。

进一步参考

文档: About Backup and Recovery

无法挂载网络文件系统 (Network File System,NFS)

适用于:适用 仅适用于 Exadata Cloud@Customer

潜在原因

  • 导出路径不正确。
  • 在导出路径上缺少正确的权限。
  • 自治 Exadata VM 集群 (AVMC) 客户端 IP 与 NFS 服务器之间没有网络访问。

建议操作

  • 验证导出路径上的导出路径和权限。
  • 验证 NFS 服务器和客户机 IP 之间的访问端口是否打开。

分辨率

  • 确保 export_path 准确。
  • 确保 Oracle 用户对 export_path 具有权限
    • 自治 VM 集群的 Oracle 用户的 uid:gid 应为 1001:1001
  • 确保 AVMC 客户机 IP 与 NFS 服务器之间没有防火墙阻止网络访问。
  • 如果通过备份 IP 对 NFS 进行网络访问,则为 Autonomous AI Database 操作创建 SR,以实施路由规则来通过备份 IP 将流量转移到 NFS。

无法在网络文件系统 (Network File System,NFS) 中写入文件

适用于:适用 仅适用于 Exadata Cloud@Customer

潜在原因

对 NFS 挂载的权限不正确。

建议操作

验证 NFS 挂载是否具有正确的权限。

分辨率

确保 Oracle 用户对 NFS 挂载具有正确的权限。
  • 自治 VM 集群的 Oracle 用户的 uid:gid 应为 1001:1001

无法从 APEX 获取出站流量

错误代码

OPC :ORA-24247 WHILE TRYING TO USE APEX_INSTANCE_ADMIN.VALIDATE_EMAIL_CONFIG

潜在原因

缺少 https 和 SMTP 出站规则。

建议操作

根据您对发送电子邮件或访问 REST(或其他基于 HTTP)资源等任务的要求,启用 APEX 的网络访问。只有在用户配置访问权限后,访问权限才可用。

分辨率

要通过 APEX 授予网络访问权限(如之前配置的那样):
  • 指定的主体名称必须与 APEX 安装方案匹配,例如它可能为 APEX_210200
  • 特定部署的 apex 方案名称取决于版本,可以通过以下查询找到:
    select schema from dba_registry where comp_id='APEX'
  • 为其他用户(例如 ADMIN)创建的 ACL 不会影响通过 APEX 的访问。此类 ACL 仅影响 ADMIN 直接称为 UTL_HTTP 或 UTL_SMTP 的 ADMIN 或代码的用例。

进一步参考

ZDLRA 的备份保留问题

适用于:适用 仅适用于 Exadata Cloud@Customer

潜在原因

根本原因取决于根据以下建议生成的诊断报告中的详细信息。

建议操作

  • 为了帮助我们了解和修复问题,请按照以下 My Oracle Support (MOS) 说明进行说明,说明如何收集诊断数据,这将有助于支持部门缩小问题的原因。

    系统活动报告:SRDC - Zero Data Loss Recovery Appliance (ZDLRA) 数据收集(文档 ID 2154189.1)

  • 如果 Recovery Appliance 高于或等于版本 19.2.1.1.2,则还可以使用以下命令生成系统活动报告 (System Activity Report,SAR),但此报告将仅以文本格式生成:
    racli run diagnostics --tag=sar

    此命令生成诊断软件包。

  • 在 My Oracle Support 中提交具有诊断结果的服务请求 (SR)。

分辨率

提交 SR 并显示诊断结果后,Oracle 技术支持团队将与您联系,以解决相应的问题。

延迟使用 SQL*Plus 连接到 Autonomous AI Database

潜在的原因

每当尝试使用 SQL*Plus 连接到 Autonomous AI Database on Dedicated Exadata Infrastructure 时,它会尝试通过端口 6200 访问 ONS 以订阅每个节点一次的 FAN 事件。如果到达节点 6200 的请求由于 10 秒(每个节点)后的超时而过期,它将继续执行常规 SQLNET 1521/2484,从而导致连接延迟。

对于端口 6200,您的 domU 上可能有阻止的入站,或者客户机主机上有阻止的出站。

建议的操作

为 FAN 端口 6200 提供入站和出站规则,或禁用对客户端上 FAN 事件的订阅。

分辨率

有两个选项可解决此问题: