对专用 Exadata 基础结构上的自治 AI 数据库进行故障排除
使用以下部分可帮助您解决 Oracle Public Cloud 和 Exadata Cloud@Customer 平台上的 Oracle Autonomous AI Database on Dedicated Exadata Infrastructure 问题。
无法访问主加密密钥
适用于: 仅限 Oracle Public Cloud
潜在原因
自治 Exadata VM 集群 (AVMC) 无法访问主加密密钥。
建议操作
验证主加密密钥是否可从 AVMC 访问。
分辨率
- 确保为具有 Destination:All IAD Services in Oracle Services Network 的 AVMC 子网启用了服务网关。
- 确保为动态组定义了以下 IAM 策略:
allow dynamic-group <dynamic-group-name> to manage keys in compartment <vaults-and-keys-compartment> where all { target.key.id='<key_ocid>', request.permission!='KEY_DELETE', request.permission!='KEY_MOVE', request.permission!='KEY_IMPORT', request.permission!='KEY_BACKUP’ }
进一步参考
无法访问 Vault
适用于: 仅限 Oracle Public Cloud
潜在原因
自治 Exadata VM 集群 (AVMC) 无法读取 Vault。
建议操作
验证 Vault 是否可从 AVMC 访问。
分辨率
- 确保为具有目标:Oracle 服务网络中的所有 IAD 服务的 AVMC 子网启用服务网关
- 确保为动态组定义了以下 IAM 策略
allow dynamic-group <dynamic-group> to read vaults in tenancy | compartment <vaults-and-keys-compartment>
进一步参考
备份到网络文件系统 (NFS) 失败
适用于: 仅适用于 Exadata Cloud@Customer
潜在原因
由于网络问题,NFS 目标可能无法访问。
建议操作
验证 NFS 是否可以从自治 Exadata VM 集群 (AVMC) 网络访问。
分辨率
- 验证网络路由并重试。所有 IP 地址都需要可通过 AVMC 的备份网络访问。
- 断开并重新连接 NFS。
- 附加共享的辅助 NFS。
进一步参考
无法挂载网络文件系统 (Network File System,NFS)
适用于: 仅适用于 Exadata Cloud@Customer
潜在原因
- 导出路径不正确。
- 在导出路径上缺少正确的权限。
- 自治 Exadata VM 集群 (AVMC) 客户端 IP 与 NFS 服务器之间没有网络访问。
建议操作
- 验证导出路径上的导出路径和权限。
- 验证 NFS 服务器和客户机 IP 之间的访问端口是否打开。
分辨率
- 确保 export_path 准确。
- 确保 Oracle 用户对 export_path 具有权限
- 自治 VM 集群的 Oracle 用户的 uid:gid 应为 1001:1001
- 确保 AVMC 客户机 IP 与 NFS 服务器之间没有防火墙阻止网络访问。
- 如果通过备份 IP 对 NFS 进行网络访问,则为 Autonomous AI Database 操作创建 SR,以实施路由规则来通过备份 IP 将流量转移到 NFS。
无法在网络文件系统 (Network File System,NFS) 中写入文件
适用于: 仅适用于 Exadata Cloud@Customer
潜在原因
对 NFS 挂载的权限不正确。
建议操作
验证 NFS 挂载是否具有正确的权限。
分辨率
- 自治 VM 集群的 Oracle 用户的 uid:gid 应为 1001:1001
无法从 APEX 获取出站流量
错误代码
OPC :ORA-24247 WHILE TRYING TO USE APEX_INSTANCE_ADMIN.VALIDATE_EMAIL_CONFIG
潜在原因
缺少 https 和 SMTP 出站规则。
建议操作
根据您对发送电子邮件或访问 REST(或其他基于 HTTP)资源等任务的要求,启用 APEX 的网络访问。只有在用户配置访问权限后,访问权限才可用。
分辨率
- 指定的主体名称必须与 APEX 安装方案匹配,例如它可能为
APEX_210200
。 - 特定部署的 apex 方案名称取决于版本,可以通过以下查询找到:
select schema from dba_registry where comp_id='APEX'
- 为其他用户(例如 ADMIN)创建的 ACL 不会影响通过 APEX 的访问。此类 ACL 仅影响 ADMIN 直接称为 UTL_HTTP 或 UTL_SMTP 的 ADMIN 或代码的用例。
进一步参考
- 说明允许访问任何主机的通配符规则以及允许本地主机访问的后续限制性更强规则的文档:在 Oracle Database 中启用网络服务
- 有关添加规则以允许特定主机或通配符模式的详细信息,请参阅 Oracle Database 19c PL/SQL Packages and Types Reference 或 Oracle Database 26ai PL/SQL Packages and Types Reference 中的 APPEND_HOST_Procedure 。
ZDLRA 的备份保留问题
适用于: 仅适用于 Exadata Cloud@Customer
潜在原因
根本原因取决于根据以下建议生成的诊断报告中的详细信息。
建议操作
- 为了帮助我们了解和修复问题,请按照以下 My Oracle Support (MOS) 说明进行说明,说明如何收集诊断数据,这将有助于支持部门缩小问题的原因。
系统活动报告:SRDC - Zero Data Loss Recovery Appliance (ZDLRA) 数据收集(文档 ID 2154189.1)
- 如果 Recovery Appliance 高于或等于版本 19.2.1.1.2,则还可以使用以下命令生成系统活动报告 (System Activity Report,SAR),但此报告将仅以文本格式生成:
racli run diagnostics --tag=sar
此命令生成诊断软件包。
- 在 My Oracle Support 中提交具有诊断结果的服务请求 (SR)。
分辨率
提交 SR 并显示诊断结果后,Oracle 技术支持团队将与您联系,以解决相应的问题。
进一步参考
延迟使用 SQL*Plus 连接到 Autonomous AI Database
潜在的原因
每当尝试使用 SQL*Plus 连接到 Autonomous AI Database on Dedicated Exadata Infrastructure 时,它会尝试通过端口 6200 访问 ONS 以订阅每个节点一次的 FAN 事件。如果到达节点 6200 的请求由于 10 秒(每个节点)后的超时而过期,它将继续执行常规 SQLNET 1521/2484,从而导致连接延迟。
对于端口 6200,您的 domU 上可能有阻止的入站,或者客户机主机上有阻止的出站。
建议的操作
为 FAN 端口 6200 提供入站和出站规则,或禁用对客户端上 FAN 事件的订阅。
分辨率
-
通过更新
oraaccess
XML 文件禁用对客户机上的 FAN 事件的订阅。oraaccess.xml
文件允许您根据各个应用程序要求覆盖特定于连接的参数。有关示例,请参见 Overriding Connection Parameters at the Connection-String Level 。 - 通过为 FAN 端口 6200 提供入站和出站规则,修复了从客户机主机到 domU 的端口 6200 的连接,如 Step 4 中所述。创建 VCN 和子网。