Go to main content

SPARC T7 系列服务器产品说明

退出打印视图

更新时间: 2017 年 6 月
 
 

分配的 IOV 设备上出现 Virtual_TTE_invalid 错误 (22138210)

重新引导主域或根域时,将通知 I/O 域暂停重新引导域中的已分配虚拟功能,重新引导完成时再将其恢复。但是,在某些情况下,可能会过早发出恢复通知,进而导致 I/O 域无法恢复一个或多个已分配的虚拟功能。此问题仅在 M7/T7 平台上的 I/O 域未设置 LDOMS 故障策略或者故障策略设置为 ignore 时发生。

有两个症状指示此故障:

  • I/O 域中控制台上显示警告(还记录在 /var/adm/messages 中)

  • 分配有物理功能的主域或根域中出现 FMA 故障

I/O 域控制台中的警告如下所示:

WARNING: pxsoft_msi_resume: retry limit exceeded.

主域或根域中的 FMA 故障为 fault.io.pciex.device-invreq (PCIEX-8000-8R)。它包含具有以下字符串的 ereport.io.pciex.rc.epkt 错误报告:

event_name = Virtual_TTE_invalid

要列出所有记录的 FMA 错误报告,请键入:

# fmdump -e

要获取可能包含 event_name = Virtual_TTE_invalid 字符串的详细列表,请键入:

# fmdump -eV

I/O 域控制台中的警告如下所示:

WARNING: pxsoft_msi_resume: retry limit exceeded.

如果出现此问题,I/O 域中一个或多个分配的虚拟功能在主域或根域重新引导后将无法正常运行。受影响的虚拟功能的设备驱动程序无法处理来自底层硬件设备的任何中断信号。

恢复

要从此问题中恢复并重新获得受影响的虚拟功能,请重新引导受影响的 I/O 域。

要提高 I/O 域应对此问题的弹性,请在其 /etc/system 文件中配置以下设置:

set pxsoft:pxsoft_resume_max_retries=1024

此设置仅影响 I/O 域中虚拟功能的恢复操作。必须重新引导 I/O 域才能使此新设置生效。

缓解

如果为 I/O 域分配了来自同一 PCIe 总线中多个物理功能的多个虚拟功能,将会出现此问题。如果在 I/O 域中仅从该 PCIe 总线的单一物理功能分配虚拟功能,则会避免出现此问题。