Go to main content

SPARC M7 系列服务器产品说明

退出打印视图

更新时间: 2017 年 3 月
 
 

分配的 IOV 设备上发生 Virtual_TTE_invalid 错误 (22138210)

此问题同时影响两个服务器。

在重新引导了主域或根域时,会通知 I/O 域暂停其中分配的虚拟功能,然后在重新引导完成时恢复它们。在有些情况下,恢复通知可能会过早发出,导致 I/O 域未能恢复一个或多个分配的虚拟功能。该问题仅在 I/O 域上的 LDoms 故障策略未设置或设置为 ignore 时适用。

如果发生了这样的故障,可能会出现两种症状。一种症状是向其分配了物理功能的主域或根域中报告 FMA 错误。另一种症状是在 I/O 域中的控制台上出现警告(也记录在 /var/adm/messages 中)。可能在主域或根域中出现的 FMA 错误报告是 ereport.io.pciex.rc.epkt,其中将包含以下字符串:

event_name = Virtual_TTE_invalid

要验证是否遇到此问题,请使用 fmdump -eV 命令确定包含 event_name 字符串的 FMA 错误报告。在 I/O 域中显示的警告为:

WARNING: pxsoft_msi_resume: retry limit exceeded.

如果发生该问题,则一个或多个分配的虚拟功能在 I/O 域中将不再正常起作用。受影响的虚拟功能的设备驱动程序将无法处理来自底层硬件设备的任何中断信号。

解决方法:如果通过同一个 PCIe 总线上的多个物理功能为某个 I/O 域分配了多个虚拟功能,则会发生此问题。如果仅通过该 PCIe 总线的单个物理功能分配虚拟功能,则可避免此问题。

恢复:必须重新引导 I/O 域才能从此问题中恢复,并恢复对受影响的虚拟功能的正常使用。

要使 I/O 域对此问题有更大的弹性,可以将以下设置添加到 /etc/system 文件中:

set pxsoft:pxsoft_resume_max_retries=1024

必须重新引导 I/O 域才能让此设置生效。