第 1 章 Oracle VM Server for SPARC 3.1.1.2、3.1.1.1、3.1.1 和 3.1 发行说明
Oracle VM Server for SPARC 3.1.1.2 维护更新
Oracle VM Server for SPARC 3.1.1.1 维护更新
Oracle VM Server for SPARC 3.1.1.1 维护更新中的新增功能
Oracle VM Server for SPARC 3.1.1 发行版中的新增功能
Oracle VM Server for SPARC 3.1 发行版中的新增功能
Oracle VM Server for SPARC 3.1.1.1 维护更新所需的 Oracle Solaris OS 版本
Oracle VM Server for SPARC 3.1.1 必需的 Oracle Solaris OS 版本
Oracle VM Server for SPARC 3.1 必需的 Oracle Solaris OS 版本
启用最新 Oracle VM Server for SPARC 功能所必需的软件
Oracle VM Server for SPARC 软件的位置
可以与 Oracle VM Server for SPARC 软件一起使用的软件
与 Oracle VM Server for SPARC 交互的系统控制器软件
升级到当前 Oracle VM Server for SPARC 软件
升级到 Oracle VM Server for SPARC 3.1.1.1 软件
升级到 Oracle VM Server for SPARC 3.1.1 软件
升级到 Oracle VM Server for SPARC 3.1 软件
已过时的 Oracle VM Server for SPARC 功能
当分配的 CPU 多于 1024 个时来宾域无法运行 Oracle Solaris 10 OS
从低于 Oracle Solaris 10 5/08 OS 的 Oracle Solaris 10 OS 升级
在某些情况下,来宾域的 Solaris Volume Manager 配置或元设备可能会丢失
如何查找来宾域的 Solaris Volume Manager 配置或元设备
彻底关闭 Oracle VM Server for SPARC 系统并对该系统执行关开机循环
Oracle Sun SNMP Management Agent 不支持多个域
ldmp2v convert 命令:引导期间出现 VxVM 警告消息
如果将多个虚拟交换机分配给一个网络适配器,则 Oracle VM Server for SPARC 3.1 ldmd 守护进程不会启动
只分配有一个虚拟 CPU 的域在实时迁移期间可能会出现紧急情况
Oracle VM Server for SPARC MIB 问题
使用版本 2 或版本 3 选项时 snmptable 命令不起作用
重新引导将 SR-IOV 虚拟功能分配给来宾域的 Oracle Solaris 10 根域时,很少情况下会出现错误的陷阱紧急情况。
销毁 SR-IOV 虚拟功能后,prtdiag 可能会导致 Oracle Solaris 10 根域出现紧急情况。
影响 Oracle VM Server for SPARC 软件的错误
影响 Oracle VM Server for SPARC 3.1.1.2 软件的错误
迁移来宾域后 format 命令挂起或者来宾域控制台不接受输入
影响 Oracle VM Server for SPARC 3.1.1.1 软件的错误
实时迁移可能失败,出现错误:Unable to restore ldc resource state on target Domain Migration of LDom failed
恢复模式失败,出现错误:ldmd in Maintenance Mode When Virtual Switch net-dev Is Missing
迁移到 SPARC M5 或 SPARC T5 系统可能会出现紧急情况,出现错误:suspend: get stick freq failed
Logical Domains Manager 不禁止创建循环依赖关系
影响 Oracle VM Server for SPARC 3.1.1 软件的错误
较大的 LDC 数量可能导致来宾域中出现 Oracle Solaris 问题
Sun Storage 16 Gb 光纤通道通用 HBA 固件不支持带宽控制
在执行跨 CPU 迁移后添加内存可能会导致来宾域出现紧急情况
尝试绑定处于正在绑定或正在解除绑定状态的域时,ldmd 会进行核心转储
影响 Oracle VM Server for SPARC 3.1 软件的错误
ldmd 服务由于创建 virtual-channel@0:hvctl 存在延迟而无法启动
在延迟重新配置中先于 CPU 分配内存时控制域上的关联性较差
无法在使用 EFI GPT 磁盘标签的单分片虚拟磁盘上安装 Oracle Solaris 11.1 OS
在成功的核心重映射操作后尝试调整来宾域的虚拟 CPU 的大小可能会失败
Oracle Solaris 10:当 failure-policy=reset 时,非 primary 根域在 primary 根域重新引导时挂起
迁移故障: Invalid Shutdown-group: 0
误允许将域从运行系统固件 8.3 的 SPARC T4 系统迁移到 SPARC T5、SPARC M5 或 SPARC M6 系统
来宾域在 lgrp_lineage_add(mutex_enter: bad mutex, lp=10351178) 处出现紧急情况
当虚拟网络设备驱动程序在 TxDring 模式下运行时,极少情况下会出现紧急情况
只分配有一个虚拟 CPU 的域在实时迁移期间可能会出现紧急情况
当从 SPARC T5、SPARC M5 或 SPARC M6 系统向 UltraSPARC T2 或 SPARC T3 系统执行跨 CPU 迁移时,ldm migrate -n 应该会失败
恢复模式应当支持移除非 primary 根域中的 PCIe 插槽
ldm list 没有显示物理 I/O 设备的 evacuated 属性
在压力下对来宾域使用 ldm stop 命令时会出现 send_mondo_set: timeout 紧急情况
在附加 I/O 设备驱动程序时,WARNING: ddi_intr_alloc: cannot fit into interrupt pool 指出中断供应已耗尽
SPARC M5-32 和 SPARC M6-32:panic: mpo_cpu_add: Cannot read MD
SPARC M5-32 和 SPARC M6-32:可通过多个直接 I/O 路径访问的磁盘会出现问题
重新引导 primary 域后,SR-IOV 域中的 ixgbevf 设备可能会变为禁用状态
重新引导 Oracle Solaris 10 1/13 primary 域可能不会自动为虚拟功能接口激活或分配 IP 地址
仅限 Oracle Solaris 10:在重新引导或关闭期间,mutex_enter: bad mutex 在 primary 域中出现紧急情况
SPARC M5-32 和 SPARC M6-32:LSI-SAS 控制器不正确地导出为支持 SR-IOV
SPARC T5-8:对于某些 ldm 列表命令,运行时间数据显示了值 0
在 SPARC T5-1B 系统的 primary 域中,无法为 sxge 虚拟功能设置大型 MTU
ldmd 无法设置 sxge 设备的 mac-addr 和 alt-mac-addrs 属性值
SPARC T5-1B 系统上 sxge 设备的 ldm list-io -d 输出缺少两个属性
具有 HIO 虚拟网络且 cpu-arch=generic 的来宾域迁移发生超时并一直等待该域暂停
将 threading 属性值从 max-throughput 更改为 max-ipc 时来宾域出现紧急情况
在具有两个活动直接 I/O 域的情况下控制域在重新引导时挂起
对包含混合 I/O 网络设备的来宾域解除绑定或进行迁移时,primary 域或来宾域出现紧急情况
将控制域从使用整体核心更改为使用部分核心时发出不正确的错误消息
ldm init-system 命令可能无法正确恢复已执行了物理 I/O 更改的域配置
您尝试同时修改许多域时 Logical Domains Manager 可能会崩溃并重新启动
在迁移到 SPARC T4 系统过程中运行 cputrack 命令时,来宾域出现紧急情况
Oracle Solaris 11:DRM 窃取操作报告 Oracle Solaris DR 失败并重试
进行跨 CPU 迁移的来宾域在迁移完成后报告的运行时间不正确
Oracle Solaris 10:使用 Intel Dual Port Ethernet Controller X540 卡引导时,ixgbe 驱动程序可能会导致出现紧急情况
应该对具有 PCIe 到 PCI 桥的 PCIe 卡禁用 ldm remove-io
如果在 ldm start 命令后立即发出 ldm stop 命令,后者可能会失败
init-system 无法从保存的 XML 文件为来宾域恢复指定的核心约束
重新引导分配了大量虚拟功能的 primary 域时系统出现紧急情况
使用部分核心的 primary 域无法进行整体核心 DR 转换
引导后,ldm list-io 命令显示 UNK 或 INV 状态
在 SPARC T4-4 系统上迁移内存非常大的域会导致目标系统上的域出现紧急情况
无法使用 Oracle Solaris 热插拔操作来热删除 PCIe 端点设备
迁移包含混合 I/O 和虚拟 I/O 虚拟网络设备的来宾域时,nxge 出现紧急情况
如果系统日志服务不联机,Logical Domains 代理服务就无法联机
DRM 和 ldm list 输出显示的虚拟 CPU 数与来宾域中的实际虚拟 CPU 数不符
对依赖于目标计算机上的非活动主域的域进行实时迁移导致 ldmd 发生故障并具有分段故障
删除策略或策略过期后,DRM 无法为迁移后的域恢复默认数量的虚拟 CPU
当系统 MAC 地址与其他 MAC 地址发生冲突时,不报告迁移失败原因
设置了弹性策略并且在运行 Oracle Solaris 10 8/11 OS 的系统可能会挂起
pkgadd 无法在 /var/svc/manifest/platform/sun4v/ldmd.xml 上设置 ACL 项
SPARC T3-1:可通过多个直接 I/O 路径访问的磁盘会出现问题
对多个已激活的 NIU nxge 实例执行内存 DR 删除操作可能会无限期挂起而且永远无法完成
对具有主-从关系的域使用 ldm stop -a 命令会在从域中设置 stopping 标志
迁移启用了默认 DRM 策略的域导致为目标域指定所有可用的 CPU
当 cpu0 处于脱机状态时,可能会阻止对 Oracle Solaris 域进行非协同迁移
当目标 OS 不支持对加密单元执行 DR 时,具有 MAU 的迁移域仅包含一个 CPU
PCI Express Dual 10-Gigabit Ethernet Fiber 卡在 ldm list-io -l 输出中显示四个子设备
将 Logical Domains mpgroup 与 MPXIO 存储阵列配置一起使用以实现磁盘高可用性
Oracle Solaris 11:配置有自动网络接口的区域可能无法启动
Oracle Solaris 10:未在控制域中正确创建虚拟网络设备
如果配置了 Logical Domains,则新添加的 NIU/XAUI 适配器在主机操作系统中不可见
当计算机未联网而且 NIS 客户机正在运行时,Logical Domains Manager 不启动
当迁移后的域已经引导时,Logical Domains Manager 将这些域显示为处于过渡状态
有时,从 Logical Domains 系统执行 uadmin 1 0 命令时系统不返回到 OK 提示符
Logical Domains Manager 关闭域至少需要 15 分钟
在同一个网络上有太多虚拟网络使用 DHCP 的来宾域可能会变得不响应
运行 Logical Domains Manager 时无法使用 eeprom 命令修改 OpenBoot PROM 变量
ldm1M 手册页:描述了有关使用 mblock 属性的限制
ldm1M 手册页:改进了对 ldm list -o status 命令的描述
ldm1M 手册页:仅 ldm add-spconfig -r 执行手动恢复
《Oracle VM Server for SPARC 3.1 管理指南》光纤通道 SR-IOV OS 要求不正确
Oracle VM Server for SPARC 3.1.1.2 发行版中解决的问题
Oracle VM Server for SPARC 3.1.1.1 发行版中解决的问题
Oracle VM Server for SPARC 3.1.1 发行版中解决的问题
错误号 18323562:重新引导时,Oracle Solaris 10 根域可能会出现紧急情况。Oracle Solaris 10 根域至少有两个 PCIe 总线,来自不同总线中物理功能的虚拟功能将分配给来宾域。即,如果并行接收来宾域上不同总线的事件,则根域可能会出现紧急情况。此紧急情况很少出现。
panic[cpu3]/thread=2a100365c80: BAD TRAP: type=31 rp=2a1003652b0 addr=2000 mmu_fsr=0 occurred in module "pcie" due to an illegal access to a user address
解决方法:无。
错误号 18323370:如果销毁虚拟功能,然后运行 prtdiag 命令,Oracle Solaris 10 根域可能会出现紧急情况。
尝试访问刚销毁的虚拟功能设备节点时,prtdiag 命令可能会导致出现紧急情况。
panic[cpu31]/thread=2a10140bc80: Fatal error has occured in: PCIe fabric.(0x1)(0x43)
prtdiag 命令会输出如下所示的消息:
DEV_GET failed -1 Invalid argument 4.0.2 offset 0xff /SYS/PCI-EM4 PCIE fibre-channel-pciex10df,e200 -- /pci@600/pci@1/pci@0/pci@4/fibre-channel@0,2
出现这些消息的原因是,prtdiag 命令尝试访问已销毁的虚拟功能设备节点。这些节点仍出现在 picl 树中,但在实际设备树中并不存在。
解决方法:要避免出现紧急情况,请在 Oracle Solaris 10 根域上将以下行添加到 /etc/system 文件。
set px:pxtool_cfg_delay_usec=25000
此外,刷新 picl 守护进程以避免出现 Invalid argument 消息:
# svcadm refresh picl
错误号 18030411:如果频繁并连续地快速停止又启动 I/O 域,则 primary 域可能会挂起。此行为的后果是 InfiniBand HCA 停止响应并导致 primary 域挂起。
如果遇到此问题,可能会在控制台上或者在 messages 文件中看到类似以下内容的消息:
VF3: PF has failed Mcxnex: HW2SW_MPT command @ failed: 0000ffff Hermon: MAD_IFC (port 01) command failed: 0000ffff WARNING: mcxnex0: Device Error: HCR Timeout waiting for command go bit
恢复:为避免此问题,不要对 I/O 域执行不必要的停止又启动操作。而应对 I/O 域执行有序的关闭操作。
解决方法:如果 primary 域由于此原因而挂起,请以下列方法之一来复位系统:
对域执行重新引导
primary# ldm stop -r domain-name
在 SP 中执行复位
-> reset /SYS
错误号 17623156:创建光纤通道虚拟功能时,您可能会看到以下警告:
WARNING: kmem_cache_destroy: 'px0_emlxs3_3_cache2' (3000383e030) not empty WARNING: vmem_destroy('px0_emlxs3_3_vmem_top'): leaked 262144 identifiers
这些消息不影响系统的正常运行,您可以将其忽略。
解决方法:无。
错误号 16397888:在添加或销毁虚拟功能后,可能需要等待五分钟后才能再次尝试添加或销毁基于光纤通道物理功能的其他虚拟功能。
如果在五分钟内尝试执行这些操作,则操作将失败并显示类似于以下内容的消息:
The attempt to offline the pf /SYS/PCI-EM4/IOVFC.PF0 in domain primary failed. Error message from svc:/ldoms/agents in domain primary: CMD_OFFLINE Failed. ERROR: devices or resources are busy.
解决方法:等待五分钟,然后再尝试对光纤通道物理功能执行其他 IOV 操作。
要在单个命令中执行所有必需的配置选项,请使用 ldm create-vf -n max 或 ldm destroy-vf -n max 命令。
在 Fujitsu M10 系统上,您可以将 PCIe 端点设备和 SR-IOV 虚拟功能从特定的 PCIe 总线分配到最多 24 个域。而在 SPARC T 系列和 SPARC M 系列平台上,您可以将 PCIe 端点设备和 SR-IOV 虚拟功能从特定的 PCIe 总线分配到最多 15 个域。
注意 - 在 Oracle VM Server for SPARC 3.1 环境中部署 InfiniBand SR-IOV 之前,请先阅读本节。 |
本节介绍了 Oracle VM Server for SPARC 3.1 的初始发行版中有关 InfiniBand SR-IOV 功能的已知问题。
重新引导分配有 InfiniBand 虚拟功能的 Oracle Solaris 11.1.10.5.0 I/O 域偶尔会使相应的根域出现紧急情况。请参见错误号 17336355。
分配有 InfiniBand 虚拟功能的 Oracle Solaris 10 1/13 I/O 域在重新引导过程中有时候会出现紧急情况。I/O 域运行 Oracle Solaris 10 1/13 OS 加上必需的修补程序。请参见错误号 17382933、17361763、17329218 和 17336035。
错误号 16979993:尝试对 InfiniBand 设备使用动态 SR-IOV 操作导致混淆和不合适的错误消息。
InfiniBand 设备不支持动态 SR-IOV。
解决方法:通过执行以下过程之一管理 InfiniBand 虚拟功能: