Ce problème affecte les deux serveurs.
Les serveurs de la série SPARC M7 comportent des SPM redondants, ce qui signifie qu'un seul des SPM est le SPM de domaine physique qui prend en charge la communication entre l'hôte et Oracle ILOM. Seul le SPM PDomain active les périphériques de stockage USB Ethernet et USB qui sont utilisés pour la prise en charge de l'interface d'interconnexion et les services KVMS . Les périphériques PCIe et USB pour ce SPM sont configurés dans le système, contrairement aux périphériques PCIe pour les autres SPM.
Lors d'un basculement de SP, les périphériques USB sont retirés de l'ancien SPM PDomain. Les périphériques PCIe et USB pour le nouveau SPM PDomain sont ajoutés, puis les périphériques PCIe pour l'ancien SPM sont retirés. Si le système de fichiers pour le KVMS host_storage_device n'est pas démonté correctement par le système lors du retrait du périphérique de stockage USB, le retrait PCIe de l'ancien SPM échoue.
Oracle ILOM vérifie les périphériques PCIe et tente de les retirer toutes les 60 secondes jusqu'à ce que l'opération aboutisse. Aucun service sur l'hôte n'est affecté, mis à part les messages d'erreur envoyés. Les tentatives de préparation du SPM inactif en vue de son retrait échouent car la liaison PCIe est toujours en cours d'utilisation. L'erreur suivante est envoyée sur la console hôte toutes les 60 secondes lorsqu'Oracle ILOM tente de retirer les périphériques PCIe du SPM inactif :
Oct 1 18:57:06 sca-m78-185-pd1 syseventconfd[317]: process 20325 exited with status 5 Oct 1 18:58:08 sca-m78-185-pd1 syseventconfd[317]: process 20369 exited with status 5 Oct 1 18:59:10 sca-m78-185-pd1 syseventconfd[317]: process 20415 exited with status 5 Oct 1 19:00:11 sca-m78-185-pd1 syseventconfd[317]: process 20458 exited with status 5 Oct 1 19:01:13 sca-m78-185-pd1 syseventconfd[317]: process 20501 exited with status 5 Oct 1 19:02:15 sca-m78-185-pd1 syseventconfd[317]: process 20564 exited with status 5 Oct 1 19:03:16 sca-m78-185-pd1 syseventconfd[317]: process 20607 exited with status 5
Pour confirmer que vous avez rencontré ce problème, vérifiez que l'hôte affiche plusieurs chemins de SPM configurés et que le retrait des périphériques PCIe du SPM inactif échoue en raison d'un système de fichiers monté.
Dans Oracle Solaris, saisissez :
root@host-name-pd1:~# cfgadm | grep SPM /SYS/SP0/SPM1 pci-pci/hp connected configured ok /SYS/SP1/SPM1 pci-pci/hp connected configured ok
Dans la CLI d'Oracle ILOM, déterminez quel SPM est le SPM PDomain en cours :
-> show /Servers/PDomains/PDomain_1/HOST sp_name /Servers/PDomains/PDomain_1/HOST Properties: sp_name = /SYS/SP1/SPM1
Sur la console hôte, confirmez que le retrait du SPM inactif a échoué en raison d'un système de fichiers monté. Cette commande ne corrige pas le problème.
root@host-name-pd0:~# cfgadm -c disconnect /SYS/SP0/SPM1 cfgadm: Component system is busy, try again: Resource Information --------------------------------------------------------------------------------- /dev/dsk/c8t0d0s2 mounted filesystem "/media/versaboot_aiconf_on12_boot_sparc"
Solution de contournement : ne lancez pas de basculement de SP si vous rencontrez ce problème.
Récupération : procédez comme suit :
Sur la console hôte, saisissez la commande eject pour supprimer la référence au périphérique USB retiré. Un message d'erreur peut s'afficher, mais la condition d'erreur est supprimée, autorisant ainsi le retrait PCIe des périphériques.
root@host-name-pd1:~# eject eject of cdrom /dev/dsk/c8t0d0s2 failed: /dev/rdsk/c8t0d0s2: No such device or address
Attendez quelques minutes, puis vérifiez que les périphériques PCIe ont été retirés.
root@host-name-pd1:~# cfgadm | grep SPM /SYS/SP0/SPM1 unknown empty unconfigured unknown /SYS/SP1/SPM1 pci-pci/hp connected configured ok