Go to main content

Notes de produit des serveurs de la série SPARC M7

Quitter la vue de l'impression

Mis à jour : Mars 2017
 
 

Le basculement de SP SPARC M7 ne peut pas supprimer les périphériques PCIe de l'image du miniroot non Golden montée (21549933)

Ce problème affecte les deux serveurs.


Remarque -  Ce problème implique un basculement de SP. Pour comprendre tous les problèmes liés au basculement d'un SP, reportez-vous à la section Instructions relatives aux utilisateurs de la plate-forme.

Les serveurs de la série SPARC M7 comportent des SPM redondants, ce qui signifie qu'un seul des SPM est le SPM de domaine physique qui prend en charge la communication entre l'hôte et Oracle ILOM. Seul le SPM PDomain active les périphériques de stockage USB Ethernet et USB qui sont utilisés pour la prise en charge de l'interface d'interconnexion et les services KVMS . Les périphériques PCIe et USB pour ce SPM sont configurés dans le système, contrairement aux périphériques PCIe pour les autres SPM.

Lors d'un basculement de SP, les périphériques USB sont retirés de l'ancien SPM PDomain. Les périphériques PCIe et USB pour le nouveau SPM PDomain sont ajoutés, puis les périphériques PCIe pour l'ancien SPM sont retirés. Si le système de fichiers pour le KVMS host_storage_device n'est pas démonté correctement par le système lors du retrait du périphérique de stockage USB, le retrait PCIe de l'ancien SPM échoue.

Oracle ILOM vérifie les périphériques PCIe et tente de les retirer toutes les 60 secondes jusqu'à ce que l'opération aboutisse. Aucun service sur l'hôte n'est affecté, mis à part les messages d'erreur envoyés. Les tentatives de préparation du SPM inactif en vue de son retrait échouent car la liaison PCIe est toujours en cours d'utilisation. L'erreur suivante est envoyée sur la console hôte toutes les 60 secondes lorsqu'Oracle ILOM tente de retirer les périphériques PCIe du SPM inactif :

       Oct  1 18:57:06 sca-m78-185-pd1 syseventconfd[317]: process 20325
exited with status 5
       Oct  1 18:58:08 sca-m78-185-pd1 syseventconfd[317]: process 20369
exited with status 5
       Oct  1 18:59:10 sca-m78-185-pd1 syseventconfd[317]: process 20415
exited with status 5
       Oct  1 19:00:11 sca-m78-185-pd1 syseventconfd[317]: process 20458
exited with status 5
       Oct  1 19:01:13 sca-m78-185-pd1 syseventconfd[317]: process 20501
exited with status 5
       Oct  1 19:02:15 sca-m78-185-pd1 syseventconfd[317]: process 20564
exited with status 5
       Oct  1 19:03:16 sca-m78-185-pd1 syseventconfd[317]: process 20607
exited with status 5

Pour confirmer que vous avez rencontré ce problème, vérifiez que l'hôte affiche plusieurs chemins de SPM configurés et que le retrait des périphériques PCIe du SPM inactif échoue en raison d'un système de fichiers monté.

Dans Oracle Solaris, saisissez :

root@host-name-pd1:~# cfgadm | grep SPM

/SYS/SP0/SPM1     pci-pci/hp    connected    configured       ok
/SYS/SP1/SPM1     pci-pci/hp    connected    configured       ok

Dans la CLI d'Oracle ILOM, déterminez quel SPM est le SPM PDomain en cours :

-> show /Servers/PDomains/PDomain_1/HOST sp_name

  /Servers/PDomains/PDomain_1/HOST
      Properties:
      sp_name = /SYS/SP1/SPM1

Sur la console hôte, confirmez que le retrait du SPM inactif a échoué en raison d'un système de fichiers monté. Cette commande ne corrige pas le problème.

root@host-name-pd0:~# cfgadm -c disconnect /SYS/SP0/SPM1

cfgadm: Component system is busy, try again:

Resource                                Information
---------------------------------------------------------------------------------

/dev/dsk/c8t0d0s2   mounted filesystem  "/media/versaboot_aiconf_on12_boot_sparc"

Solution de contournement : ne lancez pas de basculement de SP si vous rencontrez ce problème.

Récupération : procédez comme suit :

  1. Sur la console hôte, saisissez la commande eject pour supprimer la référence au périphérique USB retiré. Un message d'erreur peut s'afficher, mais la condition d'erreur est supprimée, autorisant ainsi le retrait PCIe des périphériques.

    root@host-name-pd1:~# eject
    
    eject of cdrom /dev/dsk/c8t0d0s2 failed: /dev/rdsk/c8t0d0s2: No such device or address
  2. Attendez quelques minutes, puis vérifiez que les périphériques PCIe ont été retirés.

    root@host-name-pd1:~# cfgadm | grep SPM
    
    /SYS/SP0/SPM1      unknown      empty        unconfigured     unknown
    /SYS/SP1/SPM1      pci-pci/hp   connected    configured       ok