この問題は、両方のサーバーに影響を及ぼします。
SPARC M7 シリーズサーバーには冗長 SPM があります。これは、複数の SPM のうちの 1 つのみがホストと Oracle ILOM 間の通信をサポートする PDomain SPM であることを意味します。PDomain SPM のみが、インターコネクトインタフェースおよび KVMS サービスをサポートするために使用される USB Ethernet と USB ストレージデバイスを有効にします。この SPM についての PCIe および USB デバイスがシステムに構成されますが、ほかの SPM についての PCIe デバイスは構成されません。
SP のフェイルオーバー中に、USB デバイスは古い PDomain SPM から削除されます。新しい PDomain SPM の PCIe および USB デバイスが追加され、古い SPM の PCIe デバイスが削除されます。USB ストレージデバイスが存在しなくなったときに KVMS host_storage_device のファイルシステムがシステムによって正常にアンマウントされない場合、古い SPM についての PCIe の削除が失敗します。
Oracle ILOM は削除に成功するまで 60 秒ごとに PCIe デバイスをチェックして削除しようとします。表示されるエラーメッセージ以外のホスト上のサービスは影響を受けません。非アクティブな SPM の削除の準備をする試行は、PCIe リンクがまだ使用中であるため失敗します。Oracle ILOM が非アクティブな SPM についての PCIe デバイスを削除しようとすると、次のエラーが 60 秒ごとにホストコンソールに送信されます。
Oct 1 18:57:06 sca-m78-185-pd1 syseventconfd[317]: process 20325 exited with status 5 Oct 1 18:58:08 sca-m78-185-pd1 syseventconfd[317]: process 20369 exited with status 5 Oct 1 18:59:10 sca-m78-185-pd1 syseventconfd[317]: process 20415 exited with status 5 Oct 1 19:00:11 sca-m78-185-pd1 syseventconfd[317]: process 20458 exited with status 5 Oct 1 19:01:13 sca-m78-185-pd1 syseventconfd[317]: process 20501 exited with status 5 Oct 1 19:02:15 sca-m78-185-pd1 syseventconfd[317]: process 20564 exited with status 5 Oct 1 19:03:16 sca-m78-185-pd1 syseventconfd[317]: process 20607 exited with status 5
この問題が発生したことを確認するには、ホストに構成されている複数の SPM パスがホストに表示されていること、およびマウント済みファイルシステムが原因で非アクティブな SPM の PCIe デバイスの削除に失敗したことを確認します。
Oracle Solaris から、次のように入力します。
root@host-name-pd1:~# cfgadm | grep SPM /SYS/SP0/SPM1 pci-pci/hp connected configured ok /SYS/SP1/SPM1 pci-pci/hp connected configured ok
Oracle ILOM CLI で、どの SPM が現在の PDomain SPM であるかを判別します。
-> show /Servers/PDomains/PDomain_1/HOST sp_name /Servers/PDomains/PDomain_1/HOST Properties: sp_name = /SYS/SP1/SPM1
ホストコンソールで、マウント済みファイルシステムが原因で非アクティブな SPM の削除に失敗したことを確認します。このコマンドは、問題を修正しません。
root@host-name-pd0:~# cfgadm -c disconnect /SYS/SP0/SPM1 cfgadm: Component system is busy, try again: Resource Information --------------------------------------------------------------------------------- /dev/dsk/c8t0d0s2 mounted filesystem "/media/versaboot_aiconf_on12_boot_sparc"
回避方法: この問題が発生した場合は、SP のフェイルオーバーを開始しないでください。
回復方法: 次の手順を実行します。
ホストコンソールで、eject コマンドを入力して、削除された USB デバイスへの参照をクリアします。エラーメッセージが表示されることがありますが、エラー状態がクリアされ、PCIe デバイスの削除が可能になります。
root@host-name-pd1:~# eject eject of cdrom /dev/dsk/c8t0d0s2 failed: /dev/rdsk/c8t0d0s2: No such device or address
数分待ってから、PCIe デバイスが削除されていることを確認します。
root@host-name-pd1:~# cfgadm | grep SPM /SYS/SP0/SPM1 unknown empty unconfigured unknown /SYS/SP1/SPM1 pci-pci/hp connected configured ok