Go to main content

SPARC M7 シリーズサーバープロダクトノート

印刷ビューの終了

更新: 2017 年 3 月
 
 

SPARC M7 SP のフェイルオーバーがマウント済みの重要でないミニルートイメージからの PCIe デバイスを削除できない (21549933)

この問題は、両方のサーバーに影響を及ぼします。


注 -  この問題には SP のフェイルオーバーが伴います。SP フェイルオーバーに関するすべての問題を理解するには、プラットフォームユーザーガイドラインを参照してください。

SPARC M7 シリーズサーバーには冗長 SPM があります。これは、複数の SPM のうちの 1 つのみがホストと Oracle ILOM 間の通信をサポートする PDomain SPM であることを意味します。PDomain SPM のみが、インターコネクトインタフェースおよび KVMS サービスをサポートするために使用される USB Ethernet と USB ストレージデバイスを有効にします。この SPM についての PCIe および USB デバイスがシステムに構成されますが、ほかの SPM についての PCIe デバイスは構成されません。

SP のフェイルオーバー中に、USB デバイスは古い PDomain SPM から削除されます。新しい PDomain SPM の PCIe および USB デバイスが追加され、古い SPM の PCIe デバイスが削除されます。USB ストレージデバイスが存在しなくなったときに KVMS host_storage_device のファイルシステムがシステムによって正常にアンマウントされない場合、古い SPM についての PCIe の削除が失敗します。

Oracle ILOM は削除に成功するまで 60 秒ごとに PCIe デバイスをチェックして削除しようとします。表示されるエラーメッセージ以外のホスト上のサービスは影響を受けません。非アクティブな SPM の削除の準備をする試行は、PCIe リンクがまだ使用中であるため失敗します。Oracle ILOM が非アクティブな SPM についての PCIe デバイスを削除しようとすると、次のエラーが 60 秒ごとにホストコンソールに送信されます。

       Oct  1 18:57:06 sca-m78-185-pd1 syseventconfd[317]: process 20325
exited with status 5
       Oct  1 18:58:08 sca-m78-185-pd1 syseventconfd[317]: process 20369
exited with status 5
       Oct  1 18:59:10 sca-m78-185-pd1 syseventconfd[317]: process 20415
exited with status 5
       Oct  1 19:00:11 sca-m78-185-pd1 syseventconfd[317]: process 20458
exited with status 5
       Oct  1 19:01:13 sca-m78-185-pd1 syseventconfd[317]: process 20501
exited with status 5
       Oct  1 19:02:15 sca-m78-185-pd1 syseventconfd[317]: process 20564
exited with status 5
       Oct  1 19:03:16 sca-m78-185-pd1 syseventconfd[317]: process 20607
exited with status 5

この問題が発生したことを確認するには、ホストに構成されている複数の SPM パスがホストに表示されていること、およびマウント済みファイルシステムが原因で非アクティブな SPM の PCIe デバイスの削除に失敗したことを確認します。

Oracle Solaris から、次のように入力します。

root@host-name-pd1:~# cfgadm | grep SPM

/SYS/SP0/SPM1     pci-pci/hp    connected    configured       ok
/SYS/SP1/SPM1     pci-pci/hp    connected    configured       ok

Oracle ILOM CLI で、どの SPM が現在の PDomain SPM であるかを判別します。

-> show /Servers/PDomains/PDomain_1/HOST sp_name

  /Servers/PDomains/PDomain_1/HOST
      Properties:
      sp_name = /SYS/SP1/SPM1

ホストコンソールで、マウント済みファイルシステムが原因で非アクティブな SPM の削除に失敗したことを確認します。このコマンドは、問題を修正しません。

root@host-name-pd0:~# cfgadm -c disconnect /SYS/SP0/SPM1

cfgadm: Component system is busy, try again:

Resource                                Information
---------------------------------------------------------------------------------

/dev/dsk/c8t0d0s2   mounted filesystem  "/media/versaboot_aiconf_on12_boot_sparc"

回避方法: この問題が発生した場合は、SP のフェイルオーバーを開始しないでください。

回復方法: 次の手順を実行します。

  1. ホストコンソールで、eject コマンドを入力して、削除された USB デバイスへの参照をクリアします。エラーメッセージが表示されることがありますが、エラー状態がクリアされ、PCIe デバイスの削除が可能になります。

    root@host-name-pd1:~# eject
    
    eject of cdrom /dev/dsk/c8t0d0s2 failed: /dev/rdsk/c8t0d0s2: No such device or address
  2. 数分待ってから、PCIe デバイスが削除されていることを確認します。

    root@host-name-pd1:~# cfgadm | grep SPM
    
    /SYS/SP0/SPM1      unknown      empty        unconfigured     unknown
    /SYS/SP1/SPM1      pci-pci/hp   connected    configured       ok