Go to main content

SPARC M7 시리즈 서버 제품 안내서

인쇄 보기 종료

업데이트 날짜: 2017년 3월
 
 

SPARC M7 SP 페일오버로 마운트된 비황금 미니루트 이미지에서 PCIe 장치를 제거할 수 없음(21549933)

이 문제는 두 서버 모두에 영향을 줍니다.


주 -  이 문제는 SP 페일오버와 관련이 있습니다. SP 페일오버와 관련된 모든 문제를 이해하기 위해서는 플랫폼 사용자 지침을 참조하십시오.

SPARC M7 시리즈 서버에 중복 SPM이 있습니다. 즉, SPM 중 하나만 호스트와 Oracle ILOM 간 통신을 지원하는 PDomain SPM입니다. PDomain SPM만 상호 연결 인터페이스 및 KVMS 서비스 지원을 위해 사용되는 USB 이더넷 및 USB 저장 장치를 사용으로 설정합니다. 이 SPM에 대한 PCIe 및 USB 장치가 시스템에 구성되었지만, 다른 SPM에 대한 PCIe 장치는 구성되지 않았습니다.

SP 페일오버 중에 USB 장치가 이전 PDomain SPM에서 제거됩니다. 새 PDomain SPM에 대한 PCIe 및 USB 장치가 추가된 후 이전 SPM에 대한 PCIe 장치가 제거됩니다. USB 저장 장치가 사라질 때 KVMS host_storage_device에 대한 파일 시스템이 시스템에서 성공적으로 마운트 해제되지 않으면 오래된 SPM의 PCIe 제거가 실패합니다.

Oracle ILOM은 제거가 성공할 때까지 60초마다 PCIe 장치를 확인하고 제거하려고 시도합니다. 게시된 오류 메시지 이외의 호스트에 있는 서비스는 영향을 받지 않습니다. PCIe 링크가 계속 사용 중이기 때문에 비활성 SPM을 제거하려고 준비하려는 시도가 실패합니다. 비활성 SPM에 대해 Oracle ILOM이 PCIe 장치를 제거하려고 시도할 때는 호스트 콘솔에 60초마다 다음 오류가 게시됩니다.

       Oct  1 18:57:06 sca-m78-185-pd1 syseventconfd[317]: process 20325
exited with status 5
       Oct  1 18:58:08 sca-m78-185-pd1 syseventconfd[317]: process 20369
exited with status 5
       Oct  1 18:59:10 sca-m78-185-pd1 syseventconfd[317]: process 20415
exited with status 5
       Oct  1 19:00:11 sca-m78-185-pd1 syseventconfd[317]: process 20458
exited with status 5
       Oct  1 19:01:13 sca-m78-185-pd1 syseventconfd[317]: process 20501
exited with status 5
       Oct  1 19:02:15 sca-m78-185-pd1 syseventconfd[317]: process 20564
exited with status 5
       Oct  1 19:03:16 sca-m78-185-pd1 syseventconfd[317]: process 20607
exited with status 5

발생한 문제가 이 문제인지 확인하려면 호스트에 구성된 여러 SPM 경로가 호스트에 표시되고 비활성 SPM의 PCIe 장치 제거가 마운트된 파일 시스템으로 인해 실패하는지 확인합니다.

Oracle Solaris에서 다음을 입력합니다.

root@host-name-pd1:~# cfgadm | grep SPM

/SYS/SP0/SPM1     pci-pci/hp    connected    configured       ok
/SYS/SP1/SPM1     pci-pci/hp    connected    configured       ok

Oracle ILOM CLI에서 현재 PDomain SPM인 SPM을 확인합니다.

-> show /Servers/PDomains/PDomain_1/HOST sp_name

  /Servers/PDomains/PDomain_1/HOST
      Properties:
      sp_name = /SYS/SP1/SPM1

호스트 콘솔에서 마운트된 파일 시스템으로 인한 비활성 SPM 제거를 확인합니다. 이 명령은 문제를 해결하지 않습니다.

root@host-name-pd0:~# cfgadm -c disconnect /SYS/SP0/SPM1

cfgadm: Component system is busy, try again:

Resource                                Information
---------------------------------------------------------------------------------

/dev/dsk/c8t0d0s2   mounted filesystem  "/media/versaboot_aiconf_on12_boot_sparc"

임시해결책: 이 문제가 발생한 경우 SP 페일오버를 시작하지 마십시오.

복구: 다음 단계를 수행합니다.

  1. 호스트 콘솔에서 eject 명령을 입력하여 제거된 USB 장치에 대한 참조를 지웁니다. 오류 메시지가 표시될 수 있지만 오류 조건이 처리되었으므로, PCIe에서 장치를 제거할 수 있습니다.

    root@host-name-pd1:~# eject
    
    eject of cdrom /dev/dsk/c8t0d0s2 failed: /dev/rdsk/c8t0d0s2: No such device or address
  2. 몇 분 정도 기다린 후 PCIe 장치가 제거되었는지 확인합니다.

    root@host-name-pd1:~# cfgadm | grep SPM
    
    /SYS/SP0/SPM1      unknown      empty        unconfigured     unknown
    /SYS/SP1/SPM1      pci-pci/hp   connected    configured       ok