8.7 RoCEネットワーク・ファブリック・スイッチ・ファームウェアのアップグレードおよびダウングレード

このトピックでは、RoCEネットワーク・ファブリック・スイッチのファームウェアをアップグレードおよびダウングレードする手順について説明します。

RoCEネットワーク・ファブリック・スイッチ・ファームウェアを更新する場合は、次の点に注意してください。

  • RoCEネットワーク・ファブリック・スイッチ・ファームウェアのアップグレードおよびダウングレードは、patchmgrユーティリティを使用して実行します。
  • Oracle Exadata System Softwareリリース19.3.0以降では、サーバーとRDMAネットワーク・ファブリック・スイッチ用に別々のpatchmgrディストリビューションがあります。RoCEネットワーク・ファブリック・スイッチのパッチZIPファイルに含まれているpatchmgrディストリビューションを使用していることを確認します。
  • RoCEネットワーク・ファブリック・スイッチにアクセスできるマシンに適切なパッチZIPファイルをダウンロードします。パッチ情報は、My Oracle Supportノート888828.1を参照してください。
  • patchmgrは、各スイッチに対するパスワードなしのsshアクセスを構成します。この場合、そのスイッチにadminユーザーのパスワードを入力する必要があります。
  • root以外のユーザーを使用してパッチを実行する必要があり、patchmgr-log_dirオプションを指定する必要があります。
  • スイッチのファームウェアは、常にローリング形式でアップグレードします(一度に1つのスイッチ)。
  • ストレージ・サーバーの更新は、RDMAネットワーク・ファブリック・スイッチの更新とは別に実行しますストレージ・サーバーとRDMAネットワーク・ファブリック・スイッチを同時に更新しないでください。RDMAネットワーク・ファブリックのネットワーク接続は、ストレージ・サーバーの更新のいくつかの重要な段階で安定している必要があります。RDMAネットワーク・ファブリック・スイッチのファームウェア更新にはスイッチの再起動が必要になるため、RDMAネットワーク・ファブリックの一部の接続に中断が発生します。
  • 2022年8月のpatchmgrリリース以降、patchmgrRoCEネットワーク・ファブリックで追加の一連のチェックを実行します。これらのチェックは、ファームウェア・アップグレードまたはダウングレードの直前および--roceswitch-precheckオプションを使用した前提条件チェック時に行われます。これらのチェックにより、RoCEネットワーク・ファブリックの予期しない問題に関連する障害のリスクが軽減されます。たとえば、ストレージ・サーバー上のRoCEネットワーク・ファブリック・ポートのいずれかが停止している場合、唯一の動作可能なポートに接続されているスイッチがアップグレードのためにオフラインになると、ストレージ・サーバーは使用できなくなります。チェックが失敗した場合、patchmgrは問題を報告し、ただちに終了します。この場合、アップグレードまたはダウングレードを実行する前に、RoCEネットワーク・ファブリックの問題を修正する必要があります。

次の手順を使用して、RoCEネットワーク・ファブリック・スイッチのファームウェアをアップグレードおよびダウングレードします。