UEK R6の既知の問題

UEK R6および更新リリースのすべての既知の問題のリスト。

使用不可または使用不可のArm機能

次の機能は、動作しない、テストされていない、または64ビットArm (aarch64)プラットフォームで機能が使用不可または使用不可になる原因となる問題があることがわかっています。

  • InfiniBand

    InfiniBandハードウェアは現在、UEK R6を使用したArmアーキテクチャではサポートされていません。

  • ファイバチャネル

    FibreChannelハードウェアは現在、UEK R6を使用したArmアーキテクチャではサポートされていません。

  • RDMA

    RDMAとそのサブ機能は、Armアーキテクチャではサポートされていません。

  • セキュアなブートとロックダウン

    セキュア・ブート機能およびカーネル・ロックダウン機能は、Armアーキテクチャではサポートされていないか、使用できません。

ファイル・システムの問題

このUEK R6リリースのファイル・システムの既知の問題を次に示します。

btrfs: 大きいファイル範囲から多数のファイル・エクステントを削除すると、ENOSPCエラーが発生し、トランザクションが中止されます。

限られた数のケースでは、複数のリーフを横断する削除されたファイル・エクステント・アイテムがENOSPCエラーで失敗し、現在のトランザクションが中断されます。ファイル・システムが読取り専用モードに切り替わります。

この問題が発生すると、次のようなスタックトレースエラーが syslogにダンプされ、dmesgの出力に表示されます。

[ 1500.620938] BTRFS: Transaction aborted (error -28)
[ 1500.620973] WARNING: CPU: 2 PID: 30807 at fs/btrfs/inode.c:9724 __btrfs_prealloc_file_range+0x512/0x570 [btrfs]
[ 1500.620974] Modules linked in: btrfs intel_rapl_msr intel_rapl_common kvm_intel (...)
[ 1500.621010] CPU: 2 PID: 30807 Comm: xfs_io Tainted: G        W         5.9.0-rc3-btrfs-next-67 #1
[ 1500.621012] Hardware name: QEMU Standard PC (i440FX + PIIX, 1996), BIOS rel-1.13.0-0-gf21b5a4aeb02-prebuilt.qemu.org 04/01/2014
[ 1500.621023] RIP: 0010:__btrfs_prealloc_file_range+0x512/0x570 [btrfs]
[ 1500.621026] Code: 8b 40 50 f0 48 (...)
[ 1500.621028] RSP: 0018:ffffb05fc8803ca0 EFLAGS: 00010286
[ 1500.621030] RAX: 0000000000000000 RBX: ffff9608af276488 RCX: 0000000000000000
[ 1500.621032] RDX: 0000000000000001 RSI: 0000000000000027 RDI: 00000000ffffffff
[ 1500.621033] RBP: ffffb05fc8803d90 R08: 0000000000000001 R09: 0000000000000001
[ 1500.621035] R10: 0000000000000000 R11: 0000000000000000 R12: 0000000003200000
[ 1500.621037] R13: 00000000ffffffe4 R14: ffff9608af275fe8 R15: ffff9608af275f60
[ 1500.621039] FS:  00007fb5b2368ec0(0000) GS:ffff9608b6600000(0000) knlGS:0000000000000000
[ 1500.621041] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
[ 1500.621043] CR2: 00007fb5b2366fb8 CR3: 0000000202d38005 CR4: 00000000003706e0
[ 1500.621046] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
[ 1500.621047] DR3: 0000000000000000 DR6: 00000000fffe0ff0 DR7: 0000000000000400
[ 1500.621049] Call Trace:
[ 1500.621076]  btrfs_prealloc_file_range+0x10/0x20 [btrfs]
[ 1500.621087]  btrfs_fallocate+0xccd/0x1280 [btrfs]
[ 1500.621108]  vfs_fallocate+0x14d/0x290
[ 1500.621112]  ksys_fallocate+0x3a/0x70
[ 1500.621117]  __x64_sys_fallocate+0x1a/0x20
[ 1500.621120]  do_syscall_64+0x33/0x80
[ 1500.621123]  entry_SYSCALL_64_after_hwframe+0x44/0xa9
[ 1500.621126] RIP: 0033:0x7fb5b248c477
[ 1500.621128] Code: 89 7c 24 08 (...)
. . .

通常、この問題は、fallocate()関数が、多数の小さいエクステントが割り当てられている大きいファイル範囲(100以上MiB)に対してゼロ範囲操作を完了できない場合にトリガーされます。

(バグID 32675999)

btrfs: 突然のディスク障害時にファイル・システムの破損が発生する

ファイル・システムにログをフラッシュする機会がなかった場合、突然のディスク障害によってBtrfsファイル・システムが破損する可能性があります。この問題は、ディスクのリカバリ後にファイル・システムをチェックする際に発生します。btrfs check <dev> を実行すると、次のような出力が表示されます。

root 5 inode 2832 errors 100, file extent discount
Found file extent holes:
start: 2387968, len: 69632
root 270 inode 266 errors 100, file extent discount
Found file extent holes:
start: 4145152, len: 45056
root 942 inode 259 errors 100, file extent discount
Found file extent holes:
start: 4935680, len: 77824
root 945 inode 258 errors 100, file extent discount
Found file extent holes:
start: 1064960, len: 49152
root 946 inode 259 errors 100, file extent discount
Found file extent holes:
start: 3895296, len: 73728
ERROR: errors found in fs roots
found 936067072 bytes used, error(s) found
total csum bytes: 387876
total tree bytes: 19349504
total fs tree bytes: 17235968
total extent tree bytes: 950272
btree space waste bytes: 10670592
file data blocks allocated: 2036375552
 referenced 972320768

--repair オプション・セットを指定して同じコマンドを実行することで、ファイル・システムの修復を試行できます。たとえば:

sudo btrfs check --repair /dev/sdb1
                  

(バグID 30473586)

ext4: 頻繁なシステム停止によってファイル・システムが破損する可能性がある

ext4を使用しているシステムが繰り返しおよび頻繁にシャットダウンされた場合、ファイル・システムが破損する可能性があります。この問題は、再現に必要な難しさのために、まれなケースであるとみなされています。この問題はアップストリーム・コードに存在し、提案されたパッチを現在レビュー中です。(バグID 27547113)

シリアルポートのボーレートが低すぎる場合、シリアルポートコンソールがクラッシュする可能性があります

物理シリアルコンソールを使用してシステム出力をモニターするシステム(ILOMコンソールインタフェースなど)では、高いレベルの出力によって、プロセスがCPUスケジューラ時間を取得できないことを示すカーネルデッドマンタイマーイベントなどの異常なシステム動作が発生する可能性があります。これは通常、シリアルコンソールの速度が低すぎて、システムにログレベル6以上が構成されている場合に発生します。この問題が発生する可能性を低減するには、ログレベルを減らすか、最大ボーレートである115200用にコンソールを構成します。

UEK R6U1以降では、ボーレートの設定が低すぎると、dmesgの出力に警告が表示されます。

dmesg | grep -A4 -i baud
[  369.777802] Serial console is set to the default of 9600 baud. This can
[  369.778852] result in stalls or lockups in error conditions requiring a
[  369.779892] large number of console system messages. Please increase the
[  369.780889] rate to the highest your system will allow (for instance,
115200
[  369.781918] or 57600). See Oracle KM Note 2648582.1 for more information.

実行中のOracle Linux 7またはOracle Linux 8システムの現在のコンソール速度は、次を実行して構成済のシリアル・ポートに設定できます:

stty -F /dev/ttyS0 speed 115200

システムのブート時に使用されるシリアルコンソールの速度を変更するには、GRUB構成を編集する必要があります。テキスト・エディタで/etc/sysconfig/grubを編集し、GRUB_CMDLINE_LINUXで始まる行にconsole=ttyS0,115200を追加します。次に例を示します。

GRUB_CMDLINE_LINUX="crashkernel=auto resume=/dev/mapper/linux1-swap rd.lvm.lv=linux1/root \
  rd.lvm.lv=linux1/swap rhgb quiet console=ttyS0,115200"

前述の例では、シリアル・コンソールはttyS0と想定されており、代替シリアル・ポートを使用した場合はこれを変更する必要がある場合があります。

レガシーBIOSを使用している場合、次回のブートで使用するように grub構成を変更で更新するには、次を実行します。

sudo grub2-mkconfig -o /boot/grub2/grub.cfg           

または、Unified Extensible Firmware Interface (UEFI)を使用してブートする場合は、次のコマンドを実行します。

sudo grub2-mkconfig -o /boot/efi/EFI/redhat/grub.cfg            

Oracle Serverハードウェア、またはシリアルコンソールへのILOMインタフェースを提供するシステムを使用している場合は、ホストオペレーティングシステム内で設定した速度に合わせて、ILOM上のシリアルコンソール構成を更新してください。ILOM CLIでシリアルポートを設定するには、次を実行します。

sudo set /SP/serial/host pendingspeed=115200 commitpending=true

ILOMでCLIを使用して現在のコンソール・ポートの速度を確認するには、次を実行します:

sudo show /SP/serial/host

ILOM構成の詳細は、https://docs.oracle.com/cd/E19203-01/820-1188-12/core_ilom_managing.htmlを参照してください。

(バグID 30487830、30439170)

表示されるSELinuxの「Permission watch」メッセージ

UEK R6をSELinux許容モードで起動するか、強制モードで起動すると、次のようなメッセージが表示されます。

SELinux:  Permission watch in class filesystem not defined in policy. 
SELinux:  Permission watch in class file not defined in policy. 
SELinux:  Permission watch_mount in class file not defined in policy. 
SELinux:  Permission watch_sb in class file not defined in policy.
SELinux: the above unknown classes and permissions will be allowed

これらのメッセージが表示されるのは、SELinuxポリシーにこれらのクラスの定義が現在存在しないためです。メッセージの最後の行によると、クラスおよび権限はデフォルトで許可されるため、このメッセージは無視しても問題ありません。

(バグID 30687021、30687021)

MLSポリシーを使用した強制モードのSELinuxはサポートされていません

SELinuxがMultilevel Security (MLS)ポリシーを使用するように構成されており、それが強制モードの場合、ファイル・システムをマウントしようとしたときの権限エラーや、オペレーティング・システムのブート時にSystemdがフリーズする可能性など、いくつかの問題がオペレーティング・システムの通常の機能を妨げる可能性があります。

MLSポリシーを使用した強制モードのSELinuxはサポートされていません。ターゲット・ポリシーを使用して、強制モードでSELinuxを引き続き使用できます。

(バグID 30797389、30609238)

誤ったxs_tcp_setup_socket: NFS使用時の接続メッセージ

NFSを使用すると、ソケット接続エラーに関する不正確なメッセージが出力されることがあります。メッセージは次のようになります。

xs_tcp_setup_socket: connect returned unhandled error -107

基礎となる接続の問題が解決され、失敗した接続が自動的に再オープンされるようになりました。関連する機能への影響が発生しない場合、このエラー・メッセージは無視される場合があります。このメッセージは、実際の接続の問題の結果として表示される場合もあります。

(バグID 30339848)

mstflintコマンドは、Oracle Linux 8で使用するとコア・ダンプを報告します。

mstflint -i fw-*.bin bコマンドを使用して Oracle Linux 8システム上の特定のファームウェアを更新すると、コアダンプが発生します。

この問題が発生すると、次のようなメッセージが対応する出力で確認できます。

mstflint -d 3b:00.0 -i
fw-ConnectX3-rel-2_35_6312-45-7046442_7092757.bin b
/usr/include/c++/8/bits/stl_vector.h:932: std::vector<_Tp, _Alloc>::reference
std::vector<_Tp, _Alloc>::operator[](std::vector<_Tp, _Alloc>::size_type)
[with _Tp = unsigned char; _Alloc = std::allocator<unsigned char>;
std::vector<_Tp, _Alloc>::reference = unsigned char&; std::vector<_Tp,
_Alloc>::size_type = long unsigned int]: Assertion '__builtin_expect(__n <
this->size(), true)' failed.
Aborted (core dumped)

現在、この問題の回避方法はありません。

(バグID 33212531)

IOMMUカーネルオプションはデフォルトで有効になっています

UEK R5U1以降では、x86_64カーネルでIOMMU機能がデフォルトで有効になっています。この変更により、シングルルート入出力仮想化(SR-IOV)およびほかの仮想化拡張が容易になりますが、IOMMUが有効になっているときに検出を完了できない特定のハードウェアでブート障害の問題が発生することも知られています。この機能のステータスは、iommu=onとしてレポートされる/proc/cmdに表示されなくなりました。これは、ブート障害が発生した場合にカーネルのcmdlineオプションとして明示的に無効にする必要がある可能性があることを意味します。別の回避方法として、ベンダーの指示に従って、システムROMでIOMMUまたは Intel-Vtdを無効にできます。

これらのブート障害の問題は、HP Gen8サーバーなどの特定のBroadcomネットワーク・デバイスを持つ機器で確認されています。詳細は、https://support.hpe.com/hpsc/doc/public/display?docId=emr_na-c04565693を参照してください。

NVMeデバイスの Linux I/Oスケジューラの変更が、名前空間が250を超えるQlogic HBAを持つホストで失敗する

QLogicファイバ・チャネルのqla2xxx HBAドライバを使用して作成された250を超えるNVMeネームスペースがあり、その後、Linux I/Oスケジューラをデフォルト値のnoneからmq-deadlineに変更しようとすると、問題が発生します。操作が失敗し、デバイスがオフラインになります。

以下のメッセージが記録されます。

[  692.819064] qla2xxx 0000:04:00.1: DMAR: Allocating 2-page iova failed
[  692.819107] qla2xxx 0000:04:00.1: DMAR: Device request: 2@4f309ebfd0 dir 1 

この問題の回避策は、UEK R6でデフォルトで有効になっているLinux IOMMUドライバを無効にすることです。

sudo grubby --update-kernel=ALL --args="iommu=off"

システムを再起動して、変更内容を反映する必要があります。

サーバーがシングルルート I/O仮想化(SR-IOV)デバイスをホストしていないかぎり、UEK R6ではIOMMUドライバは必要ありません。詳細は、IOMMU kernel option enabled by defaultを参照してください。

(バグID 33348390)

結合マスターの下でHCAポートに属する複数のネットデバイスがスレーブである場合、RoCE接続が失敗することがあります

デフォルトGIDまたは IPv6リンクローカルアドレスのRoCE接続に影響を与える可能性のあるバグが、特定の構成で検出されました。これらのタイプの構成に対してRoCE接続を確立しようとすると、HCAポートに属する2つ以上のネットデバイスがボンディング・マスターの下のスレーブである場合、失敗する可能性があります。

この問題が発生した場合は、次のようなエラー・メッセージがdmesg出力に表示されます。

__ib_cache_gid_add: unable to add gid
fe80:0000:0000:0000:f652:14ff:fe46:7391 error=-28.

この問題は、次の構成で発生する可能性があります。

  • ConnectX-5イーサネット・アダプタ・カードが接続されたベアメタル・システムでは、ifdownまたはifupボンディング・インタフェース操作中にIPv6およびボンディングが構成されます。

  • ConnectX-6 Ethernetアダプタカードが接続されているホストコンソールで、macvtapデバイスを作成または削除する場合。

(バグID 31868736)

bnxt_re: Broadcom NetXtreme-C/E bnxt_enドライバを使用して特定のハードウェアにインストールすると、プローブ・エラー「RoCE is not supported on this device」が報告されます

NetXtreme-C/E bnxt_enドライバを含む一部のハードウェアでは、新規インストールの直後に、次のようなメッセージがシステム・ログ(var/log/messages)で確認できます。

grep bnxt /var/log/messages
Apr 26 12:00:30 ca-ostest644 kernel: Broadcom NetXtreme-C/E driver bnxt_en
v1.10.1
Apr 26 12:00:30 ca-ostest644 kernel: bnxt_en 0000:18:00.0 (unnamed
net_device) (uninitialized): Firmware does not support TC flower offload.
Apr 26 12:00:30 ca-ostest644 kernel: bnxt_en 0000:18:00.0 eth1: Broadcom
BCM57417 NetXtreme-E 10GBase-T Ethernet found at mem 381c01210000, node addr
00:10:e0:d8:33:09
Apr 26 12:00:30 ca-ostest644 kernel: bnxt_en 0000:18:00.0: 63.008 Gb/s
available PCIe bandwidth (8 GT/s x8 link)
Apr 26 12:00:30 ca-ostest644 kernel: bnxt_en 0000:18:00.1 (unnamed
net_device) (uninitialized): Firmware does not support TC flower offload.
Apr 26 12:00:30 ca-ostest644 kernel: bnxt_en 0000:18:00.1 eth2: Broadcom
BCM57417 NetXtreme-E 10GBase-T Ethernet found at mem 381c01200000, node addr
00:10:e0:d8:33:0a
.
.
.

dmesgコマンドは、次のようなメッセージを報告します。

dmesg | grep bnxt
[    2.703443] Broadcom NetXtreme-C/E driver bnxt_en v1.10.1
[    2.720552] bnxt_en 0000:18:00.0 (unnamed net_device) (uninitialized):
Firmware does not support TC flower offload.
[    2.961037] bnxt_en 0000:18:00.0 eth1: Broadcom BCM57417 NetXtreme-E
10GBase-T Ethernet found at mem 381c01210000, node addr 00:10:e0:d8:33:09
[    2.961044] bnxt_en 0000:18:00.0: 63.008 Gb/s available PCIe bandwidth (8
GT/s x8 link)
[    2.986775] bnxt_en 0000:18:00.1 (unnamed net_device) (uninitialized):
Firmware does not support TC flower offload.
[    2.996323] bnxt_en 0000:18:00.1 eth2: Broadcom BCM57417 NetXtreme-E
10GBase-T Ethernet found at mem 381c01200000, node addr 00:10:e0:d8:33:0a
[    2.996331] bnxt_en 0000:18:00.1: 63.008 Gb/s available PCIe bandwidth (8
GT/s x8 link)
[    3.011390] bnxt_en 0000:18:00.0 eno2np0: renamed from eth1
[    3.260089] bnxt_en 0000:18:00.1 eno3np1: renamed from eth2
[    9.038400] bnxt_re: Broadcom NetXtreme-C/E RoCE Driver
[    9.038472] bnxt_en 0000:18:00.0: bnxt_re: probe error: RoCE is not 

一部の Oracleサーバーの bnxt_enカードのファームウェアでRDMAサポートが無効になっているため、これらのエラーメッセージが報告されます。ただし、この問題はすべてのBroadcom NetXtreme-C/Eカードに影響しないことに注意してください。

この問題を回避するには、取り付けの前にカードのファームウェアでRDMAサポートを有効にする必要があります。

(バグID 32819934)

Armプラットフォームで実行されている仮想マシンのPCIEホットプラグ・ドライバ・エラー

Armプラットフォームで実行されている仮想マシンが再起動されると、PCIEホットプラグ・ドライバからエラー・メッセージが出力されます。生成されるエラーは、次のメッセージに似ています。

[    3.574244] pcieport 0000:00:02.1: pciehp: Failed to check link status

この問題はベア・メタル・システムではレプリケートされません。

(バグID 30512596)

dsa-loopモジュールをアンロードすると、一部のArmプラットフォームがクラッシュする可能性があります(解決済)。

modprobe -rを使用してdsa-loopドライバをアンロードしようとすると、一部のArmプラットフォームでクラッシュする可能性があります。

dsa-loopドライバをアンロードしないでください。

このバグはUEK R6U1以降で解決されています。

(バグID 30456791)

IPv6の使用時にルートキャッシュがいっぱいであることを示すメッセージが出力されます

一部のシステムでは、IPv6を使用すると、ルートキャッシュがいっぱいであることを示すエラーメッセージが出力されます。次の例のようなエラーが返される可能性があります。

[ 5523.456447] Route cache is full: consider increasing sysctl
net.ipv[4|6].route.max_size.

これらのエラーの原因や、/proc/sys/net/ipv6/route/max_sizeのサイズを増やすべきかどうかは不明ですが、テスト・システムでは、次のコマンドを実行した後に問題をレプリケートできませんでした。

sudo sysctl net.ipv6.route.max_size=32768

問題は現在調査中であるため、この値を増やすことは実行可能な回避策です。

(バグID 30976607)

RoCEの使用時にIPv6 RDS zcopyが失敗することがある

UEK R6を実行しているシステムで -Dオプションを指定して rds-stressコマンドを使用すると、RoCEを使用するときに IPv6接続が失敗することがあります。たとえば:

/usr/bin/rds-stress -r 2001:db8:0:f101::10 -s
2001:db8:0:f101::50 -p 5001 -q 256 -a 256 -D 1048576 -t 8 -d 8 -T 5 -Q 0
connecting to 2001:db8:0:f101::50:5001
negotiated options, tasks will start in 2 seconds
Starting up....
tsks   tx/s   rx/s  tx+rx K/s    mbi K/s    mbo K/s tx us/c   rtt us cpu %
   8   1111   1138    1124.08 1148754.54 1152849.92 2262.40 166273.84 -1.00
   8      0      0       0.00       0.00       0.00    0.00     0.00 -1.00
An incoming message had a  header which
didn't contain the fields we expected:
    member                              expected eq                          
        got
       seq                                   232 !=                          
        233
 from_addr                   2001:db8:0:f101::50  =
 2001:db8:0:f101::10
   to_port                                  5009  =                          
       5009
     index                                     0 !=                          
          1
        op                                     2  =                          
          2
header from 2001:db8:0:f101::50:5006 to id 5009 bogus
An incoming message had a  header which
didn't contain the fields we expected:
.
.
.

この障害が発生すると、RDS/IB接続が切断され、dmesgコマンドは次のような「送信完了エラー」を出力します。

[ 1459.672036] RDS/IB: Active  conn 000000009390f34a i_cm_id
0000000025fb11f7, frag 16KB, connected
<::ffff:10.196.100.10,::ffff:10.196.100.20,0> version 4.1
[ 1525.726700] RDS/IB: Passive conn 0000000004f3adf0 i_cm_id
000000008ed2761a, frag 16KB, connected
<2001:db8:0:f101::10,2001:db8:0:f101::20,0> version 4.1
[ 1533.507148] RDS/IB: connection <2001:db8:0:f101::10,2001:db8:0:f101::20,0>
dropped due to 'peer ADDR_CHANGE event'
[ 1533.520819] RDS/IB: Active  conn 0000000004f3adf0 i_cm_id
00000000e4924354, frag 16KB, connected
<2001:db8:0:f101::10,2001:db8:0:f101::20,0> version 4.1
[ 6520.413359] perf: interrupt took too long (2512 > 2500), lowering
kernel.perf_event_max_sample_rate to 79000
[ 6828.577868] perf: interrupt took too long (3158 > 3140), lowering
kernel.perf_event_max_sample_rate to 63000
[11040.701140] perf: interrupt took too long (3957 > 3947), lowering
kernel.perf_event_max_sample_rate to 50000
[15759.500697] RDS/IB: Active  conn 0000000071070b96 i_cm_id
000000008991e14b, frag 16KB, connected
<2001:db8:0:f101::10,2001:db8:0:f101::50,0> version 4.1
[15761.564522] RDS/IB: connection <2001:db8:0:f101::10,2001:db8:0:f101::50,0>
dropped due to 'DISCONNECTED event'
[15763.206080] RDS/IB: Active  conn 0000000071070b96 i_cm_id
0000000078e31285, frag 16KB, connected
<2001:db8:0:f101::10,2001:db8:0:f101::50,0> version 4.1
[15763.232934] RDS/IB: connection <2001:db8:0:f101::10,2001:db8:0:f101::50,0>
dropped due to 'qp event'
[15763.250068] RDS/IB: Active  conn 0000000071070b96 i_cm_id
000000002001aa35, frag 16KB, connected
<2001:db8:0:f101::10,2001:db8:0:f101::50,0> version 4.1
[15763.284602] RDS/IB: connection <2001:db8:0:f101::10,2001:db8:0:f101::50,0>
dropped due to 'recv completion error'
[15763.300256] RDS/IB: Active  conn 0000000071070b96 i_cm_id
0000000003fdea35, frag 16KB, connected
<2001:db8:0:f101::10,2001:db8:0:f101::50,0> version 4.1
[15763.305075] RDS/IB: connection <2001:db8:0:f101::10,2001:db8:0:f101::50,0>
dropped due to 'DISCONNECTED event'
[15763.307644] infiniband mlx5_0: dump_cqe:275:(pid 0): dump error cqe
[15763.307649] 00000000: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
[15763.307650] 00000010: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
[15763.307652] 00000020: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
[15763.307653] 00000030: 00 00 00 00 00 00 88 13 08 00 01 0f 01 4f 94 d2
[15763.322476] RDS/IB: Active  conn 0000000071070b96 i_cm_id
00000000f9fd41c3, frag 16KB, connected
<2001:db8:0:f101::10,2001:db8:0:f101::50,0> version 4.1
[15763.330022] RDS/IB: connection <2001:db8:0:f101::10,2001:db8:0:f101::50,0>
dropped due to 'DISCONNECTED event'
.
.
.

同じ問題がKVMゲストにも発生しています。この問題は、IPv4接続では発生しません。

この問題は、一貫して再現できないため、コーナーケースと見なされます。

(バグID 33078473)

RoCEの使用時にIPv6フェイルバックが失敗する

rdmaipドライバは、IPv6アドレス変更通知をRDSに送信しません。これにより、RoCEの使用時にIPv6のフェイルオーバーを遅延または防止できます。これは、アクティブ・ボンディングが有効で、IPv6に対してのみ発生します。IPv4フェイルオーバーは引き続き正常に動作します。

問題がトリガーされると、カーネル・ログに次のメッセージが表示される場合があります。

kernel: rdmaip: could not add 2001:db8:0:f101::50%4/64 to ens2f0 (port 1)
kernel: IPv6: ens2f0: IPv6 duplicate address 2001:db8:0:f101::50 used by 
        50:6b:4b:cb:ef:23 detected!

修正は開発中ですが、このリリースでは使用できません。この修正はエラッタ更新として使用可能になる場合があります。

(バグID 31021418)

Oracle Linux 8でPodmanを使用した場合のファイル・システムのオーバーレイの問題(解決済)

Oracle Linux 8で使用可能なPodmanのバージョンでは、--uidmapオプションの使用中にrm操作を実行するときに、コンテナのオーバーレイ・ファイル・システムのアンマウントに問題があります。この問題は、通常、次のような出力を示しています。

ERRO[0000] error unmounting
/var/lib/containers/storage/overlay/9bf314b8c2411fd7b7e2f249671bead918a7aaffec
a8299a602b525c061c1cd3/merged: invalid argument

dmesgログに次のエラーが表示されます。

[  848.192546] overlayfs: failed to verify upper
(9bf314b8c2411fd7b7e2f249671bead918a7aaffeca8299a602b525c061c1cd3/diff,
ino=101428727, err=-116)
[  848.198470] overlayfs: failed to verify index dir 'upper' xattr
[  848.200809] overlayfs: try deleting index dir or mounting with '-o
index=off' to disable inodes index.

UEK R6でのオーバーレイ・ファイル・システムのデフォルトの処理では、indexオプションを有効にしてマウントします。この機能では、デフォルトでインデックスディレクトリを使用して下位のiノードを上位のiノードにマップしますが、オフにした場合の影響はほとんどありません。この問題が発生した場合は、index=offオプションを設定してoverlayモジュールをロードすることで回避できます。たとえば、次のように実行します。

sudo rmmod overlay 
sudo modprobe overlay index=off

これらの設定を永続的にするには、/etc/modprobe.d/でこのオプションを設定します。たとえば、次のコマンドを実行します。

echo 'options overlay index=off' | sudo tee /etc/modprobe.d/overlay.conf

このバグはUEK R6U1以降で解決されています。

(バグID 31025483)

libpcapパッケージを削除できません。

libpcapパッケージを削除しようとしたり、パッケージの削除を試行するアクションを実行しようとすると、依存関係チェーンでsystemdパッケージの削除が必要となり、システムが無効になるため、エラーが発生します。

これはOracle Linux 8では想定される動作ですが、以前のOracle Linuxリリースではlibpcapパッケージを削除できたため、ここでは動作について説明します。

RDMAパッケージをインストールする場合など、状況によっては、libpcapがオペレーティング・システム用に提供されているバージョンよりも新しいバージョンにアップグレードされることがあります。これらのパッケージを削除する場合は、libpcapパッケージを、BaseOSチャネルまたはリポジトリのオペレーティング・システムに指定された最高バージョンと一致するようにダウングレードすることもできます。通常、これは dnf history undoコマンドを使用してインストールを元に戻すことで、もっとも簡単に実行できます。詳細については、DNF(8)マニュアル・ページを参照してください

(バグID 30979601)

Infinibandファブリックのネットワーク遅延が増加する可能性がある

TCP書込みサイズがInfiniband (IB) Maximum Transmission Unit (MTU)のサイズに近い場合、アプリケーションではパケット転送の待機時間が長くなることがあります。たとえば、デフォルトのIB MTUは65520バイトです。65520バイトから128KBのTCP書込みサイズも使用するアプリケーションでは、この問題が発生する可能性があります。アプリケーションがより大きい(256KBなど)または小さい(4KBまたは32KBなど) TCP書込みサイズを使用する場合、この問題は発生しません。

Ethernetネットワークは、この問題の影響を受けません。

Oracle LinuxおよびUEK R6のIB MTUおよびTCP書込みサイズのデフォルト値では、問題は発生しません。TCPウィンドウサイズが変更されたアプリケーション、またはMTU値が変更されたシステムでは、この問題が重複して公開される可能性があります。

この問題の回避策は、IBインタフェースのMTUまたはアプリケーションのTCP書込みサイズのいずれかをチューニングして、TCP書込みサイズがIB MTUより小さいか、TCP書込みサイズがIB MTUの2倍より大きいようにすることです。MTUは、ip linkコマンドを使用して動的にチューニングできます。TCP書込みサイズのチューニングはアプリケーション固有であることに注意してください。

(バグID 31830430)

ConnectX-6Dx vDPAインターフェイス上の大きなMTUでパケット損失が発生する

ConnectX-6Dxアダプタは、現在、vDPAインタフェースのパケット・サイズに敏感です。その結果、1500バイトを超えるMTUを使用するように構成されたConnectX-6Dx vDPAインタフェースを持つシステムでは、ネットワーク送信中にパケット損失が発生する可能性があります。

この問題を回避するには、vDPAネットワークインタフェースに1500のMTUサイズを使用します。

(バグID 33403579)

vDPAインタフェースを使用する仮想マシンでは、KVMゲストの起動時間が長くなる可能性があります

BIOSまたはUEFI/OVMFを使用してブートするvDPAインタフェースを使用する仮想マシンでは、ブート時間が長くなることがあります。VMに割り当てられるvDPAインタフェースの数が増加すると、この時間の増加が見込まれます。この問題の一般的な原因は、QEMUコマンドラインまたはゲストのlibvirt XML記述でゲストのブート順序が指定されていないことです。このような場合、VMはすべてのデバイスを検出し、ブート可能なデバイスを特定する必要があります。これにより、ブート時間が長くなります。

この問題の回避方法は、vDPAインタフェースを持つすべてのVMのブート順序を確実に指定することです

(バグID 33294034)

(aarch64)仮想化されたArmプラットフォームをプロファイリングすると、Perfツールがアプリケーションの速度を低下させる

ノート

次の問題は、ベア・メタル・インストールには影響しません。

マルチソケットaarch64プラットフォーム上で実行されている仮想マシン(VM)で、perf topまたは perf recordコマンドが呼び出されると、アプリケーションの速度が低下する可能性があります。場合によっては、次のメッセージが端末ウィンドウに出力されます。

kernel:watchdog: BUG: soft lockup

この問題は、次のように軽減できます。

  • ロックアップ状態を回避し、プローブ効果を低減するために、-Fフラグを使用して頻度ではなく、perf recordコマンドで -cフラグを使用してサンプル期間を指定できます。たとえば、perf record -F 100コマンドの代わりに perf record -cコマンドを使用します。

  • --all-cpusフラグを指定して perfコマンドを使用しないでください。代わりに、perf -Cコマンドを使用して、最小数のCPUを指定します。

(バグID 32834324)

RDSまたはRDMAの使用時に発生する誤ったtrace_printk警告(解決済)

UEK R6をRDSまたはRDMAとともに使用すると、次のようなメッセージが発行されます。

[  136.066002] **********************************************************
[  136.068731] **   NOTICE NOTICE NOTICE NOTICE NOTICE NOTICE NOTICE   **
[  136.071346] **                                                      **
[  136.074893] ** trace_printk() being used. Allocating extra memory.  **
[  136.078505] **                                                      **
[  136.082337] ** This means that this is a DEBUG kernel and it is     **
[  136.086093] ** unsafe for production use.                           **
[  136.089887] **                                                      **
[  136.093682] ** If you see this message and you are not debugging    **
[  136.097192] ** the kernel, report this immediately to your vendor!  **
[  136.100615] **                                                      **
[  136.104239] **   NOTICE NOTICE NOTICE NOTICE NOTICE NOTICE NOTICE   **
[  136.108005] **********************************************************
[  136.209499] NET: Registered protocol family 21
[  136.229371] Registered RDS/tcp transport

これらのメッセージは、Resilient RDMAIPカーネル・モジュールが現在、インフラストラクチャのデバッグにtrace_print()を使用しているために表示されます。RDS/RDMAシステムでは、これらのメッセージは無視してもかまいませんが、カーネルが本番環境で使用することは安全ではありません。

(バグID 31066169)

(aarch64) Kdumpが一部のArmシステムでクラッシュカーネル・メモリーの割当てに失敗する

一部の64ビットArm (aarch64)システムでは、連続するメモリーが不足しているため、auto値が設定されているときに通常予約される最小のcrashkernelメモリーを割り当てることができないため、Kdumpが失敗することがあります。

この問題により、Kdumpの起動に失敗し、ログに次のエラーが表示されます。

kdumpctl[3812]: No memory reserved for crash kernel
...
systemd[1]: Failed to start Crash recovery kernel arming.

この問題を回避するには、crashkernelの下限値と上限値を手動で設定し、256MBを下回る下限値の設定を試行します。たとえば、crashkernel=autocrashkernel=800M,high crashkernel=200M,lowに置き換えます。

(バグID 31554906)

ipmctlを使用するためにipmctl-monitorパッケージが不要になりました

ipmctl-monitorパッケージは、UEK R6U2で使用可能なipmctlバージョン2.0には必要ありません。以前のバージョンのipmctlからシステムを更新する場合、または他のipmctlユーティリティとともにipmctl-monitorパッケージをインストールしようとすると、次のような競合が発生する可能性があります。

Error:
 Problem: cannot install both libipmctl-02.00.00.3852-1.0.1.el8.x86_64 and
libipmctl-01.00.00.3467-1.0.1.el8.x86_64
  - package ipmctl-monitor-01.00.00.3467-1.0.1.el8.x86_64 requires
libipmctl.so.3()(64bit), but none of the providers can be installed
  - package ipmctl-monitor-01.00.00.3467-1.0.1.el8.x86_64 requires
libipmctl(x86-64) = 01.00.00.3467-1.0.1.el8, but none of the providers can be
installed
  - cannot install the best candidate for the job
  - conflicting requests

システムを更新する場合は、更新を実行する前にipmctl-monitorパッケージを削除します。

sudo dnf remove ipmctl-monitor
sudo dnf update

これらのパッケージを初めてインストールする場合は、インストール・コマンドにipmctl-monitorパッケージを含めないでください。

(バグID 32818557、32516965)

初期のマイクロコードロード(解決済み)

UEK R6を使用してOracle Linux 7ベアメタル・システムをブートすると、dmesgログに次のことが報告される場合があります。

This kernel doesn't handle early microcode load properly (it tries to load
microcode even in virtualised environment, which may lead to a panic on some
hypervisors), thus the microcode files have not been added to the initramfs
image.        

UEK R6は、実際には、遅延マイクロコード・ロードを適切に処理します。このメッセージは、UEK R6カーネル・バージョンを認識しないdownrev microcode-ctlユーザー領域パッケージが原因です。

この問題は、microcode_ctl-2.1-61.10.0.1パッケージまたはそれ以降のバージョンで修正されています。

(バグID 31085618)

lpfcドライバのリロードによってエラーメッセージが出力される(解決済み)

次のようなエラーメッセージは、Broadcom Emulex LightPulse Fibre Channel SCSIドライバ lpfcがアンロードされ、リロードされたときに報告されることがあります。

bmx048-ps kernel: lpfc 0000:13:00.1: 1:(0):2858 FLOGI failure
Status:x9/x30000 TMO:x14 Data x101800 x0
bmx048-ps kernel: lpfc 0000:13:00.1: 1:(0):0820 FLOGI Failed (x300). BBCredit
Not Supported
bmx048-ps kernel: lpfc 0000:13:00.0: 0:(0):2858 FLOGI failure
Status:x9/x30000 TMO:x14 Data x101800 x0
bmx048-ps kernel: lpfc 0000:13:00.0: 0:(0):0820 FLOGI Failed (x300). BBCredit
Not Supported
      

lpfcモジュールのリロードの完了後にデバイスが適切に検出された場合、これらの通知は無視しても問題ありません。

(バグID 31598148)