12 Oracle Big Data Applianceのメンテナンス
この章では、Oracle Big Data Applianceを監視および管理する方法について説明します。一部の手順では、dcli
ユーティリティを使用してすべてのサーバーでパラレルにコマンドを実行します。
この章の内容は次のとおりです。
12.1 サーバーの周辺温度の監視
環境温度の状態をサーバーの設計仕様の範囲内に維持することは、最大限の効率性および目的のコンポーネント・サービスの存続期間を実現するために役立ちます。摂氏21から23度(華氏70から74度)の気温範囲を逸脱する温度は、Oracle Big Data Appliance内のすべてのコンポーネントに影響し、パフォーマンス上の問題の原因となり、サービスの存続期間が短縮される可能性があります。
周辺温度を監視するには、次の手順を実行します。
-
Oracle Big Data Applianceサーバーに
root
として接続します。 -
「パスワードなしSSHの設定」の説明に従って
setup-root-ssh
コマンドを入力し、root
のパスワードなしSSHを設定します。 -
現在の温度を確認します。
dcli 'ipmitool sunoem cli "show /SYS/T_AMB" | grep value'
-
示されている温度が稼働範囲を逸脱している場合、調査して問題を修正します。表2-15を参照してください。
次に、コマンド出力の例を示します。
bda1node01-adm.example.com: value = 22.000 degree C bda1node02-adm.example.com: value = 22.000 degree C bda1node03-adm.example.com: value = 22.000 degree C bda1node04-adm.example.com: value = 23.000 degree C . . .
12.2 Oracle Big Data Applianceの電源の投入および切断
この項で説明する項目は、次のとおりです。
12.2.1 緊急時以外の電源の手順
この項には、規則的な方法でOracle Big Data Applianceのコンポーネントの電源を投入および切断する手順が含まれます。
関連項目:
ソフトウェアをインストールして実行するときに正常に電源を投入および切断する方法については、『Oracle Big Data Applianceソフトウェア・ユーザーズ・ガイド』を参照してください。
12.2.1.1 Oracle Big Data Applianceの電源投入
Oracle Big Data Applianceを起動するには、次のようにします。
-
2つのPDUの12のブレーカすべてをオンにします。
Oracle ILOMおよびLinuxオペレーティング・システムが自動的に起動します。
12.2.1.2 Oracle Big Data Applianceの電源切断
12.2.1.2.2 複数サーバーの電源の同時切断
dcli
ユーティリティを使用して、同時に複数のサーバーでshutdown
コマンドを実行します。停止するサーバーからdcli
ユーティリティを実行しないでください。「パスワードなしSSHの設定」の説明に従って、root
のパスワードなしSSHを設定します。
次のコマンドで、コマンドの構文を示します。
# dcli -l root -g group_name shutdown -hP now
このコマンドで、group_nameは、サーバーのリストを含むファイルです。
次の例では、server_groupファイルにリストされているすべてのOracle Big Data Applianceサーバーを停止します。
# dcli -l root -g server_group shutdown -hP now
12.2.2 緊急時の電源切断に関する考慮事項
緊急時には、Oracle Big Data Applianceへの電源供給を即座に停止してください。次の緊急時には、状況に応じてOracle Big Data Applianceの電源を切断する必要があります。
-
地震、洪水、台風、竜巻、つむじ風などの自然災害
-
システムから発する異常な雑音、臭気または煙
-
人体の安全に対する脅威
12.2.2.1 緊急時の電源切断の手順
緊急時にOracle Big Data Applianceの電源を切断する手順を実行するには、サーキット・ブレーカの電源をオフにするか、コンピュータ・ルームで緊急電源切断スイッチを作動させます。緊急事態が終了した後、Oracleサポート・サービスに連絡してシステムの電源を復旧します。
12.2.3 注意および警告
Oracle Big Data Applianceには次の注意および警告が適用されます。
警告:
高圧電力を使用するこの製品の部品に触れないでください。それらに触れると、重傷を負う可能性があります。
注意:
-
緊急時でないかぎり、Oracle Big Data Applianceをオフにしないでください。その場合、「緊急時の電源切断の手順」に従ってください。
-
前面と背面のキャビネット・ドアは閉めたままにしてください。そうしない場合、システム障害が発生したり、ハードウェア・コンポーネントが破損する可能性があります。
-
キャビネットの最上部、前面および背面近くには何も置かず、適切な換気を促し、コンポーネントが過熱しないようにしてください。
-
付属しているハードウェアのみを使用してください。
12.3 サーバーへのメモリーの追加
クラスタのすべてのサーバーおよび特定のサーバーにメモリーを追加できます。
12.3.1 Oracle Server X8-2LまたはX7-2Lへのメモリーの追加
Oracle Big Data Appliance X8-2LおよびX7-2の各サーバーには、工場出荷時に256GBのメモリーが搭載されています。24枚実装のスロットの8つに、32GBのDIMMが挿入されています。メモリーは最大768 GBに拡張可能です(24スロットすべてに32 GBのDIMMを搭載する場合)。メモリーは最大1.5 TBに拡張可能です(24スロットすべてに64 GBのDIMMを搭載する場合)。
推奨される構成は、サーバーごとに8、12または24個のDIMMを搭載することです。
ノート:
- サーバー上のすべてのDIMMは、同じタイプである必要があります。同じサーバー上でのDIMMタイプの混在(32 GBと64 GBのDIMMなど)はサポートされません
- サーバーごとに12個のDIMMまたは24個のDIMMではないメモリーの拡張は可能ですが、パフォーマンスに悪影響を与えることがあるためお薦めしません
追加のメモリーを注文する場合は、オラクル社の営業担当に連絡してください。
DIMMの配置シナリオと規則、インストールおよびその他の情報については、Oracle Server X8-2Lサービス・マニュアルまたはOracle® Server X7-2Lサービス・マニュアルを参照してください。
12.3.2 Oracle Server X6-2Lへのメモリーの追加
Oracle Big Data Appliance X6-2Lの各サーバーには、工場出荷時に256 GBのメモリーが搭載されています。24枚実装のスロットの8つに、32GBのDIMMが挿入されています。メモリーは、最大768 GBに拡張可能です(すべての24スロットで32 GB DIMMの場合)。
DIMMの配置シナリオと規則、インストール、その他の情報についての説明は、『Oracle® Server X6-2Lサービス・マニュアル』を参照してください。
12.3.3 Oracle Server X5-2L、Sun Server X4-2LまたはSun Server X3-2Lへのメモリーの追加
Oracle Big Data Appliance X5-2の各サーバーには、工場出荷時に128GBのメモリーが搭載されています。24枚実装のスロットの8つに、16GBのDIMMが挿入されています。メモリーは、最大768 GBに拡張可能です(すべての24スロットで32 GB DIMMの場合)。
Oracle Big Data Appliance X4-2およびX3-2サーバーには、64GBのメモリーが搭載されています。8つのスロットに、8GBのDIMMが挿入されています。これらのアプライアンスは、8 GB、16 GB、32 GBのDIMMをサポートしています。1つのサーバーのメモリー量は、最大512GB (16 x 32GB)に拡張できます。8 * 32 GBメモリー・キットを使用できます。
DIMMのサイズは混在できますが、サイズの大きいものから小さいものの順に取り付ける必要があります。対称性を保つことによって、最もよいパフォーマンスを得られます。たとえば、同じサイズのDIMMを4枚(メモリー・チャネルごとに1枚)各プロセッサに追加し、両方のプロセッサで同じサイズのDIMMが同じ順序で取り付けられていることを確認します。
次のようにして、Oracle Server X5-2L、Sun Server X4-2LまたはSun Server X3-2Lにメモリーを追加します。
-
DIMMのサイズを混在させる場合、次の場所にあるOracle Server X5-2Lサービス・マニュアルのDIMMの配置規則の項を参照してください
http://docs.oracle.com/cd/E41033_01/html/E48325/cnpsm.gnvje.html#scrolltoc
-
サーバーの電源を切断します。
-
新しいDIMMを取り付けます。16GBまたは32GBのDIMMを取り付ける場合、まず既存の8GB DIMMと交換し、次にプラスチック・フィラーと交換します。サイズが最も大きいDIMMから順に取り付けます。元のDIMMは最後に再取り付けできます。
次の場所にあるOracle Server X5-2Lサービス・マニュアルを参照してください
http://docs.oracle.com/cd/E41033_01/html/E48325/cnpsm.ceiebfdg.html#scrolltoc
-
サーバーの電源を投入します。
12.3.4 Sun Fire X4270 M2サーバーへのメモリーの追加
Oracle Big Data Applianceの各サーバーには、工場出荷時に48GBのメモリーが搭載されています。18枚実装のDIMMスロットの6つに、8GBのDIMMが挿入されています。空のスロットに8GBのDIMMを挿入して、合計メモリーを96GB (12 x 8GB)または144GB (18 x 8GB)にすることが可能です。144GBにアップグレードすると、メモリー帯域幅が縮小するために多少パフォーマンスが低下する可能性があります(メモリーの動作周波数は1333MHzから800MHzに落ちます)。
Sun Fire X4270 M2サーバーにメモリーを追加するには、次の手順を実行します。
-
サーバーの電源を切断します。
-
プラスチック・フィラーをDIMMに交換します。次の場所にあるSun Fire X4270 M2サーバー・サービス・マニュアルを参照してください。
http://docs.oracle.com/cd/E19245-01/E21671/motherboard.html#50503715_71311
-
サーバーの電源を投入します。
12.4 インフィニバンド・ネットワークの管理
インフィニバンド・ネットワークは、bondib0インタフェースを通じてサーバーをラックのインフィニバンド・スイッチに接続します。この項では、インフィニバンド・スイッチのメンテナンスを実行する方法について説明します。
この項で説明する項目は、次のとおりです。
12.4.1 障害のあるインフィニバンド・スイッチの交換
次のステップを実行して、Sun Network QDR Infiniband Gateway SwitchまたはSun Datacenter InfiniBand Switch 36を交換します。
関連項目:
-
ケーブル配線の詳細は、「ラック内インフィニバンド・スイッチとサーバーのケーブル接続」を参照してください
-
Sun Network QDR InfiniBand Gateway Switchインストレーション・ガイド
-
http://docs.oracle.com/cd/E26699_01/html/E26706/gentextid-125.html#scrolltoc
-
Sun Datacenter InfiniBand Switch 36ユーザーズ・ガイド
http://docs.oracle.com/cd/E26698_01/html/E26434/gentextid-119.html#scrolltoc
障害のあるインフィニバンド・スイッチを交換するには、次の手順を実行します。
-
電源プラグを取り外して、スイッチの両方の電源をオフにします。
-
スイッチからケーブルを外します。すべてのインフィニバンド・ケーブルには、両端にその場所を示すラベルがあります。どのケーブルにもラベルがない場合、ラベルを付けてください。
-
ラックからスイッチを取り外します。
-
ラックに新しいスイッチを設置します。
-
「Oracle ILOM設定のバックアップおよびリストア」の説明に従って、バックアップ・ファイルを使用してスイッチ設定をリストアします。
-
ilom_admin
としてスイッチに接続し、ファブリック管理シェルを開きます。-> show /SYS/Fabric_Mgmt
プロンプトが->からFabMan@hostname->に変更されます。
-
サブネット・マネージャを無効にします。
FabMan@bda1sw-02-> disablesm
-
適切なポートに各ケーブルを慎重に接続して、新しいスイッチにケーブルを接続します。
-
ファブリックのどのリンクにもエラーがないことを確認します。
FabMan@bda1sw-02-> ibdiagnet -c 1000 -r
-
サブネット・マネージャを有効にします。
FabMan@bda1sw-02-> enablesm
ノート:
交換したスイッチがSun Datacenter InfiniBand Switch 36スパイン・スイッチである場合、スパイン・スイッチがマスターになるまで、他のスイッチのサブネット・マネージャを無効にして、マスター・サブネット・マネージャをスイッチに手動でフェイルバックします。次に、他のすべてのスイッチでサブネット・マネージャを再有効化します。
12.4.2 インフィニバンド・ネットワーク操作の確認
インフィニバンド・ネットワークのコンポーネントにメンテナンスが必要な場合(サーバーのインフィニバンド・ホスト・チャネル・アダプタ(HCA)、インフィニバンド・スイッチまたはインフィニバンド・ケーブルの交換など)、またはインフィニバンド・ネットワークの操作が十分に機能していないと疑われる場合、インフィニバンド・ネットワークが適切に動作していることを確認してください。次の手順では、ネットワーク操作を確認する方法について説明します。
ノート:
インフィニバンド・ネットワークのパフォーマンスが想定を下回る場合、常に次の手順を使用します。
インフィニバンド・ネットワーク操作を確認するには、次の手順を実行します。
-
ibdiagnet
コマンドを入力して、インフィニバンド・ネットワーク品質を確認します。# ibdiagnet -c 1000
このコマンドでレポートされるすべてのエラーを調査します。これによって多少のネットワーク・トラフィックが生成されますが、通常のワークロード中に実行できます。
関連項目:
Sun Network QDR InfiniBand Gateway Switchコマンド・リファレンス
http://docs.oracle.com/cd/E26699_01/html/E26706/gentextid-28027.html#scrolltoc
-
スイッチ・ポート・エラー・カウンタとポート構成情報をレポートします。
LinkDowned
、RcvSwRelayErrors
、XmtDiscards
およびXmtWait
エラーは、このコマンドでは無視されます。# ibqueryerrors.pl -rR -s LinkDowned,RcvSwRelayErrors,XmtDiscards,XmtWait
関連項目:
ibqueryerrors
のLinuxman
ページ -
ハードウェアのステータスを確認します。
# bdacheckhw
次に、出力の例を示します。
[SUCCESS: Correct system model : SUN FIRE X4270 M2 SERVER [SUCCESS: Correct processor info : Intel(R) Xeon(R) CPU X5675 @ 3.07GHz [SUCCESS: Correct number of types of CPU : 1 [SUCCESS: Correct number of CPU cores : 24 [SUCCESS: Sufficient GB of memory (>=48): 48 [SUCCESS: Correct GB of swap space : 24 [SUCCESS: Correct BIOS vendor : American Megatrends Inc. [SUCCESS: Sufficient BIOS version (>=08080102): 08080102 [SUCCESS: Recent enough BIOS release date (>=05/23/2011) : 05/23/2011 [SUCCESS: Correct ILOM version : 3.0.16.10.a r68533 [SUCCESS: Correct number of fans : 6 [SUCCESS: Correct fan 0 status : ok [SUCCESS: Correct fan 1 status : ok [SUCCESS: Correct fan 2 status : ok [SUCCESS: Correct fan 3 status : ok [SUCCESS: Correct fan 4 status : ok [SUCCESS: Correct fan 5 status : ok [SUCCESS: Correct number of power supplies : 2 [1m[34mINFO: Detected Santa Clara Factory, skipping power supply checks [SUCCESS: Correct disk controller model : LSI MegaRAID SAS 9261-8i [SUCCESS: Correct disk controller firmware version : 12.12.0-0048 [SUCCESS: Correct disk controller PCI address : 13:00.0 [SUCCESS: Correct disk controller PCI info : 0104: 1000:0079 [SUCCESS: Correct disk controller PCIe slot width : x8 [SUCCESS: Correct disk controller battery type : iBBU08 [SUCCESS: Correct disk controller battery state : Operational [SUCCESS: Correct number of disks : 12 [SUCCESS: Correct disk 0 model : SEAGATE ST32000SSSUN2.0 [SUCCESS: Sufficient disk 0 firmware (>=61A): 61A [SUCCESS: Correct disk 1 model : SEAGATE ST32000SSSUN2.0 [SUCCESS: Sufficient disk 1 firmware (>=61A): 61A . . . [SUCCESS: Correct disk 10 status : Online, Spun Up No alert [SUCCESS: Correct disk 11 status : Online, Spun Up No alert [SUCCESS: Correct Host Channel Adapter model : Mellanox Technologies MT26428 ConnectX VPI PCIe 2.0 [SUCCESS: Correct Host Channel Adapter firmware version : 2.9.1000 [SUCCESS: Correct Host Channel Adapter PCI address : 0d:00.0 [SUCCESS: Correct Host Channel Adapter PCI info : 0c06: 15b3:673c [SUCCESS: Correct Host Channel Adapter PCIe slot width : x8 [SUCCESS: Big Data Appliance hardware validation checks succeeded
-
ソフトウェアのステータスを確認します。
# bdachecksw
[SUCCESS: Correct OS disk sda partition info : 1 ext3 raid 2 ext3 raid 3 linux-swap 4 ext3 primary [SUCCESS: Correct OS disk sdb partition info : 1 ext3 raid 2 ext3 raid 3 linux-swap 4 ext3 primary [SUCCESS: Correct data disk sdc partition info : 1 ext3 primary [SUCCESS: Correct data disk sdd partition info : 1 ext3 primary [SUCCESS: Correct data disk sde partition info : 1 ext3 primary [SUCCESS: Correct data disk sdf partition info : 1 ext3 primary [SUCCESS: Correct data disk sdg partition info : 1 ext3 primary [SUCCESS: Correct data disk sdh partition info : 1 ext3 primary [SUCCESS: Correct data disk sdi partition info : 1 ext3 primary [SUCCESS: Correct data disk sdj partition info : 1 ext3 primary [SUCCESS: Correct data disk sdk partition info : 1 ext3 primary [SUCCESS: Correct data disk sdl partition info : 1 ext3 primary [SUCCESS: Correct software RAID info : /dev/md2 level=raid1 num-devices=2 /dev/md0 level=raid1 num-devices=2 [SUCCESS: Correct mounted partitions : /dev/md0 /boot ext3 /dev/md2 / ext3 /dev/sda4 /u01 ext4 /dev/sdb4 /u02 ext4 /dev/sdc1 /u03 ext4 /dev/sdd1 /u04 ext4 /dev/sde1 /u05 ext4 /dev/sdf1 /u06 ext4 /dev/sdg1 /u07 ext4 /dev/sdh1 /u08 ext4 /dev/sdi1 /u09 ext4 /dev/sdj1 /u10 ext4 /dev/sdk1 /u11 ext4 /dev/sdl1 /u12 ext4 [SUCCESS: Correct swap partitions : /dev/sdb3 partition /dev/sda3 partition [SUCCESS: Correct Linux kernel version : Linux 2.6.32-200.21.1.el5uek [SUCCESS: Correct Java Virtual Machine version : HotSpot(TM) 64-Bit Server 1.6.0_29 [SUCCESS: Correct puppet version : 2.6.11 [SUCCESS: Correct MySQL version : 5.6 [SUCCESS: All required programs are accessible in $PATH [SUCCESS: All required RPMs are installed and valid [SUCCESS: Big Data Appliance software validation checks succeeded
12.4.3 ネットワーク・サブネット・マネージャ・マスターについて
サブネット・マネージャは、InfiniBandネットワークの操作特性をすべて管理します。
インフィニバンド・ネットワークには、複数のサブネット・マネージャを含めることができますが、同時にアクティブにできるサブネット・マネージャは、1つのみです。アクティブなサブネット・マネージャは、マスター・サブネット・マネージャです。他のサブネット・マネージャは、スタンバイ・サブネット・マネージャです。マスター・サブネット・マネージャが停止するか、障害が発生すると、スタンバイ・サブネット・マネージャが自動的にマスター・サブネット・マネージャになります。
各サブネット・マネージャには、構成可能な優先度があります。複数のサブネット・マネージャがインフィニバンド・ネットワーク上に存在する場合、最高の優先度を持つサブネット・マネージャがマスター・サブネット・マネージャになります。Oracle Big Data Applianceでは、リーフ・スイッチのサブネット・マネージャが優先度5に構成され、スパイン・スイッチのサブネット・マネージャが優先度8に構成されます。
次のガイドラインによって、サブネット・マネージャがOracle Big Data Applianceで実行される場所が決定されます。
-
サブネット・マネージャは、Oracle Big Data Applianceのスイッチでのみ実行されます。他のデバイスでサブネット・マネージャを実行することは、サポートされません。
-
ケーブルで接続された1つ、2つまたは3つのラックでインフィニバンド・ネットワークが構成される場合、すべてのスイッチでサブネット・マネージャを実行する必要があります。マスター・サブネット・マネージャは、スパイン・スイッチで実行されます。
-
Oracle Big Data ApplianceやExalogicなど、異なるタイプのラックを結合するマルチラック構成については、My Oracle Supportのノート1682501.1を参照してください。
-
ケーブルで接続された4つ以上のラックでインフィニバンド・ネットワークが構成される場合、サブネット・マネージャはスパイン・スイッチでのみ実行されます。リーフ・スイッチでは、サブネット・マネージャを無効にする必要があります。
関連項目:
-
次の場所にあるSun Network QDR Infiniband Gateway Switch・ライブラリ
-
Sun Datacenter InfiniBand Switch 36ライブラリ
12.5 ゲートウェイ・スイッチに対する接続数の変更
Sun Network QDR Infiniband Gateway Switchに対する10GbE接続の数を変更する場合、bdaredoclientnet
ユーティリティを実行する必要があります。「bdaredoclientnet」を参照してください。
ラックのVNICを再作成するには、次の手順を実行します。
-
/opt/oracle/bda/network.jsonがすべてのサーバーに存在し、カスタム・ネットワーク設定を正しく記述していることを確認します。次のコマンドによって、欠落しているファイルや、異なる日付スタンプを持つファイルを識別します。
dcli ls -l /opt/oracle/bda/network.json
-
管理ネットワークを使用してnode01 (ラックの一番下)に接続します。
bdaredoclientnet
ユーティリティによってクライアント・ネットワークが停止されるため、この手順でそれを使用することはできません。 -
パスワードなしSSHを削除します。
/opt/oracle/bda/bin/remove-root-ssh
このコマンドの詳細は、「パスワードなしSSHの設定」を参照してください。
-
ディレクトリを変更します。
cd /opt/oracle/bda/network
-
ユーティリティを実行します。
bdaredoclientnet
出力は、例7-2に示されている内容とほぼ同じです。
-
パスワードなしSSHをリストアします(オプション)。
/opt/oracle/bda/bin/setup-root-ssh
12.6 NTPサーバーの変更
ネットワーク・タイム・プロトコル(NTP)・サーバーの構成情報は、初期設定後に変更できます。次の手順では、インフィニバンド・スイッチ、CiscoスイッチおよびSunサーバーのNTP構成情報を変更する方法について説明します。各サーバーを個別に変更することをお薦めします。
Oracle Big Data Applianceサーバーを更新するには、次の手順を実行します。
インフィニバンド・スイッチを更新するには、次の手順を実行します。
-
ilom-admin
ユーザーとしてスイッチにログインします。 -
「インフィニバンド・スイッチでのタイムゾーンおよびクロックの設定」の指示に従います。
Ciscoイーサネット・スイッチを更新するには、次の手順を実行します。
-
Telnetを使用してCiscoイーサネット・スイッチに接続します。
-
現在の設定を削除します。
# configure terminal Enter configuration commands, one per line. End with CNTL/Z. (config)# no ntp server current_IPaddress
-
新しいIPアドレスを入力します。
# configure terminal Enter configuration commands, one per line. End with CNTL/Z. (config)# ntp server new_IPaddress
-
現在の構成を保存します。
# copy running-config startup-config
-
セッションを終了します。
# exit
サーバーおよびスイッチの変更後にOracle Big Data Applianceを再起動します。
12.7 PDUの電流の監視
PDUの電流は直接監視できます。しきい値設定を構成してPDUを監視します。各メータリング・ユニット・モジュールおよび相の構成可能なしきい値は、Info low
、Pre Warning
およびAlarm
です。
関連項目:
PDUの構成および監視の詳細は、次の場所にあるSun Rack II配電ユニット・ユーザーズ・ガイドを参照してください。
表12-1に、単相低電圧PDUを使用するOracle Big Data Applianceラックのしきい値を示します。
表12-1 単相低電圧PDUのしきい値
PDU | モジュール/相 | Info Lowしきい値 | Pre Warningしきい値 | Alarmしきい値 |
---|---|---|---|---|
A |
モジュール1、相1 |
0 |
18 |
23 |
A |
モジュール1、相2 |
0 |
22 |
24 |
A |
モジュール1、相3 |
0 |
18 |
23 |
B |
モジュール1、相1 |
0 |
18 |
23 |
B |
モジュール1、相2 |
0 |
22 |
24 |
B |
モジュール1、相3 |
0 |
18 |
23 |
表12-2に、3相低電圧PDUを使用するOracle Big Data Applianceラックのしきい値を示します。
表12-2 3相低電圧PDUのしきい値
PDU | モジュール/相 | Info Lowしきい値 | Pre Warningしきい値 | Alarmしきい値 |
---|---|---|---|---|
AおよびB |
モジュール1、相1 |
0 |
32 |
40 |
AおよびB |
モジュール1、相2 |
0 |
34 |
43 |
AおよびB |
モジュール1、相3 |
0 |
33 |
42 |
表12-3に、単相高電圧PDUを使用するOracle Big Data Applianceラックのしきい値を示します。
表12-3 単相高電圧PDUのしきい値
PDU | モジュール/相 | Info Lowしきい値 | Pre Warningしきい値 | Alarmしきい値 |
---|---|---|---|---|
A |
モジュール1、相1 |
0 |
16 |
20 |
A |
モジュール1、相2 |
0 |
20 |
21 |
A |
モジュール1、相3 |
0 |
16 |
20 |
B |
モジュール1、相1 |
0 |
16 |
20 |
B |
モジュール1、相2 |
0 |
20 |
21 |
B |
モジュール1、相3 |
0 |
16 |
20 |
表12-4に、3相高電圧PDUを使用するOracle Big Data Applianceラックのしきい値を示します。
表12-4 3相高電圧PDUのしきい値
PDU | モジュール/相 | Info Lowしきい値 | Pre Warningしきい値 | Alarmしきい値 |
---|---|---|---|---|
AおよびB |
モジュール1、相1 |
0 |
18 |
21 |
AおよびB |
モジュール1、相2 |
0 |
18 |
21 |
AおよびB |
モジュール1、相3 |
0 |
17 |
21 |
12.8 ノード移行
クラスタ・ノードで自動化されたフェイルオーバーはありません。リカバリ・プロセスを手動で実行する必要があり、プロセスは重要なノードと重要性の低いノードで異なります。
Oracle Big Data Applianceに不可欠なノード0から3のホスト・サービス。したがって、これらは重要なノードです。障害が発生した重要なノードのすべてのサービスを別のノードに移行することで、重要なノードの障害を修復します。ノード4以上は一般にDataNodesです。データは3つのノード全体にレプリケートされるため、単一のDataNodeの障害は非クリティカルになります。重要性の低いノードの障害を修復するには、ノードの再起動を試み、それでも失敗する場合は、置き換えます。
bdacli admin_clusterコマンドを使用して、ノードをデコミッション、コミッションおよび移行します。
ノードの移行では、ロールのみを移動し、秘密キーまたはトラスト・ストアが変更されないようにしてください。ノードの移行後に、更新された証明書が引き続き所定の場所にある必要があります。
関連項目:
障害が発生しているCDHまたはNoSQLクラスタ・ノードを置き換える方法は、『Oracle Big Data Applianceソフトウェア・ユーザーズ・ガイド』のハードウェア障害の管理に関する項を参照してください。12.9 サーバーでのCPUコアのキャッピング
bdacliユーティリティを使用すると、サーバー上のアクティブなコア数を設定または取得する操作を実行できます。
概要
顧客には、アプライアンス内の特定のサーバーのアクティブなCPUの数を減らす理由がある場合があります。たとえば、ライセンスの費用がCPUコアの数によって決まる場合は、ライセンス契約への準拠が維持されるように、コアを選択的に無効にできます。
Oracle Big Data Applianceサーバーは、2つのCPUが搭載されて出荷されています。これらにはそれぞれ同じ数の物理コアが含まれているため、1つのサーバーの物理コアの合計数は、1つのCPUのコア数の2倍になります。デフォルトでは、オペレーティング・システムに表示される仮想コアの数は、物理コアの合計数の2倍です。これは、IntelハイパースレッディングがすべてのOracle Big Data ApplianceのCPUでデフォルトで有効になるためです。
たとえば、X8-2LおよびX7-2サーバーでは、1つのCPUに24個のコアがあるため、物理コアの合計数は24 x 2 = 48となります。ハイパースレッディングを使用すると、48個の物理コアは96個の仮想コアになります。
bdacli setinfo active_cores
コマンドを使用すると、アクティブなコアの数を減らしたり、使用可能な物理コアの数まで増やすことができます。関連するbdacli getinfo
パラメータを使用すると、使用可能な物理コアの数、BIOSで有効にされている現在の物理コアの数、およびサーバーで実際に使用されているコアの数を判別できます。
次の表のすべてのコマンドは、rootとして実行する必要があります。
表12-5 CPUコア・キャッピングのためのbdacliコマンド
コマンド | 戻り値または結果 |
---|---|
bdacli getinfo server_all_cores |
サーバー(両方のCPU)の使用可能な物理コアの合計数を取得します。 |
bdacli getinfo server_active_cores |
サーバーで実際に使用されている物理コアの数を取得します。 |
bdacli getinfo server_enabled_cores |
BIOSで有効にされている物理コアの数を取得します。通常、これはサーバーで実際に使用されている物理コアの数と同じです。この数値は、bdacli setinfo active_cores が呼び出されたが、サーバーがまだ再起動されていない場合は、異なる可能性があります。
|
bdacli setinfo active_cores <number> |
システムのアクティブな物理コアの数を設定します。パラメータとして渡す数値は、偶数である必要があります(Oracle Big Data Applianceには2つのソケットがあるため)。この数値は、アーキテクチャでサポートされる最小値(16)から最大値の間である必要があります。BIOS構成ファイルへの変更を有効にするには、サーバーを再起動する必要があります。
ノート: アクティブなコア数を設定する場合、再起動する必要はありません。 |
例
この例では、X8-2LおよびX7-2Lサーバーでのコマンドの使用方法を示します。X6-2LおよびX5-2Lサーバーの物理コアの数は異なりますが、手順は同じです。
- サーバーの使用可能な物理コアの合計数を取得します。
# getinfo server_all_cores
- サーバーで実際に使用されている物理コアの数を取得します。
# bdacli getinfo server_active_cores
- BIOSで有効にされている物理コアの数を取得します。通常、これはサーバーで実際に使用されている物理コアの数と同じですが、
bdacli setinfo active_cores
が呼び出されたが、サーバーがまだ再起動されていない場合は、異なる可能性があります。これは、次回の再起動後にアクティブになる物理コアの数です。# bdacli getinfo server_enabled_cores
- システムのアクティブな物理コアの数を設定します。パラメータとして渡す数値は、偶数である必要があります(Oracle Big Data Applianceサーバーには2つのソケットがあるため)。この数値は、そのアーキテクチャでサポートされる最小値(16)から最大値の間である必要があります。BIOS構成ファイルへの変更を有効にするには、サーバーを再起動する必要があります。
# bdacli setinfo active_cores <number>
以前のリリースのエッジ・ノードおよびクラスタ・ノードでのコア・キャッピング
前述のbdacliコマンドは、リリース5.0の時点でOracle Big Data Applianceに組み込まれました。ただし、以前のリリースのOracle Big Data Appliance内のサーバー(エッジ・ノードを含む)では、パッチをロードして有効にできます。Oracle Big Data Appliance 5.1が実行されているエッジ・ノードでは、パッチは必要ありません
関連項目:
My Oracle Supportのノート2473609.1では、以前のOracle Big Data Applianceサーバーにコア・キャッピング機能をパッチ適用する方法について説明しています。