この章では、Oracle Exadata System Softwareのメンテナンス方法について説明します。IPアドレス、ホスト名、InfiniBandアドレスの変更など、セルの基本構成を変更する場合は、次の点に注意してください。
セル構成を変更する前に、セルを使用するすべてのOracle Automatic Storage Management (Oracle ASM)、Oracle Real Application Clusters (Oracle RAC)およびデータベース・インスタンスが、IPアドレスの変更中にセルにアクセスしないようにします。
セルの構成を変更したら、セル・サービスのコンシューマがセルの新しい接続情報を使用するように正しく再構成されていることを確認します。自動サービス・リクエストを使用中の場合は、ASR Managerから資産を無効化し、新規IPアドレスで資産を有効化します。
セルの構成を変更する場合は、変更中にOracle ASMおよびOracle RACが正しく動作するように、一度に1つのセルのみを変更します。
この章のトピックは、次のとおりです:
注意:
この章のすべての操作を実行する際は最新の注意を払い、すべてのデータをバックアップしたことを確認してから操作を実行してください。バックアップしておかないと、データが失われた場合に復元できなくなる可能性があります。
関連項目
ipconfユーティリティは、Oracle Exadata Storage Serverの次のパラメータを設定および変更するために使用します。
また、Oracle Exadata Database Machineの初期構成時に、データベース・サーバーも構成します。
IPアドレス
ホスト名
NTPサーバー
タイムゾーン
DNSネーム・サーバー
InfiniBandアドレス
ipconfユーティリティでは、変更されたファイルのバックアップ・コピーが作成されます。ユーティリティを再実行すると、既存のバックアップ・ファイルは上書きされます。ログ・ファイルには、実行したすべてのipconf操作の完全な履歴が記録されます。
表5-1 ipconfのオプション
オプション | 説明 |
---|---|
オプションなし |
ユーティリティはメイン編集モードで起動します。 |
|
格納されているセルの構成と実行構成との間に不一致がある場合は、ユーティリティをメイン編集モードで起動します。 |
|
ILOMの基本設定を出力します。 |
|
ILOMの基本設定を設定します。 |
|
格納されているセルの構成と実行構成との整合性を検証します。 |
|
整合性を検証し、すべてのDNSサーバーとNTPサーバーへのアクセスを確認します。 |
|
整合性を検証し、それぞれ1台以上のNTPサーバーとDNSサーバーへのアクセスを確認します。 |
次の例は、Sun ILOMインタフェース設定時のipconfユーティリティによる表示を示しています。
例5-1 ipconfユーティリティを使用したSun ILOMインタフェースの設定
# ipconf Logging started to /var/log/cellos/ipconf.log Interface ib0 is Linked. hca: mxx4_0 Interface ib1 is Linked. mxx4_0 Interface eth0 is Linked. driver/mac: igb/00:00:00:01:cd:01 Interface eth1 is ... Unlinked. driver/mac: igb/00:00:00:01:cd:02 Interface eth2 is ... Unlinked. driver/mac: igb/00:00:00:01:cd:03 Interface eth3 is ... Unlinked. driver/mac: igb/00:00:00:01:cd:04 Network interfaces Name State IP address Netmask Gateway Hostname ib0 Linked ib1 Linked eth0 Linked eth1 Unlinked eth2 Unlinked eth3 Unlinked Warning. Some network interface(s) are disconnected. Check cables and switches and retry Do you want to retry (y/n) [y]: n The current nameserver(s): 192.0.2.10 192.0.2.12 192.0.2.13 Do you want to change it (y/n) [n]: The current timezone: America/Los_Angeles Do you want to change it (y/n) [n]: The current NTP server(s): 192.0.2.06 192.0.2.12 1192.0.2.13 Do you want to change it (y/n) [n]: Network interfaces Name State IP address Netmask Gateway Hostname eth0 Linked 192.0.2.151 255.255.252.0 192.0.2.15 Managment myg.example.com eth1 Unlinked eth2 Unlinked eth3 Unlinked bond0 ib0,ib1 192.168.13.101 255.255.252.0 Private myg.example.com Select interface name to configure or press Enter to continue: Select canonical hostname from the list below 1: myg.example.com 2: myg-private.example.com Canonical fully qualified domain name [1]: Select default gateway interface from the list below 1: eth01 Default gateway interface [1]: Canonical hostname: myg.example.com Nameservers: 192.0.2.10 192.0.2.12 192.0.2.13 Timezone: America/Los_Angeles NTP servers: 192.0.2.06 192.0.2.12 192.0.2.13 Network interfaces Name State IP address Netmask Gateway Hostname eth0 Linked 192.0.2.151 255.255.252.0 192.0.2.15 myg.example.com eth1 Unlinked eth2 Unlinked eth3 Unlinked bond0 ib0,ib1 192.168.13.101 255.255.252.0 Private myg-priv.example.com Is this correct (y/n) [y]: Do you want to configure basic ILOM settings (y/n) [y]: y Loading configuration settings from ILOM ... ILOM Fully qualified hostname [myg_ilom.example.com]: ILOM IP discovery (static/dhcp) [static]: ILOM IP address [192.0.2.201]: ILOM Netmask [255.255.252.0]: ILOM Gateway or none [192.0.2.15]: ILOM Nameserver or none: [192.0.2.10]: ILOM Use NTP Servers (enabled/disabled) [enabled]: ILOM First NTP server. Fully qualified hostname or ip address or none [192.0.2.06]: ILOM Second NTP server. Fully qualified hostname or ip address or none [none]: Basic ILOM configuration settings: Hostname : myg.example.com IP Discovery : static IP Address : 192.0.2.10 Netmask : 255.255.252.0 Gateway : 192.0.2.15 DNS servers : 192.0.2.10 Use NTP servers : enabled First NTP server : 192.0.2.06 Second NTP server : none Timezone (read-only) : America/Los Angeles Is this correct (y/n) [y]:
Oracle Exadata System Softwareには、起動時に実行される次の検証テストが含まれます。
/usr/local/bin/
ディレクトリにあるimageinfo
コマンドは、Oracle Exadata Storage Server上のソフトウェアおよびファームウェア・コンポーネントのリリースとステータスの概要を提供します。ソフトウェアおよびファームウェア・コンポーネントによってセルのイメージが作成されます。Oracleサポート・サービスと連動する場合は、リリースおよびステータス情報が必要です。
次の表は、imageinfo
コマンドからの出力フィールドを示しています。
表5-2 imageinfo
コマンド出力の説明
フィールド | 説明 |
---|---|
アクティブ化されたアクティブ・イメージ |
セルのイメージが完了、成功または失敗と見なされた場合のUTC形式の日付スタンプ。セル・パッチはタイムスタンプを更新し、セルにパッチが適用された時間を示します。 |
アクティブ・イメージのステータス |
総称して検証と呼ばれるセルフ・テストおよび構成アクションのセットの成功または失敗に基づくセル・イメージのステータス。このステータスが未定義、空、または失敗の場合は、 |
アクティブ・イメージのバージョン |
オペレーティング・システム、コアとなるOracle Exadata System Software (セルのrpm)、セルのほとんどのキー・コンポーネントのファームウェア・レベルのリリースの特定の組合せを示す全体的なセルのイメージのメイン・リリース・バージョン。通常、セル・パッチはこの情報を更新します。バージョンの最初の5つの区切られたフィールドは、Oracle製品のリリースが識別される標準的な方法と一致します。最後のフィールドは、リリースの正確なビルド番号です。ビルド日付のYYMMDD形式に対応しています。 |
デバイス上のアクティブ・システムのパーティション |
セルのオペレーティング・システムのルート( |
ブート領域にはバージョンのロールバック・アーカイブがあります。 |
パーティション内以外のセル・パッチを使用してセルをパッチした場合は、セルを非アクティブ・イメージのバージョンにロールバックする際に使用できる適切なバックアップ・アーカイブがあるかどうかを示します。このアーカイブは必要ですが、セル・イメージを非アクティブ・バージョンにロールバックするには不十分です。 |
セル起動usbパーティション |
Oracle Exadata Storage Serverの起動およびレスキュー用USBパーティション。 |
セル起動usbバージョン |
起動用USBのソフトウェアのバージョン。正常なセルでは、このリリースはアクティブ・イメージのバージョン行の値と同じである必要があります。 |
セルのrpmバージョン |
CellCLIユーティリティによってレポートされたセルのソフトウェア・バージョンまたはセルのrpmバージョン。 |
セルのバージョン |
CellCLIユーティリティによってレポートされたリリース・バージョン。 |
パーティション内のロールバック |
セル・パッチにはパーティションを切替えないものがあります。これらがパーティション内パッチです。このフィールドはそのようなパッチをロールバックする情報があるかどうかを示します。 |
アクティブ化済非アクティブ・イメージ |
非アクティブ・イメージのアクティブ化のタイムスタンプ。このフィールドはアクティブ化済アクティブ・イメージのフィールドに似ています。 |
非アクティブ・イメージのステータス |
非アクティブ・イメージのステータス。このフィールドはアクティブ・イメージのステータスに似ています。 |
非アクティブ・イメージのバージョン |
最新のパッチが適用される前のセルのバージョン。 |
デバイス上の非アクティブ・ソフトウェアのパーティション |
非アクティブ・イメージのOracle Exadata System Softwareのファイル・システムのパーティション、 |
デバイス上の非アクティブ・システムのパーティション |
非アクティブ・イメージのルート( |
カーネル・バージョン |
セルのオペレーティング・システムのカーネル・バージョン。 |
非アクティブ・パーティションへのロールバック |
セルでロールバックを実行してセル・イメージの非アクティブ・バージョンに戻せるかどうかを示す、パーティション内以外でパッチ適用されたセルの概要インジケータ。新規セルでは、このフィールドは空、または値が |
imageinfo
コマンドの出力例を次に示します。
Kernel version: 2.6.18-194.3.1.0.3.el5 #1 SMP Tue Aug 31 22:41:13 EDT 2010 x86_64 Cell version: OSS_MAIN_LINUX.X64_101105 Cell rpm version: cell-11.2.2.1.1_LINUX.X64_101105-1 Active image version: 11.2.2.1.1.101105 Active image activated: 2010-11-06 21:52:08 -0700 Active image status: success Active system partition on device: /dev/md5 Active software partition on device: /dev/md7 In partition rollback: Impossible Cell boot usb partition: /dev/sdm1 Cell boot usb version: 11.2.2.1.1.101105 Inactive image version: 11.2.1.3.1 Inactive image activated: 2010-08-28 20:01:30 -0700 Inactive image status: success Inactive system partition on device: /dev/md6 Inactive software partition on device: /dev/md8 Boot area has rollback archive for the version: 11.2.1.3.1 Rollback to the inactive partitions: Possible
関連項目
imagehistory
コマンドは、Oracle Exadata Storage Serverのバージョン履歴を表示します。たとえば、セルがリリース11.2.1.2.6からリリース11.2.1.3.1、リリース11.2.1.2.3の順に更新された場合、imagehistory
コマンドはこの履歴を表示します。次に、出力の例を示します。
# imagehistory Version : 11.2.1.2.3 Image activation date : 2012-12-03 06:06:46 -0700 Imaging mode : fresh Imaging status : success Version : 11.2.3.2.0.120713 Image activation date : 2012-12-12 17:56:31 -0700 Imaging mode : out of partition upgrade Imaging status : success
検証フレームワークは、rc.localレベルで起動時に実行される検証テストのセットです。テストのログは、/var/log/cellos/validations
ディレクトリにあります。また、検証フレームワークでは、特定の条件下で異なるテストが実行されます。たとえば、CELLBOOT USBフラッシュ・ドライブのレスキューおよびリカバリ機能を使用してリカバリしたOracle Exadata Storage Serverをリカバリ後初めて起動する場合、またOracle Exadata Storage Serverにパッチを適用する場合などは、それぞれ異なるテストが実行されます。
また、ヘルス・チェック検証は、起動時に毎回行われるシステムのクイック・ヘルス・チェック(ディスクの基本状態などのチェック)のセットであり、ステータスがレポートされます。検証に失敗した場合、ログ・ファイルを調査して原因を見つける必要があります(ログ・ファイルには、注意が必要な潜在的な問題が示されています)。
パッチの適用後に1つ以上の検証チェックが失敗すると、自動パッチ・ロールバックが発生します。詳細は、特定のパッチのドキュメントを参照してください。
最初の起動時の構成後に、/var/log/cellos/vldrun.first_boot.log
ファイルにレポートされている障害を確認します。後続のすべての起動については、/var/log/cellos/validations.log
ファイルに失敗した検証に関する情報が含まれます。失敗している検証ごとに、次の手順を実行します。
/var/log/cellos/validations/
failed_validation_name
.SuggestedRemedy
ファイルを検索します。このファイルは、検証プロセスによってなんらかの修正処理が識別された場合にのみ作成されます。ファイルの推奨事項に従って障害の原因を修正します。
SuggestedRemedy
ファイルが存在しない場合、/var/log/cellos/validations
にあるログ・ファイルで失敗している検証を確認し、原因を調査して必要であれば修正します。
Oracle Exadata System Softwareには、Oracle Exadata Storage Serverを診断および修復するためのユーティリティが用意されています。
これらのユーティリティにより、Oracle Exadata Storage Serverの通常のライフ・サイクル中に発生する可能性のある問題を診断および修復できます。各ユーティリティは、
ディレクトリにあります。 /opt/oracle.SupportTools
注意:
ユーティリティは、すべて
ディレクトリから/opt/oracle.SupportTools
root
ユーザーとして実行する必要があります。
CheckHWnFWProfileユーティリティは、システムがハードウェアおよびファームウェアの必須仕様に準拠しているかどうかをチェックし、不一致があればそれをレポートします。
表5-3 CheckHWnFWProfileユーティリティのコマンド
コマンド | 説明 |
---|---|
|
オプションを指定せずに実行すると、ユーティリティが既存のハードウェアおよびファームウェア・コンポーネントを予想される値でチェックします。 |
|
システムの既存のハードウェアおよびファームウェア・バージョンを表示します。 |
|
|
|
|
|
指定したコンポーネントを、予想される値に照らしてチェックします。 |
|
システム上の指定したコンポーネントのハードウェアおよびファームウェア・バージョンを表示します。 |
|
シリアル番号のリストを表示します。このリストには、次のシリアル番号が含まれます。
システムによっては、すべてのメモリー(RAM)モジュールのシリアル番号が表示されます。 |
|
予期されるハードウェアおよびファームウェアを表示します。 |
|
ヘルプおよびユーティリティの使用方法を表示します。 |
diagnostics.isoユーティリティは、システムおよびそのCELLBOOT USBフラッシュ・ドライブの障害のためにシステムを分析する他の方法が存在しない場合に、サーバーを起動して深刻な問題を診断するために使用できます。このユーティリティは、常にOracleサポート・サービスの指導の下に使用してください。状況によっては、Oracleサポート・サービスでroot
のパスワードを使用できる必要があります。
verify-topology、checkbadlinks.plおよびinfinicheckユーティリティは、ibdiagtoolsユーティリティの中で最も便利なユーティリティです。verify-topologyユーティリティは、InfiniBand接続の正確性と稼働状態をチェックします。たとえば、このユーティリティにより、サーバーからの2つのケーブルがOracle Exadata Database Machineの同じスイッチに接続されているかどうかを判別できます。両方のケーブルが同じスイッチに接続されていると、最初のInfiniBandスイッチに障害が発生した場合に、サーバーではもう1つのスイッチにフェイルオーバーできなくなります。
checkbadlinks.plユーティリティは、5Gbpsで稼働しているリンクをレポートします。通常、これはケーブルが緩んでいることを示しており、固定しなおす必要があります。
infinicheckユーティリティは、Oracle Exadata Database Machineのサーバー間におけるInfiniBandのベース・パフォーマンスをレポートします(データベース・サーバーとセル、セルとセル、およびデータベース・サーバーと別のデータベース・サーバーの間の予想最小スループットなど)。このユーティリティは、InfiniBandファブリックの潜在的な問題の識別に役立ちます。
関連項目:
ibdiagtoolsユーティリティの詳細は、/opt/oracle.SupportTools/ibdiagtools/
ディレクトリのREADME.txt
ファイルを参照してください。
各ユーティリティによるサンプル出力は、/opt/oracle.SupportTools/ibdiagtools/SampleOutputs.txt
ファイルに含まれます。
make_cellboot_usbユーティリティでは、破損したCELLBOOT USBフラッシュ・ドライブを再構築できます。システムに2つ以上のUSBフラッシュ・ドライブが接続されている場合は、このユーティリティを実行しないでください。フラッシュ・ドライブは、システムで最初に検出されたUSBフラッシュ・ドライブ上に構築されます。
注意:
このユーティリティは、Oracle Exadata Storage Serverでのみ使用できます。
USBフラッシュ・ドライブを再構築する前に、実行される処理を確認するには、次のコマンドを実行します。
cd /opt/oracle.SupportTools ./make_cellboot_usb -verbose
USBフラッシュ・ドライブを再構築するには、-execute
、-force
または-rebuild
のいずれかのオプションを指定してコマンドを実行します。
./make_cellboot_usb -execute
または
./make_cellboot_usb -force
または
./make_cellboot_usb -rebuild
サーバーを起動するたびに、システム全体の構成情報がsosreportユーティリティによって収集され、/var/log/cellos/sosreports
ディレクトリに格納されます。この情報を使用すると、問題を診断する場合に役立ちます。新規sosreportを生成するには、root
ユーザーとして次のコマンドを実行します。コマンドを入力してから30分後に、スクリプトによって情報の収集が開始されます。
/opt/oracle.cellos/vldrun -script sosreport
また、/opt/oracle.ExWatcher
ディレクトリには、Oracle ExaWatcherシステム・データ収集およびレポート・ユーティリティが含まれています。収集されたデータは、アーカイブ・サブディレクトリに格納されます。次のデータは、ユーティリティによって異なる間隔で収集されます。
表5-4 Oracle ExaWatcherのコレクタ名と説明
コレクタ名 | 説明 |
---|---|
CellSrvStat |
セル・サーバーのステータス。 |
Diskinfo |
ディスクのI/O統計情報(正常に完了した読取り、マージされた読取り、読取りに要する時間など)。 |
FlashSpace |
フラッシュ・カード領域のRAW値。 最小間隔許容値は300秒です。 |
IBCardInfo |
InfiniBandカード情報およびInfiniBandポートのステータス。 最小間隔は300秒です。 |
IBprocs |
InfiniBandステータスをチェックするコマンド。 最小間隔は600秒です。 |
Iostat |
CPU統計情報、およびデバイスとパーティションのI/O統計情報。 |
Lsof |
現在のプロセスによって開かれたファイル数。 最小間隔許容値は120秒です。 |
MegaRaidFW |
MegaRaidファームウェア情報(バッテリ情報など)。 最小間隔は86400秒です。 |
Meminfo |
カーネルによるメモリー管理。 |
Mpstat |
マイクロプロセッサ統計情報。 |
Netstat |
現在のネットワーク接続統計情報。 |
Ps |
アクティブ・プロセス統計情報。 |
RDSinfo |
セル・サーバーの可用性。 間隔許容値は30秒です。 |
Slabinfo |
カーネルで頻繁に使用されるオブジェクト用のキャッシュ。 |
Top |
システムの動的なリアルタイム表示。 |
Vmstat |
仮想メモリーのステータス。 |
Oracle ExaWatcherを実行するには、次のコマンドを使用します。root
ユーザーとしてコマンドを実行することをお薦めします。
/opt/oracle.ExaWatcher/ExaWatcher.sh [options]
次のオプションは、Oracle ExaWatcherユーティリティで使用できます。
オプション | 説明 |
---|---|
オプションの指定なし |
ユーティリティはデフォルトのオプション値を使用して実行されます。 |
|
現在のグループで実行されているコア・コマンドを変更します。変更できるのは次のコア・コマンドのみです。
例: |
|
ユーティリティは、すべてのコマンドライン入力を解析して検証し、構成ファイルを作成します。ファイルのパスと名前を指定していない場合は、ユーティリティによりデフォルトの構成ファイルが上書きされます。 |
|
ユーティリティで無効にするコレクタの名前。 例: |
|
現在のグループの終了時刻。デフォルト値は、現在の時刻から10年後です。 例: |
|
Oracle ExaWatcherユーティリティで使用する構成ファイル。デフォルトの構成ファイルは次のとおりです。 Oracle Linuxの場合: Oracle Solarisの場合: |
|
データを収集するための新しいグループを起動します。その他のオプションは、 |
|
ヘルプ情報を表示します。 |
|
現在のグループのサンプリング間隔(秒)。デフォルト値は5秒です。 特定の収集モジュールについては、リソースを消費するため、毎秒実行することはできません。 例: |
|
ユーティリティが使用する領域の許容値を設定します。許容値はMB単位で指定します。デフォルト値は300GBです。 例: |
|
ユーティリティで使用される最新の構成ファイル。 このオプションを指定すると、データは収集されません。 |
|
コマンド入力に関する情報。オプションは次のとおりです。
|
|
現在のグループで実行する収集モジュールのタイプ。オプションは次のとおりです。
デフォルト値は 例: |
|
現在のグループのアーカイブ数。デフォルト値は720です。 例: |
|
データ収集の結果を格納するディレクトリのパス。 例: |
|
ユーティリティとそのすべてのプロセスを停止し、データ・ファイルを圧縮します。 |
|
現在のグループの開始時刻。デフォルト値は、現在の時刻から20秒後です。 例: |
|
現在のグループにカスタム収集モジュールを含めます。 例: - |
|
収集データで使用する圧縮プログラム。デフォルトのプログラムはbzip2です。 例: |
Oracle Exadata Database Machineのセルおよびデータベース・サーバーは、シリアル・コンソール・アクセスを提供するように構成されています。シリアル・コンソールは、Linuxカーネル・トレースの取得またはクラッシュ・ダンプ・ファイルの作成により深刻な障害を診断する場合に役立ちます。シリアル・コンソールにアクセスするには、次の手順を実行します。
SSHを使用してILOMに接続し、ILOMの管理者としてログインします。そして、「start /SP/console
」コマンドを実行します。コンソールの使用を停止するには、「stop /SP/console
」コマンドを使用します。