この章では、Oracle Big Data Applianceで使用できるユーティリティについて説明します。ほとんどのユーティリティは、ハードウェアとネットワークの健全性を監視するために使用します。
mount-hadoop-dirs
CDHクラスタの健全性(ソフトウェア、ハードウェア、ネットワークなど)を確認し、/tmp
ディレクトリのファイルに結果を記録します。
CDHクラスタの健全性の確認も実行するには、画面の指示に応じてCloudera Managerのadmin
パスワードを入力します。パスワードを入力しない場合、これらのチェックはスキップされます。
注意
クラスタがKerberos認証で保護されている場合には、bdacheckcluster
を実行する前にhdfs
ユーザーのチケットを取得する必要があります。
hdfs
のチケットを取得するには、次の手順を実行します。
次のkadmin
コマンドを使用して、hdfs
ユーザーをキー配布センター(KDC)に追加します。
addprinc hdfs@REALM_NAME
hdfs
としてチケットを要求します。
$ su hdfs -c "kinit hdfs@REALM_NAME"
例
次の例に、ユーティリティによる出力を示します。
# bdacheckcluster INFO: Logging results to /tmp/bdacheckcluster_1373393815/ Enter CM admin password to enable check for CM services and hosts Press ENTER twice to skip CM services and hosts checks Enter password: password Enter password again: password SUCCESS: Mammoth configuration file is valid. SUCCESS: hdfs is in good health SUCCESS: mapreduce is in good health SUCCESS: oozie is in good health SUCCESS: zookeeper is in good health SUCCESS: hive is in good health SUCCESS: hue is in good health SUCCESS: Cluster passed checks on all hadoop services health check SUCCESS: bda1node01.us.oracle.com is in good health SUCCESS: bda1node02.us.oracle.com is in good health SUCCESS: bda1node03.us.oracle.com is in good health . . . SUCCESS: Cluster passed checks on all hosts health check SUCCESS: All cluster host names are pingable SUCCESS: All cluster hosts passed checks on last reboot INFO: Starting cluster host hardware checks SUCCESS: All cluster hosts pass hardware checks INFO: Starting cluster host software checks SUCCESS: All cluster hosts pass software checks SUCCESS: All ILOM hosts are pingable SUCCESS: All client interface IPs are pingable SUCCESS: All admin eth0 interface IPs are pingable SUCCESS: All private Infiniband interface IPs are pingable SUCCESS: All cluster hosts resolve public hostnames to private IPs . . . INFO: Checking local reverse DNS resolve of private IPs on all cluster hosts SUCCESS: All cluster hosts resolve private IPs to public hostnames SUCCESS: 2 virtual NICs available on all cluster hosts SUCCESS: NTP service running on all cluster hosts SUCCESS: At least one valid NTP server accessible from all cluster servers. SUCCESS: Max clock drift of 0 seconds is within limits SUCCESS: Big Data Appliance cluster health checks succeeded
サーバーのハードウェア・プロファイルを確認します。
例
次の例に、ユーティリティによる出力を示します。
# bdacheckhw
SUCCESS: Found BDA v2 server : SUN FIRE X4270 M3
SUCCESS: Correct processor info : Intel(R) Xeon(R) CPU E5-2660 0 @ 2.20GHz
SUCCESS: Correct number of types of CPU : 1
SUCCESS: Correct number of CPU cores : 32
SUCCESS: Sufficient GB of memory (>=63): 63
SUCCESS: Correct BIOS vendor : American Megatrends Inc.
SUCCESS: Sufficient BIOS version (>=08080102): 18021300
SUCCESS: Recent enough BIOS release date (>=05/23/2011):06/19/2012
SUCCESS: Correct ILOM major version : 3.1.2.12
SUCCESS: Sufficient ILOM minor version (>=74388): 74388
SUCCESS: Correct number of fans : 4
SUCCESS: Correct fan 0 status : ok
SUCCESS: Correct fan 1 status : ok
.
.
.
SUCCESS: Big Data Appliance hardware validation checks succeeded
1つのラックのサーバーとスイッチ間のインフィニバンド・ケーブル配線を確認します(オプションなしで入力された場合)。
任意のサーバーにroot
として接続した後に、このコマンドを実行します。
パラメータ
オプションなしで実行する場合と同じですが、ネットワークがまだ工場出荷時のデフォルト設定で構成されている必要があります。Oracle Big Data Applianceがサイトに到着したらすぐに、まだスイッチを構成する前であっても、このオプションを使用できます。
複数のランクにおけるインフィニバンド・スイッチ間のケーブル配線が正しいことを確認します。json_fileを作成するには、-g
オプションを参照します。
sample-multi-rack.json
というサンプルJSONファイルを生成します。-m
オプションによって必要とされる形式の例として、このファイルを使用します。
例
次の例では、スイッチとサーバー間のインフィニバンド・ケーブルを確認します。
[root@node01 network]# bdacheckib
LINK bda1sw-ib3.15A ... bda1node02.HCA-1.2 UP
LINK bda1sw-ib3.15B ... bda1node01.HCA-1.2 UP
LINK bda1sw-ib3.14A ... bda1node04.HCA-1.2 UP
LINK bda1sw-ib3.14B ... bda1node03.HCA-1.2 UP
.
.
.
次の例では、JSONファイルを生成して出力を表示します。
[root@bda1node01 bda]# bdacheckib -g [root@bda1node01 bda]# cat sample-multi-rack.json # This json multirack spec is generated. The array elements are sorted # alphabetically. A properly arranged json spec representing racks from left to right # can be used as input to bdacheckib (bdacheckib -m multi-rack.json) # Note commas separating rack elements are optional. [ {"SPINE_NAME": "bda1sw-ib1", "LEAF1_NAME": "bda1sw-ib2", "LEAF2_NAME": "bda1sw-ib3"} {"SPINE_NAME": "bda2sw-ib1", "LEAF1_NAME": "bda2sw-ib2", "LEAF2_NAME": "bda2sw-ib3"} {"SPINE_NAME": "dm01sw-ib1", "LEAF1_NAME": "dm01sw-ib2", "LEAF2_NAME": "dm01sw-ib3"}
最後の例では、前の例で作成された編集済のJSONファイルを使用して、インフィニバンド・ネットワーク上のすべてのラックを確認します。
# bdacheckib -m sample-multi-rack.json
Rack #1 leaf to spines topology check
leaf: bda1sw-ib2
expected 2 links to rack 1, found 4 OK
expected 2 links to rack 2, found 4 OK
expected 2 links to rack 3, found 3 OK
expected 2 links to rack 4, found 3 OK
leaf: bda1sw-ib3
expected 2 links to rack 1, found 3 OK
expected 2 links to rack 2, found 4 OK
expected 2 links to rack 3, found 3 OK
expected 2 links to rack 4, found 3 OK
.
.
.
Rack #1 cabling details
leaf: bda1sw-ib2
LINK ... to rack2 ......... UP
LINK ... to rack2 ......... UP
LINK ... to rack1 ......... UP
LINK ... to rack1 ......... UP
LINK ... to rack3 ......... UP
LINK ... to rack3 ......... UP
LINK ... to rack4 ......... UP
LINK ... to rack4 ......... UP
.
.
.
ネットワーク構成が適切に動作しているかどうかを確認します。
例
次の例に、ユーティリティによる出力を示します。
[root@node01 network]# bdachecknet
bdachecknet: analyse /opt/oracle/bda/BdaDeploy.json
bdachecknet: passed
bdachecknet: checking for BdaExpansion.json
bdachecknet: ping test private infiniband ips (bondib0 40gbs)
bdachecknet: passed
bdachecknet: ping test admin ips (eth0 1gbs)
bdachecknet: passed
bdachecknet: test admin network resolve and reverse resolve
bdachecknet: passed
bdachecknet: test admin name array matches ip array
bdachecknet: passed
bdachecknet: test client network (eoib) resolve and reverse resolve
bdachecknet: passed
bdachecknet: test client name array matches ip array
bdachecknet: passed
bdachecknet: test ntp servers
bdachecknet: passed
bdachecknet: ping client gateway
bdachecknet: passed
bdachecknet: test arp -a
bdachecknet: passed
サーバーのソフトウェア・プロファイルを確認します。
例
次の例に、ユーティリティによる出力を示します。
# bdachecksw
SUCCESS: Correct OS disk s0 partition info : 1 ext3 raid 2 ext3 raid 3 linux-swap 4 ext3 primary
SUCCESS: Correct OS disk s1 partition info : 1 ext3 raid 2 ext3 raid 3 linux-swap 4 ext3 primary
SUCCESS: Correct data disk s2 partition info : 1 ext3 primary
SUCCESS: Correct data disk s3 partition info : 1 ext3 primary
SUCCESS: Correct data disk s4 partition info : 1 ext3 primary
SUCCESS: Correct data disk s5 partition info : 1 ext3 primary
SUCCESS: Correct data disk s6 partition info : 1 ext3 primary
SUCCESS: Correct data disk s7 partition info : 1 ext3 primary
SUCCESS: Correct data disk s8 partition info : 1 ext3 primary
SUCCESS: Correct data disk s9 partition info : 1 ext3 primary
SUCCESS: Correct data disk s10 partition info : 1 primary
SUCCESS: Correct data disk s11 partition info : 1 primary
SUCCESS: Correct software RAID info : /dev/md2 level=raid1 num-devices=2 /dev/md0 level=raid1 num-devices=2
SUCCESS: Correct mounted partitions : /dev/mapper/lvg1-lv1 /lv1 ext4 /dev/md0 /boot ext3 /dev/md2 / ext3 /dev/sd4 /u01 ext4 /dev/sd4 /u02 ext4 /dev/sd1 /u03 ext4 /dev/sd1 /u04 ext4 /dev/sd1 /u05 ext4 /dev/sd1 /u06 ext4 /dev/sd1 /u07 ext4 /dev/sd1 /u08 ext4 /dev/sd1 /u09 ext4 /dev/sd1 /u10 ext4
SUCCESS: Correct matching label and slot : symbolic link to `../../sda4'
SUCCESS: Correct matching label and slot : symbolic link to `../../sdb4'
.
.
.
SUCCESS: Correct Linux kernel version 2.6-39-400.200 series : Linux 2.6.39-400.2 14.3.el6uek.x86_64
SUCCESS: Correct Java Virtual Machine version : HotSpot(TM) 64-Bit Server 1.7.0_ 25
SUCCESS: Correct puppet version : 2.6.11
SUCCESS: Correct MySQL version : 5.5.35
SUCCESS: All required programs are accessible in $PATH
SUCCESS: All required RPMs are installed and valid
SUCCESS: Correct bda-monitor status : bda monitor is running
SUCCESS: Big Data Appliance software validation checks succeeded
クラスタ内のすべてのサーバーの時間を同期します。
使用上の注意
このユーティリティを使用するには、root
ユーザーとしてノードの第1サーバーにログインする必要があります。また、クラスタにパスワードなしssh
が設定されている必要があります。「setup-root-ssh」の-C
パラメータに関する項を参照してください。
このユーティリティは、出力に指定されたディレクトリにbdaclustersynctime.log
いう名前のログ・ファイルを作成します。
例
次の例では、bdaclustersynctime
が正常に実行されています。
# bdaclustersynctime
INFO: Logging results to /tmp/bdacluster_1373485952/
SUCCESS: Mammoth configuration file is valid.
SUCCESS: All cluster host names are pingable
SUCCESS: NTP service running on all cluster hosts
SUCCESS: At least one valid NTP server found
SUCCESS: No errors found syncing date and time on all nodes
SUCCESS: Max clock drift of 0 seconds is within limits
SUCCESS: Sync date and time of cluster succeeded
Oracle Big Data Applianceコマンドライン・インタフェース(bdacli
)は、コマンドが実行されるサーバー、クラスタまたはラックに関する情報を返すために様々な構成ファイルを問い合せます。コマンドラインにパラメータが含まれていないか、または値が未定義の場合、CLIには使用方法の情報が表示されます。
bdacli
ユーティリティは、オプション・サービスの追加と削除も実行します。
パラメータ
次のbdacli
コマンドの1つを使用します。
--help
または -?
: 一般的なヘルプ・トピックを表示します。
getinfo
option
: 指定したオプションに関する情報を返します。表12-1を参照してください。
getparams {add | remove}
service-name
: add
またはremove
コマンドのパラメータ値を説明するJSONファイルを返します。add
またはremove
コマンドを使用する際に、これらの値の入力を要求されます。
service-nameは次の値のいずれかです。
asr
: 自動サービス・リクエスト
auditvault
: Oracle Audit Vault and Database Firewall
bdc
: Oracle Big Data Connectors
kerberos
: Kerberos認証
add
service-name
[response-file
]: オプション・サービスのサポートを追加します。service-nameは、asr
、auditvault
、bdc
、disk-encryption
またはkerberos
のいずれかです。パラメータは、応答ファイルで指定するか、または対話形式で指定します。response-fileへのフルパスを指定します。パラメータを取得するには、bdacli getparams
コマンドを使用します。
remove
service-name
[response-file
: オプション・サービスのサポートを削除します。service-nameは、asr
、auditvault
、bdc
、disk-encryption
またはkerberos
のいずれかです。パラメータは、応答ファイルで指定するか、または対話形式で指定します。response-fileへのフルパスを指定します。パラメータを取得するには、bdacli getparams
コマンドを使用します。
表12-1 bdacli getinfoのオプション
オプション | 戻り値 |
---|---|
|
Oracle Audit Vault and Database Firewall監査が有効な場合は |
|
Oracle Big Data Connectorsがインストールされている場合は |
|
このクラスタにインストールされているCloudera's Distribution including Apache Hadoopのバージョン( |
|
サーバー名およびポート番号を含むCloudera Managerのアドレス( |
|
このクラスタで実行されているCloudera Managerのバージョン( |
|
Kerberosセキュリティが有効な場合は |
|
このクラスタの名前( |
|
このクラスタ内のすべてのノードのクライアント・ネットワーク上のIPアドレス。 |
|
クラスタ内のすべてのノードのクライアント・ネットワーク上のホスト名( |
|
このクラスタにインストールされているOracle NoSQL Databaseのエディション。インストールされていない場合は |
|
Oracle Data Integratorエージェントが有効な場合は |
|
クラスタのタイプ( |
|
Mammothユーティリティによってこのクラスタにインストールされているソフトウェア・バージョン(2.5.0など)。 |
|
インフィニバンド・ファブリック上のOracle Big Data Applianceサーバーのリスト。リストには、ケーブルで接続されている複数のラック内のサーバーを含めることができます。 |
|
インフィニバンド・ファブリック上のスイッチをリストします。スイッチ名、Globally Unique Identifier (GUID)およびタイプ(ゲートウェイ・スイッチの場合は |
|
このラックの管理ネットワーク上のドメイン名( |
|
このラックのクライアント・ネットワーク上のドメイン名( |
|
ラック内の3つのインフィニバンド・スイッチのIPアドレス(1つはスパイン・スイッチ、2つはゲートウェイ・リーフ・スイッチ)。 |
|
ラック内の3つのインフィニバンド・スイッチの名前(1つはスパイン・スイッチ、2つはゲートウェイ・リーフ・スイッチ)。bda1sw-ib1、bda1sw-ib2、bda1sw-ib3など。 |
|
ラック内のすべてのOracle ILOMのIPアドレス。 |
|
ラック内のすべてのOracle ILOMのホスト名(bda1node01-ilom、bda1node02-ilomなど)。 |
|
管理、ギガビット、イーサネット・スイッチのIPアドレス。 |
|
管理、ギガビット、イーサネット・スイッチのホスト名(bda1sw-ipなど)。 |
|
このラックの名前(bda1など)。 |
|
ラック内のPDUのIPアドレス。 |
|
ラック内のPDUのホスト名(bda1-pdua、bda1-pdub)。 |
|
ラックのシリアル番号。 |
|
ラック内のすべてのサーバーの管理ネットワーク上のIPアドレス。 |
|
ラック内のすべてのサーバーの管理ネットワーク上のホスト名(bda1node01-adm、bda1node02-admなど)。 |
|
ラック内のすべてのサーバーのクライアント・ネットワーク上のIPアドレス。 |
|
ラック内のすべてのサーバーのクライアント・ネットワーク上のホスト名(bda1node01、bda1node02など)。 |
|
ラック内のすべてのサーバーのプライベート(ILOM)ネットワーク上のIPアドレス。 |
|
ラック内のすべてのサーバーのプライベート(ILOM)ネットワーク上のホスト名(bda1node01-priv、bda1node02-privなど)。 |
|
MammothユーティリティがこのサーバーにOracle Big Data Applianceソフトウェアをデプロイした場合は |
|
クライアント・ネットワーク上のこのサーバーの名前(bda1node01など)。 |
|
このサーバー上のOracle Linuxのバージョン(6.4など)。 |
例
次のコマンドは、現在のインフィニバンド・ファブリック上のすべてのスイッチをリストします。この例では、標準のハードウェア構成(それぞれに1つのスパイン・スイッチと2つのゲートウェイ・スイッチ)を備えた3つのOracle Big Data Applianceラックがファブリック上にあります。
$ bdacli getinfo ib_switches
bda1sw-ib3 00:22:28:c3:70:9a:c0:a0 GTW
bda1sw-ib2 00:22:28:de:ae:4a:c0:a0 GTW
bda2sw-ib3 00:22:28:df:0f:0a:c0:a0 GTW
bda2sw-ib2 00:22:28:df:34:8a:c0:a0 GTW
bda3sw-ib2 00:10:e0:0c:48:a0:c0:a0 GTW
bda3sw-ib1 00:22:28:e8:af:23:a0:a0 36P
bda1sw-ib1 00:22:28:46:98:d3:a0:a0 36P
bda2sw-ib1 00:22:28:46:90:ee:a0:a0 36P
bda3sw-ib3 00:22:28:f4:82:ce:c0:a0 GTW
次の例では、Oracle Big Data Connectorsの追加に必要なパラメータを示します。
$ bdacli getparams add bdc
{ "PARAMETERS" : [
{
"NAME" : "ODI_ENABLED",
"DISPLAY_NAME" : "Is ODI Enabled",
"TYPE" : "boolean",
"HELP_TEXT" : "Should ODI agent be started."
},
{
"NAME" : "ODI_PWD",
"DISPLAY_NAME" : "ODI MySQL Password",
"TYPE" : "password",
"HELP_TEXT" : "Password for the MySQL BDA_ODI_REPO user. Leave blank if ODI is not enabled."
},
{
"NAME" : "MYSQL_PWD",
"DISPLAY_NAME" : "MySQL root Password",
"TYPE" : "password",
"HELP_TEXT" : "Password for the MySQL root user"
}
] }
Oracleサポートにかわって個々のサーバーに関する診断情報を収集します。
パラメータ
Cloudera Managerから診断情報をダウンロードします。このパラメータを使用する場合、Cloudera Manager admin
パスワードを知っている必要があります。
完全なHadoop Distributed File System (HDFS) fsck
チェックの出力を収集します。
ipmitool
を使用してILOMデータを収集します。ilom
は、snapshot
と同じコマンドで使用できません。
Oracle OS Watcherログ(時系列のオペレーティング・システム・パフォーマンスおよび監視データを含む)を収集します。出力で、数百メガバイトのディスク領域を使用する場合があります。
ネットワーク経由でILOMスナップショット・データを収集し、ilom
オプションより有用な出力を提供します。このパラメータを使用する場合、サーバーのroot
パスワードを知っている必要があります。snapshot
は、ilom
と同じコマンドで使用できません。
戻り値
bdadiag
によってデータが格納された/tmp
ディレクトリの圧縮ファイルの名前。ファイル名の形式は、bdadiag_
server-name_server-serial-number_
date
.tar.bz2
です。
ログは、次のようなサブディレクトリに編成されます。
bdadiag
でオプション・パラメータを使用して追加の診断情報を収集します。コマンドラインでオプションを組み合せて入力することで、ほとんどの情報を収集できます。
Oracleサポートの求めに応じてbdadiag
を実行し、オープンしたサービス・リクエスト(SR)に関連付けます。Oracleサポートへの診断情報の提供の詳細は、『Oracle Big Data Applianceソフトウェア・ユーザーズ・ガイド』を参照してください。
例
次の例に、ユーティリティによる基本出力を示します。
# bdadiag
Big Data Appliance Diagnostics Collection Tool v2.5.0
Gathering Linux information
Skipping ILOM collection. Use the ilom or snapshot options, or login to ILOM over the network and run Snapshot separately if necessary.
Generating diagnostics tarball and removing temp directory
===========================================================================
Done. The report files are bzip2 compressed in /tmp/bdadiag_bda1node0101_12 16FM5497_2013_01_18_06_49.tar.bz2
===========================================================================
次の例では、cm
オプションによる追加出力を示します。
]# bdadiag cm Big Data Appliance Diagnostics Collection Tool v2.4.0 Getting Cloudera Manager Diagnostics Password for the Cloudera Manager admin user is needed Enter password: password Enter password again: password Passwords match Waiting for Cloudera Manager ... Succeeded. Output in : /opt/oracle/BDAMammoth/bdaconfig/tmp/cm_commands.out Collecting diagnostic data ... { "startTime" : "2013-07-09T13:27", "endTime" : "2013-07-08T13:27" } Succeeded. Output in : /opt/oracle/BDAMammoth/bdaconfig/tmp/cm_commands_collectDiagnosticData.out Command ID is 364 ... Command 364 finished after 20 seconds Operation completed successfully Diagnostic data successfully collected Can be downloaded from URL http://bda1node01.example.com:7180/cmf/command/364/download Downloading diagnostic data ... Original Cloudera Manager Diagnostics Bundle Name : 3609df48-4930-11e1-9006-b8ac6f8061c1.bda1-c.20140128-19-16.support-bundle.zip Data successfully downloaded and placed in /tmp/bdadiag_bda1node01_1226FM50CB_2014_01_28_11_13/3609df48-4930-11e1-9006-b8ac6f8061c1.AK00054322.bda01-c.20140128-19-16.support-bundle.zip Gathering Linux information . . .
次の例では、snapshot
オプションによる追加出力を示します。
# bdadiag snapshot Big Data Appliance Diagnostics Collection Tool v2.5.0 Please enter Host OS root password required for snapshot: password Gathering Linux information Gathering ILOM Snapshot data - please be patient, this may take a long time snapshot running: Tue Jul 9 13:42:28 PDT 2013 snapshot running: Tue Jul 9 13:43:29 PDT 2013 snapshot running: Tue Jul 9 13:44:32 PDT 2013 snapshot running: Tue Jul 9 13:45:35 PDT 2013 snapshot running: Tue Jul 9 13:46:39 PDT 2013 snapshot running: Tue Jul 9 13:47:43 PDT 2013 snapshot running: Tue Jul 9 13:48:47 PDT 2013 Snapshot Collection completed. Generating diagnostics tarball and removing temp directory ============================================================================== Done. The report files are bzip2 compressed in /tmp/bdadiag_bda1node01_1143FMM06E_2013_07_09_13_40.tar.bz2 ==============================================================================
Cloudera ManagerからHDFS、MapReduceおよびHiveのクライアント構成ファイルをデプロイします。
例
この例は、クラスタのあるノードからの出力を示します。
# bdagetclientconfig
bdagetclientconfig : Download and deploy HDFS, Map-Reduce and Hive client configuration files
Logging to /tmp/bdagetclientconfig-1368541073.out
Downloading HDFS and Map-Reduce client configuration zipfile
Downloading Hive client configuration zipfile
Deploying HDFS, Map-Reduce and Hive client configurations
Successfully downloaded and deployed HDFS, Map-Reduce and Hive client configurations !
個々のサーバーに関する情報を返します。
Cloudera's Distribution including Apache Hadoopの問題についてOracleサポートに連絡する必要がある場合、最初にこのコマンドを実行します。
bdacheckhw
およびbdachecksw
を実行してハードウェアとサーバー上のソフトウェアを検証します。
例
# bdaimagevalidate
SUCCESS: Found BDA v2 server : SUN FIRE X4270 M3
SUCCESS: Correct processor info : Intel(R) Xeon(R) CPU E5-2660 0 @ 2.20GHz
SUCCESS: Correct number of types of CPU : 1
SUCCESS: Correct number of CPU cores : 32
SUCCESS: Sufficient GB of memory (>=63): 63
SUCCESS: Correct BIOS vendor : American Megatrends Inc.
SUCCESS: Sufficient BIOS version (>=08080102): 18021300
SUCCESS: Recent enough BIOS release date (>=05/23/2011):06/19/2012
SUCCESS: Correct ILOM major version : 3.1.2.12
.
.
.
SUCCESS: All required programs are accessible in $PATH
SUCCESS: All required RPMs are installed and valid
SUCCESS: Oracle R Connector for Hadoop is available : Oracle R Connector for Hadoop 2.3.1 (rev. 288)
SUCCESS: Correct bda-monitor status : bda monitor is running
SUCCESS: Big Data Appliance software validation checks succeeded
SUCCESS: All Big Data Appliance validation checks succeeded
ラックのすべてのサーバーの仮想ネットワーク・インタフェース・カード(VNIC)を再作成し、それらを使用可能な10GbEポートに分散します。
使用上の注意
サーバー1にログインし、/opt/oracle/bda/network
ディレクトリに移動してこのユーティリティを実行します。
Sun Network QDR Infiniband Gateway Switchに対する10GbE接続の数を変更した後に、このユーティリティを実行する必要があります。「ゲートウェイ・スイッチに対する接続数の変更」を参照してください。
bdaredoclientnet
ユーティリティは、Oracle Big Data Applianceの初期構成中にnetworksetup-two
スクリプトによって実行される次のタスクのサブセットを実行します。
管理ネットワークが動作していること、インフィニバンドのケーブル配線が正しいこと、およびインフィニバンド・スイッチが使用できることを確認します。
使用可能な10GbE接続の数を判別し、それらをインフィニバンド・ゲートウェイ・スイッチに接続します。
すべてのVNICを削除してそれらを再作成します。
各サーバーに接続して構成ファイルを更新します。
クライアント・ネットワークを再開し、新しく構成されたクライアント・ネットワークを使用して各サーバーに接続できることを確認します。
例
次の例に、bdaredoclientnet
ユーティリティによる出力を示します。
# cd /opt/oracle/bda/network # bdaredoclientnet bdaredoclientnet: check syntax and static semantics of /opt/oracle/bda/BdaDeploy.json bdaredoclientnet: passed bdaredoclientnet: ping servers by name on admin network bdaredoclientnet: passed bdaredoclientnet: verify infiniband topology bdaredoclientnet: passed bdaredoclientnet: start setup client network (10gigE over Infiniband) bdaredoclientnet: ping both gtw leaf switches bdaredoclientnet: passed bdaredoclientnet: verify existence of gateway ports bdaredoclientnet: passed bdaredoclientnet: removing existing eoib setup for this server Shutting down interface bondeth0: [ OK ] Shutting down interface bondib0: [ OK ] Shutting down interface eth0: [ OK ] Shutting down loopback interface: [ OK ] Disabling IPv4 packet forwarding: net.ipv4.ip_forward = 0 [ OK ] Bringing up loopback interface: [ OK ] Bringing up interface bondib0: [ OK ] Bringing up interface eth0: [ OK ] bdaredoclientnet: ping server ips on admin network bdaredoclientnet: passed bdaredoclientnet: ping servers by name on admin network bdaredoclientnet: passed bdaredoclientnet: test ssh server ips on admin network hello from bda1node02.us.oracle.com hello from bda1node03.us.oracle.com . . . bdaredoclientnet: passed bdaredoclientnet: check existence of default vlan for port 0A-ETH-1 on bda1sw-ib2 bdaredoclientnet: use existing default vlan for port 0A-ETH-1 on bda1sw-ib2 bdaredoclientnet: check existence of default vlan for port 0A-ETH-1 on bda1sw-ib3 bdaredoclientnet: use existing default vlan for port 0A-ETH-1 on bda1sw-ib3 bdaredoclientnet: passed bdaredoclientnet: apply eoib on each server bdaredoclientnet: wait a few seconds for the network to restart on 10.111.22.001 bdaredoclientnet: wait a few seconds for the network to restart on 10.111.22.002 . . . check and delete vNIC for bda1node02 on switch bda1sw-ib2 vNIC ID 757 deleted IO Adapter for vNIC deleted check and delete vNIC for bda1node02 on switch bda1sw-ib3 check and delete vNIC for bda1node02 on switch bda1sw-ib2 check and delete vNIC for bda1node02 on switch bda1sw-ib3 vNIC ID 707 deleted IO Adapter for vNIC deleted create vNIC eth9 bda1node02 on switch bda1sw-ib3 vNIC created create vNIC eth8 bda1node02 on switch bda1sw-ib2 vNIC created . . . bdaredoclientnet: ping server ips on client network bdaredoclientnet: passed bdaredoclientnet: test ssh server ips on client network hello from bda1node02.us.oracle.com hello from bda1node03.us.oracle.com . . . bdaredoclientnet: passed bdaredoclientnet: end setup client network
接続しているOracle Big Data Applianceサーバーのほとんどのコンポーネントのシリアル番号およびメディア・アクセス制御(MAC)アドレスを返します。
例
次の例に、ユーティリティによる出力を示します。
# bdaserials
Rack serial number : AK00023713
System serial number : 1137FMM0BY
System UUID : 080020FF-FFFF-FFFF-FFFF-7E97D6282100
Motherboard serial number : 0338MSL-1131BA2194
Chassis serial number : 1137FMM0BY
Memory serial numbers : 87948175 87949173 87948163 8794816B 87948130 87948176
Infiniband HCA serial number : 1388FMH-1122501437
Disk controller serial number : SV11713731
Hard disk serial numbers :
SEAGATE ST32000SSSUN2.0T061A1125L6M89X
SEAGATE ST32000SSSUN2.0T061A1125L6LFH0
SEAGATE ST32000SSSUN2.0T061A1125L6M94J
SEAGATE ST32000SSSUN2.0T061A1125L6LLEZ
SEAGATE ST32000SSSUN2.0T061A1125L6M5S2
SEAGATE ST32000SSSUN2.0T061A1125L6LSD4
SEAGATE ST32000SSSUN2.0T061A1127L6M58L
SEAGATE ST32000SSSUN2.0T061A1127L6R40S
SEAGATE ST32000SSSUN2.0T061A1125L6M3WX
SEAGATE ST32000SSSUN2.0T061A1125L6M65D
SEAGATE ST32000SSSUN2.0T061A1127L6NW3K
SEAGATE ST32000SSSUN2.0T061A1127L6N4G1
MAC addresses :
bondeth0 Ethernet : CE:1B:4B:85:2A:63
bondib0 InfiniBand : 80:00:00:4A:FE:80:00:00:00:00:00:00:00:00:00:00:00:00:00:00
bond0 Ethernet : 00:00:00:00:00:00
eth0 Ethernet : 00:21:28:E7:97:7E
eth1 Ethernet : 00:21:28:E7:97:7F
eth2 Ethernet : 00:21:28:E7:97:80
eth3 Ethernet : 00:21:28:E7:97:81
eth8 Ethernet : CE:1B:4B:85:2A:63
eth9 Ethernet : CE:1B:4C:85:2A:63
ib0 InfiniBand : 80:00:00:4A:FE:80:00:00:00:00:00:00:00:00:00:00:00:00:00:00
ib1 InfiniBand : 80:00:00:4B:FE:80:00:00:00:00:00:00:00:00:00:00:00:00:00:00
オペレーティング・システムによるスワッピングをオフにします。
サーバーの特定のコンポーネント(交換ディスク・ドライブなど)のファームウェアを更新します。
パラメータ
指定されたディスク(N)のLSIディスク・ファームウェアを更新します。各サーバーには12台のディスクがあり、0から11の番号が付けられます。
ファームウェアのファイル・パスを指定します。パスを省略した場合、bdaupdatefw
は、指定されたコンポーネントの/opt/oracle/bda/firmware
のデフォルト・ファームウェアを使用します。
bdaupdatefw
の構文と使用方法の情報を表示します。
Oracle ILOMファームウェアを更新します。
LSIディスク・コントローラ・ファームウェアを更新します。
Mellanoxホスト・チャネル・アダプタ(インフィニバンド・カード)のファームウェアを更新します。
使用方法
このユーティリティは、通常、サポートされているファームウェア・バージョンが工場出荷時にインストールされていない可能性のあるハードウェア・コンポーネントのインストールまたは交換の際に、Oracleフィールド・エンジニアによって実行されます。ソフトウェアのインストール時、現在サポートされているファームウェアがMammothによってOracle Big Data Applianceにコピーされます。bdaupdatefw
コマンドは、サーバー・コンポーネントのファームウェアを更新する際、これらのファイルを使用します。
1つのコマンドで1つのファームウェア・パッケージを更新できます。したがって、-d
、-i
、-l
または-m
のいずれか1つのみのパラメータを指定できます。
注意: Mammothバンドルで提供されるファームウェアのみを使用します。サードパーティ・サイトからダウンロードされたファームウェアをインストールしないでください。これを行うと、保証やサポートの対象外となることがあります。「Oracle Big Data Applianceの使用上の制限事項」を参照してください。 |
例
次の例に、Oracle ILOMファームウェアを更新するコマンドの出力を示します。更新を行うには、出力に示されたipmiflash
コマンドを実行する必要があります。
# bdaupdatefw -i
[INFO:GENERAL] No firmware file specified. Using default firmware file - /opt/or
acle/bda/firmware/ILOM-3_2_0_r74388-Sun_Fire_X4270_M3.pkg
[INFO:GENERAL] Updating ILOM firmware with the firmware file /opt/oracle/bda/fir
mware/ILOM-3_2_0_r74388-Sun_Fire_X4270_M3.pkg
[INFO:GENERAL] Original version is: 3.1.2.12 r74388
[INFO:GENERAL]
[INFO:GENERAL] Please run the following command and enter the root password
[INFO:GENERAL] for the ILOM when requested
[INFO:GENERAL]
[INFO:GENERAL] Note that this command will shutdown the server after flashing.
[INFO:GENERAL] You will need to login to the ILOM to power on the server afterwa
rds.
[INFO:GENERAL]
[INFO:GENERAL] ipmiflash -v -I lanplus -H 10.133.46.218 -U root write /opt/oracl
e/bda/firmware/ILOM-3_1_2_12_r74388-Sun_Fire_X4270_M3.pkg
[INFO:GENERAL]
インフィニバンド・ネットワークのすべてのインフィニバンド接続をリストします。
例
次の例は、インフィニバンド・ネットワーク上の2つのOracle Big Data Applianceと1つのOracle Exadata Database Machineを示しています。
[root@bda1node01 network]# iblinkinfo
Switch 0x002128df348ac0a0 SUN IB QDR GW switch bda1sw-ib2 10.133.43.36:
149 1[ ] ==( 4X 10.0 Gbps Active/ LinkUp)==> 130 2[ ] "SUN IB QDR GW switch bda1sw-ib2 10.133...
149 2[ ] ==( 4X 10.0 Gbps Active/ LinkUp)==> 127 1[ ] "SUN IB QDR GW switch bda1sw-ib2 10.133...
149 3[ ] ==( 4X 10.0 Gbps Active/ LinkUp)==> 111 2[ ] "SUN IB QDR GW switch bda1sw-ib2 10.133...
149 4[ ] ==( 4X 10.0 Gbps Active/ LinkUp)==> 109 1[ ] "SUN IB QDR GW switch bda1sw-ib2 10.133...
149 5[ ] ==( 4X 10.0 Gbps Active/ LinkUp)==> 143 1[ ] "bda1node02 BDA 192.168.41.20 HCA-1" ( )
149 6[ ] ==( 4X 10.0 Gbps Active/ LinkUp)==> 137 1[ ] "bda1node01 BDA 192.168.41.19 HCA-1" ( )
149 7[ ] ==( 4X 10.0 Gbps Active/ LinkUp)==> 141 1[ ] "bda1node04 BDA 192.168.41.22 HCA-1" ( )
149 8[ ] ==( 4X 10.0 Gbps Active/ LinkUp)==> 123 1[ ] "bda1node03 BDA 192.168.41.21 HCA-1" ( )
149 9[ ] ==( 4X 10.0 Gbps Active/ LinkUp)==> 151 1[ ] "bda1node06 BDA 192.168.41.24 HCA-1" ( )
149 10[ ] ==( 4X 10.0 Gbps Active/ LinkUp)==> 112 1[ ] "bda1node05 BDA 192.168.41.23 HCA-1" ( )
149 11[ ] ==( 4X 10.0 Gbps Active/ LinkUp)==> 139 1[ ] "bda1node07 BDA 192.168.41.25 HCA-1" ( )
149 12[ ] ==( Down/Disabled)==> [ ] "" ( )
149 13[ ] ==( Down/Disabled)==> [ ] "" ( )
149 14[ ] ==( 4X 10.0 Gbps Active/ LinkUp)==> 85 9[ ] "SUN DCS 36P QDR dm01sw-ib1 10.133.40.203" ( )
149 15[ ] ==( Down/Disabled)==> [ ] "" ( )
.
.
.
オペレーティング・システムのアップグレード履歴を表示します。
例
次の例は、アプライアンスがバージョン2.4.0でイメージが作成され、アップグレードされていないことを示しています。
$ imagehistory
Big Data Appliance Image History
IMAGE_VERSION : 2.4.0
IMAGE_CREATION_DATE : Mon Dec 23 02:39:47 UTC 2013
IMAGING_START_DATE : Wed Mar 12 18:55:37 UTC 2014
IMAGING_END_DATE : Wed Mar 12 13:25:08 PDT 2014
DEPLOYMENT_VERSION : 2.4.0
DEPLOYMENT_START_DATE : Wed Mar 12 15:29:25 PDT 2014
DEPLOYMENT_END_DATE : Wed Mar 12 18:08:53 PDT 2014
DEPLOYMENT_VERSION : 2.5.0
DEPLOYMENT_START_DATE : Wed Mar 12 21:10:17 PDT 2014
DEPLOYMENT_END_DATE : Wed Mar 12 21:14:56 PDT 2014
現在実行されているOracle Big Data Applianceオペレーティング・システム・イメージの情報を表示します。
例
次の例は、2.5.0のイメージを示しています。
$ imageinfo
Big Data Appliance Image Info
IMAGE_CREATION_DATE : Wed Mar 12 13:59:46 PDT 2014
IMAGE_LABEL : BDA_2.4_LINUX.X64_140312
IMAGE_VERSION : 2.5.0
LINUX_VERSION : Oracle Linux Server release 6.4
KERNEL_VERSION : 2.6.39-400.214.3.el6uek.x86_64
BDA_RPM_VERSION : bda-2.5.0-1.el6.x86_64
OFED_VERSION : OFED-IOV-1.5.5-2.0.0088
JDK_VERSION : jdk-1.7.0_25-fcs.x86_64
HADOOP_VERSION : 2.0.0-cdh4.6.0
アクティブなリンクのあるイーサネット・ブリッジ・ポートを示します。
例
次の例は、スイッチbda1sw-ib3の使用可能な8つのポートのうち、3つのアクティブ・ポート(0A-ETH-1、0A-ETH-3および0A-ETH-4)を示しています。
[root@bda1sw-ib3 ~]# listlinkup | grep Bridge
Bridge-0 Port 0A-ETH-1 (Bridge-0-2) up (Enabled)
Bridge-0 Port 0A-ETH-2 (Bridge-0-2) down (Enabled)
Bridge-0 Port 0A-ETH-3 (Bridge-0-1) up (Enabled)
Bridge-0 Port 0A-ETH-4 (Bridge-0-1) up (Enabled)
Bridge-1 Port 1A-ETH-1 (Bridge-1-2) down (Enabled)
Bridge-1 Port 1A-ETH-2 (Bridge-1-2) down (Enabled)
Bridge-1 Port 1A-ETH-3 (Bridge-1-1) down (Enabled)
Bridge-1 Port 1A-ETH-4 (Bridge-1-1) down (Enabled)
setup-root-sshコマンドによって以前に確立されたパスワードなしSSHを削除します。
パラメータ
/opt/oracle/bda/cluster-hosts-infinibandのサーバーのリストを使用して、クラスタのすべてのサーバーをターゲットに設定します。
コマンドラインでhost1、host2のように指定されているサーバーをターゲットに設定します。
groupfileにリストされたユーザー定義のサーバー・セットをターゲットに設定します。1行に1つずつ、ファイルにサーバー名またはIPアドレスを入力します。
スタータ・ラックのサーバーの範囲([1-6]
)または拡張キットが組み込まれたスタータ・ラックのサーバーの範囲([1-12]
)を指定します。このパラメータは、2.2.xベース・イメージにおいて、ユーティリティをネットワーク構成の前に使用する際に必須です。
ヘルプを表示します。
コマンドラインにroot
パスワードを指定します。
このパラメータは省略することをお薦めします。パスワードを入力するように求められますが、ユーティリティは画面に表示しません。
サーバーのブート順序を、BIOSに指定されているとおりに工場出荷時のデフォルトにリセットします。これにより、ILOM起動中に上書きされた内容をすべて消去します。
例
次の例では、現在のサーバーのブート順序をリセットします。
# reset-boot-order
Set Boot Device to none
Cleared ILOM boot override - Boot device: none
Found BDA v1 Hardware - setting boot order using biosconfig
Copyright (C) SUN Microsystems 2009.
BIOSconfig Utility Version 2.2.1
Build Date: Aug 24 2009
Build Time: 09:01:30
BIOSconfig Specification Version 2.4
Processing Input BIOS Data....
Success
Found USB device name : USB:02.82;01 Unigen PSA4000
.
.
.
BIOSconfig Specification Version 2.4
Processing Input BIOS Data....
Success
New BIOS boot order :
USB:02.82;01 Unigen PSA4000
RAID:Slot0.F0:(Bus 13 Dev 00)PCI RAID Adapter
PXE:IBA GE Slot 0100 v1331
PXE:IBA GE Slot 0101 v1331
PXE:IBA GE Slot 0700 v1331
PXE:IBA GE Slot 0701 v1331
root
ユーザーのパスワードなしSSHを確立します。
パラメータ
/opt/oracle/bda/cluster-hosts-infiniband
のサーバーのリストを使用して、クラスタのすべてのサーバーをターゲットに設定します。
コマンドラインでhost1、host2のように指定されているサーバーをターゲットに設定します。
groupfileにリストされたユーザー定義のサーバー・セットをターゲットに設定します。1行に1つずつ、ファイルにサーバー名またはIPアドレスを入力します。
スタータ・ラックのサーバーの範囲([1-6]
)または拡張キットが組み込まれたスタータ・ラックのサーバーの範囲([1-12]
)を指定します。このパラメータは、2.2.xベース・イメージにおいて、ユーティリティをネットワーク構成の前に使用する際に必須です。
ヘルプを表示します。
コマンドラインにroot
パスワードを指定します。
このパラメータは省略することをお薦めします。パスワードを入力するように求められますが、ユーティリティは画面に表示しません。
例
次の例では、root
に対してパスワードなしSSHが設定されたことを示しています。
# setup-root-ssh Enter root password: password spawn /opt/oracle/bda/bin/dcli -c 192.168.42.37,192.168.42.38... -k root@192.168.42.37's password: root@192.168.42.38's password: . . . 192.168.42.37: ssh key added 192.168.42.38: ssh key added . . . setup-root-ssh succeeded
スイッチに作成された仮想ネットワーク・インタフェース・カード(VNIC)をリストします。
例
次の例は、ラウンドロビン・プロセスでスイッチbda1sw-ib3に作成されたVNICを示しています。
# showvnics
ID STATE FLG IOA_GUID NODE IID MAC VLN PKEY GW
--- ----- --- ----------------- -------------------------------- ---- ----------------- --- ---- --------
561 UP N 0021280001CF4C23 bda1node13 BDA 192.168.41.31 0000 CE:4C:23:85:2B:0A NO ffff 0A-ETH-1
564 UP N 0021280001CF4C53 bda1node16 BDA 192.168.41.34 0000 CE:4C:53:85:2B:0D NO ffff 0A-ETH-1
567 UP N 0021280001CF4B58 bda1node01 BDA 192.168.41.19 0000 CE:4B:58:85:2A:FC NO ffff 0A-ETH-1
555 UP N 0021280001CF2A5C bda1node07 BDA 192.168.41.25 0000 CE:2A:5C:85:2B:04 NO ffff 0A-ETH-1
552 UP N 0021280001CF4C74 bda1node04 BDA 192.168.41.22 0000 CE:4C:74:85:2B:01 NO ffff 0A-ETH-1
558 UP N 0021280001CF179B bda1node10 BDA 192.168.41.28 0000 CE:17:9B:85:2B:07 NO ffff 0A-ETH-1
.
.
.