診断のヒントおよび詳細

D.1 bdscheckswによる診断の実行

Oracle Databaseサーバーで、Big Data SQL診断データ収集ツールbdscheckswを使用して、Oracle Big Data SQLの簡単なサニティ・テストを実行できます。このスクリプトでは、Oracle DatabaseとHadoopクラスタの両側からOracle Big Data SQLインストールに関する診断情報を収集して分析します。このスクリプトは、データベース・サーバーの$ORACLE_HOME/binにあります。

構文

この診断チェックは、いつでも手動で実行できます。インストール時に、データベース側インストーラであるbds-database-install.shによっても実行されます。

bdschecksw Required_Params [Options]

次の表では、bdscheckswで使用する必須およびオプションのパラメータについて説明します。

表D-1 bdscheckswのパラメータ

パラメータ	説明	必須またはオプション
`-h, --help`	コマンド・ヘルプを表示して終了します。	オプション
`-d, --dbhome ORACLE_HOME`	Oracle Databaseサーバー上のOracleインストールへのパス。	`bdschecksw`が実行されるOracle Databaseサーバーで`ORACLE_HOME`環境変数が定義されていない場合のみ必須。
`-s, --sid=[ORACLE_SID]`	Oracle DatabaseサーバーのSID。	bdscheckswが実行されるOracle Databaseサーバーで`ORACLE_SID`環境変数が定義されていない場合のみ必須。
`-g, --gihome=Grid_Infrastructure_home Oracle_Database_node_IP_address`	Oracle Databaseサーバー上のグリッド・インフラストラクチャのパス。	bdscheckswが実行されるOracle Databaseサーバーで`GI_HOME`環境変数が定義されていない場合のみ必須。
`-y, --giuser Oracle_Database_node_IP_address Grid_Infrastructure_home`	`GI_HOME`管理者名または`GI_HOME`の所有者(OSユーザー名)。
`-q, --sqlplus Oracle_Database_node_IP_address username`	Oracle DatabaseサーバーのSQLPlusユーザー名。ユーザーは、パスワードを要求されます。	必須。
`-c, --cell DNS short name [...n]`	Hadoopクラスタ・セル・ノード。DNS短縮名(FQDNからドメイン名を除いたもの)をデリミタの空白とともに使用します。1つのノードが複数のネットワークに存在することもあるため、IPアドレスは使用しないでください。	Hortonworks HDPの場合のみ、必須です。
`-u, --uname Hadoop_cluster_node_username`	Oracle DatabaseサーバーからHadoopクラスタに対してリモート・コマンドを実行するための資格証明。これは通常、`oracle`ユーザーです。	ユーザー名およびパスワードは常に必須です。
`-p,--pdb=PDB_CONTAINER`	Oracle Databaseサーバーのプラガブル・データベースのコンテナ名。	プラガブル・データベース(PDB)コンテナが、bdscheckswが実行されるOracle Databaseサーバーで構成されている場合にのみ必要です。
`-k, --key SSH_identity_key_file`	SSH (セキュア・シェル)キー・ファイルへのパス。	`-u`および`-p`に加えてオプションのSSHアイデンティティ(またはキー)ファイルを使用し、公開キー認証のアイデンティティ(秘密キー)の読取り元となるファイルを選択します。
`-r, --cluster Hadoop_cluster_name`	Hadoopクラスタ名。	オプション。
`-t, --trace`	テストの実行中に、extprocおよびlog4jトレーシングを有効にします。	オプション。
`-f, --file=file_path`	出力をファイルにリダイレクトします。	オプション。
`-i, --interactive`	対話形式で(一度に全部ではなく)コマンドライン引数を入力します。	オプション。
`-x`	拡張モード。	オプション。root権限が必要です。
`-v, --verbose`	冗長レポート・モード。	オプション。(レポートでの完全詳細の場合に推奨。)

終了ステータス

bdscheckswスクリプトは、次のステータス・コードのいずれかを戻します。

表D-2 bdscheckswのステータス・コード

ステータス	説明
0	成功
1	軽微な問題(対話型モードでの応答なしなど)。
2	重大な問題(無効なコマンドライン引数など)。

例

$ ./bdschecksw -d /u03/app/oracle/product/$ORACLE_HOME/dbhome_1 -s orcl -p pdborcl -g /u03/app/oracle/product/$ORACLE_HOME/grid -q sys -u oracle -v

D.2 クイック・テストの実行方法

Oracle Big Data SQLが機能していることを確認するための一連の基本チェックを次に示します。

Oracle Databaseサーバーで、$ORACLE_HOME/bigdatasqlのhadoop_<hcluster>.envファイルを使用して、環境をソーシングします。
Kerberosが有効になっている場合、oracle LinuxユーザーとしてOracle Databaseサーバーに対してkinitを実行します。また、可能な場合は、oracleユーザーとして各Big Data SQLデータノードに対してkinitを実行します。

ノート:
データノードに対してkinitを実行しなくてもこのテストは実行できますが、テストでのオフロードは機能しません。オフロードが機能していることを確認するために、最終的にはデータノードに対してkinitを実行する必要があります。
テキスト・ファイルを作成して複数行のランダム・テキストを追加します。
テキスト・ファイルをHDFSに/user/oracle/test.txtとしてコピーします。
```
$ hadoop fs -put test.txt /user/oracle/test.txt
```
ORACLE_HDFS型のOracle外部表を定義します。
1. ```
CREATE TABLE bds_test (line VARCHAR2(4000)) 
  ORGANIZATION EXTERNAL
     ( TYPE ORACLE_HDFS DEFAULT DIRECTORY DEFAULT_DIR LOCATION ('/user/oracle/test.txt') ) 
  REJECT LIMIT UNLIMITED;  
```
2. Select * from bds_test;
3. select n.name, s.value /* , s.inst_id, s.sid */ from v$statname n, gv$mystat s where n.name like '%XT%' and s.statistic# = n.statistic#;
Hive表を定義します。
1. HueまたはHive/Beelineコマンドライン経由で、あるいはOracle SQL DeveloperをHive JDBCドライバとともに使用してHiveに接続します。
2. CREATE TABLE bds_test_hive (line string);
3. LOAD DATA INPATH '/user/oracle/test.txt' OVERWRITE INTO TABLE bds_test_hive;

外部表ORACLE_HIVEを定義します。

CREATE TABLE bds_test_hive (line VARCHAR2(4000))   
    ORGANIZATION EXTERNAL
    ( TYPE ORACLE_HIVE DEFAULT DIRECTORY DEFAULT_DIR
      ACCESS PARAMETERS
        (com.oracle.bigdata.tablename=default.bds_test_hive)  
    )
  REJECT LIMIT UNLIMITED;

D.3 Oracle Big Data SQLのデータベース・オブジェクト

様々なOracle Big Data SQLデータベース・オブジェクトをよく理解しておくと、トラブルシューティングに役立ちます。

表D-3 Big Data SQLのデータベース・オブジェクト

タイプ	オブジェクト
ディレクトリ	`DEFAULT_DIR` – `$ORACLE_HOME/bigdatasql/databases/<database name>/default_dir`を指します。 `ORACLE_BIGDATA_CONFIG` – `$ORACLE_HOME/bigdatasql/databases/<database name>/bigdata_config`を指します。 `ORA_BIGDATA_CL_<hcluster>`: パスの値をnullとする必要があります。これはアクセスを制限する方法です。外部表に関連付けられたディレクトリ・オブジェクトが常に存在する必要があります。ディレクトリ・オブジェクトは権限チェックに使用されるため、ディレクトリ下にファイルが存在しないHive/HDFSの場合でも、これは必要条件です。
データベース・リンク(パブリック) これらにより、Big Data SQLはMTA(マルチスレッド・エージェント)にアクセスできるようになります。	`BDSQL$_DEFAULT_CLUSTER`: 接続文字列のSIDは、`bds_<dbname>_<hcluster>`とする必要があります。また、`<hcluster>`は、`$ORACLE_HOME/bigdatasql/databases/<database name>/bigdata_config/bigdata.properties`のデフォルト・クラスタ(`bigdata.cluster.default`によって定義済)である必要があります。 `BDSQL$_<hcluster>`: 接続文字列のSIDは、`bds_<dbname>_<hcluster>`とする必要があります。
データ・ディクショナリ・ビュー	`User_hive_tables, all_hive_tables, dba_hive_tables`: 全Hadoopクラスタの全Hiveデータベースの全Hive表を問い合せます。 `User_hive_databases, all_hive_databases, dba_hive_databases`: 全Hadoopクラスタの全Hiveデータベースを問い合せます。 `User_hive_columns, all_hive_columns, dba_hive_columns`: 全Hadoopクラスタの全Hiveデータベースの全Hive表を問い合せます。 `V$cell`: データノードで実行中のOracle Big Data SQLサーバー・プロセスがここに表示されます(diskmonによって適切に検出された場合)。
Hiveデータ・ディクショナリのファンクションおよびプロシージャ「 `cathive.sql`」、「`dbmshadp.sql`」を参照してください。	`DBMS_HADOOP` `Create_extddl_for_hive()` `GetHiveTable`: `extproc`外部プロシージャからデータを戻すパイプライン・ファンクション。`*_hive_[tables/databases/columns]`ビューおよび`DBMS_HADOOP`で使用されます。 `HiveMetadata`: 外部プロシージャ`GetHiveTable`を定義しているODCIフレームワーク。 `SYS.DBMSHADOOPLIB (libkubsagt12.so)`: 外部プロシージャのCライブラリ。 `HiveMetadata.jar`: `libkubsagt12.so`によってコールされるJavaライブラリ。
表	`SYS.HIVE_URI$`: DBA以外のユーザー用のセキュリティ表。
統計	すべての統計の名前には%XT%が含まれます。 cell XT granules requested for predicate offload cell XT granule bytes requested for predicate offload cell interconnect bytes returned by XT smart scan cell XT granule predicate offload retries cell XT granule IO bytes saved by storage index 次の問合せを使用します。 `select n.name, s.value /* , s.inst_id, s.sid */ from v$statname n, v$mystat s where n.name like '%XT%' and s.statistic# = n.statistic# ;` 必要な場合は、`grant select any catalog to <dbuser>;`も使用します。

D.4 その他のデータベース側のアーティファクト

この項では、Oracle Big Data SQLに関連するデータベース側のディレクトリ、ファイルおよび外部プロシージャ・エージェントについて説明します。

表D-4 $ORACLE_HOME/bigdatasqlディレクトリ

サブディレクトリまたはファイル名	内容の説明
`clusters`ディレクトリ	このORACLE_HOMEにインストールされている、すべてのクラスタに関連する設定が格納されます。これには、次のものを格納する、各クラスタのサブディレクトリが含まれます。 `config`ディレクトリ – Cloudera Manager or Ambari用にダウンロードされた構成ファイル。 `fuse`ディレクトリ – このクラスタのFUSE-DFSサービスの設定。実際のクライアント・ディレクトリへの`hadoop`、`hbase`および`hive`ソフト・リンク。(例: `hadoop-2.6.0-cdh5.12.0`、`hbase-1.2.0-cdh5.12.0`、`hive-1.1.0-cdh5.12.0`。インストールされているバージョンはシステムによって異なる場合があります。) `.conf` – IPsec構成ファイル。 `.keytab` – データベース所有者のKerberosキータブ・ファイル。
`databases`ディレクトリ	このORACLE_HOMEで実行されている、すべてのデータベースに関連する設定が格納されます。このORACLE_HOMEで実行されている各データベースのサブディレクトリが含まれます。各データベースのサブディレクトリには、次のものを含む`bigdata_config`ディレクトリが格納されます。 `bigdata.properties`: JARファイルの場所を定義します。Hive表で標準以外のJavaライブラリを使用している場合は、そのようなライブラリをデータベースにコピーし、このファイルの`classpath`エントリを更新する必要があります。また、Hadoopクラスタ・リストおよびデフォルト・クラスタも定義します。変更後に`extprocbds_<dbname>_<hcluster>`を再起動します。 `bigdata-log4j.properties`: 外部表の問合せのメタデータ検出フェーズやセルが使用不可の場合の問合せフェッチ・フェーズなど、Java部分のロギングを制御します。詳しくログを記録するには、`log4j.logger.oracle.hadoop.sql`を`INFO`に変更します。変更後に`extprocbds_<dbname>_<hcluster>`を再起動します。 `<hcluster>`ディレクトリ – `$ORACLE_HOME/bigdatasql/clusters/<cluster name>/config`へのソフト・リンク。Hadoopクラスタからコピーされたクライアント構成ファイル(`hive-site.xml`など)が格納されます。各データベースのサブディレクトリには、次のものも含まれます。 `default_cluster` – このデータベースのデフォルト・クラスタである `$ORACLE_HOME/bigdatasql/clusters/`サブディレクトリへのソフト・リンク。 `default_dir` – このデータベースに関連付けられている外部表のディレクトリ。
`jdk`	JDKインストールへのソフト・リンク。別のバージョンが存在する可能性がありますが、Oracle Big Data SQLによってインストールされるバージョンは`jdk1.8.0_141`です。
`jlib`ディレクトリ	Oracle Big Data SQLのJava JARディレクトリ
`bigdata_config`ディレクトリ	`bigdata.properties`: JARファイルの場所を定義します。Hive表で標準以外のJavaライブラリを使用している場合は、そのようなライブラリをデータベースにコピーし、このファイルの`classpath`エントリを更新する必要があります。また、Hadoopクラスタ・リストおよびデフォルト・クラスタも定義します。変更後に`extprocbds_<dbname>_<hcluster>`を再起動します。 `bigdata-log4j.properties`: 外部表の問合せのメタデータ検出フェーズやセルが使用不可の場合の問合せフェッチ・フェーズなど、Java部分のロギングを制御します。詳しくログを記録するには、`log4j.logger.oracle.hadoop.sql`を`INFO`に変更します。変更後に`extprocbds_<dbname>_<hcluster>`を再起動します。 `<hcluster>`ディレクトリ – `$ORACLE_HOME/bigdatasql/clusters/<cluster name>/config`へのソフト・リンク。Hadoopクラスタからコピーされたクライアント構成ファイル(`hive-site.xml`など)が格納されます。
`default_dir`ディレクトリ	通常、このディレクトリは空です。
`log`ディレクトリ	2タイプのextprocからのJavaログ・ファイルが格納されます。ファイル名の一部であるPIDを使用して、探しているextprocを特定します(1つのログ・ファイルのみが現在実行中の`extprocbds_ <dbname>_<hcluster`>プロセスのPIDを保有します)。
`hadoop_<クラスタ名>.env`	Hadoopクライアントの環境を設定します。各クラスタのインストールには、これらの`.env`ファイルのいずれか1つがあります。このファイルをソーシングしてから`hadoop fs`コマンドを実行して、Hadoop接続を短時間でテストできます。
`orahivedp`	インストールされているcp2hadoop (Hadoopにコピー)ツールキットへのソフト・リンク。Oracle Big Data SQL 3.2によってインストールされるツールキットのバージョンは`orahivedp-3.2.0`です。

表D-5 外部プロシージャ・エージェント

エージェント説明

エージェント	説明
`extproc`	`_hive_tables`ビュー、`_hive_databases`ビューおよび`DBMS_HADOOP`プロシージャで使用される外部プロシージャ・コードを実行します。 `$ORACLE_HOME/hs/admin/extproc.ora`により、extprocは構成されます。`TRACE_LEVEL=ON`を追加して、より詳細なトレースを取得できます(ただし、場合によっては先に`SET EXTPROC_DLLS=`をコメント・アウトして「Error in assignment statement」メッセージを修正する必要があります)。C部分のログ・ファイルは`$ORACLE_HOME/hs/log/orcl_agt*`にありますが、これらは通常、診断目的で関心を引くものではありません。JVM部分のログ・ファイルは`$ORACLE_HOME/bigdatasql/log`に書き込まれます(ただし、先に`bigdata-log4j.properties`を設定する必要があります)。
`extprocbds_<dbname>_<hcluster>`	外部表を問い合せる際に使用されるBDSマルチスレッド・エージェント。これは、Oracle Clusterwareによって起動/停止されますが、`mtactl`ユーティリティを実行します。これは、`bds_database_install.sh`が最後のデータベース・サーバー・ノードで実行されると、Oracle Clusterwareに登録されます。この`extprocbds_<dbname>_<hcluster>`が実行されていない場合は、おそらくRACクラスタ内のすべてのデータベース・サーバーで`bds_database_install.sh`を実行していません。C部分のログ・ファイルは、`$ORACLE_HOME/hs/log`にあります(ただし、ロギングを確認するには、`$ORACLE_HOME/hs/admin/initbds`を編集して`TRACE_LEVEL=ON`を追加した後、再起動する必要があります)。JVM部分のログ・ファイルは、`$ORACLE_HOME/bigdatasql/log`に格納されます(ただし、`bigdata-log4j.properties`を設定して再起動する必要があります)。再起動するには、(プロセスで`kill -9`を実行する方が手早い方法ですが)次に示す方法をお薦めします。 `$ crsctl stop resource bds_<dbname>_<hcluster> $ crsctl start resource bds_<dbname>_<hcluster>`

extproc

*_hive_tablesビュー、*_hive_databasesビューおよびDBMS_HADOOPプロシージャで使用される外部プロシージャ・コードを実行します。

$ORACLE_HOME/hs/admin/extproc.oraにより、extprocは構成されます。TRACE_LEVEL=ONを追加して、より詳細なトレースを取得できます(ただし、場合によっては先にSET EXTPROC_DLLS=をコメント・アウトして「Error in assignment statement」メッセージを修正する必要があります)。C部分のログ・ファイルは$ORACLE_HOME/hs/log/orcl_agt*にありますが、これらは通常、診断目的で関心を引くものではありません。JVM部分のログ・ファイルは$ORACLE_HOME/bigdatasql/logに書き込まれます(ただし、先にbigdata-log4j.propertiesを設定する必要があります)。

extprocbds_<dbname>_<hcluster>

外部表を問い合せる際に使用されるBDSマルチスレッド・エージェント。これは、Oracle Clusterwareによって起動/停止されますが、mtactlユーティリティを実行します。これは、bds_database_install.shが最後のデータベース・サーバー・ノードで実行されると、Oracle Clusterwareに登録されます。

このextprocbds_<dbname>_<hcluster>が実行されていない場合は、おそらくRACクラスタ内のすべてのデータベース・サーバーでbds_database_install.shを実行していません。C部分のログ・ファイルは、$ORACLE_HOME/hs/logにあります(ただし、ロギングを確認するには、$ORACLE_HOME/hs/admin/initbdsを編集してTRACE_LEVEL=ONを追加した後、再起動する必要があります)。JVM部分のログ・ファイルは、$ORACLE_HOME/bigdatasql/logに格納されます(ただし、bigdata-log4j.propertiesを設定して再起動する必要があります)。再起動するには、(プロセスでkill -9を実行する方が手早い方法ですが)次に示す方法をお薦めします。

$ crsctl stop resource bds_<dbname>_<hcluster>
$ crsctl start resource bds_<dbname>_<hcluster>

ノート:

前述の表の外部プロシージャはいずれも、データベースへのコールバックを実行しますが、これは、セキュアな外部パスワード・ストア機能を使用することでブロックできます。セキュアな外部パスワード・ストア(SQLNET.WALLET_OVERRIDE=TRUE)を使用する場合は、My Oracle Supportでドキュメント2126903.1を参照してください。

表D-6 ログ・ファイルとトレース・ファイル

ディレクトリまたはファイル名	説明
`$ORACLE_HOME/bigdatasql/log`	`extprocbds_<dbname>_<hcluster>`によって実行されたJavaコードからのログ・ファイル、すなわち、PIDが`extprocbds_<dbname>_<hcluster>` PIDと同じ共有ファイルが1つと`extproc` (セッションで`*_hive_tables`または`DBMS_HADOOP`が使用されている場合、セッションごとに1つ)が格納されます。ヒント: これは、有用な診断情報です。
`$ORACLE_HOME/hs/log`	`extproc`プロセス(セッションごとに1つ)および`extbds_<dbname>_<hcluster>`マルチスレッド・プロセスのCコードからのログ・ファイルが格納されます。`exproc`は通常、診断目的で関心を引くものではありません。`extprocbds_`には、もう少し興味深い情報が含まれます(ただし、`initbds_.ora`で`TRACE_LEVEL=ON`を設定する必要があります)。
データベースの`diag`ディレクトリ	データベース・セッションからのログ・ファイルが格納されます。これらからは有用な情報を取得できます。正確なデータベース・セッション・ログ・ファイルの場所を特定する場合: `select value from v$diag_info WHERE name = 'Default Trace File';` 外部表のロギングを有効にする場合: `alter session set "_xt_trace"="low","compilation","execution";` その他のロギングを有効にする場合: `alter session set events 'trace[KCFIS] disk high, memory high';`
`/u01/oracle/diag/crs/<hostname>/crs/trace/diskmon.trc`	`diskmon`のログおよびエラーが格納されます。コモディティOracle Databaseサーバー対コモディティHadoop (Oracle Big Data SQL 3.0以上でサポート)の環境では、通信エラーまたはフェンシング(`ENTITY_FENCED`)がないか、このトレース・ファイルを確認します。必要な場合は、`diskmon`を再起動します(`crsctl`を使用)。コモディティ・ツー・コモディティ環境では`diskmon`プロセスを単純に強制終了できますが、Oracle Exadata Database Machine環境ではプロセスの強制終了は実行しないでください。 `diskmon`のトレーシングを追加で取得する場合は、`crsctl`コマンドを呼び出してクラスタを起動する前に、環境パラメータを設定できます。クラスタはすでに実行されていることが多いため、まず、クラスタを停止する必要があります。次に、環境を設定してバックアップを開始します。Oracle Big Data SQL 3.xコモディティ・データベース・サーバーのシナリオで、Oracle Restartを使用してどのようにするかを次に示します。(RAC、ASMまたはExadataを使用している場合、`crsctl`コマンドは異なります。) `crsctl stop has export CELLCLIENT_TRACE_LEVEL="all,4" export CELLCLIENT_AUTOFLUSH_LEVEL="all,4" crsctl start has`
`/etc/oracle/cell/network-config/cellinit.ora` `/etc/oracle/cell/network-config/celliniteth.ora`	データベース・サーバーのIPアドレスとサブネット範囲を記録します。コモディティ・サーバーのOracle Big Data SQLの場合、このファイルには、インフィニバンドRDSからTCP/UDPにプロトコルを切り替えるパラメータ(`_skgxp_dynamic_protocol=2`)も含まれます。コモディティ・サーバーでは、データベース・サーバーの`diskmon` (Oracle Gridホームから実行)が、TCPポート5042でリスニングしているデータノードのBDSプロセスと通信します。
Kerberosファイル: `kinit、klist、etc/krb5.conf、krb5-workstation*.rpm`	HadoopクラスタでKerberosを使用している場合、データベースでKerberosを設定する必要があり、`oracle` Linuxユーザーについて有効なKerberosチケットを常時保持するためのメカニズム(crontabなど)が必要です。BDSデータノード上にも同様のチケット更新メカニズムが必要です。 Oracle Big DataのSQLインストーラでは、このためのcronジョブをHadoopクラスタとOracle Databaseシステムの両方に、自動的に設定するディレクティブをJaguar構成ファイルに提供するようになりました。詳細は、インストレーション・ガイドの構成ファイルの説明を参照してください。

D.5 Hadoopデータノードのアーティファクト

次の表に、Big Data SQLのトラブルシューティングに役立つ情報を提供できるHadoopサーバーのオブジェクトを示します。

表D-7 トラブルシューティングに役立つHadoop側のデータノードのアーティファクト

データノードのアーティファクト	説明
`bdscli`コマンド	List quarantine detail Drop quarantine all List alerthistory Drop alerthistory List bdsql detail
ログ・ファイル	`/var/log/bigdatasql/DM` – インストーラ・ログ・ファイル `/var/log/bigdatasql/cloudera` or `/var/log/bigdatasql/ambari` – AmbariまたはCMサービス・ログ・ファイル。 `/opt/oracle/bigdatasql/bdcell-<cell version>/bigdata.properties` `/opt/oracle/bigdatasql/bdcell-<cell version>/bigdata-log4j.properties` ロギングはオフにデフォルト設定されています。`log4j.logger.oracle.hadoop.sql=INFO`に変更して再起動します。 `/opt/oracle/bigdatasql/bdcell-<cell version>/log`ディレクトリ `bigdata-log4j.log`: Big Data SQLのJVM部分からのエントリをログに記録します(ロギングはオフにデフォルト設定されているため、まず、`bigdata-log4j.properties`を編集して再起動します)。これは、特に有用な情報となります。 `/var/log/oracle/diag/bdsql/cell/<hostname>/trace/` – 管理サーバー、再起動サーバーおよびモニター・サーバー用の一般的なセル・トレース・ファイル。`alert.log`ファイルには、検疫および検疫解除のイベントに関する詳細が含まれます。 `/var/log/oracle/diag/bdsql/cell/SYS_*/trace/`: C部分用のOracle Big Data SQLオフロード・サーバー・トレース・ファイル。これらは、ほとんどの場合、トラブルシューティングに有用ではありません。
その他のデータノードのアーティファクト	`/opt/oracle/cell/cellsrv/deploy/config/cellinit.ora`: セルのIPアドレスを記録します。

D.6 外部表を問い合せるためのプロセス

この項では、外部表の問合せ中に発生するイベントについて説明します。

ユーザーがOracle Big Data SQL外部表にかかわるSELECT問合せを発行します。
データベースが、SQL内のオブジェクトの1つがORACLE_HIVE型の外部表であることを確認します。
データベースは、外部表定義のcom.oracle.bigdata.clusterパラメータからクラスタ名を特定します(特定できない場合、デフォルト・クラスタを使用します)。
データベースは、com.oracle.bigdata.tablenameパラメータからHive表名を特定します(特定できない場合、Hive表名はOracle表名と同じであると想定します)。
データベースは、ORACLE_HIVE外部表の実装で、extprocbds_<dbname>_<hcluster>マルチスレッド・エージェントによって呼び出される外部プロシージャを使用することを認識します。

ノート:
問合せの第1フェーズでは、Hiveメタデータを取得する必要があります。この第1フェーズでエラーが発生すると、次のように始まるエラーが表示されます。ODCIEXTTABLEOPENの"OPEN"に注目してください。
ORA-29913: error in executing ODCIEXTTABLEOPEN callout
データベースは、パブリック・データベース・リンクのBDSQL$_DEFAULT_CLUSTERまたはBDSQL$_<hcluster>を使用して、extprocbds_dbname>_hcluster>マルチスレッド・エージェントのスレッドにデータベース・セッションを接続するかリスナーに問うための接続文字列を検索します。
1. extprocbds_<dbname>_<hcluster>がすでにOracle Clusterwareによって起動されており、$ORACLE_HOME/bigdatasql/databases/<database name>/bigdata_configディレクトリからの構成情報を使用しています。
2. extprocbds_<dbname>_<hcluster>は、前述の構成情報を使用してHadoopクライアント・ライブラリを実行するJVMを生成しています。Hadoopクライアント・ライブラリは、bds-exa-install.shスクリプトの実行時に、Oracle Big Data ApplianceからOracle Databaseサーバーにコピーされています。
extprocbds_<dbname>_<hcluster>は、JVMおよびHiveメタストア・クライアント・ライブラリを使用して、Hiveメタストアを(thrift://hostname>:9083などのURLを使用して)コールし、Hive表のメタデータ(列、入力形式、SerDe、その他の表プロパティ)を取得します。
1. この時点で、HiveメタストアがKerberos認証によって保護されている場合、Oracle Databaseサーバーのextprocbds JVMで実行されているHiveクライアント・ライブラリは、ローカルKerberosチケットをHiveサーバーに送信しようとします。これは、データベースを実行しているoracle Linuxユーザー・アカウントが所有するチケットになります。
extprocbds_<dbname>_<hcluster>は、Hiveメタストアをコールして、Hive表の中にデータを保持する入力パスのリストを取得します。
extprocbds_<dbname>_<hcluster>は、Hadoop MapReduceのライブラリおよびロジックを使用して、入力パスのリストをスプリット/ブロックのリストに変換します。次に、HDFSネームノードにすべてのスプリット/ブロックの場所(レプリカを含む)を要求します。
1. HDFSがKerberosで保護されている場合、データベースのoracle Linuxユーザー・アカウントからのKerberosチケットを使用する必要があります。
2. 圧縮が使用されている場合、この時点で、JVMは特定の圧縮Javaライブラリまたはネイティブ・ライブラリをロードする必要があります。これらが標準以外のライブラリである場合、Oracle DatabaseサーバーとHadoop側の両方にそれらをインストールする必要があります。たとえば、LZO圧縮では、データベース側とHadoop側の両方で追加のインストールおよび構成を実行する必要があります。
この時点で、"記述"フェーズが実行され、データベースはHive表の構造の他、データの全ブロックの場所(レプリカを含む)も認識します。この情報は、メタデータ・ペイロードとも呼ばれます。今度は、"フェッチ"フェーズを開始します。
Oracle Exadataシステムでも使用されるデータベース・インテリジェント・ストレージ・レイヤーのKCFIS (Kernel Cache File Intelligent Storage)が、データのブロックが格納されるホスト名を、グリッドのdiskmonプロセスによって保持されているアクティブなBDSQLサーバー・ホストのリストと比較します。(diskmonのBDSQLサーバー・ホストのリストはV$CELLで確認できます)。
ノート:
問合せの第2フェーズでは、データをフェッチする必要があります。この第2フェーズでエラーが発生すると、次のように始まるエラーが表示されます。ODCIEXTTABLEFETCHの"FETCH"に注目してください。
```
ORA-29913: error in executing ODCIEXTTABLEFETCH callout
```
データノードのホスト名のリストがBDSQLホスト名のリストと一致した場合、データベースはローカル・ブロック(グラニュルとも呼ばれる)のリストを各BDSQLサーバーに送信します。また、データベースはBDSQLサーバーにアクセス先の表、列および構造に関するメタデータを送信します。パフォーマンス上、これはパラレルで非同期に実行されます。

ノート:
データベース統計の"cell XT granules requested for predicate offload"および"cell XT granule bytes requested for predicate offload"は、この時点で更新されます。
データノード上で実行されているBDSQLプロセスが、検疫されたSQL_IDのローカル・リストに照らしてSQL_IDをチェックします。SQL_IDが検疫リストと一致した場合、データノードのBDSQLプロセスはエラーを返します。ただし、ユーザーはこのエラーを確認する必要はありません。かわりに、データベースが、まず別のセルを試した後、その処理自体を実行しようとします。(ステップ15および16を参照してください)。
SQL_IDがデータノードのBDSQLプロセスによって検疫されなかった場合、BDSQLプロセスは、送信されたブロック/グラニュルのリストに照らしてSmartScanの処理を実行します。

ヒント:
ストレージ索引およびSmartScan処理のその他の特徴の詳細は、The Data Warehouse Insiderのブログ・エントリBig Data SQL Quick Start. Storage Indexes - Part10を参照してください。
1. BDSQLオフロード・プロセスが、/opt/oracle/bigdatasql/bdcell-<cell version>/bigdata.propertiesから構成情報をすでに読み取っています。
2. BDSQLプロセスは、前述の構成で定義されているプロパティに基づいてJVMをすでにロードしています。
3. Hive表に特殊なInputFormatクラスまたはSerdeクラスが含まれる場合、前述の構成で定義されているクラスパスに基づいて検出できれば、JVMはそのようなクラスをロードします。一部の一般的なInputFormats (デリミタ付きテキストなど)について、オラクル社では、そのような形式を通常のJavaコードよりも速く処理できるCコードを作成しています。
4. Kerberos認証が使用されている場合、BDSQLのJVMはローカルKerberosチケットをHDFSデータノード・プロセスに送信します。これは、BDSQLが稼働しているデータノードでoracle Linuxユーザーに関連付けられたKerberosチケットです。
5. Sentry認証が使用されている場合は、oracle LinuxユーザーのKerberosチケットのアイデンティティにHive表および基礎となるHDFSデータに対するアクセス権が付与されている必要があります。
6. BDSQLサーバーが、実行時に"cell XT granule IO bytes saved by storage index"などの統計を更新します。
データベースkcfisレイヤーが、データノードのBDSQLプロセスから返される結果を収集し、次のバッチのブロック/グラニュルをBDSQLプロセスに送信します。
1. バイト数が返されると、データベースが、"cell interconnect bytes returned by XT smart scan"統計を更新します。
特定のブロックについてBDSQLプロセスで問題が発生した場合、データベースは、その処理を別のBDSQLプロセスに送信しようとします(失敗したブロックのレプリカがある場所を捜します)。
1. データベースは、"cell XT granule predicate offload retries"統計を更新します。
2. 再試行が行われており、BDSQLサーバー・プロセスがすべてアクティブである(Cloudera ManagerまたはAmbari UIで表示されている)場合は、BDSQLサーバー・プロセスのメモリーに問題がある可能性があります。各データノード内の/opt/oracle/bd_cell/log/diag/bdsql/cell/SYS_*/trace/bdsql*.trcファイルに対して「Failed to create or initialize subheap」をgrepしてみてください。いずれかのメッセージが表示される場合は、BDSQLサーバー・プロセスにメモリー制約があります。Cloudera Managerでcgroup設定を大きくするか、特定のデータノードにさらにメモリーを追加してください。
  kcfisトレースを有効にすることもできます(kcfisトレースを有効にする方法については、Oracle Big Data SQLのキー管理タスクを参照)。BDSQLセル・プロセスにメモリーの問題がある場合は、kcfisトレースで「Cell failed to allocate memory」と表示されます。
  
  各データノードに2つのBDSQLオフロード・サーバー・プロセスがあることに注目してください。どのデータノードでも、bdscli -e list OFFLOADGROUPを発行してそれらの名前を調べることができます。1つは、Oracleデータベース12.1 (SYS_121*)用、もう1つはOracleデータベース12.2以上(SYS_122*)用です。どちらも必要でない場合は、bdscli -e alter OFFLOADGROUP SYSxxxxxx shutdownを発行してどちらかをシャットダウンできます(ここで、SYSxxxxxはbdscli -e list offloadgroupコマンドで表示される名前です)。BDAがある場合は、dcliを使用してこのコマンドを発行し、すべてのデータノードに適用できます。それ以外の場合は、各データノードでこのコマンドを発行する必要があります。
再試行後でも、BDSQLプロセスでブロックを正常にオフロードできない場合、データベースは"フォールバック"してextprocbds_<db>_<cluster>内のJVMでその処理を実行します。
1. これは、生データを処理のためにデータベース・サーバーに移動する必要があるため、遅くなります。
2. Hive表に特殊なInputFormatまたはSerdeが含まれる場合、extprocbds_<db>_<cluster>のJVMは、データベースのbigdata.propertiesファイルで定義されているクラスパス構成に基づいて、それらをロードする必要があります。
入力パス/ブロック/グラニュルがすべて処理されるまで、外部表データ・ソースからの結果は引き続き収集されます。

D.7 Hiveデータ・ディクショナリ問合せのプロセス

この項では、Hiveデータ・ディクショナリに対する問合せで発生するイベントについて説明します。

ユーザーがOracle Big Data SQLデータ・ディクショナリ・ビューのいずれか(all_hive_tablesなど)を問い合せます。

Oracle Big Data SQL 2.0以前では、これがuser_hive_*ビューであり、ユーザーがDBAでなかった場合、ユーザーはSYS.HIVE_URI$表にリストされている必要がありました。Oracle Big Data SQL 3.0では、HIVE_URI$チェックが削除されています。
ビューが、GetHiveTable pl/sqlパイプライン・テーブル・ファンクションにアクセスします。
GetHiveTableファンクションが、SYS.DBMSHADOOPLIBライブラリを使用して外部プロシージャとして実装されるHiveMetadata型で実装されます。
Oracle Databaseが、このデータベース・セッション用に"extproc"の新しいインスタンスを生成します。extprocが、設定用の$ORACLE_HOME/hs/admin/extproc.oraファイルを読み取ります。

CコードをトレースするためにTRACE_LEVEL=ONと設定できます。ログ・ファイルは$ORACLE_HOME/hs/logに書き込まれます。

デフォルトでは、extproc.oraに誤りがあって、ログに「Error in assignment statement」メッセージが書き込まれることがあります。文"SET EXTPROC_DLLS=" (等号記号の後に値なし)は有効ではありません。TRACE_LEVEL=ONを使用する場合は、この行をコメント・アウトします。
extprocが、libkubsagt.soライブラリ(SYS.DBMSHADOOPLIB)をアタッチします。
Libkubsagt12.soが、JVMを起動してHiveMetadata.jarをロードします。
1. JVMは、$ORACLE_HOME/bigdatasql/bigdata_config/内の構成情報を使用して、クラスタのリストおよびHiveメタストア接続情報を識別します。
2. JVMに関するロギングは、$ORACLE_HOME/bigdatasql/bigdata_config/bigdata-log4j.propertiesに基づいています。ログ・ファイルは$ORACLE_HOME/bigdatasql/logに書き込まれます。データベース・セッションごとに新しいログ・ファイルが1つ存在します。
HiveMetadata.jarのJavaコードは、Hiveメタストア・クライアント・ライブラリを使用してHiveメタストアに接続し、すべてのデータベースおよびすべての表に関するデータを取得します。
1. HiveメタストアがKerberosによって保護されている場合、JVMは、データベースを実行しているoracle LinuxユーザーのKerberosチケットを送信しようとします。
Javaコードが、データベースにリクエスト・データを返します。

D.8 Oracle Big Data SQLの主な管理タスク

これらは、重要な管理タスクに関するノートです。

extprocbds_<db>_<hcluster>の再起動:
```
$  crsctl stop res bds_<dbname>_<hcluster>
```
手早い方法ですが、最良ではありません。最良な方法は、extprocbds_*プロセスを強制終了して、復帰するのを待ちます。
extprocの再起動。

これにより、新しいデータベース・セッションが開始されます。
データノードでのOracle Big Data SQLソフトウェアの再起動:
- Cloudera ManagerまたはAmbari Web UIを使用します。
- 手早い方法ですが、最良ではありません。最良な方法は、bdsqloflsrvプロセスを強制終了して、復帰するのを待ちます。
- Oracle Big Data Appliance (ノード1でrootとしてログオン)に対するコマンドライン・メソッド:
```
$ bdacli stop big_data_sql_cluster
$ bdacli start big_data_sql_cluster
```
単一データノードでのOracle Big Data SQL検疫のチェック:
```
$ bdscli -e list quarantine detail 
```
すべてのデータノードに対して検疫をチェックするには、次のようにします。
```
$ dcli -g cells.lst bdscli -e list quarantine detail
```
単一データノードでのOracle Big Data SQL検疫のクリア:
```
 $ bdscli -e drop quarantine all
```
すべてのDataNodeに対して検疫をクリアするには、次のようにします。
$ dcli -g cells.lst bdscli -e drop quarantine all
適切なオフロードについての統計のチェック:
- SQLモニター・ヒント(/*+ MONITOR*/)を使用します。
- XTの統計を問い合せます。"retries"がゼロかつ"bytes returned"がゼロより大きいことを確認します。
データノードでのログ・ファイルの検索:
1. すべてのデータノードに対して検疫をクリアします。
2. データノードの/opt/oracle/bigdatasql/bdcell-12.1/bigdata-log4j.propertiesでLogプロパティを設定します。
3. データノードでbdsqloflsrvを再起動します。
4. ディレクトリをログ・ファイル・ディレクトリ(/opt/oracle/bigdatasql/bdcell-12.1/log)に変更します。
5. tail -f bigdata-log4j.log
6. 調べているノードに関するデータが問合せに含まれるようにします(つまり、問合せでは多数のブロックが含まれるファイルにアクセスする必要があります。少数のブロックにしかアクセスしない場合、データノードにまったく処理が要求されないという結果になります)。
7. 新しいデータベース・セッションを作成して(XTの統計をリセットするため)、問合せを実行します。
  
  ヒント:
  必ずSQLモニターで表示する場合は、/*+MONITOR*/ hintを使用します。
  
  データノードのbigdata-log4j.logに新しいエントリが表示されます。
8. Oracle Databaseサーバーで、XTの統計を問い合せて、retries=0およびbytes returned>0であることを確認します。
データベースでのログ・ファイルの検索:
1. すべてのデータノードに対して検疫をクリアします。
2. 新しいデータベース・セッションを作成します(XTの統計をリセットするため)。
3. セッションの接続先となるインスタンスを見つけます(ログオンしたのとは別のデータベース・サーバーにロード・バランシングしている場合):
```
select host_name from v$instance;
```
4. Linuxレベルでそのインスタンスのデータベース・サーバーにログインします。
5. $ORACLE_HOME/bigdatasql/bigdata-log4j.propertiesでログのプロパティを設定します。
6. そのインスタンスでextprocbds_<db>_<hcluster>を再起動し、ログのプロパティ変更を収集します。
7. XTトレースを有効にします。
  
  次のコマンドは、外部表のロギングを有効にします。
```
alter session set "_xt_trace"="low","compilation","execution";
```
  次のコマンドは、トレースをさらに追加します。
```
alter session set events 'trace[KCFIS] disk high, memory high';
```
8. 問合せを実行します。
  
  ヒント:
  必ずSQLモニターで表示する場合は、/*+ MONITOR */ hintを使用します。
9. XTの統計を問い合せて、retries=0およびbytes returned>0であるかどうかを確認します。
```
select n.name, s.value /* , s.inst_id, s.sid */ from v$statname n, gv$mystat s where n.name like '%XT%' and s.statistic# = n.statistic# ;
```
10. JVMログ・ファイル($ORACLE_HOME/bigdatasql)を調べます。(extprocbds_*プロセスと同じPIDのものを探します。)
11. データベースのtrace_fileを調べます。
```
 select value from v$diag_info WHERE name = 'Default Trace File';
```

D.9 その他のJava診断

次に、Javaのその他の診断情報を示します。

次に示すように、JVMプロパティをbigdata.propertiesファイルに追加できます。これは、目立ちにくく低いレベルのKerberosの問題に役立つことがあります。
```
java.options=-Dsun.security.krb5.debug=true
```
データベースではextprocプロセスとextprocbds_<dbname>_<hcluster>プロセスによってJVMが実行され、データノードではbdsqloflsrvプロセスによってJVMが実行されます。これを確認するには、"jps"コマンドを実行します。
```
$ORACLE_HOME/bigdatasql/jdk*/bin/jps
```
Javaスキルを非常に簡単に操れる場合は、Oracle JVisualVMまたはOracle JConsoleを使用してJVMに接続することもできます。

D.10 Oracle Big Data SQLの正しいパッチの確認

パッチ・エラーおよびデータパッチ・エラーの原因と結果は多種多様です。1つ実行できることは、必要なパッチがロードされているかを確認することです。

エラー・スタックの'FETCH_OPEN'のコールで、誤った数または型の引数を見つけた場合

正しいパッチがロードされているかどうかを判別するDBA_REGISTRY_SQLPATCHの問合せの根拠となるエラー・スタックの例を次に示します。

ORA-29913: error in executing ODCIEXTTABLEFETCH callout
ORA-29400: data cartridge error
ORA-06550: line 1, column 25:
PLS-00306: wrong number or types of arguments in call to 'FETCH_OPEN'
ORA-06550: line 1, column 14:PL/SQL: Statement ignored

これは、いくつかの問題の1つを示している場合があります。

バンドル・パッチが正しく適用されていない。
データパッチが実行されていないため、Oracle Big Data SQLのインストール済のバージョンで必要なパッチがインストールされていない。

その場合、『Oracle Big Data SQL Master Compatibility Matrix』 (My Oracle SupportのドキュメントID 2119369.1)でこのインストールに対する要件として規定されているパッチが適用されているかどうかを判別するために、次の問合せを実行します。

select PATCH_ID, PATCH_UID, VERSION, STATUS, DESCRIPTION from DBA_REGISTRY_SQLPATCH order by BUNDLE_SERIES

たとえば、BP 12.1.0.2.160419 (22806133)が適用されたOracle Big Data SQL 3.0.1の場合、問合せによって次の結果が返されます。

 PATCH_ID    PATCH_UID   VERSION              STATUS           DESCRIPTION                                                                                        
----------  ----------  -------  ----  ------- --  ------------  
22806133     19983161    12.1.0.2             SUCCESS          DATABASE BUNDLE PATCH: 12.1.0.2.160419 (22806133)

問合せが失敗した場合またはインストール済のバンドルに対する正しいパッチが見つからない場合は、データパッチのトラブルシューティングの詳細をMy Oracle Supportの2335899.2で確認してください。

D.11 SQL.NET問題のデバッグ

次の提案は、考えられるSQL.NETの問題の解決に役立ちます。

SQL.NETの構成が不適切であると、外部プロシージャ・コールがブロックされる場合があります。これらのコールの実行でORA-28579: network error during callback from external procedure agentなどのORAエラーが返される場合は、次のMy Oracle Supportノートをチェックして、構成が正しいことを確認してください。

Oracle Big Data SQLおよびOracle Secure External Password Storeの設定 (2126903.1)

My Oracle Supportノート1598247.1では、問題の症状について説明しています。