HDFSからOracle Databaseにデータをコピーします。
この操作は、Oracle Databaseによる認証が必要です。「orch.connect」
を参照してください。
引数
HDFS内のファイルの名前。ファイル名には、現在のパスに絶対的または相対的なパスを使用できます。
ファイル内のフィールドの区切りに使用される記号(オプション)。カンマ(,)がデフォルトの区切りになります。
Oracle Database内の表の名前。
db.name
で同じ名前の表が上書きされるかどうかを制御します。表を上書きする場合はTRUE
、エラーを表示する場合はFALSE
(デフォルト)に設定します。
データのコピーに使用されるドライバ(Sqoop
(デフォルト)またはOracle Loader for Hadoopを使用するolh
)を特定します。ドライバとして使用する前にOracle Loader for Hadoopを設定する必要があります。使用上の注意と、「Oracle Loader for Hadoopの設定」を参照してください。
使用上の注意
Oracle Database Advanced Analyticsオプションでは、Oracle R Enterpriseを使用して、Oracle Databaseへのロード後のデータを分析できます。
ドライバの選択
Sqoopは同期的であるため、大規模なデータセットのコピーに時間がかかる場合があります。コピーが完了すると、プロンプトが再度表示され、Rが使用できるようになります。
Oracle Loader for HadoopはSqoopよりもかなり高速であるため、できればOracle Loader for Hadoopをドライバとして使用してください。
OLHドライバに関する問題の修正
Oracle Loader for Hadoopを使用できる場合、ORCH
ライブラリのロード中に次のメッセージが表示されます。
OLH 2.0.0 is up
このメッセージが表示されない場合、Oracle Loader for Hadoopは適切にインストールされません。次の環境変数が正しく設定されていることを確認します。
OLH_HOME
: インストール・ディレクトリに設定します。
HADOOP_CLASSPATH
: $OLH_HOME
/jlib/*を含めます。
CLASSPATH
: $OLH_HOME
/jlib/*を含めます。
hdfs.pull
が失敗してHADOOP_CLASSPATH
が正しく設定される場合、Oracle Loader for HadoopのバージョンはCDHのバージョンに対して正しくない可能性があります。Oracle Loader for Hadoopのログ・ファイルを確認します。