HDFSからOracle Databaseにデータをコピーします。
この操作は、Oracle Databaseによる認証が必要です。「orch.connect」を参照してください。
引数
HDFS内のファイルの名前。ファイル名には、現在のパスに絶対的または相対的なパスを使用できます。
ファイル内のフィールドの区切りに使用される記号(オプション)。カンマ(,)がデフォルトの区切りになります。
Oracle Database内の表の名前。
db.nameで同じ名前の表が上書きされるかどうかを制御します。表を上書きする場合はTRUE、エラーを表示する場合はFALSE (デフォルト)に設定します。
データのコピーに使用されるドライバ(Sqoop (デフォルト)またはOracle Loader for Hadoopを使用するolh)を特定します。ドライバとして使用する前にOracle Loader for Hadoopを設定する必要があります。使用上の注意と、「Oracle Loader for Hadoopの設定」を参照してください。
使用上の注意
Oracle Database Advanced Analyticsオプションでは、Oracle R Enterpriseを使用して、Oracle Databaseへのロード後のデータを分析できます。
ドライバの選択
Sqoopは同期的であるため、大規模なデータセットのコピーに時間がかかる場合があります。コピーが完了すると、プロンプトが再度表示され、Rが使用できるようになります。
Oracle Loader for HadoopはSqoopよりもかなり高速であるため、できればOracle Loader for Hadoopをドライバとして使用してください。
OLHドライバに関する問題の修正
Oracle Loader for Hadoopを使用できる場合、ORCHライブラリのロード中に次のメッセージが表示されます。
OLH 2.0.0 is up
このメッセージが表示されない場合、Oracle Loader for Hadoopは適切にインストールされません。次の環境変数が正しく設定されていることを確認します。
OLH_HOME: インストール・ディレクトリに設定します。
HADOOP_CLASSPATH: $OLH_HOME/jlib/*を含めます。
CLASSPATH: $OLH_HOME/jlib/*を含めます。
hdfs.pullが失敗してHADOOP_CLASSPATHが正しく設定される場合、Oracle Loader for HadoopのバージョンはCDHのバージョンに対して正しくない可能性があります。Oracle Loader for Hadoopのログ・ファイルを確認します。