ヘッダーをスキップ
Oracle® Big Data Connectorsユーザーズ・ガイド
リリース2 (2.3)
E48215-03
  目次へ移動
目次
索引へ移動
索引

前
 
次
 

hdfs.push

Oracle DatabaseからHDFSにデータをコピーします。

この操作は、Oracle Databaseによる認証が必要です。「orch.connect」を参照してください。

使用方法

hdfs.push(
        x,
        key,
        dfs.name,
        overwrite,
        driver,
        split.by)

引数

x

プッシュするOracle Database内のデータを含むore.frameオブジェクト。

key

キー列の索引または名前。

dfs.name

HDFS内のオブジェクトの一意の名前。

overwrite

dfs.nameが同じ名前のオブジェクトを上書きできるようにする場合はTRUE。エラーを表示する場合はFALSE (デフォルト)。

driver

データのコピーに使用されるドライバを識別します。サポート対象のドライバはSqoopのみであるため、この引数は現在無視されます。

split.by

データのパーティション化に使用する列(必須)。

使用上の注意

この操作は同期的であるため、大規模なデータセットのコピーに時間がかかる場合があります。コピーが完了すると、プロンプトが再度表示され、Rが使用できるようになります。

ore.frameオブジェクトは、データベース表を指すOracle R Enterpriseメタデータ・オブジェクトです。これは、Rのdata.frameオブジェクトに相当します。

split.by引数を省略する場合、hdfs.pushは、データの一部のみをHDFSにインポートします。

戻り値

データセットを含むファイルのフル・パス。操作が失敗した場合はNULL

関連項目

Oracle R Enterpriseユーザーズ・ガイド

次の例では、年が2000と等しいONTIME_Sデータベース表の行を含むontime_s2000というore.frameオブジェクトを作成します。その後、hdfs.pushontime_s2000を使用してHDFSに/user/oracle/xq/ontime2000_DBを作成します。

R> ontime_s2000 <- ONTIME_S[ONTIME_S$YEAR == 2000,]
R> class(ontime_s2000)
[1] "ore.frame"
attr(,"package")
[1] "OREbase"
R> ontime2000.dfs <- hdfs.push(ontime_s2000, key='DEST', dfs.name='ontime2000_DB', 'split.by='YEAR')
R> ontime2000.dfs
[1] "/user/oracle/xq/ontime2000_DB"
attr(,"dfs.id")
[1] TRUE