hdfs.parts
HDFS内のファイルを構成する部分の数を返します。
引数
- dfs.id
-
HDFS内のファイルの名前。ファイル名には、現在のパスに絶対的または相対的なパスを使用できます。
使用上の注意
HDFSでは、大規模なファイルを部分に分割します。これは、MapReduceジョブの並列化の基礎となります。HDFSファイルの部分が多いほど、多くのマッパーを並列で実行できます。
戻り値
オブジェクトを構成する部分の数。オブジェクトがHDFS内に存在しない場合は0
。
例
次の例は、HDFS内のontime_Rファイルが1つの部分で構成されていることを示しています。
R> hdfs.parts("ontime_R")
[1] 1