プライマリ・コンテンツに移動
Oracle® Big Data Discovery Cloud Serviceデータ処理ガイド
E65369-05
目次
索引
前
次
機械翻訳について
1
概要
この項では、Big Data Discoveryのデータ処理コンポーネントの概要を説明します。
「
SparkおよびHadoopとのBDD統合
」
Hadoopには、BDDがデータの処理および管理に必要な多くのコンポーネントおよびツールが用意されています。
Hadoop Distributed File System (HDFS)にはソース・データが格納され、Hadoop SparkがYARN上に格納されて、すべてのデータ処理ジョブが実行されます。
この項では、BDDをSparkおよびHadoop環境に適合させる方法について説明します。
「
「セキュアHadoop」のオプション
」
この項では、BDDワークフローをセキュアなHadoop環境で使用する方法について説明します。
「
収集するデータの準備
」
必須ではありませんが、データ処理ワークフローがスムーズに実行されて収集エラーを回避できるように、ソース・データをクリーンアップすることをお薦めします。