概要
このトピックでは、Big Data Discoveryのデータ処理コンポーネントについて詳細に説明します。
Hadoopとの統合について
このトピックでは、BDDがHadoop環境にどのように適合するかについて説明します。
データ処理について
データ処理では、一連のプロセスおよびジョブをまとめて参照しますが、これらはすべて、Big Data DiscoveryがデプロイされたときにBig Data Discoveryによって起動されたものです。これらのプロセスの多くはHadoopで実行され、ソース・データの検出、サンプリング、プロファイリングおよびエンリッチメントを実行します。
収集用のデータの準備
必須ではないものの、ソース・データをクリーニングすることにより、データ処理ワークフローをよりスムーズに実行し、収集エラーを防ぐことができるような状態にすることをお薦めします。