新しいデータは通常はダーティです。ビッグ・データの場合はさらにダーティになります。検索を行う際に、データ品質の問題がしばしば表面化します。それらの優先順位を決定して、多くの場合に、なんらかのデータの修正、クリーニングまたは変更を行う必要があります。
Studioの対話型「変換」領域を使用すると、高度な分析に適したデータにダーティ・データを変えることができます。「変換」によって、データ品質の問題を分離し、いくつものデータ変換を迅速に適用して、データをクリーニング(再編成)することができます。
Studioの「変換」を次に示します。
データ変換およびデータ検索は、あらゆる検出プロジェクトにおいて不可欠な2つの部分であるため、統一されたインタフェースで「変換」と「検索」をシームレスに行き来することができ、なめらかなワークフローが実現します。
結果として、必要なデータがHDFSに格納され、Big Data Discoveryによって索引付けされ、変換されて、分析の準備が整います。