変換

新しいデータは通常はダーティです。ビッグ・データの場合はさらにダーティになります。検索を行う際に、データ品質の問題がしばしば表面化します。それらの優先順位を決定して、多くの場合に、なんらかのデータの修正、クリーニングまたは変更を行う必要があります。

Studioの対話型「変換」領域を使用すると、高度な分析に適したデータにダーティ・データを変えることができます。「変換」によって、データ品質の問題を分離し、いくつものデータ変換を迅速に適用して、データをクリーニング(再編成)することができます。

Studioの「変換」を次に示します。

「変換」のテキストが強調表示

「変換」では、データがスプレッドシート形式で属性の値リスト・ビューまたは行ビューとして表示されます。データの変換例を次に示します。

結果として、必要なデータがHDFSに格納され、Big Data Discoveryによって索引付けされ、変換されて、分析の準備が整います。