「変換」の使用

検索を行う際に、データ品質の問題がしばしば表面化します。それらの優先順位を決定して、多くの場合に、なんらかのデータの修正、クリーニングまたは変更を行う必要があります。Studioの対話型「変換」領域を使用すると、高度な分析に適したデータにデータを変えることができます。

「変換」によって、データ品質の問題を分離し、いくつものデータ変換を迅速に適用して、データをクリーニング(再編成)することができます。

Studioの「変換」を次に示します。

「変換」のテキストが強調表示

「変換」では、データがスプレッドシート形式で属性の値リスト・ビューまたは行ビューとして表示されます。データの変換例を次に示します。

次の例は、「変換」の内容を示しています。

複数のタイプの変換が使用可能なStudioの「変換」領域。

この図では、Studioの「変換」領域を確認できます。「クイック」変換のリストに注意してください。これには、「変換先」「属性の削除」などが含まれます。右側には、プロジェクトのユーザーによって作成された3つの変換の「変換スクリプト」も確認できます。

結果として、必要なデータがHDFSに格納され、Big Data Discoveryによって索引付けされ、変換されて、分析の準備が整います。