検索を行う際に、データ品質の問題がしばしば表面化します。それらの優先順位を決定して、多くの場合に、なんらかのデータの修正、クリーニングまたは変更を行う必要があります。Studioの対話型「変換」領域を使用すると、高度な分析に適したデータにデータを変えることができます。
「変換」によって、データ品質の問題を分離し、いくつものデータ変換を迅速に適用して、データをクリーニング(再編成)することができます。
Studioの「変換」を次に示します。
データ変換およびデータ検索は、あらゆる検出プロジェクトにおいて不可欠な2つの部分であるため、統一されたインタフェースで「変換」と「検索」をシームレスに行き来することができ、なめらかなワークフローが実現します。
次の例は、「変換」の内容を示しています。
この図では、Studioの「変換」領域を確認できます。「クイック」変換のリストに注意してください。これには、「変換先」、「属性の削除」などが含まれます。右側には、プロジェクトのユーザーによって作成された3つの変換の「変換スクリプト」も確認できます。
結果として、必要なデータがHDFSに格納され、Big Data Discoveryによって索引付けされ、変換されて、分析の準備が整います。