「検索」の使用

「検索」では、すぐに使用できるガイド付きの分析操作が提供されます。これは、目標に基づいてデータを説明するために、適切な視覚化でキャンバスを構成します。これにより、データおよび検索データの品質のサマリーを取得できます。

「検索」ボタンの強調表示

「検索」では、値の分布、データ品質ギャップおよび関係を示す、データの属性を中心としたビジュアル・サマリーが提供されます。

「検索」によって示される視覚化から、データ・セットのインサイトの大部分を得ることができます。視覚化は各属性のデータ型と値の分布に最も適しています。

視覚化は自動的に作成されるため、このプロセスの初期の段階では時間も手間もかかりません。データ・セットの理解が進んだら、さらに分析する価値があると判断したデータについて独自の視覚化を作成できます。

「検索」領域は、新しいデータ・セットのガイド・ツアーのようなもので、データ・セットに何が含まれているかを理解するために役立ちます。ユーザーは共通のRコマンドをいくつも手動で入力して、その結果から初期の意味を抽出しようとしなくてすみます。

次に示す質問は、Big Data Discoveryで「検索」を使用して答えを得ることができます。

このようにして、検索を行ったデータ・セットを理解します。

「検索」の視覚化の例を次に示します。

Studio内の「検索」領域には、最も潜在的な情報を持つ属性が示されます。

この図には、37.8Kのレコードのデータ・セットの「検索」が表示されます。属性は、潜在的な情報で降順に並べ替えられます。

注意: 大容量のデータ・セット全体を検索できる場合でも、最初は代表的なサンプルから開始して、その後で仮説を確認するか、データ全体で分析を展開することをお薦めします。