プライマリ・コンテンツに移動
Oracle® Big Data Discovery Cloud Serviceスタート・ガイド

E65362-05
目次へ
目次
索引へ移動
索引

前
次
機械翻訳について

エクスプローラの使用

「探索」には、すぐに使用可能なガイド付きアナリティクス・エクスペリエンスが用意されています。 目的に基づいてデータを説明する適切なビジュアライゼーションがキャンバスに構成されます。 これにより、データのサマリーを取得し、データ品質を探索できます。

強調表示された探索ボタン

「探索」では、値分布、データ品質ギャップおよび関係を要約して、データの属性に焦点を絞ったビジュアルな要約が提供されます。

「探索」では、各属性データ・タイプおよび値の分布に最も適したタイプを選択して、データ・セットを最も的確に把握できるビジュアライゼーションが表示されます。

ビジュアライゼーションは自動的に構成され、プロセスのこの早い段階で時間と労力を節約するためのものです。 データ・セットについてより深く理解していると、さらに詳しく分析できるように識別したデータに独自のビジュアライゼーションを作成できます。

「探索」領域は、新しいデータ・セットのガイド・ツアーと考えることができ、データを手動で問い合せるか、独自のビジュアライゼーションを構成する必要がありません。 これにより、結果から意味をすぐに抽出して、データ・セットの内容を理解しやすくなります。

探索を使用したときにBig Data Discoveryから回答が示される質問の一部を次に示します:
  • データに含まれるフィールドは何ですか。 それらが何であるかを理解しますか。 「探索」では、これらのフィールドが一連のビジュアライゼーションとして表示されます。
  • 値の分布方法 「探索」では、記述統計(平均、中央値、モード、五分位数)およびビジュアル(ヒストグラム、ボックス・プロット)を使用します。
  • データはどのぐらいダーティ/乱雑ですか。 欠落値または外れ値はありますか。 「探索」は、各属性の下にあるバーを使用して、非一貫性が存在するかどうかを一目で表します。
  • フィールド間にはどのような関係がありますか。 「探索」では、数値相関およびビジュアルを使用します。

また、「探索」では、独自のノートやタグをデータ・セットに追加できます。 後でそれらのタグをソートまたは検索したり、データを2回目に調査しなくてもクイック・サマリーのノートを確認できます。

結果として、検索対象のデータ・セットについて理解しています。

「探索」ビジュアライゼーションのいくつかの例を次に示します:

Studioの探索領域には、潜在的情報が最も高い属性が表示されます。

このイメージは、57.1Kレコードを持つデータ・セットについて「探索」を示しており、属性が名前でソートされています。

注意:

大規模なデータ・セットを完全なスケールで調べる場合でも、まず代表的なサンプルを調べ、後で仮説を確認するか、完全なデータ・スケールで分析を展開してください。