Explainを使用したデータの分析
Explainは、機械学習を使用してデータに関する有益なインサイトを検出します。
Explainとは
Explainは、選択された列をそのデータセットのコンテキスト内で分析し、検出したインサイトに関するテキスト説明を生成します。たとえば、任意の列に対して、基本的なファクト、キー・ドライバ、列を説明するセグメントおよび異常が見つかります。
Explainでは、Oracleの機械学習を使用して、データに関する正確で高速で強力な情報を生成し、ワークブックのキャンバスに追加できる対応するビジュアライゼーションを作成します。
Explainは、検索するデータ・トレンドがわからない可能性があるが、キャンバスに列をドラッグ・アンド・ドロップしたり、データ・フローを使用して予測モデルをトレーニングおよび適用する試験的作業に時間を費やしたくないデータ・アナリストを対象としています。
Explainは、データ・アナリストにとって、データ内で検索するトレンドを確認し、その情報を使用して他のデータセットに適用する予測モデルを作成およびチューニングするための有益な開始ポイントでもあります。
インサイトとは
インサイトは、データセットのコンテキスト内で選択された列を説明するカテゴリです。
Explainが提供するインサイトは、選択した列タイプまたは集計に基づいており、選択したメトリックに対して設定された集計ルールに従って変化します。Explainでは、選択した列タイプにとって意味のあるインサイトのみが生成されます。
インサイト・タイプ | 説明 |
---|---|
基本ファクト | 列の値の基本分布を表示します。列データは、各データセットのメジャーに対して分類されます。
このインサイトは、すべての列タイプで使用できます。
|
キー・ドライバ | 選択した列の結果と最高度の相関を持つデータセットの列を表示します。相関する各属性値全体における選択値の分布がチャートに表示されます。
このタブが表示されるのは、属性列を説明する場合か、平均集計ルールを持つメトリック列を説明する場合のみです。 |
セグメント | 列値のキー・セグメント(またはグループ)を表示します。Explainは、データに分類アルゴリズムを実行してデータ値の共通部分を特定し、属性の指定された結果について最高確率を生成するすべてのディメンション全体にわたる値の範囲を識別します。
たとえば、一定の地域に居住する一定の年数教育を受けた一定の年齢範囲の個人グループは、特定の製品を非常に高い確率で購入するセグメントを形成します。 このタブが表示されるのは、属性列を説明する場合のみです。 |
異常 | いずれかの(集計)値が回帰アルゴリズムの予想から大幅に逸脱している一連の値を識別します。 |
Explainを使用したデータ・インサイトの確認
列を選択してExplain機能を選択すると、Oracle Analyticsは機械学習を使用してデータセットのコンテキスト内で列を分析します。たとえば、Explainは、選択されたデータでキー・ドライバと異常を検索します。
Explainで使用するデータセットの作成
Explainは、Oracle Analyticsインスタンスに格納されたサブジェクト領域で使用することはできません。ただし、ローカル・サブジェクトからデータセットを作成してから、Explainを使用してデータセットの列を分析できます。
- ホーム・ページで、「作成」,、「データセット」の順にクリックします。
- 「データセットの作成」ダイアログで、ローカル・サブジェクト領域を選択します。
- オプション: 「列の選択」を選択して、使用可能なサブジェクト領域および列を表示、参照および検索します。列を選択して「選択項目の追加」をクリックし、データセットに追加します。
- オプション: または、「論理SQLの入力」を選択して問合せを作成するか、「列の選択」領域で選択した列の問合せを変更します。
- オプション: 「フィルタを追加するにはここをクリックします」を選択して、列のフィルタ基準を指定します。
- 「追加」をクリックしてデータセットを保存し、変換エディタに移動してデータセットのデータを変換およびエンリッチします。
- オプション: 「ワークブックの作成」をクリックして、データセットを含むワークブックを作成してから、Explainを使用します。