Explainを使用したデータの分析
Explainは、機械学習を使用してデータに関する有益なインサイトを検出します。
Explainとは
Explainは、選択された列をそのデータ・セットのコンテキスト内で分析し、検出したインサイトに関するテキスト説明を生成します。たとえば、任意の列に対して、基本的なファクト、キー・ドライバ、列を説明するセグメントおよび異常が見つかります。
Explainでは、Oracleの機械学習を使用して、データに関する正確で高速で強力な情報を生成し、プロジェクトのキャンバスに追加できる対応するビジュアライゼーションを作成します。
Explainは、検索するデータ・トレンドがわからない可能性があるが、キャンバスに列をドラッグ・アンド・ドロップしたり、データ・フローを使用して予測モデルをトレーニングおよび適用する試験的作業に時間を費やしたくないデータ・アナリストを対象としています。
Explainは、データ・アナリストにとって、データ内で検索するトレンドを確認し、その情報を使用して他のデータ・セットに適用する予測モデルを作成およびチューニングするための有益な開始ポイントでもあります。
インサイトとは
インサイトは、データ・セットのコンテキスト内で選択された列を説明するカテゴリです。
Explainが提供するインサイトは、選択した列タイプまたは集計に基づいており、選択したメトリックに対して設定された集計ルールに従って変化します。Explainでは、選択した列タイプにとって意味のあるインサイトのみが生成されます。
インサイト・タイプ | 説明 |
---|---|
基本ファクト | 列の値の基本分布を表示します。列データは、各データ・セットのメジャーに対して分類されます。
このインサイトは、すべての列タイプで使用できます。
|
キー・ドライバ | 選択した列の結果と最高度の相関を持つデータ・セットの列を表示します。相関する各属性値全体における選択値の分布がチャートに表示されます。
このタブが表示されるのは、属性列を説明する場合か、平均集計ルールを持つメトリック列を説明する場合のみです。 |
セグメント | 列値のキー・セグメント(またはグループ)を表示します。Explainは、データに分類アルゴリズムを実行してデータ値の共通部分を特定し、属性の指定された結果について最高確率を生成するすべてのディメンション全体にわたる値の範囲を識別します。
たとえば、一定の地域に居住する一定の年数教育を受けた一定の年齢範囲の個人グループは、特定の製品を非常に高い確率で購入するセグメントを形成します。 このタブが表示されるのは、属性列を説明する場合のみです。 |
異常 | いずれかの(集計)値が回帰アルゴリズムの予想から大幅に逸脱している一連の値を識別します。 |
Explainを使用したデータ・インサイトの確認
列を選択してExplain機能を選択すると、Oracle Analyticsは機械学習を使用してデータ・セットのコンテキスト内で列を分析します。たとえば、Explainは、選択されたデータでキー・ドライバおよび異常を検索します。
Explainは、機械学習をローカルのOracle Analytics Desktopディレクトリにインストールした後に使用可能になります。「デスクトップのMachine Learningのインストール方法」を参照してください