Oracle Analytics予測モデルの作成および使用

Oracle Analytics予測モデルは、いくつかの埋込みOracle Machine Learningアルゴリズムを使用して、データセットのマイニング、ターゲット値の予測、またはレコードのクラスの識別を実行します。予測モデルの作成やトレーニング、データへの適用には、データ・フロー・エディタを使用します。

トピック:

Oracle Analytics予測モデルとは

Oracle Analytics予測モデルは、データセットに特定のアルゴリズムを適用し、値やクラスの予測をしたり、そのデータ内のグループを識別します。

Oracle機械学習モデルは、データの予測にも使用できます。

Oracle Analyticsには各種アルゴリズムが組み込まれており、様々な目的での予測モデルのトレーニングに役立ちます。アルゴリズムには、分類や回帰ツリー(CART)、ロジスティック回帰、K平均法などがあります。

データ・フロー・エディタを使用して、まずトレーニング・データセットのモデルをトレーニングします。予測モデルをトレーニングした後で、予測するデータセットにその予測モデルを適用します。

トレーニングしたモデルを他のユーザーが使用できるようにすれば、それらのユーザーも自身のデータにそのモデルを適用して値を予測できます。場合によっては、特定のユーザーがモデルのトレーニングを行い、その他のユーザーがそのモデルを適用します。

ノート:

データで探すものがわからない場合は、機械学習によって傾向とパターンを特定するExplainの使用から始めることができます。その後、データ・フロー・エディタを使用して、予測モデルの作成とトレーニングを行い、Explainが検出した傾向とパターンを掘り下げます。

データ・フロー・エディタを使用して、次のようにモデルをトレーニングします。

まず、データ・フローを作成し、モデルのトレーニングに使用するデータセットを追加します。このトレーニング・データセットには、予測するデータ(売上や年齢のような値や、信用リスク・バケットのような変数など)が含まれています。
必要な場合は、データ・フロー・エディタを使用して列の追加や選択、結合などを行い、データセットを編集できます。
そのデータがモデルのトレーニング対象であることを確認したら、データ・フローにトレーニング・ステップを追加し、分類(二項または多項)、回帰、クラスタのいずれかのアルゴリズムを選択してモデルをトレーニングします。その後、結果のモデルに名前を付けてデータ・フローを保存し、それを実行してモデルのトレーニングと作成を行います。
機械学習オブジェクトのプロパティを調べて、モデルの品質を判断します。必要な場合は、モデルが求める品質になるまでトレーニング・プロセスを繰り返すことができます。

完成したモデルを使用して、不明またはラベルのないデータをスコアリングし、データ・フロー内にデータセットを生成するか、ワークブックに予測ビジュアライゼーションを追加します。

例

心臓病になるリスクが高い患者を予測するために、多項分類モデルを作成してトレーニングする必要があるとします。

年齢や性別、これまでに胸の痛みを感じたことがあるかなど、個々の患者に関する属性と、血圧や空腹時血糖、コレステロール、最大心拍数などのメトリックを含むトレーニング・データセットを用意します。トレーニング・データセットには、値absent、less likely、likely、highly likelyまたはpresentのいずれかが割り当てられた"Likelihood"という名前の列も含めます。
予測に値を加えない冗長な列が無視され、ターゲットの予測に役立つ列のみが識別されて使用されるため、CART (デシジョン・ツリー)アルゴリズムを選択します。データ・フローにアルゴリズムを追加したら、「Likelihood」列を選択してモデルをトレーニングします。アルゴリズムでは機械学習を使用して、予測の実行および予測や関連データセットの出力に必要なドライバ列を選択します。
結果を調べて、トレーニング・モデルを細かく調整した後、そのモデルをより大規模なデータセットに適用して、心臓病にかかっている、またはかかる可能性が高い患者を予測します。

予測モデル・アルゴリズムの選択方法

Oracle Analyticsには、数値予測、多項分類子、二項分類子、クラスタリングなど、機械学習モデリングに必要なアルゴリズムが用意されています。

オラクル社の機械学習機能は、データで探すものがわかっていて、予測分析の実行に詳しく、アルゴリズム間の相違点を理解している上級データ・アナリスト向けです。

ノート:

Oracle Autonomous Data Warehouseがソースのデータを使用している場合は、AutoML機能を使用すると、機械学習のスキルがなくても予測モデルをすばやく簡単に自動でトレーニングできます。Autonomous Data WarehouseのAutoMLを使用した予測モデルのトレーニングに関する項を参照してください。

通常は、複数の予測モデルを作成してそれらを比較し、基準や条件を満たす結果を得られる可能性が最も高いモデルを選択します。これらの基準は変わる場合もあります。たとえば、全体の精度がより高いモデルを選択する場合もあれば、最も低いタイプI (偽陽性)やタイプII (偽陰性)のエラーがあるモデルを選択する場合や、理想的な結果でなくても、許容できるレベルの精度で、より速く結果を返すモデルを選択する場合もあります。

Oracle Analyticsには、各種の予測または分類向けに、複数の機械学習アルゴリズムがあります。ユーザーは、これらのアルゴリズムを使用して、複数のモデルを作成することも、細かく調整された各種パラメータを使用することも、様々な入力トレーニング・データセットを使用してから最適なモデルを選択することも可能です。最適なモデルは、ユーザー独自の基準に対してモデルを比較し、重み付けすることで選択できます。最適なモデルを判断するには、モデルを適用し、計算の結果をビジュアル化して精度を判断するか、Oracle Analyticsでモデルを使用して出力された関連データセットを開いて調査します。

次の表を参考にして、用意されているアルゴリズムについて学習します。

名前	タイプ	カテゴリ	関数	説明
CART	分類回帰	二項分類子多項分類子数値	-	デシジョン・ツリーを使用して、離散値と連続値の両方を予測します。大規模データセットに使用します。
エラスティック・ネット線形回帰	回帰	数値	ElasticNet	詳細回帰モデル。追加の情報(正則化)を提供し、変数の選択およびと線形結合を実行します。LassoおよびRidge回帰法のペナルティ。共線性(複数の属性が完全に相関している)やオーバーフィットを避けるため、多数の属性とともに使用します。
階層	クラスタリング	クラスタリング	AgglomerativeClustering	ボトムアップ(各観察はそれ自体のクラスタであり、順次マージされる)またはトップダウン(すべての観察が1つのクラスタとして開始される)と、距離メトリックを使用してクラスタの階層を作成します。データセットが大規模ではなく、クラスタの数が事前にわからない場合に使用します。
K平均法	クラスタリング	クラスタリング	k-means	最も近い平均のクラスタに各観察が属するkクラスタに、レコードを繰り返しパーティション化します。メトリック列のクラスタ化に使用したり、予想される必要なクラスタ数を設定して使用します。大規模データ・セットに使用すると効果的です。結果は実行ごとに異なります。
線形回帰	回帰	数値	最小二乗法リッジ Lasso	データセット内のターゲット変数とその他の属性間のモデリング関係に対する線形アプローチ。属性が完全には相関していない場合に、数値の予測に使用します。
ロジスティック回帰	回帰	二項分類子	LogisticRegressionCV	カテゴリ依存変数の値の予測に使用します。依存変数は、1または0にコード化されたデータを含むバイナリ変数です。
Naive Bayes	分類	二項分類子多項分類子	GaussianNB	特徴の間に依存性がないことを前提としたBayesの定理に基づく確率的分類。入力ディメンションが多数ある場合に使用します。
ニューラル・ネットワーク	分類	二項分類子多項分類子	MLPClassifier	分類結果を実際の値と比較することで学習し、それをネットワークに返して今後の反復のためのアルゴリズムを変更する反復分類アルゴリズム。テキスト分析に使用します。
ランダム・フォレスト	分類	二項分類子多項分類子数値	-	複数のデシジョン・ツリーを作成し、すべてのデシジョン・ツリーを一括して表す値を出力するアンサンブル学習手法。数値変数やカテゴリ変数の予測に使用します。
SVM	分類	二項分類子多項分類子	LinearSVC、SVC	レコードを空間にマップし、分類に使用可能な超平面を作成することでレコードを分類します。新しいレコード(スコアリング・データ)は空間にマップされ、新しいレコードが属する超平面の側面に基づいて、あるカテゴリに属すると予測されます。

Oracle Autonomous Data WarehouseのAutoMLを使用した予測モデルのトレーニング

Oracle Autonomous Data Warehouseのデータを使用する場合、そのAutoML機能を使用して予測モデルの推奨およびトレーニングを行うことができます。AutoMLによってデータが分析され、使用する最善のアルゴリズムが計算され、データに関する予測を実行できるように予測モデルがOracle Analyticsに登録されます。

AutoMLを使用すると、困難な作業がOracle Autonomous Data Warehouseによってすべて自動で行われるため、機械学習や人工知能のスキルがなくても予測モデルをデプロイできます。生成された予測モデルは、「機械学習」ページの「モデル」領域に保存されます。新しいモデルに基づいてデータを予測するには、データ・フローを作成し、「モデルの適用」ステップを使用します。

開始する前に:

予測の対象となるOracle Autonomous Data Warehouseのデータに基づいて、データセットを作成します。たとえば、従業員減少に関するデータに、減少の'Yes'または'No'を示すATTRITIONというフィールドを含めることができます。
Oracle AnalyticsからOracle Autonomous Data Warehouseへの接続で指定されているデータベース・ユーザーがOML_Developerロールを持っていること、および'admin'スーパーユーザーではないことを確認してください。そうしない場合、データ・フローを保存または実行しようとすると失敗します。

ホーム・ページで、「作成」をクリックし、「データ・フロー」をクリックします。
「データセットの追加」で、分析するデータが含まれるOracle Autonomous Data Warehouseに基づいてデータセットを選択します。
「ステップの追加」をクリックし、AutoMLをクリックします。
「ターゲット」で、「列の選択」をクリックし、予測しようとする値が含まれるデータ列を選択します。
たとえば、従業員減少を予測する場合は、従業員が退社したかどうかを'TRUE'または'FALSE'で示すATTRITIONというフィールドを選択します。

図automl1.pngの説明
Oracle Analyticsにより推奨されたタスク・タイプおよびモデル・ランキング・メトリックを受け入れるか、別のアルゴリズムを選択します。
「モデルの保存」をクリックし、生成された予測モデルの名前を指定します。
「保存」をクリックし、データ・フローの名前を指定します。
「実行」をクリックして、データを分析し、予測モデルを生成します。
ホーム・ページから「ナビゲート」、「機械学習」の順にクリックし、生成されたモデルを右クリックして「検査」を選択します。

Oracle Analyticsによって生成されたモデルは、「機械学習」ページの「モデル」タブで検索できます。モデルを検査してその品質を評価します。「予測モデルの質の評価」を参照してください。AutoMLによって生成されたモデルに生成された関連データセットを参照することもできます。予測モデルの関連データセットとはを参照してください。

予測モデルの作成およびトレーニング

上級データ・アナリストは、予測モデルを作成およびトレーニングして、それらの使用によりOracle Machine Learningアルゴリズムをデプロイし、データセットのマイニング、ターゲット値の予測、またはレコードのクラスの識別を行うことができます。予測モデルの作成やトレーニング、データへの適用には、データ・フロー・エディタを使用します。

LiveLabsスプリント

正確なモデルに到達するにはプロセスを繰り返す必要があり、上級データ・アナリストは、様々なモデルを試してその結果を比較し、試行錯誤を基にしてパラメータを細かく調整できます。データ・アナリストは、ファイナライズされた正確な予測モデルを使用して、その他のデータセットの傾向を予測したり、モデルをワークブックに追加できます。

ノート:

Oracle Analyticsには、数値予測、多項分類、二項分類およびクラスタリングのアルゴリズムが用意されています。

アルゴリズムは、Oracle Machine LearningをローカルのOracle Analytics Desktopディレクトリにインストールするまで使用できません。「デスクトップのMachine Learningのインストール方法」を参照してください

ホーム・ページで、「作成」をクリックし、「データ・フロー」を選択します。
モデルのトレーニングに使用するデータセットを選択します。「追加」をクリックします。
データ・フロー・エディタで、「ステップの追加」(+)をクリックします。
データセットを追加したら、モデルの作成にデータセットのすべての列を使用することも、関連する列のみを選択することも可能です。関連する列を選択するには、そのデータセットを理解している必要があります。結果の動作に影響しないことがわかっている列や、重複する情報が含まれている列を無視します。「列の選択」ステップを追加すると、関連する列のみを選択できます。関連する列がわからない場合は、すべての列を使用します。
モデルのトレーニング・ステップのいずれかを選択します(「数値予測のトレーニング」または「クラスタリングのトレーニング」など)。
アルゴリズムを選択して「OK」をクリックします。
予測や分類などの教師ありモデルを使用している場合は、「ターゲット」をクリックして予測する列を選択します。たとえば、個人の所得を予測するモデルを作成している場合は、所得列を選択します。
クラスタリングなどの教師なしモデルを使用している場合、ターゲット列は必要ありません。
モデルのデフォルトの設定を変更して細かく調整し、予測結果の精度を向上させます。使用しているモデルによって、これらの設定が決まります。
「モデルの保存」ステップをクリックして、名前と説明を指定します。
「保存」をクリックしてデータ・フローの名前と説明を入力し、「OK」をクリックしてデータ・フローを保存します。
「データ・フローの実行」をクリックし、指定した入力データセットおよびモデル設定に基づいて予測モデルを作成します。

予測モデルの検査

予測モデルを作成し、データ・フローを実行すると、モデルに関する情報を確認して、その正確性を判断できます。この情報を使用して、モデルの設定を繰り返し調整することで、その正確性を向上させ、より質の高い結果を予測します。

トピック:

予測モデルの詳細の表示

予測モデルの詳細情報は、モデルの理解およびデータの予測に適しているかどうかの判断に役立ちます。モデルの詳細には、そのモデル・クラス、アルゴリズム、入力列および出力列が含まれます

ホーム・ページで、「ナビゲータ」をクリックし、「機械学習」をクリックします。
「モデル」タブをクリックします。
トレーニング・モデルのメニュー・アイコンをクリックして「検査」を選択します。
「詳細」をクリックしてモデルの情報を表示します。

予測モデルの質の評価

予測モデルの質の理解に役立つ情報を表示します。たとえば、モデル精度、適合率、再現率、F1値、偽陽性比率などの正確性のメトリックを確認できます。

Oracle Analyticsには、モデルの作成に使用されたアルゴリズムに関係なく、類似のメトリックが用意されているため、異なるモデルを簡単に比較できます。モデル作成プロセスでは、入力データセットが2つに分割され、パーティションのトレーニング率パラメータに基づいてモデルのトレーニングおよびテストが行われます。モデルはデータセットのテスト部分を使用して、作成されるモデルの精度をテストします。

「品質」タブの知見に基づいて、モデル・パラメータを調整して再トレーニングする必要がある場合があります。

ホーム・ページで、「ナビゲータ」をクリックし、「機械学習」をクリックします。
「モデル」タブをクリックします。
トレーニング・モデルのメニュー・アイコンをクリックして「検査」を選択します。
「品質」タブをクリックし、モデルの質のメトリックを確認してモデルを評価します。たとえば、「モデル精度」のスコアを確認します。

図inspect-model-quality.pngの説明

ヒント: 「詳細」をクリックして、モデルに生成されたビューの詳細を確認します。

予測モデルの関連データセットとは

データ・フローを実行してOracle Analytics予測モデルのトレーニング・モデルを作成すると、Oracle Analyticsによって一連の関連データセットが作成されます。これらのデータセットに関するワークブックを開いたり作成することによって、モデルの精度について学習できます。

LiveLabsスプリント

モデルに選択するアルゴリズムに応じて、関連データセットには、予測ルールや精度メトリック、混同行列、予測のキー・ドライバなど、モデルの詳細が含まれます。この情報を基にモデルを細かく調整して結果を向上させたり、関連データセットを使用してモデルを比較し、より正確なモデルはどちらかを判断することが可能です。

たとえば、ドライバ・データセットを開いて、モデルに強いプラスまたはマイナスの影響がある列を明らかにできます。それらの列を調べると、現実的な入力内容ではない、または予測用にしては詳細すぎるという理由で、モデル変数として扱われていない列があることがわかります。データ・フロー・エディタを使用してモデルを開き、明らかになった情報を基づいて関係のない列や詳細すぎる列を削除し、モデルを再生成します。「品質」タブと「結果」タブをチェックし、モデルの精度が向上しているかどうかを確認します。モデルの精度に問題がなくなり、新しいデータセットをスコアリングする準備が整うまでこのプロセスを続けます。

アルゴリズムが異なっても、類似した関連データセットが生成されます。データセットの個々のパラメータおよび列名はアルゴリズムのタイプによって変わることがありますが、データセットの機能は変わりません。たとえば、統計データセットの列名が線形回帰からロジスティック回帰に変わることがあっても、統計データセットにはモデルの精度メトリックが含まれます。

AutoMLモデルの関連データセット

AutoMLを使用して予測モデルをトレーニングすると、Oracle Analyticsによって、モデルに関する有益な情報を含む追加のデータセットが作成されます。作成されるデータセット数はモデル・アルゴリズムによって異なります。たとえば、Naive Bayesモデルの場合、Oracle Analyticsによって条件付き確率に関する情報を提供するデータセットが作成されます。ディシジョン・ツリー・モデルの場合、データセットは、ディシジョン・ツリー統計に関する情報を提供します。一般化線形モデル(GLM)アルゴリズムを使用して、AutoMLによって生成されたモデルを検査する際、モデルに関するメタデータ情報を含むモデル固有のデータセットの接頭辞GLM*が付いたエントリが表示されます。

図automl-related-datasets.pngの説明

関連データセット

ノート:

Oracle Analyticsは、関連データセット・タイプにデータフローの出力名を付加します。たとえば、CARTモデルでは、データ・フローの出力の名前がcart_model2の場合、データセットの名前はcart_model2_CARTです。

CART

Oracle Analyticsは、CART (分類および回帰ツリー)関連データセットの表を作成します。これには、ディシジョン・ツリーの条件および条件の基準、各グループの予測、および予測の信頼度を表す列が含まれます。ツリー・ダイアグラム・ビジュアライゼーションを使用して、このディシジョン・ツリーをビジュアル化します。

CARTデータセットは、これらのモデルとアルゴリズムの組合せを選択したときに作成されます。

モデル	アルゴリズム
数値	数値予測のCART
二項分類	CART
多項分類	CART

分類レポート

Oracle Analyticsは、分類レポート関連データセットの表を作成します。たとえば、ターゲット列に2つの個別の値(「はい」または「いいえ」)を指定できる場合、このデータセットは、ターゲット列の各個別の値に対する、F1、適合率(Precision)、再現率(Recall)、サポート(この値を含むトレーニング・データセット内の行数)などの正確性メトリックを表示します。

分類データセットは、これらのモデルとアルゴリズムの組合せを選択したときに作成されます。

モデル	アルゴリズム
二項分類	Naive Bayes ニューラル・ネットワークサポート・ベクター・マシン
多項分類	Naive Bayes ニューラル・ネットワークサポート・ベクター・マシン

モデル

アルゴリズム

二項分類

Naive Bayes

ニューラル・ネットワーク

サポート・ベクター・マシン

多項分類

Naive Bayes

ニューラル・ネットワーク

サポート・ベクター・マシン

混同行列

Oracle Analyticsは、エラー・マトリックスとも呼ばれる混同マトリックス関連データセットのピボット表を作成します。各行は予測クラスのインスタンスを表し、各列は実際のクラスのインスタンスを表します。この表は、偽陽性、偽陰性、真陽性、真陰性の数をレポートし、それらを使用して適合率、再現率およびF1の精度メトリックが計算されます。

混同マトリックス・データセットは、これらのモデルとアルゴリズムの組合せを選択したときに作成されます。

モデル	アルゴリズム
二項分類	ロジスティック回帰 CART (デシジョン・ツリー) Naive Bayes ニューラル・ネットワークランダム・フォレストサポート・ベクター・マシン
多項分類	CART (デシジョン・ツリー) Naive Bayes ニューラル・ネットワークランダム・フォレストサポート・ベクター・マシン

モデル

アルゴリズム

二項分類

ロジスティック回帰

CART (デシジョン・ツリー)

Naive Bayes

ニューラル・ネットワーク

ランダム・フォレスト

サポート・ベクター・マシン

多項分類

CART (デシジョン・ツリー)

Naive Bayes

ニューラル・ネットワーク

ランダム・フォレスト

サポート・ベクター・マシン

ドライバ

Oracle Analyticsは、ドライバ関連データセットの表を作成します。これには、ターゲット列の値を決定する列に関する情報が含まれています。これらの列の特定には、線形回帰が使用されます。各列には、係数値と相関値が割り当てられています。係数値は、ターゲット列の値の決定に使用される列の加重期間を表します。相関値は、ターゲット列と依存列間の関係の方向を示します。たとえば、依存列に基づいて、ターゲット列の値が増えるか減るかということです。

ドライバ・データセットは、これらのモデルとアルゴリズムの組合せを選択したときに作成されます。

モデル	アルゴリズム
数値	線形回帰エラスティック・ネット線形回帰
二項分類	ロジスティック回帰サポート・ベクター・マシン
多項分類	サポート・ベクター・マシン

モデル

アルゴリズム

数値

線形回帰

エラスティック・ネット線形回帰

二項分類

ロジスティック回帰

サポート・ベクター・マシン

多項分類

サポート・ベクター・マシン

Hitmap

Oracle Analyticsは、Hitmap関連データセットの表を作成します。これには、ディシジョン・ツリーのリーフ・ノードに関する情報が含まれています。表の各行はリーフ・ノードを表しており、そのリーフ・ノードが表しているものを説明する情報(セグメント・サイズや信頼度、予想される行数など)が格納されています。たとえば、予想される正しい予測の数 = セグメント・サイズ * 信頼度です。

Hitmapデータセットは、これらのモデルとアルゴリズムの組合せを選択したときに作成されます。

モデル	アルゴリズム
数値	数値予測のCART

残差

Oracle Analyticsは、残差関連データセットの表を作成します。これには、残差予測の品質に関する情報が含まれています。残差とは、回帰モデルの測定値と予測値の差異です。このデータセットには、データセットの列すべての実際値と予測値の絶対差を集計した合計値が含まれています。

残差データセットは、これらのモデルとアルゴリズムの組合せを選択したときに作成されます。

モデル	アルゴリズム
数値	線形回帰エラスティック・ネット線形回帰数値予測のCART
二項分類	CART (デシジョン・ツリー)
多項分類	CART (デシジョン・ツリー)

モデル

アルゴリズム

数値

線形回帰

エラスティック・ネット線形回帰

数値予測のCART

二項分類

CART (デシジョン・ツリー)

多項分類

CART (デシジョン・ツリー)

統計

Oracle Analyticsは、統計関連データセットの表を作成します。このデータセットのメトリックは、生成に使用されたアルゴリズムによって異なります。このメトリックのリストは、次のアルゴリズムに基づいています。

線形回帰、数値予測のCART、エラスティック・ネット線形回帰 - これらのアルゴリズムには、R2乗、調整済R2乗、平均絶対誤差(MAE)、平均平方根誤差(MSE)、相対絶対誤差(RAE)、相対平方根誤差(RSE)、2乗平均平方根誤差(RMSE)が含まれます。
CART (分類および回帰ツリー)、Naive Bayes分類、ニューラル・ネットワーク、サポート・ベクター・マシン(SVM)、ランダム・フォレスト、ロジスティックス回帰 - これらのアルゴリズムには、精度、合計F1が含まれます。

このデータセットは、これらのモデルとアルゴリズムの組合せを選択したときに作成されます。

モデル	アルゴリズム
数値	線形回帰エラスティック・ネット線形回帰数値予測のCART
二項分類	ロジスティック回帰 CART (デシジョン・ツリー) Naive Bayes ニューラル・ネットワークランダム・フォレストサポート・ベクター・マシン
多項分類	Naive Bayes ニューラル・ネットワークランダム・フォレストサポート・ベクター・マシン

モデル

アルゴリズム

数値

線形回帰

エラスティック・ネット線形回帰

数値予測のCART

二項分類

ロジスティック回帰

CART (デシジョン・ツリー)

Naive Bayes

ニューラル・ネットワーク

ランダム・フォレスト

サポート・ベクター・マシン

多項分類

Naive Bayes

ニューラル・ネットワーク

ランダム・フォレスト

サポート・ベクター・マシン

サマリー

Oracle Analyticsは、サマリー関連データセットの表を作成します。これには、ターゲット名やモデル名などの情報が含まれています。

サマリー・データセットは、これらのモデルとアルゴリズムの組合せを選択したときに作成されます。

モデル	アルゴリズム
二項分類	Naive Bayes ニューラル・ネットワークサポート・ベクター・マシン
多項分類	Naive Bayes ニューラル・ネットワークサポート・ベクター・マシン

モデル

アルゴリズム

二項分類

Naive Bayes

ニューラル・ネットワーク

サポート・ベクター・マシン

多項分類

Naive Bayes

ニューラル・ネットワーク

サポート・ベクター・マシン

予測モデルの関連データセットの検出

関連データセットは、予測モデルをトレーニングすると生成されます。

アルゴリズムに応じて、これらのデータセットには、予測ルールや精度メトリック、混同行列、予測のキー・ドライバなど、モデルの詳細が含まれます。これらのパラメータは、予測や分類の判断にモデルで使用されたルールを把握するのに役立ちます。

ホーム・ページで、「ナビゲータ」をクリックし、「機械学習」をクリックします。
「モデル」タブをクリックします。
トレーニング・モデルのメニュー・アイコンをクリックして「検査」を選択します。
「関連」タブをクリックしてモデルの関連データセットにアクセスします。
関連データセットをダブルクリックして、表示したり、ワークブックで使用します。

ワークブックへの予測モデルの追加

ワークブックでシナリオを作成する際には、ワークブックのデータセットに予測モデルを適用し、モデルが見つけ出すように設計された傾向およびパターンを明らかにします。

ノート:

Oracle機械学習モデルをワークブックのデータに適用することはできません。

モデルをワークブックに追加し、モデルの入力をデータセットの列にマップすると、キャンバスにドラッグ・アンド・ドロップできるモデルのオブジェクトが「データ・パネル」に表示されます。ビジュアライゼーションの対応するデータ列に基づき、機械学習によってモデルの値が生成されます。

ホーム・ページで「作成」、「ワークブック」の順にクリックします。
ワークブックの作成に使用するデータセットを選択し、「ワークブックに追加に追加」をクリックします。
「データ」ペインで、「追加」をクリックして「シナリオの作成」を選択します。
「シナリオの作成 - モデルの選択」ダイアログで、モデルを選択して「OK」をクリックします。
適用できるのは予測モデルのみです。Oracle機械学習モデルは適用できません。

各モデルの入力内容とデータ要素を照合できない場合は、「モデルへのデータのマップ」ダイアログが表示されます。
「モデルへのデータのマップ」ダイアログが表示されたら、「データセット」フィールドで、モデルで使用するデータセットを選択します。
必要に応じて、モデルの入力内容とデータ要素を照合します。「完了」をクリックします。
「データ要素」ペインに、シナリオがデータセットとして表示されます。
要素をデータセットおよびモデルから「ビジュアル化」キャンバスにドラッグ・アンド・ドロップします。
シナリオを調整するには、「データ要素」ペインでシナリオを右クリックして「シナリオの編集」を選択します。
必要に応じて、データセットを変更し、モデルの入力内容とデータ要素のマッピングを更新します。
「保存」をクリックしてワークブックを保存します。