教師あり学習
教師あり学習は、指示あり学習とも呼ばれます。この種の学習プロセスは、既知である従属属性またはターゲットからの指示を受けます。
教師あり機械学習では、ターゲットの動作を一連の独立属性や予測子の機能として説明するように試みます。教師あり学習は、通常、予測モデルに帰着します。
教師ありモデルの作成には、トレーニングという、ターゲット値が既知である多数のケースをソフトウェアで分析するプロセスが伴います。トレーニング・プロセスでは、モデルは予測を可能にするデータのパターンを"学習"します。たとえば、販促に反応しやすい顧客の識別を目的とするモデルは、過去に販促に反応した、または反応しなかったと認識されている多数の顧客の特性を分析することによって、トレーニングされている必要があります。
Oracle Machine Learningでは、次の教師あり機械学習手法がサポートされています:
表3-1 教師あり機械学習手法
機能 | 説明 | 問題例 | サポートされているアルゴリズム |
---|---|---|---|
特徴の選択または属性評価 | ターゲット属性の予測において最も重要な属性を識別する。 | 提携カード・プログラムに対する顧客の反応を指定し、最も重要な予測子を検出する。 | |
分類 | 個々のクラスに項目を割り当て、ある項目が属するクラスを予測する。 | 1群の顧客に関する人口統計データを指定し、提携カード・プログラムに対する顧客の反応を予測する。 | |
回帰 | 連続する値を概算および予測する。 | 1群の顧客に関する人口統計データおよび購入データを指定し、顧客の年齢を予測する。 | |
ランキング | ある項目の確率を他の項目に対して予測する | 閲覧履歴に基づいてオンライン顧客に製品をお薦めする | XGBoost |
時系列 | 等間隔の時点で取得されたターゲット値の既知の履歴に基づいてターゲット値を予測する | 海の波の長さを予測し、コスト、在庫要件、顧客満足度を見積るなどの戦術的な問題に対処する。 | 指数平滑法 |
- データの分割
一部の予測モデルの作成(トレーニング)とテストには、別々のデータセットが必要です。通常は、1つの大規模な表またはビューを2つのデータセットに分割し、1つをモデルの作成用、もう1つをモデルのテスト用とします。
親トピック: 機械学習の手法とアルゴリズム