予測モデルの作成およびトレーニング

解決が必要な問題に基づいて、上級データ・アナリストが適切なアルゴリズムを選択して予測モデルをトレーニングした後、モデルの結果を評価します。

正確なモデルに到達するにはプロセスを繰り返す必要があり、上級データ・アナリストは、様々なモデルを試してその結果を比較し、試行錯誤を基にしてパラメータを細かく調整できます。データ・アナリストは、ファイナライズされた正確な予測モデルを使用して、その他のデータ・セットの傾向を予測したり、モデルをプロジェクトに追加できます。

Oracle Analyticsには、数値予測、多項分類、二項分類およびクラスタリングのアルゴリズムが用意されています。アルゴリズムの選択方法の詳細は、トレーニング・モデル・アルゴリズムの選択方法を参照してください。

アルゴリズムは、Oracle Machine LearningをローカルのOracle Analytics Desktopディレクトリにインストールするまで使用できません。「デスクトップのMachine Learningのインストール方法」を参照してください

  1. 「ホーム」ページで、「作成」をクリックして「データ・フロー」を選択します。
  2. モデルのトレーニングに使用するデータ・セットを選択します。「追加」をクリックします。
    通常は、モデルのトレーニングに特化して用意されていて、予測するデータのサンプルが含まれているデータ・セットを選択します。モデルの精度は、トレーニング・データがどれほど典型的であるかによって決まります。
  3. データ・フロー・エディタで、「ステップの追加」(+)をクリックします。
    データ・セットを追加したら、モデルの作成にデータ・セットのすべての列を使用することも、関連する列のみを選択することも可能です。関連する列を選択するには、そのデータ・セットを理解している必要があります。結果の動作に影響しないことがわかっている列や、重複する情報が含まれている列を無視します。「列の選択」ステップを追加すると、関連する列のみを選択できます。関連する列がわからない場合は、すべての列を使用します。
  4. リストの最後に移動し、データ・セットに適用するモデルのトレーニング・タイプをクリックします。
  5. アルゴリズムを選択して「OK」をクリックします。
  6. 予測や分類などの教師ありモデルを使用している場合は、「ターゲット」をクリックして予測する列を選択します。たとえば、個人の所得を予測するモデルを作成している場合は、所得列を選択します。
    クラスタリングなどの教師なしモデルを使用している場合、ターゲット列は必要ありません。
  7. モデルのデフォルトの設定を変更して細かく調整し、予測結果の精度を向上させます。使用しているモデルによって、これらの設定が決まります。
  8. 「モデルの保存」ステップをクリックして、名前と説明を指定します。これが、生成される予測モデルの名前になります。
  9. 「保存」をクリックしてデータ・フローの名前と説明を入力し、「OK」をクリックしてデータ・フローを保存します。
  10. 「データ・フローの実行」をクリックし、指定した入力データ・セットおよびモデル設定に基づいて予測モデルを作成します。