予測モデルの作成およびトレーニング

解決が必要な問題に基づいて、拡張データ・アナリストが適切なアルゴリズムを選択し、予測モデルをトレーニングし、次にモデルの結果を評価します。

正確なモデルへの到達は反復プロセスであり、拡張データ・アナリストは様々なモデルを試して、その結果を比較し、試行錯誤に基づいてパラメータを微調整できます。データ・アナリストは、ファイナライズされた正確な予測モデルを使用して、他のデータ・セットのトレンドを予測したり、モデルをプロジェクトに追加したりできます。

Oracle Analyticsには、数値予測、複数分類、バイナリ分類およびクラスタリング用のアルゴリズムが用意されています。アルゴリズムを選択する方法の詳細は、「トレーニング・モデル・アルゴリズムの選択方法」を参照してください。

  1. 「ホーム」ページで、「作成」をクリックし、「データ・フロー」を選択します。
  2. モデルのトレーニングに使用するデータ・セットを選択します。「追加」をクリックします。
    通常は、モデルのトレーニング用として特別に準備され、予測するデータのサンプルを含むデータ・セットを選択します。モデルの精度は、トレーニング・データの代表性によって異なります。
  3. データ・フロー・エディタで、「ステップの追加(+)」をクリックします。
    データ・セットを追加した後、データ・セット内のすべての列を使用してモデルを構築したり、関連する列のみを選択したりできます。関連する列を選択するには、データ・セットについて理解している必要があります。結果の動作に影響しないことがわかっている列、または冗長な情報を含む列は無視します。「列の選択」ステップを追加することで、関連する列のみを選択できます。関連する列がわからない場合は、すべての列を使用します。
  4. リストの最下部に移動し、データ・セットに適用するトレイン・モデル・タイプをクリックします。
  5. アルゴリズムを選択して、「OK」をクリックします。
  6. 予測や分類などの教師ありモデルで作業している場合は、「ターゲット」をクリックして、予測しようとしている列を選択します。たとえば、個人の収入を予測するモデルを作成する場合は、「収益」列を選択します。
    クラスタリングなど、教師なしモデルで作業している場合、ターゲット列は必要ありません。
  7. モデルのデフォルト設定を変更して微調整し、予測結果の精度を改善します。これらの設定は、操作中のモデルによって決定されます。
  8. 「モデルの保存」ステップをクリックして、名前と説明を指定します。これは、生成された予測モデルの名前になります。
  9. 「保存」をクリックし、データ・フローの名前および説明を入力し、「OK」をクリックしてデータ・フローを保存します。
  10. 「データ・フローの実行」をクリックし、入力データ・セットおよび指定したモデル設定に基づいて予測モデルを作成します。