2 機械学習プロセス
機械学習プロジェクトのライフサイクルは6つのフェーズに分かれています。このプロセスは、ビジネス上の問題を定義し、機械学習の観点からビジネス上の問題を言い換えることから始まります。機械学習プロセスの最終目標は、ビジネス上の問題を解決するための正確な結果を生成することです。
- Oracle Machine Learningプロセス
この機械学習プロセスの図は、Cross-Industry Standard Process for Data Mining (CRISP-DM)の方法論に基づいています。各ステージを、主要タスクをまとめた要点とともに示しています。CRISP‐DM手法は、機械学習において最も一般的に使用されている方法論です。 - ビジネス目標の定義
機械学習プロセスの最初のフェーズは、ビジネス目標を定義することです。プロジェクトのこの初期フェーズでは、プロジェクトの目的および要件の理解に焦点を当てます。 - データの理解
データ理解フェーズには、データのロードやビジネス上の問題のデータの分析など、データの収集と調査が含まれます。 - データの準備
準備フェーズでは、データをファイナライズし、モデルの作成に使用できる形式でデータを作成するために必要なタスクをすべて実行します。 - モデルの開発
このフェーズでは、様々なモデリング手法を選択して適用し、ハイパーパラメータと呼ばれるアルゴリズム・パラメータを目的の値に調整します。 - 評価
プロジェクトのこの段階では、最初に示されたビジネス目標をモデルがどの程度満たしているか評価します。 - デプロイ
デプロイメントとは、ターゲット環境内で機械学習を使用することです。デプロイメント・フェーズでは、データ駆動型のインサイトと実用的な情報を導出できます。