3 AutoML UIスタート・ガイド
AutoMLユーザー・インタフェース(AutoML UI)は、コーディングを必要としない自動化された機械学習モデリングを提供するOracle Machine Learningインタフェースです。AutoML UIで実験を作成して実行すると、自動化されたアルゴリズムの選択、特徴の選択およびモデルのチューニングが実行されるため、生産性が向上するのみでなく、モデルの精度とパフォーマンスが向上する可能性があります。
次のステップは、機械学習モデリング・ワークフローで構成され、AutoMLユーザー・インタフェースによって自動化されています。
- アルゴリズムの選択: データセットとその特性、および各アルゴリズムのデータセットの予測機能に基づいて、より正確なモデルを生成する可能性が高いアルゴリズムをランク付けします。
- 適応サンプリング: 適切なデータ・サンプルを検索します。このステージの目標は、モデルの品質を低下させることなく、特徴の選択およびモデルのチューニングのステージを高速化することです。
- 特徴の選択: ターゲットの予測に最も役立つ特徴のサブセットを選択します。このステージの目標は、予測パフォーマンスを低下させることなくパイプラインを高速化するために、後のパイプライン・ステージ(特にモデルのチューニング・ステージ)で使用される特徴の数を減らすことです。
- モデルのチューニング: 候補リストに挙げられた各アルゴリズムについて選択したメトリックに基づいて、個々のアルゴリズム・モデルの品質を向上させることを目的としています。
- 特徴予測の影響: これは、AutoML UIパイプラインの最終ステージです。ここでは、各入力列が最後にチューニングされたモデルの予測に与える影響を計算します。計算された予測の影響により、チューニングされたAutoMLモデルの動作を把握できます。
- 機械学習モデルの作成
- 機械学習モデルのデプロイ
AutoML UI実験
AutoML UIで実験を作成すると、機械学習ワークフローに関連するすべてのステップが自動的に実行されます。実験ページには、作成したすべての実験が一覧表示されます。実験の詳細を表示するには、実験をクリックします。さらに、次のタスクを実行できます。
図3-1 実験ページ
- 作成: 「作成」をクリックして、新しいAutoML UI実験を作成します。作成するAutoML UI実験は、「ワークスペース」の下の「プロジェクト」で選択したプロジェクト内に存在します。
- 編集: ここにリストされている実験を選択し、「編集」をクリックして実験定義を編集します。
- 削除: ここにリストされている実験を選択し、「削除」をクリックして削除します。実行中の実験は削除できません。実験を削除するには、まず実験を停止する必要があります。
- 複製: 実験を選択し、「複製」をクリックしてそのコピーを作成します。実験は即座に複製され、「準備完了」ステータスになります。
- 移動: 実験を選択し、「移動」をクリックして、実験を同じワークスペースまたは別のワークスペース内の別のプロジェクトに移動します。プロジェクトおよびワークスペース間で実験を移動するには、
管理者
または開発者
権限が必要です。ノート:
実験は、RUNNING、STOPPING、またはSTARTING状態にある場合、または実験が同じ名前でターゲットプロジェクトにすでに存在する場合、移動できません。 - コピー: 実験を選択し、「コピー」をクリックして、実験を同じワークスペースまたは別のワークスペース内の別のプロジェクトにコピーします。
- 開始: 実験を作成したが実行していない場合は、「開始」をクリックして実験を実行します。
- 停止: 実行中の実験を選択し、「停止」をクリックして実験の実行を停止します。
- AutoML UIへのアクセス
AutoML UIには、Oracle Machine Learning Notebooksからアクセスできます。 - AutoML UI実験の作成
Oracle Machine LearningのAutoML UIを使用するには、まず実験を作成します。実験は、最小限のデータ・ソース、予測ターゲット、および予測タイプを指定する作業単位です。実験が正常に実行されると、選択したメトリックに従ってモデル品質の順に機械学習モデルのリストが表示されます。デプロイメントまたはノートブックを生成するために、これらのモデルのいずれかを選択できます。生成されたノートブックには、OML4Pyを使用するPythonコードと、モデルの生成に使用される特定の設定AutoMLが含まれています。 - 実験の表示
AutoML UIの実験ページに、作成したすべての実験が一覧表示されます。各実験は、「完了」、「実行中」、「準備完了」のいずれかのステージになります。
関連トピック
AutoML UIへのアクセス
AutoML UIには、Oracle Machine Learning Notebooksからアクセスできます。
親トピック: AutoML UIスタート・ガイド
AutoML UI実験の作成
Oracle Machine LearningのAutoML UIを使用するには、まず実験を作成します。実験は、最小限のデータ・ソース、予測ターゲット、および予測タイプを指定する作業単位です。実験が正常に実行されると、選択したメトリックに従ってモデル品質の順に機械学習モデルのリストが表示されます。デプロイメントまたはノートブックを生成するために、これらのモデルのいずれかを選択できます。生成されたノートブックには、OML4Pyを使用するPythonコードと、モデルの生成に使用される特定の設定AutoMLが含まれています。
VARCHAR2
、CHAR
、CLOB
、BLOB
およびBFILE
の列をテキストとして処理できます。データ型がVARCHAR2
で4K未満の列は、カテゴリ型とみなされます。
親トピック: AutoML UIスタート・ガイド
実験の表示
AutoML UIの実験ページには、作成したすべての実験が一覧表示されます。各実験は、「完了」、「実行中」、「準備完了」のいずれかのステージになります。
実験を表示するには、実験名をクリックします。「実験」ページには、選択した実験の詳細が表示されます。内容は次のとおりです。
実験の編集
ノート:
実行中の実験は編集できません。メトリック・チャート
モデル・メトリック・チャートは、実験の実行時における経時的な最善のメトリック値を表します。これは、実験の実行が進行するにつれて精度の改善点を示します。表示名は、実験の作成時に選択したモデル・メトリックによって異なります。
リーダー・ボード
図3-10 リーダー・ボード
- モデルの詳細の表示: モデル名をクリックして、詳細を表示します。「モデルの詳細」ダイアログ・ボックスにモデル詳細が表示されます。リーダー・ボードで複数のモデルをクリックし、モデルの詳細を同時に表示できます。「モデルの詳細」ウィンドウには、次の情報が表示されます。
- 予測の影響: モデルのターゲット予測に関する属性の重要度が表示されます。
- 混同行列: アルゴリズムによる実際の値と予測値の様々な組合せが表に表示されます。混同行列は、機械学習アルゴリズムのパフォーマンス測定として機能します。
- デプロイ: リーダー・ボードで任意のモデルを選択し、「デプロイ」をクリックして、選択したモデルをデプロイします。「モデルのデプロイ」。
- 名前変更: 「名前変更」をクリックして、システム生成のモデル名を変更します。名前は英数字(123文字以内)で、空白を含めることはできません。
- ノートブックの作成: リーダー・ボードで任意のモデルを選択し、AutoML UIモデルからのノートブックの作成をクリックして、選択したモデルをコードから再作成します。
- メトリック: 「メトリック」をクリックして、リーダー・ボードに表示する追加メトリックを選択します。追加メトリックは次のとおりです。
- 分類の場合
- 精度:正数と負数の両方のケースを正しく分類する割合を計算します。たとえば、TP + TN + FP + FN (True Positives+True Negatives+False Positives+False Negatives)ケースから正しく分類されたTP (True Positives) + TN (True Negatives)ケースの合計がある場合、式は次のようになります。
Accuracy = (TP+TN)/(TP+TN+FP+FN)
- バランスの取れた精度: 二項分類子がどの程度良好かを評価します。これは、クラスが不均衡な場合、つまり2つのクラスのいずれかが他方よりも頻繁に出現する場合に特に便利です。これは、異常検出などの多くの設定でよく発生します。
- 再現率: 正しく分類された実際の陽性の比率を計算します。
- 適合率: 予測された陽性のうち真陽性であるものの割合を計算します。
- F1スコア: 適合率と再現率を組み合せて単一の数値にします。F1-scoreは、次の式で計算される調和平均を使用して計算されます:
F1-score = 2 × (precision × recall)/(precision + recall)
- 精度:正数と負数の両方のケースを正しく分類する割合を計算します。たとえば、TP + TN + FP + FN (True Positives+True Negatives+False Positives+False Negatives)ケースから正しく分類されたTP (True Positives) + TN (True Negatives)ケースの合計がある場合、式は次のようになります。
- 回帰の場合:
- R2(デフォルト): 適合回帰線へのデータの近似度を計算する統計的測定。一般に、R2乗の値が大きいほど、モデルはデータに適合します。R2の値は常に0から1の間です。
0
は、平均に関するレスポンス・データの変動がモデルで説明されていないことを示します。1
は、平均に関するレスポンス・データのすべての変動をモデルが説明していることを示します。
- 負の平均二乗誤差: これは、予測ターゲットと実際のターゲットの2乗差の平均です。
- 負の平均絶対誤差: これは、予測ターゲットと実際のターゲットの絶対差の平均です。
- 負の中央絶対誤差: これは、予測ターゲットと実際のターゲットの間の絶対差の中央値です。
- R2(デフォルト): 適合回帰線へのデータの近似度を計算する統計的測定。一般に、R2乗の値が大きいほど、モデルはデータに適合します。R2の値は常に0から1の間です。
- 分類の場合
特徴
0
から1
の範囲で表され、1
に近い方がより重要です。
図3-11 特徴
- AutoML UIモデルからのノートブックの作成
同じ設定を使用して、選択したモデルを再作成するOML4Pyコードを使用してノートブックを作成できます。また、モデルを使用してデータをスコアリングする方法も示します。このオプションは、コードを使用して類似の機械学習モデルを再作成する場合に役立ちます。
親トピック: AutoML UIスタート・ガイド
AutoML UIモデルからのノートブックの作成
同じ設定を使用して、選択したモデルを再作成するOML4Pyコードを使用してノートブックを作成できます。また、モデルを使用してデータをスコアリングする方法も示します。このオプションは、コードを使用して類似の機械学習モデルを再作成する場合に役立ちます。
親トピック: 実験の表示