19 機械学習(プレビュー)

Oracle AI Data Platform Workbenchは、MLflowの概念とAPI、具体的には実験、実行、モデル・レジストリを使用した機械学習(ML)ライフサイクル管理を提供します。

これらの機能は、ワークスペース、実験、カタログなどの複数の表面にまたがるAIデータ・プラットフォーム・ワークベンチに深く統合されているため、チームはどこで作業が発生するかを追跡し、結果を共有された管理されたアセットにプロモートできます。

MLライフサイクル

エンドツーエンドのMLライフサイクルは通常、次のステップに従います。
  1. データ準備: RAW入力を消去およびフォーマットします
  2. 探索的データ分析(EDA):データを探索してパターンを見つけます
  3. 機能エンジニアリング:モデルの変数を作成します
  4. 実験:複数のアプローチを使用して反復的にトレーニング(各反復は実行)
  5. 検証および格納:最適な実行を識別し、再利用のためにモデルを登録します
  6. 推論の実行:ノートブックからのバッチ推論に登録されたモデル・バージョンを使用します
  7. 監視:デプロイされたモデルの基本的な本番パフォーマンスと可用性を追跡します。

コア機能

チーム・ワークスペースごとの実験トラッキング

  • 実験は、チームを分離し、作業を整理するために ⁇workspace⁇ にスコープされます。
  • MLflow互換の自動ロギングでは、実行ごとにパラメータ、メトリックおよびアーティファクトが取得され、制御された変更による再実行をサポートする再現可能なレコードが作成されます。

比較および登録の実行

  • 実行をフィルタおよび比較して、候補モデルを識別できます。
  • 実行をマスター・カタログにバックアップされたモデル・レジストリに登録し、バージョニング、タグおよびカスタム・フィールドを保持できます。バージョン管理は、更新されたモデルの登録時にプラットフォームによって処理されます。

レジストリからノートブック推論へ

  • モデルは、最新バージョンまたは明示的なバージョンでノートブックにロードできるため、一貫した再利用できます。
  • バッチ推論ワークフローでは、レジストリ・バージョンを直接参照できるため、実験と推論の間の手動処理が削減されます。

監査可能性の系統

  • 登録済モデルは、ハイパーパラメータ、環境変数、メトリック、アーティファクトなどの実行条件など、元の実験実行にリンクします。
  • これにより、各モデルの来歴を明示的にすることで、レビューおよび監査がサポートされます。

MLflowを使用する理由

AI Data Platform WorkbenchはMLflowをMLOpsフレームワークの基盤として使用します。MLflowは、エンドツーエンドの機械学習ライフサイクルを管理するためのオープンで拡張可能でフレームワークに依存しないアプローチを提供するためです。

MLflowは、実験追跡、モデル・パッケージング、アーティファクト管理、モデル・バージョニング、レジストリベース、ガバナンスなど、機械学習を大規模に運用するために必要なコア機能をサポートしています。パラメータ、メトリック、アーティファクトを取得し、一貫した方法でメタデータを実行できるため、データ・サイエンス・チームとエンジニアリング・チーム間の再現性、監査性、コラボレーションの向上に適しています。

MLflowを選択する主な理由は、TensorFlow、PyTorch、scikit-learnなどの一般的な機械学習フレームワークとの幅広い互換性です。これにより、AI Data Platform Workbenchは、チームを単一のフレームワークやツールチェーンに強制することなく、多様なモデル開発パターンをサポートできます。MLflowのプラグイン・アーキテクチャと導入の柔軟性により、プラットフォームの拡張と既存のエンタープライズ・インフラストラクチャとの統合が容易になります。

MLflow上で標準化することで、AI Data Platform Workbenchは、さまざまなAI/MLユースケースで進化するために必要な柔軟性を維持しながら、実験、モデル登録、ライフサイクル管理全体で一貫したMLOpsエクスペリエンスを提供できます。