19 機械学習(プレビュー)
Oracle AI Data Platform Workbenchは、MLflowの概念とAPI、具体的には実験、実行、モデル・レジストリを使用した機械学習(ML)ライフサイクル管理を提供します。
これらの機能は、ワークスペース、実験、カタログなどの複数の表面にまたがるAIデータ・プラットフォーム・ワークベンチに深く統合されているため、チームはどこで作業が発生するかを追跡し、結果を共有された管理されたアセットにプロモートできます。
MLライフサイクル
- データ準備: RAW入力を消去およびフォーマットします
- 探索的データ分析(EDA):データを探索してパターンを見つけます
- 機能エンジニアリング:モデルの変数を作成します
- 実験:複数のアプローチを使用して反復的にトレーニング(各反復は実行)
- 検証および格納:最適な実行を識別し、再利用のためにモデルを登録します
- 推論の実行:ノートブックからのバッチ推論に登録されたモデル・バージョンを使用します
- 監視:デプロイされたモデルの基本的な本番パフォーマンスと可用性を追跡します。
コア機能
チーム・ワークスペースごとの実験トラッキング
- 実験は、チームを分離し、作業を整理するために ⁇workspace⁇ にスコープされます。
- MLflow互換の自動ロギングでは、実行ごとにパラメータ、メトリックおよびアーティファクトが取得され、制御された変更による再実行をサポートする再現可能なレコードが作成されます。
比較および登録の実行
- 実行をフィルタおよび比較して、候補モデルを識別できます。
- 実行をマスター・カタログにバックアップされたモデル・レジストリに登録し、バージョニング、タグおよびカスタム・フィールドを保持できます。バージョン管理は、更新されたモデルの登録時にプラットフォームによって処理されます。
レジストリからノートブック推論へ
- モデルは、最新バージョンまたは明示的なバージョンでノートブックにロードできるため、一貫した再利用できます。
- バッチ推論ワークフローでは、レジストリ・バージョンを直接参照できるため、実験と推論の間の手動処理が削減されます。
監査可能性の系統
- 登録済モデルは、ハイパーパラメータ、環境変数、メトリック、アーティファクトなどの実行条件など、元の実験実行にリンクします。
- これにより、各モデルの来歴を明示的にすることで、レビューおよび監査がサポートされます。
MLflowを使用する理由
AI Data Platform WorkbenchはMLflowをMLOpsフレームワークの基盤として使用します。MLflowは、エンドツーエンドの機械学習ライフサイクルを管理するためのオープンで拡張可能でフレームワークに依存しないアプローチを提供するためです。
MLflowは、実験追跡、モデル・パッケージング、アーティファクト管理、モデル・バージョニング、レジストリベース、ガバナンスなど、機械学習を大規模に運用するために必要なコア機能をサポートしています。パラメータ、メトリック、アーティファクトを取得し、一貫した方法でメタデータを実行できるため、データ・サイエンス・チームとエンジニアリング・チーム間の再現性、監査性、コラボレーションの向上に適しています。
MLflowを選択する主な理由は、TensorFlow、PyTorch、scikit-learnなどの一般的な機械学習フレームワークとの幅広い互換性です。これにより、AI Data Platform Workbenchは、チームを単一のフレームワークやツールチェーンに強制することなく、多様なモデル開発パターンをサポートできます。MLflowのプラグイン・アーキテクチャと導入の柔軟性により、プラットフォームの拡張と既存のエンタープライズ・インフラストラクチャとの統合が容易になります。
MLflow上で標準化することで、AI Data Platform Workbenchは、さまざまなAI/MLユースケースで進化するために必要な柔軟性を維持しながら、実験、モデル登録、ライフサイクル管理全体で一貫したMLOpsエクスペリエンスを提供できます。