空間AIモデリング・ワークフロー
監視あり機械学習と教師なし機械学習の両方のための空間AIモデリング・ワークフローについて学習します。
次のフローチャートは、空間AIモデリングおよび分析の一般的なワークフローを示しています。
前の図に示すように、ワークフローは次のステップで構成されます - データのロード、前処理、MLモデルのトレーニングと評価、トレーニングされたモデルを使用した予測、結果の事後処理、および他のストレージ内のデータベースまたはファイルへの結果のエクスポート。
ワークフローは、教師あり(回帰、分類および異常検出)と教師なし(クラスタリングおよびリージョン化)の両方の機械学習に適用されます。 ただし、後者の場合、トレーニングと予測のアクションは1つのステップにマージされます。
前の図に示すワークフロー・アクションは、次のコンポーネントでサポートされています:
- データ・アクセス: このコンポーネントは、次のデータ・ソースのいずれかからの読取りおよび書込みに役立ちます - Autonomous Databaseサーバーレス、OCIオブジェクト・ストレージまたはローカル・ファイル。 ただし、メイン・ストレージ・システムはAutonomous Databaseサーバーレス・データベースです。 単一のプロキシ空間データ・フレームは、データのロードとデータのエクスポートの両方に使用されます。
詳細については、「空間データへのアクセス」を参照してください。
- 前処理: このコンポーネントは、ソース・データを準備、処理および補強します。 これには、欠損値の入力、データのスケーリング、新機能のエンジニアリング、ソース・データセットのトレーニング・データセット、検証データセットおよびテスト・データセットへの分割が含まれます。
詳細については、「空間データの前処理」を参照してください。
- 空間分析: このコンポーネントは、基本的な空間アナリティクスを提供します。 これらは、より良い結果を達成したり、より良いインサイトを得るために、機械学習モデリングと一緒に使用したり、促進したりします。
詳細については、「空間分析の実行」を参照してください。
- AI機械学習アルゴリズム: このコンポーネントは空間AIの中核であり、記述的および予測的分析のためのアルゴリズムと手法を提供します。
各アルゴリズムには、モデルを作成またはトレーニングし、予測を行うためのメソッドが用意されています。
- 回帰、分類および異常検出アルゴリズム: これらは、各アルゴリズムにトレーニングの適合メソッド、評価のスコア・メソッドおよび予測の予測メソッドがある教師あり学習アルゴリズムです。
詳細は、「空間回帰の適用」、「空間分類の適用」および「空間異常検出の適用」を参照してください。
- クラスタ化およびリージョン化アルゴリズム: これらは教師なし学習アルゴリズムであり、各アルゴリズムにはトレーニングとクラスタリングの両方に適したメソッドがあります。
詳細については、「空間クラスタリングの適用」を参照してください。
各モデルのトレーニングと個別適用に加えて、このコンポーネントは適応的空間回帰も提供します。 このツールを使用すると、様々な回帰アルゴリズムを自動的に検索および評価し、特定のアプリケーションに最適なアルゴリズムを見つけることができます。
- 回帰、分類および異常検出アルゴリズム: これらは、各アルゴリズムにトレーニングの適合メソッド、評価のスコア・メソッドおよび予測の予測メソッドがある教師あり学習アルゴリズムです。
- Post-processing: 通常、このコンポーネントには、結果のクリーニング、冗長性の削除、空間データの地理参照、データ形式の変換、有用な空間レイヤーの生成と格納が含まれます。
空間AI機械学習は空間ベクトル・データのみで適用されるため、結果は後処理を必要とせずに比較的単純です。 結果のデータは、データ・アクセス・コンポーネントを使用してデータベースに直接格納できます。 その後、Oracle Spatialの機能を使用してデータをさらに処理できます。
詳細については、「後処理タスクの実行」を参照してください。
- 空間パイプライン: パイプラインは、空間機械学習ワークフローを編成および簡素化する機能を提供します。 空間パイプラインは、既存の
scikit-learn
パイプラインを拡張して、ジオメトリ・データや空間重みなどの空間情報を取得します。詳細については、「空間パイプラインの操作」を参照してください。