7 インデータベース機械学習アルゴリズムへのアクセスを提供するOML4Rクラス
OML4Rには、インデータベースへのアクセスを提供するクラスが用意されています。Oracle Machine Learningのアルゴリズムデータベース内のOracle Machine Learningアルゴリズムを使用して、データの移動を排除し、データを準備するためにデータベースを活用します。
これらの関数については、次の各トピックで説明します。
- OML4Rを使用したデータベース内モデルの構築について
 OML4R機械学習インタフェースは、同じデータベース内アルゴリズムを利用してOML4SQL上に構築され、同じアルゴリズム・ハイパーパラメータを使用できます。
- モデルの設定について
 モデルの特性に影響する設定を指定できます。
- 共有設定
 次の設定は、複数のOML4R機械学習クラスに共通です。
- 相関ルールore.odmAssocRules関数は、Aprioriアルゴリズムを実装することで、高頻度アイテム・セットを検索して相関モデルを生成します。
- 属性評価モデルore.odmAI属性の重要な関数は、ターゲットの予測における重要性に従って属性をランク化します。
- デシジョン・ツリーore.odmDT関数は、条件付き確率に基づいたデータベース内デシジョン・ツリー・アルゴリズムを使用します。
- 期待値最大化ore.odmEM関数は、データベース内の期待値最大化(EM)アルゴリズムを使用するモデルを作成します。
- 明示的セマンティック分析ore.odmESA関数は、データベース内の明示的セマンティック分析(ESA)アルゴリズムを使用するモデルを作成します。
- 指数平滑法モデルore.odmESMクラスは、データベース内の指数平滑法モデル(ESM)アルゴリズムを使用してクラスタリング・モデルを作成します。
- 拡張可能Rアルゴリズム・モデルore.odmRAlg関数は、拡張可能Rアルゴリズム・モデルを作成します。
- 一般化線形モデルore.odmGLM関数は一般化線形モデル(GLM)を構築しますが、これは線形モデル(線形回帰)のクラスを含み、このクラスを拡張したものです。
- k-Meansore.odmKM関数はk-Means (KM)アルゴリズムを使用します。このアルゴリズムは、指定した数のクラスタにデータをパーティション化する、距離ベースのクラスタリング・アルゴリズムです。
- Naive Bayesore.odmNB関数は、データベース内のNaive Bayesモデルを構築します。
- ニューラル・ネットワーク・モデルore.odmNNクラスは、分類および回帰用のニューラル・ネットワーク(NN)モデルを作成します。ニューラル・ネットワーク・モデルを使用すると、入力と出力との間の複雑な非リニアの関係を取得すること、つまりデータのパターンを見つけることができます。
- Non-Negative Matrix Factorizationore.odmNMF関数は、特徴抽出用にデータベース内のNon-Negative Matrix Factorization (NMF)モデルを構築します。
- 直交パーティショニング・クラスタore.odmOC関数は、直交パーティショニング・クラスタ(O-Cluster)アルゴリズムを使用してデータベース内モデルを構築します。
- パーティション化されたモデル
 パーティション化されたモデルは、複数のサブモデル(データの各パーティションに1つ)で構成されるアンサンブル・モデルです。
- ランダム・フォレスト・モデルore.odmRFクラスは、分類のためのアンサンブル学習手法を提供するデータベース内のランダム・フォレスト(RF)モデルを作成します。
- 特異値分解ore.odmSVD関数は、データベース内の特異値分解(SVD)アルゴリズムを使用するモデルを作成します。
- サポート・ベクター・マシンore.odmSVM関数は、OML4Rのサポート・ベクター・マシン(SVM)モデルを構築します。
- テキスト処理モデル
 テキスト処理モデルでは、ctx.settings引数を使用してOracle Text属性の設定を指定します。
- XGBoostモデルore.odmXGBクラスは、分類と回帰の両方をサポートするスケーラブルな勾配ツリー・ブースティング・システムです。これにより、オープン・ソースの勾配ブースティング・フレームワークが使用可能になります。トレーニング・データを準備し、インデータベースXGBoostをコールし、モデルを作成して保持し、予測のためにモデルを適用します。