インデータベース機械学習アルゴリズムへのアクセスを提供するOML4Rクラス

7 インデータベース機械学習アルゴリズムへのアクセスを提供するOML4Rクラス

OML4Rには、インデータベースへのアクセスを提供するクラスが用意されています。Oracle Machine Learningのアルゴリズムデータベース内のOracle Machine Learningアルゴリズムを使用して、データの移動を排除し、データを準備するためにデータベースを活用します。

これらの関数については、次の各トピックで説明します。

OML4Rを使用したデータベース内モデルの構築について
OML4R機械学習インタフェースは、同じデータベース内アルゴリズムを利用してOML4SQL上に構築され、同じアルゴリズム・ハイパーパラメータを使用できます。
モデルの設定について
モデルの特性に影響する設定を指定できます。
共有設定
次の設定は、複数のOML4R機械学習クラスに共通です。
相関ルール
ore.odmAssocRules関数は、Aprioriアルゴリズムを実装することで、高頻度アイテム・セットを検索して相関モデルを生成します。
属性評価モデル
ore.odmAI属性の重要な関数は、ターゲットの予測における重要性に従って属性をランク化します。
デシジョン・ツリー
ore.odmDT関数は、条件付き確率に基づいたデータベース内デシジョン・ツリー・アルゴリズムを使用します。
期待値最大化
ore.odmEM関数は、データベース内の期待値最大化(EM)アルゴリズムを使用するモデルを作成します。
明示的セマンティック分析
ore.odmESA関数は、データベース内の明示的セマンティック分析(ESA)アルゴリズムを使用するモデルを作成します。
指数平滑法モデル
ore.odmESMクラスは、データベース内の指数平滑法モデル(ESM)アルゴリズムを使用してクラスタリング・モデルを作成します。
拡張可能Rアルゴリズム・モデル
ore.odmRAlg関数は、拡張可能Rアルゴリズム・モデルを作成します。
一般化線形モデル
ore.odmGLM関数は一般化線形モデル(GLM)を構築しますが、これは線形モデル(線形回帰)のクラスを含み、このクラスを拡張したものです。
k-Means
ore.odmKM関数はk-Means (KM)アルゴリズムを使用します。このアルゴリズムは、指定した数のクラスタにデータをパーティション化する、距離ベースのクラスタリング・アルゴリズムです。
Naive Bayes
ore.odmNB関数は、データベース内のNaive Bayesモデルを構築します。
ニューラル・ネットワーク・モデル
ore.odmNNクラスは、分類および回帰用のニューラル・ネットワーク(NN)モデルを作成します。ニューラル・ネットワーク・モデルを使用すると、入力と出力との間の複雑な非リニアの関係を取得すること、つまりデータのパターンを見つけることができます。
Non-Negative Matrix Factorization
ore.odmNMF関数は、特徴抽出用にデータベース内のNon-Negative Matrix Factorization (NMF)モデルを構築します。
直交パーティショニング・クラスタ
ore.odmOC関数は、直交パーティショニング・クラスタ(O-Cluster)アルゴリズムを使用してデータベース内モデルを構築します。
パーティション化されたモデル
パーティション化されたモデルは、複数のサブモデル(データの各パーティションに1つ)で構成されるアンサンブル・モデルです。
ランダム・フォレスト・モデル
ore.odmRFクラスは、分類のためのアンサンブル学習手法を提供するデータベース内のランダム・フォレスト(RF)モデルを作成します。
特異値分解
ore.odmSVD関数は、データベース内の特異値分解(SVD)アルゴリズムを使用するモデルを作成します。
サポート・ベクター・マシン
ore.odmSVM関数は、OML4Rのサポート・ベクター・マシン(SVM)モデルを構築します。
テキスト処理モデル
テキスト処理モデルでは、ctx.settings引数を使用してOracle Text属性の設定を指定します。
XGBoostモデル
ore.odmXGBクラスは、分類と回帰の両方をサポートするスケーラブルな勾配ツリー・ブースティング・システムです。これにより、オープン・ソースの勾配ブースティング・フレームワークが使用可能になります。トレーニング・データを準備し、インデータベースXGBoostをコールし、モデルを作成して保持し、予測のためにモデルを適用します。