4.1 機械学習のクラスとアルゴリズムについて
次に示すクラスは、データベース内機械学習アルゴリズムへのアクセスを提供します。
アルゴリズム・クラス
クラス | アルゴリズム | アルゴリズムの機能 | 説明 |
---|---|---|---|
ore.odmAI |
最小記述長 |
分類または回帰の属性評価 |
ターゲットの予測における重要度に従って属性をランク付けします。 |
ore.odmAssocRules |
Apriori |
相関ルール |
あるセット内で同時発生する項目(高頻度項目セット)を識別することにより、マーケット・バスケット分析を行います。 |
ore.odmDT |
デシジョン・ツリー |
分類 |
人間が理解可能なルールの形式で予測情報を抽出します。 このルールはif-then-else式で、予測を導く決定を示す。 |
ore.odmEM |
期待値の最大化 |
クラスタリング | 密度推定アルゴリズムに基づいて確率的クラスタリングを実行します。 |
ore.odmESA |
明示的セマンティック分析 |
特徴抽出 |
ドキュメントのコーパスからテキストベースの特徴を抽出します。 ドキュメントの類似度比較を実行します。 |
ore.odmGLM |
一般化線形モデル |
分類 回帰 |
2項ターゲットの分類用にロジスティック回帰を実装し、連続的ターゲット用に線形回帰を実装します。 |
ore.odmKM |
k-Means |
クラスタリング |
教師なし学習を使用し、類似度に基づいて、事前に決められた数のクラスタにデータをグループ化します。 |
ore.odmNB |
Naive Bayes |
分類 |
データで観測された、基礎となる根拠から予測の確率を導き出すことによって予測を行います。 |
ore.odmNN |
ニューラル・ネットワーク |
分類 回帰 |
例から学習し、学習プロセス中にニューロン間の接続の重みをチューニングします。 |
ore.odmRF |
ランダム・フォレスト |
分類 |
データを分類するためのアンサンブル学習手法を提供します。 |
ore.odmSVD |
特異値分解 |
特徴抽出 |
矩形マトリックスを3つのマトリックスに分解することで、基礎となるデータの分散を取得する直交線形変換を実行します。 |
ore.odmSVM |
サポート・ベクター・マシン |
異常検出 分類 回帰 |
クラスのプロファイルであるモデルを構築します。モデルが適用されると、そのプロファイルとなんらかの形で異なるケースを識別します。 |
ore.odmNMF |
Non-Negative Matrix Factorization |
特徴抽出 |
多数の属性があり、これらの属性があいまいであるか、予測可能性が低い場合に使用される、最先端の特徴抽出アルゴリズム。 |
ore.odmXGB |
XGBoost |
分類 回帰 |
スタンドアロンの予測子として使用することも、広告クリックスルー率の予測、ハザード・リスクの予測、Webテキスト分類といった幅広い問題に対処するために、実際の生産パイプラインに組み込むこともできます。 |
モデルの永続化
OML4R APIを使用して作成されたデータベース内モデルは、次のいずれかのアクションを実行しないかぎり、データベース接続が終了したときに削除される一時オブジェクトとして存在します:
- 次の例のように、デフォルトの名前のモデル・オブジェクトをデータストアに保存します。
regr2 = ore.odmGLM("regression") ore.save(regr2, name = 'regression2', overwrite=TRUE)
- 次の例に示すように、モデルを構築するときに
model_name
パラメータを使用して、データベース内モデル・プロキシ・オブジェクトに明示的に名前を付けます:ore.drop(model='RF_CLASSIFICATION_MODEL') settings = list(RFOR_MTRY = 3, model_name="RF_CLASSIFICATION_MODEL") MOD2 <- ore.odmRF(AFFINITY_CARD~., DEMO_DF.train, odm.settings= settings) MOD2$name
- 次の例のように、モデルの
model_name
関数を使用して既存のモデルの名前を変更します。regr2(model_name = 'myRegression2')
永続的な名前付きモデルを削除するには、oml.drop
関数を使用します。
モデルを使用した新しいデータのスコアリング
ほとんどのOML4R機械学習クラスでは、モデル・オブジェクトのpredict
メソッドを使用して新しいデータをスコアリングできます。
データベース内モデルについては、データベース内で直接スコアリングするSQL PREDICTION
関数をモデル・プロキシ・オブジェクトで使用できます。 データを適切に準備すれば、データベース内モデルをSQLから直接使用できます。 オープン・ソース・モデルでは、Embedded R Executionを使用して、パフォーマンスとスケーラビリティのためにデータ・パラレル実行を有効にできます。
REST APIを介したモデルのデプロイ
Oracle Machine Learning ServicesのREST APIは、Oracle Autonomous DatabaseインスタンスでホストされるRESTエンドポイントを提供します。 これらのエンドポイントを使用すると、OMLモデルをそのメタデータとともに格納し、モデルのスコアリング・エンドポイントを作成できます。
親トピック: リファレンス