Oracle Machine Learning for Rのこのリリースでの変更点

この項では、現在のリリースでOracle Machine Learning for R (OML4R)に加えられた変更および追加について説明します。

23aiの新機能

Oracle Machine Learning for R: Oracle Database 23aiでの新機能です。

アルゴリズムの拡張

ノート:

新しいアルゴリズム設定: モデル設定およびアルゴリズム固有の設定は、『Oracle Database PL/SQLパッケージ・プロシージャおよびタイプ・リファレンス』ガイドを参照してください。『Oracle Database PL/SQLパッケージ・プロシージャおよびタイプ・リファレンス』ガイドを参照してください。
  • ニューラル・ネットワーク

    ore.odmNNクラスは、分類および回帰のためのニューラル・ネットワーク(NN)モデルを表し、それを作成できます。このクラスは、データベース内のニューラル・ネットワーク・アルゴリズムを公開することで、ore.neuralを置き換えます。ニューラル・ネットワーク・モデルを使用すると、入力と出力との間の複雑な非リニアの関係を取得すること、つまりデータのパターンを見つけることができます。「ニューラル・ネットワーク・モデル」を参照してください。

  • ランダム・フォレスト

    ore.odmRFクラスは、分類のためのアンサンブル学習手法を提供するランダム・フォレスト(RF)モデルを表し、それを作成できます。このクラスは、データベース内のランダム・フォレスト・アルゴリズムを公開することで、ore.randomForestを置き換えます。「ランダム・フォレスト・モデル」を参照してください。

  • 指数平滑法モデル

    ore.odmESMクラスは、時系列予測に対する指数平滑法モデル(ESM)アルゴリズムを表し、それを作成できます。このクラスは、データベース内の指数平滑法アルゴリズムを公開することで、ore.esmを置き換えます。「指数平滑法モデル」を参照してください。

  • XGBoostモデル

    ore.odmXGBクラスは、分類、回帰および生存分析をサポートするスケーラブルな勾配ブースティング木システムを使用して、XGBoostモデルを表し、それを作成できます。「XGBoostモデル」を参照してください。

  • GLMリンク関数

    ロジスティック回帰のための追加の一般化線形モデル(GLM)リンク関数をサポートします。Logitに加えて、新しいリンク機能にはProbit、Cloglog、Cauchitなどがあります。「一般化線形モデル」を参照してください。

    次の設定により、ユーザーはGLMモデルを構築するためのリンク機能を指定できます。リンク・ファンクションはマイニング機能に固有です。

    分類の場合は、次の設定を適用できます:

    • GLMS_LOGIT_LINK (デフォルト)
    • GLMS_PROBIT_LINK
    • GLMS_CLOGLOG_LINK
    • GLMS_CAUCHIT_LINK

    回帰の場合は、次の設定を適用できます: GLMS_IDENTITY_LINK (デフォルト)

    表6-10を参照してください。

  • 制約および生存分析に対するXGBoostサポート

    XGBoostでは、単調制約と相互作用制約、および生存分析のためのAFTモデルがサポートされています。「XGBoostモデル」を参照してください。

    制約および生存分析に対するXGBoostのサポートのために、次の新しい設定が追加されました:

    ノート:

    XGBoostの設定では大文字と小文字が区別されます。
    • xgboost_interaction_constraints
    • xgboost_decrease_constraints
    • xgboost_increase_constraints
    • objective: survival:aft
    • xgboost_aft_loss_distribution
    • xgboost_aft_loss_distribution_scale
    • xgboost_aft_right_bound_column_name
    表6-23を参照してください。
  • ESAを介した埋込み

    明示的セマンティック分析(ESA)アルゴリズムの埋込みをサポートし、ESAモデルを使用してテキストおよびその他のESA入力の埋込みを生成できます。この機能は、doc2vec (ドキュメントのベクター化表現)と同等です。明示的セマンティック分析を参照してください。

    明示的なセマンティック分析の埋込みをサポートするために、次の新しい設定が追加されました。

    • ESAS_EMBEDDINGS: 有効にすると、特徴抽出モデルのスコアリング中に埋込みが生成されます。
    • ESAS_EMBEDDING_SIZE: 埋込みを表すベクター・サイズを指定します。

    表6-7を参照してください。

  • 時系列回帰

    指数平滑法アルゴリズムの複数時系列機能を使用して、時系列回帰モデルを構築するためのデータを準備できます。「指数平滑法モデル」を参照してください。

    トレーニング・データの外れ値の頻度を識別するために、次の設定が追加されました: EMCS_OUTLIER_RATE表6-6を参照してください。

    拡張された時系列予測をサポートするために、次の新しい設定が追加されました。

    • EXSM_SERIES_LIST: この設定を使用すると、ターゲット系列に加えて最大20個の予測子系列を予測できます。
    • EXSM_INITVL_OPTIMIZE: モデルの作成中に初期値が最適化されるかどうかが決まります。
    表6-8を参照してください。
  • k-Means

    平均値を中心とした6個の標準偏差のウィンドウ・サイズでデータを制限するために、次の新しい設定が追加されました: KMNS_WINSORIZE

    表6-11を参照してください。

  • 自動時系列モデル検索

    EXSM_MODEL設定を指定しない場合に、指数平滑法アルゴリズムで最適なモデル・タイプが自動的に選択されます。これにより、予測がより正確になります。このアルゴリズムは、許容可能な時系列モデルを自動的に検索します。「指数平滑法モデル」を参照してください。

一般的な機能拡張

モデル設定およびアルゴリズム固有の設定は、『Oracle Database PL/SQLパッケージ・プロシージャおよびタイプ・リファレンス』ガイドを参照してください。

  • 新しい共有設定

    共有設定に次の新しい設定が追加されました:

    • ODMS_BOXCOX: この設定では、Box-Cox分散安定化変換を有効にします。

    • ODMS_EXPLOSION_MIN_SUPP: データ駆動型の高カーディナリティのカテゴリ列に対して、より効率的な展開データ準備が導入されました。展開マッピングのカテゴリ値に必要な最小支持度を定義できます。

    表6-3を参照してください。

  • データ系統を含むモデル

    データベース内モデルでは、ビルド・データの指定に使用されたモデルのメタデータ内に問合せ文字列が記録されるようになりました。all_mining_models、user_mining_models、dba_mining_modelsビュー内のbuild_sourceパラメータでは、モデルの生成に使用されたデータ問合せを表示できます。ALL_MINING_MODELSを参照してください。

  • パーティション化モデルのパフォーマンスの向上

    パーティション数が多いパーティション化モデルのパフォーマンス、およびパーティション・モデル内の個々のモデルの削除パフォーマンスが向上しました。「パーティション化されたモデル」を参照してください。

  • 表内の列数が4000

    データベース表に4,096列まで含めることができるようになりました。この機能はワイド・テーブルと呼ばれます。Oracleデータベースに対してワイド・テーブルを有効または無効にするには、MAX_COLUMNSパラメータを使用します。MAX_COLUMNSを参照してください。