1.1 23aiでの新機能

Oracle Machine Learning for Python: Oracle Database 23aiでの新機能を示します。

アルゴリズムの拡張

ノート:

新しいアルゴリズム設定: モデル設定およびアルゴリズム固有の設定は、Oracle Database PL/SQLパッケージ・プロシージャおよびタイプ・リファレンスガイドを参照してください。『Oracle Database PL/SQLパッケージ・プロシージャおよびタイプ・リファレンス』ガイドを参照してください。

  • GLMリンク関数

    GLMS_LINK_FUNCTION: この設定を使用すると、ユーザーは、一般化線形モデルを作成するためのリンク関数を指定できます。追加のリンク関数は、Logit、Probit、CloglogおよびCauchitです。「一般化線形モデル」を参照。

  • XGBoost

    制約および生存分析に対するXGBoostサポート用に、次の新しい設定が追加されました。

    ノート:

    XGBoostの設定では大文字と小文字が区別されます。
    • 相互作用制約と単調制約
      • xgboost_interaction_constraints
      • xgboost_decrease_constraints
      • xgboost_increase_constraints
    • 生存分析のサポート
      • objective: survival:aft
      • xgboost_aft_loss_distribution
      • xgboost_aft_loss_distribution_scale
      • xgboost_aft_right_bound_column_name
    Oracle Machine Learningでは、単調制約や相互作用制約などのXGBoost機能と、生存分析用のAFTモデルがサポートされています。「XGBoost」を参照してください。
  • 明示的セマンティック分析 (ESA)

    明示的セマンティック分析の埋込みによる埋込み生成をサポートするために、次の設定が追加されています:

    • ESAS_EMBEDDINGS: 有効にすると、特徴抽出モデルのスコアリング中に埋込みが生成されます。
    • ESAS_EMBEDDING_SIZE: 埋込みを表すベクター・サイズを指定します。

    明示的セマンティック分析(ESA)アルゴリズムの埋込みをサポートします。ESA埋込みにより、ESAモデルを利用して、テキストまたはその他のESA入力の埋込みを生成できます。この機能は、doc2vec (ドキュメントのベクター化表現)と同等です。明示的セマンティック分析を参照してください。

  • 期待値最大化

    EMCS_OUTLIER_RATE: トレーニング・データの外れ値の頻度を識別します。「期待値最大化」を参照してください。

  • 指数平滑法モデル

    時系列回帰モデルとモデル作成の初期値の最適化をサポートする指数平滑法の新しい設定:
    • 複数の時系列

      EXSM_SERIES_LIST: この設定を使用すると、ターゲット系列に加えて最大20個の予測子系列を予測できます。

    • 自動モデル・タイプ検索

      EXSM_INITVL_OPTIMIZE: モデルの作成中に初期値が最適化されるかどうかが決まります。

    指数平滑化は複数時系列モデルの作成をサポートするように拡張され、複数系列作成で時系列回帰が可能です。指数平滑化の動作は、許容可能な時系列モデルを自動的に検索するように変更されています。EXSM_MODEL設定を指定しないと、最適なモデル・タイプをアルゴリズムが自動的に選択できます。これにより、予測がより正確になります。詳細は、「指数平滑法」を参照してください。
  • K-Means

    KMNS_WINSORIZE: この設定では、平均値の周囲の6つの標準偏差のウィンドウ・サイズでデータが制限されます。「k-Means」を参照してください。

一般的な拡張

  • 新しい共有設定
    • ODMS_BOXCOX: この設定では、Box-Cox分散安定化変換を有効にします。

    • ODMS_EXPLOSION_MIN_SUPP: 高カーディナリティのカテゴリ列に対して、より効率的なデータ駆動型エンコーディングが導入されました。展開マッピングのカテゴリ値に必要な最小支持度を定義できます。

    共有設定」を参照してください。

  • 事前トレーニング済モデルからONNX形式への変換

    OML4Pyでは、Hugging Faceからのテキスト・トランスフォーマを、ONNX形式のモデルに変換することで使用できるようになります。OML4Pyにより、必要なトークン化および後処理も追加されます。結果となるONNXパイプラインは、その後、データベースにインポートされます。また、AIベクトル検索用の埋込みの生成に使用できます。「事前トレーニング済モデルからONNX形式への変換」を参照してください。

  • データ系統を含むモデル

    データベース内MLモデルでは、作成データを指定するために実行された問合せ文字列が、モデルのメタデータ内に記録されるようになりました。all/user/dba_mining_modelsビュー内のbuild_sourceパラメータでは、ユーザーが、モデルの生成に使用されたデータ問合せを把握できます。ALL_MINING_MODELSを参照してください。

  • パーティション化モデルのパフォーマンスの向上

    パーティション数が多いパーティション化モデルのパフォーマンス、およびパーティション・モデル内の個々のモデルの削除パフォーマンスが向上しました。パーティション化されたモデルの詳細は、パーティション化されたモデルでのDDLを参照してください。

  • 表内の列数が4000:

    データベース表に4,096列まで含めることができるようになりました。この機能はワイド・テーブルと呼ばれます。Oracleデータベースに対してワイド・テーブルを有効または無効にするには、MAX_COLUMNSパラメータを使用します。MAX_COLUMNSを参照してください。