Oracle Machine Learning for SQL概要』のこのリリースでの変更点

これは、Oracle Database 23aiの『Oracle Machine Learning for SQL概要』における重要な変更の要約です。

23aiでの新機能

Oracle Database 23aiのOracle Machine Learning for SQLの新機能と拡張機能は次のとおりです。

新機能

  • ONNX形式モデルの統合

    Oracle Machine Learning for SQLでは、ONNX Runtimeの統合によりONNX形式のモデルがサポートされています。詳細は、Oracle Machine Learning for SQLユーザーズ・ガイドを参照してください。

  • 新しいテクニック: 埋込み

    埋込みと呼ばれる新しい手法が導入されました。詳細は、「埋込み」を参照してください。

機能拡張

  • GLMリンク関数

    ロジスティック回帰のための追加の一般化線形モデル(GLM)リンク関数をサポートします。追加のリンク関数は、Logit、Probit、CloglogおよびCauchitです。「一般化線形モデルとは」を参照してください

  • 制約および生存分析に対するXGBoostサポート

    Oracle Machine Learningでは、単調制約や相互作用制約などのXGBoost機能と、生存分析用のAFTモデルがサポートされています。「XGBoost機能制約」および「XGBoost AFTモデル」を参照してください。

  • ESAを介した埋込み

    明示的セマンティック分析(ESA)アルゴリズムの埋込みをサポートします。ESA埋込みにより、ESAモデルを利用して、テキストまたはその他のESA入力の埋込みを生成できます。この機能は、doc2vec (ドキュメントのベクター化表現)と同等です。「明示的セマンティック分析とは」を参照してください。

  • 複数の時系列および時系列回帰

    指数平滑化アルゴリズムの複数時系列機能を使用すると、多変数時系列入力および休日フラグやプロモーション・フラグなどのインジケータ・データを含む時系列回帰モデルを簡単に構築できます。詳細は、複数の時系列モデルおよび時系列回帰を参照してください。

  • ブールのサポート

    Oracle Machine Learningでは、BOOLEANデータ型がサポートされます。『Oracle Machine Learning for SQLユーザーズ・ガイド』「列のデータ型の変換」「量的、質的および非構造化テキスト」および「ターゲット属性」を参照してください。

  • 期待値最大化による異常検出

    OML4SQLは、分布ベースの異常検出の期待値最大化(EM)異常をサポートしています。「確率密度推定」、「異常検出の期待値最大化」および「異常検出アルゴリズム」を参照してください。モデルの設定は、「DBMS_DATA_MINING - アルゴリズムの設定: 期待値最大化」を参照してください。

  • 自動時系列モデル検索

    EXSM_MODEL設定を指定しないと、最適なモデル・タイプをアルゴリズムが自動的に選択できます。これにより、予測がより正確になります。「自動時系列モデル検索」を参照してください。

  • データベース表での4000列のサポート

    データベース表に4,096列まで含めることができるようになりました。この機能はワイド・テーブルと呼ばれます。Oracleデータベースに対してワイド・テーブルを有効または無効にするには、MAX_COLUMNSパラメータを使用します。MAX_COLUMNSを参照してください。

  • データ系統を含むモデル

    OML4SQLでは、作成データを指定するために実行された問合せ文字列をモデルのメタデータ内に記録します。all/user/dba_mining_modelsビューのbuild_source列により、モデルの生成に使用されたデータ問合せをユーザーが知ることができます。ALL_MINING_MODELSを参照してください。

  • パーティション化モデルのパフォーマンスの向上

    パーティション数が多いパーティション化モデルのパフォーマンス、およびパーティション・モデル内の個々のモデルの削除パフォーマンスが向上しました。パーティション化モデルの詳細は、パーティション化モデルについてを参照してください。

  • 特徴抽出アルゴリズムのベクトル出力

    Oracle Machine Learningでは、特徴抽出アルゴリズムのVECTORデータ型およびVECTOR_EMBEDDING演算子の拡張がサポートされており、密度が高く特徴が多いデータを処理する効率が大幅に改善され、ユーザーのベクトルベースの操作へのアクセスおよび効率が向上しています。詳細は、「特徴抽出とスコアリング」を参照してください。

ディクショナリ設定、PL/SQLパッケージおよびSQL関数の変更

ディクショナリ・ビューの設定

embeddingという新しい関数とアルゴリズムONNXがALL_MINING_MODELSビューに追加されました。詳細は、Oracle Databaseリファレンスを参照してください。埋込みモデルのターゲット属性をサポートするために、新しい属性タイプVECTORが追加されました。詳細は、Oracle Databaseリファレンスの「ALL_MINING_MODEL_ATTRIBUTES」を参照してください。

PL/SQLパッケージの変更

PL/SQLパッケージ固有の情報は、『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』ガイドを参照してください。

  • ONNX形式のモデルをロードおよび削除するための新しいプロシージャが導入されました: IMPORT_ONNX_MODELSLOAD_ONNX_MODELSおよびDROP_ONNX_MODEL

  • GLMS_LINK_FUNCTION: この設定を使用すると、ユーザーは、一般化線形モデルを作成するためのリンク関数を指定できます。「DBMS_DATA_MINING - アルゴリズムの設定: 一般化線形モデル」を参照してください。

  • 制約および生存分析に対するXGBoostサポート用に、次の新しい設定が追加されました。

    ノート:

    XGBoostの設定では大文字と小文字が区別されます。
    • xgboost_interaction_constraints
    • xgboost_decrease_constraints
    • xgboost_increase_constraints
    • objective: survival:aft
    • xgboost_aft_loss_distribution
    • xgboost_aft_loss_distribution_scale
    • xgboost_aft_right_bound_column_name
    「DBMS_DATA_MINING - アルゴリズムの設定: XGBoost」を参照してください。
  • 明示的セマンティック分析の埋込みをサポートするために、次の設定が追加されています。
    • ESAS_EMBEDDINGS: 有効にすると、特徴抽出モデルのスコアリング中に埋込みが生成されます。
    • ESAS_EMBEDDING_SIZE: 埋込みを表すベクター・サイズを指定します。

    「DBMS_DATA_MINING - アルゴリズムの設定: 明示的セマンティック分析」を参照してください。

  • EMCS_OUTLIER_RATE: トレーニング・データの外れ値の頻度を識別します。「DBMS_DATA_MINING - アルゴリズムの設定: 期待値の最大化」を参照してください
  • 時系列回帰モデルとモデル作成の初期値の最適化をサポートする指数平滑法の新しい設定:
    • EXSM_SERIES_LIST: この設定を使用すると、ターゲット系列に加えて最大20個の予測子系列を予測できます。
    • EXSM_INITVL_OPTIMIZE: モデルの作成中に初期値が最適化されるかどうかが決まります。
    「DBMS_DATA_MINING - アルゴリズムの設定: 指数平滑法」を参照してください。
  • KMNS_WINSORIZE: この設定では、平均値の周囲の6つの標準偏差のウィンドウ・サイズでデータが制限されます。「DBMS_DATA_MINING - アルゴリズムの設定: k-Means」を参照してください。

  • 新しいグローバル設定:
    • ODMS_BOXCOX: この設定では、Box-Cox分散安定化変換を有効にします。

    • ODMS_EXPLOSION_MIN_SUPP: 高カーディナリティのカテゴリ列に対して、より効率的なデータ駆動型エンコーディングが導入されました。展開マッピングのカテゴリ値に必要な最小支持度を定義できます。

    「DBMS_DATA_MINING - グローバル設定」を参照してください。

新しいSQL関数

ONNX埋込みモデルから推論するには、VECTOR_EMBEDDINGを使用します。このSQLスコアリング関数については、VECTOR_EMBEDDINGを参照してください。

その他の変更

これは、23aiの『Oracle Machine Learning for SQL概要』のその他の変更の要約です

ドキュメント全体で、短い説明が更新され、読みやすくするための軽微な編集が行われています。