『Oracle Machine Learning for SQL概要』のこのリリースでの変更点
これは、Oracle Database 23aiの『Oracle Machine Learning for SQL概要』における重要な変更の要約です。
23aiでの新機能
Oracle Database 23aiのOracle Machine Learning for SQLの新機能と拡張機能は次のとおりです。
新機能
- ONNX形式モデルの統合
Oracle Machine Learning for SQLでは、ONNX Runtimeの統合によりONNX形式のモデルがサポートされています。詳細は、『Oracle Machine Learning for SQLユーザーズ・ガイド』を参照してください。
-
新しいテクニック: 埋込み
埋込みと呼ばれる新しい手法が導入されました。詳細は、「埋込み」を参照してください。
機能拡張
-
ロジスティック回帰のための追加の一般化線形モデル(GLM)リンク関数をサポートします。追加のリンク関数は、Logit、Probit、CloglogおよびCauchitです。「一般化線形モデルとは」を参照してください
-
Oracle Machine Learningでは、単調制約や相互作用制約などのXGBoost機能と、生存分析用のAFTモデルがサポートされています。「XGBoost機能制約」および「XGBoost AFTモデル」を参照してください。
-
明示的セマンティック分析(ESA)アルゴリズムの埋込みをサポートします。ESA埋込みにより、ESAモデルを利用して、テキストまたはその他のESA入力の埋込みを生成できます。この機能は、doc2vec (ドキュメントのベクター化表現)と同等です。「明示的セマンティック分析とは」を参照してください。
-
複数の時系列および時系列回帰
指数平滑化アルゴリズムの複数時系列機能を使用すると、多変数時系列入力および休日フラグやプロモーション・フラグなどのインジケータ・データを含む時系列回帰モデルを簡単に構築できます。詳細は、複数の時系列モデルおよび時系列回帰を参照してください。
-
Oracle Machine Learningでは、
BOOLEAN
データ型がサポートされます。『Oracle Machine Learning for SQLユーザーズ・ガイド』の「列のデータ型の変換」、「量的、質的および非構造化テキスト」および「ターゲット属性」を参照してください。 -
OML4SQLは、分布ベースの異常検出の期待値最大化(EM)異常をサポートしています。「確率密度推定」、「異常検出の期待値最大化」および「異常検出アルゴリズム」を参照してください。モデルの設定は、「DBMS_DATA_MINING - アルゴリズムの設定: 期待値最大化」を参照してください。
-
EXSM_MODEL
設定を指定しないと、最適なモデル・タイプをアルゴリズムが自動的に選択できます。これにより、予測がより正確になります。「自動時系列モデル検索」を参照してください。 -
データベース表での4000列のサポート
データベース表に4,096列まで含めることができるようになりました。この機能はワイド・テーブルと呼ばれます。Oracleデータベースに対してワイド・テーブルを有効または無効にするには、
MAX_COLUMNS
パラメータを使用します。MAX_COLUMNSを参照してください。 -
OML4SQLでは、作成データを指定するために実行された問合せ文字列をモデルのメタデータ内に記録します。
all/user/dba_mining_models
ビューのbuild_source
列により、モデルの生成に使用されたデータ問合せをユーザーが知ることができます。ALL_MINING_MODELS
を参照してください。 - パーティション化モデルのパフォーマンスの向上
パーティション数が多いパーティション化モデルのパフォーマンス、およびパーティション・モデル内の個々のモデルの削除パフォーマンスが向上しました。パーティション化モデルの詳細は、パーティション化モデルについてを参照してください。
- 特徴抽出アルゴリズムのベクトル出力
Oracle Machine Learningでは、特徴抽出アルゴリズムの
VECTOR
データ型およびVECTOR_EMBEDDING
演算子の拡張がサポートされており、密度が高く特徴が多いデータを処理する効率が大幅に改善され、ユーザーのベクトルベースの操作へのアクセスおよび効率が向上しています。詳細は、「特徴抽出とスコアリング」を参照してください。
ディクショナリ設定、PL/SQLパッケージおよびSQL関数の変更
ディクショナリ・ビューの設定
embedding
という新しい関数とアルゴリズムONNX
がALL_MINING_MODELSビューに追加されました。詳細は、『Oracle Databaseリファレンス』を参照してください。埋込みモデルのターゲット属性をサポートするために、新しい属性タイプVECTOR
が追加されました。詳細は、『Oracle Databaseリファレンス』の「ALL_MINING_MODEL_ATTRIBUTES」を参照してください。
PL/SQLパッケージの変更
PL/SQLパッケージ固有の情報は、『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』ガイドを参照してください。
-
ONNX形式のモデルをロードおよび削除するための新しいプロシージャが導入されました:
IMPORT_ONNX_MODELS
、LOAD_ONNX_MODELS
およびDROP_ONNX_MODEL
-
GLMS_LINK_FUNCTION
: この設定を使用すると、ユーザーは、一般化線形モデルを作成するためのリンク関数を指定できます。「DBMS_DATA_MINING - アルゴリズムの設定: 一般化線形モデル」を参照してください。 - 制約および生存分析に対するXGBoostサポート用に、次の新しい設定が追加されました。
ノート:
XGBoostの設定では大文字と小文字が区別されます。xgboost_interaction_constraints
xgboost_decrease_constraints
xgboost_increase_constraints
objective
:survival:aft
xgboost_aft_loss_distribution
xgboost_aft_loss_distribution_scale
xgboost_aft_right_bound_column_name
- 明示的セマンティック分析の埋込みをサポートするために、次の設定が追加されています。
ESAS_EMBEDDINGS
: 有効にすると、特徴抽出モデルのスコアリング中に埋込みが生成されます。ESAS_EMBEDDING_SIZE
: 埋込みを表すベクター・サイズを指定します。
EMCS_OUTLIER_RATE
: トレーニング・データの外れ値の頻度を識別します。「DBMS_DATA_MINING - アルゴリズムの設定: 期待値の最大化」を参照してください- 時系列回帰モデルとモデル作成の初期値の最適化をサポートする指数平滑法の新しい設定:
EXSM_SERIES_LIST
: この設定を使用すると、ターゲット系列に加えて最大20個の予測子系列を予測できます。EXSM_INITVL_OPTIMIZE
: モデルの作成中に初期値が最適化されるかどうかが決まります。
-
KMNS_WINSORIZE
: この設定では、平均値の周囲の6つの標準偏差のウィンドウ・サイズでデータが制限されます。「DBMS_DATA_MINING - アルゴリズムの設定: k-Means」を参照してください。 - 新しいグローバル設定:
-
ODMS_EXPLOSION_MIN_SUPP
: 高カーディナリティのカテゴリ列に対して、より効率的なデータ駆動型エンコーディングが導入されました。展開マッピングのカテゴリ値に必要な最小支持度を定義できます。
「DBMS_DATA_MINING - グローバル設定」を参照してください。
新しいSQL関数
ONNX埋込みモデルから推論するには、VECTOR_EMBEDDING
を使用します。このSQLスコアリング関数については、VECTOR_EMBEDDINGを参照してください。