9.3 共有設定

次に示す設定は、すべてのOML4Py機械学習クラスに共通です。

次の表は、すべてのOML4Pyモデルで共有される設定のリストです。

表9-1 モデルの共有設定

設定名 設定値 説明

ODMS_DETAILS

ODMS_ENABLE

ODMS_DISABLE

データベースでのモデル・サイズの制御に役立ちます。モデルの詳細では、特にパーティション化されたモデルで大量のディスク領域が消費される可能性があります。デフォルト値はODMS_ENABLEです。

設定値がODMS_ENABLEの場合、モデル詳細の表およびビューがモデルとともに作成されます。モデル詳細は、SQLを使用して問合せできます。

値がODMS_DISABLEの場合、モデル詳細表は作成されず、モデル詳細に関連する表も作成されません。

削減される領域はアルゴリズムに応じて異なります。約10倍のモデル・サイズの削減が可能です。

ODMS_MAX_PARTITIONS

1 < value <= 1000000

パーティション化されたモデルで許可されるパーティションの最大数を制御します。デフォルトは1000です。

ODMS_MISSING_VALUE_TREATMENT

ODMS_MISSING_VALUE_AUTO

ODMS_MISSING_VALUE_MEAN_MODE

ODMS_MISSING_VALUE_DELETE_ROW

トレーニング・データでの欠損値を処理する方法を示します。この設定は、スコアリング・データに影響を与えません。デフォルト値は、ODMS_MISSING_VALUE_AUTOです。

ODMS_MISSING_VALUE_MEAN_MODEでは、欠損値は、作成時と適用時に、適宜平均値(量的属性)または最頻値(質的属性)に置き換えられます。ODMS_MISSING_VALUE_AUTOでは、アルゴリズムごとに異なる計画が実行されます。

ODMS_MISSING_VALUE_TREATMENTODMS_MISSING_VALUE_DELETE_ROWに設定すると、欠損値を含むトレーニング・データの行は削除されます。ただし、スコアリング・データにおいてこのような欠損値の処理を行うには、明示的に変換を実行する必要があります。

ODMS_MISSING_VALUE_DELETE_ROWは、すべてのアルゴリズムに適用できます。

ODMS_PARTITION_BUILD_TYPE

ODMS_PARTITION_BUILD_INTRA

ODMS_PARTITION_BUILD_INTER

ODMS_PARTITION_BUILD_HYBRID

パーティション化されたモデルのパラレル作成を制御します。

ODMS_PARTITION_BUILD_INTRAでは、すべてのスレーブを使用して各パーティションがパラレルで作成されます。

ODMS_PARTITION_BUILD_INTERでは、各パーティションが1つのスレーブのみで作成されますが、複数のスレーブがアクティブであるため、複数のパーティションを同時に作成できます。

ODMS_PARTITION_BUILD_HYBRIDは他の2つのタイプの組合せであり、多くの状況で動的環境に適応するためにお薦めします。これはデフォルト値です。

ODMS_PARTITION_COLUMNS

機械学習属性のカンマ区切りのリスト

パーティション化されたモデルの作成を要求します。設定値は、リスト内のパーティション・キーの値を決定するために使用される機械学習の属性のカンマ区切りリストです。XFORM_LISTパラメータがモデルに渡されていないかぎり、これらの属性は入力列から取得されます。XFORM_LISTパラメータがモデルに渡された場合、これらの変換によって生成された属性から属性が取得されます。

ODMS_TABLESPACE_NAME

tablespace_name

モデルを格納する表領域を指定します。

これを(十分な割当て制限を持っている)表領域の名前に明示的に設定すると、指定した表領域の記憶域によって結果のモデルの内容が作成されます。この設定を指定しない場合、デフォルトの表領域によって結果のモデルの内容が作成されます。

ODMS_SAMPLE_SIZE

0 < value

サンプリングするおおよその行数を決定します。この設定は、ODMS_SAMPLINGが有効である場合にのみ使用できます。デフォルト値は、システムによって決定されます。

ODMS_SAMPLING

ODMS_SAMPLING_ENABLE

ODMS_SAMPLING_DISABLE

ビルド・データのサンプリングの要求をユーザーに許可します。デフォルトはODMS_SAMPLING_DISABLEです。

ODMS_TEXT_MAX_FEATURES

1 <= value

モデルに渡されたドキュメント・セットから使用する、すべてのテキスト属性間の個別特徴の最大数。デフォルトは3000です。oml.esaモデルのデフォルト値は300000です。

ODMS_TEXT_MIN_DOCUMENTS

負でない値

このテキスト処理設定では、あるトークンがいくつのドキュメントに出現すればそれを特徴として使用できるかが制御されます。

デフォルトは1です。oml.esaモデルのデフォルト値は3です。

ODMS_TEXT_POLICY_NAME

CTX_DDL.CREATE_POLICYを使用して作成された、Oracle Textポリシーの名前。

非構造化テキストからの個々のトークンの抽出方法に影響を与える。

CTX_DDL.CREATE_POLICYの詳細は、『Oracle Textリファレンス』を参照してください。

PREP_AUTO

PREP_AUTO_ON

PREP_AUTO_OFF

このデータ準備設定により、完全自動データ準備が有効になります。

デフォルトはPREP_AUTO_ONです。

PREP_SCALE_2DNUM

PREP_SCALE_STDDEV

PREP_SCALE_RANGE

このデータ準備設定により、2次元数値列のスケーリングのデータ準備が有効になります。この変更を有効にするには、PREP_AUTOOFFにする必要があります。次は、返される値です。

PREP_SCALE_STDDEV: 列の値を列の標準偏差で割る要求であり、多くの場合PREP_SHIFT_MEANとともに指定されてz-スコアによる正規化が行われます。

PREP_SCALE_RANGE: 列の値を値の範囲で割る要求であり、多くの場合PREP_SHIFT_MINとともに指定されて[0,1]の範囲が得られます。

PREP_SCALE_NNUM

PREP_SCALE_MAXABS

このデータ準備設定により、ネストした数値列のスケーリングのデータ準備が有効になります。この変更を有効にするには、PREP_AUTOOFFにする必要があります。指定した場合、この設定の有効な値はPREP_SCALE_MAXABSで、これによって[-1,1]の範囲のデータが得られます。

PREP_SHIFT_2DNUM

PREP_SHIFT_MEAN

PREP_SHIFT_MIN

このデータ準備設定により、2次元数値列のセンタリングのデータ準備が有効になります。この変更を有効にするには、PREP_AUTOOFFにする必要があります。次は、返される値です。

PREP_SHIFT_MEAN: 各値から列の平均が差し引かれます。

PREP_SHIFT_MIN: 各値から列の最小値が差し引かれます。