共有設定

前次このコンテンツを正しく表示するにはJavaScriptを有効にする必要があります

9.3 共有設定

次に示す設定は、すべてのOML4Py機械学習クラスに共通です。

次の表は、すべてのOML4Pyモデルで共有される設定のリストです。

表9-1 モデルの共有設定

設定名	設定値	説明
`ODMS_DETAILS`	`ODMS_ENABLE` `ODMS_DISABLE`	データベースでのモデル・サイズの制御に役立ちます。モデルの詳細では、特にパーティション化されたモデルで大量のディスク領域が消費される可能性があります。デフォルト値は`ODMS_ENABLE`です。設定値が`ODMS_ENABLE`の場合、モデル詳細の表およびビューがモデルとともに作成されます。モデル詳細は、SQLを使用して問合せできます。値が`ODMS_DISABLE`の場合、モデル詳細表は作成されず、モデル詳細に関連する表も作成されません。削減される領域はアルゴリズムに応じて異なります。約10倍のモデル・サイズの削減が可能です。
`ODMS_MAX_PARTITIONS`	`1 < value <= 1000000`	パーティション化されたモデルで許可されるパーティションの最大数を制御します。デフォルトは`1000`です。
`ODMS_MISSING_VALUE_TREATMENT`	`ODMS_MISSING_VALUE_AUTO` `ODMS_MISSING_VALUE_MEAN_MODE` `ODMS_MISSING_VALUE_DELETE_ROW`	トレーニング・データでの欠損値を処理する方法を示します。この設定は、スコアリング・データに影響を与えません。デフォルト値は、`ODMS_MISSING_VALUE_AUTO`です。 `ODMS_MISSING_VALUE_MEAN_MODE`では、欠損値は、作成時と適用時に、適宜平均値(量的属性)または最頻値(質的属性)に置き換えられます。`ODMS_MISSING_VALUE_AUTO`では、アルゴリズムごとに異なる計画が実行されます。 `ODMS_MISSING_VALUE_TREATMENT`を`ODMS_MISSING_VALUE_DELETE_ROW`に設定すると、欠損値を含むトレーニング・データの行は削除されます。ただし、スコアリング・データにおいてこのような欠損値の処理を行うには、明示的に変換を実行する必要があります。値`ODMS_MISSING_VALUE_DELETE_ROW`は、すべてのアルゴリズムに適用できます。
`ODMS_PARTITION_BUILD_TYPE`	`ODMS_PARTITION_BUILD_INTRA` `ODMS_PARTITION_BUILD_INTER` `ODMS_PARTITION_BUILD_HYBRID`	パーティション化されたモデルのパラレル作成を制御します。 `ODMS_PARTITION_BUILD_INTRA`では、すべてのスレーブを使用して各パーティションがパラレルで作成されます。 `ODMS_PARTITION_BUILD_INTER`では、各パーティションが1つのスレーブのみで作成されますが、複数のスレーブがアクティブであるため、複数のパーティションを同時に作成できます。 `ODMS_PARTITION_BUILD_HYBRID`は他の2つのタイプの組合せであり、多くの状況で動的環境に適応するためにお薦めします。これはデフォルト値です。
`ODMS_PARTITION_COLUMNS`	機械学習属性のカンマ区切りのリスト	パーティション化されたモデルの作成を要求します。設定値は、リスト内のパーティション・キーの値を決定するために使用される機械学習の属性のカンマ区切りリストです。`XFORM_LIST`パラメータがモデルに渡されていないかぎり、これらの属性は入力列から取得されます。`XFORM_LIST`パラメータがモデルに渡された場合、これらの変換によって生成された属性から属性が取得されます。
`ODMS_TABLESPACE_NAME`	tablespace_name	モデルを格納する表領域を指定します。これを(十分な割当て制限を持っている)表領域の名前に明示的に設定すると、指定した表領域の記憶域によって結果のモデルの内容が作成されます。この設定を指定しない場合、デフォルトの表領域によって結果のモデルの内容が作成されます。
`ODMS_SAMPLE_SIZE`	`0 < value`	サンプリングするおおよその行数を決定します。この設定は、`ODMS_SAMPLING`が有効である場合にのみ使用できます。デフォルト値は、システムによって決定されます。
`ODMS_SAMPLING`	`ODMS_SAMPLING_ENABLE` `ODMS_SAMPLING_DISABLE`	ビルド・データのサンプリングの要求をユーザーに許可します。デフォルトは`ODMS_SAMPLING_DISABLE`です。
`ODMS_TEXT_MAX_FEATURES`	`1 <= value`	モデルに渡されたドキュメント・セットから使用する、すべてのテキスト属性間の個別特徴の最大数。デフォルトは`3000`です。`oml.esa`モデルのデフォルト値は`300000`です。
`ODMS_TEXT_MIN_DOCUMENTS`	負でない値	このテキスト処理設定では、あるトークンがいくつのドキュメントに出現すればそれを特徴として使用できるかが制御されます。デフォルトは`1`です。`oml.esa`モデルのデフォルト値は`3`です。
`ODMS_TEXT_POLICY_NAME`	`CTX_DDL.CREATE_POLICY`を使用して作成された、Oracle Textポリシーの名前。	非構造化テキストからの個々のトークンの抽出方法に影響を与える。 `CTX_DDL.CREATE_POLICY`の詳細は、『Oracle Textリファレンス』を参照してください。
`PREP_AUTO`	`PREP_AUTO_ON` `PREP_AUTO_OFF`	このデータ準備設定により、完全自動データ準備が有効になります。デフォルトは`PREP_AUTO_ON`です。
`PREP_SCALE_2DNUM`	`PREP_SCALE_STDDEV` `PREP_SCALE_RANGE`	このデータ準備設定により、2次元数値列のスケーリングのデータ準備が有効になります。この変更を有効にするには、`PREP_AUTO`を`OFF`にする必要があります。次は、返される値です。 `PREP_SCALE_STDDEV`: 列の値を列の標準偏差で割る要求であり、多くの場合`PREP_SHIFT_MEAN`とともに指定されてz-スコアによる正規化が行われます。 `PREP_SCALE_RANGE`: 列の値を値の範囲で割る要求であり、多くの場合`PREP_SHIFT_MIN`とともに指定されて[0,1]の範囲が得られます。
`PREP_SCALE_NNUM`	`PREP_SCALE_MAXABS`	このデータ準備設定により、ネストした数値列のスケーリングのデータ準備が有効になります。この変更を有効にするには、`PREP_AUTO`を`OFF`にする必要があります。指定した場合、この設定の有効な値は`PREP_SCALE_MAXABS`で、これによって[-1,1]の範囲のデータが得られます。
`PREP_SHIFT_2DNUM`	`PREP_SHIFT_MEAN` `PREP_SHIFT_MIN`	このデータ準備設定により、2次元数値列のセンタリングのデータ準備が有効になります。この変更を有効にするには、`PREP_AUTO`を`OFF`にする必要があります。次は、返される値です。 `PREP_SHIFT_MEAN`: 各値から列の平均が差し引かれます。 `PREP_SHIFT_MIN`: 各値から列の最小値が差し引かれます。
`ODMS_BOXCOX` ノート: Oracle Database 23aiでのみ使用できます。	`ODMS_BOXCOX_ENABLE` `ODMS_BOXCOX_DISABLE`	この設定では、Box-Cox分散安定化変換を有効にします。これは、ターゲット値が大きくなるにつれて分散が大きくなる場合に便利です。これにより、分散が小さくなり、ターゲットとの乗法関係が変換されて、よりシンプルな加法関係になります。この設定は、指数平滑法アルゴリズムにのみ適用可能です。`EXSM_MODEL`設定の値が指定されていない場合、デフォルト値は`ODMS_BOXCOX_ENABLE`で、`EXSM_MODEL`設定の値が指定されている場合、デフォルト値は`ODMS_BOXCOX_DISABLE`です。
`ODMS_EXPLOSION_MIN_SUPP` ノート: Oracle Database 23aiでのみ使用できます。	正の整数	これは、展開マッピングに含まれている必要があるカテゴリ値の最低限必要なサポートです。これにより、パフォーマンスが低下したりメモリーを使い果たす可能性があるため、モデルに対して統計的に有意な影響を及ぼすのに十分な行インスタンスがないカテゴリ値が削除されます。デフォルトは、データセット内の行数に応じて、システムによって決定されます。値`1`を指定すると、すべてのカテゴリ値がマッピングされます。

親トピック: インデータベース機械学習アルゴリズムへのアクセスを提供するOML4Pyクラス