9.3 共有設定
次に示す設定は、すべてのOML4Py機械学習クラスに共通です。
次の表は、すべてのOML4Pyモデルで共有される設定のリストです。
表9-1 モデルの共有設定
| 設定名 | 設定値 | 説明 | 
|---|---|---|
| 
 | 
 
 | データベースでのモデル・サイズの制御に役立ちます。モデルの詳細では、特にパーティション化されたモデルで大量のディスク領域が消費される可能性があります。デフォルト値は 設定値が 値が 削減される領域はアルゴリズムに応じて異なります。約10倍のモデル・サイズの削減が可能です。 | 
| 
 | 1 < value <= 1000000 | パーティション化されたモデルで許可されるパーティションの最大数を制御します。デフォルトは | 
| 
 | 
 
 
 | トレーニング・データでの欠損値を処理する方法を示します。この設定は、スコアリング・データに影響を与えません。デフォルト値は、 
   値 | 
| 
 | 
 
 
 | パーティション化されたモデルのパラレル作成を制御します。 
 
 
 | 
| 
 | 機械学習の属性のカンマ区切りリスト | パーティション化されたモデルの作成を要求します。設定値は、リスト内のパーティション・キーの値を決定するために使用される機械学習の属性のカンマ区切りリストです。 | 
| 
 | tablespace_name | モデルを格納する表領域を指定します。 これを(十分な割当て制限を持っている)表領域の名前に明示的に設定すると、指定した表領域の記憶域によって結果のモデルの内容が作成されます。この設定を指定しない場合、デフォルトの表領域によって結果のモデルの内容が作成されます。 | 
| 
 | 0 < value | サンプリングするおおよその行数を決定します。この設定は、 | 
| 
 | 
 
 | ビルド・データのサンプリングの要求をユーザーに許可します。デフォルトは | 
| 
 | 
 | モデルに渡されたドキュメント・セットから使用する、すべてのテキスト属性間の個別特徴の最大数。デフォルトは | 
| 
 | 負でない値 | このテキスト処理設定では、あるトークンがいくつのドキュメントに出現すればそれを特徴として使用できるかが制御されます。 デフォルトは | 
| 
 | 
 | 非構造化テキストからの個々のトークンの抽出方法に影響を与える。 
 | 
| PREP_AUTO | 
 
 | このデータ準備設定により、完全自動データ準備が有効になります。 デフォルトは | 
| PREP_SCALE_2DNUM | p 
 | このデータ準備設定により、2次元数値列のスケーリングのデータ準備が有効になります。この変更を有効にするには、 
 
 | 
| PREP_SCALE_NNUM | 
 | このデータ準備設定により、ネストした数値列のスケーリングのデータ準備が有効になります。この変更を有効にするには、 | 
| PREP_SHIFT_2DNUM | 
 
 | このデータ準備設定により、2次元数値列のセンタリングのデータ準備が有効になります。この変更を有効にするには、 
 
 |