7.3 共有設定
これらの設定は、複数のOML4R機械学習クラスに共通です。
次の表に、すべてのOracle Machine Learning for Rモデルで共有される設定を示します。
表7-3 モデルの共有設定
| 設定名 | 設定値 | 説明 | 
|---|---|---|
| 
 | 
 
 | データベースでのモデル・サイズの制御に役立ちます。モデルの詳細では、特にパーティション化されたモデルで大量のディスク領域が消費される可能性があります。デフォルト値は 設定値が 値が 削減される領域はアルゴリズムに応じて異なります。約10倍のモデル・サイズの削減が可能です。 | 
| 
 | 1 < X <= 1000000 | パーティション化されたモデルで許可されるパーティションの最大数を制御します。デフォルトは | 
| 
 | 次のリストのいずれかの文字列値: 
 
 
 | トレーニング・データでの欠損値を処理する方法を示します。この設定は、スコアリング・データに影響を与えません。デフォルト値は、 
   値 | 
| 
 | 
 
 
 | パーティション化されたモデルのパラレル作成を制御します。 
 
 
 | 
| 
 | 機械学習の属性のカンマ区切りリスト | パーティション化されたモデルの作成を要求します。設定値は、リスト内のパーティション・キーの値を決定するために使用される機械学習属性のカンマ区切りのリストです。 | 
| 
 | tablespace_name | モデルを格納する表領域を指定します。 これを(十分な割当て制限を持っている)表領域の名前に明示的に設定すると、指定した表領域の記憶域によって結果のモデルの内容が作成されます。この設定を指定しない場合、デフォルトの表領域によって結果のモデルの内容が作成されます。 | 
| 
 | 0 < X | サンプリングするおおよその行数を決定します。この設定は、 | 
| 
 | 
 
 | ビルド・データのサンプリングの要求をユーザーに許可します。デフォルトは | 
| 
 | 
 | モデルに渡されたドキュメント・セットから使用する、すべてのテキスト属性間の個別特徴の最大数。デフォルトは | 
| 
 | 
 | このテキスト処理設定では、あるトークンがいくつのドキュメントに出現すればそれを特徴として使用できるかが制御されます。 デフォルトは | 
| 
 | 
 | 非構造化テキストからの個々のトークンの抽出方法に影響を与える。 
 | 
| PREP_AUTO | 
 
 | このデータ準備設定により、完全自動データ準備が有効になります。 デフォルトは | 
| PREP_SCALE_2DNUM | 
 
 | このデータ準備設定により、2次元数値列のスケーリングのデータ準備が有効になります。この変更を有効にするには、 
 
 | 
| PREP_SCALE_NNUM | 
 | このデータ準備設定により、ネストした数値列のスケーリングのデータ準備が有効になります。この変更を有効にするには、 | 
| PREP_SHIFT_2DNUM | 
 
 | このデータ準備設定により、2次元数値列のデータ・センタリングの準備が有効になります。この変更を有効にするには、 
 
 | 
| ODMS_BOXCOXノート:Oracle Database 23aiでのみ使用できます。 | 
 
 | この設定では、Box-Cox分散安定化変換を有効にします。これは、ターゲット値が大きくなるにつれて分散が大きくなる場合に便利です。これにより、分散が小さくなり、ターゲットとの乗法関係が変換されて、よりシンプルな加法関係になります。この設定は、指数平滑法アルゴリズムにのみ適用可能です。 | 
| ODMS_EXPLOSION_MIN_SUPPノート:Oracle Database 23aiでのみ使用できます。 | 
 | これは、展開マッピングに含まれている必要があるカテゴリ値の最低限必要なサポートです。これにより、パフォーマンスが低下したりメモリーを使い果たす可能性があるため、モデルに対して統計的に有意な影響を及ぼすのに十分な行インスタンスがないカテゴリ値が削除されます。デフォルトは、データセット内の行数に応じて、システムによって決定されます。値 |