デシジョン・ツリー・アルゴリズムのチューニング

様々なパラメータを使用してデシジョン・ツリー・アルゴリズムを微調整します。

デシジョン・ツリー・アルゴリズムには、分岐および終了基準に対して妥当なデフォルト値が実装されています。ただし、微調整のために複数の構築設定を使用できます。

ツリーの最適な分岐条件を見つけるための同種メトリックを指定できます。デフォルトのメトリックはジニです。entropyメトリックも使用できます。

ツリーの拡大を制御する設定も使用できます。ツリーの最大深度、子ノードで必要とされるケースの最小数、追加の分岐を可能にするためにノードで必要とされるケースの最小数、子ノードのケースの最小数、および追加の分岐を可能にするためにノードで必要とされるケースの最小数を指定できます。

ノート:

モデル設定と同じ意味でハイパーパラメータという用語も使用されます。

トレーニング・データ属性は、アルゴリズムのデータ準備の一部としてビニングされます。ビニング・ステップで使用するビンの数を変更できます。使用されるビンの数と作成に必要な時間との間にはトレードオフがあります。

参照:

使用可能なモデル設定のリストおよび説明は、DBMS_DATA_MINING - アルゴリズムの設定: デシジョン・ツリーを参照してください。

ノート:

モデル設定と同じ意味でハイパーパラメータという用語も使用されます。