管理型分類では、CTX_CLS.TRAIN
プロシージャを使用してルール記述の手順を自動化します。CTX_CLS.TRAIN
では、サンプル・ドキュメントのトレーニング・セットを使用して分類ルールが推定されます。この点が、ユーザー自身が分類ルールを作成する必要があるルールベース分類と比較して大きなメリットとなります。
ただし、CTX_CLS.TRAIN
プロシージャを実行する前に、カテゴリを手動で作成し、サンプル・トレーニング・セットの各ドキュメントをカテゴリに割り当てる必要があります。
ルールが生成されると、ユーザーがそれを索引付けし、CTXRULE
索引を作成します。次に、MATCHES
演算子を使用して、新規ドキュメントの着信ストリームを分類できます。
管理型分類の場合、2つの異なる分類アルゴリズムを選択できます。
意思決定ツリー分類のメリットは、生成したルールを簡単に監視(または変更)できる点です。「意思決定ツリー管理型分類の例」を参照してください。
このメソッドでは、サポート・ベクター・マシン(SVM)・アルゴリズムを使用してルールを作成します。SVMベース分類のメリットは、通常、意思決定ツリー分類より正確である点です。デメリットは、バイナリ・ルールが生成されるため、ルール自体が不明瞭になる点です。「SVMベース管理型分類の例」を参照してください。