トレーニング除外
トレーニング除外を使用して、ナレッジ・ベースの作成や改善に使用されるトレーニング・セットで無視される単語のリストを作成および管理します。
費用データのテキスト文字列には、多くの場合、様々な無関係な費用レコードに表示される共通の単語が含まれることがよくあり、カテゴリ・コードを割り当てたり更新するための予測子が不十分になります。 一連のトレーニング用語除外を作成すると、これらの用語がカテゴリ予測に干渉せず、ナレッジ・ベースのパフォーマンスが向上します。 費用分類機械学習では、費用データの分類中にトレーニング除外リストの単語は無視されます。
次にその方法を説明します。
- 「費用分類」の「構成」セクションの「トレーニング除外」ページに移動します。
- 最初に、ソリューション内で使用可能なサンプル除外を確認します。 「サンプル除外のダウンロード」処理を使用して、これらの除外をスプレッドシートにダウンロードできます。
- 必要に応じて単語のリストを変更します。
- 「除外のアップロード」をクリックして、変更をアプリケーションにインポートします。
または、「トレーニング除外」ページで直接変更することもできます。 「除外された単語」フィールドに一度に1つずつ除外する単語を追加し、除外リストから削除するには単語に対して「X」をクリックします。
- アップロードしたトレーニング除外を分類プロセスに組み込みます。
- 新しいナレッジ・ベースを作成すると、使用可能な場合は除外のリストがナレッジ・ベース作成時に組み込まれます。
- 既存のナレッジ・ベースの場合、「ナレッジ・ベースの改善」処理を使用してナレッジ・ベースを改善し、最新のトレーニング除外を組み込む必要があります。
ノート: 追加のトレーニングが不要な場合は、ナレッジ・ベースの作成に最初に使用されたトレーニング・セットのみを使用してください。 - ナレッジ・ベースの準備ができたら、これを使用して支出トランザクションを分類して結果を改善します。
トレーニング除外リストは、複数回繰り返されるため、時間の経過とともに進化します。 特定のナレッジ・ベースに最後に適用された除外リストをダウンロードしてレビューするには、「ナレッジ・ベース」ページに移動し、そのナレッジ・ベースの「除外のダウンロード」処理をクリックします。 スプレッドシートには、次のリストがあります。
- 現在の除外: 現在トレーニング・セットから除外されている単語。
- 取り消された除外: ナレッジ・ベースが作成または最後に改善されてからトレーニング除外のリストから削除された単語。
- 追加された除外: ナレッジ・ベースが作成または最後に改善されてからトレーニング除外のリストに追加された単語。
このリストを使用して、さらに多くのトレーニング除外を組み込むためにナレッジ・ベースを再構築または改善する必要があるかどうか、または以前に削除した単語を追加するためにトレーニング除外を変更する必要があるかどうかを判断します。