照合ストップワードの構成

要求アイテムを照合するか、ビューポイント内のノードを重複除外するとき、ノード・タイプ・レベルで文字列値の比較時に無視されるストップワードを定義できます。

たとえば、「名前」プロパティを使用して照合または重複除外する場合、"Company"、"Corporation"および"Incorporated"などの単語を無視できます。これらの一般的な単語を含めると、偽陽性が発生する可能性があるためです。

考慮事項

  • 文字列プロパティ(文字列、メモまたは数値文字列データ型)にのみストップワードを追加できます。
  • ストップワードは、句読点を含むプロパティ値の単語全体と一致する必要があります。部分一致はカウントされません。たとえば、ストップワード"Corporation"を定義した場合、"Corp"という単語は無視されません。同様に、ストップワード"Corp" (ピリオドなし)は、"Corp." (ピリオドあり)を一致するとして無視しません。
  • ストップワードでは、大文字と小文字は区別されません。

ノード・タイプでのストップワードの構成

  1. ストップワードを構成するノード・タイプを調べます。ノード・タイプの検査を参照してください。
  2. 「ルール」タブに移動し、「ストップワード」サブタブで「編集」をクリックします。
  3. 「追加」 追加ボタンをクリックし、「プロパティ」ドロップダウン・メニューでストップワードを追加するプロパティを選択します。

    Note:

    複数の行で同じプロパティを選択した場合、「保存」をクリックすると、各行のストップワード値がそのプロパティに対して1つの行にマージされます。
  4. 「照合ストップワード」に、照合プロセス中に無視するストップワードを入力します。

    Note:

    値は、保存時に小文字に変換されます。ストップワードでは、大文字と小文字は区別されません。
  5. ストップワードを除去するには、その横にある「X」アイコンをクリックします。プロパティとそのすべてのストップワードを完全に除去するには、「アクション」 「アクション」メニューをクリックし、「除去」を選択します。
  6. 「保存」をクリックします。

ストップワード処理

一致するストップワードが構成されているノード・タイプに対して要求アイテムの照合または重複除外を実行する場合:

  • すべてのプロパティのストップワードは、そのプロパティを使用するすべての照合ルールで無視されます。
  • 一致の候補(要求アイテムの照合時)または一致したノード(重複除去の実行時)の照合ルールの照合スコアを計算する場合、すべてのプロパティのストップワードは無視されます。

たとえば、要求アイテムの照合の場合、取込要求アイテムに"StreamVault Media"という名前のノードがあり、ノード・タイプに"The StreamVault Media Company"という名前の一致の候補が含まれているとします。

  • ストップワードが構成されていない場合、照合スコアは61になります(要求アイテム内の文字の17/28または61%が一致の候補と一致するため。照合スコアはどのように計算され、どのように使用しますか。を参照してください)。
  • ストップワード"The"および"Company"を構成すると、照合スコアは100になります。これは、照合スコアの計算時にこれらの単語が無視されるため、要求アイテムの17文字すべてが一致の候補と一致するためです。

改訂された照合スコアにより、以前に受け入れられなかった一致の候補が一致として自動的に受け入れられたり、以前に除外されなかった一致の候補が自動的に照合結果から除外される可能性があります。