このトピックでは、英数字以外の文字を含む結果テキストに一致する検索問合せ語のセマンティクスについて説明します。
- 問合せ処理中に、デリミタ(空白)が含まれる検索文字としてマークされないすべての英数字以外の文字を置き換えるために、各ユーザーの検索語は変換されます。
- 句読点とみなされている英数字以外の文字(! @ # & ( ) - [ { } ] : ; ', ? / *)は、空白として処理され、語順は保持されます。これは、引用符で囲まれたフレーズ検索に相当するものが生成されることを意味します。そのような理由で、スペル修正、ステミング、シソーラス展開など、引用符で囲まれたフレーズ検索と互換性がないすべての検索機能は、アクティブにはなりません。(詳細は、「フレーズ検索の使用」を参照。)
- 記号とみなされている英数字以外の文字(` ~ $ ^ + = < > “)も、空白として処理されます。ただし、句読点とは異なり、複数単語の検索での語順は保持されません。
- ユーザー問合せ内のアルファベット文字は、ケース・フォールディングされた索引付き文字列に対して一致することを保証するために、小文字に置き換えられます。
- 変換された問合せ内の各検索語は、ヒットするとみなされるテキストの指定されたソース・テキストからの索引付き文字列と正確に一致する必要があります。
前述したように、ユーザーが入力した検索語を解析する際には、英数字以外の文字を含む問合せは変換され、(検索文字としてマークされていない)すべての英数字以外の文字は空白に置き換えられますが、語順の処理は、問題になっている文字が句読点と記号のどちらにみなされているかに応じて異なります。句読点の場合のみ、検索動作で、検索語の語順および近接が保持されます。
たとえば、ice-creamの検索問合せでは、ハイフン(句読点)は空白に置き換えられ、次のテキストを含むレコードのみが返されます。
テキストの語順および語の近接が元の問合せ語と一致しないため、次のテキストを含むレコードは返されません。
- cream ice
- ice in the cream container
ただし、一致モードがAllであると仮定した場合、ice~creamの検索は、[ice AND cream]の非連続の結果を返します。