スペル修正に使用するロジック

上位のレベルで、Oracle Endeca Serverのスペル・エンジンでは、指定された検索問合せのスペル修正に関連する次のステップを実行します。

  1. 検索語が修正なしで特定の数より多くヒットする場合、スペル・エンジンは修正または提案を生成しません。

    自動修正では、ヒット数のしきい値は1です。もしかして機能では、ヒット数のしきい値は20です。

  2. 問合せ内の各語に対して、スペル・エンジンは、最低のスペル・スコアで32個の修正を検出します。スペル・スコアが低いことは、修正が検索語に類似していることを示します。

    Dgraphプロセスが使用する英語のAspellモードの場合、スペル・スコアは音声の違いに基づいています。32個の修正は、特定のしきい値を下回るスペル・スコアの修正にプルーニングされます。自動修正では、スペルのしきい値は125で、もしかしてでは、スペルのしきい値は175です。

  3. スペル・エンジンは、修正する元の検索語のかわりに、各修正をテストします。一致する語数を減らさずに、(元の問合せに関連する)ヒット数を増やす修正のみが、返される対象となります。
  4. スペル・エンジンは、最も高いヒット数を持つ適格な修正に基づいて、最適な修正を選択します。レコード検索の場合、これは一致するレコード数です。値検索の場合、これは一致する一連の値に関連付けられたレコード数です。
    注意: レコード検索と値検索の結果の処理における相違点の詳細は、「値検索の結果数の処理方法」を参照してください。

自動スペル修正およびDYMのDgraphプロセス構成を変更するために、Endeca Serverのupdate-spelling-dictionaries endeca-cmdコマンドを使用して、スペル辞書を再構築できます。データ収集プロセス中に、このコマンドを定期的に実行して、Dgraphデータ・ファイル内のスペル辞書を更新できます。

自動修正の提案は、Oracle Endeca Serverによって公開されません。つまり、インストール済の製品で、この辞書を手動では更新できません。

グローバル構成レコードで、単語の最小発生数、単語の最大および最小の長さなど、索引付けパラメータを構成できます。これらのパラメータによって、どの単語をスペル辞書に含めるかをOracle Endeca ServerのDgraphプロセスに示す境界を設定できます。