スペル辞書の制約の構成

Oracle Endeca Serverは、事前定義済の制約に基づいて、スペル辞書の単語を選択します。これらの制約を変更すると、スペル修正された検索のパフォーマンスを向上する際に役立ちます。

制約の設定は、グローバル構成レコードで使用できます。

これらの構成設定を使用して、Oracle Endeca Serverで生成されるスペル修正のタイプを調整および改善できます。たとえば、単語の最小発生数を設定すると、頻度の低い語から離れ、目的とするユーザーの検索語に対応する可能性があるとみなされた、より一般的な(頻繁に発生する)語へのスペル修正アルゴリズムに注意を向けることができます。

Oracle Endeca ServerのDgraphプロセスがスペル辞書のエントリを生成するために使用する設定を構成するには、次の手順に従います。

  1. 選択したエディタで、Dgraphが単語をスペル辞書に追加するために使用するGCRの制約を編集します。

    レコード検索と値検索のために、辞書のエントリの設定を別々に編集できます。つまり、レコード上の各属性割当てに対して、および各属性値に対して、グローバル構成レコードで次の設定を指定できます。

    属性 タイプ 説明
    mdex-config_SpellingRecordMinWordOccur Int スペル修正のために索引付けする標準属性値(属性上のレコード割当て)で単語が発生する最小回数を指定します。デフォルト値は4です。
    mdex-config_SpellingRecordMinWordLength Int スペル修正のために索引付けする標準属性値(属性上のレコード割当て)で単語に含まれる最小文字数を指定します。デフォルト値は3です。
    mdex-config_SpellingRecordMaxWordLength Int スペル修正のために索引付けする単語に含まれる最大文字数を指定します。デフォルト値は16です。
    mdex-config_SpellingDValMinWordOccur Int スペル修正のために索引付けする管理属性値で単語が発生する最小回数を指定します。デフォルト値は1です。
    mdex-config_SpellingDValMinWordLength Int スペル修正のために索引付けする管理属性値で単語に含まれる最小文字数を指定します。デフォルト値は3です。
    mdex-config_SpellingDValMaxWordLength Int スペル修正のために索引付けする単語に含まれる最大文字数を指定します。デフォルト値は16です。
  2. 更新されたGCRをOracle Endeca Serverに送信するには、構成Webサービスを直接、またはIntegrator ETLを使用します。詳細は、このガイドの構成Webサービスに関する項、または、Integrator ETLを使用する場合は、『Oracle Endeca Information Discovery Integrator Integrator ETLユーザーズ・ガイド』を参照してください。
  3. これらの変更を有効にするために、データ・ドメイン上でEndeca Serverのupdate-spelling-dictionaries endeca-cmdコマンドを実行します。