データ・ドメインの作成および構成を行う際に推奨されるプロセス

ここでは、データ・ドメインを作成、構成およびロードする際にお薦めするプロセスの概略を示します。

データ・ドメインの作成、構成およびデータ移入には、次のプロセスを使用します。次のプロセスのステップはすべて、省略可能であることに注意してください。そのため、たとえば、デフォルトのグローバル構成がニーズを満たしている場合は、グローバル構成レコードを更新する必要はありません。属性の階層をいっさい定義しない場合は、管理対象属性のスキーマも管理対象属性の値もロードする必要はありません。

  1. データ・ドメインを作成します。
  2. グローバル構成レコード(GCR)を更新します。

    グローバル構成レコードでは、Endecaデータ・ドメインのグローバル構成設定が設定されます。「グローバル構成レコード」を参照してください。

  3. 属性スキーマ構成を更新します。「属性の構成」を参照してください。
    属性スキーマの構成は次のとおりです。
    1. 標準属性スキーマ
      標準属性はレコードの情報の基本単位であり、キーと値のペアで構成されています。Endeca Serverにデータをロードすると、デフォルトのデータ型を有する標準属性が作成されます。次の状況では、標準属性のスキーマを更新することが必要になります。
      • 属性のデフォルトのデータ型とは異なるデータ型を割り当てます。たとえば、デフォルトでは、数値データで構成される部品番号には、integerやlongなどの数値データ型が割り当てられます。ただし、部品番号は通常、文字列データとして扱うものなので、データをロードする前に部品番号をstringデータ型として定義します。
      • 属性値の階層を管理対象属性として定義します。これらの属性はまず、標準属性としてロードする必要があります。

      標準属性は、プロパティ詳細レコード(PDR)によって定義されます。

    2. 管理対象属性スキーマ

      管理対象属性では、属性値の階層を定義します。たとえば、位置属性では、国、都道府県および市区町村の階層を定義する場合があります。管理対象属性は、属性を定義するプロパティ詳細レコード(PDR)と、属性の値の間の関係および階層を定義するディメンション詳細レコード(DDR)の両方によって定義されます。

    3. 管理対象属性の値(mval)。
  4. 構成ドキュメント(次に示す順序でロードされています)。
    1. relrank_strategies

      このドキュメントでは、Information Discoveryアプリケーションの関連性ランキング付け方針を構成しています。このドキュメントは、recsearch_configドキュメントおよびdimsearch_configドキュメントをロードする前にロードする必要があります。詳細は、「関連性ランキングの構成」を参照してください。

    2. recsearch_config

      このドキュメントではレコード検索を構成しており、そこには、属性のグループに対するレコード検索動作を制御する検索インタフェースが含まれています。詳細は、「レコード検索の構成」を参照してください。

    3. dimsearch_config

      このドキュメントでは、値検索の構成を設定しています。詳細は、「値検索の構成」を参照してください。

    4. stop_words

      このドキュメントでは、問合せのストップワードを設定しています。ストップワードとは、問合せから排除される単語であり、問合せは、その排除が行われた後でDgraphによって処理されます。詳細は、「ストップワードの構成」を参照してください。

    5. thesaurus

      このドキュメントでは、アプリケーションのシソーラスを構成しています。これにより、ユーザー問合せに含まれている単語およびフレーズに関連する概念と一致するものを返すことができます。詳細は、「シソーラスの構成」を参照してください。

  5. Endeca Serverにロードするソース・データ。

優先順位ルールのロードは、この一連の流れの中のどこでもできます。優先順位ルールにより、ある条件が満たされるまで、Endecaの属性の絞込みが抑制されます。一部の属性が抑制されれば、ナビゲーションはより簡単になり、過度な量の情報が表示されてユーザーが当惑するような事態は避けられます。詳細は、「優先順位ルールの構成」を参照してください。