データ・ロード方針の選択

Endeca Serverへデータをロードするための方針は、ベースライン更新と増分更新の2つの一般的なカテゴリに分類されます。

ベースライン更新では、空のデータ・ドメインにデータがロードされます。ベースライン更新には、データの完全初期ロードおよび後続ベースライン更新が含まれます。増分更新では、既存のデータ・ドメインにレコードが追加されますが、デルタによる増分更新ではロード先のデータ・ドメインの既存レコードの変更も行われます。

次の表では、これらの方針について詳しく説明します。
表1 データ・ロード方針
データ・ロード方針 タイプ 説明 この方針をいつ使用するか
完全初期ロード ベースライン更新 完全初期ロードとは、空のデータ・ドメインへの単純なデータのロードです。データ・ドメインが構成されており、スキーマがロード済である場合があります。スキーマの構成がロードされていない場合は、データがロードされる際にデフォルトのスキーマが作成されます。

Getting Startedプロジェクトのベースライン・グラフでは、基本属性スキーマのロード後に、初期ロードが実行されます。

この方針は、新規データ・ドメインに初めてデータをロードする場合に使用します。この方針では通常、Bulk Add/Update Recordsコンポーネントが使用され、新しいレコードが迅速にロードされます。
後続ベースライン ベースライン更新 再ベースラインとも呼ばれ、後続のベースラインが既存のデータ・ドメインの既存のコンテンツを完全に置き換えますが、構成とスキーマは保持されます。
一般的な後続ベースラインには、次のグラフが含まれます。
  • 構成エクスポート・グラフ: データ・ドメインの既存の構成を保持します。このグラフでは、Export Configコンポーネントが使用されます。
  • リセット・グラフ: データ・ドメインを初期状態にリセットします。このグラフでは、Resetコンポーネントが使用されます。
  • 構成インポート・グラフ: データ・ドメインをリセットした後に、以前エクスポートされた構成をインポートします。このグラフでは、Import Configコンポーネントが使用されます。
  • 再構成されたデータ・ドメインへのデータのリロードを行う一連のグラフ。

Transaction RunGraphコンポーネントを使用して、外部トランザクション内でこれらのグラフを実行するのが一般的な方法です。

この方針は、データ・ドメインを定期的にリフレッシュして、最新かつ破損していないデータを確保するために使用します。
増分更新 増分更新 増分更新では、データ・ドメインに対しては新しいレコードが、既存のレコードに対しては新しいプロパティが追加されます。 この方針は、データ・ドメインに新しいレコードを追加するか、既存のレコードに新しい割当てを追加する場合に使用します。この方針では通常、Merge Recordsコンポーネントが使用されます。このコンポーネントでは、1つの入力レコードにつきEndecaレコードが1つのみ追加または変更されることに注意してください。
デルタによる増分更新 増分更新 デルタによる増分更新では、次が実行されます。
  • 既存のレコードへの新規割当ての追加
  • 既存のレコードの既存の割当ての変更
  • レコードからの割当ての削除
  • レコードの完全な削除
この方針は、特定のレコードを変更または削除する場合に使用します。この方針では、Modify Recordsコンポーネント(割当ての追加、変更または削除の場合)、またはDelete Recordsコンポーネント(レコードの完全な削除のばあい)のいずれかが使用されます。どちらのコンポーネントでも、1つの入力レコードにつき、複数のEndecaレコードを変更または削除できることに注意してください。