グラフのロードでは、データの初期ロードまたは後続のベースラインのどちらに向けて開発されたかにかかわらず、同様の実装を共有します。Integrator ETLのサンプル・アプリケーションには、LoadDataという完全ロードのグラフが含まれており、これをモデルとして使用して独自のロード・グラフを作成できます。
データのロードは「属性の構成」で説明したように、属性スキーマのロードの前または後の、いずれかで可能です。属性スキーマのロードの前にデータをロードする場合は、標準属性のデフォルト値でレコードが作成されます。ニーズに見合った構成を決定するまでには、通常データのロードや属性スキーマの構成を何度か繰り返して行います。各繰り返しの中で、データ・ドメイン内のデータの削除、構成と属性スキーマの更新およびリロード、データのロードを行います。
ロード・グラフは通常、次のコンポーネントで構成されます。
1つ以上のデータ・リーダー・コンポーネント
リーダー・コンポーネントにより、ロード対象のソース・データが読み取られます。どのリーダーを使用するかは、読取り対象のデータソースの性質に依存します。LoadDataグラフでは、ソースの.csvファイルからの読取りにUniversal Data Readerコンポーネントが使用されます。ただし、データベースのデータやXMLとして格納されているデータをロードする場合は、それらのデータソースに対応したコンポーネントを使用する必要があります。
グラフへのリーダー・コンポーネントの追加の詳細は、「新規コンポーネントの追加」を参照してください。
Reformatコンポーネント(オプション)
入力データに使用可能な主キーが含まれる場合は、このコンポーネントは不要です。複数の入力値の組合せとして主キーを定義する場合は、Reformatコンポーネントが必要です。
Reformatコンポーネントの構成による主キーの作成の詳細は、「Reformatコンポーネントの構成による主キーの生成」を参照してください。
1つ以上のジョイナ・コンポーネント
複数の入力データソース(LoadDataグラフ内の複数の.csvファイルなど)のデータを結合する場合、ジョイナ・コンポーネントが必要です。ジョイナの正確な数および構成は、入力されるデータ・ストリームの数および異なる入力ストリームからのデータの結合方法に依存します。
1つのデータ・ライター・コンポーネント
データ・ライター・コンポーネントにより、処理されたデータがEndecaデータ・ドメインに書き込まれます。LoadDataグラフで示したように、完全初期ロード・グラフでは、通常、この目的でBulk Add/Replace Recordsコンポーネントが使用されます。詳細は、「Bulk Add/Replace Recordsコンポーネント」を参照してください。