Integrator ETLのリーダー・コンポーネントでは、デリミタ付き、JDBC、XMLなどの様々な形式の読取りが可能です。
Production Information Discoveryアプリケーションでは、通常、データベースまたはデータベースの抽出から直接データを読み取ります。
FullLoadサンプル・アプリケーションでは、一般的なデータベース管理システムで使用されている表に似た、2次元形式が使用されています。つまり、データが表にまとめられ、レコードの行で構成されています。各行は、各レコードのソース・プロパティとプロパティ値を表す列のセットで構成されています。(このタイプの形式は、一般的に矩形データ形式と呼ばれます。)
次の図は、FullLoadグラフのソース・データが2次元形式へまとめられた状態を示しています。
Endeca Serverでは、主キーはレコード指定子とも呼ばれます。各レコードで一意になるプロパティがレコードに含まれている場合は、標準属性をレコードの主キーとして使用できます。(主キーの詳細は、Oracle Endeca Serverデータ・ロード・ガイドを参照してください。)
LoadDataグラフの例では、すべてのレコードに対して一意の値を持ったフィールドが含まれるソース・ファイルが存在しません。そのため、グラフにはCreateSpecという名前のTransformコンポーネントが含まれており、2つの属性値の連結によって主キー(FactSales_RecordSpecという名前)が作成されます。
主キーの名前は、エッジに適用されるメタデータ定義に追加する必要があります。エッジによりTransformコンポーネントがグラフ・フローの次のコンポーネントに結合されます。
Dgraphでは、ハイフン付きの属性名が受け入れられますが(ハイフンが有効なNCName文字であるため)、Integrator ETLではハイフン付きのソース・プロパティ名はメタデータとして受け入れられません。そのため、Ship-Dateのようなソース・プロパティ名が存在する場合は、名前からハイフンを必ず取り除くようにしてください。
ComponentID|Color|Size 123|Blue|Medium 456|Blue;Red|Small 789|Red;Black;Silver|Large
この例では、パイプ文字(|)がプロパティ間のデリミタであるのに対し、セミコロン(;)は特定のプロパティでの複数の値の間のデリミタです。たとえば、レコード789のColorプロパティは、Red、BlackおよびSilverという値を持っています。
Bulk Add/Replace Recordsコンポーネントの構成の際には、複数割当てプロパティ用に、セミコロンがデリミタとして使用されるように指定できます。
複数割当てのEndeca属性では、PDRでmdex-property_IsSingleAssignプロパティをfalseに設定しておく必要があることに注意してください。このプロパティのデフォルト値はfalseです。これは、デフォルトで属性の複数割当てが可能であることを意味します。