Delete Recordsコンポーネント

Delete Recordsコンポーネントは、指定されたEndecaレコードを削除します。

Delete Recordsコンポーネントのアイコン
Delete Recordsコンポーネントはデータ収集Webサービス(DIWS)を使用してEndecaデータ・ドメインからレコード全体を削除します。このコンポーネントは1つのトランザクションで複数のレコードを削除できます。削除するレコードの選択には、次の2つのオプションが使用できます。
  • 削除するレコードを選択するために使用する割当てを定義するデータ配列を入力できます。
  • Endeca問合せ言語(EQL)レコード指定子(WHERE句)を入力して、削除するレコードを選択できます。
これらのオプションは相互に排他的です。削除するレコードを選択するためにEQLレコード指定子を使用する場合は、入力配列も使用できません。

入力配列を使用した削除対象レコードの選択

入力配列は、EQL問合せを使用しない場合にのみ必要となります。入力配列を使用してEQL問合せをサポートすることもできます。詳細は、この後の「EQLの使用方法」を参照してください。

Delete Recordsコンポーネントの入力配列のメタデータ・スキーマは、削除するレコードを指定するプロパティ名と値の任意の配列です。入力配列の最初の行はレコード・ヘッダー行です。この行は、削除するレコードを選択するために使用するプロパティ名を定義します。

属性はAND演算子を使用して結合されます。したがって、入力配列に含まれるプロパティが少ないほど選択が汎用的になり、より多くのレコードが削除されます。反対に、入力配列に含まれるプロパティが多いほど選択が個別的になり、より少ないレコードが削除されます。

次の例では、データ・ドメインに次のようなスキーマが定義されているとします。
DimGeography_GeographyKey|DimGeography_City|DimGeography_StateProvinceCode|DimGeography_StateProvinceName|DimGeography_CountryRegionCode|DimGeography_CountryRegionName|DimGeography_PostalCode
  • 次の配列が入力の場合、DimGeography_StateProvinceNameプロパティの値がAlabamaであるすべてのレコードが削除されます。
    DimGeography_StateProvinceName
    Alabama
  • 次の配列が入力の場合、DimGeography_Cityプロパティの値がNewtonかつDimGeography_StateProvinceNameの値がBritish Columbiaであるレコードが削除されます。
    DimGeography_City|DimGeography_StateProvinceName
    Newton|British Columbia
  • 次の配列が入力の場合、DimGeography_Cityプロパティの値がNewtonかつDimGeography_StateProvinceNameの値がBritish ColumbiaかつDimGeography_PostalCodeの値がV2M1P1であるレコードが削除されます。
    DimGeography_City|DimGeography_StateProvinceName|DimGeography_PostalCode
    Newton|British Columbia|V2M1P1

複数値属性は、複数割当てデリミタまたはリスト・データ型を使用して指定できます。詳細は、「複数値データの処理」を参照してください。

複数値属性を使用してレコードを選択する場合、一致動作は複数割当て指定子属性の動作プロパティの値で定義されます。
  • 複数割当て指定子属性の動作プロパティの値が「完全に一致する」である場合、Endecaレコードはレコードの属性の値が属性の入力値と完全に一致する場合にのみ選択されます。つまり、Endecaレコードの属性値には入力レコードの属性のすべての値が含まれ、かつそれらの値のみである必要があります。つまり、Endecaレコードの属性値に入力レコードの属性値以外の追加の値が含まれていると、Endecaレコードは選択されません。
  • 複数割当て指定子属性の動作プロパティの値が「含む」である場合、レコードの属性値に入力レコードの値が1つ以上含まれていると、Endecaレコードが選択されます。すべての値が必ずしも一致している必要はなく、Endecaレコードには、入力レコードに含まれている以外の追加の値が含まれていてもかまいません。

EQLを使用した削除対象レコードの選択

Endeca問合せ言語(EQL)レコード指定子(EQL問合せのWHERE句)を使用して、削除するレコードを選択できます。たとえば"DimGeography_City"='Newton' AND "DimGeography_StateProvinceName"='British Columbia'と記述すると、DimGeography_Cityプロパティの値がNewtonかつDimGeography_StateProvinceNameの値がBritish Columbiaであるレコードが選択されます。

注意: EQLでは、二重引用符を使用して属性名を囲み、一重引用符を使用して属性値を囲む方法が標準的です。
入力配列を使用して、EQLレコード指定子をサポートするようにすることも可能です。入力プロパティを指定するには、変数を使用します。たとえば、次の配列を入力するとします。
City|StateProvince
Newton|British Columbia
Townsville|Queensland
Longmont|Colorado
その場合、次のEQLを入力できます: "DimGeography_City"=$input.City and "DimGeography_StateProvinceName"=$input.StateProvince

複数割当てプロパティの値に基づいてレコードを選択する場合は、属性の値の完全なセットに基づいて値を選択するか、または属性の値セットの個々のメンバーに基づいて値を選択するかに応じて、異なる構文を使用します。

属性の値の完全なセットに基づいてレコードを選択する場合は、構文"attribute"={'value1','value2',value3',...'valuen'}を使用します。たとえば、Colorが複数割当て属性で、属性の値がred,green,blueのセットであるレコードを選択する場合は、構文"Color"={'red','green','blue'}を使用します。セットのメンバーの順序は重要でないことに注意してください。つまり、レコード指定子"Color"={'green','blue','red'}では、レコード指定子"Color"={'red','green','blue'}と同じレコード・セットが選択されます。

複数割当て指定子属性の動作プロパティの値により、入力セットよりも多いまたは少ない値がレコードに含まれている場合の動作が決まります。このプロパティの値が「含む」である場合は、レコードに入力セットのいずれかのメンバーが含まれており、入力セットの値と完全に一致する必要がないときに、レコードが選択されます。複数割当て指定子属性の動作の値が「完全に一致する」である場合は、属性の値に入力セットのすべてのメンバーが含まれているときにのみレコードが選択されます。含まれている値が多いか、または少ない場合、レコードは選択されません。つまり、レコード指定子"Color"={'red','green','blue'}を使用すると、Colorの値がblue,redのレコードは選択されず、Colorの値がred,green,blue,yellowの場合も選択されません。

複数値のフィールドが含まれる入力配列を使用する場合は、"Color"={$input.Color}のように変数を中カッコで囲みます。

複数割当てプロパティの値セットの個々のメンバーに基づいてレコードを選択する場合は、明示的な修飾構文を使用します。たとえば、Colorが複数割当て属性である場合、レコード指定子SOME "value" IN "Color" SATISFIES("value"='red')では、Color属性の値セットのいずれかのメンバーがredである場合にレコードが選択されます。

Endeca問合せ言語の詳細は、Oracle Endeca Server EQLガイドを参照してください。

構成プロパティ

注意: すべてのコネクタのビジュアル・プロパティの詳細は、「コンポーネントのビジュアル・プロパティ」を参照してください。すべてのコネクタに共通の構成プロパティの詳細は、「コンポーネントの共通構成プロパティ」を参照してください。

次の表は、Delete Recordsコンポーネントに使用可能な構成プロパティを示しています。

表1 Delete Recordsコンポーネントのプロパティ
名前 説明 有効な値
Endeca Serverホスト Endeca Serverが稼働しているマシンを指定します。 そのマシンの名前またはIPアドレス。localhostを使用できます。 MyEndecaServer

255.255.255.0

Endeca Serverポート Endeca Serverがリスニングしているポートを指定します。 有効なポート。

Endeca Serverのデフォルト・ポートは7001ですが、別のポートに変更できます。

7001
Endeca Serverコンテキスト・ルート Endeca ServerのWebLogicアプリケーション・ルート・コンテキストを指定します。 WebLogicでの有効なルート・コンテキスト名。 /endeca-server
データ・ドメイン名 変更されるデータ・ドメインの名前。

データ・ドメインは、コネクタが含まれているグラフが実行されるときに稼働している必要があります。

有効なデータ・ドメイン名 quickstart
レコード・セット指定子属性 操作するレコードを選択するために使用する入力属性を指定します。 入力メタデータで使用可能な属性
複数割当て指定子属性の動作 レコード選択時の複数値入力属性の一致方法を指定します。
  • 完全に一致する

    レコードは、レコードの属性値に属性のすべての入力値が含まれている場合にのみ選択されます。

  • 含む

    レコードは、レコードの属性値が属性の任意の入力値と一致する場合に選択されます。

コレクションの切捨て コレクション・キー・プロパティで指定したコレクションからレコードを削除するかどうかを指定します。 選択(True)

選択解除(false)

コレクション・キー レコードの削除元のコレクションのキー。 有効なコレクション・キー。

指定したコレクションが存在しない場合、グラフは失敗し、エラーが返されます。

NewCollection
EQLレコード・セット指定子を使用する 操作するレコードの選択にEQL式を使用するかどうかを指定します。

EQLの標準的な使用方法では、属性名を二重引用符で囲み、属性値を一重引用符で囲みます。

選択解除(false)

選択(true)

"DimGeography_City"='Newton' AND "DimGeography_StateProvinceName"='British Columbia'
EQLレコード・セット指定子 操作するレコードを選択するために使用するEQL式。 有効なEQL式
複数割当て指定子属性の動作 レコード選択時の複数値入力属性の一致方法を指定します。
  • 完全に一致する

    レコードは、レコードの属性値に属性のすべての入力値が含まれている場合にのみ選択されます。

  • 含む

    レコードは、レコードの属性値が属性の任意の入力値と一致する場合に選択されます。

SSL有効 コンポーネントのSSLを有効化または無効化します。

接続しているEndeca ServerのSSLが有効になっている場合にのみSSLを有効にしてください。

選択(True)

選択解除(False)

バッチ・サイズ 収集操作のバッチ・サイズ(バイト単位)を指定します。1つまたは複数のレコードで構成されるバッチ。

「コンポーネントによるバッチ・サイズ調整」も参照してください。

1以上の正の整数でバッチ・サイズを定義します。バッチ・サイズが小さすぎて最後のレコードがバッチに収まらない場合は、そのレコードを収容できるようにサイズをリセットします。その後、バッチ・サイズは指定したバッチ・サイズに戻ります。

0 (ゼロ)または負の整数を指定すると、バッチ処理はオフになります。バッチ処理がオフになっていると、レコードは1つずつデータ・ドメインに送信されます。

1000000

0

複数割当てデリミタ ソース・レコードのプロパティ内の複数割当て値を区切る文字を設定します。このデリミタは、ソース・レコードのプロパティ・フィールドを区切るデリミタとは異なることに注意してください。

「複数割当てデリミタ」も参照してください。

複数割当てのデリミタである単一文字。デフォルトはUnicode DELETE文字(\U007F)です。データに複数割当てプロパティが含まれていない場合は、このフィールドを使用する必要はありません。
失敗バッチの最大数 収集操作が終了するまでに許容されるバッチの失敗の最大数。 0 (バッチの失敗は許容されない)または正の整数。 15

出力ポート

データ・ドメイン内のレコード・データを(レコードまたはキーと値のペアの追加または削除によって)変更する各Information Discoveryコンポーネントには次2つの出力ポートがあります。
  • ポート0は、正常に収集されたレコードのバッチを示すステータス情報を返します。
  • ポート1は、データ・ドメインが収集に失敗したレコードのバッチを示すエラー情報を返します。ポートに出力された各レコードは、個々のレコードではなく失敗したバッチに対応します。
表2 ポート0のメタデータ
ポート・フィールド名 データ型 説明
開始行 Long バッチの開始行のID 00001
終了行 Long バッチの終了行のID 99999
削除されるレコードの数 Long データ・ドメインから削除されるレコードの総数 42683
影響を受けるレコードの数 Long 他のレコードは保持したまま、キー/値のペア(割当て)が削除されたレコードの数 19834
所要時間(秒) Numeric バッチの合計処理時間(秒) 127
表3 ポート1のメタデータ
ポート・フィールド名 データ型 説明
開始行 Long バッチの開始行のID 00001
終了行 Long バッチの終了行のID 99999
フォルト・メッセージ String Endeca Serverによって返されたエラー・メッセージ