Text Tagger Regexコンポーネント

Text Tagger Regexコンポーネントは、正規表現(regex)を使用して受信レコードで指定されたテキスト・フィールド内のテキストの照合を行い、計算された値で出力レコードにタグ付けします。

Text Tagger Regexコンポーネントは検索パターン/レンダリング・パターンのペアのリストを受け取り、入力レコードのソース・フィールド名プロパティで指定されたフィールド内で入力パターンを検索します。正規表現がレコードで一致すると、(検索パターン/レンダリング・パターンの入力からの)レンダリング・パターンで生成された出力が、ターゲット・フィールド名プロパティで指定したレコードのフィールドに追加されます。

メタデータ・スキーマ

Text Tagger Regexコンポーネントのメタデータ・スキーマは修正されません。

構成プロパティ

注意: すべてのコネクタのビジュアル・プロパティの詳細は、「コンポーネントのビジュアル・プロパティ」を参照してください。すべてのコネクタに共通の構成プロパティの詳細は、「コンポーネントの共通構成プロパティ」を参照してください。

次の表は、Text Tagger Regexコンポーネントに使用可能な構成プロパティを示しています。

表1 Text Tagger Regexのプロパティ
名前 説明 有効な値
ソース・フィールド名 一致するかどうかの検索を行う入力レコード内のテキスト・フィールド名。 入力レコード内のプロパティ。
ターゲット・フィールド名 タグの書込み先となる出力レコード内のフィールド名。 有効なプロパティ名。
上書きターゲット・フィールド 指定されたターゲット・フィールド内の既存の入力値を、新しいタグ出力で上書きするかどうかを指定します。 選択(True)

選択解除(False)

複数割当てデリミタ ソース・レコードのプロパティ内の複数割当て値を区切る文字を設定します。このデリミタは、ソース・レコードのプロパティ・フィールドを区切るデリミタとは異なることに注意してください。

「複数割当てデリミタ」も参照してください。

複数割当てのデリミタである単一文字。デフォルトはUnicode DELETE文字(\U007F)です。データに複数割当てプロパティが含まれていない場合は、このフィールドを使用する必要はありません。