文字の置換

「文字の置換」プロセッサは、個々の文字を置換します。これにより、参照データ・マップと一致する文字を標準化または正規化できます。

アクセント付き文字や記号のバリアント(開始引用符と終了引用符など)のような一定でない文字を他の類似データでマスクできます。「文字の置換」プロセッサを使用して、参照データ・マップの文字のすべてのインスタンスを、その置換文字で置換します。

場合によっては、ある記述体系から別の記述体系に文字をマッピングすることで、「文字の置換」を文字から文字への単純な音訳に使用することもあります。

次の表に、構成オプションを示します。

構成 説明

入力

文字を置換する文字列または文字列配列型の属性を指定します。数値属性および日付属性は有効な入力ではありません。

配列属性を入力すると、変換はすべての配列要素に適用され、単一の配列属性が出力されます。

オプション

次のオプションを指定します。

  • 大文字/小文字を区別しない: 大文字と小文字の両方の文字(存在する場合)の置換を有効にします。Specified as 「はい」/「いいえ」で指定します。デフォルト値: No

  • マップ参照データの変換: 文字をその置換文字にマップします。参照データとして指定します。デフォルト値: *アクセント記号付きの文字を標準化する

出力

データ属性またはフラグ属性の出力を記述します。

データ属性

次のデータ属性が出力されます。

  • [Attribute Name].CharReplace: 置換した文字が設定された新しい文字列または配列属性。値は、元の属性値を文字置換して導出されます。

フラグ

なし。

「文字の置換」プロセッサでは、処理に関するサマリー統計は表示されません。データ・ビューには、入力属性とともに、右側に文字置換後の文字列が含まれた新しい属性が表示されます。

出力フィルタ

なし。

この例では、「文字の置換」プロセッサを使用して、名(姓名の名)属性のアクセント付き文字を標準化します。

変換マップ参照データ:

ルックアップ マップ コメント

É

E

E揚音

È

E

E抑音

ô

o

o曲折アクセント記号

大文字/小文字を区別しない = はい

結果:

アクセント名 accent names.CharReplace

élise

elise

Aimée

Aimee

Marie-élise

Marie-elise

Cécile

Cecile

注意:

大文字のÉはEに変換され、小文字のéはeに変換されます。