|
Generate Initials |
「Generate Initials」プロセッサでは、「Bayerische Motoren Werke」から「BMW」への変換など、値をイニシャルに変換します。
「Generate Initials」変換は、略称と非略称の両方の名称(またはその他の用語)が使用される場合に、データをマッチさせる(またはマッチ処理のためのレコードのクラスタリング)に最も一般的に使用されます。これは、「International Business Machines」と「IBM」のようなマッチを検索する場合に役立ちます。この場合、最初に各値をイニシャル変換しないと、コンピュータで照合することは困難です。「IBM」のような短い単語が「I」にイニシャル変換されないようにするオプションも含まれています。
イニシャルに変換する文字列または文字列配列型の属性。数値属性および日付属性は有効な入力ではありません。
配列属性を入力すると、変換はすべての配列要素に適用され、単一の配列属性が出力されます。
オプション |
タイプ |
目的 |
デフォルト値 |
Delimiters Reference Data |
参照データ |
イニシャルの生成前に単語を区切るために使用される文字の標準セットを使用できます。 |
*Delimiters |
Delimiter characters |
自由形式テキスト |
イニシャルの生成前に単語を区切るために使用される文字の追加セットを指定します。 |
スペース |
Ignore upper case single words of length |
整数 |
「Generate Initials」プロセッサでは、すべて大文字でこの文字数以内の1単語の値(つまり、単語の区切りがない)を変換しません(たとえば、「IBM」)。 後述の注意を参照してください。 |
4 |
注意: 通常、「Generate Initials」変換では、元の値の大/小文字は無視され、指定のデリミタで区切られた各単語が検出されて大文字のイニシャルが生成されます。たとえば、値「A j Smith」、「ALAN JOHN SMITH」および「Alan john smith」はすべての「AJS」にイニシャル変換されます。ただし、「PWC」、「IBM」、「BT」のようにすでにイニシャル変換されている値もあり、これらは「P」、「I」、「B」にイニシャル変換する必要はありません。 |
これらは、次の条件によって識別できます。
a. 1単語の値である
b. 大文字である
c. 長さが数文字である
「Ignore upper case single words of length」オプションを使用すると、値が大文字の1単語の場合、その単語が何文字以内のときにイニシャル変換しないかを指定できます。
たとえば、4に設定した場合、値「PWC」、「BT」、「RSPB」および「IBM」は、長さが4文字以内で、1単語の値で大文字であるため、イニシャル変換プロセスで無視されます。これに対して、「IAN JOHN SMITH」は、単語「IAN」の長さが4文字以内で大文字ですが、1単語の値でないため、「IJS」にイニシャル変換されます。また、「RSPCA」は長さが4文字を超えているため、「R」にイニシャル変換されます。
データ属性 |
タイプ |
目的 |
値 |
[Attribute Name].initials |
導出 |
イニシャル変換された値の新しい属性。 |
元の属性がイニシャルに変換された値。 |
なし
実行モード |
サポート |
バッチ |
Yes |
リアルタイム・モニタリング |
Yes |
リアルタイム応答 |
Yes |
「Generate Initials」トランスフォーマでは、処理に関するサマリー統計は表示されません。
データ・ビューには、各入力属性とともに、右側に新しく導出されたイニシャル変換した属性が表示されます。
なし
この例では、「Generate Initials」変換を使用して次のデフォルトの構成で会社名をイニシャルの値に変換します。
Delimiters Reference Data: 使用しない
Delimiters: スペース
Ignore upper case single words of length: 4
「BMW」は大文字で構成される3文字の単一語であるため、すでにイニシャルで表現されているとみなされ、「B」にイニシャル変換されないことに注意してください。
Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.