「Generate Initials」変換を使用すると、識別子をイニシャル変換した値を使用して、レコードをクラスタリングしたり照合できます。たとえば、「BMW」と「Bayerische Motoren Werke」を照合する場合です。これは、メインの「Generate Initials」プロセッサと完全に同じ方法で機能します。
「Generate Initials」変換は、識別子を構成するときにイニシャル変換されることが多い会社名などの名称を照合するときに使用します。これは、「International Business Machines」と「IBM」のようなマッチを検索する場合に役立ちます。この場合、最初に各値をイニシャル変換しないと、コンピュータで照合することは困難です。「IBM」のような短い単語が「I」にイニシャル変換されないようにするオプションも含まれています。
オプション |
タイプ |
目的 |
デフォルト値 |
参照データ |
イニシャルの生成前に単語を区切るために使用される文字の標準セットを使用できます。 |
*Delimiters |
|
Delimiter characters |
自由形式テキスト |
イニシャルの生成前に単語を区切るために使用される文字の追加セットを指定します。 |
スペース |
整数 |
「Generate Initials」プロセッサでは、すべて大文字でこの文字数以内の1単語の値(つまり、単語の区切りがない)を変換しません(たとえば、「IBM」)。 後述の注意を参照してください。 |
4 |
注意: 通常、「Generate Initials」変換では、元の値の大/小文字は無視され、指定のデリミタで区切られた各単語が検出されて大文字のイニシャルが生成されます。たとえば、値「A j Smith」、「ALAN JOHN SMITH」および「Alan john smith」はすべての「AJS」にイニシャル変換されます。ただし、「PWC」、「IBM」、「BT」のようにすでにイニシャル変換されている値もあり、これらは「P」、「I」、「B」にイニシャル変換する必要はありません。 |
これらは、次の条件によって識別できます。
「Ignore upper case single words of length」オプションを使用すると、値が大文字の1単語の場合、その単語が何文字以内のときにイニシャル変換しないかを指定できます。
たとえば、4に設定した場合、値「PWC」、「BT」、「RSPB」および「IBM」は、長さが4文字以内で、1単語の値で大文字であるため、イニシャル変換プロセスで無視されます。これに対して、「IAN JOHN SMITH」は、単語「IAN」の長さが4文字以内で大文字ですが、1単語の値でないため、「IJS」にイニシャル変換されます。また、「RSPCA」は長さが4文字を超えているため、「R」にイニシャル変換されます。
構成例
この例では、「Generate Initials」変換を「Exact String match」比較内で使用して、会社名(値がイニシャル変換されることが多い)を照合します。
Delimiters Reference Data: なし
Delimiter characters: <スペース>
Ignore upper case single words of length: 5
「Generate Initials」変換の前に、次の2つの変換が使用されます。
1. Upper Case - すべての値を大文字に変換します。
2. Strip Words - 値から特定の単語を削除します。使用される参照データには、単語「PLC」が含まれています。
変換例
次の表に、前述の構成を使用した変換の例を示します。
値 |
「Upper Case」および「Strip Words」変換後の値 |
「Generate Initials」変換後の値 |
IBM |
IBM |
IBM |
I.B.M. |
I.B.M. |
IBM |
International Business Machines |
INTERNATIONAL BUSINESS MACHINES |
IBM |
PWC |
PWC |
PWC |
Price waterhouse coopers |
PRICE WATERHOUSE COOPERS |
PWC |
Price Waterhouse Coopers |
PRICE WATERHOUSE COOPERS |
PWC |
PRICE WATERHOUSE COOPERS |
PRICE WATERHOUSE COOPERS |
PWC |
British Telecom Plc |
BRITISH TELECOM |
BT |
BT plc |
BT |
BT |
BARKERS plc |
BARKERS |
B |
BARKERS & LEWIS plc |
BARKERS & LEWIS |
B&L |
Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.