照合変換: 余りの丸め

「余りの丸め」変換を使用すると、互いに近い数値を同じクラスタに挿入できるように、数値を端数処理し、端数処理済の数値の両端に追加の数字を作成できます。

「余りの丸め」変換は比較内では使用できないことに注意してください。

「余りの丸め」変換は、様々な精度の数値データがあるときに、端数処理済の値の両端に追加のクラスタ値を付加して、各数値の概数を使用してクラスタリングする場合に使用します。

「余りの丸め」は、単一の数値に端数処理することに伴う問題を回避するために効果的です。たとえば、他の数値との差異が特定範囲内の数値を含むすべてのレコードを同じクラスタに挿入する場合、すべての数値を単一の値に端数処理すると、実現が難しくなる可能性があります。

たとえば、差異が10以内のすべての数値を同じクラスタに挿入するというルールがある場合、数値32と41は同じクラスタに属する必要があります。しかし、従来の「端数処理」変換を使用した場合、10の位に切り捨てまたは四捨五入を行うと、これらはそれぞれ30と40のグループに挿入され、切上げを行うと、それぞれグループ40と50に挿入されます。しかし、「余りの丸め」変換を使用すると、入力値ごとに複数のクラスタ値を生成して、これらを同じグループに挿入することができます。この場合、値32と41を10の位に端数処理すると、32はグループ20、30および40に挿入され、41はグループ30、40および50に挿入されます。

次の表に、構成オプションを示します。

構成 説明

オプション

次のオプションを指定します。

  • 一番近い値に丸める: 整数を指定の位(10の位、100の位など)の概数に端数処理できます。タイプ: 整数デフォルト値: 10。

  • 端数処理タイプ: 実行する端数処理(切上げ、切捨て、または整数に四捨五入)を決定します。タイプ: 選択(上方/下方/一番近い値)。デフォルト値: 一番近い値。

  • トークンの数: 作成する固有のクラスタ値(トークン)の数を決定します。端数処理済の数値に加えて常に両端の追加の数値も出力されるため、奇数である必要があります。たとえば、これを3に設定し、10の位に端数処理した場合、値99では端数処理済の値100と、追加の値90および110が出力されます。タイプ: 整数(奇数にする必要があります)。デフォルト値: 1。

この例では、「余りの丸め」変換を使用して、互いの差異が10以内のすべての数値が常に同じクラスタに属するように整数値を端数処理します。

サンプル構成

一番近い値に丸める: 5

端数処理タイプ: 一番近い値

トークンの数: 3

変換例

次の表に、前述の構成を使用した変換の例を示します。

表1-93 「余りの丸め」変換の例

変換後の値

1

1 - 0

2 - 5

3 - -5

11

1 - 10

2 - 5

3 - 15

14

1 - 15

2 - 10

3 - 20

26

1 - 25

2 - 20

3 - 30

36

1 - 35

2 - 30

3 - 40

44

1 - 45

2 - 40

3 - 50

61

1 - 60

2 - 55

3 - 65

70

1 - 70

2 - 65

3 - 75

変換後に共通のクラスタ値を共有するレコードはすべて同じクラスタに属します。たとえば、前述の最初の2つのレコードはクラスタ'5'に属し、最後の2つのレコードはクラスタ・グループ'65'に属します。