照合変換: 文字列を数値に変換

「文字列を数値に変換」変換を使用すると、クラスタリングの際に、文字列属性に格納された数値を実際の数値属性に変換できます。

これはメインの文字列を数値に変換プロセッサとまったく同様に機能します。ただし、クラスタ化の目的でのみ適用することをお薦めします。

「文字列を数値に変換」は比較内では使用できないことに注意してください。

「文字列を数値に変換」変換は、(たとえば、データをテキスト・ファイルまたは特定のデータ型付けのない他の書式からインポートしたために)数値が文字列識別子に格納されているときに、形式化された日付値に基づいてクラスタリングする場合に使用します。数値として認識されない値はすべてNull値に変換されることに注意してください。

テキスト・フィールドに数多くの数値の表現があり、変換の結果を確認する必要がある場合は、照合の前にメインの文字列を数値に変換プロセッサを使用する必要があります。

次の表に、構成オプションを示します。

構成 説明

オプション

次のオプションを指定します。

  • 数値書式参照データ: 様々な書式の数値を認識します。タイプ: 参照データ(「数値の書式設定」カテゴリ)。デフォルト値: *数値書式。

この例では、データはテキスト・ファイルからインポートされたため、すべての属性は文字列型です。データ型プロファイリング(「データ型プロファイラ」を参照)で、属性の1つに、電話番号の市外局番に対応する数値が含まれることがわかりました。クラスタリングの際に、データは数値書式に変換されます。

サンプル構成

数値書式参照データ: *数値書式

変換例

次の表に、前述の構成を使用した変換の例を示します。

表1-78 「文字列を数値に変換」変換の例

変換済の値

01223743984 (文字列)

1223743984 (数値)

029 (文字列)

29 (数値)

+44(0)1223

Null (数値)

(01784)

Null (数値)