データ・フローでのビン化列の作成

メジャーをビン化すると、メジャーの値に基づいて新しい列を作成して、データを分類できます。たとえば、数値を低、中、高の3つのビンに分類できます。

「ステップ・エディタ」ペインで「ビン」ステップを使用して、ビン・カテゴリを作成します。
  1. ビン列を作成するデータ・フローを作成するかまたは開きます。
  2. 「ステップの追加(+)」をクリックして「ビン」を選択します。
    あるいは、「列の追加」を選択してから(+)列をクリックして「ビン」を選択できます。
  3. 分類する列を選択します。
  4. 「ビン」ペインで、ビン列のオプションを指定します。
    フィールド 説明
    Bin ステップ3で選択した列が表示されます。別の列に変更するには、列名をクリックして別の列を選択します。
    新規要素名 提示された新しい列名を変更せず保持するか、この値を編集して新しい列名を変更します。
    ビン数 データを分類するビンの数を指定します。
    メソッド データ境界の計算方法を指定します。
    • 「手動」メソッドでは、範囲はビンの数で分割されます。
    • 「等幅」メソッドで、ヒストグラム範囲は同じサイズの間隔で分割されます。等幅のビン化の場合、列値が測定され、範囲が等しいサイズの間隔に分割されます。エッジのビンは列内の非常に低い値または高い値にあわせることができます。
    • 「等高」メソッドでは、各ビンの高さは同じまたはほんのわずかに異なりますが、ヒストグラム範囲は同じです。等高または頻度のビン化の場合、各ビンの間隔は、ほぼ等しい数の要素(レコード)を含む各間隔に基づいています。「等高」メソッドはスキュー・データの場合に特に優先されます。
    ヒストグラム・ビュー 選択された「方法」に基づいて、ビンのヒストグラム範囲(幅)およびヒストグラム数(高さ)が更新されます。
    リスト・ビュー 「手動」メソッドを選択した場合、ビンの名前を変更でき、各ビンの範囲を定義できます。

    変更に基づいて、データ・プレビュー(たとえば、ビン列名)が更新されます。

  5. 「保存」をクリックします。