機械翻訳について

データ・フローでのビン列の作成

メジャーをビン化すると、メジャーの値に基づいて新しい列が作成されます。 一定の数の等しいサイズのビン(各ビンに同じ数の値など)を作成するか、各ビンに値の範囲を明示的に指定することによって、ビンに値を動的に割り当てることができます。

「ステップ・エディタ」ペインにビン・ステップを追加できます。
  1. ビン列を作成するデータ・フローを作成するか開きます。
  2. 「ステップ(+)を追加」をクリックし、「ビン」を選択します。
    または、「列の追加」を選択し、「(+)列」をクリックして「ビン」を選択します。
  3. 「ビン」ペインで、「列の選択」をクリックします。
  4. 「使用可能な列」ダイアログで、データ要素を選択します。
  5. ビンペインで、bin列のオプションを指定します。
    フィールド 説明
    Bin 別のデータ要素を選択してください。
    新規要素名 ビン列の名前を変更します。
    ビン数 数字を入力するか、矢印を使用してビン数を増減します。
    メソッド 「手動」「等幅」、または「等高」のいずれかのメソッドを選択します。
    ヒストグラム・ビュー 「メソッド」フィールドでの選択に基づいて、ビンのヒストグラム範囲(幅)およびヒストグラム数(高さ)が更新されます。
    • 「手動」メソッドでは、スライダを移動して境界(つまり、ヒストグラム範囲およびヒストグラム数)を選択できます。 スライダの数は、ヒストグラム数に基づいて変更されます。 リスト・ビューに切り替えて、ビン名とともに範囲を手動で入力できます。

    • 「等幅」メソッドでは、ヒストグラムの範囲は同じサイズの間隔に分割されています。 等幅のビニングの場合、列値が測定され、範囲が等しいサイズの間隔に分割されます。 エッジ・ビンには、列の非常に低い値または非常に高い値を収容できます。

    • 「等高」メソッドでは、各ビンの高さは同じかわずかに異なりますが、ヒストグラム範囲は同じです。 高さまたは頻度の同じビニングの場合、各ビンの間隔は、ほぼ等しい数の要素(レコード)を含む各間隔に基づきます。 「等高」メソッドは、偏ったデータに特に適しています。

    リスト・ビュー 「手動」メソッドを選択すると、ビンの名前を変更したり、各ビンの範囲を定義できます。

    変更に基づいて、データ・プレビュー(ビン列名など)が更新されます。

  6. 保存をクリックします。