- Oracle Analytics Desktopユーザーズ・ガイド
- データ・フローを使用したデータのキュレート
- ステップの使用
- データ・フローでのビン化列の作成
データ・フローでのビン化列の作成
ビンを使用すると、メジャーの値に基づいて新しい列を作成して、データを分類できます。たとえば、RISK
の値を低、中、高の3つのビンに分類できます。
データ・フロー・エディタの「ビン」ステップを使用します。
- 「ステップの追加(+)」をクリックして「ビン」を選択します。「列の追加」ステップを使用して列を追加するときにビンを作成することもできます。
- 値を分類する列を選択します。
- 「ビン」ペインのオプションを使用してビンを構成します:
フィールド 説明 Bin ステップ2で選択した列が表示されます。別の列に値を分類するには、列名をクリックして別の列を選択します。 新規要素名 提示された新しい列名を変更せず保持するか、この値を編集して新しい列名を変更します。 ビン数 データを分類するビンの数を指定します。 メソッド データ境界の計算方法を指定します。 - 「手動」メソッドでは、範囲はビンの数で分割されます。
- 「等幅」メソッドで、ヒストグラム範囲は同じサイズの間隔で分割されます。等幅のビン化の場合、列値が測定され、範囲が等しいサイズの間隔に分割されます。エッジのビンは列内の非常に低い値または高い値にあわせることができます。
- 「等高」メソッドでは、各ビンの高さは同じまたはほんのわずかに異なりますが、ヒストグラム範囲は同じです。等高または頻度のビン化の場合、各ビンの間隔は、ほぼ等しい数の要素(レコード)を含む各間隔に基づいています。「等高」メソッドはスキュー・データの場合に特に優先されます。
ヒストグラム・ビュー 選択された「方法」に基づいて、ビンのヒストグラム範囲(幅)およびヒストグラム数(高さ)が更新されます。 リスト・ビュー 「手動」メソッドを選択した場合、ビンの名前を変更でき、各ビンの範囲を定義できます。 変更に基づいて、データ・プレビュー(たとえば、ビン列名)が更新されます。