3.2.1 データのロード
SHスキーマからデータ・セットにアクセスし、属性を理解するためにデータを探索します。
データへのアクセス
SHスキーマで使用可能なCUSTOMERS
表およびSUPPLEMENTARY_DEMOGRAPHICS
表を使用します。
SH
スキーマのCUSTOMERS
表の詳細は、SH.CUSTOMERSを参照してください。
次の表に、SUPPLEMENTARY_DEMOGRAPHICS
の属性に関する情報を示します。
属性名 | データ型 | 情報 |
---|---|---|
CUST_ID | 数値 | 顧客のID |
EDUCATION | 文字 | 学歴 |
OCCUPATION | 文字 | 顧客の職業 |
HOUSEHOLD_SIZE | 文字 | 居住者数 |
YRS_RESIDENCE | 数値 | 顧客が現在の居住地に住んでいた年数 |
AFFINITY_CARD | 文字 | 顧客がアフィニティ・カードを保持しているかどうかを示します。
1は「はい」を意味します。0は「いいえ」を意味します |
BULK_PACK_DISKETTES | 文字 | 製品。 顧客がバルク・パケットを購入したかどうかを示します。
1は「はい」を意味します。0は「いいえ」を意味します |
FLAT_PANEL_MONITOR | 文字 | 製品。 顧客がフラット・パネル・モニターを購入したかどうかを示します。
1は「はい」を意味します。0は「いいえ」を意味します |
HOME_THEATER_PACKAGE | 文字 | 製品。 顧客がホーム・シアター・パッケージを購入したかどうかを示します。
1は「はい」を意味します。0は「いいえ」を意味します |
BOOKKEEPING_APPLICATION | 文字 | 製品。 顧客が経理アプリケーションを購入したかどうかを示します。
1は「はい」を意味します。0は「いいえ」を意味します |
PRINTER_SUPPLIES | 文字 | 製品。 顧客がプリンタを購入したかどうかを示します。
1は「はい」を意味します。0は「いいえ」を意味します |
Y_BOX_GAMES | 文字 | 製品。 顧客がYBoxゲームを購入したかどうかを示します。
1は「はい」を意味します。0は「いいえ」を意味します |
OS_DOC_SET_KANJI | 文字 | 製品。 顧客がオペレーティング・システム・ドキュメントの漢字文字セットを購入したかどうかを示します。
1は「はい」を意味します。0は「いいえ」を意味します |
COMMENTS | 文字 | 顧客からのコメント |
OML4Rを使用してRからデータベース・データにアクセスするには、まず、データベース表、ビューまたは問合せを表すプロキシ・オブジェクトをRに作成する必要があります。 この例では、プロキシ・オブジェクトは問合せを使用して作成されます。 SUPPLEMENTARY_DEMOGRAPHICSおよびCUSTOMERSのプロキシ・オブジェクトを作成し、キー列(この場合はCUST_ID)の内部結合によってマージします。 データを評価して、データ型とデータ品質の問題を特定します。 欠落値、外れ値の数値、またはラベルが矛盾するカテゴリ値を探します。
- OMLノートブック(または同様のノートブック環境)のRインタプリタ段落で(%rを使用して)次のコマンドを実行して、Oracle Machine Learning for Rライブラリをインポートし、行の順序付けに関する警告を抑制します。 または、このコードは、RコマンドラインまたはRStudioなどのツールから実行できます。
library(ORE) options(ore.warn.order=FALSE)
ore.sync
関数では、SH
スキーマ・データベース表のCUSTOMERS
表のプロキシであるore.frame
オブジェクトを作成します。ore.sync
関数では、SH
スキーマ・データベース表のSUPPLEMENTARY DEMOGRAPHICS
表のプロキシであるore.frame
オブジェクトを作成します。ore.sync(query = c("SUPPLEMENTARY_DEMOGRAPHICS" = "select CUST_ID, HOUSEHOLD_SIZE, YRS_RESIDENCE, TO_CHAR(Y_BOX_GAMES) Y_BOX_GAMES from SH.SUPPLEMENTARY_DEMOGRAPHICS")) # The TO_CHAR function is used to have Y_BOX_GAMES treated as a categorical variable, not a numeric variable. z.show(head(SUPPLEMENTARY_DEMOGRAPHICS))
親トピック: クラスタリング・ユース・ケース