3.2.1 データのロード
SHスキーマからデータ・セットにアクセスし、属性を理解するためにデータを探索します。
データへのアクセス
SHスキーマで使用可能なCUSTOMERS表およびSUPPLEMENTARY_DEMOGRAPHICS表を使用します。
                  
SHスキーマのCUSTOMERS表の詳細は、SH.CUSTOMERSを参照してください。
                  
次の表に、SUPPLEMENTARY_DEMOGRAPHICSの属性に関する情報を示します。 
                  
| 属性名 | データ型 | 情報 | 
|---|---|---|
| CUST_ID | 数値 | 顧客のID | 
| EDUCATION | 文字 | 学歴 | 
| OCCUPATION | 文字 | 顧客の職業 | 
| HOUSEHOLD_SIZE | 文字 | 居住者数 | 
| YRS_RESIDENCE | 数値 | 顧客が現在の居住地に住んでいた年数 | 
| AFFINITY_CARD | 文字 | 顧客がアフィニティ・カードを保持しているかどうかを示します。
                                  1は「はい」を意味します。0は「いいえ」を意味します  | 
                           
| BULK_PACK_DISKETTES | 文字 | 製品。 顧客がバルク・パケットを購入したかどうかを示します。 
                                  1は「はい」を意味します。0は「いいえ」を意味します  | 
                           
| FLAT_PANEL_MONITOR | 文字 | 製品。 顧客がフラット・パネル・モニターを購入したかどうかを示します。 
                                  1は「はい」を意味します。0は「いいえ」を意味します  | 
                           
| HOME_THEATER_PACKAGE | 文字 | 製品。 顧客がホーム・シアター・パッケージを購入したかどうかを示します。 
                                  1は「はい」を意味します。0は「いいえ」を意味します  | 
                           
| BOOKKEEPING_APPLICATION | 文字 | 製品。 顧客が経理アプリケーションを購入したかどうかを示します。 
                                  1は「はい」を意味します。0は「いいえ」を意味します  | 
                           
| PRINTER_SUPPLIES | 文字 | 製品。 顧客がプリンタを購入したかどうかを示します。 
                                  1は「はい」を意味します。0は「いいえ」を意味します  | 
                           
| Y_BOX_GAMES | 文字 | 製品。 顧客がYBoxゲームを購入したかどうかを示します。 
                                  1は「はい」を意味します。0は「いいえ」を意味します  | 
                           
| OS_DOC_SET_KANJI | 文字 | 製品。 顧客がオペレーティング・システム・ドキュメントの漢字文字セットを購入したかどうかを示します。 
                                  1は「はい」を意味します。0は「いいえ」を意味します  | 
                           
| COMMENTS | 文字 | 顧客からのコメント | 
OML4Rを使用してRからデータベース・データにアクセスするには、まず、データベース表、ビューまたは問合せを表すプロキシ・オブジェクトをRに作成する必要があります。 この例では、プロキシ・オブジェクトは問合せを使用して作成されます。 SUPPLEMENTARY_DEMOGRAPHICSおよびCUSTOMERSのプロキシ・オブジェクトを作成し、キー列(この場合はCUST_ID)の内部結合によってマージします。 データを評価して、データ型とデータ品質の問題を特定します。 欠落値、外れ値の数値、またはラベルが矛盾するカテゴリ値を探します。
- OMLノートブック(または同様のノートブック環境)のRインタプリタ段落で(%rを使用して)次のコマンドを実行して、Oracle Machine Learning for Rライブラリをインポートし、行の順序付けに関する警告を抑制します。 または、このコードは、RコマンドラインまたはRStudioなどのツールから実行できます。 
library(ORE) options(ore.warn.order=FALSE) ore.sync関数では、SHスキーマ・データベース表のCUSTOMERS表のプロキシであるore.frameオブジェクトを作成します。
ore.sync関数では、SHスキーマ・データベース表のSUPPLEMENTARY DEMOGRAPHICS表のプロキシであるore.frameオブジェクトを作成します。ore.sync(query = c("SUPPLEMENTARY_DEMOGRAPHICS" = "select CUST_ID, HOUSEHOLD_SIZE, YRS_RESIDENCE, TO_CHAR(Y_BOX_GAMES) Y_BOX_GAMES from SH.SUPPLEMENTARY_DEMOGRAPHICS")) # The TO_CHAR function is used to have Y_BOX_GAMES treated as a categorical variable, not a numeric variable. z.show(head(SUPPLEMENTARY_DEMOGRAPHICS))
親トピック: クラスタリング・ユース・ケース