機械翻訳について

3.2.1 データのロード

SHスキーマからデータ・セットにアクセスし、属性を理解するためにデータを探索します。

データへのアクセス

SHスキーマで使用可能なCUSTOMERS表およびSUPPLEMENTARY_DEMOGRAPHICS表を使用します。

SHスキーマのCUSTOMERS表の詳細は、SH.CUSTOMERSを参照してください。

次の表に、SUPPLEMENTARY_DEMOGRAPHICSの属性に関する情報を示します。

属性名 データ型 情報
CUST_ID 数値 顧客のID
EDUCATION 文字 学歴
OCCUPATION 文字 顧客の職業
HOUSEHOLD_SIZE 文字 居住者数
YRS_RESIDENCE 数値 顧客が現在の居住地に住んでいた年数
AFFINITY_CARD 文字 顧客がアフィニティ・カードを保持しているかどうかを示します。

1は「はい」を意味します。0は「いいえ」を意味します

BULK_PACK_DISKETTES 文字 製品。 顧客がバルク・パケットを購入したかどうかを示します。

1は「はい」を意味します。0は「いいえ」を意味します

FLAT_PANEL_MONITOR 文字 製品。 顧客がフラット・パネル・モニターを購入したかどうかを示します。

1は「はい」を意味します。0は「いいえ」を意味します

HOME_THEATER_PACKAGE 文字 製品。 顧客がホーム・シアター・パッケージを購入したかどうかを示します。

1は「はい」を意味します。0は「いいえ」を意味します

BOOKKEEPING_APPLICATION 文字 製品。 顧客が経理アプリケーションを購入したかどうかを示します。

1は「はい」を意味します。0は「いいえ」を意味します

PRINTER_SUPPLIES 文字 製品。 顧客がプリンタを購入したかどうかを示します。

1は「はい」を意味します。0は「いいえ」を意味します

Y_BOX_GAMES 文字 製品。 顧客がYBoxゲームを購入したかどうかを示します。

1は「はい」を意味します。0は「いいえ」を意味します

OS_DOC_SET_KANJI 文字 製品。 顧客がオペレーティング・システム・ドキュメントの漢字文字セットを購入したかどうかを示します。

1は「はい」を意味します。0は「いいえ」を意味します

COMMENTS 文字 顧客からのコメント

OML4Rを使用してRからデータベース・データにアクセスするには、まず、データベース表、ビューまたは問合せを表すプロキシ・オブジェクトをRに作成する必要があります。 この例では、プロキシ・オブジェクトは問合せを使用して作成されます。 SUPPLEMENTARY_DEMOGRAPHICSおよびCUSTOMERSのプロキシ・オブジェクトを作成し、キー列(この場合はCUST_ID)の内部結合によってマージします。 データを評価して、データ型とデータ品質の問題を特定します。 欠落値、外れ値の数値、またはラベルが矛盾するカテゴリ値を探します。

  1. OMLノートブック(または同様のノートブック環境)のRインタプリタ段落で(%rを使用して)次のコマンドを実行して、Oracle Machine Learning for Rライブラリをインポートし、行の順序付けに関する警告を抑制します。 または、このコードは、RコマンドラインまたはRStudioなどのツールから実行できます。
    library(ORE)
    options(ore.warn.order=FALSE)
  2. ore.sync関数では、SHスキーマ・データベース表のCUSTOMERS表のプロキシであるore.frameオブジェクトを作成します。
    このイメージは、Customersデータ・セットの最初の数行を示しています。

  3. ore.sync関数では、SHスキーマ・データベース表のSUPPLEMENTARY DEMOGRAPHICS表のプロキシであるore.frameオブジェクトを作成します。
    ore.sync(query = c("SUPPLEMENTARY_DEMOGRAPHICS" = "select CUST_ID, HOUSEHOLD_SIZE, YRS_RESIDENCE, TO_CHAR(Y_BOX_GAMES) Y_BOX_GAMES from SH.SUPPLEMENTARY_DEMOGRAPHICS"))
    # The TO_CHAR function is used to have Y_BOX_GAMES treated as a categorical variable, not a numeric variable.
    z.show(head(SUPPLEMENTARY_DEMOGRAPHICS))

    このイメージは、補足統計データ・セットの最初の数行を示しています。