8.1.5.1 ターゲット変数の定義

ターゲット変数(y)は、従属変数またはラベルとも呼ばれ、機械学習モデルが予測または分類することを目的とした結果です。

ターゲット変数(y)には、OMLオブジェクトまたは文字列を指定できます。
  • ターゲット変数(y)が単一列のOMLオブジェクトの場合、yで指定されたターゲット値は入力データ(x)と互換性がある必要があります。つまり、同じ構造(同じ行数など)を持つ必要があります。
  • ターゲット変数(y)が文字列の場合、モデルのターゲット値(ラベル)を含むxの列名を表します。この場合、xにはyで指定された名前の列が含まれ、トレーニングまたは予測のターゲットとして使用されます。

例8-9 OMLオブジェクトまたは文字列としてのターゲット変数

この例では、ターゲット変数を指定する2つの異なる方法を示します。

import oml
import pandas as pd
from sklearn import datasets 

# Create training and test datasets with the target variable specified as an OML object.
dat = oml.sync(table = 'IRIS').split()
train_x = dat[0].drop('Species')
train_y = dat[0]['Species']
test_dat = dat[1]

# Create training and test datasets with the target variable specified as a string.
dat = oml.sync(table = 'IRIS').split()
train_dat = dat[0]
train_y = 'Species'
test_dat = dat[1]