8.1.5.1 ターゲット変数の定義
ターゲット変数(y)は、従属変数またはラベルとも呼ばれ、機械学習モデルが予測または分類することを目的とした結果です。
ターゲット変数(y)には、OMLオブジェクトまたは文字列を指定できます。
- ターゲット変数(y)が単一列のOMLオブジェクトの場合、yで指定されたターゲット値は入力データ(x)と互換性がある必要があります。つまり、同じ構造(同じ行数など)を持つ必要があります。
- ターゲット変数(y)が文字列の場合、モデルのターゲット値(ラベル)を含むxの列名を表します。この場合、xにはyで指定された名前の列が含まれ、トレーニングまたは予測のターゲットとして使用されます。
例8-9 OMLオブジェクトまたは文字列としてのターゲット変数
この例では、ターゲット変数を指定する2つの異なる方法を示します。
import oml
import pandas as pd
from sklearn import datasets
# Create training and test datasets with the target variable specified as an OML object.
dat = oml.sync(table = 'IRIS').split()
train_x = dat[0].drop('Species')
train_y = dat[0]['Species']
test_dat = dat[1]
# Create training and test datasets with the target variable specified as a string.
dat = oml.sync(table = 'IRIS').split()
train_dat = dat[0]
train_y = 'Species'
test_dat = dat[1]
親トピック: データの分割