7.2.1 探索的データ分析メソッドについて

OML4Pyには、探索的データ分析を実行できるメソッドが用意されています。

次の表に、一般的な統計操作を実行できるOML4Pyデータ型クラスのメソッドをリストし、そのクラスがそのメソッドをサポートしているかどうかを示します。

表7-2 データ型クラスでサポートされているデータ探索メソッド

メソッド 説明 oml.Boolean oml.Bytes oml.Float oml.String oml.DataFrame
corr

係数のタイプに基づいて、可能であればoml.DataFrame内のすべての列の間の対相関を計算します。

いいえ いいえ いいえ いいえ はい
count

系列データ・オブジェクトまたはoml.DataFrameの各列におけるNULLでない要素の数を計算します。

はい はい はい はい はい
crosstab

oml.DataFrame内の2つ以上の列のクロス集計を計算します。

いいえ いいえ いいえ いいえ はい
cumsum

oml.Float系列データ・オブジェクトのソート後の累積合計、またはoml.DataFrameオブジェクトのソート後の各float列あるいはBoolean列の累積合計を計算します。

いいえ いいえ はい いいえ はい
describe

oml系列データ分布またはoml.DataFrame内の各列の中心傾向、分散および形状を要約する記述統計を計算します。

はい はい はい はい はい
kurtosis

oml.Float系列データ・オブジェクトまたはoml.DataFrame内の各float列における値の尖度を計算します。

いいえ いいえ はい いいえ はい
max

系列データ・オブジェクトまたはoml.DataFrame内の各列の最大値を返します。

はい はい はい はい はい
mean

oml.Float系列オブジェクトまたはoml.DataFrame内の各float列あるいはBoolean列における値の平均を計算します。

いいえ いいえ はい いいえ はい
median

oml.Float系列オブジェクトまたはoml.DataFrame内の各float列における値の中央値を計算します。

いいえ いいえ はい いいえ はい
min

系列データ・オブジェクトまたはoml.DataFrame内の各列の最小値を返します。

はい はい はい はい はい
nunique

系列データ・オブジェクトまたはoml.DataFrameの各列における一意の値の数を計算します。

はい はい はい はい はい
pivot_table

oml.DataFrameをスプレッドシート形式のピボット・テーブルに変換します。

いいえ いいえ いいえ いいえ はい
sort_values

系列データ・オブジェクト内の値をソートするか、oml.DataFrame内の行をソートします。

はい はい はい はい はい
skew

oml.Floatデータ系列オブジェクトまたはoml.DataFrame内の各float列における値の歪度を計算します。

いいえ いいえ はい いいえ はい
std

oml.Floatデータ系列オブジェクトまたはoml.DataFrame内の各float列あるいはBoolean列における値の標準偏差を計算します。

いいえ いいえ はい いいえ はい
sum

oml.Floatデータ系列オブジェクトまたはoml.DataFrame内の各float列あるいはBoolean列の値の合計を計算します。

いいえ いいえ はい いいえ はい