7.2 データの探索
OML4Pyには、探索的データ分析および一般的な統計操作を実行できるメソッドが用意されています。
次の各トピックでこれらのメソッドについて説明します。
- 探索的データ分析メソッドについて
OML4Pyには、探索的データ分析を実行できるメソッドが用意されています。 - データの相互関連付け
corr
メソッドを使用して、oml.DataFrame
オブジェクト内で可能であれば列を横断してピアソン、スピアマンまたはケンドール相関分析を実行します。 - データのクロス集計
crosstab
メソッドを使用してoml.DataFrame
オブジェクトのクロス集計分析を実行し、pivot_table
メソッドを使用してoml.DataFrame
をスプレッドシート形式のピボット・テーブルに変換します。 - データのミューテーション
分析用のデータを準備する際の一般的な操作は、データの書式を再設定するか、新しい列を導出してデータセットに追加することによって、データをミューテーションすることです。 - データのソート
sort_values
関数では、by引数で指定した1つ以上の列に従ってoml.DataFrame
を柔軟にソートでき、oml.DataFrame
が返されます。 - データの集計
describe
メソッドは、各列のデータの中心傾向、分散および形状を要約する記述統計を計算します。
親トピック: データの準備および探索