7.2 データの探索
OML4Pyには、探索的データ分析および一般的な統計操作を実行できるメソッドが用意されています。
次の各トピックでこれらのメソッドについて説明します。
- 探索的データ分析メソッドについて
OML4Pyには、探索的データ分析を実行できるメソッドが用意されています。 - データの相互関連付け
corrメソッドを使用して、oml.DataFrameオブジェクト内で可能であれば列を横断してピアソン、スピアマンまたはケンドール相関分析を実行します。 - データのクロス集計
crosstabメソッドを使用してoml.DataFrameオブジェクトのクロス集計分析を実行し、pivot_tableメソッドを使用してoml.DataFrameをスプレッドシート形式のピボット・テーブルに変換します。 - データのミューテーション
分析用のデータを準備する際の一般的な操作は、データの書式を再設定するか、新しい列を導出してデータセットに追加することによって、データをミューテーションすることです。 - データのソート
sort_values関数では、by引数で指定した1つ以上の列に従ってoml.DataFrameを柔軟にソートでき、oml.DataFrameが返されます。 - データの集計
describeメソッドは、各列のデータの中心傾向、分散および形状を要約する記述統計を計算します。
親トピック: データの準備および探索