5.2 データの探索
Oracle Machine Learning for Rには、探索的データ分析を実行できる関数があります。
関数およびその使用について、次の各項で説明します。
- 探索的データ分析関数について
探索的データ分析用のOML4Rの関数は、OREeda
パッケージにあります。 - サンプルのNARROWデータセットについて
探索的データ分析関数の多くの例で、NARROW
データセットを使用します。 - データの相互関連付け
ore.corr
関数を使用して相関分析を実行できます。 - データのクロス集計
クロス集計は、値からなる2つの表の間の相互依存関係を見つける統計手法です。 - クロス集計の頻度の分析
ore.freq
関数は、ore.crosstab
関数の出力を分析し、ore.crosstab
の結果に関連する手法を自動的に判別します。 - 時系列データでの指数平滑法モデルの構築
ore.esm
関数は、順序付けられたore.vector
オブジェクトで、インデータベース時系列観測のための単純または二重の指数平滑化モデルを構築します。 - データのランキング
ore.rank
関数は、ore.frame
の数値列の値の分布を分析します。 - データのソート
ore.sort
関数は、by
引数で指定した1つ以上の列によるデータ・フレームの柔軟なソートを可能にします。 - ore.summaryによるデータの集計
ore.summary
関数は、記述統計を計算し、柔軟な行の集計とともに、ore.frame
内の列の広範な分析をサポートします。 - 数値変数の分布の分析
ore.univariate
関数は、ore.frame
の数値変数の分布分析を提供します。 - 主要コンポーネント分析
オーバーロードされたprcomp
関数およびprincomp
関数は、主要コンポーネント分析をデータベースで並行して実行します。 - 特異値分解
オーバーロードされたsvd
関数は、特異値分解をデータベースで並行して実行します。
親トピック: データベースでのデータの準備および探索