5.1 Oracle Machine Learning for Rを使用したデータベースのデータの準備
OML4Rを使用して、データベースで分析用のデータを準備できます。
データ準備については、次の各トピックで説明します。
- データベースでのデータの準備について
Oracle Machine Learning for Rには、Rを使用して分析用のデータベース・データを準備できる関数が用意されています。 - データの選択
分析用のデータの準備の一般的なステップは、大規模なデータセットから対象の値を選択またはフィルタ処理することです。 - データの索引付け
整数ベクターまたは文字列ベクターを使用して、順序付けられたore.frame
オブジェクトに索引付けできます。 - データの結合
merge
関数を使用して、データベース表を表すore.frame
オブジェクトのデータを結合できます。 - ore.summaryによるデータの集計
ore.summary
関数は、記述統計を計算し、柔軟な行の集計とともに、ore.frame
内の列の広範な分析をサポートします。 - データの変換
分析用のデータの準備での一般的なステップは、データを再フォーマットするか新しい列を導出してデータセットに追加することによってデータを変換することです。 - データのサンプリング
サンプリングは統計分析の重要な機能です。 - データのパーティション化
大規模なデータセットの分析での通常の操作は、データセットをランダムにサブセットにパーティション化することです。 - 時系列データの準備
OML4Rでは、時系列データに対して、データのフィルタ処理、順序付け、変換などの多数のデータの準備操作を実行できます。
親トピック: データベースでのデータの準備および探索