7.1.1 データベースでのデータの準備について

OML4Pyデータ型クラスには、Pythonを使用して分析用のデータベース・データを準備できるメソッドが用意されています。

データベース内の大量のデータに対してデータ準備操作を実行し、そのデータを引き続きデータベース内で操作したり、結果のサブセットをローカルPythonセッションにプルできます。たとえば、そこでサードパーティのPythonパッケージを使用して他の操作を実行できます。

次の表に、一般的なデータ準備タスクを実行できるメソッドをリストし、OML4Pyデータ型クラスがそのメソッドをサポートしているかどうかを示します。

表7-1 データ型でサポートされているメソッド

メソッド 説明 oml.Boolean oml.Bytes oml.Float oml.String oml.DataFrame
append 同じクラスの別のomlデータ・オブジェクトをomlオブジェクトに追加します。 はい はい はい はい はい
ceil oml.Float系列データ・オブジェクト内の各要素の小数点以下を切り上げます。 いいえ いいえ はい いいえ いいえ
concat omlデータ・オブジェクトを他の1つ以上のデータ・オブジェクトと列単位で結合します。 はい はい はい はい はい
count_pattern 各文字列におけるパターンの出現回数をカウントします。 いいえ いいえ いいえ はい いいえ
create_view OML4Pyデータ・オブジェクトで表されるデータのOracle Databaseビューを作成します。 いいえ いいえ いいえ いいえ はい
dot 現在のoml.Floatオブジェクトと別のoml.Floatとの内積を計算するか、oml.DataFrameでマトリックス乗算を行います。 いいえ いいえ はい いいえ いいえ
drop oml.DataFrame内の指定された列を削除します。 いいえ いいえ いいえ いいえ はい
drop_duplicates 重複する要素をoml系列データ・オブジェクトから削除するか、重複する行をoml.DataFrameから削除します。 はい はい はい はい はい
dropna 欠損要素をoml系列データ・オブジェクトから削除するか、欠損値を含む行をoml.DataFrameから削除します。 はい はい はい はい はい
exp eを底とする、oml.Float系列データ・オブジェクト内の値のべき乗を要素単位で計算します。 いいえ いいえ はい いいえ いいえ
find 部分文字列が見つかった各文字列内で開始索引以上の最小の索引を検索します。 いいえ いいえ いいえ はい いいえ
floor

oml.Float系列データ・オブジェクト内の各要素の小数点以下を切り捨てます。

いいえ いいえ はい いいえ いいえ
head oml系列データ・オブジェクトの最初のn個の要素またはoml.DataFrameの最初のn行を返します。 はい はい はい はい はい
KFold omlデータ・オブジェクトを連続するk個のフォールドにランダムに分割します。 はい はい はい はい はい
len oml.Bytesまたはoml.String系列データ・オブジェクト内の各文字列の長さを計算します。 いいえ はい いいえ はい いいえ
log 指定された底に対する、oml.Float系列データ・オブジェクト内の値の要素単位の対数を計算します。 いいえ いいえ はい いいえ いいえ
materialize OML4Pyプロキシ・オブジェクト(ビュー、表など)で表される内容をOracle Databaseの表にプッシュします。 いいえ いいえ いいえ いいえ はい
merge 別のoml.DataFrameoml.DataFrameに結合します。 いいえ いいえ いいえ いいえ はい
replace 既存の値を別の値に置き換えます。 いいえ いいえ はい はい はい
rename oml.DataFrameの列の名前を変更します。 いいえ いいえ いいえ いいえ はい
round oml.Float値を指定の小数点以下の桁数に丸めます。 いいえ いいえ はい いいえ いいえ
select_types omlデータ型に基づいて包含または除外される列のサブセットを返します。 いいえ いいえ いいえ いいえ はい
split

omlデータ・オブジェクトを複数のセットにランダムに分割します。

はい はい はい はい はい
sqrt oml.Float系列データ・オブジェクト内の各要素の平方根を計算します。 いいえ いいえ はい いいえ いいえ
tail oml系列データ・オブジェクトの最後のn個の要素またはoml.DataFrameの最後のn行を返します。 はい はい はい はい はい