7.1.1 データベースでのデータの準備について
OML4Pyデータ型クラスには、Pythonを使用して分析用のデータベース・データを準備できるメソッドが用意されています。
データベース内の大量のデータに対してデータ準備操作を実行し、そのデータを引き続きデータベース内で操作したり、結果のサブセットをローカルPythonセッションにプルできます。たとえば、そこでサードパーティのPythonパッケージを使用して他の操作を実行できます。
次の表に、一般的なデータ準備タスクを実行できるメソッドをリストし、OML4Pyデータ型クラスがそのメソッドをサポートしているかどうかを示します。
表7-1 データ型でサポートされているメソッド
| メソッド | 説明 | oml.Boolean | oml.Bytes | oml.Float | oml.String | oml.DataFrame |
|---|---|---|---|---|---|---|
append |
同じクラスの別のomlデータ・オブジェクトをomlオブジェクトに追加します。
|
|||||
ceil |
oml.Float系列データ・オブジェクト内の各要素の小数点以下を切り上げます。
|
|||||
concat |
omlデータ・オブジェクトを他の1つ以上のデータ・オブジェクトと列単位で結合します。
|
|||||
count_pattern |
各文字列におけるパターンの出現回数をカウントします。 | |||||
create_view |
OML4Pyデータ・オブジェクトで表されるデータのOracle Databaseビューを作成します。 | |||||
dot |
現在のoml.Floatオブジェクトと別のoml.Floatとの内積を計算するか、oml.DataFrameでマトリックス乗算を行います。
|
|||||
drop |
oml.DataFrame内の指定された列を削除します。
|
|||||
drop_duplicates |
重複する要素をoml系列データ・オブジェクトから削除するか、重複する行をoml.DataFrameから削除します。
|
|||||
dropna |
欠損要素をoml系列データ・オブジェクトから削除するか、欠損値を含む行をoml.DataFrameから削除します。
|
|||||
exp |
eを底とする、oml.Float系列データ・オブジェクト内の値のべき乗を要素単位で計算します。
|
|||||
find |
部分文字列が見つかった各文字列内で開始索引以上の最小の索引を検索します。 | |||||
floor |
|
|||||
head |
oml系列データ・オブジェクトの最初のn個の要素またはoml.DataFrameの最初のn行を返します。
|
|||||
KFold |
omlデータ・オブジェクトを連続するk個のフォールドにランダムに分割します。
|
|||||
len |
oml.Bytesまたはoml.String系列データ・オブジェクト内の各文字列の長さを計算します。
|
|||||
log |
指定された底に対する、oml.Float系列データ・オブジェクト内の値の要素単位の対数を計算します。
|
|||||
materialize |
OML4Pyプロキシ・オブジェクト(ビュー、表など)で表される内容をOracle Databaseの表にプッシュします。 | |||||
merge |
別のoml.DataFrameをoml.DataFrameに結合します。
|
|||||
replace |
既存の値を別の値に置き換えます。 | |||||
rename |
oml.DataFrameの列の名前を変更します。
|
|||||
round |
oml.Float値を指定の小数点以下の桁数に丸めます。
|
|||||
select_types |
omlデータ型に基づいて包含または除外される列のサブセットを返します。
|
|||||
split |
|
|||||
sqrt |
oml.Float系列データ・オブジェクト内の各要素の平方根を計算します。
|
|||||
tail |
oml系列データ・オブジェクトの最後のn個の要素またはoml.DataFrameの最後のn行を返します。
|
親トピック: データの準備