7.1.1 データベースでのデータの準備について
OML4Pyデータ型クラスには、Pythonを使用して分析用のデータベース・データを準備できるメソッドが用意されています。
データベース内の大量のデータに対してデータ準備操作を実行し、そのデータを引き続きデータベース内で操作したり、結果のサブセットをローカルPythonセッションにプルできます。たとえば、そこでサードパーティのPythonパッケージを使用して他の操作を実行できます。
次の表に、一般的なデータ準備タスクを実行できるメソッドをリストし、OML4Pyデータ型クラスがそのメソッドをサポートしているかどうかを示します。
表7-1 データ型でサポートされているメソッド
メソッド | 説明 | oml.Boolean | oml.Bytes | oml.Float | oml.String | oml.DataFrame |
---|---|---|---|---|---|---|
append |
同じクラスの別のoml データ・オブジェクトをoml オブジェクトに追加します。
|
|||||
ceil |
oml.Float 系列データ・オブジェクト内の各要素の小数点以下を切り上げます。
|
|||||
concat |
oml データ・オブジェクトを他の1つ以上のデータ・オブジェクトと列単位で結合します。
|
|||||
count_pattern |
各文字列におけるパターンの出現回数をカウントします。 | |||||
create_view |
OML4Pyデータ・オブジェクトで表されるデータのOracle Databaseビューを作成します。 | |||||
dot |
現在のoml.Float オブジェクトと別のoml.Float との内積を計算するか、oml.DataFrame でマトリックス乗算を行います。
|
|||||
drop |
oml.DataFrame 内の指定された列を削除します。
|
|||||
drop_duplicates |
重複する要素をoml 系列データ・オブジェクトから削除するか、重複する行をoml.DataFrame から削除します。
|
|||||
dropna |
欠損要素をoml 系列データ・オブジェクトから削除するか、欠損値を含む行をoml.DataFrame から削除します。
|
|||||
exp |
e を底とする、oml.Float 系列データ・オブジェクト内の値のべき乗を要素単位で計算します。
|
|||||
find |
部分文字列が見つかった各文字列内で開始索引以上の最小の索引を検索します。 | |||||
floor |
|
|||||
head |
oml 系列データ・オブジェクトの最初のn個の要素またはoml.DataFrame の最初のn行を返します。
|
|||||
KFold |
oml データ・オブジェクトを連続するk個のフォールドにランダムに分割します。
|
|||||
len |
oml.Bytes またはoml.String 系列データ・オブジェクト内の各文字列の長さを計算します。
|
|||||
log |
指定された底に対する、oml.Float 系列データ・オブジェクト内の値の要素単位の対数を計算します。
|
|||||
materialize |
OML4Pyプロキシ・オブジェクト(ビュー、表など)で表される内容をOracle Databaseの表にプッシュします。 | |||||
merge |
別のoml.DataFrame をoml.DataFrame に結合します。
|
|||||
replace |
既存の値を別の値に置き換えます。 | |||||
rename |
oml.DataFrame の列の名前を変更します。
|
|||||
round |
oml.Float 値を指定の小数点以下の桁数に丸めます。
|
|||||
select_types |
oml データ型に基づいて包含または除外される列のサブセットを返します。
|
|||||
split |
|
|||||
sqrt |
oml.Float 系列データ・オブジェクト内の各要素の平方根を計算します。
|
|||||
tail |
oml 系列データ・オブジェクトの最後のn個の要素またはoml.DataFrame の最後のn行を返します。
|
親トピック: データの準備