pyqIndexEvalファンクション(Autonomous Database)

10.6.2.6 pyqIndexEvalファンクション(Autonomous Database)

ファンクションpyqIndexEvalは、Oracle Autonomous Databaseで使用すると、データベース環境によって生成されたPythonエンジンで必要なユーザー定義Python関数を複数回実行します。

ファンクションpyqIndexEvalは、SCR_NAMEパラメータで指定されたユーザー定義Python関数を実行します。PAR_LSTパラメータは、スクリプトでレンダリングされたイメージを取得するための特別な制御引数oml_graphics_flagを指定し、oml_parallel_flagおよびoml_service_levelフラグはMEDIUMサービス・レベルを使用したパラレル処理を有効にします。関連項目: 特殊な制御引数(Autonomous Database)。

構文

FUNCTION PYQSYS.pyqIndexEval(
    PAR_LST VARCHAR2,
    OUT_FMT VARCHAR2,
    TIMES_NUM NUMBER,
    SCR_NAME VARCHAR2,
    SCR_OWNER VARCHAR2 DEFAULT NULL,
    ENV_NAME VARCHAR2 DEFAULT NULL
)
RETURN SYS.AnyDataSet

パラメータ

パラメータ	説明
`PAR_LST`	`SCR_NAME`パラメータで指定されたユーザー定義Python関数に渡す追加パラメータが含まれるJSON文字列。`oml_`で始まる特殊な制御引数は、`SCR_NAME`で指定された関数に渡されるのではなく、関数の呼出し前後の動作を制御します。たとえば、入力データ型を`pandas.DataFrame`として指定するには、次を使用します。 `'{"oml_input_type":"pandas.DataFrame"}'` 関連項目: 特殊な制御引数(Autonomous Database)。
`OUT_FMT`	ファンクションによって返される出力の形式。次のいずれかになります。ファンクションによって返された表の列名およびデータ型を指定するJSON文字列。イメージ・データは破棄されます。Python関数は、`pandas.DataFrame`、`numpy.ndarray`、`tuple`または`tuple`のリストを返す必要があります。文字列`'JSON'`。返される表にJSON文字列であるCLOBが含まれることを指定します。文字列`'XML'`。返される表にXML文字列であるCLOBが含まれることを指定します。XMLには構造化データとイメージの両方が含まれる可能性があり、最初に構造化または半構造化のPythonオブジェクトが含まれ、続いてPython関数によって生成されたイメージが含まれます。文字列`'PNG'`。返される表に、Python関数によって生成されたイメージを格納するBLOBが含まれることを指定します。イメージはPNG表示のbase 64エンコーディングとして返されます。関連項目: 出力形式(Autonomous Database)。
`TIMES_NUM`	Pythonスクリプトを実行する回数。
`SCR_NAME`	OML4Pyスクリプト・リポジトリ内のユーザー定義Python関数の名前。
`SCR_OWNER`	登録済Pythonスクリプトの所有者。デフォルト値は`NULL`です。`NULL`の場合、ユーザーのスクリプト・リポジトリでPythonスクリプトを検索します。
`ENV_NAME`	指定されたユーザー定義Python関数の実行時に使用されるconda環境の名前。

例

Python関数fit_lmを定義し、myFitMultipleという名前でスクリプト・リポジトリに格納します。この関数は、scikit-learnのIRISデータセットからサンプリングされたデータ基づいた適合モデルの索引および予測スコアが含まれるpandas.DataFrameを返します。

begin
    sys.pyqScriptCreate('myFitMultiple',
        'def fit_lm(i, sample_size):
            from sklearn import linear_model
            from sklearn.datasets import load_iris
            import pandas as pd
            
            import random
            random.seed(10)
            
            iris = load_iris()
            x = pd.DataFrame(iris.data, columns = ["Sepal_Length",\
                        "Sepal_Width","Petal_Length","Petal_Width"])
            y = pd.DataFrame(list(map(lambda x: {0:"setosa", 1: "versicolor",\
                                  2: "virginica"}[x], iris.target)),\
                         columns = ["Species"])
            dat = pd.concat([y, x], axis=1).sample(sample_size)
            regr = linear_model.LinearRegression()
            regr.fit(x.loc[:, ["Sepal_Length", "Sepal_Width", \
                              "Petal_Length"]],
                     x.loc[:,["Petal_Width"]])
            sc = regr.score(dat.loc[:, ["Sepal_Length", "Sepal_Width", \
                              "Petal_Length"]],
                            dat.loc[:,["Petal_Width"]])
            return pd.DataFrame([[i,sc]],columns=["id","score"])
        ',FALSE,TRUE); -- V_GLOBAL, V_OVERWRITE
end;
/

pyqIndexEvalファンクションを呼び出す問合せを発行します。このファンクションのPAR_LST引数では、関数の引数sample_sizeを指定します。OUT_FMT引数では、pyqIndexEvalによって返される表の列名およびデータ型が含まれるJSON文字列を指定します。TIMES_NUMパラメータでは、スクリプトを実行する回数を指定します。SCR_NAMEパラメータでは、myFitMultipleという名前でスクリプト・リポジトリに格納されているユーザー定義Python関数を指定します。

select *
    from table(pyqIndexEval(
        par_lst => '{"sample_size":80,
                        "oml_parallel_flag":true", "oml_service_level":"MEDIUM"}',
        out_fmt => '{"id":"number","score":"number"}',
        times_num => 3,
        scr_name => 'myFitMultiple'));

出力は次のようになります。

        id score
---------- ----------
         1 .943550631
         2 .927836941
         3 .937196049
3 rows selected.

親トピック: Embedded Python Executionファンクション(Autonomous Database)