34.5 Oracle Machine Learning for SQL統計関数

Oracle Databaseでは、様々なSQL統計関数を使用してデータを調査および分析できます。

Oracle Databaseでは、SQLを使用して各種のスケーラブルな統計関数にアクセスできます。これらの統計関数は、SQL関数として実装されます。SQL統計関数を使用すると、MEANMAXMINMEDIANMODEおよびデータの標準偏差などの標準的な一変量統計を計算できます。ユーザーは、t検定、f検定、集計関数、分析関数、ANOVAなど、他の様々な統計関数を実行することもできます。次の表に示す関数は、SQLで使用できます。

表34-5 OML4SQLでサポートされるSQL統計関数

ファンクション 説明
APPROX_COUNT 式の近似カウントを返します
APPROX_SUM 式の近似合計を返します
APPROX_RANK 値のグループの近似値を返します
CORR 数値の組の集合に対する相関係数を戻します
CORR_S Spearmanの順位相関係数(Spearman's rho)を計算します
CORR_K Kendallの順位相関係数(tau-b)を計算します
COVAR_POP 数値の集合の母集団分散を戻します
COVAR_SAMP 数値の集合の標本分散を戻します。
LAG LAGは分析ファンクションです。これは、自己結合せずに、表の2つ以上の行へ同時アクセスを行います。
LEAD LEADは分析ファンクションです。これは、自己結合せずに、表の2つ以上の行へ同時アクセスを行います。
STATS_BINOMIAL_TEST STATS_BINOMIAL_TESTは、有効な値が2つのみである二値変数に使用する直接確立法です。
STATS_CROSSTAB STATS_CROSSTABは、2つの名義変数の分析に使用する方法です。
STATS_F_TEST STATS_F_TESTは、2つの分散に有意差があるかどうかをテストします。
STATS_KS_TEST STATS_KS_TESTは、2つの標本を比較して、それらが同じ母集団に属しているか、または同じ分布を持つ母集団に属しているかをテストするKolmogorov-Smirnovファンクションです。
STATS_MODE 引数として値の集合を取り、最も出現頻度の高い値を戻します
STATS_MW_TEST Mann-Whitney検定では、2つの独立した標本を比較して、2つの母集団が同じ分布ファンクションを持つという帰無仮説を、2つの分布ファンクションは異なるという対立仮説に対してテストします。
STATS_ONE_WAY_ANOVA 2つの異なる分散の推定値を比較することにより、統計的有意性について(グループまたは変数の)平均値の差をテストします
STATS_T_TEST_* t検定では、平均値の差の有意性を測定します
STATS_T_TEST_ONE 1標本t検定
STATS_T_TEST_PAIRED 2標本、対応のあるt検定(交差したt検定とも呼ばれます)
STATS_T_TEST_INDEPおよびSTATS_T_TEST_INDEPU 同じ分散を持つ(合併分散)2つの独立したグループのt検定

分散が等しくない(分散は非合併)2つの独立したグループのt検定

STDDEV 数値の集合の標本標準偏差を返します
STDDEV_POP 母集団標準偏差を計算し、母集団分散の平方根を戻します
STDDEV_SAMP 標本累積標準偏差を計算し、標本分散の平方根を戻します
SUM 値の合計を戻します

DBMS_STAT_FUNCS PL/SQLパッケージはユーザーにも使用できます。