2.5 Oracle Machine Learning for SQLの統計関数

Oracle Databaseでは、様々なSQL統計関数を使用してデータを調査および分析できます。

Oracle Databaseでは、SQLを介して様々なスケーラブルな統計関数にアクセスできます。これらの統計関数は、SQL関数として実装されています。SQL統計関数を使用すると、データに関するMEANMAXMINMEDIANMODEおよび標準偏差などの標準的な可変統計を計算できます。ユーザーは、テスト、f-test、集計関数、分析関数、ANOVAなど、その他の様々な統計関数を実行することもできます。次の表に示す関数は、SQLから使用できます。

表2-5 OML4SQLでサポートされているSQL統計関数

関数 説明
APPROX_COUNT 式の近似カウントを返します
APPROX_SUM 式の近似合計を返します
APPROX_RANK 値のグループの近似値を返します
CORR 数値の組の集合に対する相関係数
CORR_S Spearmanの順位相関係数(Spearman's rho)を計算します
CORR_K Kendallの順位相関係数(Kendall's tau-b)を計算します
COVAR_POP 数値の組の集合について母集団分散を返します
COVAR_SAMP 数値の組の集合について標本分散を返します。
LAG LAGは分析ファンクションです。これは、自己結合せずに、表の2つ以上の行へ同時アクセスを行います。
LEAD LEADは分析ファンクションです。これは、自己結合せずに、表の2つ以上の行へ同時アクセスを行います。
STATS_BINOMIAL_TEST STATS_BINOMIAL_TESTは、有効な値が2つのみである二値変数に使用する直接確立法です。
STATS_CROSSTAB STATS_CROSSTABは、2つの名義変数を分析するために使用する方法です。
STATS_F_TEST STATS_F_TESTは、2つの分散に有意差があるかどうかをテストします。
STATS_KS_TEST STATS_KS_TESTは、2つの標本を比較して、それらが同じ母集団に属しているか、または同じ分布を持つ母集団に属しているかをテストするKolmogorov-Smirnovファンクションです。
STATS_MODE 引数として値の集合を取り、最も出現頻度の高い値を返します
STATS_MW_TEST Mann-Whitney検定では、2つの独立した標本を比較して、2つの母集団が同じ分布ファンクションを持つという帰無仮説を、2つの分布ファンクションは異なるという対立仮説に対してテストします。
STATS_ONE_WAY_ANOVA 2種類の差異の見積りを比較することで、統計的重要性の(グループまたは変数の)差異をテストします。
STATS_T_TEST_* t検定は、平均値の差の有意性を測定します
STATS_T_TEST_ONE 1標本 t検定
STATS_T_TEST_PAIRED 2標本、対応のあるt検定(交差したt検定とも呼ばれます)
STATS_T_TEST_INDEP and STATS_T_TEST_INDEPU 同じ分散を持つ(合併分散) 2つの独立したグループのt検定

分散が等しくない(分散は非合併)2つの独立したグループのt検定

STDDEV 数値の集合について標本標準偏差を返します
STDDEV_POP 母集団標準偏差を計算し、母集団分散の平方根を返します
STDDEV_SAMP 標本累積標準偏差を計算し、標本分散の平方根を返します
SUM 値の合計を返します

DBMS_STAT_FUNCS PL/SQLパッケージは、ユーザーに対しても使用可能です。