2.5 Oracle Machine Learning for SQLの統計関数
Oracle Databaseでは、様々なSQL統計関数を使用してデータを調査および分析できます。
Oracle Databaseでは、SQLを介して様々なスケーラブルな統計関数にアクセスできます。これらの統計関数は、SQL関数として実装されています。SQL統計関数を使用すると、データに関するMEAN、MAX、MIN、MEDIAN、MODEおよび標準偏差などの標準的な可変統計を計算できます。ユーザーは、テスト、f-test、集計関数、分析関数、ANOVAなど、その他の様々な統計関数を実行することもできます。次の表に示す関数は、SQLから使用できます。  
                  
表2-5 OML4SQLでサポートされているSQL統計関数
| 関数 | 説明 | 
|---|---|
| APPROX_COUNT | 式の近似カウントを返します | 
| APPROX_SUM | 式の近似合計を返します | 
| APPROX_RANK | 値のグループの近似値を返します | 
| CORR | 数値の組の集合に対する相関係数 | 
| CORR_S | Spearmanの順位相関係数(Spearman's rho)を計算します | 
| CORR_K | Kendallの順位相関係数(Kendall's tau-b)を計算します | 
| COVAR_POP | 数値の組の集合について母集団分散を返します | 
| COVAR_SAMP | 数値の組の集合について標本分散を返します。 | 
| LAG | LAGは分析ファンクションです。これは、自己結合せずに、表の2つ以上の行へ同時アクセスを行います。 | 
| LEAD | LEADは分析ファンクションです。これは、自己結合せずに、表の2つ以上の行へ同時アクセスを行います。 | 
| STATS_BINOMIAL_TEST | STATS_BINOMIAL_TESTは、有効な値が2つのみである二値変数に使用する直接確立法です。 | 
| STATS_CROSSTAB | STATS_CROSSTABは、2つの名義変数を分析するために使用する方法です。 | 
| STATS_F_TEST | STATS_F_TESTは、2つの分散に有意差があるかどうかをテストします。 | 
| STATS_KS_TEST | STATS_KS_TESTは、2つの標本を比較して、それらが同じ母集団に属しているか、または同じ分布を持つ母集団に属しているかをテストするKolmogorov-Smirnovファンクションです。 | 
| STATS_MODE | 引数として値の集合を取り、最も出現頻度の高い値を返します | 
| STATS_MW_TEST | Mann-Whitney検定では、2つの独立した標本を比較して、2つの母集団が同じ分布ファンクションを持つという帰無仮説を、2つの分布ファンクションは異なるという対立仮説に対してテストします。 | 
| STATS_ONE_WAY_ANOVA  | 2種類の差異の見積りを比較することで、統計的重要性の(グループまたは変数の)差異をテストします。 | 
| STATS_T_TEST_* | t検定は、平均値の差の有意性を測定します | 
| STATS_T_TEST_ONE | 1標本 t検定 | 
| STATS_T_TEST_PAIRED | 2標本、対応のあるt検定(交差したt検定とも呼ばれます) | 
| STATS_T_TEST_INDEPandSTATS_T_TEST_INDEPU | 同じ分散を持つ(合併分散) 2つの独立したグループのt検定 分散が等しくない(分散は非合併)2つの独立したグループのt検定 | 
| STDDEV | 数値の集合について標本標準偏差を返します | 
| STDDEV_POP | 母集団標準偏差を計算し、母集団分散の平方根を返します | 
| STDDEV_SAMP | 標本累積標準偏差を計算し、標本分散の平方根を返します | 
| SUM | 値の合計を返します | 
DBMS_STAT_FUNCS PL/SQLパッケージは、ユーザーに対しても使用可能です。