33.5 Oracle Machine Learning for SQL統計関数
Oracle Databaseでは、様々なSQL統計関数を使用してデータを調査および分析できます。
Oracle Databaseでは、SQLを使用して各種のスケーラブルな統計関数にアクセスできます。これらの統計関数は、SQL関数として実装されます。SQL統計関数を使用すると、MEAN、MAX、MIN、MEDIAN、MODEおよびデータの標準偏差などの標準的な一変量統計を計算できます。ユーザーは、t検定、f検定、集計関数、分析関数、ANOVAなど、他の様々な統計関数を実行することもできます。次の表に示す関数は、SQLで使用できます。  
                  
表33-5 OML4SQLでサポートされるSQL統計関数
| ファンクション | 説明 | 
|---|---|
APPROX_COUNT | 
                           式の近似カウントを返します | 
APPROX_SUM | 
                           式の近似合計を返します | 
APPROX_RANK | 
                           値のグループの近似値を返します | 
CORR | 
                           数値の組の集合に対する相関係数を戻します | 
CORR_S | 
                           Spearmanの順位相関係数(Spearman's rho)を計算します | 
CORR_K | 
                           Kendallの順位相関係数(tau-b)を計算します | 
COVAR_POP | 
                           数値の集合の母集団分散を戻します | 
COVAR_SAMP | 
                           数値の集合の標本分散を戻します。 | 
LAG | 
                            LAGは分析ファンクションです。これは、自己結合せずに、表の2つ以上の行へ同時アクセスを行います。 
                            | 
                        
LEAD | 
                           LEADは分析ファンクションです。これは、自己結合せずに、表の2つ以上の行へ同時アクセスを行います。  
                            | 
                        
STATS_BINOMIAL_TEST | 
                           STATS_BINOMIAL_TESTは、有効な値が2つのみである二値変数に使用する直接確立法です。
                            | 
                        
STATS_CROSSTAB | 
                           STATS_CROSSTABは、2つの名義変数の分析に使用する方法です。 
                            | 
                        
STATS_F_TEST | 
                            STATS_F_TESTは、2つの分散に有意差があるかどうかをテストします。
                            | 
                        
STATS_KS_TEST | 
                           STATS_KS_TESTは、2つの標本を比較して、それらが同じ母集団に属しているか、または同じ分布を持つ母集団に属しているかをテストするKolmogorov-Smirnovファンクションです。
                            | 
                        
STATS_MODE | 
                           引数として値の集合を取り、最も出現頻度の高い値を戻します | 
STATS_MW_TEST | 
                           Mann-Whitney検定では、2つの独立した標本を比較して、2つの母集団が同じ分布ファンクションを持つという帰無仮説を、2つの分布ファンクションは異なるという対立仮説に対してテストします。 | 
STATS_ONE_WAY_ANOVA  | 
                           2つの異なる分散の推定値を比較することにより、統計的有意性について(グループまたは変数の)平均値の差をテストします | 
STATS_T_TEST_* | 
                           t検定では、平均値の差の有意性を測定します | 
STATS_T_TEST_ONE | 
                           1標本t検定 | 
STATS_T_TEST_PAIRED | 
                           2標本、対応のあるt検定(交差したt検定とも呼ばれます) | 
STATS_T_TEST_INDEPおよびSTATS_T_TEST_INDEPU | 
                           同じ分散を持つ(合併分散)2つの独立したグループのt検定
                               分散が等しくない(分散は非合併)2つの独立したグループのt検定  | 
                        
STDDEV | 
                           数値の集合の標本標準偏差を返します | 
 STDDEV_POP | 
                           母集団標準偏差を計算し、母集団分散の平方根を戻します | 
STDDEV_SAMP | 
                           標本累積標準偏差を計算し、標本分散の平方根を戻します | 
 SUM | 
                           値の合計を戻します | 
DBMS_STAT_FUNCS PL/SQLパッケージはユーザーにも使用できます。