CORRELATIONファンクションは、2つの式のデータ値のペアについて相関係数を返すファンクションです。相関係数は、データ値間の関係の強度を示します。相関係数が正の1
または負の1
に近いほど、式内のデータ値間の関係は強くなります。相関係数0
(ゼロ)は相関がないことを意味し、+1
(プラス1)または-1
(マイナス1)は完全な相関を意味します。正の相関係数は、一方の式のデータ値が増加(または減少)すると、もう一方の式のデータ値も増加(または減少)することを示します。負の相関係数は、一方の式のデータ値が増加すると、もう一方の式のデータ値は減少することを示します。
戻り値
DECIMAL
構文
CORRELATION(expression1 expression2 [PEARSON|SPEARMAN|KENDALL] -
[BASEDON dimension-list])
引数
少なくとも1つのディメンションがexpression2と共通している、ディメンション化された数式。
少なくとも1つのディメンションがexpression1と共通している、ディメンション化された数式。
Pearsonの積率相関係数(Pearson product-moment)を計算します。たとえば販売個数と単価などのように、データ水準が間隔尺度または比例尺度で、式のデータ値が線形関係を持ち、正規分布する場合、このメソッドを使用します。
Spearmanの順位相関係数(Spearman's rho)を計算します。式が線形関係を持たないか、正規分布しない場合に、このノンパラメトリック・メソッドを使用します。相関係数の計算時に、このメソッドではexpression1およびexpression2のデータ値に順位を付け、expression1の各要素の順位をexpression2の対応する要素と比較します。このメソッドは、式のほとんどの値が一意であることを前提としています。
Kendallの順位相関係数(Kendall's tau)を計算します。このノンパラメトリック・メソッドでは、SPEARMANメソッドと同様に、まずexpression1およびexpression2のデータ値を順位付けます。ただし、KENDALLメソッドでは、各ペアの順位を次に続くペアと比較します。このメソッドは、expression1およびexpression2のデータ値のほとんどが一意でない場合に使用します。
CORRELATIONが相関係数を計算する、オプションのディメンション・リスト。expression1およびexpression2の両方が、dimension-listにあるすべてのディメンションでディメンション化されている必要があります。CORRELATIONは、dimension-listのすべてのディメンションに対して、expression1のデータ値をexpression2のデータ値と相関させます。CORRELATIONは、dimension-listのディメンション以外のexpression1とexpression2のすべてのディメンションによってディメンション化された各セルに対し1つの相関係数を含む、1つの配列を返します。
dimension-list引数を指定しない場合は、expression1およびexpression2で共通するディメンション全体の相関係数がCORRELATIONによって計算されます。2つの式のディメンションがすべて同じ場合は、CORRELATIONは単一の相関係数を返します。いずれかの式にもう一方の式では共有されていないディメンションが含まれている場合には、CORRELATIONは、各セルに1つの相関係数を含んだ配列を返します(このとき、セルは、式内の共有されていないディメンションによってディメンション化されたものです)。
注意
CORRELATIONでのNASKIPの影響
CORRELATIONはNASKIPオプションの影響を受けます。NASKIPがYES
に設定されている場合(デフォルト)、CORRELATIONではNA
値を無視します。NASKIPがNO
に設定されている場合、式のNA
値はNA
相関係数になります。
例
例7-51 PEARSONメソッドによる相関付け
アナリティック・ワークスペースにunits
およびprice
の2つの変数があるとします。price
変数の2つのディメンション(month
およびproduct
)は、units
変数と共有されています。units
変数には、3つ目のディメンションとしてdistrict
があります。
次のCORRELATION文では、dimension-list引数は指定されていません。この文のCORRELATIONファンクションからは、2つの変数で共有されていないディメンション内の各ディメンション値についての相関係数が返されます。
REPORT CORRELATION(units price pearson)
この文によって生成される出力は、次のとおりです。
CORRELATION (UNITS PRICE DISTRICT PEARSON) -------------- ----------- Boston -0.75 Atlanta -0.85 Chicago -0.83 Dallas -0.66 Denver -0.83 Seattle -0.69
次の文で、month
およびproduct
ディメンションを制限します。
LIMIT month to 'Jan96' TO 'Mar96' LIMIT product TO 'Tents' TO 'Racquets'
次の文により、ステータスにある制限されたディメンション値について、product
ディメンションを基準とした相関係数がレポートされます。
REPORT CORRELATION(units price pearson basedon product) CORRELATION(UNITS PRICE PEARSON- --------BASEDON PRODUCT)-------- -------------MONTH-------------- DISTRICT Jan96 Feb96 Mar96 -------------- ---------- ---------- ---------- Boston -0.96 -0.90 -0.89 Atlanta -0.97 -0.97 -0.97 Chicago -0.96 -0.95 -0.95 Dallas -0.98 -0.98 -0.99 Denver -0.97 -0.97 -0.97 Seattle -0.89 -0.83 -0.83
次の文により、制限されたディメンション値について、month
ディメンションを基準とした相関係数がレポートされます。
REPORT CORRELATION(units price pearson basedon month) CORRELATION(UNITS PRICE PEARSON- ---------BASEDON MONTH)--------- ------------PRODUCT------------- DISTRICT Tents Canoes Racquets -------------- ---------- ---------- ---------- Boston -0.59 -0.92 -0.55 Atlanta -0.73 -0.83 0.03 Chicago -0.91 -0.84 -0.68 Dallas -0.86 -0.92 0.31 Denver -0.98 -0.94 -0.67 Seattle -0.98 -0.89 -0.70