相关系数具有如下性质:
1.r的取值范围在-1~1,即-1≤r≤1.r>0表明x与y之间存在正线性相关关系;r<0表明x与y之间存在负线性相关关系;r值越接近1(或-1)就越正(或负)相关,越接近0,就越不相关。r=1或r=-1表明x与y是安全相关关系(实际上就是函数关系)。
2.r具有对称性。
3.r数值大小与X和y的数据原点及计量尺度无关。
4.r仅仅是X与y之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关,并不表明变量之间没有任何关系,比如他们之间可能存在非线性相关关系。
5.r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系。
可将相关程度分为以下几种情况:
当|r|≥0.8时,可视为高度相关;当0.5≤|r|<0.8时,可视为中度相关;当0.3≤|r|<0.5时,可视为低度相关;当|r|<0.3时,说明两个变量之间的相关程度极弱。
相关系数的检验:
相关系数的检验通常用t分布检验,该检验可以用于小样本,也可以用于大样本。检验的具体步骤如下:
首先确定原假设:
H0:两变量之间不存在线线性相关 或 H0:p=0
H1:两变量之间存在线线性相关 或 H1:p≠0
其次,计算统计量t值