相关性是什么意思?
相关性是衡量两个定量变量(例如,身高、体重)内线性关系的功效的术语。根据变量的运动,主要有两种类型的相关性-
正相关——在两个变量的正相关中,两个变量都朝着相同的方向移动。这意味着当一个变量的值上升时,另一个变量也会增加,反之亦然。例如,您燃烧的燃料越多,您驾驶汽车的距离就越远。
负相关-在负相关的情况下,当一个变量增加时,另一个变量会下降,反之亦然。
强弱相关
在强相关中,可以根据另一个变量的值以相当高的准确度预测一个变量的值。在弱相关的情况下,一个变量的平均值与另一个相关,但也有很多例外。
样本相关系数“r”量化了关系的功效。还经常测试相关性的统计显着性。
相关分析的局限性
除了正在探索的两个变量之外,相关性无法显示其他变量的存在或影响。
相关性并没有告诉我们变异的原因和结果。
相关性也无法描述曲线关系。
相关性描述一起移动的数据
相关性可用于描述数据集中的简单关系。例如,对于山地公园露营地的数据集,人们可能想知道露营地的高度与夏季平均温度之间是否存在关系。
在这里,对于每个单独的露营地,必须采取两项措施:海拔和温度。当您通过相关性检查样本中的这两个变量时,您会发现线性关系:随着海拔升高,温度下降。所以,这两个变量是负相关的。
相关数是什么意思?
相关性是通过无单位计算来衡量的,该计算称为相关系数,范围从-1到+1,用“r”表示。统计部分用p值表示。因此,相关性通常用两个关键数字表示:“r=”和“p=”。
接近“r”变为零,线性关系变弱。
正“r”值显示正相关。
负“r”值表示负相关。
p值为我们提供了证据,证明我们可以证明总体相关系数不为零的事实,这取决于我们从样本中观察到的情况。
“无单位度量”表明相关性存在于它们自己的尺度上。在上面给出的示例中,为“r”给出的数字与高度或温度的比例不同。这与其他形式的统计数据不同。例如,高度测量的平均值与其变量在同一尺度上。
评论列表