薪酬设计回归分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关与回归分析
第一节 简单线性相关分析
一、相关关系的概念与种类
(一)相关关系的概念
在自然界和人类社会中,普遍着存在现象之间的相互依赖、相互制约的关系。一些现象在数量上的发展变化经常伴随着另一些现象数量上的发展变化。现象间的数量关系可分为两种基本类型:①函数关系。它是指现象间存在的严格依存的、确定的因果关系,一种现象的数量变化必然决定着另一种现象的数量变化,这种关系可通过精确的数学表达式来反映,比如,圆面积同其半径的关系为s=πr 2
,自由落体落下的距离同时间的关系为h=
2
1gt 2
,等等。②相关关系。指的是现象之间确实存在着数量关系,但这种关系不是严格确定的,当一种现象的数量发生变化时,另一种现象的数量可能在一定范围内发生变化,出现不同的数值。比如,单位产品成本同产量之间的关系,一般说来,当工厂规模扩大,产品产量增加时,单位产品成本会随之下降,这种变化趋势体现了规模经济的效应,具有客观性和普遍性。但由于影响产品成本的因素众多,有主要的,也有次要的,有必然的,也有偶然的,有随机的,也有非随机的,有观察得到的,也有观察不到的,等等。同一产量水平下,可能会出现各种各样的单位成本,或者某一确定的单位成本对应着不同的产量,两者的关系不是唯一确定的。粮食收获量与施肥量之间、商品价格与需求量之间、身高与体重之间等都具有类似的特征,这种关系就是相关关系。
函数关系与相关关系既有区别,又有联系。由于观察和实验中的误差,函数关系往往通过相关关系表现出来;而当对现象之间的内在联系和规律性了解得更加清楚的时候,相关关系又可能转化为函数关系。在社会经济领域里,一般说来,函数关系反映了现象间关系的理想化状态,相关关系则反映了现象间关系的现实化状态,只有在大量观察时,在平均的意义上,它才能被描述。
综上所述,相关关系是现象之间确实存在的,但关系数值不固定的相互依存关系。相关分析则是研究一个变量与另一个变量或另一组变量之间相关密切程度和相关方向的一种统计分析方法。
(二)相关关系的种类
现象之间的相关关系是很复杂的,从不同的角度看,相关关系有不同的种类。 1.固定相关和随机相关。按变量的性质(是否是随机变量),相关关系可分固定相关和随机相关。固定相关是指一个随机变量与另一个或一组非随机变量之间的的相关关系。例如,农作物的施肥量是一个可控制的变量,农作物收获量是一个不确定的变量,两个变量之间的关系表现为一个随机变量与另一个非随机变量之间的固定相关。随机相关是指一个随机变量与另一个或一组随机变量之间的相关关系。例如,大学生的身高和体重之间的关系就是两个随机变量之间的随机相关关系,如果观察某一身高的一组学生时,其体重各不相同,会形成一个分布;如果观察某一体重的一组学生时,其身高也不相同并形成一个分布,两个变量均为随机变量。
2.简单相关和多元相关。按变量的多少,相关关系可分为简单相关和多元相关。简单相
关,又称单相关,是指一个随机变量与另一个随机变量或非随机变量之间的相关关系;多元相关,又称复相关,是指一个随机变量与另一组随机变量或非随机变量之间的相关关系。
按变量之间的相关方向不同,简单相关又可分为正相关和负相关。当自变量的值增加,因变量的值也相应地增加;自变量的值减少,因变量的值也随之减少时,这样的相关关系就是正相关。反之,当自变量的值增加时,因变量的值随之减少;自变量的值减少时,因变量的值反而增加,具有这种特点的相关关系就是负相关。
多元相关可进一步分解为简单相关和偏相关。偏相关是指在测定一个随机变量与某个或某些随机变量或非随机变量之间的相互关系后,该随机变量与某一新增加的随机量或非随变量之间的相关关系,又称之为净相关。
3.线性相关和非线性相关。按变量之间的相关形式,相关关系可分为线性相关和非线性相关。若一随机变量与另一个或一组随机变量或非随机变量之间的相关关系表现为线性组合时,则称它们之间的相关关系为线性相关。反之,若一随机变量与另一个或一组随机变量或非随机变量之间的相关关系不能表现为线性组合,而只能表现为非线性组合时,则称它们之间的相关关系为非线性相关。
4.完全相关、不完全相关和不相关。按变量之间的相关程度不同,相关关系可分为完全相关、不完全相关和不相关。若一个变量的值完全由另一个或一组变量的值所决定,则称变量之间的这种相关关系为完全相关,即函数关系。若一个变量的值与另一个或一组变量的值有关,但其中要受到随机因素的影响,则称变量之间的这种相关关系为不完全相关。若一个变量的值完全不受另一个或一组变量值的影响,则称变量之间不相关。大量社会经济现象之间的相关关系都属于不完全相关,不完全相关是相关分析的基本内容。完全相关和不相关可视为相关关系中的特例。
二、简单线性相关图表
判定两变量之间的相关程度和相关方向是简单线性相关分析的重要内容之一。其最简单、最直观的方法就是列相关表、绘制相关图。
简单线性相关关系有固定简单线性相关与随机简单线性相关之分。简单线性相关图表可用于直观地表明这两类简单线性相关变量之间的相关程度和相关方向。
(一)固定简单线性相关图表
已知有两个变量,设y是随机变量,x是非随机变量,对应于x的每一个给定的取值,y有多个可能的取值,但在一次试验中,y只取其中一个可能值。由于x是非随机变量,在实验中其取值可以控制并重复进行,所以在n次试验中,x可能取n个相同或不同的值,相应地也有n个y的值,即得到一一对应的样本资料(x,y)。将这些数据按x的取值由小到大依次对应排列,即构成固定简单线性相关表,又称之为一维相关表。
例9.1 某地区居民人均收入水平(x)与其食品支出占生活费支出比重(y)之间具有相关关系,编制相关表如下(见表9-1):
表9-1 一维相关表
从表9-1可以粗略看出,随着居民人均收入水平的提高,食品支出占生活费支出的比重有下降的趋势。
将一一对应的(x,y)描点于坐标系上,即构成散点图,又称相关图。在相关图上,以横轴表示非随机变量(x),以纵轴表示随机变量(y),通过观察各对变量值坐标点的分布状况,可以大致判断变量之间相关的形态、方向和密切程度。
利用表9-1资料,可绘制相关图如下(见图9-1):
图9-1 居民人均收入水平与其食品支出的关系图
从图9-1可以看出,随着居民人均收入水平的提高,食品支出占生活费支出的比重明显降低,并大致呈线性下降趋势,即负线性相关。
一些常见的相关分布状态可用下述各图表示(见图9-2):
x x x
x
x
x x
x
x
x
x
x
x
较显著的线性正相关较显著的线性负相关
x x
x
x
x
x
x x
x
x
不显著的线性负相关不相关
图9-2 几种常见的相关散点图