相关分析与回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当假定其他变量不变,其中两个变量的相关 关系。
厦门大学嘉庚学院
用散点图观察变量之间的相关关系
完全正线性相关
正线性相关
完全负线性相关
负线性相关
非线性相关
不相关
相关系数
●总体相关系数
对于所研究的总体,表示两个相互联系变量相关 程度
的总体相关系数为:
总体相关系数反映总体两个变量X和Y的线性相关 程度。 特点:对于特定的总体来说,X和Y的数值是既定 的,总体相关系数是客观存在的特定数值。
•当 关系;
时,表明X与Y存在一定的线性相关
若 表明X与Y 为正相关;
若 表明X与Y 为负相关。
• 当 时,表明X与Y完全线性相关;
若r=1,称X与Y完全正相关;
若r=-1,称X与Y完全负相关。
厦门大学嘉庚学院
相关系数的经验解释
1. |r|0.8时,可视为两个变量之间高度相关 2. 0.5|r|<0.8时,可视为中度相关 3. 0.3|r|<0.5时,视为低度相关 4. |r|<0.3时,说明两个变量之间的相关程度极
弱,可视为不相关 5. 上述解释必须建立在对相关系数的显著性进
行检验的基础之上
厦门大学嘉庚学院
相关系数的几点补充说明
▲X和Y 都是相互对称的随机变量,所以
▲相关系数只反映变量间的线性相关程度,不 能说明非线性相关关系。
▲相关系数不能确定变量的因果关系,也不能 说明相关关系具体接近于哪条直线。
厦门大学嘉庚学院
– 被预测或被解释的变量称为因变量 (dependent variable),用y表示
– 用来预测或用来解释因变量的一个或多个变 量称为自变量(independent variable),用x表 示
3. 因变量与自变量之间的关系用一个线性方 程来表示
2008年8月
总体回归函数
Chapter 6
相关分析与回归分析
厦门大学嘉庚学院
quiz
1. 某地区小麦的一般生产水平为亩产250 公斤,其标准差为30公斤。现用一种化肥 进行试验,从25个小区抽样结果,平均产 量为270公斤。问这种化肥是否使小麦明 显增产? (=0.05)
2. 某种大量生产的袋装食品,按规定不得 少于250克。今从一批该食品中任意抽取 50袋,发现有6袋低于250克。若规定不 符合标准的比例超过5%就不得出厂。问 该批食品能否出厂? (=0.05)
25
20
15
10
5
0
0
2
4
6
8
10
12
25
20
15
10
5
0
0
2
4
6
8
10
12
厦门大学嘉庚学院
相关分析
4. 单相关、负相关和偏相关 ➢ 单相关:一元相关,仅限于一个变量与另一
个变量之间的依存关系。 Y=f(X) ➢复相关:三个或三个以上变量之间的相关关
系。Y= f (X1, X2,….) ➢偏相关:在某一个变量与多个变量相关时,
2. 利用样本数据建立模型的估计方程 3. 对模型进行显著性检验 4. 进而通过一个或几个自变量的取值来估计
或预测因变量的取值
2008年8月
回归模型的类型
回归模型
一元回归
多元回归
线性回归 非线性回归 线性回归 非线性回归
2008年8月
一元线性回归
1. 涉及一个自变量的回归 2. 因变量y与自变量x之间为线性关系
消费支出和可支配收入的相关系数
• 计算结果:
• t检验值为
消费支出
可支配收 入
消费支出 可支配收入 1
0.9968
1
r n 2 0.9968 21
t
57.1981
1 r2 1 0.99682
临界值t(21)=2.08,故拒绝H0,认为相关系数显著。
相关分析与回归分析
• 相关分析(Correlation Analysis)研究变量 之间相关的方向和相关的程度,但无法给 出变量间相互关系的具体形式,因而无法 从一个变量推测另一个变量。
相关系数的检验
为什么要检验?
Baidu Nhomakorabea
样本相关系数是随抽样而变动的随机变量,相关系数的统计 显著性还有待检验。
检验的依据:
如果X和Y都服从正态分布,在总体相关系数
的原假
设下,与样本相关系数 r 有关的 t 统计量服从自由度为n-2的 t
分布:
厦门大学嘉庚学院
样本能代表总体吗?
• 如果红色的点碰巧为你的样本,则样 本相关系数为0.907,总体相关系数为
0.00005 350
300
250
200
150
100
50
0
2
4
6
8
相关系数的显著性检验
检验的步骤是:
1、提出假设:H0: ;H1: 0
2、 计算检验的统计量:
t r n 2 ~ t(n 2) 1 r2
3、 确定显著性水平,并作出决策 • 若 t >t,拒绝H0 • 或者:若p值< ,拒绝H0
厦门大学嘉庚学院
相关分析
一、变量间的相互关系
◆确定性的函数关系 Y=f (X)
◆不确定性的统计关系—相关关系
Y= f(X)+u (u为随机变量)
◆没有关系
35 30
变量间关系的图形描述 坐标图(散点图)
Y
25
20
15
10
5
0
0
10
20
30
X
厦门大学嘉庚学院
相关分析
二、相关关系的种类 1. 按相关关系的程度分 ➢ 完全相关 Y=2X ➢ 不完全相关 Y=f(X)+ e ➢ 不相关
厦门大学嘉庚学院
相关关系
2. 按相关形式 ➢ 线性相关
散布图接近一条直线(左图)
➢ 非线性相关
散布图接近一条曲线(右图)
25
20
15
10
5
0
0
2
4
6
8
10
12
11.2 11
10.8 10.6 10.4 10.2
10 0
5
10
厦门大学嘉庚学院
相关关系
3. 按相关方向分 ➢ 正相关 变量同方向变化 ➢负相关 变量反方向变化
厦门大学嘉庚学院
相关系数
• 样本相关系数
通过X和Y 的样本观测值去估计样本相关系数变量 X和Y的样本相关系数通常用 表示
特点:样本相关系数是根据从总体中抽取的随机样 本的观测值计算出来的,是对总体相关系数的估计, 它是个随机变量。
厦门大学嘉庚学院
相关系数的特点
• 相关系数的取值在-1与1之间。
• 当r =0时,表明X与Y没有线性相关关系。
回归分析(Regression) 可以确定变量之间相 互关系的具体形式(回归方程),确定一 个变量对另一个变量的影响程度,并根据 回归方程进行预测。
什么是回归分析?
(regression analysis)
1. 重点考察考察一个特定的变量(因变量), 而把其他变量(自变量)看作是影响这一变 量的因素,并通过适当的数学模型将变量 间的关系表达出来
相关文档
最新文档