统计学-相关与回归分析ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

因果
.
3
年份 人均国内生产总值 人均消费金额
year
x
y
1995
4854
2236
1996
5576
2641
1997
6054
2834
1998
6308
2972
1999
6551
3138
2000
7086
3397
2001
7651
3609
2002
8214
3818
2003
9101
4089 4300
人均消费
3800
写成矩阵形式为:Y X ε
.
9
1 x11 x12 ...... x1p
X
1
x21
x22
.......
x2
p
....... ...... ...... ...... ......
1
xn1
xn2
......
xnp
;
y1
0
1
Y
y2
...... ;
yn
1
......
例1:太阳镜的日销售数量 Y 与日最高气温 X 之间的关系
例2:人均消费与人均GDP的关系
.
2
相关分析与回归分析
相关分析
用一个指标来表明现象间相互依存关系 的密切程度。
回归分析
根据相关关系的具体形态,选择一个合 适的数学模型,来近似地表达变量间关系。
相关分析所研究的变量是对等关系;回归分析所
研究的两个变量不是对等关系。
Q n(y i y ^ i)2ne i2 e T e (Y X ˆ)T (Y X ˆ)
i 1
i 1
• 参数的最小二乘估计值为:
• 另外,
βˆ(X'X)1X'Y
^
ˆ Sy(x1xp)
(yi yi)2 np1
.
12
模型评价-拟合优度
• 一般不再用可决系数
r2 SSR yˆi y2
(4)若 ti t /2 ,则拒绝 H 0 ,即总体回归系数 i 0
有多少个回归系数,就要做多少次 t 检验。
.
15
EXCEL演示和解释
.
16
五、非线性回归分析
线性回归模型的结构特点: (1)被解释变量是解释变量的线性函数—变量线性 (2)被解释变量也是参数的线性函数—参数线性
根据实际分析建立的模型往往不符合上述线性特点,称为 非线性模型。如: 柯布—道格拉斯生产函数 YALK 处理非线性回归模型的方法有两种:
3300
2800
2300
1800 4.300
5300
6300
7300
8300
人均GDP 9300 4
本章内容
一、相关关系的概念和分类 相Biblioteka Baidu

二、线性相关关系的识别
分 析
三、一元线性回归分析
四、多元线性回归分析 New
五、非线性回归分析
New
.
5
一、相关关系的概念和分类
一、函数关系和相关关系 二、相关关系的分类
第九章
相关相与关回回归归分析
南京财经大学统计学系
相关分析与回归分析是现代统计学中非常重要的内容,在 自然、管理科学和社会经济领域有着十分广泛的应用。
在分析变量之间关系的时,常用的基本模型: (1)相关模型; (2)回归模型
实践中到底使用哪种模型取决于研究者的研究目的和数据 的收集方式和条件。相关分析: 变量 X 和 Y 都被视为随机 变量,服从二元分布;经典的回归分析: 通常变量 x 不是 随机变量,在事先选好的值中取值,变量 Y 是随机变量, 在变量 x 的给定值处有相应的观测值。
相关程度、 相关方向、 相关形式、 变量多少、 相关性质
二、线性相关关系的识别
(一)散点图 (例子)
最简单、最直观的识别方法, 但难以给出相关的程度.
(二)直线相关系数
直线相关系数的设计思想 总体相关系数与Pearson相关系数 相关系数的检验
.
7
三、一元线性回归分析
一元线性回归模型的概念
y01x 变量y对x的一元线性回归总体模型
(4)若 F F ( p, n p 1) ,则拒绝 H 0 ,说明总体回归系数 i 不
全为零,即回归方程是显著的;反之,则认为回归方程不显著。
表 10.4 多元线性回归模型的方差分析表 方差来源 平方和 自由度 均方
回归
SSR
p
MSR SSR p
误差 总计
SSE SST
n-p-1 n-1
MSE SSE n p 1
(1) 把非线性关系转化为线性关系,然后再运用线性回 归的分析方法进行估计。
(2) 利用非线性最小二乘法直接估计 非线性模型转换成线性模型的常用方法:直接和间接代换法
F值 F MSR
MSE
.
14
模型评价-显著性检验2
• 单个回归系数的检验
(1)要检验的假设:H 0 : i 0 ;H1 : i 0 (i=1,2,……,p)
^
(2)t 检验的计算公式为: ti
i
S i
,其中 Si 是回归系数
标准误,t 值应该有 p 个
(3)给定显著性水平α,确定临界值 t / 2 (n p 1)
SST
2
yi y
• 而是用修正的可决系数
ra21(1r2)nnp11
.
13
模型评价-显著性检验1
• 整个回归方程的检验
(1)提出假设 H0 : 1 2 p 0 , H1 : 1, p 不全为 0.
(2)根据表 10.4 构建 F 统计量,见表 10.4 (3)给定显著性水平α,查 F 分布表,得临界值 F ( p, n p 1) 。
基本概念:回归系数、被解释变量(因变量)、解释 变量(自变量)、多元回归、 随机误差项。
多元线性回归模型的样本形式:
y1 0 1x11 2 x12 ...... p x1p 1 y2 0 1x21 2 x22 ...... p x2 p 2
......
yn 0 1xn1 2 xn2 ...... p xnp n
E (Y|x)01x 一元线性回归方程
yˆˆ0 ˆ1x 一元线性经验回归方程
New
估计方法:普通最小二乘估计 、标准误差 — 的估计
模型评价:可决系数、显著性检验1 2
预测方法:点预测,区间预测
将代入回归方程得=181.5830+0.4414×10000=4595.5628(元)
.
8
四、多元线性回归分析
p

2
......
n
.
10
基本假设
解释变量是确定性变量,不是随机变量,且要求矩 阵X中的自变量列之间不相关,样本容量的个数应 大于解释变量的个数。 独立、同分布、零均值
正态分布的假定条件:
i~ N (0 , 2 )i, 1 ,2 , ,n
.
11
参数估计
• 与一元线性回归方程的参数估计原理一样, 应该使得估 计值与观测值y之间的残差在所有样本点上达到最小, 即使Q达到最小
相关文档
最新文档