统计学相关及回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

相关分析与回归分析
相关分析
用一个指标来表明现象间相互依存关系 的密切程度。
回归分析 根据相关关系的具体形态,选择一个合 适的数学模型,来近似地表达变量间关系。
相关分析所研究的变量是对等关系;回归分析所 研究的两个变量不是对等关系。 因果
3800 3300 2800 2300 1800
人均消费
年份 人均国内生产总值 人均消费金额 year x y 1995 4854 2236 1996 5576 2641 1997 6054 2834 1998 6308 2972 1999 6551 3138 2000 7086 3397 2001 7651 3609 2002 8214 3818 2003 9101 4089 4300
4300
5300
6300
7300
8300
人均GDP 9300
wenku.baidu.com章内容
一、相关关系的概念和分类 二、线性相关关系的识别
相 关 分 析
三、一元线性回归分析
四、多元线性回归分析 五、非线性回归分析
New
New
一、相关关系的概念和分类 一、函数关系和相关关系
二、相关关系的分类
相关程度、 相关方向、 相关形式、
第九章 相关回归 相关与回归分析
南京财经大学统计学系
相关分析与回归分析是现代统计学中非常重要的内容,在 自然、管理科学和社会经济领域有着十分广泛的应用。
在分析变量之间关系的时,常用的基本模型: (1)相关模型; (2)回归模型 实践中到底使用哪种模型取决于研究者的研究目的和数据 的收集方式和条件。相关分析: 变量 X 和 Y 都被视为随机 变量,服从二元分布;经典的回归分析: 通常变量 x 不是 随机变量,在事先选好的值中取值,变量 Y 是随机变量, 在变量 x 的给定值处有相应的观测值。 例1:太阳镜的日销售数量 Y 与日最高气温 X 之间的关系 例2:人均消费与人均GDP的关系
i ~ N (0, 2 ) i, 1, 2, , n
参数估计
• 与一元线性回归方程的参数估计原理一样, 应该使得估 计值与观测值y之间的残差在所有样本点上达到最小, 即使Q达到最小
ˆ )T (Y X ˆ) Q ( yi yi ) 2 ei2 eT e (Y X
i 1 i 1
n
^
n
• 参数的最小二乘估计值为:
• 另外,
ˆ ( X ' X )1 X ' Y β
2 ( y y ) i i ^
ˆ S y ( x x )
1 p
n p 1
模型评价-拟合优度
• 一般不再用可决系数
SSR r SST
2
ˆ y y
写成矩阵形式为: Y X ε
x11 x12 1 1 x x 21 22 X ....... ...... ...... x n1 x n 2 1
x1 p ....... x 2 p ...... ...... ; ...... x np ......
i i
y
y
2 2
• 而是用修正的可决系数
n 1 r 1 (1 r ) n p 1
2 a 2
模型评价-显著性检验1
• 整个回归方程的检验
H : 2 p 0 H1 : 1 , p (1)提出假设 0 1 , 不全为 0. (2)根据表 10.4 构建 F 统计量,见表 10.4
0 1 y1 y 1 2 2 Y ...... ; ...... ...... ; n yn p
基本假设
解释变量是确定性变量,不是随机变量,且要求矩 阵X中的自变量列之间不相关,样本容量的个数应 大于解释变量的个数。 独立、同分布、零均值 正态分布的假定条件:
(3)给定显著性水平α ,查 F 分布表,得临界值 F ( p, n p 1) 。
), ( 4) 若F F 则拒绝 H 0 , 说明总体回归系数 i 不 ( p, n p 1
全为零,即回归方程是显著的;反之,则认为回归方程不显著。 表 10.4 多元线性回归模型的方差分析表 方差来源 平方和 自由度 均方 回归 误差 总计 SSR SSE SST p n-p-1 n-1
四、多元线性回归分析
基本概念:回归系数、被解释变量(因变量)、解释 变量(自变量)、多元回归、 随机误差项。
多元线性回归模型的样本形式:
y1 0 1 x11 2 x12 ...... p x1 p 1 y2 0 1 x21 2 x22 ...... p x2 p 2 ...... yn 0 1 xn1 2 xn 2 ...... p xnp n
变量多少、 相关性质
二、线性相关关系的识别
(一)散点图 (例子)
最简单、最直观的识别方法, 但难以给出相关的程度.
(二)直线相关系数
直线相关系数的设计思想 总体相关系数与Pearson相关系数
相关系数的检验
三、一元线性回归分析
一元线性回归模型的概念
y 0 1 x 变量y对x的一元线性回归总体模型
E (Y | x) 0 1 x
一元线性回归方程
ˆ ˆ x 一元线性经验回归方程 ˆ y 0 1
估计方法:普通最小二乘估计 、标准误差 — 的估计 模型评价:可决系数、显著性检验1 2
New
预测方法:点预测,区间预测
将代入回归方程得=181.5830+0.4414×10000=4595.5628(元)
MSR
MSE
F值
MSR MSE
SSR p
SSE n p 1
F
模型评价-显著性检验2
• 单个回归系数的检验
(1) 要检验的假设:H 0 : i 0 ;H1 : i 0 (i=1,2,……,p)
i (2)t 检验的计算公式为: t S ,其中 S 是回归系数
相关文档
最新文档