本科统计学第十二讲 回归与相关 ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
RSSR
n i1
yiy2
❖ 3、统计量:
FRR SSSSR F1,n2
n2
TSS
2
x2n1
RSSR
2
x2 1
RSS
2
x2n2
2
L ❖ 其中:TSS yy
RSSR Lxy Lxx
2
L RSSTSSRSSR xy Lyy Lxx
H H ❖ 如果 FF拒绝 F 1 ;F 接受 1
❖ 例:统计某城市家具销售额y(万元)与 新建住宅面积x(千平方米),得如下资 料:
❖ 2、最小二乘法
❖ 设总体中抽取一样本,围绕n个观测点画 一条直线 yabx ,与各点都比较接近 的直线为最佳。要求:各点到待估直线
的铅直距离之和为最小。利用微分学中
求极值的原理,求得:
L a ybx
b xy
L ❖ 将a、b代入线性回归方程:
xx
y a bx
❖ 它是总体线性回归方程 yx的最
第十二讲 回归与相关
第一节 回归研究的对象
1、研究定距变量与定距变量之间的非确定关系 相关关系:1)变量之间存在关系
2)这种关系是非确定性的 两个变量x和y,当x变化时会引起y相应变化,但他 们之间的变化关系是不确定的。如果当x取任何一可 能值xi 时,y相应地服从一定的概率分布,则称随机 变量y和变量x之间存在着相关。
E yx
❖ 问题:用 yx这个方程表示的回归线性
方程应该在坐标图上的哪一个位置,才使预 测时所犯错误最小?
第二节 回归直线的建立与最小二乘法
❖ 1、直线回归方程的建立
❖ 通过样本值作散布图,由散布图估计出 总体回归直线的系数 、 ,建立直线 回归方程。
❖ 但:抽样误差存在,样本均值并不等于 总体均值,要获得一条最佳的估计直线, 用最小二乘法。
线上,称做线性假定。
❖ 4、要E 求y 随i 机 变 量yx i 是i统计独立的
❖ 以上假定用两组数据结构来表达:
❖ 1)随机变量 y i 是独立的,且有:
❖ 均值:E y i x i
❖ 方差:Dy 2 i
❖ 2)y i 与 x i 有如下关系:
是yn 随机变量x ,n它们n相互独立,且
佳估计方程
: 例 妇女受教育的年限与家务劳动时间调查资料
妇女 教育年限 劳动小时 xy x 2 y 2
A
2
5
10 4 25
B
2
4
8 4 16
C
3
4
12 9 16
D
3
3
99 9
E
4
1
4 16 1
F
4
1
4 16 1
G
4
0
0 16 0
H
6
0
0 36 0
I
8
0
0 64 0
36
18 47 174 68
第三节 回归方程的假定与检验
❖ 表示x与y两变量观测值相对其各自均值
所造成的共同平均偏差。协方差的数量
可以作为变量线性相关程度的度量。
❖ 2、相关系数
xixyiy
2
2
xix•yiy
❖ 相关系数就是标准化了的协方差,取值
范围:1,1
❖ 3、相关系数具有PRE的性质
❖ r为相关系数;PRE( r2)系数为判定系数。 ❖ 二者的区别?
❖ 例:以下是子代和父代受教育年限的抽 样调查:
父代 2 4
6
8 10
子代 4 5
8
7
9
❖ 求:回归直线、相关系数,是否有推论
意义?0.05
练习
❖ 如下资料,求回归直线、 相关系数,是否有推论 价值?
教育年限 6 9 9 13 16 16 19 21
个人成就 2 3 1 4 5 7 8 8
❖ 5、相关系数 的检验与回归系数 的
1n
有
E 0 D 2
5、处于检验的需要i ,要求y值的每i 一个子
总体都满足正态分布。
❖ 二、回归方程的检验 ❖ 1、原假设:x与y不存在线性关系
❖H0 : 0
❖H1 : 0
❖ 2、线性回归的平方和分解
❖ 1)总偏差平方和:反映观察值y i 围绕均
y 值 y 的总分散程度。
n
2
TS S i1 yiy
年次 91 92 93 94 95 96 97 98 x 116 129 137 146 144 165 182 198 y 104 115 124 131 132 145 158 172
建立回归方程,并进行F检验0.05
第四节 相关
❖ 一、相关系数 (线性相关)
❖ 1、协C 方差o x,:yv xixyiy n1
y y 1 n
n i1
i
E ❖TSS 1
,不知x与y有关系时估计y的总
误差。
❖ 2)剩余平方和:反映观测值 y i 偏离回
归线
y
的程度。
i
RSS
n
i1
yiyi
2
❖ y i 由回归直线y a bx 确定
❖ RSSE2,知道x与y有关后,估计y所产
生的误差
❖ 3)回归平方和:通过回归直线解释 掉的误差。
检验的关系:
❖ 如果通过了 的检验也必然导致 (F
检验)检验的通过。实际上,F公式与 r
公式有对应关系:
F
r2 1r2
n2
F1,n2
❖ 6、相关与回归的比较 ❖ 1)相同点:都是研究变量之间的非确定
性关系,而且都是研究其中的线性关系。
❖ 2)不同点:
❖ ①回归是研究变量之间的因果关系百度文库但 相关不一定具有因果关系。
❖ 社会现象之间有哪些属于相关关系?
❖ 2、散布图
x
x 1 x 2 x 3 …… x n
y
yy
1
2
y 3
……
y n
y
………………………………
x1
x
❖ 3、回归方程与线性回归方程 ❖ 1)回归方程
Eyifxi
❖ 自变量不同取值时,因变量y平均值的变化。
❖ 2)线性回归方程(一元)
❖ 当因变量y的平均值与自变量x呈线性关系时
❖ ②相关系数是双向对称的,回归直线是 非对称的。
第五节 用回归方程进行预测
❖ 求y的区间估计值
❖
y e a
❖ 4、相关系数的检验
❖ H 0 :P0
H 1 :P0
❖ t
n2
2
1
tn2
❖ 用 进行直接检验: ❖ 1)根据 公式计算样本的 值
❖ 2)给出显著性水平 和k=n-2,按附表8查出
相应的临界相关系数
❖ 3)比较 与 的大小
❖
如在果 显著 性水平
则x与y之间存在线性相关关系, 下显著
❖ 一、线性回归模型基本假定的界定
❖ 1、自变量x可以是随机变量,也可以是 非随机变量,x值可以认为是无误差的。
❖ 2、由于x和y之间存在非确定性的相关关
系 等,。D 因 y 此 要D 求y y 的D 所y 有 子 总D y 体 的 方 差D y 都相
11 2
i
n
❖ 3、y的所有子总体,其均值都在一条直