教育统计学第八章 线性回归
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
( X X )( Y Y )
r n SX SY
( X X )( Y Y ) r n S X S Y
又 S X 2
(X X )2 n
( X X ) 2 n S X 2
b
( X X )( Y Y ) (X X )2
r n SX SY n S X 2
而回归分析的研究目的是确定变量之间数量关系的可能形式, 找出表达它们之间依存关系的合适的数学模型,并用这个数 学模型来表示一个变量随另一个变量作不同程度变化的单向 关系。
一元线性回归
只有一个自变量的线性回归叫一元线性回归,也称作简单线性回归。
回归方程和回归系数
(1)回归方程
yˆ abX
(2) 回归方程的求法——最小二乘法
r SY SX
( 2)用原始数据计算:
b
(X
X )( Y (X X )2
Y
)
XY ( X )( n
X
2
( X
n
)2
Y
)
回归系数与相关系数的关系
r byxbxy
相关系数是两个回归系数的几何平均。 1、一元线性回归与相关系数的计算,都是以两个连续变量的共变数为基
础,其基本原理相似。 2、在进行回归分析时,由于目的在于用某一变量去预测另一变量的变化
b
b
b
(Y Y ) b( X X ) 2 0,
b
即 : 2 (Y Y ) b( X X )( X X ) 0
即 : ( X X )(Y Y ) b ( X X )2 0
即
:b
(X
X )(Y (X X )2
Y
)
求回归系数的转换公式
(1) 用相关系数 r 与标准差 S X 、 S Y 计算:
∑ 2140 1420
X-
-18.00 -10.00 19.00 -20.00 12.00 -6.00 23.00 8.00 1.00 -2.00 -23.00 14.00 -10.00 -6.00 -15.00 3.00 21.00 4.00 -8.00 13.00
Y-
-16.00 3.00 16.00 -11.00 .00 -17.00 19.00 2.00 -4.00 -1.00 -18.00 11.00 -13.00 -11.00 -4.00 9.00 14.00 2.00 .00 19.00
4、误差等分散性假设。
特定水平的误差,除了应呈随机化的常态分配,其变异量也应相等,称为误差等分散性。
一元线性回归方程的建立、有效性检验与应用
下面是20名工作人员的智商和某一次技术考试成绩,根据这个结果求出考
试 成绩对智商的回归方程。如果另有一名工作人员智商为120,则估计一下若他
也参加技术考试,将会得多少分?
情形,往往是单向地分析两变量的变化关系,即找出一个变量随另一变量 的变化而变化的关系,X与Y两个变量各有其作用。在回归系数的计算中, bYX反映当X变化时Y的变化率,bXY反映当Y变化时X的变化率,因此它们 分别用X Y和Y X表示,是一种不对称设计。 3、但是在计算相关系数时,考虑的是两个变量的变化情况,相关表示两 方面的平均关系,属于对称性设计,因此相关分析是双向的,不强调哪个 是自变量哪个是因变量,以X Y表示。
教育统计学第八章 线性回归
回归分析与相关分析的关系
1、回归分析和相关分析均为研究及度量两个或两个以上ቤተ መጻሕፍቲ ባይዱ变量之间关系的方法。如果通过相关分析显示出变量间的关 系非常密切,则通过所求得的回归模型可以获得相当准确的 推算值。从广义上说,相关分析包括回归分析,但严格地讲, 二者有区别。
2、相关分析旨在分析数量之间关系的密切程度,一般使用 相关系数,表示的是两个变量之间的双向相互关系。
67
80
85
73
71
90
回归方程的建立
X
Y
89.00 55.00 97.00 74.00 126.00 87.00 87.00 60.00 119.00 71.00 101.00 54.00 130.00 90.00 115.00 73.00 108.00 67.00 105.00 70.00 84.00 53.00 121.00 82.00 97.00 58.00 101.00 60.00 92.00 67.00 110.00 80.00 128.00 85.00 111.00 73.00 99.00 71.00 120.00 90.00
工作人员 A
B
C
D
E
F
G
H
I
J
智商(X) 89 97
126 87
119 101 130 115 108 105
考试(Y) 55 74
87
60
71
54
90
73
67
70
工作人员 K
L
M
N
O
P
Q
R
S
T
智商(X) 84 121 97
101 92
110 128 111 99
120
考试(Y) 53 82
58
60
的Y(Xi一) 个无偏估计。
即
Yˆ(Xi)
Y(Xi)
。由此经由回归方程式所分离的误差项e,即由特定Xi所预测得到的
Y的估计值与实际的Yi之间的差距,也应呈正态分布。误差项e的平均数为0。因此有人指
出线性回归中应满足变量X没有测量误差。
3、独立性假设。
与某一个X值对应的一组Y值和另一个X值对应的一组Y值之间没有关系,彼此独立。不同X 所产生的误差之间应相互独立,无自相关,而误差项也需与自变量X相互独立。
一元线性回归的基本假设
1、线性关系假设。
X与Y在总体上具有线性关系。这是一条最基本的假设。
2、正态性假设。
回归分析中的Y服从正态分布。这样,与某一个X值对应的Y值构成变量Y的一个子总体,
所有这样的子总体都服从正态分布,其平均数记作
,Y (方X i差) 记作
。2 各个子总体的
Y(Xi)
方差都相等。与某一个X值对应的 是Yˆ( X该i ) 子总体平均数
a Y bX
b ( X X )( Y Y )
(X X )2
回归系数的确定
原理:使 Q (Y Yˆ )2 (Y a bX )2最小,
即:
(1) (2)
Q a Q b
0 先解
0
(1)得
:
Q a
2
(Y
a
bX
)
0, 整理
:a
Y
bX
(3);
将 (3)代入 (2) : Q (Y a bX )2 (Y Y bX bX )2