教育统计学第八章 线性回归

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

( X X )( Y Y )
r n SX SY
( X X )( Y Y ) r n S X S Y
又 S X 2
(X X )2 n
( X X ) 2 n S X 2
b
( X X )( Y Y ) (X X )2
r n SX SY n S X 2
而回归分析的研究目的是确定变量之间数量关系的可能形式, 找出表达它们之间依存关系的合适的数学模型,并用这个数 学模型来表示一个变量随另一个变量作不同程度变化的单向 关系。
一元线性回归
只有一个自变量的线性回归叫一元线性回归,也称作简单线性回归。
回归方程和回归系数
(1)回归方程
yˆ abX
(2) 回归方程的求法——最小二乘法
r SY SX
( 2)用原始数据计算:
b
(X
X )( Y (X X )2
Y
)
XY ( X )( n
X
2
( X
n
)2
Y
)
回归系数与相关系数的关系
r byxbxy
相关系数是两个回归系数的几何平均。 1、一元线性回归与相关系数的计算,都是以两个连续变量的共变数为基
础,其基本原理相似。 2、在进行回归分析时,由于目的在于用某一变量去预测另一变量的变化
b
b
b
(Y Y ) b( X X ) 2 0,
b
即 : 2 (Y Y ) b( X X )( X X ) 0
即 : ( X X )(Y Y ) b ( X X )2 0

:b
(X
X )(Y (X X )2
Y
)
求回归系数的转换公式
(1) 用相关系数 r 与标准差 S X 、 S Y 计算:
∑ 2140 1420
X-
-18.00 -10.00 19.00 -20.00 12.00 -6.00 23.00 8.00 1.00 -2.00 -23.00 14.00 -10.00 -6.00 -15.00 3.00 21.00 4.00 -8.00 13.00
Y-
-16.00 3.00 16.00 -11.00 .00 -17.00 19.00 2.00 -4.00 -1.00 -18.00 11.00 -13.00 -11.00 -4.00 9.00 14.00 2.00 .00 19.00
4、误差等分散性假设。
特定水平的误差,除了应呈随机化的常态分配,其变异量也应相等,称为误差等分散性。
一元线性回归方程的建立、有效性检验与应用
下面是20名工作人员的智商和某一次技术考试成绩,根据这个结果求出考
试 成绩对智商的回归方程。如果另有一名工作人员智商为120,则估计一下若他
也参加技术考试,将会得多少分?
情形,往往是单向地分析两变量的变化关系,即找出一个变量随另一变量 的变化而变化的关系,X与Y两个变量各有其作用。在回归系数的计算中, bYX反映当X变化时Y的变化率,bXY反映当Y变化时X的变化率,因此它们 分别用X Y和Y X表示,是一种不对称设计。 3、但是在计算相关系数时,考虑的是两个变量的变化情况,相关表示两 方面的平均关系,属于对称性设计,因此相关分析是双向的,不强调哪个 是自变量哪个是因变量,以X Y表示。
教育统计学第八章 线性回归
回归分析与相关分析的关系
1、回归分析和相关分析均为研究及度量两个或两个以上ቤተ መጻሕፍቲ ባይዱ变量之间关系的方法。如果通过相关分析显示出变量间的关 系非常密切,则通过所求得的回归模型可以获得相当准确的 推算值。从广义上说,相关分析包括回归分析,但严格地讲, 二者有区别。
2、相关分析旨在分析数量之间关系的密切程度,一般使用 相关系数,表示的是两个变量之间的双向相互关系。
67
80
85
73
71
90
回归方程的建立
X
Y
89.00 55.00 97.00 74.00 126.00 87.00 87.00 60.00 119.00 71.00 101.00 54.00 130.00 90.00 115.00 73.00 108.00 67.00 105.00 70.00 84.00 53.00 121.00 82.00 97.00 58.00 101.00 60.00 92.00 67.00 110.00 80.00 128.00 85.00 111.00 73.00 99.00 71.00 120.00 90.00
工作人员 A
B
C
D
E
F
G
H
I
J
智商(X) 89 97
126 87
119 101 130 115 108 105
考试(Y) 55 74
87
60
71
54
90
73
67
70
工作人员 K
L
M
N
O
P
Q
R
S
T
智商(X) 84 121 97
101 92
110 128 111 99
120
考试(Y) 53 82
58
60
的Y(Xi一) 个无偏估计。

Yˆ(Xi)
Y(Xi)
。由此经由回归方程式所分离的误差项e,即由特定Xi所预测得到的
Y的估计值与实际的Yi之间的差距,也应呈正态分布。误差项e的平均数为0。因此有人指
出线性回归中应满足变量X没有测量误差。
3、独立性假设。
与某一个X值对应的一组Y值和另一个X值对应的一组Y值之间没有关系,彼此独立。不同X 所产生的误差之间应相互独立,无自相关,而误差项也需与自变量X相互独立。
一元线性回归的基本假设
1、线性关系假设。
X与Y在总体上具有线性关系。这是一条最基本的假设。
2、正态性假设。
回归分析中的Y服从正态分布。这样,与某一个X值对应的Y值构成变量Y的一个子总体,
所有这样的子总体都服从正态分布,其平均数记作
,Y (方X i差) 记作
。2 各个子总体的
Y(Xi)
方差都相等。与某一个X值对应的 是Yˆ( X该i ) 子总体平均数
a Y bX
b ( X X )( Y Y )
(X X )2
回归系数的确定
原理:使 Q (Y Yˆ )2 (Y a bX )2最小,
即:
(1) (2)
Q a Q b
0 先解
0
(1)得
:
Q a
2
(Y
a
bX
)
0, 整理
:a
Y
bX
(3);
将 (3)代入 (2) : Q (Y a bX )2 (Y Y bX bX )2
相关文档
最新文档