1.1回归分析的基本思想及其初步应用(3)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解: 1)用y = c1ec2x 模型; 令 z = lny 则z=bx+a,(a=lnc1,b=c2),列出变换后数据表并画 出x与z 的散点图
x y z 21 7 23 11 25 21
z 7 6 5 4 3 2 1 0 0 10 20 30 40
27 24
29 66
32 115
35 325
1.946 2.398 3.045 3.178 4.19 4.745 5.784
y ax b e, y c1e
c2 x e
,
z c2 x b e
y t e
y x e.
2
可以利用直观(散点图和残差图)、相关指 数来确定哪一个模型的拟合效果更好。
建立回归模型的基本步骤 1)确定解释变量和预报变量; 2)画出散点图; 3)确定回归方程类型; 4)求出回归方程; 5)利用相关指数或残差进行分析.
i=1 i=1
ˆ ˆ = y - bx a
预报精度
1.相关指数R2
R2 = 1 -
(y
i=1 n i=1
n
i
- yi ) - y)
2
2
(y
=
(y
i=1 n i=1
n
i
- y)
2
在含有一个解释 变量的线性模型 中R2=r2(相关程度) 判断xi确定差异 百分数
i
(y
i
- y)
2
2.残差e
(x1 ,y1 ), (x2 ,y , (xn ,yn ) 对于样本点 它们随机误 2 ), 1) 衡量预报精度
小 实际问题 y = f(x) 抽样
结 样本分析 y = f(x)
回归模型 y = f(x)
yi - bxi - a 称相应残差. 差的估计值ei = yi - yi = 2)确定样本的异常点. 残差分析: 残差图
建立回归模型的基本步骤 1)确定解释变量和预报变量; 2)画出散点图; 3)确定回归方程类型; 4)求出回归方程; 5)利用相关指数或残差进行分析.
问题:一只红铃虫的产卵数y与温度x有关,现收 集了7组观测数据,试建立y与x之间的回归方程
z
x和z之间的关系可以用线性回归模型来拟合 z = ax+b+e
2 2) 用 y=c3x2+c4 模型,令 t = x ,则y=c3t+c4 ,列出 变换后数据表并画出t与y 的散点图
x
21
23
25
27
29
32
35
t
y
441
7
529
11
625
21
y
729
24
841
66
1024
115
1225
325
350 300 250 200 150 100 50 0 0 200 400 600 800 1000 1200 1400
瑞安五中
陈俊燕
线性回归模型
E(e)= 0
y=bx+a+e
y=bx+a+e其中a和b为模型的未知参数, e是y与 y ˆ 之间的误差,通常e称为随机误差。
ˆ +a 所求直线方程 y ˆ 叫做回归直线方程; ˆ = bx 其中 n n (xi - x)(yi - y) xi yi - nxy i=1 ˆ = i=1 b = , n n 2 2 2 (xi - x) xi - nx
y
散点并不集中在一条直线的附近,因此用线 性回归模型拟合他们的效果不是最好的。
ˆ 非线性回归方程 y
二次回归方程 残差公式
(1) (2)
=e
0.272x-3.843 2
,
ˆ y
= 0.367x - 202.54
(1) (1) 0.272x-3.843 ˆ ˆ ei = yi - y = yi - e , (i = 1,2...7) (2) (2) 2 ˆ ˆ ei = yi - y = yi - 0.367x + 202.54,
残
编号 1 2
差
3
表
4 5 6 7
x
y
21
7
23
11
25
21 1.76
27
24 -9.149
29
66 8.889
32பைடு நூலகம்
115 -14.153
35
325 32.928
e(1) 0.52 -0.167
e(2) 47.7 19.397 -5.835
-41.003
-40.107
-58.268
77.965
在此处可以引导学生体会应用统计方法解决实 际问题需要注意的问题: 对于同样的数据,有 不同的统计方法进行分析,我们要用最有效的 方法分析数据。 现在有三个不同的回归模型可供选择来拟合红 铃虫的产卵数与温度数据,他们分别是:
温度x 21 产卵数y 7
350
23 11
300
25 21
27 24
29 66
32 115
35 325
解:1)作散点图;
产卵数
250
200
正相关关系
150
100
50
0 20 22 24 26 28 30 32 34 36
温度
从散点图中可以看出产卵数和温度之间的关系并不能 用线性回归模型来很好地近似。这些散点更像是集中 在一条指数曲线或二次曲线的附近。