高中数学选修2-3优质课件2:3.1 回归分析的基本思想及其初步应用(2)
合集下载
人教版高中选修2-3回归分析的基本思想及其初步应用课件
y=bx2+a 非线性关系
换元 t=x2 y=bt+a 线性关系
方案2解答
平方变换:令t=x2,产卵数y和温度x之间二次函数模型 y=bx2+a就转化为产卵数y和温度的平方t之间线性回归 模型y=bt+a
温度
21
23
25
27
29
32
35
温度的平方t
441
529
625
729
841
1024
1225
产卵数y/个
产卵数y/个
350 300 250 200 150 100
50 0 0
t 150 300 450 600 750 900 1050 1200 1350
得:y=0.367x2 -202.543
当x=28时,y=0.367×282-202.54≈85,
从散点图看,还 象什么函数图像 的一部分? 350
eˆi(2) yi yˆi(2) yi 0.367x2 202.543,i 1, 2,..., 7.
x
21
23
25
27
29
32
35
y
7
11
21
24
66
115 325
eˆ(1) 0.557 -0.101 1.875 -8.950 9.230 -13.381 34.675 eˆ(2) 47.696 19.400 -5.832 -41.000 -40.104 -58.265 77.968
令:z = lny, a = lnc1,b = c2
则y = c1ec2x就转换为:z = bx +a
温度xoC z=lny 产卵数y/个
21
高中数学人教A版选修2-3课件:3.1回归分析的基本思想及其初步应用
问题导学
Байду номын сангаас
当堂检测
解:(1)由表画出散点图,如图所示.
问题导学
当堂检测
(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为 x 和 y 线性相关关系显著,下面求其回归方程,首先列出下表.
序号 1 2 3 4 5 6 7 8 ∑ xi 5 .6 6 .0 6 .1 6 .4 7 .0 7 .5 8 .0 8 .2 54.8 yi 130 136 143 149 157 172 183 188 1 258 x2 i 31.36 36.00 37.21 40.96 49.00 56.25 64.00 67.24 382.02 y2 i 16 900 18 496 20 449 22 201 24 649 29 584 33 489 35 344 201 112 xiyi 728.0 816.0 872.3 953.6 1 099.0 1 290.0 1 464.0 1 541.6 8 764.5
例 1 某工厂 1~8 月份某种产品的产量与成本的统计数据见 下表:
月份 产量 (t) 成本 (万元) 1 5 .6 130 2 6 .0 136 3 6 .1 143 4 6 .4 149 5 7 .0 157 6 7 .5 172 7 8.0 183 8 8 .2 188
以产量为 x,成本为 y. (1)画出散点图; (2)y 与 x 是否具有线性相关关系?若有,求出其回归方程. 思路分析:画出散点图,观察图形的形状得 x 与 y 是否具有线性相关 关系.把数值代入回归系数公式求回归方程 . x
3.回归模型拟合效果的刻画
类 别 残差图法 残差点比较均匀地落在 特 点 水平的带状区域内,说明 选用的模型比较适合,这 样的带状区域的宽度越 窄,说明模型拟合精度越 高 残差平方和法 残差平方和
选修2-3第三章:回归分析的基本思想及其初步应用(校级优质课)
为了衡量预报的精度,需要估计 的σ2值?
随机误差ei yi bxi a(i 1, 2,....n) ˆ ˆ ˆ ˆ 其估计值为: e y y y bx a
i i i i i
ˆ ei称为相应点(xi ,yi )的残差
(1)根据散点图来粗略判断它们是否线性相关。
(2)是否可以用线性回归模型来拟合数据
施化肥量
30 40 50
x
Q(a,b)= (yi - bxi - a)2 取最小值时,a,b的值.
i=1
推导过程见教材80和81页,推导 方法叫最小二乘法
1、所求直线方程 y = bx + a 叫做回归直 ˆ ˆ ˆ ---线方程;其中
回归直线方程:
(x
i=1 n n i
称为样本点的中心。 2.相应的直线叫做回归直线。 3、对两个相关变量进行的线性分析叫做 线性回归分析。
高二数学 选修2-3
3.1回归分析的基本 思想及其初步应用 (两课时)
复习、变量之间的两种关系
问题1:正方形的面积y与正方形的边长x之间 的函数关系是 确定性关系 y = x2 问题2:某水田水稻产量y与施肥量x之间是否 -------有一个确定性的关系? 例如:在 7 块并排、形状大小相同的试验田 上 进行施肥量对水稻产量影响的试验,得到 如下所示的一组数据:
如:人的身高与年龄; 产品的成本与生产数量;
商品的销售额与广告费;
家庭的支出与收入。等等 探索:水稻产量y与施肥量x之间大致有何 规律?
施化肥量x 15
20
25
30
35
40
45
水稻产量y 330 345 365 y
500 450 400 350 300 10
高中数学选修2-3优质课件:回归分析的基本思想及其初步应用
[类题通法] 求线性回归方程的步骤
(1)列表表示 xi,yi,xiyi,x2i ;
n
n
(2)计算 x , y , xi2, xiyi;
i=1
i=1
(3)代入公式计算^a,^b的值; (4)写出线性回归方程.
[对点训练] 为了估计山上积雪融化后对下游灌溉的影响,在山下建立了
一个观测站,测量了最大积雪深度 x(尺)与当年灌溉面积 y(千 亩),得到连续 10 年的数据于下表:
[例 2] 已知某种商品的价格 x(元)与需求量 y(件)之间的
关系有如下一组数据:
x(元) 14
16 18 20 22
y(件) 12
10
75 3
求 y 对 x 的回归直线方程,并说明回归模型拟合效果的
好坏.
[解] x =15×(14+16+18+20+22)=18, y =15×(12+10+7+5+3)=7.4,
5
x2i =142+162+182+202+222=1 660,
i=1
5
y2i =122+102+72+52+32=327,
i=1
5
xiyi=14×12+16×10+18×7+20×5+22×3=620,
i=1
5 xiyi-5-x -y
i=1
∴^b=
5
=62106-605-×51×8×1872.4=-1.15.
n
yi- y 2
i=1
,
其几何意义: R2越接近于1 ,表示回归效果越好.
【常考题型】
求线性回归方程 [例 1] 某种产品的广告费用支出 x 与销售额 y(单位:百 万元)之间有如下的对应数据:
x/百万元 2 4 5 6 8 y/百万元 30 40 60 50 70 (1)画出散点图; (2)求线性回归方程; (3)试预测广告费用支出为 10 百万元时,销售额多大?
【人教.高中.数学】选修2-3全册:第三章 3.1 回归分析的基本思想及其初步应用【PPT课件】
5
xiyi=1 380.
i=1
5
xiyi-5 x y
i=1
于是可得^b=
5
=1 318405--55×2×5×5 50=6.5,
x2i -5 x 2
i=1
^a= y -^b x =50-6.5×5=17.5. 所以所求的线性回归方程为^y=6.5x+17.5. (3)根据上面求得的线性回归方程,当广告费用支出 为 10 百万元时, ^y=6.5×10+17.5=82.5(百万元), 即广告费用支出为 10 百万元时,销售额大约为 82.5 百万元.
y 16
12
52 1
作出 y 与 t 的散点图,如图所示:
由图可知 y 与 t 近似地呈线性相关关系.
5
5
又 t =1.55, y =7.2, tiyi=94.25, ti2=21.312 5,
i=1
i=1
5 tiyi-5-t -y
i=1
^b=
5 t2i -5-t 2
=9241.2.351-2 55×-15.×551×.575.22≈4.134 4,
精确度越高.
3.利用相关指数 R2 刻画回归效果
n
yi-^y i2
i=1
1-
其计算公式为:R2=
n
yi- y 2
i=1
,
其几何意义: R2越接近于1 ,表示回归效果越好.
[化解疑难] 1.在线性回归模型中,因为 e 是一个随机变量,所以 可以通过其数字特征来刻画它的一些总体特征. 2.在线性回归模型中,R2 表示解释变量对于预报变量 变化的贡献率,R2 越接近于 1,表示回归的效果越好.
年序 1 2 3 4 5
最大积雪深度x/尺 15.2 10.4 21.2 18.6 26.4
高中数学人教A版选修2-3教学课件:3.1.2回归分析的基本思想及其初步应用(2)
~ ~ ~
(1)
~
^ ^ y =g(x,b),其中a和b分别是参数 a 和 b 的估计值; (2)
^
• [例1] 以下是某地搜集到的新房屋的销售 价格y和房屋的面积x的数据: 房屋面积 115 110 80 135 105 2 (m ) 销售价格 • (1) 画出数据对应的散点图; 24.8 21.6 18.4 29.2 22 (万元) • (2)求线性回归方程,并在散点图中加上回 归直线; • (3)据(2)的结果估计当房屋面积为 150m2时 的销售价格.
∴^ e1=2.2-2.54=-0.34, ^ e2=3.8-3.77=0.03, ^ e3=5.5-5=0.5, ^ e4=6.5-6.23=0.27, ^ e5=7.0-7.46=-0.46. ∴残差平方和为 ( - 0.34)2 + 0.032 + 0.52 + 0.272 + ( - 0.46)2=0.651.
• [解析] (1)数据对应的散点图如下图所示:
5 15 (2) x =5 xi=109,lxx= (xi- x )2=1570, i=1 i=1
y =23.2,lxy= (xi- x )(yi- y )=308.
i=1 ^ ^ ^, 设所求回归直线方程为y=bx+a ^ lxx 308 则 b= = ≈0.1962,a= y -b x =1.8166. lxy 1570
• 我们可以用残差图和相关指数R2=
•
来刻画回归的效果.
• 4.建立回归模型的基本步骤 解释变量 • (1)确定研究对象,明确哪个变量是 预报变量 ,哪个变量是 ; 散点图 • (2) 画出确定好的解释变量和预报变量的 ,观察它们之间的关系 ( 如是否存 在线性关系等); • (3) 由经验确定回归方程的类型 ( 如我们观 察到数据呈线性关系,则选用线性回归方 程 );
(1)
~
^ ^ y =g(x,b),其中a和b分别是参数 a 和 b 的估计值; (2)
^
• [例1] 以下是某地搜集到的新房屋的销售 价格y和房屋的面积x的数据: 房屋面积 115 110 80 135 105 2 (m ) 销售价格 • (1) 画出数据对应的散点图; 24.8 21.6 18.4 29.2 22 (万元) • (2)求线性回归方程,并在散点图中加上回 归直线; • (3)据(2)的结果估计当房屋面积为 150m2时 的销售价格.
∴^ e1=2.2-2.54=-0.34, ^ e2=3.8-3.77=0.03, ^ e3=5.5-5=0.5, ^ e4=6.5-6.23=0.27, ^ e5=7.0-7.46=-0.46. ∴残差平方和为 ( - 0.34)2 + 0.032 + 0.52 + 0.272 + ( - 0.46)2=0.651.
• [解析] (1)数据对应的散点图如下图所示:
5 15 (2) x =5 xi=109,lxx= (xi- x )2=1570, i=1 i=1
y =23.2,lxy= (xi- x )(yi- y )=308.
i=1 ^ ^ ^, 设所求回归直线方程为y=bx+a ^ lxx 308 则 b= = ≈0.1962,a= y -b x =1.8166. lxy 1570
• 我们可以用残差图和相关指数R2=
•
来刻画回归的效果.
• 4.建立回归模型的基本步骤 解释变量 • (1)确定研究对象,明确哪个变量是 预报变量 ,哪个变量是 ; 散点图 • (2) 画出确定好的解释变量和预报变量的 ,观察它们之间的关系 ( 如是否存 在线性关系等); • (3) 由经验确定回归方程的类型 ( 如我们观 察到数据呈线性关系,则选用线性回归方 程 );
高中数学 3.1回归分析的基本思想及其初步应用课件 新人教A版选修2-3
根据上表可得回归直线方程^y=b^x+a^,其中b^=0.76,a^= y
-b^ x .据此估计,该社区一户年收入为 15 万元家庭的年支出为
() A.11.4 万元 C.12.0 万元
B.11.8 万元 D.12.2 万元
• [答案] B
[解析] 考查线性回归方程. 由已知得 x =8.2+8.6+10.50+11.3+11.9=10(万元), y =6.2+7.5+85.0+8.5+9.8=8(万元), 故a^=8-0.76×10=0.4. 所以回归直线方程为^y=0.76x+0.4,社区一户年收入为 15 万元家庭年支出为^y=0.76×15+0.4=11.8(万元),故选 B.
包含在e中.
5.残差 对于样本点(x1,y1)、(x2,y2)、…、(xn,yn),其回归方程
为^y=b^x+a^,用^y作为回归模型Ey=eb=x+0,a+Dee=σ2 中 bx+a 的 估计值,随机误差 ei=yi-bxi-a 的估计值^ei=_y_i-__b^_x_i-__a^__ (i= 1,2,…,n),称为相应于点(xi,yi)的残差.
典例探究学案
• 变量间的相关性检验
• 示:
关于两个变量x和y的7组数据如下表所
x 21 23 25 27 29 32 35
y 7 11 21 24 66 115 325
试判断 y 与 x 是否线性相关.
[解析] -x =17(21+23+25+27+29+32+35)≈27.4,
-y =17(7+11+21+24+66+115+325)≈81.3,
体重关系的模型中,体重不仅受身高的影响,还会 受遗传基因、饮食习惯、生长环境等其他因素的影
响),它们的影响都体现在e中.
高中数学人教A版选修2-3:回归分析的基本思想及其初步应用PPT全文课件
现实生活中存在着大量的相关关系:
如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等
二、两个变量的线性相关 (1)散点图
正相关、 负相关。
(2)回归直线:观察散点图的特征,如果各点大 致分布在一条直线的附近,就称两个变量之间具 有线性相关的关系,这条直线叫做回归直线。
解析变量x(身高) 随机误差e
预报变量y(体重)
高中数学人教A版选修2-3:回归分析 的基本 思想及-3:回归分析 的基本 思想及 其初步 应用PPT 全文课 件【完 美课件 】
在线性回归模型中,e是用bx+a预报真实值y的 随机误差,即 e=y-(bx+a),它是一个不可观测 的量,那么应如何研究随机误差呢?
3.如果两个变量线性相关,则可以用线性回归模型 来表示:y=bx+a+e,其中a和b为模型的未知参数, e 称为随机误差。
4.线性回归模型y=bx+a+e中, 把自变量x称为解释变量, 把因变量y称为预报变量。
^
^
5.残差: ei yi yi
n
^
6.残差平方和:
( yi yi )2
i 1
第一步:列表(把数据整理成表格);
n
n
第二步:计算:x,
y,
xi
y , i
x2 ; i
i 1
i 1
第三步:代入公式计算b,a的值;
第四步:写出直线方程:
yˆ bˆx aˆ
高中数学人教A版选修2-3:回归分析 的基本 思想及 其初步 应用PPT 全文课 件【完 美课件 】
新课讲解
例 从某大学中随机选出8名女大学生,其 身高和体重数据如下表:
高中数学人教课标版选修2-3《回归分析基本思想及其初步应用(第2课时)》课件
1.137
54.373
6.627
45.883
-2.883
58.618
0.382
我们可以利用图形来分析残差.作图时纵坐标为残差,横坐标可以选
为样本的编号或者解释变量的数值,这样作出的图形称为残差图.下表是 以女大学生编号为横坐标的残差图
知识回顾
问题探究
课堂小结
随堂检测
探究二:什么是残差、及残差平方和、如何用残差判断拟合效果?
重点、难点知识★▲
从残差图中可以看到第 1 个样本点和第 6 个样本点的残差较大,需 要确认是否出现人为的错误.
知识回顾
问题探究
课堂小结
随堂检测
探究二:什么是残差、及残差平方和、如何用残差判断拟合效果?
重点、难点知识★▲
残差所能说明的情况: ①样本点的残差比较大,确认采集数据时是否出现人为的错 误或其他原因; ②残差点比较均匀地落在水平的带状区域中,说明选用的 模型比较合适,带状区域的宽度越窄,模型拟合精度越高,回 归方程的预报精度越高.
次数/x 成绩/y 30 30 33 34 35 37 37 39 39 42 44 46 46 48 50 51
根据数据分别计算相关系数、残差、相关指数
,判断能否用线性
回归模型,若能求出回归方程并试预测该运动员训练47次以及55次 的成绩,若不能说明理由.
详解:
(1)作出该运动员训练次数x与成绩y之间的散点图,如图1所示: 由散点图可知,它们之间具有线性相关关系.
y=bx+a+e中的bx+a.由于随机误差e=y-(bx+a),所以 值.对于样本点 而言,它们的随机误差为
其估计值为 称 是相对于点 的残差.
知识回顾
54.373
6.627
45.883
-2.883
58.618
0.382
我们可以利用图形来分析残差.作图时纵坐标为残差,横坐标可以选
为样本的编号或者解释变量的数值,这样作出的图形称为残差图.下表是 以女大学生编号为横坐标的残差图
知识回顾
问题探究
课堂小结
随堂检测
探究二:什么是残差、及残差平方和、如何用残差判断拟合效果?
重点、难点知识★▲
从残差图中可以看到第 1 个样本点和第 6 个样本点的残差较大,需 要确认是否出现人为的错误.
知识回顾
问题探究
课堂小结
随堂检测
探究二:什么是残差、及残差平方和、如何用残差判断拟合效果?
重点、难点知识★▲
残差所能说明的情况: ①样本点的残差比较大,确认采集数据时是否出现人为的错 误或其他原因; ②残差点比较均匀地落在水平的带状区域中,说明选用的 模型比较合适,带状区域的宽度越窄,模型拟合精度越高,回 归方程的预报精度越高.
次数/x 成绩/y 30 30 33 34 35 37 37 39 39 42 44 46 46 48 50 51
根据数据分别计算相关系数、残差、相关指数
,判断能否用线性
回归模型,若能求出回归方程并试预测该运动员训练47次以及55次 的成绩,若不能说明理由.
详解:
(1)作出该运动员训练次数x与成绩y之间的散点图,如图1所示: 由散点图可知,它们之间具有线性相关关系.
y=bx+a+e中的bx+a.由于随机误差e=y-(bx+a),所以 值.对于样本点 而言,它们的随机误差为
其估计值为 称 是相对于点 的残差.
知识回顾
人教高中数学选修2-3第三章3.1回归分析的基本思想及其初步应用课件
Image yi -9 -7 -5 -3 -1 1 5 3 7 9
xiyi 9 14 15 12 5 5 15 12 14 9
所求回归直线方程为
70 65 60 55 50 45 40
150 155 160 165 170 175 180
图1.1 2
假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散 点图中所有的点将完全落在回归直线上。但是,在图中,数据点并没有完全落 在回归直线上。这些点散布在回归直线附近。
有如下的两个线性模型:
(1) yˆ 6.5x 17.5 ;(2) yˆ 7x 17.
试比较哪一个拟合效果更好。
7、一般地,建立回归模型的基本步骤为:
(1)确定研究对象,明确哪个变量是解析变量,哪个变量是 预报变量。
(2)画出确定好的解析变量和预报变量的散点图,视察它们 之间的关系(如是否存在线性关系等)。
探索2:在这些点附近可画直线不止一条,哪条直 线最能代表x与y之间的关系呢?
探究
对于一组具有线性相关关系的数据 (x1, y1), (x2 , y2 ),..., (xn , yn ),
我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:
其中x
1 n
n i 1
xi ,
y
1 n
n i 1
yi .
aˆ y bˆx
2、求回归直线方程的步骤:
(1)求x
1 n
n i 1
xi , y
1 n
n i 1
yi
n
n
(2)求 xi2 , xi yi. n
n
i 1
i 1
y (xi x)(yi y)
xi
nxy
xiyi 9 14 15 12 5 5 15 12 14 9
所求回归直线方程为
70 65 60 55 50 45 40
150 155 160 165 170 175 180
图1.1 2
假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散 点图中所有的点将完全落在回归直线上。但是,在图中,数据点并没有完全落 在回归直线上。这些点散布在回归直线附近。
有如下的两个线性模型:
(1) yˆ 6.5x 17.5 ;(2) yˆ 7x 17.
试比较哪一个拟合效果更好。
7、一般地,建立回归模型的基本步骤为:
(1)确定研究对象,明确哪个变量是解析变量,哪个变量是 预报变量。
(2)画出确定好的解析变量和预报变量的散点图,视察它们 之间的关系(如是否存在线性关系等)。
探索2:在这些点附近可画直线不止一条,哪条直 线最能代表x与y之间的关系呢?
探究
对于一组具有线性相关关系的数据 (x1, y1), (x2 , y2 ),..., (xn , yn ),
我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:
其中x
1 n
n i 1
xi ,
y
1 n
n i 1
yi .
aˆ y bˆx
2、求回归直线方程的步骤:
(1)求x
1 n
n i 1
xi , y
1 n
n i 1
yi
n
n
(2)求 xi2 , xi yi. n
n
i 1
i 1
y (xi x)(yi y)
xi
nxy
高中数学优质课件精选人教版选修2-3课件3.1回归分析的基本思想及其初步应用
a∧= y -b∧ x =-0.003 02, ∴回归方程为∧y=1.041 5x-0.003 02.
• (3)残差分析
• 作残差图如下图所示,由图可知,残差点比 较均匀地分布在水平带状区域中,说明选用的 模型比较合适.
(4)计算相关指数 R2 计算相关指数 R2=0.985 5.说明了该运动员的成绩的差异 有 98.55%是由训练次数引起的. (5)做出预报 由上述分析可知,我们可用回归方程∧y=1.041 5x-0.003 02 作为该运动员成绩的预报值. 将 x=47 和 x=55 分别代入该方程可得∧y=49 和∧y=57. 故预测该运动员训练 47 次和 55 次的成绩分别为 49 和 57.
5
所以,
(yi-∧yi)2=0.3,
5
(yi- y )2=53.2,
i=1
i=1
5
yi-∧yi2
i=1
R2=1-
≈0.994,
5
yi- y 2
i=1
所以回归模型的拟合效果很好.
非线性回归分析
•
某地区不同身高的未成年男性的体重
平均值如下表:
身高x/cm 60 70 80 90 100 110 体重y/kg 6.13 7.90 9.99 12.15 15.02 17.50
i=1
1n
1n
=_____n_i=_1_x_i ____, y =____n_i=_1_y_i ___.
• 2.变量样本点中心:( x_,__y _) ___________,回 归直线过样本点的中心.
• 3.线性回归模型y=bx_+_a_+__e _______,a 其中b _____和_____是模e型的未知参数,___称为随 机解误释差变.量 自变量x又称为_预__报_变__量______,因变量 y又称为_____________.
3.1 回归分析的基本思想及其初步应用( 二)课件(人教A版选修2-3)
编号为3的女大学生的体重并也没有落在水平直线上,她的体重为50kg。解析 变量(身高)和随机误差共同把这名学生的体重从50kg“推”到了54.5kg,相差-4.5kg 这时解析变量和随机误差的组合效应为-4.5kg。
用这种方法可以对所有预报变量计算组合效应。
数学上,把每个效应(观测值减去总的平均值)的平方加起来,即用
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 6 7 8
身高/cm 165 165 157 170 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
y=bx+a
4. 用回归直线方程 解决应用问题
5. 了解相关指数 R2 和模型拟 合的效果之间的关系
6. 了解残差图的作用
7. 利用线性回归模型解决一类 非线性回归问题
2021/1/20
8. 正确理解分析方法与结果
郑平正 制作
回归分析的内容与步骤:
回归分析通过一个变量或一些变量的变化解释 另一变量的变化。
即,用这个回归方程不能给出每个身高为172cm 的女大学生的体重的预测值,只能给出她们平均 体重的值。
2021/1/20
郑平正 制作
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 6 7 8
身高/cm 165 165 157 170 175 165 155 170
n
R2
1
( yi yi )2
用这种方法可以对所有预报变量计算组合效应。
数学上,把每个效应(观测值减去总的平均值)的平方加起来,即用
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 6 7 8
身高/cm 165 165 157 170 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
y=bx+a
4. 用回归直线方程 解决应用问题
5. 了解相关指数 R2 和模型拟 合的效果之间的关系
6. 了解残差图的作用
7. 利用线性回归模型解决一类 非线性回归问题
2021/1/20
8. 正确理解分析方法与结果
郑平正 制作
回归分析的内容与步骤:
回归分析通过一个变量或一些变量的变化解释 另一变量的变化。
即,用这个回归方程不能给出每个身高为172cm 的女大学生的体重的预测值,只能给出她们平均 体重的值。
2021/1/20
郑平正 制作
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 6 7 8
身高/cm 165 165 157 170 175 165 155 170
n
R2
1
( yi yi )2
人教版高中数学选修2-3第三章1回归分析的基本思想及其初步应用(共33张PPT)教育课件
女大学生身高体重原始数据和相应的残差数据表
编号 1 2 3 4 5 6 7 8
身高/cm 165 165 157 170 175 165 155 170
体重/kg
残差_e
48
-6.373
57
2.627
50
2.419
54
-4.618
64
1.137
61
6.627
43
-2.883
58
0.382
利用图形分析
7 6 5 4 3 2 1 0
20 22 24 26 28 30 32 34 36 温度
得到线性回归方程为 z 0 .2x 7 3 2 .843
红铃虫的35产0 卵数对温度的非线性回归方程为
300 250
y1 e0.27x 23.843
200
产卵数
150
100
50
0
20 22 24 26 28 30 32 34 36
y
与
y
a,
b 与a,
b
线性回归模型
之间
存在误差
ybxae,
误差
随机
Ee0,De2.
原因
误差e
2越小 ~ ybxa预报 y值越精确
产生随机误差e的原因是什么?
一个人的体重值除了受身高的影响外,
还有 饮食
运动
度量误差
线性模型只是近似模型
怎样研究随机误差?如何衡量预报的精度? 随机变量数字特征
均值 反映随机变量取值平均水平 方差 反映随机变量集中于均值程度
函数关系是一种确定性关系 相关关系是一种非确定性关 系 回归分析是对具有相关关系的两个变量进行统
计分析的一种常用方法.
相关主题