统计案例线性回归方程讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x x
y
2
=621-6.65-×51×.8×1.872.4=-11.5,
^
^
a= y -b x =7.4+11.5×1.8=28.1.
故 y 对 x 的回归方程为y^=28.1-11.5x. (3)y^ =28.1-11.5×1.9=6.25(t).
返回
◆数学•选修2-3•(配人教A版)◆
残差分析
和b的_最__好__估__计_,
^b=x1y1+x21+x2yx222++……++xxn2ny-n-n nx-x2 ·-y ,
^a=
y
-
^ b
x
.
例如:从某大学中随机选取8名女大学生,其身高和体重 数据如下表所示:
编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59
(3)如价格定为1.9万元,预测需求量大约是多少?(精确 到0.01 t)
返回
◆数学•选修2-3•(配人教A版)◆
解析:(1)散点图如右图所示:
(2)因为 x =15×9=1.8,
y =15×37=7.4,∑ i=51xiyi=
5
62,∑ i=1
x2i =16.6,所以
5
b^ =∑ i=∑ i1=5x1iyxi2i--55
i=1
i=1
返回
◆数学•选修2-3•(配人教A版)◆
n
yi- ^yi2
i=1
R2=1-
n
相关指数 : _______i_=_1 __y_i-___y__2___,R2的 值越大 , 说明
_残__差__平__方__和___越小,模型的拟合效果__越__好____.
例如:在两个变量y与x的回归模型中,分别选择了甲、
所以解释变量小麦基本苗数对总效应约贡献了 83.2%.残
差变量贡献了约 1-83.2%=16.8%.
返回
◆数学•选修2-3•(配人教A版)◆
跟踪练习
2.一个车间为了规定工时定额,需要确定加工零件所花 费的时间,为此进行了10次试验,测得的数据如下:
编号 1 2 3 4 5 6 7 8 9 10
零件数x/个 10 20 30 40 50 60 70 80 90 100
返回
◆数学•选修2-3•(配人教A版)◆
跟踪练习
1.在一段时间内,分5次测得某种商品的价格x(万元)和 需求量y(t)之间的一组数据为:
1
2
3
4
5
价格x
1.4 1.6 1.8 2 2.2
需求量y
12
10
7
5
3
已知∑ i=51xiyi=62,∑ i=51x2i =16.6.
(1)画出散点图;
(2)求出y对x的回归方程;
4.总偏差平方和、残差平方和、回归平方和、相关指数: 名称 总偏差平方和 残差平方和 回归平方和
所有单个样本 说明 值与样本均值
差的平方和
回归值与样 本值差的平 方和
总偏差平方和-残差平 方和
公式
n
(yi- y )2
i=1
n
i=1
(yi-
^yi)2
n
n
(yi- y )2-
(yi- ^yi)2
____0____.
返回
◆数学•选修2-3•(配人教A版)◆
3.(2011年长沙一中月考)在对两个变量x、y进行线性回归 分析时一般有下列步骤:
①对所求出的回归方程作出解释;②收集数据(xi,yi),i =1,2,…,n;③求线性回归方程;④求相关系数;⑤根据 所搜集的数据绘制散点图.如果根据可靠性要求能够判定变 量x,y具有线性相关性,则在下列操作顺序中正确的是( D )
A.34.6万元
B.35.6万元
C.36.6万元
D.37.6万元
返回
◆数学•选修2-3•(配人教A版)◆
解析: x =-416=-4, y =1400=25,由题意知, y^ =-2.4x+^a过(-4,25),25=-2.4×(-4)+^a,得 ^a=25-9.6=15.4.所以y^=-2.4x+15.4.当 x=-8 时, y=19.2+15.4=34.6,故选 A. 答案:A
序号 x
y
x2
xy
1 1.40 1.70 1.96 2.380
返回
◆数学•选修2-3•(配人教A版)◆
2 1.50 1.79 3 1.60 1.88 4 1.70 1.95 5 1.80 2.03 6 1.90 2.10 7 2.00 2.16 8 2.10 2.21 ∑ 14.00 15.82
于是, x =18×14.00=1.75, y =18×15.82=1.977 5.
5
∑ i=1xiyi=6 746.76.
5
由b^ =∑ i=1x∑ i=5iy1xi-2i -55x x 2 y ≈0.29,a^ = y -b^ x ≈34.67,
返回
◆数学•选修2-3•(配人教A版)◆
^
故所求的回归直线方程为y=34.67+0.29x.
当 x=56.7 时,y^=34.67+0.29×56.7=51.113.
(2)预测水深为1.95 m时水的流速是多少?
返回
◆数学•选修2-3•(配人教A版)◆
分析:从散点图可以直观地 看出变量x与y之间有无线性相关 关系,为此把这8对数据描绘在平 面直角坐标系中,得到平面上8个 点,如下图所示.
由图容易看出,x与y之间有线性相关关系.故可用线性 回归模型解决.
解析:数据列表如下:
加工时间y/ 分
62
68
75
81
89
95
102
108
115
122
(1)求回归方程;
(2)判断(1)中所得回归模型拟合效果如何.
返回
◆数学•选修2-3•(配人教A版)◆
解析:(1)根据表中数据作出散点图,从而可以判断出用 线性回归模型来拟合数据.
计算得加工时间对零件数的线性回归方程为^y=0.668x+ 54.93.
返回
◆数学•选修2-3•(配人教A版)◆
解析:(1)散点图如下: (2)由图看出,样本点呈条状分布, 有比较好的线性相关关系,因此可以用 线性回归方程刻画它们之间的关系.
设回归方程为y^ =b^ x+a^ , x =30Leabharlann Baidu36, y =43.5, ∑ i=51x2i =5 101.56,∑ i=51yi2=9 511.43. x ·y =1 320.66, y 2=1 892.25, x 2=921.729 6,
残差数据如下表:
编号
1
2
3
4
5
残差e^ 0.39 -0.29 0.03 -0.65 0.67
编号
6
7
8
9
10
残差e^ -0.01 0.31 -0.37 -0.05 0.27
返回
◆数学•选修2-3•(配人教A版)◆
(2)以零件数为横坐标, 残差为纵坐标作出残差图 如图所示:
由图可知,残差点分 布较均匀,即用上述回归 模型拟合数据效果很好. 但需注意,由残差图也可以看出,第4个样本点和第5个样本 点的残差比较大,需要确认在采集这两个样本点的过程中是 否有人为的错误.
返回
◆数学•选修2-3•(配人教A版)◆
非线性回归分析
表:
某地区不同身高的未成年男性的体重平均值如下
身高x/cm 60 70 80 90 100 110
体重y/kg 6.13 7.90 9.99 12.15 15.02 17.50
身高x/cm 120 130 140 150 160 170
体重y/kg 20.92 26.86 31.11 38.85 47.25 55.05
试建立y与x之间的回归方程.
返回
◆数学•选修2-3•(配人教A版)◆
解析:根据上表中的数据 画出散点图如右图所示:
A.①②⑤③④
B.③②④⑤①
C.②④③①⑤
D.②⑤④③①
返回
◆数学•选修2-3•(配人教A版)◆
4.(2012年江门一模)有人收集了春节期间平均气温x与某取 暖商品销售额y的有关数据如下表:
平均气温/℃ -2 -3 -5 -6 销售额/万元 20 23 27 30
根据以上数据,用线性回归的方法,求得销售额y与平均 气温x之间线性回归方程y= bˆ x+ aˆ 的系数 bˆ =-2.4.则预测平 均气温为-8 ℃时该商品销售额为( )
n
xi- x yi- y
i=1
3.相关系数:r=
.
n
-n
xi-x2 yi- y 2
i=1
i=1
返回
◆数学•选修2-3•(配人教A版)◆
当r>0时,两个变量___正_____相关;当r<0时,两个变 量___负_____相关;相关系数的绝对值越接近于1,两个变量的 线性相关关系___越__强___,它们的散点图越接近_一__条__直__线_,这 时用线性回归模型拟合这组数据就__越__好____.此时建立的线 性回归模型是有意义的.
假定小麦基本苗数x与成熟期有效穗y之间存在相关 关系,今测得5组数据如下:
x 15.0 25.8 30.0 36.6 44.4 y 39.4 42.9 42.9 43.1 49.2 (1)以x为解释变量,y为预报变量,作出散点图; (2)求y与x之间的回归方程,并对于基本苗数56.7预报有 效穗; (3)计算各组残差,并计算残差平方和; (4)求相关指数R2,并说明残差变量对有效穗的影响占百 分之几.
2.25 2.56 2.89 3.24 3.61 4.00 4.41 24.92
2.685 3.008 3.315 3.654 3.990 4.320 4.641 27.993
返回
◆数学•选修2-3•(配人教A版)◆
^b=27.99234-.982×-18.×751×.715.2977 5=1115≈0.733. ^a=1.977 5-1115×1.75≈0.694. y对x的回归直线方程为y^=0.694+0.733x. 回归系数^b=0.733的含义是,在此灌溉渠道中,水深每 增加0.1 m,水的流速平均增加0.733 m/s, a^=0.694可以解释 为水的流速中不受水深影响的部分. (2)由(1)中求出的回归直线方程,把x=1.95代入,易得 y^=0.694+0.733×1.95≈2.12(m/s). 计算结果表明,当水深为1.95 m时可以预测渠水的流速 约为2.12 m/s.
A.残差
B.回归
C.二维条形图
D.独立检验
返回
◆数学•选修2-3•(配人教A版)◆
2.从散点图看,若样本点集中在某一条直线附近,则可
用下面的线性回归模型来表示:__y_=__b_x+__a_+__e_____.其中a和b 为模型的未知参数,e称为_随__机__误__差_.把a^和^b称为未知参数a
估计成熟期有效穗为 51.113.
^
^
^
(3)由于 y=bx+a+e,可以算出ei=yi-yi,分别为e1=
^
^
^
^
0.38,e2=0.748,e3=-0.47,e4=-2.184,e5=1.654.
残差平方和:∑i=51e^ 2i ≈8.43.
5
(4)∑i=1
(yi- y )2=50.18,
∴R2=1-580.4.138≈0.832.
返回
◆数学•选修2-3•(配人教A版)◆
由此建立的身高与体重的回归模型为y=0.849x-85.712, 用这个模型预报一名身高为172 cm的女大学生的体重,则正 确的叙述是( ) C
A.体重一定是60.316 kg
B.体重在60.316 kg以上
C.体重在60.316 kg左右
D.体重在60.316 kg以下
◆数学•选修2-3•(配人教A版)◆
统计案例
3.1 回归分析的基本思想及其初步应用 3.1.1 线性回归方程
◆数学•选修2-3•(配人教A版)◆
基础梳理
1.回归分析是对具有_相__关__关__系_的两个变量进行统计分析 的一种常用方法.
例如:身高与体重有关系可以用______分析的方法来研 究.( B )
乙两个不同的模型,它们的相关指数R2如下:
n
yi- ^yi2
n
yi- ^yi2
i=1
i=1
R
2
甲
=
1
-
=
0.845
,
R
2
乙
=
1
-
=
n
yi- y 2
n
yi- y 2
i=1
i=1
0.82,则____甲____模型拟合的效果更好.
返回
◆数学•选修2-3•(配人教A版)◆
自测自评 1.下列变量是相关关系的是( D ) A.人的身高与视力 B.角的大小与所对的圆弧长 C.收入水平与消费水平 D.人的年龄与身高 2.若线性回归方程中的回归系数 ^b =0,则相关系数为
返回
◆数学•选修2-3•(配人教A版)◆
线性回归分析
研究某灌溉渠道水的流速y与水深x之 间的关系, 测得一组数据如下:
水深x/m 1.40 1.50 1.60 1.70 1.80 1.90 2.00 2.10
流速y/ (m·s-1)
1.70
1.79
1.88
1.95
2.03
2.10
2.16
2.21
(1)求y对x的回归直线方程;