2017-2018学年高中数学人教A版选修1-2教学案: 第一章 章末小结与测评 Word版含解析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在散点图中样本点大致分布在一条直线附近,则利用线性回归模型进行研究,可近似地利用回归直线方程y ^=b ^x +a ^来预报,利用公式求出回归系数a ^,b ^
,即可写出回归直线方程,并用回归直线方程进行预测说明.
[典例1] 以下是某地收集到的新房屋的销售价格y 和房屋的面积x 的数据:
房屋面积x /m 2 115 110 80 135 105 销售价格y /万元
24.8
21.6
18.4
29.2
22
(1)画出数据对应的散点图; (2)若线性相关,求线性回归方程;
(3)根据(2)的结果估计当房屋面积为150 m 2时的销售价格. 解:(1)数据对应的散点图如图所示.
(2)由散点图知y 与x 具有线性相关关系.
由表中数据知x =15
∑i =1
5
x i =109,
y =15
∑i =1
5
y i =23.2,∑i =1
5x 2
i =60 975,∑i =1
5x i y i =12 952.
设所求回归直线方程为y ^=b ^x +a ^

则b ^=
∑i =15
x i y i -5x -y

∑i =1
5
x 2i -5x
2
≈0.196 2,a ^=y -b ^x -
≈1.814 2,
故所求回归直线方程为y ^
=0.196 2x +1.814 2.
(3)根据(2),当x =150时,销售价格的估计值为y ^
=0.1962×150+1.814 2=31.244 2(万元).
[对点训练]
1.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)
5
6
7
8
10
(1)求y 关于t 的回归方程y =b t +a ;
(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款.
附:回归方程y ^=b ^t +a ^中,b ^
=∑i =1
n
t i y i -n t y
∑i =1
n
t 2i -n t
-2
,a ^=y -b ^
t .
解:(1)列表计算如下:
i t i y i t 2i t i y i 1 1 5 1 5 2 2 6 4 12 3
3 7 9 21
4 4 8 16 32 5
5
10
25
50
∑ 15 36 55 120 这里n =5,t =1n ∑i =1
n t i =155=3,y =1n ∑i =1
n y i =36
5
=7.2,
又l tt =∑i =1
n t 2i -n t -
2=55-5×32=10,
l ty =∑i =1
n
t i y i -n t y =120-5×3×7.2=12,
从而b ^=l ty l tt =1210=1.2,a ^=y -b ^
t =7.2-1.2×3=3.6,
故所求回归方程为y ^
=1.2t +3.6.
(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^
=1.2×6+3.6=10.8(千亿元).
对于建立的回归模型,我们必须对模型的拟合效果进行分析,也就是对利用回归模型解决实际问题的效果进行评价.一方面可以对比残差或残差平方和的大小,同时观察残差图,进行残差分析;另一方面也可以研究数据的R 2(相关系数r ).对模型拟合效果的分析能够帮助我们利用最优化的模型来解决实际问题.
[典例2] 在研究弹簧伸长长度y (cm)与拉力x (N)的关系时,对不同拉力的6根弹簧进行测量,测得如下表中的数据:
x /N 5 10 15 20 25 30 y /cm
7.25
8.12
8.95
9.90
10.9
11.8
若依据散点图及最小二乘法求出的回归直线方程为y ^
=0.18x +6.34,求R 2,并结合残差说明拟合效果. 解:列表求值如下:
x i 5 10 15 20 25 30 y i 7.25 8.12 8.95 9.90 10.9 11.8 x i y i 36.25 81.2 134.25 198 272.5 354 x 2i 25 100 225 400 625 900 y i -y ^i 0.01 -0.02 -0.09 -0.04 0.06 0.06 y i -y
-2.24
-1.37
-0.54
0.41
1.41
2.31
x =17.5,y
≈9.49,∑i =16
x i y i =1 076.2,∑
i =16
x 2
i =2 275,∑i =16 (y i -y ^i )2=0.017 4,∑
i =1
6
(y i -
y )2=14.678 4.
∴R 2=1-0.017 4
14.678 4
≈0.998 81,回归模型拟合效果较好.由表中数据可以看出残差比较均匀地落在宽度不
超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高.
[对点训练]
2.从某大学中随机选取5名女大学生,其身高和体重数据如下表所示:
编号
1 2 3 4 5 身高x /cm 165 165 157 170 175 体重y /kg
48
57
50
54
64
甲、乙两位同学在计算根据女大学生的身高预报体重的回归方程时,分别得到以下回归模型:甲:y ^
=0.75x -70;乙:y ^
=0.76x -71.试依据R 2判定哪一个模型的拟合效果较好?
解:对甲模型,y i -y ^
i 与y i -y 的值如下表:
y i -y ^i -5.75 3.25 2.25 -3.5 2.75 y i -y
-6.6
2.4
-4.6
-0.6
9.4
所以∑i =1
5
(y i -y ^
i )2=(-5.75)2+3.252+2.252+(-3.5)2+2.752=68.5,
∑i =1
5
(y i -y )2=(-6.6)2+2.42+(-4.6)2+(-0.6)2+9.42=159.2.此时R 2=1-68.5
159.2≈0.57.
对乙模型,y i -y ^
i 与y i -y 的值如下表:
y i -y ^i -6.4 2.6 1.68 -4.2 2 y i -y
-6.6
2.4
-4.6
-0.6
9.4
所以∑i =1
5
(y i -y ^
i )2=(-6.4)2+2.62+1.682+(-4.2)2+22≈72.2,
∑i =1
5
(y i -y )2=(-6.6)2+2.42+(-4.6)2+(-0.6)2+9.42=159.2.此时R 2=1-72.2
159.2≈0.55.
因为0.57>0.55,
所以甲模型的拟合效果较好.
独立性检验就是根据采集的样本数据,利用公式求出随机变量K 2的观测值k ,通过比较k 与临界值k 0的
大小来确定两个分类变量是否有关系的方法.
[典例3] 户外运动已经成为一种时尚运动,某单位为了了解员工喜欢户外运动是否与性别有关,决定从本单位全体650人中采用分层抽样的办法抽取50人进行问卷调查,得到了如下列联表:
喜欢户外运动
不喜欢户外运动
总计 男性5 女性 10 总计50
已知在这50人中随机抽取1人抽到喜欢户外运动的员工的概率是3
5.
(1)请将上面的列联表补充完整; (2)求该公司男、女员工各多少人;
(3)在犯错误的概率不超过0.005的前提下能否认为喜欢户外运动与性别有关?并说明你的理由. 下面的临界值表仅供参考:
P (K 2≥k 0)
0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
参考公式:K 2=
n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
,其中n =a +b +c +d
解:(1)因为在全部50人中随机抽取1人抽到喜欢户外运动的员工的概率是3
5,所以喜欢户外运动的男女
员工共30人,其中男员工20人,列联表补充如下:
喜欢户外运动
不喜欢户外运动
总计 男性 20 5 25 女性 10 15 25 总计
30
20
50
(2)该公司男员工人数为25÷50×650=325(人),则女员工有325人.
(3)K 2的观测值k =50×(20×15-10×5)2
30×20×25×25≈8.333>7.879,所以在犯错误的概率不超过0.005的前提下认为
喜欢户外运动与性别有关.
[对点训练]
3.吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表是性别与吃零食的列联表:
男 女 总计 喜欢吃零食
5
12
17
不喜欢吃零食
40 28 68 总计
45
40
85
请问喜欢吃零食与性别是否有关? 解:k =n (ad -bc )2
(a +b )(c +d )(a +c )(b +d ),
把相关数据代入公式,得
k =85×(5×28-40×12)217×68×45×40
≈4.722>3.841.
因此,在犯错误的概率不超过0.05的前提下,可以认为“喜欢吃零食与性别有关”.
(时间:120分钟,满分:150分)
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.有下列关系:①人的年龄与他拥有的财富之间的关系;
②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其横断面直径与高度之间的关系,其中有相关关系的是( )
A .①②③
B .①②
C .②③
D .①③④
解析:选D 曲线上的点与该点的坐标之间是确定关系——函数关系,故②不正确.其余均为相关关系. 2.对于回归分析,下列说法中错误的是( )
A .在回归分析中,若变量间的关系是非确定性关系,则因变量不能由自变量唯一确定
B .相关系数可以是正的也可以是负的
C .回归分析中,如果R 2=1,说明变量x 与y 之间是完全线性相关
D .样本相关系数r ∈(-∞,+∞)
解析:选D 在回归分析中,样本相关系数r 的范围是|r |≤1,故选D. 3.在一次调查后,根据所得数据绘制成如图所示的等高条形图,则( )
A .两个分类变量关系较弱
B .两个分类变量无关系
C .两个分类变量关系较强
D .无法判断
解析:选C 从条形图中可以看出,在x 1中y 1比重明显大于x 2中y 1的比重,所以两个分类变量的关系较强.
4.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的斜率是b ,纵轴上的截距是a ,那么必有( )
A .b 与r 的符号相同
B .a 与r 的符号相同
C .b 与r 的符号相反
D .a 与r 的符号相反
解析:选A 因为b >0时,两变量正相关,此时r >0;b <0时,两变量负相关,此时r <0. 5.下表显示出样本中变量y 随变量x 变化的一组数据,由此判断它最可能是( )
x 4 5 6 7 8 9 10 y
14
18
19
20
23
25
28
A.线性函数模型 B .二次函数模型 C .指数函数模型 D .对数函数模型
解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函
数模型.
6.下表是某厂1~4月份用水量(单位:百吨)的一组数据:
月份x 1 2 3 4 用水量y
4.5
4
3
2.5
由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^=-0.7x +a ^,则a ^
=( )
A .10.5
B .5.15
C .5.2
D .5.25
解析:选D 样本点的中心为(2.5,3.5),将其代入线性回归方程可解得a ^
=5.25.
7.在研究吸烟与患肺癌的关系中,通过收集数据并整理、分析,得到“吸烟与患肺癌有关”的结论,并且有99%的把握认为这个结论成立.下列说法正确的个数是( )
①在100个吸烟者中至少有99个人患肺癌;②如果一个人吸烟,那么这个人有99%的概率患肺癌;③在100个吸烟者中一定有患肺癌的人;④在100个吸烟者中可能一个患肺癌的人也没有.
A .4
B .3
C .2
D .1
解析:选D 有99%的把握认为“吸烟与患肺癌有关”,指的是“吸烟与患肺癌有关”这个结论成立的可能性或者可信程度有99%,并不表明在100个吸烟者中至少有99个人患肺癌,也不能说如果一个人吸烟,
那么这个人就有99%的概率患肺癌;更不能说在100个吸烟者中一定有患肺癌的人,反而有可能在100个吸烟者中,一个患肺癌的人也没有.故正确的说法仅有④,选D.
8.下表是某小卖部一周卖出热茶的杯数与当天气温的对比表:
气温(℃) 18 13 10 4 -1 杯数
24
34
39
51
63
若热茶杯数y 与气温x 近似地满足线性关系,则其关系式最接近的是( ) A.y ^=x +6 B.y ^
=x +42 C.y ^=-2x +60 D.y ^
=-3x +78
解析:选C 由表格可知,气温与杯数呈负相关关系.把x =4代入y =-2x +60得y =52,e ^
=52-51=1.把x =4代入y =-3x +78得y =66,e ^
=66-51=15.故应选C.
9.如图,5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )
A .相关系数r 变大
B .残差平方和变大
C .相关指数R 2变大
D .解释变量x 与预报变量y 的相关性变强
解析:选B 由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.
10.根据一位母亲记录儿子3~9岁的身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)的线性回归方程为y ^
=7.19x +73.93,若用此方程预测儿子10岁时的身高,有关叙述正确的是( )
A .身高一定为145.83 cm
B .身高大于145.83 cm
C .身高小于145.83 cm
D .身高在145.83 cm 左右
解析:选D 用线性回归方程预测的不是精确值,而是估计值.当x =10时,y =145.83,只能说身高在145.83 cm 左右.
11.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调
查,得到以下数据:
)
A .没有充足的理由认为课外阅读量大与作文成绩优秀有关
B .有0.5%的把握认为课外阅读量大与作文成绩优秀有关
C .有99.9%的把握认为课外阅读量大与作文成绩优秀有关
D .有99.5%的把握认为课外阅读量大与作文成绩优秀有关
解析:选D 根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.
12.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,
y 2},其样本频数分别是a =10,b =21,c +d =35.若X 与Y 有关系的可信程度不小于97.5%,则c 等于( )
A .3
B .4
C .5
D .6 附:
解析:选A 列2×2列联表如下:

K 2的观测值
k =66×[10(35-c )-21c ]2
31×35×(10+c )(56-c )
≥5.024. 把选项A ,B ,C ,D 代入验证可知选A.
二、填空题(本大题共14小题,每小题5分,共20分,把答案填在题中横线上) 13.下面是一个2
×2列联表:
则表中b -a =________.
解析:b -a =8. 答案:8
14.已知样本容量为11,计算得∑i =1
11x i =510,∑i =1
11
y i =214,回归方程为y ^=0.3x +a ^,则x ≈________,a
^
≈________.(精确到0.01)
解析:由题意得x =111∑i =1
11x i =51011≈46.36,y =111∑i =1
11y i =21411
,因为y =0.3x +a ^

所以21411=0.3×51011+a ^,可得a ^
≈5.55.
答案:46.36 5.55
15.某单位为了了解用电量y (度)与气温x
(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ^=b ^x +a ^,其中b ^
=-2.现预测当气温为-4℃时,用电量的度数约为________.
解析:由题意可知x =1
4(18+13+10-1)=10,
y =14(24+34+38+64)=40,b ^
=-2.
又回归直线y ^=-2x +a ^过点(10,40),故a ^
=60, 所以当x =-4时,y ^
=-2×(-4)+60=68. 答案:68
16.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:
在犯错误的概率不超过解析:由列联表中的数据,得K 2的观测值为 k =89×(24×26-31×8)255×34×32×57
≈3.689>2.706,
因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系.
答案:0.10
三、解答题(本大题共6小题,共70分,解答时应写出必要的文字说明、证明过程或演算步骤) 17.(本小题10分)x 与y 有如下五组数据,
x 1 2 3 5 10 y
10
5
4
2
2
试分析x 与y 之间是否具有线性相关关系.若有,求出回归直线方程;若没有,说明理由. 解:作出散点图,如图所示:
由散点图可以看出,x 与y 不具有线性相关关系.
18.(本小题12分)有两个分类变量x 与y ,其一组观测值如下面的2×2列联表所示:
y 1 y 2 x 1 a 20-a x 2
15-a
30+a
其中a,15-a 均为大于5的整数,则a 取何值时,在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系?
解:查表可知,要使在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系,则k ≥2.706,而 k =65×[a (30+a )-(20-a )(15-a )]220×45×15×50
=65×(65a -300)220×45×15×50=13×(13a -60)260×90. 由k ≥2.706得a ≥7.19或a ≤2.04.
又a >5且15-a >5,a ∈Z ,解得a =8或9,
故a 为8或9时,在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系.
19.(本小题 12分)某学校高三年级有学生1000名,经调查,其中750名同学经常参加体育锻炼(称为A 类同学),另外250名同学不经常参加体育锻炼(称为B 类同学),现用分层抽样方法(按A 类、B 类分两层)从该年级的学生中共抽取100名同学,如果以身高达165 cm 作为达标的标准,对抽取的100名学生,得到以下列联表:
身高达标 身高不达标
总计 经常参加体育锻炼
40
不经常参加体育锻炼15
总计100
(1)完成上表;
(2)能否在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系(K 2的观测值精确到0.001)?
解:(1)填写列联表如下:
身高达标 身高不达标
总计 经常参加体育锻炼 40 35 75 不经常参加体育锻炼
10 15 25 总计
50
50
100
(2)由列联表中的数据,得K 2的观测值为 k =100×(40×15-35×10)275×25×50×50
≈1.333<3.841.
所以不能在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系.
20.(本小题12分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了4次试验,得到数据如下:
零件的个数x (个)
2 3 4 5 加工的时间y (小时)
2.5
3
4
4.5
(1)在给定坐标系(如图)中画出表中数据的散点图;
(2)求y 关于x 的线性回归方程y ^=b ^x +a ^
; (3)试预测加工10个零件需要的时间. 解:(1)散点图如图所示:
(2)由表中数据得x = 3.5,y =3.5, ∑i =1
4
(x i -x )(y i -y )=3.5,
∑i =1
4
(x i -x )2=5,
由公式计算得b ^=0.7,a ^=y --b ^x -
=1.05, 所以所求线性回归方程为y ^
=0.7x +1.05. (3)当x =10时,y ^
=0.7×10+1.05=8.05, 所以预测加工10个零件需要8.05小时.
21.(本小题12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.
(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?
P (K 2≥k )
0.100 0.050 0.010 0.001 k
2.706
3.841
6.635
10.828
解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名. 所以,样本中日平均生产件数不足60件的工人中, 25周岁以上组工人有60×0.05=3(人), 记为A 1,A 2,A 3;
25周岁以下组工人有40×0.05=2(人), 记为B 1,B 2.
从中随机抽取2名工人,所有的可能结果共有10种,
它们是(A 1,A 2),(A 1,A 3),(A 2,A 3),(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).
其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).故所求的概率P =7
10
.
(2)由频率分布直方图可知,在抽取的100名工人中, “25周岁以上组”中的生产能手有60×0.25=15(人), “25周岁以下组”中的生产能手有40×0.375=15(人), 据此可得2×2列联表如下:
生产能手 非生产能手
合计 25周岁以上组 15 45 60 25周岁以下组
15 25 40 合计
30
70
100
所以得
K 2=
n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
=100×(15×25-15×45)260×40×30×70

25
14
≈1.79. 因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”. 22.(本小题12分)在一段时间内,某种商品价格x (万元)和需求量y (t )之间的一组数据如下表:
价格x 1.4 1.6 1.8 2 2.2 需求量
12
10
7
5
3
(1)画出散点图;
(2)求出y 对x 的线性回归方程,并在(1)的图形上画出它的图象;
(3)如果价格定为1.9万元,预测需求量大约是多少.(结果精确到0.01 t). 解:(1)散点图如图所示.
(2)x -=1.8,y -
=7.4,∑i =1
5x i y i =62,∑i =1
5
x 2i =16.6,
b ^=
∑i =1
5
x i y i -5x -y

∑i =1
5x 2i -5x
-2
=62-5×1.8×7.416.6-5×1.82=-4.60.4=-11.5,a ^=y --b ^x -=7.4+11.5×1.8=28.1. 所以y 对x 的线性回归方程为y ^
=-11.5x +28.1.画出图象如图.
(3)当价格定为1.9万元,即x =1.9时,y =-11.5×1.9+28.1=6.25.所以商品价格定为1.9万元时,需求量大约是6.25t.。

相关文档
最新文档