2017年高考数学文二轮复习课件:专题整合突破 专题7 概率与统计 第2讲 统计与统计案例 适考素能
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8.[2016·吉林通化月考]某产品的广告费用 x(万元)与销 售额 y(万元)的统计数据如下表:
广告费用 x(万元) 3 4 5 6 销售额 y(万元) 25 30 40 45 根据上表可得回归方程^y=b^x+a^中的b^为 7.据此模型预 测广告费用为 10 万元时销售额为___7_3_.5___万元. 解析 由题表可知,x =4.5,y =35,代入回归方程^y=
宿生”有 55 人,“走读生”有 45 人,利用时间不充分的
有 100×(P1+P2+P3+P4)=25 人,从而 2×2 列联表如下: 利用时间充分 利用时间不充分 总计
走读生
301545 Nhomakorabea住宿生
45
10
55
总计
75
25
100
将 2×2 列联表中的数据代入公式计算,
得 K2=nnn111+nn222+-n+n11n2n+2212=100×45×305×5×107-5×152×5452= 3476542×0612050≈3.030.∵3.030<3.841, ∴没有理由认为学生“利用时间是否充分”与走读、 住宿有关.
(3)从甲、乙两组数据中各任取一个,求所取两数之差 的绝对值大于 20 的概率.
解 (1)甲组数据的中位数为78+2 79=78.5,乙组数据 的中位数为75+2 82=78.5.
从茎叶图可以看出,甲组数据比较集中,乙组数据比 较分散.
(2)由图易知 a=0.05,b=0.02,c=0.01. (3)从甲、乙两组数据中各任取一个,得到的所有基本 事件共有 100 个,其中满足“两数之差的绝对值大于 20” 的基本事件有 16 个,故所求概率 P=11060=245.
P6=1120×30=12050,P7=2100×30=11050, P8=6100×30=1500, ∴P4=1-(P1+P2+P3+P5+P6+P7+P8)=11020, ∴第④组的高度为 h=11020×310=310020=2150, 频率分布直方图如图.
(2)由频率分布直方图可知,在抽取的 100 人中,“住
12.为了调查学生星期天晚上学习时间的利用问题,某 校从高二年级 1000 名学生(其中走读生 450 名,住宿生 550 名)中,采用分层抽样的方法抽取 n 名学生进行问卷调查.根 据问卷取得了这 n 名同学星期天晚上学习时间(单位:分钟) 的数据,按照以下区间分为八组:①[0,30),②[30,60),③ [60,90),④[90,120),⑤[120,150),⑥[150, 180),⑦[180,210), ⑧[210, 240),得到频率分布直方图如图,已知抽取的学生 中星期天晚上学习时间少于 60 分钟的人数为 5 人.
5
5
(2)∵ (xi- x )(yi- y )=30, (xi- x )2=40,
i=1
i=1
∴b^=0.75,a^= y -b^ x =17.75. 则所求的线性回归方程为y^=0.75x+17.75.
10.[2016·江淮十校一联]某学校在高一、高二两个年级
学生中各抽取 100 人的样本,进行普法知识调查,其结果如
解得 y=0.2,
所以年龄在[35,40)的网民出现的频率为 0.2.故选 C.
3.[2016·开封一模]下列说法错误的是( ) A.自变量取值一定时,因变量的取值带有一定随机性 的两个变量之间的关系叫做相关关系 B.在线性回归分析中,相关系数 r 的值越大,变量间 的相关性越强 C.在残差图中,残差点分布的带状区域的宽度越狭窄, 其模型拟合的精度越高 D.在回归分析中,R2 为 0.98 的模型比 R2 为 0.80 的模 型拟合的效果好
2017年高考数学文二轮复习课件:专 题整合突破 专题7 概率与统计 第2讲 统计与统计案例 适考素能特训 2-7-2a
2.[2016·湖北武汉第二次调研]如图是依据某城市年龄 在 20 岁到 45 岁的居民上网情况调查而绘制的频率分布直方 图,现已知年龄在[30,35),[35,40),[40,45)的上网人数呈现 递减的等差数列分布,则年龄在[35,40)的网民出现的频率为 ()
A.0.04 C.0.2
B.0.06 D.0.3
解析 由频率分布直方图的知识得,年龄在[20,25)的
频率为 0.01×5=0.05,[25,30)的频率为 0.07×5=0.35,设
年龄在[30,35),[35,40),[40,45]的频率为 x,y,z,又 x,y, z 成等差数列,所以可得
x+y+z=1-0.05-0.35, x+z=2y,
(3)由题可知第①组人数为 100×P1=2(人),第②组人 数为 100×P2=3(人),
记第①组的 2 人为 A1,A2,第②组的 3 人为 B1,B2, B3,
则“从 5 人中抽取 2 人”所构成的基本事件有 A1A2, A1B1,A1B2,A1B3,A2B1,A2B2,A2B3,B1B2,B1B3,B2B3”, 共 10 个基本事件;
下表:
高一 高二 总数
合格人数
70
x
150
不合格人数 y
20
50
总数
100 100 200
(1)求 x,y 的值;
(2)有没有 99%的把握认为“高一、高二两个年级这次
普法知识调查结果有差异”;
(3)用分层抽样的方法从样本的不合格同学中抽取 5 人 的辅导小组,在 5 人中随机选 2 人,这 2 人中,正好高一、 高二各 1 人的概率为多少?
所以所求概率为 P=35.
11.[2016·重庆测试]从甲、乙两部门中各任选 10 名员 工进行职业技能测试,测试成绩(单位:分)数据的茎叶图如 图 1 所示:
(1)分别求出甲、乙两组数据的中位数,并比较两组数 据的分散程度(只需给出结论);
(2)甲组数据频率分布直方图如图 2 所示,求 a、b、c 的值;
政治(y 分) 77 79 79 82 83
(1)求该生 5 次月考历史成绩的平均分和政治成绩的方
差;
(2)一般来说,学生的历史成绩与政治成绩有较强的线 性相关关系,根据上表提供的数据,求两个变量 x、y 的线 性回归方程^y=b^x+a^.
n
n
xi- x yi- y xiyi-n x y
附:b^=i=1
7.[2015·豫北十校联考]2015 年的 NBA 全明星赛于北京 时间 2015 年 2 月 14 日举行.如图是参加此次比赛的甲、乙 两名篮球运动员以往几场比赛得分的茎叶图,则甲、乙两人 这几场比赛得分的中位数之和是___6_4____.
解析 应用茎叶图的知识得,甲、乙两人这几场比赛 得分的中位数分别为 28,36,因此甲、乙两人这几场比赛得 分的中位数之和是 64.
7x+a^,得a^=3.5,所以回归方程为y^=7x+3.5.所以当 x=10 时,^y=7×10+3.5=73.5.
三、解答题
9.[2016·河北三市二联]下表是高三某位文科生连续 5
次月考的历史、政治的成绩,结果统计如下:
月份
9 10 11 12 1
历史(x 分) 79 81 83 85 87
解析 由题设知,a=45,b=10,c=30,d=15, 所以 K2=100×55×454×5×157-5×302×5102≈3.0303. 2.706<3.0303<3.841. 由附表可知,有 90%以上的把握认为“该市居民能否 做到‘光盘’与性别有关”,故选 C.
二、填空题 6.[2016·石家庄质检二]将高三(1)班参加体检的 36 名学 生,编号为:1,2,3,…,36,若采用系统抽样的方法抽取一 个容量为 4 的样本,已知样本中含有编号为 6、24、33 的学 生,则样本中剩余一名学生的编号是___1_5____. 解析 根据系统抽样的特点可知抽取的 4 名学生的编 号依次成等差数列,故剩余一名学生的编号是 15.
i=1
=
,a^=^y-b^ x
n
xi- x 2
n
xi2-n x 2
i=1
i=1
解 (1) x =51×(79+81+83+85+87)=83,
∵ y =15×(77+79+79+82+83)=80,
∴
s
2 y
=
1 5
×[(77
-
80)2
+
(79
-
80)2
+
(79
-
80)2
+
(82
-
80)2+(83-80)2]=4.8.
浪费”,某市通过随机询问 100 名性别不同的居民是否能做
到“光盘”行动,得到如下的列联表:
做不到“光盘” 能做到“光盘”
男
45
10
女
30
15
附:
P(K2≥k) 0.10 0.05 0.025
k
2.706 3.841 5.024
K2=a+bcn+add-ab+cc2b+d.
参照附表,得到的正确结论是( ) A.在犯错误的概率不超过 1%的前提下,认为“该市 居民能否做到‘光盘’与性别有关” B.在犯错误的概率不超过 1%的前提下,认为“该市 居民能否做到‘光盘’与性别无关” C.有 90%以上的把握认为“该市居民能否做到‘光 盘’与性别有关” D.有 90%以上的把握认为“该市居民能否做到‘光 盘’与性别无关”
4.[2016·河南郑州二模]某工厂为了对新研发的一种产
品进行合理定价,将该产品按事先拟定的价格进行试销,得
到如下数据:
单价(元) 4 5 6 7 8 9
销量(件) 90 84 83 80 75 68
由表中数据,求得线性回归方程y^=-4x+a,若在这些
样本点中任取一点,则它在回归直线左下方的概率为( )
解析 根据相关关系的概念知 A 正确;当 r>0 时,r 越大,相关性越强,当 r<0 时,r 越大,相关性越弱,故 B 不正确;对于一组数据的拟合程度的好坏的评价,一是残 差点分布的带状区域越窄,拟合效果越好.二是 R2 越大, 拟合效果越好,所以 R2 为 0.98 的模型比 R2 为 0.80 的模型 拟合的效果好,C,D 正确,故选 B.
参考公式:χ2=a+bcn+add-ab+cc2b+d χ2≥ 5.024 6.635 7.879 10.828 97.5% 99% 99.5% 99.9%
解 (1)x=80,y=30. (2)由(1)得 χ2=20105×0×705×0×201-008×0×103002≈2.67<6.635, 所以没有 99%的把握认为“高一、高二两个年级这次 普法知识调查结果有差异”.
(3)由分层抽样得从高一抽取 3 人,设为 A,B,C,从 高二抽取 2 人,设为 1,2.
从 5 人中选 2 人,有(AB),(AC),(A1),(A2),(BC), (B1),(B2),(C1),(C2),(12),共 10 种选法.
其中正好高一、高二各 1 人,有(A1),(A2),(B1),(B2), (C1),(C2),共 6 种选法.
1
1
A.6
B.3
1
2
C.2
D.3
解析 由表中数据得 x =6.5, y =80. 由( x , y )在直线y^=-4x+a 上,得 a=106. 即线性回归方程为y^=-4x+106.经过计算只有(5,84) 和(9,68)在直线的下方,故所求概率为62=31,选 B.
5.[2016·湖南永州一模]为大力提倡“厉行节约,反对
(1)求 n 的值并补全频率分布直方图;
(2)如果把“学生晚上学习时间达到两小时”作为是否
充分利用时间的标准,对抽取的 n 名学生,完成下列 2×2
列联表:
利用时间充分 利用时间不充分 总计
走读生
住宿生
10
总计
据此资料,是否有 95%的把握认为学生“利用时间是否
充分”与走读、住宿有关?
(3)若在第①组、第②组共抽出 2 人调查影响有效利用 时间的原因,求抽出的 2 人中第①组、第②组各有 1 人的概 率.
参考数据: P(K2 ≥k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828 参考公式:K2=nnn111+nn222+-n+n11n2n+2212
解 (1)设第 i 组的频率为 Pi(i=1,2,…,8), 由图可知 P1=15100×30=1200,P2=10100×30=1030, ∴学习时间少于 60 分钟的频率为 P1+P2=1500, 由题意得 n×1050=5,∴n=100. 又 P3=3175×30=1800,P5=1100×30=13000,