专题四 概率与统计第1讲概率与统计(小题)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
√D.身高相差10厘米的两人臂展都相差11.6厘米
解析 A项,身高极差大约为20,臂展极差大于等于25,故正确; B项,很明显根据散点图以及回归直线得到,身高矮臂展就会短一些,身高高一些, 臂展就长一些,故正确; C项,身高为190厘米,代入回归方程可得到臂展估计值等于189.65厘米,但不是准 确值,故正确; D项,身高相差10厘米的两人臂展的估计值相差11.6厘米,但并不是准确值,回归 方程上的点并不都是准确的样本点,故说法不正确.
解析 根据题意,系统抽样是等距抽样,所以抽样间隔为1100000=10. 因为46除以10余6, 所以抽到的号码都是除以10余6的数, 结合选项知,616号学生被抽到.
2.(2018·全国Ⅰ,文,3)某地区经过一年的新农村建设,农村的经济收入增加了一 倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农 村建设前后农村的经济收入构成比例,得到如下饼图:
116%a
故选A.
3.(2018·全国Ⅲ,文,14)某公司有大量客户,且不同年龄段客户对其服务的评价有 较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有 简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是_分__层__抽__样___.
(2)(2019·合肥质检)某工厂生产的A,B,C三种不同型号的产品数量之比为2∶3∶5,
为研究这三种产品的质量,现用分层抽样的方法从该工厂生产的A,B,C三种产
品中抽出样本容量为n的样本,若样本中A型产品有10件,则n的值为
A.15
B.25
√C.50
D.60
解析 某工厂生产的A,B,C三种不同型号产品的数量之比为2∶3∶5, 分层抽样的方法抽取一个容量为n的样本, 则 A 被抽的抽样比为2+23+5=15,
跟踪演练2 (1)已知某高中的一次测验中,甲、乙两个班级的九科平均分的雷达 图如图所示,下列判断错误的是 A.乙班的理科综合成绩强于甲班 B.甲班的文科综合成绩强于乙班 C.两班的英语平均分分差最大
√D.两班的语文平均分分差最小
解析 由甲、乙两个班级的九科平均分的雷达图可得: 乙班的理科综合成绩强于甲班,即选项A正确, 甲班的文科综合成绩强于乙班,即选项B正确, 两班的英语平均分分差最大,即选项C正确, 两班地理平均分分差最小,即选项D错误.
0.050 3.841
0.010 6.635
0.001 10.828
nad-bc2
由 K2=
计算得,
a+bc+da+cb+d
100×45×22-20×132 K2 的观测值 k= 58×42×35×65 ≈9.616,
参照附表,得到的正确结论是
A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
√D.24
解析 由题意得,30+103+030+50=13200=6n,解得 n=24.
(2)(2019·上饶联考)某校高三科创班共48人,班主任为了解学生高考前的心理状 况,将学生按1至48的学号用系统抽样方法抽取8人进行调查,若抽到的最大学 号为48,则抽到的最小学号为__6___.
解析 由系统抽样方法从学号为1到48的48名学生中抽取8名学生进行调查,把 48人分成8组, 抽到的最大学号为48,它是第8组的最后一名,则抽到的最小学号为第一组的最 后一名6号.
√D.2018年月销售量最大的是6月份
解析 A项,由图可得3月份的销售任务是400台,所以A正确.
B项,由图形得2018年月销售任务的平均值为 112×(3+2+4+5+8+10+7+4+3+4+1+3)×100=450,所以 B 正确. C 项,由图形得第一季度的总销售量为 300×12+200×1+400×1.2=830(台), 所以C正确.
B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
√C.有99%以上的把握认为“生育意愿与城市级别有关”
D.有99%以上的把握认为“生育意愿与城市级别无关”
解析 由题意知, K2的观测值k≈9.616>6.635, ∴有99%以上的把握认为“生育意愿与城市级别有关”.
1
真题体验
则下面结论中不正确的是
√A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
解析 设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.
新农村建设前后,各项收入的对比如下表:
(2)(2019·黄冈模拟)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响 情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频 率分布直方图如图所示: 将阅读时间不低于30分钟的学生称为“阅读 霸”,则下列命题正确的是
√A.抽样表明,该校约有一半学生为阅读霸
B.该校只有50名学生不喜欢阅读 C.该校只有50名学生喜欢阅读 D.抽样表明,该校有50名学生为阅读霸
D项,由图形得销售量最大的月份是5月份,为800台,所以D不正确.
(2)(2019·临沂质检)已知8位学生的某次数学测试成绩的茎叶图如图,则下列说法 正确的是 A.众数为7 B.极差为19
√C.中位数为64.5
D.平均数为64
解析 根据茎叶图中的数据知,这组数据的众数为67,A错误; 极差是75-57=18,B错误; 中位数是62+2 67=64.5,C 正确; 平均数为 60+18(-3-1+1+2+7+7+12+15)=65,D 错误.
押题预测
真题体验
1.(2019·全国Ⅰ,文,6)某学校为了解1 000名新生的身体素质,将这些学生编号为
1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.
若46号学生被抽到,则下面4名学生中被抽到的是
A.8号学生
√C.616号学生
B.200号学生 D.815号学生
解析 根据频率分布直方图可列下表:
阅读时间(分钟) [0,10) [10,20) [20,30) [30,40) [40,50) [50,60]
抽样人数(名) 10 18 22 25
20
5
抽样100名学生中有50名为阅读霸,占一半,据此可判断该校约有一半学生为阅读霸.
热点三 变量间的相关关系、统计案例
(2)某研究型学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如 下表:
学习成绩优秀 学习成绩不优秀
总计
使用智能手机 4 16 20
不使用智能手机 8 2 10
总计 12 18 30
附表:
P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
若从表中第6行第6列开始向右依次读取3个数据,则得到的第6个样本编号为
例1 (1)(2019·汉中联考)某机构对青年观众是否喜欢跨年晚会进行了调查,人数 如下表所示:
男性青年观众 女性青年观众
不喜欢 30 30
喜欢 10 50
现要在所有参与调查的人中用分层抽样的方法抽取n人做进一步的调研,若在“不
喜欢的男性青年观众”的人中抽取了6人,则n等于
A.12
B.16
C.20
(2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的
面积乘以小长方形底边中点的横坐标之和.
4.对于其他的统计图表,要注意结合问题背景分析其所表达的意思,进而解决所
给问题.
例2 (1)(2019·厦门质检)如图是某公司2018年1月至12月空调销售任务及完成情况 的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为 90%,则下列叙述不正确的是 A.2018年3月的销售任务是400台 B.2018年月销售任务的平均值不超过600台 C.2018年第一季度总销售量为830台
跟踪演练1 (1)(2019·漳州质检)某工厂利用随机数表对生产的600个零件进行抽样
测试,先将600个零件进行编号,编号分别为001,002,…,599,600从中抽取60个
样本,如下提供随机数表的第4行到第6行:
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
高考中解决变量间的相关关系问题时需注意: (1)回归直线一定过样本点的中心( x , y ). (2)随机变量K2的观测值k越大,说明“两个变量有关系”的可能性越大.
例3 (1)(2019·皖江联考)某单位为了了解用电量y(度)与气温x(℃)之间的关系,随 机统计了某4天的用电量与当天气温,并制作了对照表:
概率与统计
主要内容 热点分类突破
真题押题精练
1
热点一 随机抽样
热点二 用样本估计总体
热点三 变量间的相关关系、统计案例
热点一 随机抽样
1.随机抽样的各种方法中,每个个体被抽到的概率都是相等的. 2.系统抽样又称“等距”抽样,被抽到的各个号码间隔相同. 3.分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.
跟踪演练3 (1)(2019·长春质检)某运动制衣品牌为了成衣尺寸更精准,现选择15名 志愿者,对其身高和臂展进行测量(单位:厘米),左图为选取的15名志愿者身高与 臂展的折线图,右图为身高与臂展所对应的散点图,并求得其回归方程为 y^=1.16x -30.75,以下结论中不正确的为
A.15名志愿者身高的极差小于臂展的极差 B.15名志愿者身高和臂展成正相关关系 C.可估计身高为190厘米的人臂展大约为189.65厘米
A.522 C.535
B.324
√D.578
解析 第6行第6列开始的数为808(不合适),436,789(不合适),535,577,348,994(不 合适),837(不合适),522,535(重复不合适),578, 则满足条件的6个编号为436,535,577,348,522,578, 则第6个编号为578.
新农村建设前 新农村建设后 新农村建设后变化情况 结论
种植收入
60%a
37%×2a=74%a
增加
A错
其他收入
4%a
5%×2a=10%a
增加了一倍以上
wenku.baidu.comB对
养殖收入
30%a
30%×2a=60%a
增加了一倍
C对
养殖收入+第 (30%+6%)a (30%+28%)×2a=
超过经济收入2a的一半 D对
三产业收入 =36%a
气温x(℃)
18 13 10 -1
用电量y(度) 24 34 38 64
由表中数据得线性回归方程 y^=b^x+a^中b^=-2,预测当温度为-5 ℃时,用电量的
度数约为
A.64
B.66
C.68
√D.70
解析 由已知 x =10, y =40,将其代入线性回归方程得 40=-2×10+a^⇒a^ =60, 故线性回归方程为y^=-2x+60,当 x=-5 时,y^=70.
因为 A 产品有 10 件,所以 n=110=50. 5
热点二 用样本估计总体
频率
频率
1.频率分布直方图中横坐标表示组距,纵坐标表示 ,频率=组距× .
组距
组距
2.频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数
频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即众数.
(2)(2019·泸州模拟)随着国家二胎政策的全面放开,为了调查一线城市和非一线城 市的二胎生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女, 结果如下表.
非一线城市 一线城市 总计
愿生
45
20
65
不愿生
13
总计
58
22
35
42
100
附表:
P(K2≥k0) k0
0.100 2.706
经计算K2的观测值k=10,则下列选项正确的是
√A.有99.5%的把握认为使用智能手机对学习有影响
B.有99.5%的把握认为使用智能手机对学习无影响 C.有99.9%的把握认为使用智能手机对学习有影响 D.有99.9%的把握认为使用智能手机对学习无影响
解析 由于K2的观测值k=10>7.879,其对应的值0.005=0.5%, 据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响.
解析 A项,身高极差大约为20,臂展极差大于等于25,故正确; B项,很明显根据散点图以及回归直线得到,身高矮臂展就会短一些,身高高一些, 臂展就长一些,故正确; C项,身高为190厘米,代入回归方程可得到臂展估计值等于189.65厘米,但不是准 确值,故正确; D项,身高相差10厘米的两人臂展的估计值相差11.6厘米,但并不是准确值,回归 方程上的点并不都是准确的样本点,故说法不正确.
解析 根据题意,系统抽样是等距抽样,所以抽样间隔为1100000=10. 因为46除以10余6, 所以抽到的号码都是除以10余6的数, 结合选项知,616号学生被抽到.
2.(2018·全国Ⅰ,文,3)某地区经过一年的新农村建设,农村的经济收入增加了一 倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农 村建设前后农村的经济收入构成比例,得到如下饼图:
116%a
故选A.
3.(2018·全国Ⅲ,文,14)某公司有大量客户,且不同年龄段客户对其服务的评价有 较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有 简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是_分__层__抽__样___.
(2)(2019·合肥质检)某工厂生产的A,B,C三种不同型号的产品数量之比为2∶3∶5,
为研究这三种产品的质量,现用分层抽样的方法从该工厂生产的A,B,C三种产
品中抽出样本容量为n的样本,若样本中A型产品有10件,则n的值为
A.15
B.25
√C.50
D.60
解析 某工厂生产的A,B,C三种不同型号产品的数量之比为2∶3∶5, 分层抽样的方法抽取一个容量为n的样本, 则 A 被抽的抽样比为2+23+5=15,
跟踪演练2 (1)已知某高中的一次测验中,甲、乙两个班级的九科平均分的雷达 图如图所示,下列判断错误的是 A.乙班的理科综合成绩强于甲班 B.甲班的文科综合成绩强于乙班 C.两班的英语平均分分差最大
√D.两班的语文平均分分差最小
解析 由甲、乙两个班级的九科平均分的雷达图可得: 乙班的理科综合成绩强于甲班,即选项A正确, 甲班的文科综合成绩强于乙班,即选项B正确, 两班的英语平均分分差最大,即选项C正确, 两班地理平均分分差最小,即选项D错误.
0.050 3.841
0.010 6.635
0.001 10.828
nad-bc2
由 K2=
计算得,
a+bc+da+cb+d
100×45×22-20×132 K2 的观测值 k= 58×42×35×65 ≈9.616,
参照附表,得到的正确结论是
A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
√D.24
解析 由题意得,30+103+030+50=13200=6n,解得 n=24.
(2)(2019·上饶联考)某校高三科创班共48人,班主任为了解学生高考前的心理状 况,将学生按1至48的学号用系统抽样方法抽取8人进行调查,若抽到的最大学 号为48,则抽到的最小学号为__6___.
解析 由系统抽样方法从学号为1到48的48名学生中抽取8名学生进行调查,把 48人分成8组, 抽到的最大学号为48,它是第8组的最后一名,则抽到的最小学号为第一组的最 后一名6号.
√D.2018年月销售量最大的是6月份
解析 A项,由图可得3月份的销售任务是400台,所以A正确.
B项,由图形得2018年月销售任务的平均值为 112×(3+2+4+5+8+10+7+4+3+4+1+3)×100=450,所以 B 正确. C 项,由图形得第一季度的总销售量为 300×12+200×1+400×1.2=830(台), 所以C正确.
B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
√C.有99%以上的把握认为“生育意愿与城市级别有关”
D.有99%以上的把握认为“生育意愿与城市级别无关”
解析 由题意知, K2的观测值k≈9.616>6.635, ∴有99%以上的把握认为“生育意愿与城市级别有关”.
1
真题体验
则下面结论中不正确的是
√A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
解析 设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.
新农村建设前后,各项收入的对比如下表:
(2)(2019·黄冈模拟)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响 情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频 率分布直方图如图所示: 将阅读时间不低于30分钟的学生称为“阅读 霸”,则下列命题正确的是
√A.抽样表明,该校约有一半学生为阅读霸
B.该校只有50名学生不喜欢阅读 C.该校只有50名学生喜欢阅读 D.抽样表明,该校有50名学生为阅读霸
D项,由图形得销售量最大的月份是5月份,为800台,所以D不正确.
(2)(2019·临沂质检)已知8位学生的某次数学测试成绩的茎叶图如图,则下列说法 正确的是 A.众数为7 B.极差为19
√C.中位数为64.5
D.平均数为64
解析 根据茎叶图中的数据知,这组数据的众数为67,A错误; 极差是75-57=18,B错误; 中位数是62+2 67=64.5,C 正确; 平均数为 60+18(-3-1+1+2+7+7+12+15)=65,D 错误.
押题预测
真题体验
1.(2019·全国Ⅰ,文,6)某学校为了解1 000名新生的身体素质,将这些学生编号为
1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.
若46号学生被抽到,则下面4名学生中被抽到的是
A.8号学生
√C.616号学生
B.200号学生 D.815号学生
解析 根据频率分布直方图可列下表:
阅读时间(分钟) [0,10) [10,20) [20,30) [30,40) [40,50) [50,60]
抽样人数(名) 10 18 22 25
20
5
抽样100名学生中有50名为阅读霸,占一半,据此可判断该校约有一半学生为阅读霸.
热点三 变量间的相关关系、统计案例
(2)某研究型学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如 下表:
学习成绩优秀 学习成绩不优秀
总计
使用智能手机 4 16 20
不使用智能手机 8 2 10
总计 12 18 30
附表:
P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
若从表中第6行第6列开始向右依次读取3个数据,则得到的第6个样本编号为
例1 (1)(2019·汉中联考)某机构对青年观众是否喜欢跨年晚会进行了调查,人数 如下表所示:
男性青年观众 女性青年观众
不喜欢 30 30
喜欢 10 50
现要在所有参与调查的人中用分层抽样的方法抽取n人做进一步的调研,若在“不
喜欢的男性青年观众”的人中抽取了6人,则n等于
A.12
B.16
C.20
(2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的
面积乘以小长方形底边中点的横坐标之和.
4.对于其他的统计图表,要注意结合问题背景分析其所表达的意思,进而解决所
给问题.
例2 (1)(2019·厦门质检)如图是某公司2018年1月至12月空调销售任务及完成情况 的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为 90%,则下列叙述不正确的是 A.2018年3月的销售任务是400台 B.2018年月销售任务的平均值不超过600台 C.2018年第一季度总销售量为830台
跟踪演练1 (1)(2019·漳州质检)某工厂利用随机数表对生产的600个零件进行抽样
测试,先将600个零件进行编号,编号分别为001,002,…,599,600从中抽取60个
样本,如下提供随机数表的第4行到第6行:
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
高考中解决变量间的相关关系问题时需注意: (1)回归直线一定过样本点的中心( x , y ). (2)随机变量K2的观测值k越大,说明“两个变量有关系”的可能性越大.
例3 (1)(2019·皖江联考)某单位为了了解用电量y(度)与气温x(℃)之间的关系,随 机统计了某4天的用电量与当天气温,并制作了对照表:
概率与统计
主要内容 热点分类突破
真题押题精练
1
热点一 随机抽样
热点二 用样本估计总体
热点三 变量间的相关关系、统计案例
热点一 随机抽样
1.随机抽样的各种方法中,每个个体被抽到的概率都是相等的. 2.系统抽样又称“等距”抽样,被抽到的各个号码间隔相同. 3.分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.
跟踪演练3 (1)(2019·长春质检)某运动制衣品牌为了成衣尺寸更精准,现选择15名 志愿者,对其身高和臂展进行测量(单位:厘米),左图为选取的15名志愿者身高与 臂展的折线图,右图为身高与臂展所对应的散点图,并求得其回归方程为 y^=1.16x -30.75,以下结论中不正确的为
A.15名志愿者身高的极差小于臂展的极差 B.15名志愿者身高和臂展成正相关关系 C.可估计身高为190厘米的人臂展大约为189.65厘米
A.522 C.535
B.324
√D.578
解析 第6行第6列开始的数为808(不合适),436,789(不合适),535,577,348,994(不 合适),837(不合适),522,535(重复不合适),578, 则满足条件的6个编号为436,535,577,348,522,578, 则第6个编号为578.
新农村建设前 新农村建设后 新农村建设后变化情况 结论
种植收入
60%a
37%×2a=74%a
增加
A错
其他收入
4%a
5%×2a=10%a
增加了一倍以上
wenku.baidu.comB对
养殖收入
30%a
30%×2a=60%a
增加了一倍
C对
养殖收入+第 (30%+6%)a (30%+28%)×2a=
超过经济收入2a的一半 D对
三产业收入 =36%a
气温x(℃)
18 13 10 -1
用电量y(度) 24 34 38 64
由表中数据得线性回归方程 y^=b^x+a^中b^=-2,预测当温度为-5 ℃时,用电量的
度数约为
A.64
B.66
C.68
√D.70
解析 由已知 x =10, y =40,将其代入线性回归方程得 40=-2×10+a^⇒a^ =60, 故线性回归方程为y^=-2x+60,当 x=-5 时,y^=70.
因为 A 产品有 10 件,所以 n=110=50. 5
热点二 用样本估计总体
频率
频率
1.频率分布直方图中横坐标表示组距,纵坐标表示 ,频率=组距× .
组距
组距
2.频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数
频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即众数.
(2)(2019·泸州模拟)随着国家二胎政策的全面放开,为了调查一线城市和非一线城 市的二胎生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女, 结果如下表.
非一线城市 一线城市 总计
愿生
45
20
65
不愿生
13
总计
58
22
35
42
100
附表:
P(K2≥k0) k0
0.100 2.706
经计算K2的观测值k=10,则下列选项正确的是
√A.有99.5%的把握认为使用智能手机对学习有影响
B.有99.5%的把握认为使用智能手机对学习无影响 C.有99.9%的把握认为使用智能手机对学习有影响 D.有99.9%的把握认为使用智能手机对学习无影响
解析 由于K2的观测值k=10>7.879,其对应的值0.005=0.5%, 据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响.