2021年统计与统计案例(文科)(13页)
最新-2021年大一轮数学文高考复习人教课件:第十章 统计、统计案例103 精品
y1 a c a+c
y2 b d b+d
总计 a+b c+d a+b+c+d
随机变量 K2=a+ban+adc-bb+cd2 c+d(其中 n= a+b+c+d 为 样本容量),则利用独立性检验判断表来判断“X 与 Y 的关系”.
3.判断下列结论的正误(正确的打“√”,错误的打“×”) (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关 系.(×) (2)利用样本点的散点图可以直观判断两个变量的关系是否可以用 线性关系去表示.(√) (3) 通 过 回 归 方 程 ^y = b^ x+ a^ 可 以 估 计 和 观 测 变 量 的 取 值 和 变 化 趋 势.(√) (4)任何一组数据都对应着一个回归直线方程.(×)
≈2.646.
7
∑i=1 yi- y 2=0.55, 7
参考公式:相关系数 r=
n
∑ ti- t yi- y
i=1
n
n
,
∑ ti- t 2∑ yi- y 2
i=1
i=1
回归方程^y=a^+b^t 中斜率和截距的最小二乘估计公式分别为:b^=
n
∑ ti- t yi- y
i=1 n
,a^= y -b^ t .
注:
P(K2≥k0) 0.10 0.05
k0
2.706 3.841
K2=a+bcn+add-ab+cc2b+d,n=a+b+c+d.
解:(1)由统计表可知,在抽取的 100 人中,“歌迷”有 25 人,从 而完成 2×2 列联表如下:
非歌迷 歌迷 总计 男 30 15 45 女 45 10 55 总计 75 25 100 将 2×2 列联表中的数据代入公式计算得: K2=100×75×302×5×104-5×455×5 152=13030≈3.030<3.841 所以我们没有 95%的把握认为是否为“歌迷”与性别有关.
统计与统计案例(文科)教程文件
统计与统计案例(文科)统计与统计案例第一节随机抽样1.下面的抽样方法是简单随机抽样的是( )A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D.用抽签方法从10件产品中选取3件进行质量检验答案:D2.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )答案:D3.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A.50 B.40 C.25 D.20答案: C4.某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A.11 B.12 C.13 D.14答案:B5.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.答案:46.某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )A.90 B.100C.180 D.300答案:C7.某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.答案:58.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=()A.54 B.90 C.45 D.126答案:B9.某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人).个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________.答案:3010.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.答案:180011.某市有A、B、C三所学校,共有高三文科学生1 500人,且A、B、C三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B校学生中抽取________人.答案:40第二节用样本估计总体12.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案: D13.某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.①直方图中的a=________;②在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案:①3 ②6 00014.某地政府调查了工薪阶层1 000人的月工资收入,并根据调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对月工资收入的满意程度,要用分层抽样的方法从调查的1 000人中抽出100人做电话询访,则(30,35](百元)月工资收入段应抽出________人.答案:1515.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )答案:A16.某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:①分别估计该市的市民对甲、乙两部门评分的中位数; ②分别估计该市的市民对甲、乙两部门的评分高于90的概率; ③根据茎叶图分析该市的市民对甲、乙两部门的评价.答案:①由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67. ②由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.③由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大. 17.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?答案:(1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1得x =0.007 5,∴直方图中x 的值为0.007 5.(2)月平均用电量的众数是220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,∴月平均用电量的中位数在[220,240)内,设中位数为a ,则(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5,解得a =224,即中位数为224.(3)月平均用电量在[220,240)的用户有0.012 5×20×100=25(户),同理可求月平均用电量为[240,260),[260,280),[280,300)的用户分别有15户、10户、5户,故抽取比例为1125+15+10+5=15,∴从月平均用电量在[220,240)的用户中应抽取25×1=5(户).518.重庆市2013年各月的平均气温(℃)数据的茎叶图如下图,则这组数据的中位数是( )A.19 B.20 C.21.5 D.23答案:B19.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为( )A.①③ B.①④ C.②③ D.②④答案:B20.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均环数x8.38.88.88.7方差s2 3.5 3.6 2.2 5.4A.甲 B.乙 C.丙 D.丁答案:C第三节变量间的相关关系、统计案例1.判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( )(2)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示.( )(3)通过回归方程y ^=b ^x +a ^可以估计和观测变量的取值和变化趋势.( ) (4)任何一组数据都对应着一个回归直线方程.( )(5)事件X ,Y 关系越密切,则由观测数据计算得到的K 2的观测值越大.( ) 答案:(1)× (2)√ (3)√ (4)× (5)√ 2.观察下列各图:其中两个变量x ,y 具有相关关系的图是( ) A .①② B .①④ C .③④ D .②③ 解析:选C 由散点图知③④具有相关关系.3.已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ,则a =( )x 0 1 3 4 y2.24.34.86.7A.3.25 B .2.6 C .解析:选B 由已知得x =2,y =4.5,因为回归方程经过点(x ,y ),所以a =4.5-0.95×2=2.6.4.若回归直线方程为y ^=2-1.5x ,则变量x 增加一个单位,y ( )A .平均增加1.5个单位B .平均增加2个单位C .平均减少1.5个单位D .平均减少2个单位解析:选 C 因为回归直线方程为y ^=2-1.5x ,所以b ^=-1.5,则变量x 增加一个单位,y 平均减少1.5个单位.5.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A .若K 2的观测值为k =6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病C .若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D .以上三种说法都不正确解析:选C 根据独立性检验的思想知C 项正确.6.下列四个散点图中,变量x 与y 之间具有负的线性相关关系的是( )答案:D7.为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x 轴、y 轴的单位长度相同),用回归直线方程y ^=bx +a 近似地刻画其相关关系,根据图形,以下结论最有可能成立的是( )A .线性相关关系较强,b 的值为1.25B .线性相关关系较强,b 的值为0.83C .线性相关关系较强,b 的值为-0.87D .线性相关关系较弱,无研究价值 答案:B8.已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( )A .x 与y 正相关,x 与z 负相关B .x 与y 正相关,x 与z 正相关C .x 与y 负相关,x 与z 负相关D .x 与y 负相关,x 与z 正相关 答案: C9.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y =b x +a ; (2)利用(1)中所求出的回归直线方程预测该地2016年的粮食需求量.解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:x =0,y =3.2,b ^=(-4)×(-21)+(-2)×(-11)+2×19+4×29-5×0×3.2(-4)2+(-2)2+22+42-5×02=26040=6.5, a ^=y -b ^x =3.2.由上述计算结果,知所求回归直线方程为 y ^-257=b ^(x -2010)+a ^=6.5(x -2010)+3.2, 即y ^=6.5(x -2010)+260.2.(*)(2)利用回归直线方程(*),可预测2016年的粮食需求量为6.5(2016-2010)+260.2=6.5×6+260.2=299.2(万吨).10.某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在40分以下的学生后,共有男生300名,女生200名.现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下所示频数分布表.精品资料仅供学习与交流,如有侵权请联系网站删除 谢谢11看,数学成绩与性别是否有关;(2)规定80分以上为优分(含80分),请你根据已知条件作出2×2列联表,并判断是否有90%以上的把握认为“数学成绩与性别有关”.附表及公式K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )[听前试做](1)x 男=45×0.05+55×0.15+65×0.3+75×0.25+85×0.1+95×0.15=71.5,x女=45×0.15+55×0.1+65×0.125+75×0.25+85×0.325+95×0.05=71.5,从男、女生各自的平均分来看,并不能判断数学成绩与性别有关.(2)由频数分布表可知:在抽取的100名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得2×2列联表如下:可得K 2=100×(15×25-15×45)260×40×30×70≈1.79,因为1.79<2.706,所以没有90%以上的把握认为“数学成绩与性别有关”.。
第一章统计案例(文科)
第一章统计案例(选修1——2)学习目标:1、回归分析的基本思想及其初步应用通过对典型案例的探究,进一步体会回归分析的基本思想、方法及其初步应用。
2、独立性检验的基本思想及其初步应用通过对典型案例的探究,体验独立性检验(只要求2×2列联表)的基本思想、方法及其应用。
1.1回归分析的基本思想及其初步应用(约4课时)1、教学标准①通过对典型案例的学习、理解和方法的实质,让学生进一步体会统计方法在解决实际问题中的基本思想。
②通过例1的教学,让学生进一步体验与线性回归模型有关的一些统计思想,体验模型的适用范围。
③通过例2的学习,让学生体会统计方法的特点。
④通过作图类比,让学生体会线性回归模型与函数模型的差异。
⑤通过典型案例的探究,使学生体会有些非线性模型通过交换可以转化为线性回归模型,体验在解决实际问题的过程中寻找更好的模型的方法,能运用用残差分析的方法,比较两种模型的拟合效果。
2、标准解析⑴内容解析本节内容是在前面必修③中学生学习了两个变量之间的相互关系,包括画散点图,最小二乘法求回归直线方程,利用回归直线方程进行预报等内容。
本节在此基础上进一步介绍模型的基本思想及其初步应用,这部分内容《教师用书》共计4课时。
第一课时:介绍线性回归模型的数学表达式,解释随机误差项产生的原因,使学生能正确理解回归方程的预报结果,并能从残差角度分析讨论回归模型的拟合效果;第二课时:从相关系数,相关指数的角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;第三课时:介绍两上变量非线性相关关系;第四课时:回归分析的应用。
教学重点体会回归模型与函数模型的区别感受任何模型只能近似描述实际问题学会模型拟合效果的分析工具——残差分析和R2,体会有些非线性模型通过变换可以转化为线性回归模型,体验在解决实际问题过程中寻找更好的模型的方法。
⑵、学情诊断本节是进一步介绍回归模型的基本思想及其应用,数学问题的载体都是具有实际意义与生活背景的,为了使例题具有一定的真实性,对例1进行了修改,让学生代表用抽样调查的方法统计10名男生的身高体重数据来进行线性回归分析。
最新-2021版高考数学大一轮人教A版文科复习课件:第十章 算法初步、统计与统计案例 104 精品
为2×2列联表)为
y1
y2×2列联表
总
计
2
x1
x2
总计
a
c
a+c
b
d
b+d
a+b
c+d
a+b+c+d
-8知识梳理
双基自测
自测点评
构造一个随机变量
1 2 3 4 5
2
(-)
K2 =
,其中
(+)(+)(+)(+)
解析
答案
-20考点1
考点2
考点3
考点 2
回归方程的求法及回归分析
例2下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折
线图.
注:年份代码1-7分别对应年份2008-2014.
-21考点1
考点2
考点3
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以
说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无
^
.据此估计,该社区一户年收入为 15 万元家庭的年支出为(
A.11.4万元
BC.12.0万元
B.11.8万元
D.12.2万元
)
关闭
答案
-12知识梳理
双基自测
自测点评
1 2 3 4 5
4.高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成
绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学
^
所以 y 关于 t 的回归方程为 =0.92+0.10t.
第2部分 专题4 第1讲 统计与统计案例 课件(共66张PPT)
由题意知
16n 52
-
13n 52
=6,解得n=104,所以选项D正确,故选
D.]
02 考点2 回归分析
高考串讲·找规律
考题变迁·提素养
1.(2020·全国卷Ⅰ)某校一个课外学习小组为研究某作物种子的 发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种 子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点 图:
2.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原
始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1
个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不
变的数字特征是( )
A.中位数
B.平均数
C.方差
D.极差
A [记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小 到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数, 故不变的数字特征是中位数,故选A.]
样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出
一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=
20
∑ xi- x yi- y
i=1 20
20
, 2≈1.414.
∑ xi- x 2 ∑ yi- y 2
i=1
i=1
[解]
(1)由已知得样本平均数
y
=
1 20
20
y
i=1
i=60,从而该地区这种
D [由饼形图知2050年中国将有约32%的人已经退休,所以选 项A错误;
设46~55岁的人数为16x人,16~25岁的人数为13x人,则46~ 55岁的人数比16~25岁的人数多16x1-3x13x=133≈23%,所以选项B错 误;
2021版文科数学全国通用版一轮复习第十一章 统计、统计案例第3节
一个解答题,选择题、填 应用.
空题中也会出现.
第十一章 统计、统计案例
返回导航
高考总复习 ·数学(文科)
1
课 前 ·基 础 巩 固
第十一章 统计、统计案例
返回导航
高考总复习 ·数学(文科) ‖知识梳理‖ 1.相关关系与回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性 的常用统计图是: 1 _散__点__图____;统计量有相关系数与相关指数. (1)在散点图中,点散布在从 2 __左__下__角___到 3 _右__上__角____的区域,对于两个变量的这 种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从 4 _左__上__角____到 5 _右__下__角____的区域,两个变量的这种相 关关系称为负相关.
第十一章 统计、统计案例
返回导航
三、易错自纠
高考总复习 ·数学(文科)
5.某医疗机构通过抽样调查(样本容量 n=1 000),利用 2×2 列联表和 K2 统计量研
究患肺病是否与吸烟有关,计算得 K2=4.453,经查阅临界值表和 P(K2≥3.841)≈0.05,
现给出四个结论,其中正确的是( )
①当当天气温为 26 ℃时,卖出的热饮杯数为 68. ②当当天气温升高 1 ℃时,卖出的热饮杯数约减少 3 杯. ③当当天气温升高 1 ℃时,卖出的热饮杯数约增加 3 杯. ④当当天气温为 28 ℃时,卖出的热饮杯数约为 62.
第十一章 统计、统计案例
返回导航
高考总复习 ·数学(文科)
解析:由线性回归方程得到估计值,所以①错误,④正确,由回归直线的斜率小于 零可知,当当天气温升高 1 ℃时,卖出的热饮杯数约减少 3 杯,所以②正确,③错误.
2021版文科数学全国通用版一轮复习第十一章 统计、统计案例第2节
第十一章统计、统计案例第二节用样本估计总体A级·基础过关|固根基|1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是()A.0.05 B.0.25C.0.5 D.0.7解析:选D由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为14=0.7.202.(2019届江西师大附中开学考试)某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量,如下表所示:用电量/度120140160180200户数2367 2则这20A.180,170 B.160,180C.160,170 D.180,160解析:选D用电量为180度的家庭最多,有7户,故这20户家庭该月用电量的众数是180;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,160,故这20户家庭该月用电量的中位数是160.故选D.3.为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是()A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数解析:选C由题图,可得是否倾向选择生育二胎与户籍有关、性别无关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中,男性人数为60×60%=36,女性人数为40×60%=24,不相同.4.(2018年全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析:选A设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由饼图可得新农村建设前种植收入为0.6a,新农村建设后种植收入为0.74a,所以新农村建设后,种植收入减少是错误的.故选A.5.(2019届陕西黄陵中学期末)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄在17~18岁的男生的体重(kg),将他们的体重按[54.5,56.5),[56.5,58.5),…,[74.5,76.5]分组,得到频率分布直方图如图所示.由图可知这100名学生中体重在[56.5,64.5)的学生人数是()A.20 B.30C.40 D.50解析:选C由频率分布直方图可得体重在[56.5,64.5)的学生频率为(0.03+0.05+0.05+0.07)×2=0.4,则这100名学生中体重在[56.5,64.5)的学生人数为100×0.4=40.故选C.6.(2020届“四省八校联盟”高三联考)某高中三年级甲、乙两班各选出7名学生参加高中数学竞赛,他们取得的成绩(满分140分)的茎叶图如图,其中甲班学生成绩的中位数为81,乙班学生成绩的平均数为86,则x+y=________.解析:根据甲班学生成绩的中位数为81可得x=1,根据乙班学生成绩的平均数为86可得86=17×(76+80+82+80+y+91+93+96),y=4,所以x+y=5.答案:57.在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制成如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是________.解析:根据频率分布直方图,得第二小组的频率是0.04×10=0.4,因为频数是40,所以样本容量是400.4=100,又成绩在80~100分的频率是(0.01+0.005)×10=0.15,所以成绩在80~100分的学生人数是100×0.15=15.答案:158.一组数据1,10,5,2,x,2(2<x<5),若该数据的众数是中位数的23倍,则该数据的方差为________.解析:根据题意知,该组数据的众数是2,则中位数是3,把这组数据从小到大排列,为1,2,2,x,5,10,则2+x2=3,解得x=4,所以这组数据的平均数为x=16×(1+2+2+4+5+10)=4,方差为s2=16×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.答案:99.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求频率分布直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.解:(1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a =0.30.(2)估计全市居民中月均用水量不低于3吨的人数为3.6万.理由如下:由(1)知,100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,得x=2.04.故可估计居民月均用水量的中位数为2.04.10.(2019年全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值代表).解:(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.B级·素养提升|练能力|11.某商场对某一商品搞活动,已知该商品每一个的进价为3元,销售价为8元,每天售出的第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如图所示,设x(个)为每天商品的销量,y(元)为该商场每天销售这种商品的利润.从日利润不少于96元的几天里任选2天,则选出的这2天日利润都是97元的概率为()A.19B.110C.15D.18解析:选B 由题意知y =⎩⎪⎨⎪⎧5x ,x =18,19,95+(x -19)(4-3),x =20,21,即y =⎩⎪⎨⎪⎧5x ,x =18,19,76+x ,x =20,21.当日销量不少于20个时,日利润不少于96元.当日销量为20个时,日利润为96元,当日销量为21个时,日利润为97元,日利润为96元的有3天,记为a ,b ,c ,日利润为97元的有2天,记为A ,B ,从中任选2天有{a ,A },{a ,B },{a ,b },{a ,c },{b ,A },{b ,B },{b ,c }{c ,A },{c ,B },{A ,B },共10种情况,其中选出的这2天日利润都是97元的有{A ,B },共1种情况,故所求概率为P =110.故选B.12.某人5次上班途中所花的时间(单位:分钟)分别为x ,y ,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为( )A .1B .2C .3D .4解析:选D 由题意这组数据的平均数为10,方差为2,可得x +y =20,(x -10)2+(y -10)2=8,设x =10+t ,y =10-t ,由(x -10)2+(y -10)2=8,得t 2=4,所以|x -y |=2|t |=4.13.(2019届西安市八校联考)为了解甲、乙两个快递公司的工作状况,假设同一个公司快递员的工作状况基本相同,现从甲、乙两公司各随机抽取一名快递员,并从两人某月(30天)的快递件数记录结果中随机抽取10天的数据,制图如下:每名快递员完成一件货物投递可获得的劳务费情况如下:甲公司规定每件4.5元;乙公司规定每天35件以内(含35件)的部分每件4元,超出35件的部分每件7元.(1)根据图中数据写出甲公司员工A在这10天投递的快递件数的平均数和众数;(2)为了解乙公司员工B每天所得劳务费的情况,从这10天中随机抽取1天,他所得的劳务费记为X(单位:元),求X>182的概率;(3)根据图中数据估算两公司的每位员工在该月所得的劳务费.解:(1)由题意知,甲公司员工A在这10天投递的快递件数的平均数为32+33×3+38+35+36+39+40+4110=36,众数为33.(2)设a为乙公司员工B每天的投递件数,则当a=35时,X=140;当a>35时,X=35×4+(a-35)×7,令X=35×4+(a-35)×7>182,得a>41,则a的取值为44,42,所以X>182的概率为410=25.(3)根据题图中数据,可估算甲公司的每位员工该月所得劳务费为4.5×36×30=4 860(元),易知乙公司员工B每天所得劳务费X的可能取值为136,147,154,189,203,所以乙公司的每位员工该月所得劳务费约为110×(136×1+147×3+154×2+189×3+203×1)×30=165.5×30=4 965(元).14.某种植园在芒果临近成熟时,随机从一些芒果树上摘下100个芒果,其质量分别在[100,150),[150,200),[200,250),[250,300),[300,350),[350,400)(单位:克)内,经统计得如图所示的频率分布直方图.(1)经计算估计这组数据的中位数;(2)先用分层抽样的方法从质量在[250,300),[300,350)内的芒果中随机抽取6个,再从这6个中随机抽取3个,求这3个芒果中恰有1个质量在[300,350)内的概率;(3)某经销商来收购芒果,用各组数据的中间数代表这组数据的平均值,用样本估计总体,该种植园中还未摘下的芒果大约还有10 000个,经销商提出如下两种收购方案:A:所有芒果以10元/千克收购;B:对质量低于250克的芒果以2元/个收购,高于或等于250克的以3元/个收购.通过计算确定种植园选择哪种方案获利更多?解:(1)由频率分布直方图可得,前3组的频率和为(0.002+0.002+0.003)×50=0.35<0.5,前4组的频率和为(0.002+0.002+0.003+0.008)×50=0.75>0.5,所以中位数在[250,300)内,设中位数为x,则有0.35+(x-250)×0.008=0.5,解得x=268.75.故中位数为268.75.(2)由题可知,应从质量在[250,300)内的芒果中抽取4个,从质量在[300,350)内的芒果中抽取2个,设质量在[250,300)内的4个芒果分别为A,B,C,D,质量在[300,350)内的2个芒果分别为a,b.从这6个芒果中选出3个的情况有{A,B,C},{A,B,D},{A,B,a},{A,B,b},{A,C,D},{A,C,a},{A,C,b},{A,D,a},{A,D,b},{A,a,b},{B,C,D},{B,C,a},{B,C,b},{B,D,a},{B,D,b},{B,a,b},{C,D,a},{C,D,b},{C,a,b},{D,a,b},共20种,其中恰有一个质量在[300,350)内的情况有{A,B,a},{A,B,b},{A,C,a},{A,C,b},{A,D,a},{A,D,b},{B,C,a},{B,C,b},{B,D,a},{B,D,b},{C,D,a},{C,D,b},共12种,因此所求概率P=1220=35.(3)方案A:共获利(125×0.002+175×0.002+225×0.003+275×0.008+325×0.004+375×0.001)×50×10 000×10×0.001=25 750(元).方案B:低于250克的获利(0.002+0.002+0.003)×50×10 000×2=7 000(元);高于或等于250克的获利(0.008+0.004+0.001)×50×10 000×3=19 500(元),故总获利7 000+19 500=26 500(元).由于25 750<26 500,故B方案获利更多,应选B方案.。
高考文科数学二轮复习新课标:专题四 第1讲 统计与统计案例
一、选择题1.某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n人中,抽取81人进行问卷调查.已知高二被抽取的人数为30,那么n=() A.860B.720C.1 020 D.1 040解析:选D.根据分层抽样方法,得1 2001 000+1 200+n×81=30,解得n=1 040.故选D.2.(2019·高考全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差解析:选A.记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.3.(2019·高考全国卷Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5 B.0.6C.0.7 D.0.8解析:选C.根据题意阅读过《红楼梦》《西游记》的人数用Venn图表示如下:所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.4.(2019·武汉市调研测试)某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A—结伴步行,B—自行乘车,C—家人接送,D—其他方式.并将收集的数据整理绘制成如下两幅不完整的统计图.请根据图中信息,求本次抽查的学生中A类人数是()A.30 B.40C.42 D.48解析:选A.由条形统计图知,B—自行乘车上学的有42人,C—家人接送上学的有30人,D—其他方式上学的有18人,采用B,C,D三种方式上学的共90人,设A—结伴步行上学的有x人,由扇形统计图知,A—结伴步行上学与B—自行乘车上学的学生占60%,所以x+42x+90=60100,解得x=30,故选A.5.为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为y^=b^x+a^,已知∑i=110x i=255,∑i=110y i=1 600,b^=4.该班某学生的脚长为24,据此估计其身高为()A.160 B.163C.166 D.170解析:选C.由题意可知y^=4x+a^,又x=22.5,y=160,因此160=22.5×4+a^,所以a^=70,因此y^=4x+70.当x=24时,y^=4×24+70=96+70=166.6.(2019·郑州市第二次质量预测)将甲、乙两个篮球队各5场比赛的得分数据整理成如图所示的茎叶图,由图可知以下结论正确的是()A.甲队平均得分高于乙队的平均得分B.甲队得分的中位数大于乙队得分的中位数C.甲队得分的方差大于乙队得分的方差D.甲、乙两队得分的极差相等解析:选C.由题中茎叶图得,甲队的平均得分x甲=26+28+29+31+315=29,乙队的平均得分x 乙=28+29+30+31+325=30,x 甲<x 乙,选项A 不正确;甲队得分的中位数为29,乙队得分的中位数为30,甲队得分的中位数小于乙队得分的中位数,选项B 不正确;甲队得分的方差s 2甲=15×[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=185,乙队得分的方差s 2乙=15×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2,s 2甲>s 2乙,选项C 正确;甲队得分的极差为31-26=5,乙队得分的极差为32-28=4,两者不相等,选项D 不正确.故选C.二、填空题7.某校高三(2)班现有64名学生,随机编号为0,1,2,…,63,依编号顺序平均分成8组,组号依次为1,2,3,…,8.现用系统抽样方法抽取一个容量为8的样本,若在第1组中随机抽取的号码为5,则在第6组中抽取的号码为________.解析:依题意,分组间隔为648=8,因为在第1组中随机抽取的号码为5,所以在第6组中抽取的号码为5+5×8=45.答案:458.为了解学生在课外活动方面的支出情况,抽取了n 个同学进行调查,结果显示这些学生的支出金额(单位:元)都在[10,50],其中支出金额在[30,50]的学生有117人,频率分布直方图如图所示,则n =________.解析:[30,50]对应的频率为1-(0.01+0.025)×10=0.65,所以n =1170.65=180.答案:1809.某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:女 男 总计 喜爱 40 20 60 不喜爱 20 30 50 总计6050110________的前提下(约有________的把握)认为“喜爱该节目与否和性别有关”.参考附表:P(K2≥k0)0.0500.0100.001k0 3.841 6.63510.828(参考公式:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d)解析:假设喜爱该节目和性别无关,分析列联表中数据,可得K2的观测值k=110×(40×30-20×20)260×50×60×50≈7.822>6.635,所以在犯错误的概率不超过0.01的前提下(约有99%的把握)认为“喜爱该节目与否和性别有关”.答案:0.0199%三、解答题10.(2019·高考全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解:(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.11.(2019·郑州市第一次质量预测)疫苗关系人民群众健康,关系公共卫生安全和国家安全,因此,疫苗行业在生产、运输、储存、使用等任何一个环节都容不得半点瑕疵.国家规定,疫苗在上市前必须经过严格的检测,并通过临床试验获得相关数据,以保证疫苗使用的安全和有效.某生物制品研究所将某一型号疫苗用在小白鼠身上进行科研和临床试验,得到统计数据如下:现从未注射疫苗的小白鼠中任取1只,取到“感染病毒”的小白鼠的概率为35.(1)求2×2列联表中p ,q ,x ,y 的值; (2)能否有99.9%的把握认为注射此种疫苗有效? 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .解:(1)由p 40+p =35,得p =60,所以q =40,x =100,y =100. (2)由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),得K 2=200×(40×40-60×60)2100×100×100×100=8<10.828,所以没有99.9%的把握认为注射此种疫苗有效.12.(2019·长沙市统一模拟考试)某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x (单位:万元)和收益y (单位:万元)的数据如下表:分析,得到如图所示的残差图及一些统计量的值:x y ∑6i =1x i y i∑6i =1x 2i 7301 464.24364(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由; (2)残差绝对值大于2的数据被认为是异常数据,需要剔除: (i)剔除异常数据后,求出(1)中所选模型的回归方程;(ii)广告投入量x =18时,(1)中所选模型收益的预报值是多少?附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为:b ^=∑ni =1 (x i -x )(y i -y )∑ni =1 (x i -x )2=∑ni =1x i y i -n x y ∑n i =1x 2i -n x 2,a ^=y -b ^x . 解:(1)应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预报精度高.(2)(i)剔除异常数据,即3月份的数据后,得 x =15×(7×6-6)=7.2,y =15×(30×6-31.8)=29.64.∑5i =1x i y i =1 464.24-6×31.8=1 273.44,∑5i =1x 2i =364-62=328.b ^=∑5i =1x i y i -5x y ∑5i =1x 2i -5x 2=1 273.44-5×7.2×29.64328-5×7.2×7.2=206.468.8=3,a ^=y -b ^x =29.64-3×7.2=8.04. 所以y 关于x 的回归方程为y ^=3x +8.04.(ii)把x =18代入(i)中所求回归方程得y ^=3×18+8.04=62.04,故预报值为62.04万元.。
最新-2021届高考数学文二轮复习课件:2.7.1 统计 统计案例 精品
核心梳理 [知识回顾]
一、基本概念 (1)抽样方法
抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方 法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范 围.
(2)统计中的四个数据特征 ①众数:在样本数据中,出现次数最多的数据. ②中位数:在样本数据中,将数据按大小排列,位于最中间的数 据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.
样本点的中心为(6,117.1),②错误;当 x=10 时,y^=145.86,此为估 计值,所以儿子 10 岁时的身高的估计值是 145.86 cm,而不一定是实 际值,③错误;由于回归直线的斜率为 7.19,则儿子年龄增加 1 周岁, 身高约增加 7.19 cm,④正确,故应选 B.
答案:B
热点追踪
[专题回访]
1.一支田径队有男运动员 56 人,女运动员 42 人,若用分层抽样
的方法从全体运动员中抽出一个容量为 28 的样本,则样本中女运动员
的人数为( )
ቤተ መጻሕፍቲ ባይዱ
A.9
B.10
C.11
D.12
解析:由分层抽样的知识可知,样本中女运动员的人数为
42×562+842=12. 答案:D
2.某班共有 52 人,现根据学生的学号,用系统抽样的方法抽取 一个容量为 4 的样本,已知 3 号、29 号、42 号学生在样本中,那么样 本中还有一名学生的学号是( )
A.55.2,3.6 B.55.2,56.4 C.64.8,63.6 D.64.8,3.6
解析:每一个数据都加上 60 时,平均数也加上 60,而方差不变. 答案:D
4.某校为了解学生平均每周的上网时间(单位:h),从高一年级 1 000 名学生中随机抽取 100 名进行了调查,将所得数据整理后,画出 频率分布直方图(如图),其中频率分布直方图从左到右前 3 个小矩形 的面积之比为 1∶3∶5,据此估计该校高一年级学生中平均每周上网 时间少于 4 h 的学生人数为( )
2021高考数学(文)2 统计与统计案例随机事件概率、古典概型、几何概型
2021高考数学(文)2 统计与统计案例随机事件概率、古典概型、几何概型晨鸟教育Earlybird专题限时集训(二) 统计与统计案例随机事件的概率、古典概型、几何概型1.(20·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为1,2,…,n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.1,2,…,n的平均数B.1,2,…,n的标准差C.1,2,…,n的最大值D.1,2,…,n的中位数B [评估这种农作物亩产量稳定程度的指标是标准差或方差,故选B.]2.(20·全国卷Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )A.0.5 B.0.6 C.0.7 D.0.8C [由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7.故选C.]3.(20·全国卷Ⅲ)若某群体中的成员只用现金支付的概率为0.45,既用现金支付也用非现金支付的概率为0.15,则不用现金支付的概率为( )A.0.3 B.0.4 C.0.6 D.0.7B [设“只用现金支付”为事件A,“既用现金支付也用非现金支付”为事件B,“不用现金支付”为事件C,则P(C)=1-P(A)-P(B)=1-0.45-0.15=0.4.故选B.]4.(20·全国卷Ⅱ)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为( )A.eq \f(7,10) B.eq \f(5,8) C.eq \f(3,8) D.eq \f(3,10)B [如图,若该行人在时间段AB的某一时刻来到该路口,则该行人至少等待15秒才出现绿灯.AB长度为40-15=25,由几何概型的概率公式知,至少需要等待15秒才出现绿灯的概率为eq \f(40-15,40)=eq \f(5,8),故选B.] 5.(2021·全国卷Ⅲ)设一组样本数据1,2,…,n的方差为0.01,则数据,102,…,10n的方差为( )A.0.01 B.0.1 C.1 D.10C [由方差计算公式:1,2,…,n的方差为s2,则a1,a2,…,an的方差为a2s2,因为s2=0.01,则所求方差为100s2=1.故选C.]6.(20·全国卷Ⅱ)生物实验室有5只兔子,其中只有3只测量过某项指标.若从这5只兔子中随机取出3只,则恰有2只测量过该指标的概率为( ) A.eq \f(2,3) B.eq \f(3,5) C.eq \f(2,5) D.eq \f(1,5)B [设其中做过测试的3只兔子为a,b,c,剩余的2只为A,B,则从这5只中任取3只的所有取法有{a,b,c},{a,b,A},{a,b,B},{a,c,A},{a,c,B},{a,A,B},{b,c,A},{b,c,B},{b,A,B},{c,A,B},共10种.其中恰有2只做过测试的取法有{a,b,A},{a,b,B},{a,c,A},{a,c,B},{b,c,A},{b,c,B},共6种,所以恰有2只做过测试的概率为eq \f(6,10)=eq \f(3,5),故选B.]7.(20·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了20年1月至20年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( )A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳A [根据折线图可知,20年8月到9月、20年10月到11月等月接待游客量都在减少,所以A错误.由图可知,B、C、D正确.]8.(20·全国卷Ⅰ)如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( )A.eq \f(1,4) B.eq \f(π,8) C.eq \f(1,2) D.eq \f(π,4)B [不妨设正方形边长为a,由图形的对称性可知,太极图中黑、白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,所求概率为eq\f(\f(1,2)×π×\b\lc\(\rc\)(\a\vs4\al\co1(\f(a,2)))eq \s\up12(2),a2)=eq \f(π,8),选B.]9.(20·全国卷Ⅲ)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M,I,N中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是( )A.eq \f(8,15) B.eq \f(1,8) C.eq \f(1,15) D.eq \f(1,30)C [∵Ω={(M,1),(M,2),(M,3),(M,4),(M,5),(I,1),(I,2),(I,3),(I,4),(I,5),(N,1),(N,2),(N,3),(N,4),(N,5)},∴事件总数有15种.∵正确的开机密码只有1种,∴P=eq \f(1,15).]10.(20·全国卷Ⅱ)从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为( )A.eq \f(1,10) B.eq \f(1,5) C.eq \f(3,10) D.eq \f(2,5)D [如下表所示,表中的点的横坐标表示第一次取到的数,纵坐标表示第二次取到的数:123451(1,1)(1,2)(1,3)(1,4)(1,5)2(2,1)(2,2)(2,3)(2,4)(2,5)3(3,1)(3,2)(3,3)(3,4)(3,5)4(4,1)(4,2)(4,3)(4,4)(4,5)5(5,1)(5,2)(5,3)(5,4)(5,5)总计有25种情况,满足条件的有10种.所以所求概率为eq \f(10,25)=eq \f(2,5).]11.(20·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例建设后经济收入构成比例则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半A [设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A项不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C项正确;新农村建设后,养殖收入与第三产业收入的总和占经济收入的30+28=58>50,所以超过了经济收入的一半,所以D正确.故选A.]12.(20·全国卷Ⅰ)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是( )A.eq \f(1,3) B.eq \f(1,2) C.eq \f(2,3) D.eq \f(5,6)C [从4种颜色的花中任选2种颜色的花种在一个花坛中,余下2种颜色的花种在另一个花坛的种数有:红黄—白紫、红白—黄紫、红紫—白黄、黄白—红紫、黄紫—红白、白紫—红黄,共6种,其中红色和紫色的花在同一花坛的种数有:红紫—白黄、黄白—红紫,共2种,故所求概率为P=1-eq \f(2,6)=eq\f(2,3),故选C.]13.(20·全国卷Ⅰ)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是( ) A.8号学生B.20号学生C.616号学生D.815号学生C [根据题意,系统抽样是等距抽样,所以抽样间隔为eq \f(1 000,100)=10.因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616.故选C.]14.(20·全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是.分层抽样[因为客户的数量较大,且不同年龄段客户对服务评价有较大的差异,所以应该选择分层抽样.]15.(20·全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为.0.98 [由题意得,经停该高铁站的列车正点数约为10×0.97+20×0.98+10×0.99=39.2,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为eq \f(39.2,40)=0.98.]1.(2021·广州模拟)如果数据1,2,…,n的平均数为eq \\to,方差为82,则51+2,52+2,…,5n+2的平均数和方差分别为( )A.eq \\to,82 B.5eq \\to+2,82C.5eq \\to+2,25×82 D.eq \\to,25×82C [∵数据1,2,…,n的平均数为eq \\to,方差为82,∴51+2,52+2,…,5n+2的平均数为:5eq \\to +2,51+2,52+2,…,5n+2的方差为25×82.故选C.]2.(2021·银川模拟)为了调查不同年龄段女性的平均收入情况,研究人员利用分层抽样的方法随机调查了A地[20,65]岁的n名女性,其中A地各年龄段的女性比例如图所示.若年龄在[20,50)岁的女性被抽取了40人,则年龄在[35,65]岁的女性被抽取的人数为( )A.50 B.10 C.25 D.40C [由题意,设抽到的年龄在[35,65]岁的女性人数为,则eq \f(,40)=eq \f(30+20,30+50)=eq \f(5,8),解得=25,故选C.] 3.(2021·洛阳模拟)甲、乙两人下棋,甲获胜的概率为50,甲不输的概率为80,则甲、乙下成平局的概率为( )A.60 B.50 C.30 D.10C [甲、乙两人下棋,甲获胜的概率为50,甲不输的概率为80,则甲、乙下成平局的概率为:80-50=30.故选C.]4.(2021·邯郸模拟)为了调查高一学生在分班选科时是否选择物理科目与性别的关系,随机调查100名高一学生,得到2×2列联表如表:选择“物理”选择“历史”总计男生352055女生153045总计5050100附:K2=eq \f(n?ad-bc?2,?a+bc+da+cb+d?)P(K2≥k0)0.0500.0100.001k03.8416.63510.828由此得出的正确结论是( )A.在犯错误的概率不超过0.01的前提下,认为“选择物理与性别有关”B.在犯错误的概率不超过0.01的前提下,认为“选择物理与性别无关”C.有99.9的把握认为“选择物理与性别有关”D.有99.9的把握认为“选择物理与性别无关”A [由题意可知,K2=eq \f(100×?15×20-30×35?2,?15+35?×?15+30?×?30+20?×?35+20?)≈9.091>6.635,所以在犯错误的概率不超过0.01的前提下,认为“选择物理与性别有关”,或有99的把握认为“选择物理与性别有关”.故选A.]5.(2021·洛阳模拟)在边长为4的正方形的边上随机取一点,则该点到正方形中心的距离小于eq \r(5)的概率是( )A.eq \f(1,6) B.eq \f(1,5) C.eq \f(1,4) D.eq \f(1,2)D [如图,作OC⊥AB于C,OD=eq \r(5),则CD=eq \r(OD2-OC2)=eq \r(?\r(5)?2-22)=1.故该点到正方形中心的距离小于eq \r(5)的概率是:eq \f(2CD,AB)=eq \f(1,2),故选D.] 6.(2021·石家庄模拟)某学校为进行一项调查,先将高三年级800名同学依次编号为1,2,3,…,800,然后采用系统抽样的方法等距抽取20名同学,已知抽取到了25号,则下列号码没被抽到的是( )A.185 B.315 C.465 D.625B [采用系统抽样的方法从800名学生中抽取20名学生进行调査,将他们随机编号为1,2,3, (800)则抽样间隔为eq \f(800,20)=40,∵随机抽到的号码数为25,∴应抽取的号码为:25+40(n-1)=40n-15.(n 为正整数).经检验,只有选项B对应的n不是整数.故选B.]7.(2021·齐齐哈尔一模)已知一组数据的茎叶图如图所示.下列说法错误的是( )A.该组数据的极差为12B.该组数据的中位数为21C.该组数据的平均数为21D.该组数据的方差为11D [由题意,极差为26-14=12,中位数为21,平均数为eq \f(1,9)(14+18+20+20+21+22+23+25+26)=21,方差为eq \f(1,9)[(14-21)2+(18-21)2+…+(26-21)2]=eq\f(106,9),D错误,故选D.]8.(2021·石家庄模拟)雷达图(RadarChart),又可称为戴布拉图、蜘蛛网图(SpiderChart),原先是财务分析^p 报表的一种,现可用于对研究对象的多维分析^p .图为甲、乙两人在五个方面的评价值的雷达图,则下列说法错误的是( )A.甲、乙两人在次要能力方面的表现基本相同B.甲在沟通、服务、销售三个方面的表现优于乙C.在培训与销售两个方面上,甲的综合表现优于乙D.甲在这五个方面的综合表现优于乙C [由雷达图可知,乙在培训方面的数据大于甲,乙在销售方面的数据小于甲,显然C选项的分析^p 错误.故选C.]9.(2021·长治一模)根据党中央关于“精准脱贫”的要求,某市农业经济部门派三位专家对A,B,C三个县区进行调研,每个县区派一位专家,则甲专家恰好派遣至A县区的概率为( )A.eq \f(1,2) B.eq \f(1,3) C.eq \f(1,6) D.eq \f(2,3)B [某市农业经济部门派三位专家对A,B,C三个县区进行调研,每个县区派一位专家,故调研的情况的基本事件总数为ABC,ACB,BAC,BCA,CAB,CBA,六种情况,甲专家恰好派遣至A县区的情况为ABC,ACB,两种情况,则甲专家恰好派遣至A县区的概率为:eq \f(2,6)=eq \f(1,3),故选B.]10.(2021·临沂模拟)下列说法中正确的是( )A.先把高三年级的20名学生编号:1到20,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m,然后抽取编号为m+50,m+100,m+150…的学生,这样的抽样方法是分层抽样法B.线性回归直线eq \o(y,\s\up7(^))=eq \o(b,\s\up7(^))+eq\o(a,\s\up7(^))不一定过样本中心(eq \\to,eq \\to(y))C.若两个随机变量的线性相关性越强,则相关系数r的值越接近于1D.若一组数据1,a,3的平均数是2,则该组数据的方差是eq \f(2,3)D [A错误,是系统抽样;B错误,线性回归直线eq \o(y,\s\up7(^))=eq \o(b,\s\up7(^))+eq \o(a,\s\up7(^))一定过样本中心点(eq \\to,eq\\to(y));C错误,两个随机变量的线性相关性越强,则相关系数|r|的值越接近于1;对于D,一组数据1,a,3的平均数是2,∴a=2,∴该组数据的方差是s2=eq \f(1,3)×[(1-2)2+(2-2)2+(3-2)2]=eq \f(2,3),D正确.故选D.] 11.(2021·碑林区校级模拟)虚拟现实技术被认为是经济发展的新增长点,某地区引进技术后,市场收入(包含软件收入和硬件收入)逐年翻一番,据统计该地区市场收入情况如图所示,则下列说法错误的是( )A.该地区20年的市场总收入是20年的4倍B.该地区20年的硬件收入比20年和20年的硬件收入总和还要多C.该地区20年的软件收入是20年的软件收入的3倍D.该地区20年的软件收入是20年的软件收入的6倍D [设20年市场总收入为1,该地区20年的市场总收入为4,是20年的4倍,故A正确;20年和20年的硬件收入总和为1×0.9+2×0.8=2.5<4×0.7=2.8,故B正确;20年的软件收入1.2是20年的软件收入0.4的3倍,故C正确;20年的软件收入是20年的软件收入的12倍,故D错误.故选D.]12.(2021·西安模拟)从5个同类产品(其中3个正品,2个次品)中,任意抽取2个,下列事件发生概率为eq \f(9,10)的是( )A.2个都是正品B.恰有 1 个是正品C.至少有 1 个正品D.至多有 1 个正品C [从5个同类产品(其中3个正品,2个次品)中,任意抽取2个,基本事件总数n=10,在A中,2个都是正品的概率P1=eq \f(3,10),故A错误;在B中,恰有 1 个是正品的概率P2=eq \f(3,5),故B错误;在C中,至少有 1 个正品的概率P3=1-eq \f(1,10)=eq \f(9,10),故C正确;在D中,至多有 1 个正品的概率:P4=eq \f(7,10).故选C.]13.(2021·广东实验中学模拟)某公司针对新购买的50 000个手机配件的重量随机抽出1 000台进行检测,如图是根据抽样检测后的重量(单位:克)数据绘制的频率分布直方图,其中配件重量的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].用样本估计总体,则下列说法错误的是( )A.这批配件重量的平均数是.30 (精确到0.01)B.这批配件重量的中位数是在[100,]之间C.a=0.125D.这批配件重量在[96,100)范围的有15 000 个B [由已知图可知:(0.05+0.075+0.1+a+0.15)×2=1,解得a=0.125,故C正确;故估计手机配件的重量的平均数为97×0.1+99×0.2+×0.3+103×0.25+105×0.15=.30(克),故A正确;设中位数为,则0.1+0.2+(-100)×0.15=0.5,=.33,故B错误;这批配件重量在[96,100)范围的有50000×0.15×2=15 000 个,故D正确.故选B.]14.(2021·麒麟区二模)已知变量与变量y的取值如表所示,且2.5<m<n <6.5,则由该数据算得的线性回归方程可能是( )2345y2.5mn6.5A.eq \o(y,\s\up7(^))=0.8+2.3 B.eq \o(y,\s\up7(^))=2+0.4 C.eq \o(y,\s\up7(^))=-1.5+8 D.eq \o(y,\s\up7(^))=-1.6+10A [由表格中的数据可知,两个变量是正相关关系,所以排除C、D选项.eq \\to=eq \f(2+3+4+5,4)=3.5,eq \\to(y)=eq \f(2.5+m+n+6.5,4)=eq \f(9+m+n,4)∈(3.5,5.5),把eq \\to=3.5分别代入A、B选项,对于A,有eq \o(y,\s\up7(^))=0.8×3.5+2.3=5.1∈(3.5,5.5),符合题意;对于B,有eq \o(y,\s\up7(^))=2×3.5+0.4=7.4?(3.5,5.5),不符合题意.故选A.]15.(2021·济阳模拟)已知样本1,2,…,n的平均数为;样本y1,y2,…,ym的平均数为y(≠y),若样本1,2,…,n,y1,y2,…,ym的平均数z=a+(1-a)y;其中0<a<eq \f(1,2),则n,m(n,m∈N)的大小关系为.n<m [由题意得z=eq \f(1,n+m)(n+my)=eq \f(n,n+m)+eq\b\lc\(\rc\)(\a\vs4\al\co1(1-\f(n,n+m)))y,∴a=eq \f(n,n+m),∵0<a<eq \f(1,2),∴0<eq \f(n,n+m)<eq \f(1,2),∴n<m.]16.(2021·福州模拟)小王因上班繁忙,来不及做午饭,所以叫了外卖.假设小王和外卖小哥都在12:00~12:10之间随机到达小王所居住的楼下,则小王在楼下等候外卖小哥的时间不超过5分钟的概率是.eq \f(3,8) [设小王和外卖小哥分别到达小王楼下的时间为12点分,12点y分,则eq \b\lc\{\rc\ (\a\vs4\al\co1(0≤≤10,,0≤y≤10,))其区域是以10为边长的正方形,面积10×10=100,小王在楼下等候外卖小哥的时间不超过5分钟,即0≤y-≤5,其表示区域为如图所示阴影部分.其面积为eq \f(1,2)(100-5×5)=eq \f(75,2),故所求概率P=eq \f(75,2×100)=eq \f(3,8).]17.(2021·毕节市模拟)20年7月1日,《上海市生活垃圾管理条例》正式实施,生活垃圾要按照“可回收物”“有害垃圾”“湿垃圾”“干垃圾”的分类标准进行分类,没有对垃圾分类或未投放到指定垃圾桶内都会被处罚.若某上海居民提着厨房里产生的“湿垃圾”随意地投收到楼下的“可回收物”“有害垃圾”“湿垃圾”,“干垃圾”四个垃圾桶内,则该居民会被处罚的概率为.eq \f(3,4) [由题意知,基本事件总数n=4,该居民会被处罚包含的基本事件个数m=3,则该居民会被处罚的概率为p=eq \f(3,4).]18.(2021·保定一模)恩格尔系数是食品支出总额占个人消费支出总额的比重.据某机构预测,n(n≥10)个城市职工购买食品的人均支出y(千元)与人均月消费支出(千元)具有线性相关关系,且回归方程为y=0.4+1.2,若其中某城市职工的人均月消费支出为5千元,则该城市职工的月恩格尔系数约为.64 [把=5代入回归方程y=0.4+1.2中,得y=0.4×5+1.2=3.2,则该城市职工的月恩格尔系数约为eq \f(3.2,5)=0.64=64.]。
欣宜市实验学校二零二一学年度高考数学第11章统计、统计初步试题
黔西北州欣宜市实验学校二零二一学年度第十一章统计、统计案例第一局部三年高考荟萃 2021年高考题一、选择题1.〔2021文〕4.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为A B x x 和,样本HY差分别为sA 和sB,那么[B](A)A x >B x ,sA >sB (B)A x <B x ,sA >sB (C)A x >B x ,sA <sB (D)A x <B x ,sA <sB解析:此题考察样本分析中两个特征数的作用A x <10<B x ;A 的取值波动程度显然大于B ,所以sA >sB2.〔2021文〕〔5〕某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了理解该单位职工的安康情况,用分层抽样的方法从中抽取样本.假设样本中的青年职工为7人,那么样本容量为〔A 〕7〔B 〕15〔C 〕25〔D 〕35 【答案】B解析:青年职工、中年职工、老年职工三层之比为7:5:3,所以样本容量为7157153.〔2021文〕(6)在某项体育比赛中,七位裁判为一选手打出的分数如下: 90899095939493去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 答案:B4.〔2021理〕7.随机变量X 服从正态分布N(),且(24)P X ≤≤=0.6826,那么p 〔X>4〕=〔〕A 、0.1588B 、0.1587C 7.B .1(34)(24)2P X P X ≤≤=≤≤=0.3413, (4)0.5(24)P X P X >=-≤≤.5.〔2021文〕〔A 〕12,24,15,9〔B 〕9,12,12,7〔C 〕8,15,12,5〔D 〕8,16,10,6 解析:因为40180020=故各层中依次抽取的人数分别是160820=,3201620=,2001020=,120620= 答案:D6.〔2021理〕〔8〕某台小型晚会由6个节目组成,演出顺序有如下要求:节目甲必须排在第四位、节目乙不能排在第一位,节目丙必须排在最后一位,该台晚会节目演出顺序的编排方案一共有 〔A 〕36种〔B 〕42种(C)48种〔D 〕54种【答案】B 7.〔2021理〕 8.〔2021理〕9.〔2021理〕6.将参加夏令营的600名学生编号为:001,002,……600,采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495住在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数一次为 A .26,16,8,B .25,17,8 C .25,16,9D .24,17,9二、填空题1.〔2021文〕(14)某地有居民100000户,其中普通家庭99000户,高收入家庭1000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取l00户进展调查,发现一共有120户家庭拥有3套或者3套以上住房,其中普通家庭50户,高收人家庭70户.根据这些数据并结合所掌握的统计知识,你认为该地拥有3套或者3套以上住房的家庭所占比例的合理估计是.【答案】5.7%【解析】该地拥有3套或者3套以上住房的家庭可以估计有:5070 9900010005700990100⨯+⨯=户,所以所占比例的合理估计是5700100000 5.7%÷=.【方法总结】此题分层抽样问题,首先根据拥有3套或者3套以上住房的家庭所占的比例,得出100000户,居民中拥有3套或者3套以上住房的户数,它除以100000得到的值,为该地拥有3套或者3套以上住房的家庭所占比例的合理估计.2.〔2021文〕〔11〕在如下列图的茎叶图中,甲、乙两组数据的中位数分别是【答案】4546〔2021理〕〔11〕从某小学随机抽取100名同学,将他们的身高〔单位:厘米〕数据绘制成频率分布直方图〔如图〕。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
精品文档精品文档统计与统计案例第一节随机抽样1下面的抽样方法是简单随机抽样的是()A 在某年明信片销售活动中,规定每1万张为一个开奖组,通过随机抽取的方式确定号码的后四位为 279的为三等奖B某车间包装一种产品,在自动包装的传送带上,每隔3分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D 用抽签方法从1件产品中选取3件进行质量检验答案D2总体由编号为1 , 2,…,19,2的2个个体组成.利用下面的随机数表选取 5个个体,选取方法是从随机数表第 1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()78166572826314724369972819832492344935823623486969387481A.8B. 7C. 2D. 1答案D3为了解1 名学生的学习情况,采用系统抽样的方法,从中抽取容量为4的样本,贝吩段的间隔为()A.A. 5B . 4C . 25D . 2答案C4某单位有844某单位有84名职工,现采用系统抽样方法抽取42人做问卷调查,将84人按1, 2,…,84随机编号,则抽取的42人中,编号落入区间[481,72]的人数为84随机编号,则抽取的11 B. 12 C. 13 D. 14答案B5在一次马拉松比赛中,35名运动员的成绩(单位分钟)的茎叶图如图所示5在一次马拉松比赛中,若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取 7人,则其中成若将运动员按成绩由好到差编为绩在区间[139,151]上的运动员人数是答案46某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在类别人数老年教师9中年教师1 8青年教师1 6合计4 3抽取的样本中,青年教师有32抽取的样本中,青年教师有32人,则该样本中的老年教师人数为A . 9 B. 1C. 18D. 3答案C7某校高一年级有9名学生,其中女生 47某校高一年级有学生中抽取一个容量为45的样本,则应抽取的男生人数为答案58某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3 : 5 : 7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=()A. 54B. 9C. 45 D . 126答案B9某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位人).篮球组书画组乐器组冋453a高二1512学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取 3人,结果篮球组被抽出12人,则a的值为.答案31甲、乙两套设备生产的同类型产品共 4 8件,采用分层抽样的方法从中抽取一个容量为8的样本进行质量检测.若样本中有5件产品由甲设备生产,则乙设备生产的产品总数为件.答案18某市有A、B、C三所学校,共有高三文科学生 1 5人,且A、B、C三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为12的样本,进行成绩分析,则应从 B校学生中抽取人.答案4第二节用样本估计总体根据下面给出的24年至213年我国二氧化硫年排放量(单位万吨)柱形图,以下结论中不正确的是()AA .逐年比较,27年我国治理二氧化硫排放显现成效26年以来我国二氧化硫年排放量呈减少趋势D . 26年以来我国二氧化硫年排放量与年份正相关答案D13某电子商务公司对1 名网络购物者214年度的消费情况进行统计,发现消费金额(单位万元)都在区间[.3,.9]内,其频率分布直方图如图所示.TOC \o "1-5" \h \z 直方图中的 a=;在这些购物者中,消费金额在区间[.5,.9]内的购物者的人数为.答案①3 ②614某地政府调查了工薪阶层 1 人的月工资收入,并根据调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对月工资收入的满意程度,要用分层抽样的方法从调查的 1人中抽出1人做电话询访,则(3,35](百元)月工资收入段应抽出人.答案1515某学校随机抽取2个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为 5将数据分组成[,5),[5,1),…,[3,35) , [35,4]时,所作的频率分布直方图是()TOC \o "1-5" \h \z 7 317 6 4 137 5 5 4 3 2H 5 3 d答案A16某市为了考核甲、乙两部门的工作情况,随机访问了5位市民根据这5位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下甲绑门乙部门979766533211555514133321 6&552 61222594481 22456777891L23468BL 23期 51146fiQ分别估计该市的市民对甲、乙两部门评分的中位数;分别估计该市的市民对甲、乙两部门的评分高于9的概率;根据茎叶图分析该市的市民对甲、乙两部门的评价.答案①由所给茎叶图知,5位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66壬68=67,所以该市的市民对乙部门评分的中位数的估计值是 6②由所给茎叶图知,5 85位市民对甲、乙部门的评分高于9的比率分别为5",5=.16,故该市的市民对甲、乙部门的评分高于9的概率的估计值分别为.1, .1由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.17某城市1户居民的月平均用电量 (单位:度),以[16,18) ,[18,2) ,[2,22) ,[22,24), [24,26), [26,28) , [28,3]分组的频率分布直方图如图.⑵求月平均用电量的众数和中位数;在月平均用电量为[22,24) , [24,26), [26,28) , [28,3]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在 [22,24)的用户中应抽取多少户?答案(1)由(.2 + .9 5 + .11 + .12 5 + x+ .5 + .2 5) X 2=1 得 x=.7 5, 直方图中x 的值为.7(2)月平均用电量的众数是22(2)月平均用电量的众数是22+242=23./ (.2 + .9 5 + .11)X 2=.45V .5,月平均用电量的中位数在[22,24)内,设中位数为 a,则(.2 + .9 5 + .11)X 2+ .12 5 X (a - 22)=.5,解得 a=224,即中位数为 22(3)月平均用电量在[22,24)的用户有.12 5 X 2X 1=25(户),同理可求月平均用电量为[24,26) , [26,28) , [28,3)的用户分别有 15户、1户、5户,故抽取比例为11=125+ 15+ 1+ 5=51从月平均用电量在[22,24)的用户中应抽取25X;=5(户).51重庆市213年各月的平均气温(C )数据的茎叶图如下图,则这组数据的中位数是()L 2 52 ()L 2 52 ()A.19B. 2C. 25D. 23答案B14时的19为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这514时的气温数据(气温数据(单位:C )制成如图所示的茎叶图考虑以下结论:甲乙9 8 628 91 13L 2①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.A .①③B .①④ C.②③ D .②④答案B2.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均环数73887方差s25624从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是()A .甲B .乙C .丙D .丁答案C第三节变量间的相关关系、统计案例TOC \o "1-5" \h \z 1判断下列结论的正误.(正确的打“V”,错误的打“X”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系. ()(2)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示.()(3)通过回归方程y=bx+a可以估计和观测变量的取值和变化趋势.()(4)任何一组数据都对应着一个回归直线方程. ()(5)事件X, Y关系越密切,则由观测数据计算得到的 K2的观测值越大.()答案(1)X (2) V (3)V ⑷ X (5) V观察下列各图:x134y2387其中两个变量x, y其中两个变量x, y具有相关关系的图是(A .①②B .①④ C.③④ D .②③解析选C由散点图知③④具有相关关系.已知x, y的取值如下表,从散点图可以看出则 a=()y与x线性相关,且回归方程为y=.95x+ a,A.25B. 6C. 2D.解析选B 由已知得x=2, y=5,因为回归方程经过点(x , y ),所以a=5 —.95 X 2=4若回归直线方程为y=2— 5x,则变量x增加一个单位,y()A .平均增加5个单位 B.平均增加2个单位C.平均减少5个单位D.平均减少2个单位解析选C 因为回归直线方程为y=2— 5x,所以b=— 5,则变量x增加一个单位, y平均减少5个单位.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A .若K2的观测值为k=635,我们有99%的把握认为吸烟与患肺病有关系,那么在1个吸烟的人中必有 99人患有肺病B .从独立性检验可知,有 99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病C.若从统计量中求出有 95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误以上三种说法都不正确解析选C 根据独立性检验的思想知 C项正确.6下列四个散点图中,变量 x与y之间具有负的线性相关关系的是()rUy* ■/■I-]....,TB 丘C'D 1答案D7为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用回归直线方程y=bx+ a近似地刻画其相关B 线性相关关系较强,CB 线性相关关系较强,C.线性相关关系较强,b的值为.83b的值为一.87D .线性相关关系较弱,无研究价值答案B已知变量x和y满足关系y=— .1x+ 1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关答案C某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份262821212214需求量(万吨)236246257276286(i)利用所给数据求年需求量与年份之间的回归直线方程 y=bx+ a;⑵利用⑴中所求出的回归直线方程预测该地216年的粮食需求量.解(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:年份—21—4—224需求量—257—21—111929对预处理后的数据,容易算得,x=, y=2 ,bb=— 4 X — 21 + — 2 X — 11 + 2X 19+ 4 X 29 — 5 X X 2b=— 4 2+ — 2 2+ 22+ 42 — 5 X 2264264-=5A — A —a=y — b x=由上述计算结果,知所求回归直线方程为y— 257=b(x — 21) + a=5(x — 21) + 2,即 b=5(x— 21) + 262(*)⑵利用回归直线方程(*),可预测 216年的粮食需求量为5(216 — 21) + 26.2=5X 6+ 26.2=292(万吨).某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在4分以下的学生后,共有男生3名,女生2名现采用分层抽样的方法,从中抽取了1名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下所示频数分布表 .分数段[4,5)[5,6)[6,7)[7,8)[8,9)[9,1)男39181569女6451132(1)估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果看,数学成绩与性别是否有关;(2)规定8分以上为优分(含8分),请你根据已知条件作出2X 2列联表,并判断是否有9%以上的把握认为“数学成绩与性别有关”优分非优分总计男生女生总计1附表及公式P(K2> k).1.5.1.1k768416351.828宀 nad — be2a+ b c+ d a+ e b+ d[听前试做](1) x 男=45X .5 + 55X .15 + 65 X .3+ 75 X .25 + 85X .1 + 95X .15= 75,x 女=45 X .15+ 55 X .1 + 65 X .125 + 75X .25 + 85 X .325+ 95 X .5=75,从男、女生各自的平均分来看,并不能判断数学成绩与性别有关.(2)由频数分布表可知在抽取的 1名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得2 X 2列联表如下优分非优分总计男生15456女生15254总计3712 1 X 15X 25- 15X 45 2可得K2=疋79,6X 4 X 3X 7因为79<76,所以没有9%以上的把握认为“数学成绩与性别有关。