高考数学一轮总复习第十章统计与成对数据的统计分析课时规范练48用样本估计总体北师大版
新课标高考数学一轮总复习第十章算法初步统计统计案例用样本估计总体课时规范练理含解析新人教A版
10-3 用样本估计总体课时规范练(授课提示:对应学生用书第339页)A 组 基础对点练1.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x 的值等于( D )A .0.12B .0.012C .0.18D .0.0182.一次数学考试后,某老师从自己所带的两个班级中各抽取5人,记录他们的考试成绩,得到如图所示的茎叶图.已知甲班5名同学成绩的平均数为81,乙班5名同学成绩的中位数为73,则x -y 的值为( D )A .2B .-2C .3D .-33.(2017·长沙适应性考试)某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打出的分数的茎叶图如图所示(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a 1,a 2,则一定有( B )A .a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2的大小与m 的值有关解析:由茎叶图知,a 1=80+1+5+5+4+55=84,a 2=80+4+4+6+4+75=85,故选B.4.如图是一组样本数据的频率分布直方图,则依据图形中的数据,可以估计总体的平均数与中位数分别是( B )A .12.5,12.5B .13,13C .13.5,12.5D .13.5,13解析:第1组的频率为0.04×5=0.2,第2组的频率为0.1×5=0.5,则第3组的频率为1-0.2-0.5=0.3,估计总体平均数为7.5×0.2+12.5×0.5+17.5×0.3=13.由题意知,中位数在第2组内,设为10+x ,则有0.1x =0.3,解得x =3,从而中位数是13. 5.某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图,已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为 2 .解析:由题意可知,170+17×(1+2+x +4+5+10+11)=175,即17×(33+x )=5,即33+x =35,解得x =2. 6.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的14,且样本容量为160,则中间一组的频数为 32 .解析:依题意,设中间小长方形的面积为x ,则其余小长方形的面积和为4x ,所以5x =1,x =0.2,中间一组的频数为160×0.2=32.7.第47届联合国大会于1993年1月18日通过193号决议,确定自1993年起,每年的3月22日为“世界水日”,以此推动对水资源进行综合性统筹规划和管理,加强水资源保护,解决日益严重的水问题.某研究机构为了了解各年龄层的居民对“世界水日”的了解程度,随机抽取了300名年龄在[10,60]内的公民进行调查,所得结果统计为如下的频率分布直方图.(1)求抽取的年龄在[30,40)内的居民人数;(2)若按照分层抽样的方法从年龄在[10,20),[50,60]内的居民中抽取6人进行知识普及,并在知识普及后再抽取2人进行测试,求进行测试的居民中至少有1人的年龄在[50,60]内的概率.解析:(1)依题意,知年龄在[30,40)内的频率P =1-(0.02+0.025+0.015+0.01)×10=0.3,故所求居民人数为300×0.3=90.(2)依题意,从年龄在[10,20),[50,60]内的居民中分别抽取4人和2人, 记年龄在[10,20)内的4人为A ,B ,C ,D , 年龄在[50,60]内的2人为1,2,故抽取2人进行测试的所有情况为(A ,B ),(A ,C ),(A ,D ),(A,1),(A,2),(B ,C ),(B ,D ),(B,1),(B,2),(C ,D ),(C,1),(C,2),(D,1),(D,2),(1,2),共15种,其中满足条件的情况为(A,1),(A,2),(B,1),(B,2),(C,1),(C,2),(D,1),(D,2),(1,2),共9种, 故所求概率P =35.B 组 能力提升练1.若数据x 1,x 2,x 3,…,x n 的平均数为x =5,方差s 2=2,则数据3x 1+1,3x 2+1,3x 3+1,…,3x n +1的平均数和方差分别为( C ) A .5,2 B .16,2 C .16,18D .16,92.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( D )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x3.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( C ) A .8 B .15 C .16D .324.已知样本(x 1,x 2,…,x n )的平均数为x ,样本(y 1,y 2,…,y m )的平均数为y (x ≠y ),若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数z =a x +(1-a )y ,其中0<a <12,则n ,m 的大小关系为( A )A .n <mB .n >mC .n =mD .不能确定解析:由题意可得x =x 1+x 2+…+x nn,y =y 1+y 2+…+y mm,z =x 1+x 2+…+x n +y 1+y 2+…+y mn +m=nn +m ·x 1+x 2+…+x n n +m n +m ·y 1+y 2+…+y mm=n n +m·x +m n +m·y =a x +(1-a )y ,所以nn +m=a ,mn +m =1-a ,又0<a <12,所以0<n n +m <12<mn +m,所以n <m .故选A. 5.某学校高二年级共有女生300人,现调查她们每天的课外运动时间,发现她们的课外运动时间介于30分钟到90分钟,如图是统计结果的频率分布直方图,则她们的平均运动时间大约是 56.5 分钟.解析:由题图得35×0.1+45×0.1+55×0.5+65×0.2+75×0.05+85×0.05=56.5(分钟).6.已知甲、乙两组数据如茎叶图所示,若两组数据的中位数相同,平均数也相同,那么m +n = 11 .解析:∵两组数据的中位数相同, ∴m =2+42=3,又∵两组数据的平均数也相同, ∴27+33+393=20+n +32+34+384,∴n =8, ∴m +n =11.7.某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35 m 3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解析:(1)使用了节水龙头50天的日用水量数据的频率分布直方图:(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48. (3)该家庭未使用节水龙头50天日用水量的平均数为x1=150(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48. 该家庭使用了节水龙头后50天日用水量的平均数为x2=150(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35. 估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).。
高考数学大一轮复习 第十章 统计 10.2 用样本估计总体教师用书 文 苏教版(2021年最新整理)
(江苏专用)2018版高考数学大一轮复习第十章统计10.2 用样本估计总体教师用书文苏教版编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((江苏专用)2018版高考数学大一轮复习第十章统计10.2 用样本估计总体教师用书文苏教版)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(江苏专用)2018版高考数学大一轮复习第十章统计10.2 用样本估计总体教师用书文苏教版的全部内容。
10.2 用样本估计总体1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.(2)总体分布的密度曲线:将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线.3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离.(2)标准差:s=错误!.(3)方差:s2=1n[(x1-错误!)2+(x2-错误!)2+…+(x n-错误!)2](x n是样本数据,n是样本容量,x是样本平均数).【知识拓展】1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示错误!,频率=组距×错误!。
(2)频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m错误!+a.(2)数据x1,x2,…,x n的方差为s2.①数据x1+a,x2+a,…,x n+a的方差也为s2;②数据ax1,ax2,…,ax n的方差为a2s2。
人教B版高考总复习一轮数学精品课件 第10章统计与成对数据的统计分析 第3节成对数据的统计分析
=1
=1
=_______________________
来衡量y与x的线性相关性强弱,这里的r称为线性相关系数(简称为相Βιβλιοθήκη 系数).(2)性质
①|r|≤ 1 ,且y与x正相关的充要条件是 r>0 ,y与x负相关的充要条件
是 r<0 ;
②|r|越
小
,说明两个变量之间的线性相关性越
弱
,也就是得出
的回归直线方程越没有价值,即方程越不能反映真实的情况;|r|越 大
r=0.824 5,下列说法正确的是( C )
A.花瓣长度和花萼长度没有相关性
B.花瓣长度和花萼长度呈现负相关
C.花瓣长度和花萼长度呈现正相关
D.若从样本中抽取一部分,则这部分
的相关系数一定是0.824 5
解析 根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误;
散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B选
床的产品质量有差异?
2
(d-c)
附:χ2=
.
(+)(c+d)(+c)(+d)
α=P(χ2≥k)
k
解
0.05
3.841
0.01
6.635
0.001
10.828
150
(1)由表格数据得甲机床生产的产品中一级品的频率为
200
120
乙机床生产的产品中一级品的频率为
200
=
3
.
5
=
3
;
4
(2)由题意可知
(1)根据散点图推断两个变量是否线性相关.计算相关系数(精确到0.01),并
推断它们的相关程度;
高考数学一轮复习第10章统计与统计案例3成对数据的统计分析课件新人教版
使用相关的统计软件.
3.针对实际问题,会用一元线性回归模型进行预测.
4.通过实例,理解2×2列联表的统计意义,了解2×2列联表独立性检验及其
应用.
备考指导
本节内容在高考选择题、填空题、解答题中均有体现,难度中等.主要体现
在一元线性回归模型的应用和独立性检验的应用.近几年高考中,尤其加强
是( C )
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
由样本相关系数r1=0.785 9>0,知x与y正相关,
(1)样本相关系数的公式
r=
∑ (xi -x)(yi -y)
=1
n
∑ ( -)
i=1
2
∑ ( -)
=1
2
=
∑ -
=1
2 2
2
2
∑ - ∑ -
=1
=1
(2)样本相关系数r的取值范围为[-1,1].
.
问题思考
样本相关系数r是如何反映成对样本数据的线性相关程度的?
对点训练1
(1)已知x,y是两个变量,下列四个散点图中,x与y负相关的是( C )
若两个变量负相关,则当一个变量的值增加时,另一个变量的值呈减少的
趋势,故选C.
(2)对四组数据进行统计,获得的散点图如图所示,关于其样本相关系数的
高考数学一轮复习第十章概率、随机变量及其分布课时规范练51随机抽样、用样本估计总体
课时规范练51随机抽样、用样本估计总体基础巩固组1.(2020天津耀华中学高一期末)已知一组数据为4,5,6,7,8,8,40%分位数是()A.8B.7C.6D.52.(多选)(2020江苏泗洪质检)某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人.甲就读于高一,乙就读于高二.学校计划从这两个年级中共抽取235人进行视力调查,下列说法中正确的有()A.应该采用分层随机抽样法B.高一、高二年级应分别抽取100人和135人C.乙被抽到的可能性比甲大D.该问题中的总体是高一、高二年级的全体学生的视力3.(多选)(2020江苏启东高一期末)某人射箭9次,射中的环数依次为7,8,9,7,6,9,8,10,8,关于这组数据,下列说法正确的是()A.这组数据的众数是8B.这组数据的平均数是8C.这组数据的中位数是6D.这组数据的方差是434.将甲、乙两个篮球队10场比赛的得分数据整理成如图所示的茎叶图,由图可知()A.甲队得分的众数是3B.甲、乙两队得分在[30,39)内的频率相等C.甲、乙两队得分的极差相等D.乙队得分的中位数是38.55.(2020陕西榆林高三四模)港珠澳大桥位于中国广东省珠江口伶仃洋海域内,是中国境内一项连接香港、珠海和澳门的桥隧工程,因其超大的建筑规模、空前的施工难度和顶尖的建造技术而闻名世界.2018年10月24日上午9时开通运营后香港到澳门之间4个小时的陆路车程极大缩短.为了解实际通行所需时间,随机抽取了n台车辆进行统计,结果显示这些车辆的通行时间(单位:分钟)都在[35,50]内,按通行时间分为[35,38),[38,41),[41,44),[44,47),[47,50]五组,其中通行时间在[38,47)内的车辆有182台,频率分布直方图如图所示,则n=()A.280B.260C.250D.2006.(2020天津一中高三月考)某社区组织“学习强国”的知识竞赛,从参加竞赛的市民中抽出40人,将其成绩分成以下6组:第1组[40,50),第2组[50,60),第3组[60,70),第4组[70,80),第5组[80,90),第6组[90,100],得到如图所示的频率分布直方图.现采用分层随机抽样的方法,从第2,3,4组中抽取8人,则第2,3,4组抽取的人数依次为()A.1,3,4B.2,3,3C.2,2,4D.1,1,67.(2020山东泰安高一期末)某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x ,174,175,若样本数据的90%分位数是173,则x 的值为.8.(2020北京密云高三质检)某校高一年级三个班共有学生120名,这三个班的男生、女生人数如下表所示,已知在全年级中随机抽取1名学生,抽到二班女生的概率是0.2,则x=.现用分层随机抽样的方法在全年级抽取30名学生,则应在三班抽取的学生人数为.班级一班二班三班女生人数20x y 男生人数2020z 综合提升组9.(多选)(2020山东淄博高三质检)某学校为了调查学生一周内在生活方面的支出情况,抽出了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60)内的学生有60人,则下列说法正确的是()A.样本中支出在[50,60)内的频率为0.03B.样本中支出不少于40元的人数为132C.n的值为200D.若该校有2000名学生,则定有600人支出在[50,60)内10.在《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱.欲以钱多少衰出之,问各几何?”其译文为:今有甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带钱多少的比例进行交税,问三人各应付多少税?则下列说法错误的是()A.甲应付5141109钱B.乙应付3224109钱C.丙应付1656109钱D.三者中甲付的钱最多,丙付的钱最少11.(多选)(2020山东嘉祥一中高三月考)在某次高中学科知识竞赛中,对4000名考生的参赛成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],60分以下视为不及格,若同一组中数据用该组区间中点值作代表,则下列说法中正确的是()A.成绩在[70,80)内的考生人数最多B.不及格的考生人数为1000C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75分12.(2020江西九江高三模拟)一组数据中的每一个数据都乘以3,再减去50,得到一组新数据,若求得新的数据的平均数是1.6,方差是3.6,则原来数据的平均数和方差分别是()A.17.2,3.6B.54.8,3.6C.17.2,0.4D.54.8,0.413.(2020福建福州高二期中)为让学生适应新高考的赋分模式,某校在一次校考中使用赋分制给高二年级学生的生物成绩进行赋分,具体方案如下:A等级,排名等级占比7%,分数区间是83—100;B等级,排名等级占比33%,分数区间是71—82;C等级,排名等级占比40%,分数区间是59—70;D等级,排名等级占比15%,分数区间是41—58;E等级,排名等级占比5%,分数区间是30—40.现从全年段的生物成绩中随机抽取100名学生的原始成绩(未赋分)进行分析,其频率分布直方图如图所示:(1)求图中a的值;(2)以样本估计总体的办法,估计该校本次生物成绩原始分不少于多少分才能达到赋分后的C等级及以上(含C等级);(3)若采用分层抽样的方法,从原始成绩在[40,50)和[50,60)内的学生中共抽取5人,查看他们的答题情况来分析知识点上的缺漏,再从中选取2人进行调查分析,求这2人中至少一人原始成绩在[40,50)内的概率.创新应用组14.(多选)(2020重庆巴蜀中学高三月考)气象意义上从春季进入夏季的标志为:“连续5天每天日平均温度不低于22℃”.现有甲、乙、丙三地连续5天日平均温度的记录数据(数据都是正整数,单位:℃)满足以下条件:甲地:5个数据的中位数是24,众数是22;乙地:5个数据的中位数是27,平均数是24;丙地:5个数据有1个是32,平均数是26,方差是10.2,则下列说法正确的是()A.进入夏季的地区至少有2个B.丙地区肯定进入了夏季C.不能肯定乙地区进入夏季D.不能肯定甲地区进入夏季15.如图是某城市100户居民的月平均用电量(单位:度)的频率分布直方图.(1)求频率分布求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?参考答案课时规范练51随机抽样、用样本估计总体1.C因为有6位数,所以6×40%=2.4,所以40%分位数是第三个数6.2.ABD由于各年级的年龄段不一样,因此应采用分层随机抽样法.由于比例为23520×50+30×45=110,因此高一年级1000人中应抽取100人,高二年级1350人中应抽取135人,甲、乙被抽到的可能性都是110,因此只有C不正确,故选ABD.3.ABD数据从小到大排列为6,7,7,8,8,8,9,9,10,所以众数为8,故A正确;中位数为8,故C错误;平均数为6+7+7+8+8+8+9+9+109=8,故B正确;方差为19×[(6-8)2+(7-8)2×2+(8-8)2×3+(9-8)2×2+(10-8)2]=43,故D正确.4.D甲队得分的众数是33和35,故A错误;甲、乙两队得分在[30,39)内的频率分别为25和310,所以甲、乙两队得分在[30,39)内的频率不相等,故B错误;甲队得分的极差为51-24=27,乙队得分的极差为52-22=30,所以甲、乙两队得分的极差不相等,故C错误;乙队得分的中位数是34+432=38.5,故D正确.故选D.5.D由题意可知,通行时间在[38,47)内的频率为1-(0.01+0.02)×3=0.91,所以182=0.91,所以n=200.6.C由图可知第2,3,4组的频率之比为0.15∶0.15∶0.3,所以频数之比为1∶1∶2,现采用分层随机抽样的方法,从第2,3,4组中抽取8人,所以第2,3,4组抽取的人数依次为2,2,4.7.17290%分位数是173,所以r1742=173,x=172.8.249由题意可得120=0.2,解得x=24.三班总人数为120-20-20-24-20=36,用分层随机抽样的方法在全年级抽取30名学生,每个学生被抽到的概率为30120=14,故应从三班抽取的人数为36×14=9.9.BC样本中支出在[50,60)内的频率为1-(0.01+0.024+0.036)×10=0.3,故A错误;样本中支出不少于40元的人数为0.0360.03×60+60=132,故B正确;n=600.3=200,故n的值为200,故C正确;若该校有2000名学生,则可能有0.3×2000=600(人)支出在[50,60)内,故D错误.10.B依题意由分层随机抽样可知,100÷(560+350+180)=10109,则甲应付10109×560=5141109(钱);乙应付10109×350=3212109(钱);丙应付10109×180=1656109(钱).11.ABC由频率分布直方图可得,成绩在[70,80)内的频率最高,因此考生人数最多,故A正确;成绩在[40,60)内的频率为0.01×10+0.015×10=0.25,因此,不及格的人数为4000×0.25=1000,故B 正确;考生竞赛成绩的平均分约为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5(分),故C正确;因为成绩在[40,70)内的频率为0.45,在[70,80)内的频率为0.3,所以考生竞赛成绩的中位数为70+10×0.050.3≈71.67(分),故D错误.12.C设一组数据为x i(i=1,2,3,…,n),平均数为,方差为12,所得一组新数据为y i(i=1,2,3,…,n),平均数为,方差为22,则y i=3x i-50(i=1,2,3,…,n),=1+2+…+=1.6,即31-50+32-50+…+3-50=1.6,所以3-50=1.6,所以=51.63=17.2.22=1[(y1-)2+(y2-)2+…+(y n-)2]=1[(3x1-50-1.6)2+(3x2-50-1.6)2+…+(3x n-50-1.6)2]=1×9[(x1-17.2)2+(x2-17.2)2+…+(x n-17.2)2]=1×9[(x1-)2+(x2-)2+…+(x n-)2]=3.6,所以912=3.6,所以12=0.4.故选C.13.解(1)由题意(0.010+0.015+0.015+a+0.025+0.005)×10=1,所以a=0.030.(2)由已知等级达到C及以上所占排名等级占比为7%+33%+40%=80%,假设原始分不少于x分可以达到赋分后的C等级及以上,则有(0.005+0.025+0.030+0.015)×10+(60-x)×0.015=0.8,所以x≈57.估计原始分不少于57分才能达到赋分后的C等级及以上.(3)由题知评分在[40,50)和[50,60)内的频率分别为0.1和0.15,则抽取的5人中,评分在[40,50)内的有2人,评分在[50,60)内的有3人,记评分在[50,60)内的3位学生为a,b,c,评分在[40,50)内的2位学生为D,E,则从5人中任选2人的所有可能结果为:(a,b),(a,c),(a,D),(a,E),(b,c),(b,D),(b,E),(c,D),(c,E),(D,E),共10种,其中,这2人中至少一人评分在[40,50)内的可能结果为(a,D),(a,E),(b,D),(b,E),(c,D),(c,E),(D,E),共7种.所以这2人中至少一人评分在[40,50)内的概率为710.14.ABC甲地:5个数据由小到大排,则22,22,24,a,b,其中24<a<b,满足进入夏季的标志;乙地:将5个数据由小到大排,则a,b,27,c,d,其中a≤b≤27≤c≤d,则27+c+d≥81,而a+b+27+c+d=120,故a+b≤39,其中必有一个小于22,故不满足进入夏季的标志;丙地:设5个数据为a,b,c,d,32,且a,b,c,d∈N*,由方差公式可知:(a-26)2+(b-26)2+(c-26)2+(d-26)2+(32-26)2=10.2×5=51,则(a-26)2+(b-26)2+(c-26)2+(d-26)2=15=9+4+1+1,不妨设|a-26|=3,|b-26|=2,|c-26|=|d-26|=1,则a,b,c,d均大于22,满足进入夏季标准.综上,ABC正确.15.解(1)由频率分布直方图得20×(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)=1,解得x=0.0075.(2)由频率分布直方图知众数为230,用电量在[160,220)的频率是20×(0.002+0.0095+0.011)=0.45,用电量在[220,240)的频率为0.0125×20=0.25,设中位数为m,则-22020=0.5-0.450.25,解得m=224,即中位数是224.(3)由频率分布直方图知月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户的频率依次为0.25,0.15,0.1,0.05,则月平均用电量在[220,240)的用户中应抽取户数为0.250.25+0.15+0.1+0.05×11=5,应抽取5户.。
备战2024年高考数学总复习第一轮第十章 统计与成对数据的统计分析第二节 用样本估计总体
)
(2)(多选)(2022·广东茂名二模)小李上班可以选择公交车、自行车两种交
通工具,他分别记录了100次坐公交车和100次骑车所用时间(单位:分钟),得
到下列两个频率分布直方图:
坐公交车时间
骑车时间
基于以上统计信息,则(
)
A.骑车时间的中位数的估计值是22分钟
B.骑车时间的众数的估计值是21分钟
数据中的数;
2.一组数据的某些百分位数可能是同一个数.
2.总体集中趋势的估计
数字特征
概念
众数
不一定唯一,一定是这组
数据中的数
一组数据中出现次数
中位数
唯一,不一定是这组数据
中的数
平均数
最多
的数
把一组数据按从小到大(或从大到小)的顺序排
列,处在
中间
位置的一个数据(或两个数据
的平均数)
如果有 n 个数据 x1,x2,…,xn,那么这 n 个数的平
8
11
)
9
9
10
4
答案 (1)172
(2)C
解析 (1)因为20×90%=18,所以90%分位数是第18和第19个数的平均数,
+174
即
=173,解得
2
x=172.
(2)由50×75%=37.5,故75%分位数为借书数量从小到大排序后的第38人,
又5+8+13+11=37<38<5+8+13+11+9=46,故上四分位数是9.
0.2+0.4+0.25=0.85>0.8,所以80%分位数位于第3个矩形,则80%分位数约为
北师版高考数学一轮总复习课后习题 第十章 统计与成对数据的统计分析 课时规范练48
课时规范练48《素养分级练》P380基础巩固组1.(重庆八中高三开学考试)某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了部分党员,对他们一周的党史学习时间进行了统计,统计数据如下表所示:则该单位党员一周学习党史时间的众数及50%分位数分别是( )A.8,8.5B.8,8C.9,8D.8,9答案:D解析:党员人数一共有6+10+9+7+8=40,学习党史时间为8小时的人数最多,故学习党史时间的众数为8,40×50%=20,那么第50百分位数是第20和21=9.个数的平均数,第20,21个数分别为9,9,所以第50百分位数是9+922.(多选)(江苏苏州模拟)近日,中国最具幸福感城市调查推选活动正式启动,在100个地级及以上候选城市名单中,某市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.现随机抽取20位该市居民,他们的幸福感指数见下表,则有关这组幸福感指数,下列说法正确的有( )A.这组数据的平均数为7B.这组数据的标准差为3.6C.这组数据的众数为8D.这组数据的80%分位数是8答案:AC解析:对于A,平均数为120×(3+4×2+5+6×3+7×4+8×5+9×2+10×2)=7,所以A正确;对于B,标准差为√120[(3-7)2+2×(4-7)2+(5-7)2+3×(6-7)2+4×(7-7)2+5×(8-7)2+2×( =√3.6,所以B错误;对于C,因为8出现的次数最多,所以这组数据的众数为8,所以C正确;对于D,因为20×0.8=16,所以这组数据的80%分位数是8+9=8.5,所以D错2误.故选AC.3.(全国甲,文2)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图,则( )A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差答案:B解析:对于A,中位数为(70%+75%)÷2=72.5%>70%,A错误;对于B,平均数为89.5%>85%,B正确;对于C,从图中可以看出,讲座前问卷答题的正确率的波动幅度要大于讲座后问卷答题的正确率的波动幅度,故C错误;对于D,讲座后问卷答题的正确率的极差为20%,讲座前问卷答题的正确率的极差为35%,D错误.故选B.4.(多选)(山东潍坊一模)某市共青团委统计了甲、乙两名同学最近十期“青年大学习”答题得分情况,整理成如图所示的茎叶图.则下列说法中正确的是( )A.甲得分的30%分位数是31B.乙得分的众数是48C.甲得分的中位数小于乙得分的中位数D.甲得分的极差等于乙得分的极差答案:BCD解析:对于A,甲得分从小到大排列为27,28,31,39,42,45,55,55,58,66,而10×30%=3,所以甲得分的30%分位数是35,A不正确;对于B,乙的得分中有两个48,其余分数值均只有一个,因此,乙得分的众数是48,B正确;对于C,甲得分的中位数是43.5,乙得分的中位数是45,C正确;对于D,甲得分的极差、乙得分的极差都是39,D正确.故选BCD.5.(多选)(河北唐山一模)有一组互不相等的数组成的样本数据x1,x2,…,x9,其平均数为a(a≠x i,i=1,2,…,9),若插入一个数a,得到一组新的数据,则( )A.两组样本数据的平均数相同B.两组样本数据的中位数相同C.两组样本数据的方差相同D.两组样本数据的极差相同答案:AD解析:由已知可得x1+x2+…+x9=9a.(9a+a)=a,与原数据的平均数相等,A正对于A选项,新数据的平均数为110确;对于B选项,不妨设x1<x2<…<x9,则原数据的中位数为x5,若a<ax{a,x4}+x5)<x5,若a>in{a,x6})>x5,B错误;对于C 选项,新数据的方差为s'2=110[(x 1-a)2+(x 2-a)2+…(x 9-a)2+(a-a)2]<19[(x 1-a)2+(x 2-a)2+…+(x 9-a)2]=s 2,C 错误;对于D 选项,不妨设x 1<x 2<…<x 9,则x 1<a<x 9,故新数据的极差仍为x 9-x 1,D 正确.故选AD.6.(山东济南二模)4月24日是第七个“中国航天日”,今年的主题是“航天点亮梦想”.某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的25%分位数保持不变,则整数m(1≤m≤10)的值可以是 (写出一个满足条件的m 值即可).答案:7或8或9或10(填4个数中任意一个均可)解析:7,6,8,9,8,7,10,m,若去掉m,该组数据从小到大排列为6,7,7,8,8,9,10,则7×0.25=1.75,故25%分位数为第二个数即7,所以7,6,8,9,8,7,10,m,25%分位数为7,而8×0.25=2,所以7为第二个数与第三个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10. 7.(山东师范大学附中模拟)现有10个数,其平均数是4,且这10个数的平方和是300,那么这组数的标准差是 . 答案:√14解析:设这10个数为x i ,i=1,2,3,…,10,则x =4,则由题可得110(x 1+x 2+…+x 10)=4,所以x 1+x 2+…+x 10=40,x 12+x 22+…+x 102=300,则这组数的标准差是s=√110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2]=√110[(x 12+x 22+…+x 102)-2x (x 1+x 2+…+x 10)+10x 2]=√110(300-2×4×40+10×42)=√14.综合提升组8.(多选)(江苏南通模拟)一组样本数据x 1,x 2,…,x n 的平均数为x(x ≠0),标准差为s.另一组样本数据x n+1,x n+2,…,x 2n 的平均数为3x ,标准差为s.两组数据合成一组新数据x 1,x 2,…,x n ,x n+1,…,x 2n ,新数据的平均数为y ,标准差为s',则 ( )A.y >2xB.y =2xC.s'>sD.s'=s答案:BC 解析:由题意y =nx+n ·3x2n=2x ,故B 正确.ns 2=(x 1-x )2+(x 2-x )2+…+(x n -x )2=∑k=1nx k 2-n x 2,同理ns 2=∑k=n+12nx k 2-n·(3x )2=∑k=n+12nx k 2-9n x 2.两式相加得2ns 2=∑k=12n x k 2-10n x 2,2ns'2=∑k=12n x k 2-2n·(2x )2=∑k=12nx k 2-8n x 2,所以2ns'2>2ns 2,s'>s,故C 正确.9.(山东临沂模拟)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.已知落在[50,60)的平均成绩是54,方差是7,落在[60,70)的平均成绩为66,方差是4,则两组成绩的总平均数z和总方差s2分别为多少.解:因为所有小矩形的面积之和为1,所以(0.005+0.010+0.020+a+0.025+0.010)×10=1,所以a=0.030.成绩在[50,60)的市民人数为100×0.1=10,成绩在[60,70)的市民人数为100×0.2=20,故z=10×54+66×20=62.10+20设成绩在[50,60)中10人的分数分别为x1,x2,x3, (x10)成绩在[60,70)中20人的分数分别为y1,y2,y3,…,y20,则由题意可得x12+x22+…+x10210-542=7,y12+y22+…+y20220-662=4,所以x12+x22+…+x102=29230,y12+y22+…+y202=87200,所以s2=110+20(x12+x22+…+x102+y12+y22+…+y202)-z2=130(29230+87200)-622=37,所以两组市民成绩的总平均数是62,总方差是37.创新应用组10.(多选)(福建莆田模拟)已知一组数据x1,x2,…,x11是公差不为0的等差数列,若去掉数据x6,则( )A.中位数不变B.平均数变小C.方差变大D.方差变小答案:AC解析:对于选项A,原数据的中位数为x6,去掉x6后的中位数为12(x5+x7)=x6,即中位数没变,故选项A正确;对于选项B,原数据的平均数为x=111(x1+x2+…+x11)=111×11(x1+x11)2=x6,去掉x6后的平均数为x'=110(x1+x2+…+x5+x7+x8+…+x11)=x6=x,即平均数不变,故选项B错误;对于选项C,则原数据的方差为s2=1[(x1-x6)2+(x2-x6)2+…+(x11-x6)2],去掉11[(x1-x6)2+(x2-x6)2+…+(x5-x6)2+(x7-x6)2+…+(x11-x6)2], x6后的方差为s'2=110故s2<s'2,即方差变大,故选项C正确,选项D错误.故选AC.。
2025年高考数学一轮复习-第十章-统计与成对数据的统计分析【课件】
2023年:新高考Ⅱ卷·T19
用样本估 2.体会统计思维与确定性思维
2022年:新高考Ⅱ卷·T19
计总体 的差异、归纳推理与演绎推理
2021年:新高考Ⅰ卷·T9
的差异,通过实际操作,积累数
2021年:新高考Ⅱ卷·T9
据分析的经验.
角度
考查内容
课程标准
高考真题
考题 统计
1.了解相关系数的统计含义;
3.重视数学思想方法的应用 重视数学运算、数据分析、数学建模在解题中的应用,统计是数学思想方法 的重要载体,学习中会经常用到“函数与方程”“分类与整合”“数形结合”“数学建 模”等思想. (1)函数与方程思想 在回归直线方程的应用中,需要利用函数与方程的思想对相关变量进行估计. (2)分类与整合思想 统计中计算中位数时,要分数据个数为偶数和奇数两种情况,含有参数时对 数据进行排序要分类与整合.
变量的相关性与一元 2.了解一元线性回归模型,
线性回归分析
பைடு நூலகம்
并会利用其解决简单的实
际问题.
了解2×2列联表,并会利用 2022年:新高考 列联表与独立性检验
其解决简单的实际问题. Ⅰ卷·T20
角度
考查内容
课程标准
高考真题
1.题型设置:常以选择题、解答题的形式出现; 命题 2.内容考查:本章高考考查的频率较高.常考查样本频率分布直方图、 趋势 列联表与独立性检验、变量的相关性与一元线性回归分析;
(3)数形结合思想 统计中有一类题主要考查读图能力和利用统计图获取信息的能力及处理数 据作出决策的能力,充分体现数形结合思想的作用. (4)数学建模思想 数学建模思想的实质是将实际问题数学化,进而用数学的方法解决统计在实 际问题中的应用,充分体现了数学建模思想的应用.
(适用于新高考新教材)高考数学一轮总复习第十章统计与成对数据的统计分析课时规范练57统计
课时规范练57 统计基础巩固组1.为了解某地区的“健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查.事先已了解到该地区老、中、青三个年龄段人员的“健步走”活动情况有较大差异,而男、女“健步走”活动情况差异不大,在下面的抽样方法中,最合理的抽样方法是()A.抽签法抽样B.按性别分层随机抽样C.按年龄段分层随机抽样D.利用随机数表抽样2.某工厂生产的30个零件编号为01,02,…,19,30,现利用如下随机数表从中抽取5个进行检测.若从表中第1行第5列的数字开始,从左往右依次读取数字,则抽取的第5个零件编号为()A.25B.23C.12D.073.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.100,40B.100,20C.200,40D.200,204.某高中为调查该校高一年级学生的体育锻炼情况,通过简单随机抽样抽取100名学生,统计其一周的体育锻炼次数,统计数据如图所示,则此100人一周的人均体育锻炼次数为()A.3.9B.4.5C.5.1D.5.55.(2022全国甲,理2)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图,则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差6.(多选)(2022山东济宁三模)在某市高三年级举行的一次模拟考试中,某学科共有20 000人参加考试.为了了解本次考试学生的成绩,从中抽取了部分学生的成绩(成绩均为正整数,满分为100分)作为样本进行统计,样本容量为n.按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出频率分布直方图,如图所示.其中,成绩落在区间[50,60)内的人数为16.则下列结论正确的是()A.样本容量n=1 000B.图中x=0.030C.估计该市全体学生成绩的平均分为70.6分D.该市要对成绩由高到低前20%的学生授予“优秀学生”称号,则成绩为78分的学生肯定能得到此称号7.某党小组组织开展党史学习教育知识竞赛活动,其中7名党员在这次活动中的成绩统计如图所示.则这7个成绩的中位数所对应的党员是.党史学习教育知识竞赛成绩8.已知某地区人口总数为125万,具体分布如图,近期,卫计委拟针对18到60岁的人群开展疫苗接种工作,抽样发现,他们中有80%的人符合接种的健康要求.截至3月底,已有30%符合健康要求的人接种了第一剂,据要求,这部分人需要在4月份接种第二剂,剩余70%符合健康要求的人需在4月份接种第一剂,5月份接种第二剂.则该地区4月份需要万剂疫苗.综合提升组9.已知数据x1,x2,…,x10,2的平均数为2,方差为1,则数据x1,x2,…,x10相对于原数据()A.一样稳定B.变得比较稳定C.变得比较不稳定D.无法判断其稳定性10.(多选)为了解学生的身体状况,某校随机抽取了100名学生测量体重,经统计,这些学生的体重数据(单位:千克)全部介于45至70之间,将数据整理得到如图所示的频率分布直方图,则()A.频率分布直方图中a的值为0.04B.这100名学生中体重不低于60千克的人数为20C.这100名学生体重的众数约为52.5D.据此可以估计该校学生体重的75%分位数约为61.2511.(多选)有一组样本数据x1,x2,…,x n,由这组数据得到新样本数据y1,y2,…,y n,其中y i=x i+c(i=1,2,…,n),c为非零常数,则()A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同12.为了解某校学生的视力情况,现采用简单随机抽样的方式从该校的A,B两班中各抽4名学生进行视力检测.检测的数据如下:A班:4.1,4.6,4.4,4.9;B班:4.9,4.6,4.2,4.5.(1)分别计算两组数据的平均数,从计算结果看,班的4名学生视力较好;(2)班的4名学生视力方差较大.13.某家水果店的店长为了解本店苹果的日销售情况,记录了近期连续120天苹果的日销售量(单位:千克),并绘制频率分布直方图如下:(1)请根据频率分布直方图估计该水果店苹果日销售量的众数和平均数;(同一组中的数据以这组数据所在区间的中点值作代表)(2)一次进货太多,水果会变得不新鲜;进货太少,又不能满足顾客的需求.店长希望每天的苹果尽量新鲜,又能80%地满足顾客的需求(在10天中,大约有8天可以满足顾客的需求).请问每天应该进多少千克苹果?(精确到整数位)创新应用组14.下图是国家统计局发布的2020年2月至2021年2月全国居民消费价格涨跌幅折线图,则给出下列三个结论:①2020年11月居民消费价格低于2019年同期;②2020年3月至7月居民的消费价格持续增长;③2020年7月的消费价格低于2020年3月的消费价格.其中所有正确结论的序号是.全国居民消费价格涨跌幅折线图说明:1.在统计学中,同比是指本期统计数据与上一年同期统计数据相比较,例如2021年2月与2020年2月相比较;环比是指本期统计数据与上期统计数据相比较,例如2020年4月与2020年3月相比较.2.同比增长率=×100%,环比增长率=×100%.课时规范练57统计1.C解析:根据分层随机抽样的特征知选C.2.C解析:从表中取到的有效数字依次为07,04,08,23,12,则抽取的第5个零件编号为12.故选C.3.D解析:由题图甲可知,学生总数为4500+3500+2000=10000,故抽取的样本容量为10000×2%=200.其中抽取的高中生有200×=40(人).由题图乙可知,高中生近视率为50%,故抽取的高中生近视人数为40×50%=20.故选D.4.C解析:100人一周的人均体育锻炼次数为4×+5×+6×=5.1.故选C.5.B解析:对于A,中位数为(70%+75%)÷2=72.5%>70%,A错误;对于B,平均数为89.5%>85%,B正确;对于C,从图中可以看出,讲座前问卷答题的正确率的波动幅度要大于讲座后问卷答题的正确率的波动幅度,故C错误;对于D,讲座后问卷答题的正确率的极差为20%,讲座前问卷答题的正确率的极差为35%,D错误.故选B.6.BC解析:对于A,因为成绩落在区间[50,60)内的人数为16,所以样本容量n==100,故A不正确;对于B,因为(0.016+x+0.040+0.010+0.004)×10=1,解得x=0.030,故B正确;对于C,学生成绩的平均分为0.016×10×55+0.030×10×65+0.040×10×75+0.010×10×85+0.004×10×95=70.6,故C正确;对于D,因为10×(0.004+0.010)+(8078)×0.040=0.22>0.20,即按照成绩由高到低前20%的学生中不含78分的学生,所以成绩为78分的学生不能得到此称号,故D不正确.故选BC.7.甲解析:根据条形图可知,7名党员的成绩由高到低依次为:庚、丙、戊、甲、丁、己、乙,因此,这7个成绩的中位数所对应的党员是甲.8.70解析:18到60岁的有125×0.7=87.5(万人),其中符合接种的健康要求的有87.5×0.8=70(万人),所以需要70万剂疫苗.9.C解析:由题可得=2,所以x1+x2+…+x10=20,所以平均数为2.由=1得=1.1>1,所以变得比较不稳定,故选C.10.ACD解析:由(0.01+0.07+0.06+a+0.02)×5=1,解得a=0.04,故A正确;体重不低于60千克的频率为(0.04+0.02)×5=0.3,所以这100名学生中体重不低于60千克的人数为0.3×100=30,故B错误;100名学生体重的众数约为=52.5,故C正确;因为体重不低于60千克的频率为0.3,而体重在[60,65)的频率为0.04×5=0.2,所以估计该校学生体重的75%分位数约为60+5×=61.25,故D正确.故选ACD.11.CD解析:x i,+c,故A错误;两组样本数据的样本中位数相差c,故B 错误;(x i)2,[(x i+c)(+c)]2=,故C正确;x极差=x max x min,y极差=(x max+c)(x min+c)=x max x min,故D正确.12.(1)B (2)A 解析:(1)A班数据的平均数×(4.1+4.6+4.4+4.9)=4.5,B班数据的平均数×(4.9+4.6+4.2+4.5)=4.55,从计算结果看,B班的4名学生视力较好.(2)A班数据的方差s2=×[(4.14.5)2+(4.64.5)2+(4.44.5)2+(4.94.5)2]=×(0.42+0.12+0.12+0.42)=0.085,B班数据的方差s'2=×[(4.94.55)2+(4.64.55)2+(4.24.55)2+(4.54.55)2]=×(0.352+0.052+0.352+0.052)=0.0625, 所以A班的4名学生视力方差较大.13.解(1)由题图可知,该水果店苹果日销售量的众数为=85,平均数为=(65×0.0025+75×0.01+85×0.04+95×0.035+105×0.01+115×0.0025)×10=89.75. (2)日销售量在[60,90)内的频率为0.525<0.8,日销量在[60,100)内的频率为0.875>0.8,故所求的量位于[90,100)内.由0.80.525=0.275,得90+≈98,故每天应该进98千克苹果.14.①③解析:对于①,由题图可知2020年11月同比增长率为负值,由同比增长率的计算公式可得,2020年11月居民消费价格低于2019年同期,故①正确;对于②,由题图可知,2020年3月至6月的环比增长率为负,由环比增长率的计算公式可得消费价格下降,故②错误;对于③,设2020年3月居民消费价格为a3,4月消费价格为a4,5月消费价格为a5,6月消费价格为a6,7月消费价格为a7,由题意得×100%=0.9%,解得a4=0.991a3,×100%=×100%=0.8%,解得a5≈0.983a3,×100%≈×100%=0.1%,解得a6≈0.982a3,×100%≈×100%=0.6%,解得a7≈0.988a3,所以a7<a3,所以2020年7月消费价格低于2020年3月消费价格,故③正确.。
(福建专版)高考数学一轮复习课时规范练49用样本估计总体(文)
课时规范练49 用样本估计总体基础巩固组1.一组数据分别为12,16,20,23,20,15,28,23,则这组数据的中位数是()A.19B.20C.21.5D.232.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是()A.甲B.乙C.丙D.丁3.(2017广西南宁一模)某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在()A.第3组B.第4组C.第5组D.第6组〚导学号24190795〛4.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为()A.2B.3C.4D.55.在某次测量中得到的甲样本数据如下:42,43,46,52,42,50,若乙样本数据恰好是甲样本每个数据都减5后所得数据,则甲、乙两个样本的下列数字特征对应相同的是()A.平均数B.标准差C.众数D.中位数6.若数据x1,x2,…,x n的平均数为x,方差为s2,则2x1+3,2x2+3,…,2x n+3的平均数和方差分别为()A.x和s2B.2x+3和4s2C.2x+3和s2D.2x+3和4s2+12s+97.(2017辽宁大连一模,文13)某班级有50名同学,一次数学测试平均成绩是92,如果学号为1号到30号的同学平均成绩为90,那么学号为31号到50号同学的平均成绩为.8.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩在[16,18]的学生人数是.〚导学号24190796〛9.某市运动会期间30名志愿者年龄数据如下表:(1)求这30名志愿者年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这30名志愿者年龄的茎叶图;(3)求这30名志愿者年龄的方差.综合提升组10.若一组数据2,4,6,8的中位数、方差分别为m,n,且ma+nb=1(a>0,b>0),则1x +1x的最小值为()A.6+2√3B.4+3√5C.9+4√5D.2011.已知样本(x1,x2,…,x n)的平均数为x,样本(y1,y2,…,y m)的平均数为x(x≠x),若样本(x1,x2,…,x n,y1,y2,…,y m)的平均数x=αx+(1-α)x,其中0<α<12,则n,m的大小关系为() A.n<m B.n>mC.n=mD.不能确定12.(2017山西晋中一模)设样本数据x1,x2,…,x2 017的方差是4,若y i=2x i-1(i=1,2,…,2 017),则y1,y2,…,y2 017的方差为.13.(2017河北邯郸二模,文18)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.〚导学号24190797〛创新应用组14.某学校随机抽取20个班,调查各班有网上购物经历的人数,所得数据的茎叶图如图所示,以5为组距将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()〚导学号24190798〛15.(2017河北邯郸一模,文18)某校为指导学生合理选择文理科的学习,根据数理综合测评成绩,按6分为满分进行折算后,若学生成绩小于m分建议选择文科,不低于m分则建议选择理科(这部分学生称为候选理科生).现从该校高一随机抽取500名学生的数理综合成绩作为样本,整理得到分数的频率分布直方图(如图所示).(1)求直方图中t的值;(2)根据此次测评,为使80%以上的学生选择理科,整数m至多定为多少?(3)若m=4,试估计该校高一学生中候选理科学生的平均成绩.(精确到0.01)答案:1.B把该组数据按从小到大的顺序排列如下:12,15,16,20,20,23,23,28,排在中间的两个数是20,20,故这组数据的中位数为20+202=20.故选B.2.C由题目表格中数据可知,丙的平均环数最高,且方差最小,说明丙的技术稳定,且成绩好,故选C.3.B由题图可得,前第四组的频率为(0.037 5+0.062 5+0.075+0.1)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.1×2=8,即中位数落在第4组,故选B.4.B依题意可得10×(0.005+0.01+0.02+a+0.035)=1,则a=0.03.所以身高在[120,130),[130,140),[140,150]三组内的学生人数比例为3∶2∶1.所以从身高在[140,150]内的学生中选取的人数应为13+2+1×18=3.5.B设样本甲中的数据为x i(i=1,2,…,6),则样本乙中的数据为y i=x i-5(i=1,2,…,6),则样本乙中的众数、平均数和中位数与甲中的众数、平均数和中位数都相差5,只有标准差没有发生变化,故选B.6.B原数据乘2加上3得到一组新数据,则由平均数、方差的性质可知得到的新数据的平均数、方差分别是2x+3和4s2.7.95设学号为31号到50号同学的平均成绩为x,则92×50=90×30+20x,解得x=95,故答案为95.8.54成绩在[16,18]的学生人数所占比例为6+31+3+7+6+3=920,所以成绩在[16,18]的学生人数为120×920=54.9.解 (1)众数为19,极差为21.(2)茎叶图如图.(3)年龄的平均数为19×7+21×2+28×3+30×4+31×5+32×3+40×630=29,故这30名志愿者年龄的方差为130[(19-29)2×7+2×(21-29)2+3×(28-29)2+4×(30-29)2+(31-29)2×5+(32-29)2×3+(40-29)2×6]=2685.10.D ∵数据2,4,6,8的中位数是5,方差是14(9+1+1+9)=5,∴m=5,n=5.∴ma+nb=5a+5b=1(a>0,b>0).∴1x +1x =(1x +1x )(5a+5b )=5(2+x x +xx )≥20(当且仅当a=b 时等号成立),故选D .11.A 由题意知样本(x 1,…,x n ,y 1,…,y m )的平均数为x =xx +xx x +x=x x +x x +xx +xx .又x =αx +(1-α)x ,即α=xx +x ,1-α=xx +x .因为0<α<12,所以0<x x +x <12,即2n<m+n , 所以n<m ,故选A.12.16 根据题意,设样本数据x 1,x 2,…,x 2 017的平均数为x ,又由其方差为4,则x x 2=12 017[(x 1-x )2+(x 2-x )2+(x 3-x )2+…+(x 2 017-x )2]=4.对于数据y i =2x i -1(i=1,2,…,2 017), 其平均数x =12 017(y 1+y 2+…+y 2 017)=12 017[(2x 1-1)+(2x 2-1)+…+(2x 2 017-1)]=2x -1,其方差x x 2=12 017[(y 1-x )2+(y 2-x )2+(y 3-x )2+…+(y 2 017-x )2]=42 017[(x 1-x )2+(x 2-x )2+(x 3-x )2+…+(x 2 017-x )2]=16,故答案为16.13.解 (1)依题意,得10(2a+0.02+0.03+0.04)=1,解得a=0.005.(2)这100名学生语文成绩的平均分为:55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73(分).(3)数学成绩在[50,60)的人数为:100×0.05=5, 数学成绩在[60,70)的人数为:100×0.4×12=20, 数学成绩在[70,80)的人数为:100×0.3×43=40, 数学成绩在[80,90)的人数为:100×0.2×54=25,所以数学成绩在[50,90)之外的人数为:100-5-20-40-25=10.14.A由组距可知选项C,D不对;由茎叶图可知[0,5)有1人,[5,10)有1人,故第一、二小组频率相同,频率分布直方图中矩形的高应相等,可排除B.故选A.15.解 (1)根据频率分布直方图,得0.15×1+t×1+0.30×1+t×1+0.15×1=1,解得t=0.2.(2)为使80%以上的学生选择理科,则0.15+0.2+0.3<0.8<0.15+0.2+0.3+0.2,故满足条件的m值为2.(3)当m=4时,4.5×0.2×1×500+5.5×0.15×1×5000.2×1×500+0.15×1×500≈4.93,估计该校高一学生中候选理科学生的平均成绩为4.93分.。
高三数学一轮复习《成对数据的统计分析》讲义
高三数学一轮复习《成对数据的统计分析》讲义【必备知识】1、变量的相关关系(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)相关关系的分类:正相关和负相关.(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,称这两个变量线性相关.2、样本相关系数(1)样本相关系数∑∑∑===----=ni ini ini iiy yx x y yx x r 12121)()())(((2)当0>r ,成对样本数据正相关;当0<r 时,成对样本数据负相关. (3)当||r 越接近1时,成对样本数据的线性相关程度越强; 当||r 越接近0时,成对样本数据的线性相关程度越弱. 3、一元线性回归模型(1)经验回归方程为a x b yˆˆˆ+=,其中∑∑∑∑====--=---=ni ini ii ni ini iixn xyx n yx x x y yx x b 1221121)())((.(2)残差分析①观测值:通过观测得到的数据.②预测值:通过经验回归方程得到的yˆ. ③残差:观测值减去预测值的差.④残差分析:通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等.这方面的工作称为残差分析.4.独立性检验(1)假定通过简单随机抽样得到了X 和Y 的抽 样数据列联表,如表所示. 则))()()(()(22d b c a d c b a bc ad n ++++-=χ.(2)独立性检验当αχx ≥2时,推断0H 不成立,即认为X 和Y 不独立,该推断犯错误的概率不超过α;X Y 合计 Y =0 Y =1 X =0 a b a +b X =1 c d c +d 合计a +cb +dn =a +b +c +d当αχx <2时,没有充分证据推断0H 不成立,可以认为X 和Y 独立.利用χ2的取值推断分类变量X 和Y 是否独立的方法称为2χ独立性检验,简称独立性检验.考点04 相关关系的判断【常见方法】判断相关关系的方法:(1)回归方程法:利用回归方程中x 的系数bˆ的正负判断. (2)散点图法:如果所有的样本点都落在某一曲线附近,那么变量之间就有相关关系;如果所有的样本点都落在某一直线附近,那么变量之间就有线性相关关系.(3)相关系数法:利用相关系数判断,|r |越趋近于1,相关性越强. 【典例分析04】1、为了对变量x 与y 的线性相关进行检验,由样本点(x 1,y 1)、(x 2,y 2)、…、(x 10,y 10)求得两个变量的样本相关系数为r ,那么下面说法中正确的是( )A .若所有样本点都在直线y =-2x +1上,则r =1B .若所有样本点都在直线y =-2x +1上,则r =-2C .若||r 越大,则变量x 与y 的线性相关性越强D .若||r 越小,则变量x 与y 的线性相关性越强 2、下列命题中正确的为( )A .线性相关系数r 越大,两个变量的线性相关性越强B .线性相关系数r 越小,两个变量的线性相关性越弱C .残差平方和越小的模型,模型拟合的效果越好D .用相关指数R 2来刻画回归效果,R 2越小,说明模型的拟合效果越好3、某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i ,y i )(i =1,2,…,20)得到下面的散点图:由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( )A .y =a +bxB .y =a +bx 2C .y =a +b e xD .y =a +b ln x考点05 线性回归方程角度01 线性回归方程及其应用 【常见方法】求线性回归方程的基本步骤(1)先把数据制成表,从表中计算出x 、y ,x 21 +x 22 +…+x 2n 、x 1y 1+x 2y 2+…+x n y n 的值;(2)计算回归系数b aˆ,ˆ; (3)写出线性回归方程a x b yˆˆˆ+=.注意:回归方程一定过点(x ,y ). 【典例分析05】1、某食品厂2020年2月至6月的某款饮料生产产量(单位:万件)的数据如下表:月份x 2 3 4 5 6 生产产量y /万件356.5810.5(1)根据以上数据,求y 关于x 的线性回归方程a x b yˆˆˆ+=; (2)调查显示该年7月份的实际市场需求量为13.5万件,求该年7月份所得回归方程预测的生产产量与实际市场需求量的误差.参考公式:∑∑∑∑====--=---=ni ini ii ni ini iix n xy x n yx x x y yx x b 1221121)())((,x b y aˆˆ-=.角度02 相关系数及其应用【常见方法】1.模型拟合效果的判断(1)残差平方和越小,模型的拟合效果越好; (2)决定系数R 2越大,模型的拟合效果越好;(3)回归方程的拟合效果,可以利用相关系数判断.当|r |越趋近于1时,两变量的线性相关程度越强. 2.确定残差系数2R∑∑==---=n i ini i iy yyyR 12122)()ˆ(1.其中∑=-ni iiyy 12)ˆ(是残差平方和,其值越小,则2R 越大(接近1),模型的拟合效果越好.2、某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得60201=∑=i ix,1200201=∑=i i y ,80)(2012=-∑=i i x x ,9000)(2012=-∑=i i y y ,800))((201=--∑=i iiy yx x .(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数∑∑∑===----=ni ini ini iiy yx x y yx x r 12121)()())((, 2 ≈1.414.角度03 非线性回归分析【常见方法】非线性回归方程的求法(1)根据原始数据(x ,y )作出散点图.(2)根据散点图选择恰当的拟合函数.(3)作恰当的变换,将其转化成线性函数,求线性回归方程. (4)在(3)的基础上通过相应变换,即可得到非线性回归方程.3、某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y i (i =1,2,…,8)数据作了初步处理,得到如图所示的散点图及一些统计量的值.xyw∑=-812)(i ix x∑=-812)(i iw w∑=--81))((i iiy yx x∑=--81))((i iiy yw w46.6563 6.8 289.81.61.469108.8表中i i x w =,∑==18i i w w .(1)根据散点图判断,bx a y +=与x d c y +=哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型(给出判断即可,不必说明理由)?(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.考点06 独立性检验【常见方法】独立性检验的一般步骤(1)根据样本数据制成2×2列联表;(2)根据公式))()()(()(22d b c a d c b a bc ad n ++++-=χ计算2χ.(3)如果αχx ≥2,则“X 与Y 有关系”这种推断犯错误的概率不超过a ;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够的证据支持结论“X 与Y 有关系”. 【典例分析06】1、甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品 二级品 合计 甲机床 150 50 200 乙机床 120 80 200 合计270130400①甲机床、乙机床生产的产品中一级品的频率分别是多少?②能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异? 附:))()()(()(22d b c a d c b a bc ad n ++++-=χ)(2αχx P ≥0.050 0.010 0.001 x α3.8416.63510.828。
湘教版高考总复习一轮数学精品课件 第10章统计与成对数据的统计分析 课时规范练 随机抽样、统计图表
B.农村居民恩格尔系数的平均数低于32%
C.城镇居民恩格尔系数的第45百分位数高于29%
D.全国居民恩格尔系数等于农村居民恩格尔系数和城镇居民恩格尔系数
的平均数
1 2 3 4 5 6 7 8 9 10 11 12 13
答案 AC
解析 对于A,从折线统计图可知2015年开始城镇居民的恩格尔系数均低于
3
人,由图可知,样本中高三年级学生假期学习计划的完成率为 40%,故样
本中高三年级完成计划的人数为 20×40%=8.
1 2 3 4 5 6 7 8 9 10 11 12 13
6.(多选题)(2024·陕西商洛模拟)十项全能是田径运动中全能项目的一种,
是由跑、跳、投等10个田径项目组成的综合性男子比赛项目,比赛成绩是
费用最少,故A正确.
由扇形图可得,30周岁及以上的参保人群约占参保总人群的80%,故B错误;
由条形图可得,丁险种参保人群约占参保总人群的55%,所以最受青睐,所以
D正确.故选ACD.
1 2 3 4 5 6 7 8 9 10 11 12 13
11.(多选题)(2024·福建泉州模拟)2021年7月24日,中共中央办公厅、国务院
少1小时
答案 ACD
1 2 3 4 5 6 7 8 9 10 11 12 13
解析 对于A,图1与图2相比较,图1更“矮胖”,图2更瘦高,故图2的方差更小,数
据也更均衡,故A正确;
对于
0.35
B,“双减”前学习时长在(3.5,6]的频率为 2 +0.2+0.1=0.475<0.5,故
B错
误;
对于 C,“双减”后学习时长在[0,2.5)的频率为
D.甲的各项得分的极差比乙的各项得分的极差大
高考数学一轮总复习第十章统计与成对数据的统计分析课时规范练49成对数据的统计分析北师大版
课时规范练49基础巩固组1.(2022·江西重点中学协作体二模)千百年来,我国劳动人民在生产实践中根据云的形状、走向速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”等,小明同学为了验证“日落云里走,雨在半夜后”这一谚语,观察了所在地区A的100天日落和夜晚天气,得到如下表格:日落云里走夜晚天气下雨不下雨出现25 5不出现25 45P(χ2>k) 0.1 0.05 0.01k2.706 3.841 6.635并计算得到χ2≈19.05,小明对所在地区天气的下列判断正确的是()B.未出现“日落云里走”,但夜晚下雨的概率约为C.出现“日落云里走”,夜晚一定会下雨D.有99%的把握判断“日落云里走是否出现”与“当晚是否下雨”有关答案:D解析:根据表中数据可知,夜晚下雨的概率约为P=,所以A错.未出现“日落云里走”,但夜晚下雨的概率约为P=,故B错.χ2≈19.05>10.828=x0.001,对照临界值表可知,依据α=0.001的独立性检验,可认为“日落云里走是否出现”与“当晚是否下雨”有关,但不能认为夜晚一定会下雨,故C错,D对.2.(2022·安徽蚌埠一模)文旅部门统计了某景点在2022年3月至7月的旅游收入y(单位:万元),得到以下数据:月份x 3 4 5 6 7旅游收入y(单位:万元) 10 12 11 12 20(1)根据表中所给数据,用相关系数r加以判断,是否可用一元线性回归方程拟合y与x的关系?若可以,求出y关于x之间的线性回归方程;若不可以,请说明理由.(2)为调查游客对该景点的评价情况,随机抽查了200名游客,得到如下列联表,请填写下面的2×2列联表,并判断能否认为“游客是否喜欢该景点与性别有关联”.性别喜欢不喜欢总计男100女60总计110参考公式:相关系数r=,参考数据:≈3.162.线性回归方程:x+,其中,χ2=.临界值表:P(χ2>k) 0.1 0.05 0.01k2.706 3.841 6.635解:(1)由已知得:=5,=13,(x i)2=10,(y i)2=64,(x i)(y i)=20,r=≈0.791,因为|r|≈0.791接近于1,说明y与x的线性相关关系很强,可用一元线性回归方程拟合y与x的关系,∴=2,=1310=3,则y关于x的线性回归方程为=2x+3.(2)2×2列联表如下所示:性别喜欢不喜欢总计男70 30 100女40 60 100总计110 90 200根据列联表中数据,χ2=≈18.182>6.635,我们有99%的把握认为游客是否喜欢该景点与性别有关联.综合提升组3.(2023·江苏盐城高三检测)我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额x(单位:亿元)对年盈利额y(单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间最近10年年研发资金投入额x i和年盈利额y i的数据.通过对比分析,建立了两个函数模型:①y=α+βx2,②y=eλx+t,其中α,β,λ,t均为常数,e为自然对数的底数.令u i=,v i=ln y i(i=1,2,…,10),经计算得如下数据:(x i)2(y i)226 215 65 2 680 5.36(u i)2(u i)(y i) (v i)2(x i)(v i)11250 130 2.6 12请从相关系数的角度分析,模型拟合程度更好是(填函数模型序号①或②);利用模型拟合程度更好的模型以及表中数据,建立y关于x的非线性回归方程为(系数精确到0.01).附:相关系数r=,线性回归方程x中:.答案:②=e0.18x+0.56解析:设u与y的相关系数为r1,x与v的相关系数为r2,由题意,r1=≈0.87,r2=≈0.92,则|r1|<|r2|,因此从相关系数的角度分析,模型y=eλx+t的拟合程度更好.先建立v关于x的线性回归方程,由y=eλx+t,得ln y=t+λx,即v=t+λx,≈0.18,=5.36×26=0.56,所以v关于x的线性回归方程为=0.18x+0.56,所以ln =0.18x+0.56,则=e0.18x+0.56.4.(2023·山东淄博模拟)小叶紫檀是珍稀树种,因其木质好备受人们喜爱,其幼苗从观察之日起,第x天的高度为y cm,测得数据如下:x 1 4 9 16 25 36 49y(单位:cm) 0 4 7 9 11 12 13成对数据的散点图如图所示:为近似描述y与x的关系,除了一次函数模型=bx+a外,还有=b+a和=bx2+a两个函数模型可选.(1)从三个函数模型中选出“最好”的曲线拟合y与x的关系,并求出其非线性回归方程(保留到小数点后1位);(2)判断说法“高度从1 000 cm长到1 001 cm所需时间超过一年”是否成立,并给出理由.参考公式:.参考数据(其中u i=,v i=):=20,=4,=668,=8,=4 676,=140,=7 907396,x i y i=1 567,u i y i=283,v i y i=56 575.解:(1)由散点图可知,这些数据形成的曲线的形状与函数y=的图象很相似,因此可以用类似的表达式=b+a来描述y与x的关系,即三个函数中=b+a的图象是拟合y与x的关系“最好”的曲线.令u=,则u+,根据已知数据,得=4,=8,u i y i=283,=140,所以≈2.1,又线性回归直线u+经过点(4,8),所以=82.1×4=0.4,所以y关于u的线性回归方程为=2.1u0.4,即y与x的非线性回归方程为=2.10.4.(2)说法“高度从1 000 cm长到1 001 cm所需时间超过一年”成立.设其幼苗从观察之日起,第m天的高度为1 000 cm,有1 000=2.10.4,解得m≈226 939,第n天的高度为1 001 cm,有1 001=2.10.4,解得n≈227 393,nm=227 393226 939=454天,所以说法“高度从1 000 cm长到1 001 cm所需时间超过一年”成立.创新应用组5.为了增强学生的身体素质,提高适应自然环境、克服困难的能力,某校在课外活动中新增了一项登山活动,并对“学生喜欢登山和性别是否有关”做了一次调查,其中被调查的男女生人数相同,得到如图所示的等高堆积条形统计图,则下列说法中正确的有(填序号).①被调查的学生中喜欢登山的男生人数比喜欢登山的女生人数多②被调查的女生中喜欢登山的人数比不喜欢登山的人数多③若被调查的男女生均为100人,有99%的把握可以认为喜欢登山和性别有关④无论被调查的男女生人数为多少,都可以认为喜欢登山和性别有关答案:①③解析:因为被调查的男女生人数相同,由等高堆积条形统计图可知,喜欢登山的男生占80%,喜欢登山的女生占30%,所以①正确,②错误;设被调查的男女生人数均为n,则由等高堆积条形统计图可得列联表如下:性别男女总计喜欢0.8n0.3n1.1n不喜欢0.2n0.7n0.9n总计n n2n可得χ2=.当n=100时,χ2=>50>6.635,有99%的把握可以判断喜欢登山和性别有关,故③正确; 而χ2=,所以χ2的值与n的取值有关.故④错误.。
2023年高考新教材数学一轮复习课件 第十章 统计与成对数据的统计分析
[解析] 样本量 n=(250+150+400)×30%=240,抽取的户主对四居室满意 的人数为 150×30%×40%=18.
统计图表
考向 1 扇形图、条形图 已知某市某居民小区户主人数和户主对户型结构的满意率分别如图①和
图②所示,为了解该小区户主对户型结构的满意程度,用分层随机抽样的方法抽取 30%的户主进行调查,则样本量和抽取的户主对四居室满意的人数分别为( )
A.240,18
B.200,20
C.240,20
DБайду номын сангаас200,18
8 行第 6 列的数开始,按三位数连续向右读取,最先抽出的 5 名同学的号码是(下
面摘取了此随机数表第 7 行和第 8 行)
()
75331 57245 50688 77047 44767 21763 35025 83921
37859 16955 56719 98105 07175 12867 35807 44395 A.455 068 047 447 176
解析:因为是三种型号的轿车,个体差异明显,所以选择分层随机抽样,故选项 A
正确;因为个体数目多,用抽签法制签难,搅拌不均匀,抽出的样本不具有好的代
表性,故选项
B
不正确;抽样比为1
500+6
57 000+2
000=5300,三种型号的轿车依次
应抽取 9 辆,36 辆,12 辆,故选项 C 正确;分层随机抽样中,每一个个体被抽到 的可能性相同,故选项 D 正确.
第三步:登记频数,计算频率,列出频率分布表.
3.条形图、折线图及扇形图 (1)条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵 轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少 画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表 达和分析数据的统计图称为条形图; (2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长 度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺 次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分 析数据的统计图称为折线图; (3)扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个 扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数 据的统计图称为扇形图.
湘教版高考总复习一轮数学精品课件 第10章统计与成对数据的统计分析 课时规范练73 用样本估计总体
2
.
解析 一个数由 4 改为 2,另一个数由 6 改为 8,故该组数据的平均数不变,设
没有改变的 6 个数分别为 x1,x2,…,x6,
原数据的方差12
据的方差22
12
=
=
2
1
[(2-)
8
=
2
1
[(1 -)
8
2
1
[(
-)
1
8
2
2
2
2
2
+ (2 -) +…+(6 -) + (4-) + (6-) ],新数
s22
63
x3
55
(1)根据样本频率分布直方图估计该校全体学生成绩的众数、平均数、第
71百分位数;
(2)已知所抽取各年级答题成绩的平均数、方差的数据如表,且根据频率分
布直方图估计出总成绩的方差为 140,求高三年级学生成绩的平均数3 和高
二年级学生成绩的方差22 .
1 2 3 4 5 6 7 8 9 10 11 12
=
[(1 +)-(+)]2 +[(2 +)-(+)]2 +…+[( +)-(+)]2
=
(1 -)2 +(2 -)2 +…+( -)2
=s
x,故
C 正确;x 极差=xmax-xmin,y 极差
=(xmax+c)-(xmin+c)=xmax-xmin,故 D 正确.
1 2 3 4 5 6 7 8 9 10 11 12
4.(多选题)(2021·新高考Ⅰ,9)有一组样本数据x1,x2,…,xn,由这组数据得到新
湘教版高考总复习一轮数学精品课件 第10章统计与成对数据的统计分析 课时规范练 成对数据的统计分析
促进药材的生长,发展生态循环农业.下图所示为某农户近7年2017年~2023
年种植药材的平均收入y(单位:千元)与年份代码x的折线图,并计算得到
7
7
=1
=1
∑ yi=480, ∑ xiyi=2 052,
7
∑ (wi-)(yi-)=1 048,
=1
1 2 3 4 5 6 7
7
2
7
7
=1
=1
^
^
^
,回归直线方程 = + x 中 =
=1
解 (1)因为 =
本次调查得出“有不少于 99.5%的把握认为喜爱足球与性别有关”的结论,则
被调查的男性至少有( C )
2
(
-
)
χ2=
,n=a+b+c+d.
(+)(+)(+)(+)
P(χ2≥x0)
x0
A.10人
0.10
2.706
0.05
3.841
B.11人
C.12人
1 2 3 4 5 6 7
0.3
31.3
49.7
根据表及图得到以下判断:①羊只数量与草场植被指数之间为减函数关系;
②若利用这五组数据得到的两变量间的相关系数为r1,去掉第一年数据后
得到的相关系数为r2,则|r1|<|r2|;③可以利用回归直线方程,准确地得到当
羊只数量为2万只时的草场植被指数.其中正确的个数是( B )
A.0
合计
中老年
合计
60
110
200
依据上述数据,能否认为是否喜欢购买智能小家电与年龄有关?
1 2 3 4 5 6 7
湘教版高考数学一轮总复习课后习题 第十章 统计与成对数据的统计分析 课时规范练47
课时规范练47《素养分级练》P324基础巩固组1.(陕西宝鸡二模)北京冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”很受欢迎,现工厂决定从20只“冰墩墩”,15只“雪容融”和10个北京冬奥会会徽中,采用分层抽样的方法,抽取一个容量为n的样本进行质量检测,若“冰墩墩”抽取了4只,则n为( )A.3B.2C.5D.9答案:D解析:n20+15+10=420,解得n=9.2.(江苏南京六校联考)总体由编号为01,02,…,29,30的30个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数字.下面摘取了随机数表中的第1、2行,则选出来的第5个个体的编号为( )7816 1572 0802 6315 0216 4319 9714 01983204 9234 4936 8200 3623 4869 6938 7181A.02B.15C.16D.19答案:D解析:由题意,依次取到的编号为16,15,08,02,19,所以第5个个体的编号为19.3.(广东深圳二模)为调查某大型公益活动期间志愿者的服务时长(单位:小时),对参加过活动的志愿者进行随机抽样调查,将样本中个体的服务时长进行整理,得到如图所示的频率分布直方图.据此估计,7.2万名参加过活动的志愿者中服务时长超过32小时的约有( )A.3.3万人B.3.4万人C.3.8万人D.3.9万人答案:A解析:依题意样本中服务时长超过32小时的个体频率为1-4×(0.005+0.04+0.09)=0.46;可得总体中服务时长超过32小时的个体数为7.2×0.46=3.312≈3.3(万人).4.(山东济南一模)某学校于3月12日组织师生举行植树活动,购买垂柳、银杏、侧柏、海桐四种树苗共计1 200棵,比例如图所示.高一、高二、高三报名参加植树活动的人数分别为600,400,200,若每种树苗均按各年级报名人数的比例进行分配,则高三年级应分得侧柏的数量为( )A.34B.46C.50D.70答案:C解析:由扇形统计图知,购买的1200棵树苗中,侧柏的数量为1200×25%=300,依题意,高一、高二、高三分到的侧柏的棵数比例为600∶400∶200=3∶2∶1,所以高三年级应分得侧柏的数量为1×300=50.3+2+15.(天津南开中学模拟)为承办某项赛事,现面向某市招募1 000名志愿者,按年龄分成5组:第一组[20,25),第二组[25,30),第三组[30,35),第四组[35,40),第五组[40,45],经整理得到如下的频率分布直方图.若采用分层抽样的方法从前三组志愿者中抽出39人负责疏导交通工作,则在第二组中抽出的人数为( )A.6B.9C.12D.18答案:D解析:由直方图可知前三组志愿者的人数之比为3∶6∶4,所以从前三组志愿者中抽出39人负责疏导交通工作,则在第二组中抽出的人数为6×39=18.3+6+46.(多选)(江苏南京二模)我国居民收入与经济同步增长,人民生活水平显著提高.“三农”工作重心从脱贫攻坚转向全面推进乡村振兴,稳步实施乡村建设行动,为实现农村富强目标而努力.—某市城镇居民、农村居民年人均可支配收入比上年增长率如下图所示.根据下面图表,下列说法一定正确的是( )A.该市农村居民年人均可支配收入高于城镇居民B.对于该市居民年人均可支配收入比上年增长率的极差,城镇比农村的大C.对于该市居民年人均可支配收入比上年增长率的中位数,农村比城镇的大D.该市城镇居民、农村居民年人均可支配收入都比有所上升答案:BCD解析:由农村居民的增长率高,得不出收入高,即A错误;由表中数据,可知城镇居民相关数据极差较大,即B正确;由表中数据,可知农村居民相关数据中位数较大,即C正确;由表中数据,可知增长率均为正,即D正确.故选BCD.7.(陕西咸阳高三检测)为了研究人们生活健康情况,某市随机选取年龄在= 15~75岁之间的1 000人进行调查,得到频率分布直方图如图所示,其中ab7,利用分层抽样从年龄在3[15,25),[25,35),[35,45),[45,55),[55,65),[65,75]之间共选取20名市民书写生活健康情况的报告,其中选取年龄在[35,45)范围内的市民的人数为( )A.2B.3C.4D.7 答案:D解析:由频率分布直方图得{ab =7 3,10(b+0.03+a+0.01+0.005+0.005)=1,解得a=0.035,b=0.015,所以年龄在[15,25),[25,35),[35,45),[45,55),[55,65),[65,75]内的人数分别为150,300,350,100,50,50,若共选取20名市民,则利用分层抽样选取的人数分别为3,6,7,2,1,1.8.(内蒙古呼和浩特二模)3月12日是植树节,某地组织青年志愿者进行植树活动,植树的树种及其数量的折线图,如图所示.后期,该地区农业局根据树种采用分层抽样的方法抽取150棵树,请专业人士查看树种的成活情况,则被抽取的梧桐树的棵数为.答案:10=10.解析:被抽取的梧桐树的棵数为150×50200+100+250+150+50综合提升组9.(多选)(山东济南历城第二中学模拟)某保险公司为客户定制了A,B,C,D,E共5个险种,并对5个险种参保客户进行抽样调查,得出如下的统计图:参保人数比例不同年龄段人均参保费用参保险种比例用该样本估计总体,以下四个说法正确的有( )A.57周岁及以上参保人数最少B.18~30周岁人群参保总费用最少C.C险种更受参保人青睐D.31周岁及以上的人群约占参保人群80%答案:ACD解析:由扇形图可知,57周岁及以上参保人数最少,故A正确;由折线图可知,18~30周岁人群人均参保费用最少,但是由扇形图知参保人数并不是最少的,经计算可知参保总费用不是最少,故B错误;由条形图可知,C险种参保比例最高,故C正确;由扇形图可知,31周岁及以上的人群约占参保人群80%,故D正确,故选ACD.10.(多选)(广东佛山模拟)学生的睡眠很重要,教育部《关于进一步加强中小学生睡眠管理工作的通知》中强调“小学生每天睡眠时间应达到10小时,初中生应达到9小时,高中生应达到8小时”.某机构调查了1万名学生的睡眠及学习时长得出下图,则以下判断正确的有( )A.高三年级学生平均学习时间最长B.中小学生的平均睡眠时间都没有达到《通知》中的标准,其中高中生平均睡眠时间最接近标准C.大多数年龄段学生平均睡眠时间长于平均学习时间D.与高中生相比,大学生平均学习时间大幅下降,释放出的时间基本是在睡眠答案:BC解析:根据图象可知,高三年级学生平均学习时间没有高二年级学生平均学习时间长,A选项错误.根据图象可知,中小学生平均睡眠时间都没有达到《通知》中的标准,高中生平均睡眠时间最接近标准,B选项正确.平均.学习时间长于平均睡眠时间的有:初二、初三、高一、高二、高三,占比516平均睡眠时间长于平均学习时间的占比11,C选项正确.分析数据易知D选16项错误.故选BC.创新应用组11.(多选)(山东临沂三模)有以下经济数据,图1为三大产业比重,图2为第三产业中各行业比重.图1图2以下关于这些经济数据的说法正确的有( )A.第一产业的生产总值不超过第三产业中“房地产业”的生产总值B.第一产业的生产总值与第三产业中“租赁和商务服务业”的生产总值基本持平C.若“住宿和餐饮业”生产总值为7 500亿元,则“金融业”生产总值为32 500亿元D.若“金融业”生产总值为45 600亿元,则第二产业生产总值为185 000亿元答案:AD解析:对于A,第一产业的生产总值占6%,第三产业中“房地产业”的生产总值占57%×13%=7.41%,正确;对于B,第一产业的生产总值占6%,第三产业中“租赁和商务服务业”的生产总值占57%×6%=3.42%,错误;对于C,若“住宿和餐饮业”生产总值为7500亿元,则“金融业”生产总×16%=40000亿元,错误;值为75003%对于D,若“金融业”生产总值为45600亿元,则第二产业生产总值为45600×37%=185000亿元,正确.故选AD.57%×16%第11页共11页。
高考数学一轮总复习课时规范练47成对数据的统计分析北师大版
课时规范练47成对数据的统计分析基础巩固组1.对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较,正确的是()A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r32.有一组数据统计了2013年至2020年中国高铁每年的运营里程,它反映了中国高铁近几年的飞速发展,甲同学用一元线性回归模型y=bx+a来拟合,并算得样本相关系数r1=0.70,乙同学用指数函数模型y=c e dx来拟合,并算得转化为线性回归方程所对应的样本相关系数r2=0.99,则()A.一元线性回归模型拟合效果更好B.指数函数模型拟合效果更好C.两种模型拟合效果都不好D.不能确定哪个模型拟合效果更好3.根据如下样本数据:得到的线性回归方程为Y=b ^X+a ^,则( ) A.a ^>0,b ^<0B.a ^>0,b ^>0 C.a ^<0,b ^<0D.a ^<0,b ^>04.(2021山东济南二模)第24届冬季奥林匹克运动会将于2022年在北京举办.为了解某城市居民对冰雪运动的关注情况,随机抽取了该市100人进行调查统计,得到如下2×2列联表.根据列联表可知( )附:χ2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.A.该市女性居民中大约有5%的人关注冰雪运动B.该市男性居民中大约有95%的人关注冰雪运动C.有95%的把握判断认为该市居民是否关注冰雪运动与性别有关D.有99%的把握判断认为该市居民是否关注冰雪运动与性别有关 5.(2021安徽合肥一模)某商场2020年部分月份销售金额如下表:若用最小二乘法求得线性回归方程为Y=38.1X-17.6,则a=()A.198.2B.205C.211D.213.56.给出以下四个说法,其中正确的说法是()A.线性回归方程适用于一切样本和总体B.线性回归方程得到的值影响实际观测值C.在线性回归方程Y=0.2X+12中,当变量X每增加一个单位时,变量Y平均增加0.2个单位D.对分类变量X与Y,若它们的随机变量χ2的取值越小,则判断X与Y有关时的把握越大7.为了解阅读量多少与幸福感强弱之间的关系,一个调查机构根据所得到的数据,绘制了如下的2×2列联表(个别数据暂用字母表示):计算得χ2≈12.981,参照下表:下列选项正确的有( )A.“阅读量多少与幸福感强弱无关”B.m=42C.有99%的把握判断“阅读量多少与幸福感强弱有关”D.n=528.已知变量Y 与X 线性相关,若x =5,y =50,且Y 关于X 的回归直线的斜率为6.5,则Y 关于X 的线性回归方程是 .综合提升组9.某校团委对“学生性别和喜欢某热门软件是否有关”进行了一次调查,其中被调查的女生人数是男生人数的12,男生喜欢该软件的人数占男生人数的16,女生喜欢该软件的人数占女生人数的23.若有95%的把握判断是否喜欢该软件和性别有关,则男生至少有( )A.12人B.6人C.10人D.18人10.(2021湖南衡阳一模)5G 技术的运营不仅提高了网络传输速度,更拓宽了网络资源的服务范围.目前,我国加速了5G 技术的融合与创新,前景美好!某手机商城统计了5个月的5G 手机销量,如表所示:若Y 与X 线性相关,由上表数据求得线性回归方程为Y=44X+10,则下列说法错误的是( )A .5G 手机的销量逐月增加,平均每个月增加约10台B .a=151C .Y 与X 正相关D .预计2021年9月份该手机商城的5G 手机销量约为318部11.某校计划在课外活动中新增攀岩项目,为了解学生喜欢攀岩和性别是否有关,面向学生开展了一次随机调查,其中参加调查的男生、女生人数相同,并绘制如下等高堆积条形图,则( )参考公式: 附:χ2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.A.参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数少B.参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多C.若参与调查的男生、女生人数均为100,则有99%的把握判断学生喜欢攀岩和性别有关D.无论参与调查的男生、女生人数为多少,都有99%的把握判断学生喜欢攀岩和性别有关 12.蟋蟀鸣叫的频率Y (单位:次/分钟)与气温X (单位:℃)存在着较强的线性关系.某地研究人员根据当地的气温和蟋蟀鸣叫的频率得到了如下数据:利用上表中的数据求得线性回归方程为Y=b ^X+a ^,若利用该方程知,当该地的气温为30 ℃时,蟋蟀每分钟鸣叫次数的估计为68,则b ^的值为 .13.某公司为了解某产品的研发费X (单位:万元)对销售量V (单位:百件)的影响,收集了该公司以往的5组数据,发现用模型Y=a e kX(e 为自然对数的底数)拟合比较合适.令Z=ln Y 得到Z=bX+4.06.经计算,X ,Z 对应的数据如表所示:则a e k= .14.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:(1)甲机床、乙机床生产的产品中一级品的频率分别是多少? (2)能否认为甲机床的产品质量与乙机床的产品质量有差异? 附:χ2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P (χ2>k ) 0.10 0.05 0.01k2.706 3.841 6.635创新应用组15.如图是我国2013年至2019年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1—7分别对应年份2013—2019.(1)由折线图看出,可用线性回归模型拟合年生活垃圾无害化处理量Y与年份代码T的关系,请用相关系数加以说明.(2)建立Y关于T的线性回归方程(系数精确到0.01),预测2021年我国生活垃圾无害化处理量.参考数据:∑i=17y i =9.32,∑i=17t i y i =40.17,√∑i=17(y i -y)2=0.55,√7≈2.646.参考公式:相关系数r=∑i=1n(t i -t)(y i -y)√∑i=1n (t i -t)2∑i=1n (y i -y)2,线性回归方程Y=a ^+b ^T 的系数分别为:b ^=∑i=1n(t i -t)(y i -y)∑i=1n (t i-t)2,a ^=y −b ^t .课时规范练47 成对数据的统计分析1.A 解析: 由给出的四组数据的散点图可以看出,r 1,r 3大于0,r 2,r 4小于0, 题图1和题图2的点相对更加集中,所以r 1接近于1,r 2接近于-1, 由此可得r 2<r 4<0<r 3<r 1. 故选A .2.B 解析: 因为样本相关系数的绝对值越接近1拟合效果越好, 由题意得r 2的绝对值更接近1, 所以指数函数模型拟合效果更好. 故选B .3.A 解析: 由图表中的数据可得,变量Y 随着X 的增大而减小,则b ^<0. x =3+4+5+6+7+86=5.5,y =4.0+2.5−0.5+0.5−2.0−3.06=0.25.又线性回归方程为Y=b ^X+a ^,且经过点(5.5,0.25),可得a ^>0, 故选A .4.C 解析: 由2×2列联表中的数据可得χ2=(35×25-15×25)2×10060×40×50×50≈4.167>3.841,有95%的把握判断该市居民是否关注冰雪运动与性别有关. 故选C .5.B 解析: 由表格数据知x =2+4+6+8+105=6,y =64+132+a+286+3685=850+a 5,则850+a 5=38.1×6-17.6,解得a=205.故选B .6.C 解析: 样本或总体具有线性关系时,才可求线性回归方程,而且由线性回归方程得到的函数值是近似值,而非精确值,因此线性回归方程有一定的局限性,所以A ,B 错误;在线性回归方程Y=0.2X+12中,当变量X 每增加一个单位时,变量Y 平均增加0.2个单位,故C 正确;对分类变量X 与Y ,它们的随机变量χ2的取值越小,判断X 与Y 有关时的把握越大,故D 错误.故选C .7.C 解析: ∵χ2≈12.981, 又12.981>6.635,∴有99%的把握判断“阅读量多少与幸福感强弱有关”, 故A 错误,C 正确; ∵m+36=90,18+n=60, ∴m=54,n=42, 故B ,D 错误, 故选C .8.Y=6.5X+17.5 解析: 设Y 关于X 的线性回归方程为Y=b ^X+a ^, ∵x =5,y =50,Y 关于X 的回归直线的斜率为6.5, ∴a ^=50-6.5×5=17.5.∴Y 关于X 的线性回归方程为Y=6.5X+17.5.9.A 解析: 设男生人数为x ,则女生人数为x2,则列联表如下:若有95%的把握判断是否喜欢该软件和性别有关,则χ2>3.841, 即χ2=3x 2(x 6·x 6-5x 6·x 3)2x ·x 2·x 2·x=3x8>3.841,解得x>10.2426·.又因为x 2,x 3,x 6,5x6为整数,所以男生至少有12人. 故选A .10.A 解析: 线性回归方程为Y=44X+10,5G 手机的销量逐月增加,平均每个月增加约44台,故A 不正确;根据表中数据,可得x =1+2+3+4+55=3,∴y =44×3+10=142.于是,52+95+a+185+227=142×5=710,即a=151,故B 正确;由线性回归方程中X 的系数大于0,可知Y 与X 正相关,且相关系数r>0,故C 正确; 9月份时,X=7,Y=44×7+10=318(部),故D 正确.11.C 解析: 由题意设参加调查的男生、女生人数均为m ,则所以参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多,参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数少,故A ,B 错误;计算得 χ2=2m(0.56m 2-0.06m 2)21.1m ·0.9m ·m ·m=50m 99, 当m=100时,χ2=50m99=50×10099≈50.505>6.635,所以若参与调查的男生、女生人数均为100,有99%的把握判断学生喜欢攀岩和性别有关,故C 正确,D 错误.故选C .12.5 解析: 由题得x =17(21+22+23+24+25+26+27)=24,y =17(24+28+31+39+43+47+54)=38,所以38=24b ^+a ^.① 又68=30b ^+a ^,② 联立①②得b ^=5.13.e 4.18 解析: x =5+8+12+15+205=12,z =4.5+5.2+5.5+5.8+6.55=5.5, 所以5.5=b ^×12+4.06,解得b ^=0.12,所以Z=0.12X+4.06.所以Y=e0.12X+4.06=e 4.06·e 0.12X , 所以a e k =e 4.06·e 0.12=e 4.18.14.解(1)由表格数据得甲机床生产的产品中一级品的频率为150200=75%;乙机床生产的产品中一级品的频率为120200=60%.(2)χ2=400(150×80−120×50)2270×130×200×200=40039>10>6.635.所以有99%的把握判断甲机床的产品与乙机床的产品质量有差异. 15.解(1)由折线图看出,Y 与T 具有很强的正相关性.理由如下: r=∑i=17(t i -t)(y i -y)√∑i=1(t i -t)2∑i=1(y i -y)2=∑i=17t i y i -7ty √∑i=1(t i -t)2∑i=1(y i -y)2≈2√7×0.55≈ 2.892.9106≈0.99, 样本相关系数r ≈0.99,故Y 与T 具有很强的正相关性.(2)b ^=∑i=17(t i -t)(y i -y)∑i=17(t i -t)2=∑i=17t iyi -7ty∑i=17t i2-7t 2≈2.8928≈0.10,a ^=y −b ^t ≈1.33-0.10×4=0.93,∴Y 关于T 的线性回归方程为Y=0.10T+0.93,由最小二乘法得出的线性回归方程可得0.10×9+0.93=1.83, 故预测2021年我国生活垃圾无害化处理量为1.83亿吨.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课时规范练48
基础巩固组
1.(2023·重庆八中高三开学考试)某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了部分党员,对他们一周的党史学习时间进行了统计,统计数据如下表所示:
党史学习时间/小时7 8 9 10 11
党员人数 6 10 9 7 8
则该单位党员一周学习党史时间的众数及50%分位数分别是()
A.8,8.5
B.8,8
C.9,8
D.8,9
答案:D
解析:党员人数一共有6+10+9+7+8=40,学习党史时间为8小时的人数最多,故学习党史时间的众数为8,40×50%=20,那么第50百分位数是第20和21个数的平均数,第20,21个数分别为9,9,所以
第50百分位数是=9.
2.(多选)(2023·江苏苏州模拟)近日,2022年中国最具幸福感城市调查推选活动正式启动,在100个地级及以上候选城市名单中,某市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.现随机抽取20位该市居民,他们的幸福感指数见下表,则有关这组幸福感指数,下列说法正确的有()
居民编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 幸福感指数 3 4 4 5 6 6 6 7 7 7 7 8 8 8 8 8 9 9 10 10
.6
D.这组数据的80%分位数是8
答案:AC
解析:对于A,平均数为×(3+4×2+5+6×3+7×4+8×5+9×2+10×2)=7,所以A正确;
对于B,标准差为
=,所以B错误;
对于C,因为8出现的次数最多,所以这组数据的众数为8,所以C正确;
对于D,因为20×0.8=16,所以这组数据的80%分位数是=8.5,所以D错误.故选AC.
3.(2022·全国甲,文2)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图,则()
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
答案:B
解析:对于A,中位数为(70%+75%)÷2=72.5%>70%,A错误;
对于B,平均数为89.5%>85%,B正确;
对于C,从图中可以看出,讲座前问卷答题的正确率的波动幅度要大于讲座后问卷答题的正确率的波动幅度,故C错误;
对于D,讲座后问卷答题的正确率的极差为20%,讲座前问卷答题的正确率的极差为35%,D错误.故选B.
4. (多选)(2022·山东潍坊一模)某市共青团委统计了甲、乙两名同学最近十期“青年大学习”答题得分情况,整理成如图所示的茎叶图.则下列说法中正确的是()
A.甲得分的30%分位数是31
答案:BCD
解析:对于A,甲得分从小到大排列为27,28,31,39,42,45,55,55,58,66,而10×30%=3,所以甲得分的30%分位数是35,A不正确;
对于B,乙的得分中有两个48,其余分数值均只有一个,因此,乙得分的众数是48,B正确;
对于C,甲得分的中位数是43.5,乙得分的中位数是45,C正确;
对于D,甲得分的极差、乙得分的极差都是39,D正确.故选BCD.
5.(多选)(2022·河北唐山一模)有一组互不相等的数组成的样本数据x1,x2,…,x9,其平均数为
a(a≠x i,i=1,2,…,9),若插入一个数a,得到一组新的数据,则()
答案:AD
解析:由已知可得x1+x2+…+x9=9a.
对于A选项,新数据的平均数为(9a+a)=a,与原数据的平均数相等,A正确;
对于B选项,不妨设x1<x2<…<x9,则原数据的中位数为x5,若a<x5,则中位数为(max{a,x4}+x5)<x5, 若a>x5,则中位数为(x5+min{a,x6})>x5,B错误;
对于C选项,新数据的方差为s'2=[(x1-a)2+(x2-a)2+…(x9-a)2+(a-a)2]<[(x1-a)2+(x2-a)2+…+(x9-a)2]=s2,C错误;
对于D选项,不妨设x1<x2<…<x9,则x1<a<x9,故新数据的极差仍为x9-x1,D正确.故选AD.
6.(2022·山东济南二模)2022年4月24日是第七个“中国航天日”,今年的主题是“航天点亮梦想”.某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的25%分位数保持不变,则整数m(1≤m≤10)的值可以是(写出一个满足条件的m值即可).
答案:7或8或9或10(填4个数中任意一个均可)
解析: 7,6,8,9,8,7,10,m,若去掉m,该组数据从小到大排列为6,7,7,8,8,9,10,则7×0.25=1.75,故25%分位数为第二个数即7,所以7,6,8,9,8,7,10,m,25%分位数为7,而8×0.25=2,所以7为第二个数与第三个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10.
7.(2023·山东师范大学附中模拟)现有10个数,其平均数是4,且这10个数的平方和是300,那么这组数的标准差是.
答案:
解析:设这10个数为x i,i=1,2,3,…,10,则=4,则由题可得(x1+x2+…+x10)=4,所以
x1+x2+…+x10=40,+…+=300,则这组数的标准差是s=
=
.
综合提升组
8.(多选)(2023·江苏南通模拟)一组样本数据x1,x2,…,x n的平均数为≠0),标准差为s.另一组样本数据x n+1,x n+2,…,x2n的平均数为3,标准差为s.两组数据合成一组新数据
x1,x2,…,x n,x n+1,…,x2n,新数据的平均数为,标准差为s',则()
A.>2
B.=2
C.s'>s
D.s'=s
答案:BC
解析:由题意=2,故B正确.
ns2=(x1-)2+(x2-)2+…+(x n-)2=-n,
同理ns2=-n·(3)2=-9n.
两式相加得2ns2=-10n,2ns'2=-2n·(2)2=-8n,所以2ns'2>2ns2,s'>s,故C正
确.
9.(2023·山东临沂模拟)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.
已知落在[50,60)的平均成绩是54,方差是7,落在[60,70)的平均成绩为66,方差是4,则两组成绩的总平均数和总方差s2分别为多少.
解:因为所有小矩形的面积之和为1,
所以(0.005+0.010+0.020+a+0.025+0.010)×10=1,所以a=0.030.
成绩在[50,60)的市民人数为100×0.1=10,成绩在[60,70)的市民人数为100×0.2=20,故
=62.
设成绩在[50,60)中10人的分数分别为x1,x2,x3, (x10)
成绩在[60,70)中20人的分数分别为y1,y2,y3,…,y20,则由题意可得-
542=7,-662=4,所以+…+=29230,+…+=87200,所以
s2=+…++…+)-(29230+87200)-622=37,所以两组市民成绩的总
平均数是62,总方差是37.
创新应用组
10.(多选)(2023·福建莆田模拟)已知一组数据x1,x2,…,x11是公差不为0的等差数列,若去掉数据x6,则()
答案:AC
解析:对于选项A,原数据的中位数为x6,去掉x6后的中位数为(x5+x7)=x6,即中位数没变,故选项A 正确;
对于选项B,原数据的平均数为(x1+x2+…+x11)==x6,去掉x6后的平均数为
'=(x1+x2+…+x5+x7+x8+…+x11)=x6=,即平均数不变,故选项B错误;
对于选项C,则原数据的方差为s2=[(x1-x6)2+(x2-x6)2+…+(x11-x6)2],去掉x6后的方差为s'2=[(x1-x6)2+(x2-x6)2+…+(x5-x6)2+(x7-x6)2+…+(x11-x6)2],故s2<s'2,即方差变大,故选项C正确,选项D错误.故选AC.。