2018年高考理科数学通用版三维二轮专题复习专题检测:(七) 统计与统计案例 Word版含解析

合集下载

2018年高考数学(理)二轮复习 讲学案:考前专题七 概率与统计 第3讲 统计与统计案例(含答案解析)

2018年高考数学(理)二轮复习 讲学案:考前专题七 概率与统计 第3讲 统计与统计案例(含答案解析)

第3讲统计与统计案例1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等.2.在概率与统计的交汇处命题,以解答题中档难度出现.热点一抽样方法1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体数较少.2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.例1 (1)(2017届日照三模)从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为5的一个样本,若编号为42的产品在样本中,则该样本中产品的最小编号为________.答案10解析样本间隔为80÷5=16,∵42=16×2+10,∴该样本中产品的最小编号为10.(2)某高级中学高一、高二、高三年级的学生人数分别为600,700,700,为了解不同年级学生的眼睛近视情况,现用分层抽样的方法抽取了容量为100的样本,则高三年级应抽取的学生人数为________.答案35解析由题意结合抽样比可得,高三年级应抽取的学生人数为100×700600+700+700=35.思维升华(1)随机抽样的各种方法中,每个个体被抽到的概率都是相等的.(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同.(3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.跟踪演练1 (1)(2017·葫芦岛协作体模拟)福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个二位号码中选取,小明利用如图所示的随机数表选取红色球的6个号码,选取方法是从第1行、第9列和第10列的数字开始从左到右依次选取两个数字,则第四个被选中的红色球号码为( )A.12 B.33C.06 D.16答案 C解析 被选中的红色球号码依次为17,12,33,06,所以第四个被选中的红色球号码为06,故选C.(2)(2017届江西重点中学协作体联考)高三某班有学生36人,现将所有同学随机编号,用系统抽样的方法,抽取一个容量为4的样本,已知5号、23号、32号学生在样本中,则样本中还有一个学生的编号为( ) A .13 B .14 C .18 D .26答案 B解析 ∵高三某班有学生36人,用系统抽样的方法,抽取一个容量为4的样本, ∴样本组距为36÷4=9,则5+9=14, 即样本中还有一个学生的编号为14,故选B. 热点二 用样本估计总体1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距.2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.例2 (1)(2017·湖南衡阳联考)一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为( ) A .-11 B .3 C .9 D .17 答案 C解析 设没记清的数为x ,若x ≤2,则这列数为x,2,2,2,4,5,10,平均数为25+x7,中位数为2,众数为2,所以2×2=25+x 7+2,得x =-11;若2<x ≤4,则这列数为2,2,2,x,4,5,10,则平均数为25+x7,中位数为x ,众数为2,所以2x =25+x 7+2,得x =3;若x ≥5,则这列数为 2,2,2,4,5,x,10或2,2,2,4,5,10,x ,则平均数为25+x 7,中位数为4,众数为2,所以2×4=25+x7+2,得x =17,所以-11+3+17=9.(2)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图可知,这200名学生中每周的自习时间不足22.5小时的人数是________.答案45解析阅读频率分布直方图可得,这200名学生中每周的自习时间不足22.5小时的人数是200×(0.02+0.07)×2.5=45.思维升华(1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的平均数、众数、中位数和方差等.(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.跟踪演练2 (1)(2017届江西南昌二模)某人到甲、乙两市各7个小区调查空置房情况,调查得到的小区空置房的套数绘成了如图所示的茎叶图,则调查中甲市空置房套数的中位数与乙市空置房套数的中位数之差为( )A.4 B.3C.2 D.1答案 B解析由茎叶图可以看出甲、乙两市的空置房的套数的中位数分别是79,76,因此其差是79-76=3,故选B. (2)学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人,则n的值为( )A.300 B.200C.150 D.100答案 D解析根据频率分布直方图的面积和为1,可得[50,60)的频率为P=1-10×(0.01+0.024+0.036)=0.3,又由P =30n=0.3,解得n =100.故选D.热点三 统计案例 1.线性回归方程方程y ^=b ^x +a ^称为线性回归方程,其中b ^=∑ni =1x i y i -n x y∑n i =1x 2i -n x2,a ^=y -b ^x ,(x ,y )称为样本点的中心.2.随机变量K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .例3 (1)(2017届山西太原三模)已知某产品的广告费用x (单位:万元)与销售额y (单位:万元)具有线性相关关系,其统计数据如下表:附:b ^=∑ni =1(x i -x )(y i -y )∑ni =1(x i -x )2=∑ni =1x i y i -n x y∑n i =1x 2i -n x2,a ^=y -b ^x .由上表可得线性回归方程y ^=b ^x +a ^,据此模型预测广告费用为8万元时的销售额是( ) A .59.5万元 B .52.5万元 C .56万元 D .63.5万元答案 A解析 由题意可得x =3+4+5+64=92, y =25+30+40+454=35,则b ^=∑4i =1x i y i -4x y ∑4i =1x 2i -4 x 2=665-4×92×3586-4×⎝ ⎛⎭⎪⎫922=7,a ^=y -b ^x =3.5,所以线性回归方程为y ^=7x +3.5,据此模型预报广告费用为8万元时的销售额是y =7×8+3.5=59.5(万元).故选A.(2)(2017·四川成都九校联考)某学校为了解该校学生对于某项运动的爱好是否与性别有关,通过随机抽查110名学生,得到如下2×2的列联表:由公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),得K 2≈7.82.附表:参照附表,以下结论正确是( )A .有99.5%以上的把握认为“爱好该项运动与性别有关”B .有99.5%以上的把握认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关” 答案 C解析 由题意知本题所给的观测值K 2≈7.82>6.635,∴这个结论有0.01的机会出错,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.思维升华 (1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值;回归直线过样本点的中心(x ,y ),应引起关注.(2)独立性检验问题,要确定2×2列联表中的对应数据,然后代入公式求解K 2即可.跟踪演练3 (1)(2017届德州二模)某产品的广告费用x (万元)与销售额y (万元)的统计数据如表:根据上表可得线性回归方程y ^=9.4x +a ^,据此模型预测,广告费用为6万元时的销售额为( ) A .65.5万元 B .66.6万元 C .67.7万元 D .72万元答案 A解析 x =2+3+4+54=3.5,y =26+39+49+544=42,代入线性回归方程,得42=9.4×3.5+a ^,解得a ^=9.1,所以线性回归方程为y ^=9.4x +9.1, 当x =6时,y =65.5,故选A.(2)(2017·广东湛江二模)某同学利用课余时间做了一次社交软件使用习惯调查,得到2×2列联表如下:附表:则下列结论正确的是( )A .在犯错的概率不超过0.005的前提下认为社交软件使用习惯与年龄有关B .在犯错的概率超过0.005的前提下认为社交软件使用习惯与年龄有关C .在犯错的概率不超过0.001的前提下认为社交软件使用习惯与年龄有关D .在犯错的概率超过0.001的前提下认为社交软件使用习惯与年龄有关 答案 A解析 K 2=30×(4×2-16×8)220×10×12×18=10,由于7.879<10<10.828,可以认为在犯错的概率不超过0.005的前提下认为社交软件使用习惯与年龄有关,故选A.真题体验1.(2017·山东改编)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为__________. 答案 3,5解析 甲组数据的中位数为65,由甲、乙两组数据的中位数相等得y =5.又甲、乙两组数据的平均值相等, ∴15×(56+65+62+74+70+x )=15×(59+61+67+65+78),∴x =3. 2.(2017·山东改编)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其线性回归方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为________.答案 166解析 ∵∑10i =1x i =225,∴x =110∑10i =1x i =22.5. ∵∑10i =1y i =1 600,∴y =110∑10i =1y i =160. 又b ^=4,∴a ^=y -b ^x =160-4×22.5=70.∴线性回归方程为y ^=4x +70.将x =24代入上式,得y ^=4×24+70=166.3.(2016·全国Ⅲ改编)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下列叙述不正确的是________.①各月的平均最低气温都在0 ℃以上; ②七月的平均温差比一月的平均温差大; ③三月和十一月的平均最高气温基本相同; ④平均最高气温高于20 ℃的月份有5个. 答案 ④解析 由题意知,平均最高气温高于20 ℃的有七月,八月,故④不正确.4.(2017·江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件. 答案 18解析 ∵样本容量总体个数=60200+400+300+100=350.∴应从丙种型号的产品中抽取350×300=18(件).押题预测1.某公司为了解用户对其产品的满意度,从甲、乙两地分别随机调查了10个用户,将满意度的分数绘成茎叶图如图所示.设甲、乙两地的满意度分数的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲>x 乙,m 甲>m 乙C.x 甲>x 乙,m 甲<m 乙D.x 甲<x 乙,m 甲<m 乙押题依据 从茎叶图中提取数字的特征(如平均数、众数、中位数等)是高考命题的热点题型. 答案 B解析 甲地用户的平均满意度分数为x 甲=53+62+64+73+74+76+81+85+92+9510=75.5,乙地用户的平均满意度分数为x 乙=51+56+62+64+73+73+81+82+83+9110=71.6,所以x 甲>x 乙.中位数分别为m 甲=74+762=75,m 乙=73+732=73,所以m 甲>m 乙. 故选B.2.某校为了解高三学生寒假期间的学习情况,抽查了100名学生,统计他们每天的平均学习时间,绘成的频率分布直方图如图所示,则这100名学生中学习时间在6至10小时之间的人数为________.押题依据 频率分布直方图多以现实生活中的实际问题为背景,对图形的理解应用可以考查考生的基本分析能力,是高考的热点. 答案 58解析 由图知,(0.04+0.12+x +0.14+0.05)×2=1,解得x =0.15,所以学习时间在6至10小时之间的频率是(0.15+0.14)×2=0.58, 所求人数为100×0.58=58.3.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x 的线性回归方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少小时?(注:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b ^x )押题依据 线性回归分析在生活中具有很强的应用价值,是高考的一个重要考点. 解 (1)散点图如图.(2)由表中数据得∑i =14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,∴b ^ =52.5-4×3.5×3.554-4×3.52=0.7, a ^=3.5-0.7×3.5=1.05,∴y ^=0.7x +1.05,回归直线如图所示.(3)将x =10代入线性回归方程,得y ^=0.7×10+1.05=8.05,故预测加工10个零件约需要8.05小时.A 组 专题通关1.(2017·山西实验中学模拟)一个学校高一、高二、高三的学生人数之比为2∶3∶5,若用分层抽样法抽取容量为200的样本,则应从高三学生中抽取的人数是( ) A .40 B .60 C .80 D .100答案 D解析 由分层抽样的概念可得,应从高三学生中抽取的人数是200×52+3+5=100.故选D.2.(2017届广东省东莞市二模)已知某学校有1 680名学生,现在采用系统抽样的方法抽取84人,调查他们对学校食堂的满意程度,将1 680人按1,2,3,…,1 680随机编号,则在抽取的84人中,编号落在[61,160]内的人数为( ) A .7 B .5 C .3 D .4 答案 B解析 (160-60)×841 680=5,故选B.3.(2017·北京丰台区二模)某校高一1班、2班分别有10人和8人骑自行车上学,他们每天骑行路程(单位:千米)的茎叶图如图所示:则1班10人每天骑行路程的极差和2班8人每天骑行路程的中位数分别是( ) A .14,9.5 B .9,9 C .9,10 D .14,9答案 A解析 2班共有8个数据,中间两个数是9和10,因此中位数为9.5,只有A 符合,故选A(1班10个数据最大为22,最小为8,极差为14).4.(2017·福建泉州质检)2017年4月,泉州有四处湿地被列入福建省首批重要湿地名录,某同学决定从其中A ,B 两地选择一处进行实地考察,因此,他通过网站了解上周去过这两个地方的人对它们的综合评分,并将评分数据记录为下图的茎叶图,记A ,B 两地综合评分数据的平均数分别为A ,B ,方差分别为s 2A ,s 2B ,若已备受好评为依据,则下述判断较合理的是( ) A .因为A >B ,s 2A >s 2B ,所以应该去A 地 B .因为A >B ,s 2A <s 2B ,所以应该去A 地C .因为A <B ,s 2A >s 2B ,所以应该去B 地 D .因为A <B ,s 2A <s 2B ,所以应该去B 地 答案 B解析 计算可得A =8623>85=B ,s 2A <s 2B (A 数据集中,B 数据分散),所以A 地好评分高,且评价稳定,故选B.5.(2017届江西上饶二模)下面四个命题中,为真命题的是( )①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③判断两个分类变量X 与Y 的相关性:若K 2越小,则说明“X 与Y 有关系”的把握程度越大; ④随机变量X ~N (0,1),则P (|X |<1)=2P (X <1)-1. A .①④ B .②④ C .①③ D .②③答案 A解析 ②错误,因为相关系数可以接近-1;③错误,K 2越大,有关系的把握越大.故选A.6.(2017届湖南长郡中学、衡阳八中等十三校联考)某校高三文科班150名男生在“学生体质健康50米跑”单项测试中,成绩全部介于6秒与11秒之间.现将测试结果分成五组:第一组[6,7];第二组(7,8],…,第五组(10,11].下图是按上述分组方法得到的频率分布直方图.按国家标准,高三男生50米跑成绩小于或等于7秒认定为优秀,若已知第四组共48人,则该校文科班男生在这次测试中成绩优秀的人数是________.答案 9解析 由题设中提供的频率分布直方图可以看出,这次测试中成绩优秀的人数的频率P =1-⎝⎛⎭⎪⎫0.38+0.16+0.08+48150×1=0.06,故这次测试中成绩优秀的人数为0.06×150=9. 7.(2017届四川广志联考)某同学使用计算器求30个数据的平均数时,错将其中的一个数据105输为15,那么由此求出的平均数与实际平均数的差是________. 答案 -3解析 若将该数看做15,其他数据不变,其和记为M ,则其平均数为P 1=M +1530;若将该数看做105,其他数据不变,其和仍为M ,则其平均数为P 2=M +10530,则两次算得的平均数之差P 1-P 2=M +15-M -10530=-3.8.(2017·江西百校联盟联考)某设备的使用年数x 与所支出的维修总费用y 的统计数据如下表:根据上表可得线性回归方程为y ^=1.4x +a ^.若该设备维修总费用超过12万元就报废,据此模型预测该设备最多可使用________年. 答案 8解析 因为x =2+3+4+5+65=4,y =1.5+4.5+5.5+6.5+7.55=5.1,故代入线性回归方程可得a ^=5.1-1.4×4=-0.5,所以线性回归方程为y ^=1.4x -0.5, 当y =12时,解得x ≈8.9.9.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是________.表1表2表3表4答案 阅读量解析 根据数据求出K 2的值,再进一步比较大小.表1中,a =6,b =14,c =10,d =22,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(6×22-14×10)220×32×16×36=131 440.表2中,a =4,b =16,c =12,d =20,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(4×20-16×12)220×32×16×36=637360.表3中,a =8,b =12,c =8,d =24,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(8×24-12×8)220×32×16×36=1310.表4中,a =14,b =6,c =2,d =30,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(14×30-6×2)220×32×16×36=3 757160.∵131 440<1310<637360<3 757160, ∴与性别有关联的可能性最大的变量是阅读量.10.(2017·全国Ⅱ)淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率直方图如下:(1)设两种养殖方法的箱产量相互独立,记A 表示事件“旧养殖法的箱产量低于50 kg ,新养殖法的箱产量不低于50 kg”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)记B 表示事件“旧养殖法的箱产量低于50 kg”,C 表示事件“新养殖法的箱产量不低于50 kg”. 由题意知,P (A )=P (BC )=P (B )P (C ).旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P (B )的估计值为0.62.新养殖法的箱产量不低于50 kg 的频率为 (0.068+0.046+0.010+0.008)×5=0.66, 故P (C )的估计值为0.66.因此事件A 的概率估计值为0.62×0.66=0.409 2. (2)根据箱产量的频率分布直方图得列联表K 2=200×(62×66-34×38)2100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5, 故新养殖法箱产量的中位数的估计值为 50+0.5-0.340.068≈52.35(kg).B 组 能力提高11.某公司有30名男职员和20名女职员,公司进行了一次全员参与的职业能力测试,现随机询问了该公司5名男职员和5名女职员在测试中的成绩(满分为30分),可知这5名男职员的测试成绩分别为16,24,18,22,20,5名女职员的测试成绩分别为18,23,23,18,23,则下列说法一定正确的是( ) A .这种抽样方法是分层抽样 B .这种抽样方法是系统抽样C .这5名男职员的测试成绩的方差大于这5名女职员的测试成绩的方差D .该测试中公司男职员的测试成绩的平均数小于女职员的测试成绩的平均数 答案 C解析 根据抽样方法的特点,可知这种抽样既不是分层抽样,也不是系统抽样,故A ,B 是错误的;由这5名男职员和5名女职员的测试成绩得不出该公司男职员和女职员的测试成绩的平均数,故D 是错误的;根据公式,可以求得这5名男职员的测试成绩的方差为s 21=8,5名女职员的测试成绩的方差为s 22=6,所以C 正确.故选C.12.(2017届四川大教育联盟三诊)某青少年成长关爱机构为了调研所在地区青少年的年龄与身高状况,随机抽取6岁,9岁,12岁,15岁,18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出如图所示的散点图和回归直线l .根据图中数据,下列对该样本描述错误的是( )A .据样本数据估计,该地区青少年身高与年龄成正相关B .所抽取数据中,5 000名青少年平均身高约为145 cmC .直线l 的斜率的值近似等于样本中青少年平均身高每年的增量D .从这5种年龄的青少年中各取一人的身高数据,由这5人的平均年龄和平均身高数据作出的点一定在直线l 上 答案 D解析 在给定范围内,随着年龄增加,年龄越大身高越高,故该地区青少年身高与年龄成正相关,故A 正确;用样本数据估计总体可得平均数大约是145 cm ,故B 正确;根据直线斜率的意义可知斜率的值近似等于样本中青少年平均身高每年的增量,故C 正确;各取一人具有随机性,根据数据做出的点只能在直线附近,不一定在直线上,故D 错误.13.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的实验数据,计算得线性回归方程为y ^=0.85x -0.25.由以上信息,可得表中c 的值为________.答案 6解析 x =3+4+5+6+75=5,y =2.5+3+4+4.5+c 5=14+c 5,代入线性回归方程,得14+c5=0.85×5-0.25,解得c =6.14.(2017届广东潮州二模)当今,手机已经成为人们不可或缺的交流工具,人们常常把喜欢玩手机的人冠上了名号“低头族”,手机已经严重影响了人们的生活.一媒体为调查市民对低头族的认识,从某社区的500名市民中随机抽取n 名市民,按年龄情况进行统计的频率分布表和频率分布直方图如图:(1)求出表中a ,b ,n 的值,并补全频率分布直方图;(2)媒体记者为了做好调查工作,决定从所随机抽取的市民中按年龄采用分层抽样的方法抽取20名接受采访,再从抽出的这20名中年龄在[30,40)的选取2名担任主要发言人.记这2名主要发言人年龄在[35,40)的人数为ξ,求ξ的分布列及期望.解 (1)由题意及频率分布表可知,n =5÷0.05=100, 所以a =100×0.35=35,b =30100=0.3.补全频率分布直方图,如图所示.(2)设抽出的20名受访者年龄在[30,35)和[35,40)的分别有m ,n 名,由分层抽样可得20100=m 35=n30,解得m =7,n =6.所以年龄在[30,40)的共有13名. 故ξ的可能取值为0,1,2,P (ξ=0)=C 06C 27C 213=726,P (ξ=1)=C 16C 17C 213=713,P (ξ=2)=C 26C 07C 213=526.ξ的分布列为∴E (ξ)=0×726+1×713+2×526=1213.。

2018年高考理科数学通用版三维二轮专题复习专题检测(七) 统计与统计案例 Word版含解析

2018年高考理科数学通用版三维二轮专题复习专题检测(七) 统计与统计案例 Word版含解析

专题检测(七)统计与统计案例一、选择题.(届高三·西安八校联考)某班对八校联考成绩进行分析,利用随机数法抽取样本时,先将个同学按,,…,进行编号,然后从随机数表第行第列的数开始向右读,则选出的第个个体是( ) (注:下表为随机数表的第行和第行)....解析:选依题意得,依次选出的个体分别是,…因此选出的第个个体是..(·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中点表示十月的平均最高气温约为℃,点表示四月的平均最低气温约为℃.下面叙述不正确的是( ).各月的平均最低气温都在℃以上.七月的平均温差比一月的平均温差大.三月和十一月的平均最高气温基本相同.平均最高气温高于℃的月份有个解析:选由图形可得各月的平均最低气温都在℃以上,正确;七月的平均温差约为℃,而一月的平均温差约为℃,故正确;三月和十一月的平均最高气温都在℃左右,基本相同,正确;故错误..为了了解高一、高二、高三学生的身体状况,现用分层抽样的方法抽取一个容量为的样本,三个年级学生人数之比依次为∶∶,已知高一年级共抽取了人,则高三年级抽取的人数为( )....解析:选因为高一年级抽取学生的比例为)=,所以=,解得=,故高三年级抽取的人数为×=..某同学为了解自己记忆成语的个数与所花费的时间(单位:秒)的关系,做了次试验,收集到的数据如表所示,由最小二乘法求得的回归直线方程为=+.则+的值为( )....解析:选由表中数据得,=,=(++++)=(++),将=,=(++)代入回归直线方程,得+=..(·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[)的为一等品,在区间[)和[)的为二等品,其余均为三等品,则该样本中三等品的件数为( )....解析:选根据题中的频率分布直方图可知,三等品的频率为-( ++)×=,因此该样本中三等品的件数为×=..为比较甲、乙两地某月时的气温情况,随机选取该月中的天,将这天中时的气温数据(单位:℃)制成如图所示的茎叶图,考虑以下结论:①甲地该月时的平均气温低于乙地该月时的平均气温②甲地该月时的平均气温高于乙地该月时的平均气温③甲地该月时的气温的标准差小于乙地该月时的气温的标准差④甲地该月时的气温的标准差大于乙地该月时的气温的标准差。

2018届高考理科数学二轮复习《概率与统计》检测试卷及答案解析

2018届高考理科数学二轮复习《概率与统计》检测试卷及答案解析

课时跟踪检测(二十)概率与统计1.(2017·广州二测)某种商品价格与该商品日需求量之间的几组对照数据如下表:价格x (元/kg)1015202530日需求量y (kg)1110865(1)求y 关于x 的线性回归方程;(2)利用(1)中的回归方程,当价格x =40元/kg 时,日需求量y 的预测值为多少?参考公式:线性回归方程y ^=b ^x +a ^,其中b ^=错误!,a ^=y -b ^x .2.(2018届高三·广西五校联考)下图是某市11月1日至14日的空气质量指数趋势图,空气质量指数(AQI)小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择11月1日至11月12日中的某一天到达该市,并停留3天.(1)求此人到达当日空气重度污染的概率;(2)设X 是此人停留期间空气重度污染的天数,求X 的分布列与数学期望.随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N (μ,σ2).(1)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P (X ≥1)及X 的数学期望;(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①试说明上述监控生产过程方法的合理性;②下面是检验员在一天内抽取的16个零件的尺寸:9.9510.129.969.9610.019.929.9810.0410.269.9110.1310.029.2210.0410.059.95经计算得x =116错误!i =9.97,s =错误!=错误!≈0.212,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)用样本平均数x 作为μ的估计值μ^,用样本标准差s 作为σ的估计值σ^,利用估计值判断是否需对当天的生产过程进行检查?剔除(μ^-3σ^,μ^+3σ^)之外的数据,用剩下的数据估计μ和σ(精确到0.01).性别有关,现从该市高三理科生中随机抽取50名学生进行调查,得到如下2×2列联表:(单位:人)报考“经济类”不报考“经济类”总计男62430女14620总计203050(1)据此样本,判断能否在犯错误的概率不超过0.001的前提下认为理科生报考“经济类”专业与性别有关?(2)若以样本中各事件的频率作为概率估计全市总体考生的报考情况,现从该市的全体考生(人数众多)中随机抽取3人,设3人中报考“经济类”专业的人数为随机变量X,求随机变量X的概率分布列及数学期望.附:P(K2≥k0)0.10.050.010.001k0 2.706 3.841 6.63510.828K2=n(ad-bc)2,其中n=a+b+c+d.(a+b)(c+d)(a+c)(b+d)天的日营业额y (单位:万元)与该地当日最低气温x (单位:℃)的数据,如下表:x 258911y1.210.80.80.7(1)求y 关于x 的线性回归方程y ^=b ^x +a ^;(2)判断y 与x 之间是正相关还是负相关,若该地1月份某天的最低气温为6℃,用所求回归方程预测该店当日的营业额;(3)设该地1月份的日最低气温X ~N (μ,σ2),其中μ近似为样本平均数x ,σ2近似为样本方差s 2,求P (3.8<X ≤13.4).附:①回归方程y ^=b ^x +a ^中,b ^=错误!,a ^=y -b ^x .②10≈3.2, 3.2≈1.8.若X ~N (μ,σ2),则P (μ-σ<X ≤μ+σ)=0.6827,P (μ-2σ<X ≤μ+2σ)=0.9545.定出台“延迟退休年龄政策”.为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研.人社部从网上年龄在15~65岁的人群中随机调查100人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:年龄[15,25)[25,35)[35,45)[45,55)[55,65]支持“延迟退155152817休”的人数(1)由以上统计数据填2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;45岁以下45岁以上总计支持不支持总计(2)若以45岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取8人参加某项活动.现从这8人中随机抽2人.①抽到1人是45岁以下时,求抽到的另一人是45岁以上的概率.②记抽到45岁以上的人数为X,求随机变量X的分布列及数学期望.参考数据:P(K2≥k0)0.1000.0500.0100.001k0 2.706 3.841 6.63510.828K2=n(ad-bc)2,其中n=a+b+c+d.(a+b)(c+d)(a+c)(b+d)课时跟踪检测(二十)概率与统计1.(2017·广州二测)某种商品价格与该商品日需求量之间的几组对照数据如下表:价格x (元/kg)1015202530日需求量y (kg)1110865(1)求y 关于x 的线性回归方程;(2)利用(1)中的回归方程,当价格x =40元/kg 时,日需求量y 的预测值为多少?参考公式:线性回归方程y ^=b ^x +a ^,其中b ^=错误!,a ^=y -b ^x .解:(1)由所给数据计算得x =15×(10+15+20+25+30)=20,y =15×(11+10+8+6+5)=8,错误!(x i -x )2=(-10)2+(-5)2+02+52+102=250,错误!(x i -x )(y i -y )=(-10)×3+(-5)×2+0×0+5×(-2)+10×(-3)=-80.b ^=错误!=-80250=-0.32.a ^=y -b ^x=8+0.32×20=14.4.所求线性回归方程为y ^=-0.32x +14.4.(2)由(1)知当x =40时,y ^=-0.32×40+14.4=1.6.故当价格x =40(元/kg)时,日需求量y 的预测值为1.6kg.2.(2018届高三·广西五校联考)下图是某市11月1日至14日的空气质量指数趋势图,空气质量指数(AQI)小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择11月1日至11月12日中的某一天到达该市,并停留3天.(1)求此人到达当日空气重度污染的概率;(2)设X 是此人停留期间空气重度污染的天数,求X 的分布列与数学期望.解:设A i 表示事件“此人于11月i 日到达该市”(i =1,2,…,12).依题意知,P (A i )=112,且A i ∩A j =∅(i ≠j ).(1)设B 为事件“此人到达当日空气重度污染”,则B =A 1∪A 2∪A 3∪A 7∪A 12,所以P (B )=P (A 1∪A 2∪A 3∪A 7∪A 12)=P (A 1)+P (A 2)+P (A 3)+P (A 7)+P (A 12)=512.即此人到达当日空气重度污染的概率为512.(2)由题意可知,X 的所有可能取值为0,1,2,3,P (X =0)=P (A 4∪A 8∪A 9)=P (A 4)+P (A 8)+P (A 9)=312=14,P (X =2)=P (A 2∪A 11)=P (A 2)+P (A 11)=212=16,P (X =3)=P (A 1∪A 12)=P (A 1)+P (A 12)=212=16,P (X =1)=1-P (X =0)-P (X =2)-P (X =3)=1-14-16-16=512,或P (X =1)=P (A 3∪A 5∪A 6∪A 7∪A 10)=P (A 3)+P (A 5)+P (A 6)+P (A 7)+P (A 10)=512所以X 的分布列为:X 0123P145121616故X 的数学期望E (X )=0×14+1×512+2×16+3×16=54.3.(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N (μ,σ2).之外的零件数,求P (X ≥1)及X 的数学期望;(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①试说明上述监控生产过程方法的合理性;②下面是检验员在一天内抽取的16个零件的尺寸:9.9510.129.969.9610.019.929.9810.0410.269.9110.1310.029.2210.0410.059.95经计算得x =116错误!i =9.97,s =错误!=错误!≈0.212,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)用样本平均数x 作为μ的估计值μ^,用样本标准差s 作为σ的估计值σ^,利用估计值判断是否需对当天的生产过程进行检查?剔除(μ^-3σ^,μ^+3σ^)之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z 服从正态分布N (μ,σ2),则P (μ-3σ<Z <μ+3σ)=0.9974.0.997416≈0.9592,0.008≈0.09.解:(1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.9974,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.0026,故X ~B (16,0.0026).因此P (X ≥1)=1-P (X =0)=1-0.997416≈0.0408.X 的数学期望为EX =16×0.0026=0.0416.(2)①如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.0408,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.②由x =9.97,s ≈0.212,得μ的估计值为u ^=9.97,σ的估计值为σ^=0.212,由样本数据可以看出有一个零件的尺寸在(μ^-3σ^,μ^+3σ^)之外,因此需对当天的生产过程进行检查.剔除(μ^-3σ^,μ^+3σ^)之外的数据9.22,剩下数据的平均数为115(16×9.97-9.22)=10.02,因此μ的估计值为10.02.错误!2i =16×0.2122+16×9.972≈1591.134,剔除(μ^-3σ^,μ^+3σ^)之外的数据9.22,剩下数据的样本方差为115(1591.134-9.222-2因此σ的估计值为0.008≈0.09.4.(2017·沈阳模拟)为了探究某市高中理科生在高考志愿中报考“经济类”专业是否与性别有关,现从该市高三理科生中随机抽取50名学生进行调查,得到如下2×2列联表:(单位:人)报考“经济类”不报考“经济类”总计男62430女14620总计203050(1)据此样本,判断能否在犯错误的概率不超过0.001的前提下认为理科生报考“经济类”专业与性别有关?(2)若以样本中各事件的频率作为概率估计全市总体考生的报考情况,现从该市的全体考生(人数众多)中随机抽取3人,设3人中报考“经济类”专业的人数为随机变量X ,求随机变量X 的概率分布列及数学期望.附:P (K 2≥k 0)0.10.050.010.001k 02.7063.8416.63510.828K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解:(1)由表中数据得,K 2的观测值k =50×(6×6-24×14)230×20×20×30=50×300230×20×20×30=12.5>10.828,∴能在犯错误的概率不超过0.001的前提下认为理科生报考“经济类”专业与性别有关.(2)估计该市的全体考生中任一人报考“经济类”专业的概率为P =2050=25,X 的可能取值为0,1,2,3,由题意,得X ~P (X =k )=C -k(k =0,1,2,3),∴P (X =0)=27125,P (X =2)=C 23×35=36125,P (X =3)=8125,故随机变量X 分布列为:X 0123P2712554125361258125∴随机变量X 的数学期望E (X )=3×25=65.5.(2017·昆明模拟)某火锅店为了了解气温对营业额的影响,随机记录了该店1月份其中5天的日营业额y (单位:万元)与该地当日最低气温x (单位:℃)的数据,如下表:x 258911y1.210.80.80.7(1)求y 关于x 的线性回归方程y ^=b ^x +a ^;(2)判断y 与x 之间是正相关还是负相关,若该地1月份某天的最低气温为6℃,用所求回归方程预测该店当日的营业额;(3)设该地1月份的日最低气温X ~N (μ,σ2),其中μ近似为样本平均数x ,σ2近似为样本方差s 2,求P (3.8<X ≤13.4).附:①回归方程y ^=b ^x +a ^中,b ^=错误!,a ^=y -b ^x .②10≈3.2, 3.2≈1.8.若X ~N (μ,σ2),则P (μ-σ<X ≤μ+σ)=0.6827,P (μ-2σ<X ≤μ+2σ)=0.9545.解:(1)x =15×(2+5+8+9+11)=7,y =15×(1.2+1+0.8+0.8+0.7)=0.9.错误!2i =4+25+64+81+121=295,错误!i y i =2.4+5+6.4+7.2+7.7=28.7,∴b ^=错误!=28.7-5×7×0.9295-5×72=-2.850=-0.056,a ^=y -b ^x=0.9-(-0.056)×7=1.292.∴线性回归方程为y ^=-0.056x +1.292.(2)∵b ^=-0.056<0,∴y 与x 之间是负相关.当x =6时,y ^=-0.056×6+1.292=0.956.∴该店当日的营业额约为9560元.(3)样本方差s 2=15×(25+4+1+4+16)=10,∴最低气温X ~N (7,3.22),∴P (3.8<X ≤10.2)=0.6827,P (0.6<X ≤13.4)=0.9545,∴P (10.2<X ≤13.4)=12×(0.9545-0.6827)=0.1359.∴P (3.8<X ≤13.4)=P (3.8<X ≤10.2)+P (10.2<X ≤13.4)=0.6827+0.1359=0.8186.6.(2018届高三·张掖摸底)中央政府为了应对因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”.为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研.人社部从网上年龄在15~65岁的人群中随机调查100人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:年龄[15,25)[25,35)[35,45)[45,55)[55,65]支持“延迟退休”的人数155152817(1)由以上统计数据填2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;45岁以下45岁以上总计支持不支持(2)若以45岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取8人参加某项活动.现从这8人中随机抽2人.①抽到1人是45岁以下时,求抽到的另一人是45岁以上的概率.②记抽到45岁以上的人数为X,求随机变量X的分布列及数学期望.参考数据:P(K2≥k0)0.1000.0500.0100.001k0 2.706 3.841 6.63510.828K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.解:(1)由频率分布直方图知45岁以下与45岁以上各50人,故填充2×2列联表如下:45岁以下45岁以上总计支持354580不支持15520总计5050100因为K2的观测值k=100×(35×5-45×15)250×50×80×20=6.25>3.841,所以在犯错误的概率不超过0.05的前提下认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异.(2)①抽到1人是45岁以下的概率为68=3 4,抽到1人是45岁以下且另一人是45岁以上的概率为C16C12C28=37,故所求概率P=3734=47.②从不支持“延迟退休”的人中抽取8人,则45岁以下的应抽6人,45岁以上的应抽2人.所以X的可能取值为0,1,2.P(X=0)=C26C28=15 28,P(X=1)=C16C12C28=1228=37,P(X=2)=C2C28=1 28 .故随机变量X的分布列为:X012P152837128所以E(X)=1×37+2×128=12.。

2018年高考数学总复习统计与统计案例(2021年整理)

2018年高考数学总复习统计与统计案例(2021年整理)

2018年高考数学总复习统计与统计案例(word版可编辑修改)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018年高考数学总复习统计与统计案例(word版可编辑修改))的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018年高考数学总复习统计与统计案例(word版可编辑修改)的全部内容。

第三节统计与统计案例考纲解读1. 理解随机抽样的必要性和重要性。

2. 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.3. 了解分布的意义和作用,会列频率分布表,会画出频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.4. 理解样本数据标准差的意义和作用,会计算数据标准差.5. 能从样本的频率分布估计总体分布,会用样本的基本数字牲估计总体的基本数字特征,理解用样本估计总体的思想。

6. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。

7. 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.8. 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。

9. 了解常见的统计方法,并能应用这些方法解决一些实际问题。

(1)独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.(2)回归分析了解回归分析的基本思想、方法及其简单应用.命题趋势探究1。

本节内容是高考必考内容,以选择题、填空题为主.2. 命题内容为:(1)三种抽样(以分层抽样为主);(2)频率分布表和频率分布直方图的制作、识图及运用。

(1)(2)有结合趋势,考题难度中下.3。

统计案例为新课标教材新增内容,考查考生解决实际问题的能力。

2018-2019届高三数学(理)二轮复习课件:专题3第7讲统计与统计案例

2018-2019届高三数学(理)二轮复习课件:专题3第7讲统计与统计案例

考题2(2014 全国Ⅰ)从某企业生产的某种产品中抽取 500 件,测量这些产品的一项质量指标值,由测量结果得 如图所示的频率分布直方图:
(1)求这 500 件产品质量指标值的样本平均数 x 和样本 方差 s2(同一组中的数据用该组区间的中点值作代表);
(2)由直方图可以认为, 这种产品的质量指标值 Z 服从 正态分布 N(μ,σ 2),其中 μ 近似为样本平均数 似为样本方差 s2. ①利用该正态分布,求 P(187.8<Z<212.2); ②某用户从该企业购买了 100 件这种产品, 记 X 表示 这 100 件产品中质量指标值位于区间(187.8,212.2)的产品 件数,利用①的结果,求 E(X). 附: 150≈12.2. 若 Z~N(μ,σ 2),则 P(μ-σ<Z<μ+σ)=0.682 6, P(μ-2σ<Z<μ+2σ)=0.954 4.
【命题立意】本题主要考查频率分布直方图和频率公 式,考查读图,用图能力和运算能力.
考题3(2015 全国Ⅰ)某公司为确定下一年度投入某种 产品的宣传费, 需了解年宣传费 x(单位: 千元)对年销售量 y(单位:t)和年利润 z(单位:千元)的影响.对近 8 年的年 宣传费 xi 和年销售量 yi(i=1,2,…,8)数据作了初步处 理,得到下面的散点图及一些统计量的值.
(1)根据散点图判断, y=a+bx 与 y=c+d x哪一个适 宜作为年销售量 y 关于年宣传费 x 的回归方程类型?(给出 判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据, 建立 y 关于 x 的回归 方程. (3)已知这种产品的年利润 z 与 x,y 的关系为 z=0.2y- x.根据(2)的结果回答下列问题: ①年宣传费 x=49 时,年销售量及年利润的预报值是多 少? ②年宣传费 x 为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其 回归直线 v=α+βu 的斜率和截距的最小二乘估计分别为

高考数学(理):专题07 概率与统计(含解析)

高考数学(理):专题07 概率与统计(含解析)

7.概率与统计1.【2018年浙江卷】设0<p<1,随机变量ξ分布列是ξ0 1 2P则当p在(0,1)内增大时,A. D(ξ)减小B. D(ξ)增大C. D(ξ)先减小后增大D. D(ξ)先增大后减小【答案】D点睛:2.【2018年理新课标I卷】下图来自古希腊数学家希波克拉底所研究几何图形.此图由三个半圆构成,三个半圆直径分别为直角三角形ABC斜边BC,直角边AB,AC.△ABC三边所围成区域记为I,黑色部分记为II,其余部分记为III.在整个图形中随机取一点,此点取自I,II,III概率分别记为p1,p2,p3,则A. p1=p2B. p1=p3C. p2=p3D. p1=p2+p3【答案】A【解析】分析:首先设出直角三角形三条边长度,根据其为直角三角形,从而得到三边关系,之后应用相应面积公式求得各个区域面积,根据其数值大小,确定其关系,再利用面积型几何概型概率公式确定出p1,p2,p3关系,从而求得结果.详解:设,则有,从而可以求得面积为,黑色部分面积为,其余部分面积为,所以有,根据面积型几何概型概率公式,可以得到,故选A.点睛:该题考查是面积型几何概型有关问题,题中需要解决是概率大小,根据面积型几何概型概率公式,将比较概率大小问题转化为比较区域面积大小,利用相关图形面积公式求得结果.【2018年理新课标I卷】某地区经过一年新农村建设,农村经济收入增加了一倍.实现翻番.为3.更好地了解该地区农村经济收入变化情况,统计了该地区新农村建设前后农村经济收入构成比例.得到如下饼图:则下面结论中不正确是A. 新农村建设后,种植收入减少B. 新农村建设后,其他收入增加了一倍以上C. 新农村建设后,养殖收入增加了一倍D. 新农村建设后,养殖收入与第三产业收入总和超过了经济收入一半【答案】A详解:设新农村建设前收入为M,而新农村建设后收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后种植收入为0.74M,所以种植收入增加了,所以A项不正确;新农村建设前其他收入我0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C项正确;新农村建设后,养殖收入与第三产业收入综合占经济收入,所以超过了经济收入一半,所以D正确;故选A.点睛:该题考查是有关新农村建设前后经济收入构成比例饼形图,要会从图中读出相应信息即可得结果.4.【2018年全国卷Ⅲ理】某群体中每位成员使用移动支付概率都为,各成员支付方式相互独立,设为该群体10位成员中使用移动支付人数,,,则A. 0.7B. 0.6C. 0.4D. 0.3【答案】B点睛:本题主要考查二项分布相关知识,属于中档题。

2018届高考理科数学二轮专题复习讲义。统计与统计案例

2018届高考理科数学二轮专题复习讲义。统计与统计案例

2018届高考理科数学二轮专题复习讲义。

统计与统计案例本文介绍了统计与统计案例中的一些考点和热点分类,以及一些跟踪演练题目的解析。

在考试中,会以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等。

同时,在概率与统计的交汇处命题,难度适中。

抽样方法有三种:简单随机抽样、系统抽样和分层抽样。

简单随机抽样适用于总体中个体数较少的情况,而系统抽样适用于个体数较多的情况。

分层抽样适用于总体由差异明显的几部分组成的情况。

对于一些具体的题目,我们可以根据题意和抽样比例计算出样本中产品的最小编号或者应该抽取的学生人数。

在随机抽样的各种方法中,每个个体被抽到的概率都是相等的。

系统抽样又称为“等距”抽样,被抽到的各个号码间隔相同。

分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例。

最后,我们来看一道跟踪演练题目。

题目要求从福利彩票“双色球”中选取红色球的6个号码,选取方法是从第1行、第9列和第10列的数字开始从左到右依次选取两个数字。

根据题意和随机数表,我们可以计算出第四个被选中的红色球号码为06.解析:1) 样本编号题目,根据系统抽样的方法,计算出样本组距为9,然后根据已知编号推算出样本中还有一个学生的编号为14,故选B。

2) 该部分内容排版混乱,需要重新排版。

频率分布直方图中,横坐标表示组距,纵坐标表示频率,频率等于组距乘以组距。

各小长方形的面积之和为1.在频率分布直方图中,最高的小长方形底边中点的横坐标即为众数。

中位数左边和右边的小长方形的面积和相等。

平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和。

3) 根据题目可以列出方程,设未知数为x,平均数为a,中位数为b,众数为c,则有:(10+2+5+2+4+2+x)/7=a,中位数为2或5,众数为2,根据众数的定义可得c=2,因此有:b-a=c-b,代入已知数据可得b=3a-4,根据平均数的定义可得:(10+2+5+2+4+2+x)/7=a,解出a=5,代入b=3a-4可得b=11,因此中位数为11,根据中位数的定义可得:(10+2+5+2+4+2+x)/7=11,解出x=3,所以所有可能值之和为25+3=28,因此答案为B。

2018高考数学复习小单元卷 15.统计与统计案例

2018高考数学复习小单元卷 15.统计与统计案例

102336735556790344678891598765统计与统计案例(抽样方法、相关性检验、独立性检验、回归分析)一、选择题:1. 有A 、B 、C 三种零件,分别为a 个、300个、200个,现采用分层抽样法抽取一个容量为45的样本,C 种零件被抽取10个,则此三种零件的总数是 ( ) A .900 B .800 C .600 D .7002. 为了让人们感知丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢的塑料袋的数量,结果如下(单位:个):33、25、28、26、25、31.如果该班有45名学生,那么根据提供的数据估计该班级全班同学各家丢弃塑料袋的数量约为( ) A. 900个 B. 1080个 C. 1260个 D. 1800个3. 某人5次上班途中所花的时间(单位:分钟)分别为x ,y ,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为 ( )A. 1B. 2C. 3D. 4 4. 为了了解某学校学生的身体发育情况,抽查了 该校100名高中男生的体重情况,根据所得数据画出 样本的频率分布直方图如右图所示.根据此图,估计 该校2000名高中男生中体重大于70.5公斤的人数 为( )A.180B.360C.700D. 7205. 设两个正态分布2111(,)(0)N μσσ>和222(,)N μσ2(0)σ>的密度函数图象如图所示,则有( ) A .1212<<μμσσ, B .1212<>μμσσ, C .1212><μμσσ, D .1212>>μμσσ,则y 与x 的线性回归方程为y=bx+a 必过点( )A. (0,1)B. (1,3)C. (2,5)D. (1.5,4) 二、填空题:7. 某单位有27名老年人,54名中年人,81名青年人. 为了调查他们的身体情况,用分层抽样的方法从他们中抽取了n 个人进行体检,其中有6名老年人,那么n =_________.则第三组的频率和累积频率分别是 和 .9. 已知一个班的语文成绩的茎叶图如图所示,那么优秀率(90分以上) 为 , 最低分是 .10. 考察棉花种子经过处理跟生病之间的关系得到如下表数据:根据以上数据,则种子经过处理跟是否生病 关)三、解答题:(1)估计甲乙两厂灯泡瓦数的平均值;(2)如果在95—105瓦范围内的灯泡为合格品,计算两厂合格品的比例各是多少? (3)哪个厂的生产情况比较稳定?12. 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生 产能耗y (吨标准煤)的几组对照数据(Ⅰ)请画出上表数据的散点图;(Ⅱ)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程ˆˆy bx a =+;(Ⅲ)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3 2.543546 4.566.5⨯+⨯+⨯+⨯=)统计与统计案例参考答案一、选择题:1. A 解析: 由于C 种零件有200个, 被抽取10个,可知其抽样比为10120020=, 则B 零件300个应当抽取13001520⨯=个, 共抽取45个样本,则A 应当抽取20个, 即A 零件的个数2020400a =⨯=, 由此可得三种零件总数是400300200900++=, 故应选D.2. C 解析:由已知抽样数据可得平均数为332528262531286+++++=个, 据此可以估计本周全班同学各家丢弃塑料袋的数量约为28451260⨯=个.3. D 解析:由已知可得2222221011910,51[(10)(10)(1010)(1110)(910)]2,5x y x y ++++⎧=⎪⎪⎨⎪-+-+-+-+-=⎪⎩∴2220,(10)(10)18,x y x y +=⎧⎨-+-=⎩解之得12,8,x y =⎧⎨=⎩或8,12,x y =⎧⎨=⎩ ∴|x -y |=4, 故应选D. 4. B 解析: 体重大于70.5公斤的频率为(0.04+0.03+0.02)20.18⨯=,∴该校2000名高中男生中体重大于70.5公斤的人数为20000.18360⨯=人. 5. A 解析: 由正态分布密度函数图象可得12μμ<,2212σσ<,即12σσ<, 故应选A. 6. D 解析:根据回归方程要过样本的中心点(,x y ,x y ),所以过(1.5,4)点. 二、填空题:7. 36 解析:由已知条件可得每一个个体被抽入样的概率为627548127n =++,解之得36n =.8. 0.14和0.37解析:第三组的频率P 3=10014=0.14, 累积频率为P 1+P 2+P 3=10010+10013+10014=0.37. 9. 51%4与解析:由茎叶图可得,样本容量为25, 90分以上的人数为1人, 即优 秀率为14%25=, 最低分为51分. 10. 无 解析:根据题意可以求得,在假设无关的情况下可以得到K 2=0.16,可以得到无关的概率大于50%,所以种子经过处理跟是否生病有关的概率小于50%,所以种子经过处理跟是否生病无关. 三、解答题:11. 解析:(1)1(963986100810221061)99.320x =⨯+⨯+⨯+⨯+⨯=甲1(9419629871004102310421061)99.620x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=乙 所以:甲厂灯泡平均值的估计值为99.3,乙厂灯泡平均值的估计值为99.6 . (2)根据抽样%902018%,952019====乙甲A A . (3)222221[3(9699.3)6(9899.3)8(10099.3)2(10299.3)20O =⨯-+⨯-+⨯-+⨯-甲 21(10699.3)]+⨯- 5.31=222221[1(9499.6)2(9699.6)7(9899.6)4(10099.6)20O =⨯-+⨯-+⨯-+⨯-乙 2223(10299.6)2(10499.6)1(10699.6)+⨯-+⨯-+⨯-]8.64=所以甲的情况稳定. 12. 解析: (Ⅰ)如下图(Ⅱ)y x i ni i ∑=1=3⨯2.5+4⨯3+5⨯4+6⨯4.5=66.5x =46543+++=4.5y =45.4435.2+++=3.5 ∑=ni x i 12=32+42+52+62=86266.54 4.5 3.566.563ˆ0.7864 4.58681b-⨯⨯-===-⨯- ˆˆ 3.50.7 4.50.35aY bX =-=-⨯= 故线性回归方程为y=0.7x+0.35(Ⅲ)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7 100+0.35=70.35 故耗能减少了90-70.35=19.65(吨).。

2018届高考理科数学《第11章统计与统计案例》11-3

2018届高考理科数学《第11章统计与统计案例》11-3

高考总复习· 数学理科(RJ)
第十一章 统计与统计案例
2×2列联表
y1
x1 x2 a c
y2
b d
总计
a+b c+d
总计
a+c
b+d
a+b+c+d
高考总复习· 数学理科(RJ)
第十一章 统计与统计案例
高考总复习· 数学理科(RJ)
第十一章 统计与统计案例
【思考辨析】
判 断 下 面 结 论 是 否 正 确 ( 请 在 括 号 中 打 “√” 或
高考总复习· 数学理科(RJ)
第十一章 统计与统计案例
4.(2017· 湖南三校联考 ) 某产品在某零售摊位的零售价
x(单位:元)与每天的销售量y(单位:个)的统计资料如下表
所示:
x
16
“×”) (1) 相关关系与函数关系都是一种确定性的关系,也是 一种因果关系.( )
(2)“ 名师出高徒 ” 可以解释为教师的教学水平与学生 的水平成正相关关系.( )
(3) 只有两个变量有相关关系,所得到的回归模型才有
预测价值.(
)
高考总复习· 数学理科(RJ)
第十一章 统计与统计案例
(4)某同学研究卖出的热饮杯数 y 与气温 x(℃)之间的关系, 得 回归方程^ y=-2.352x+147.767,则气温为 2 ℃时,一定可卖出 143 杯热饮.( )
个变量的这种相关关系称为负相关.
高考总复习· 数学理科(RJ)
第十一章 统计与统计案例
(3)线性相关关系、回归直线 一条直线附近 , 如果散点图中点的分布从整体上看大致在 _____________ 就称这两个变量之间具有线性相关关系,这条直线叫做回归 直线. 2.回归方程 (1)最小二乘法 距离的平方和最小 求回归直线,使得样本数据的点到它的 _________________ 的方法叫做最小二乘法.

【高考专题】2018年 高考数学(理数) 统计案例 专项练习(含答案)

【高考专题】2018年 高考数学(理数) 统计案例 专项练习(含答案)

2018年高考数学(理数) 统计案例专项练习1.某城镇社区为了丰富辖区内广大居民的业余文化生活,创建了社区“文化丹青”大型活动场所,配备了各种文化娱乐活动所需要的设施,让广大居民健康生活、积极向上.社区最近四年内在“文化丹青”上的投资金额统计数据如表:(为了便于计算,把2015年简记为5,其余以此类推)(1)利用所给数据,求出投资金额y与年份x之间的回归直线方程;(2)预测该社区在2019年在“文化丹青”上的投资金额.2.第31届夏季奥林匹克运动会将于2016年8月5日—21日在巴西里约热内卢举行下表是近五届奥运会中国代表团和俄罗斯代表团获得的金牌数的统计数据(单位:枚).(1)根据表格中两组数据完成近五届奥运会两国代表团获得的金牌数的茎叶图,并通过茎叶图比较两国代表团获得的金牌数的平均值及分散程度(不要求计算出具体数值,给出结论即可);(2)甲、乙、丙三人竞猜下一届中国代表团和俄罗斯代表团中的哪一个获得的金牌数多(假设两国代表团获得的金牌数不会相等),规定甲、乙、丙必须在两个代表团中选一个,已知甲、乙猜中国代表团的概率都为0.8,丙猜中国代表团的概率为0.6,三人各自猜哪个代表团的结果互不影响.现让甲、乙、丙各猜一次,设三人中猜中国代表团的人数为X,求X的分布列及数学期望EX.3.随着互联网的快速发展,基于互联网的共享单车应运而生,某市场研究人员为了了解共享单车运营公司M 的经营状况,对该公司最近六个月的市场占有率进行了统计,并绘制了相应的折线图:(1)由折线图可以看出,可用线性回归模型拟合月度市场占有率与月份代码之间的关系,求y关于x 线性回归方程,并预测M公司2017年4月的市场占有率;(2)为进一步扩大市场,公司拟再采购一批单车,现有采购成本分别为1000元/辆和1200元/辆的A、B两款车型可供选择,按规定每辆单车最多使用4年,但由于多种原因(如骑行频率等)会导致单车使用寿命各不相同,考虑到公司运营的经济效益,该公司决定先对这两款车型的单车各100辆进行科学模拟测试,得到两款单车使用寿命的频数表如右表:经测算,平均每辆单车每年可以带来收入500元,不考虑除采购成本之外的其他成本,假设每辆单车的使用寿命都是整数年,且以频率作为每辆单车使用寿命的概率,如果你是M公司的负责人,以每辆单车产生利润的期望值为决策依据,你会选择采购哪款车型?参考公式:4.随着我国互联网信息技术的发展,网络购物已经成为许多人消费的一种重要方式,某市为了了解本市市民的网络购物情况,特委托一家网络公示进行了网络问卷调查,并从参与调查的10000名网民中随机抽取了200人进行抽样分析,得到了下表所示数据:(1)依据上述数据,能否在犯错误的概率不超过0.15的前提下认为该市市民进行网络购物的情况与性别有关?(2)现从所抽取的女性网民中利用分层抽样的方法再抽取5人,从这5人中随机选出3人赠送网络优惠券,求出选出的3人中至少有两人是经常进行网络购物的概率;(3)将频率视为概率,从该市所有的参与调查的网民中随机抽取10人赠送礼物,记经常进行网络购物的人数为X,求X的期望和方差.5.随着电子产品的不断更新完善,更多的电子产品逐步走入大家的世界,给大家带来了丰富多彩的生活,但也带来了一些负面的影响,某公司随即抽取1000人对某电子产品是否对日常生活有益进行了问卷调查,并对参与调查的1000人中的年龄层次以及意见进行了分类,得到的数据如下表所示:(1)根据表中的数据,能否在犯错误的概率不超过10.1%的前提下,认为电子产品的态度与年龄有关系?(2)为了答谢参与问卷调查的人员,该公司对参与本次问卷调查的人员进行抽奖活动,奖金额以及发放的概率如下:现在甲、乙两人参与了抽奖活动,记两人获得的奖金总金额为Y,求Y的分布列和数学期望.6.随着科学技术的飞速发展,手机的功能逐渐强大,很大程度上代替了电脑、电视.为了了解某高校学生平均每天使用手机的时间是否与性别有关,某调查小组随机抽取了30名男生、20名女生进行为期一周的跟踪调查,调查结果如表所示:(1)能否在犯错误的概率不超过0.01的前提下认为学生使用手机的时间长短与性别有关?(2)在这20名女生中,调查小组发现共有15人使用国产手机,在这15人中,平均每天使用手机不超过3小时的共有9人.从平均每天使用手机超过3小时的女生中任意选取3人,求这3人中使用非国产手机的人数X的分布列和数学期望.参考公式:7.从某小区抽取50户居民进行月用电量调查,发现其用电量都在50到350度之间,将用电量的数据绘制成频率分布直方图如下图所示.(1)求频率分布直方图中x的值并估计这50户用户的平均用电量;(2)若将用电量在区间[50,150)内的用户记为A类用户,标记为低用电家庭,用电量在区间[250,350)内的用户记为B类用户,标记为高用电家庭,现对这两类用户进行问卷调查,让其对供电服务进行打分,并将打分数据绘制成茎叶图如图所示:①从B类用户中任意抽取3户,求恰好有2户打分超过85分的概率;②若打分超过85分视为满意,没超过85分视为不满意,请填写下面列联表,并根据列联表判断是否有95%的把握认为“满意与否与用电量高低有关”?附表及公式:8.某高三理科班共有60名同学参加某次考试,从中随机挑选出5名同学,他们的数学成绩x与物理成绩y 如下表:数据表明y与x之间有较强的线性关系.(1)求y关于x的线性回归方程;(2)该班一名同学的数学成绩为110分,利用(1)中的回归方程,估计该同学的物理成绩;(3)本次考试中,规定数学成绩达到125分为优秀,物理成绩达到100分为优秀.若该班数学优秀率与物理优秀率分别为50%和60%,且除去抽走的5名同学外,剩下的同学中数学优秀但物理不优秀的同学共有5人.能否在犯错误概率不超过0.01的前提下认为数学优秀与物理优秀有关?9.第23届冬季奥运会于2018年2月9日至2月25日在韩国平昌举行,期间正值我市学校放寒假,寒假结束后,某校工会对全校教职工在冬季奥运会期间每天收看比赛转播的时间作了一次调查,得到如下频数分布表:(1)若将每天收看比赛转播时间不低于3小时的教职工定义为“体育达人”,否则定义为“非体育达人”,请根据频数分布表补全2×2列联表:并判断能否有90%的把握认为该校教职工是否为“体育达人”与“性别”有关;(2)在全校“体育达人”中按性别分层抽样抽取6名,再从这6名“体育达人”中选取2名作冬奥会知识讲座.记其中女职工的人数为,求的分布列与数学期望.附表及公式:10.为调查了解某省属师范大学师范类毕业生参加工作后,从事的工作与教育是否有关的情况,该校随机调查了该校80位性别不同的2016年师范类毕业大学生,得到具体数据如下表:(1)能否在犯错误的概率不超过5%的前提下,认为“师范类毕业生从事与教育有关的工作与性别有关”?参考公式:().附表:(2)求这80位师范类毕业生从事与教育有关工作的频率;(3)以(2)中的频率作为概率.该校近几年毕业的2000名师范类大学生中随机选取4名,记这4名毕业生从事与教育有关的人数为X,求X的数学期望E(X).参考答案1.解:2.解:3.解:5.解:7.解:9.解:。

2018届高三数学(理科)二轮复习讲义二+专题六+第三讲 正态分布、统计与统计案例+Word版含解析

2018届高三数学(理科)二轮复习讲义二+专题六+第三讲 正态分布、统计与统计案例+Word版含解析

专题六概率与统计、算法、复数、推理与证明第三讲正态分布、统计与统计案例高考导航1.考查正态曲线的性质及正态分布的概率计算.2.考查系统抽样和分层抽样、样本的频率分布与数字特征、线性回归分析、独立性检验.3.与概率知识交汇进行综合考查.1.(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图:根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳[解析] 折线图呈现出的是一个逐渐上升的趋势,但是并不是每个月都在增加,故A 说法错误;折线图中按照年份进行划分,可以看出每年的游客量都在逐年增加,故B 说法正确;折线图中每年的高峰出现在每年的7,8月,故C 说法正确;每年的1月至6月相对于7月至12月的波动性更小,变化的幅度较小,说明变化比较平稳,故D 说法正确.[答案] A2.(2017·山东卷)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x +a ^,已知∑i =110x i =225,∑i =110y i =1600,b ^=4.该班某学生的脚长为24,据此估计其身高为( )A .160B .163C .166D .170[解析] 由题意可得x -=22.5,y -=160,∴a ^=160-4×22.5=70,即y ^=4x +70.当x =24时,y ^=4×24+70=166,故选C.[答案] C3.(2017·江苏卷)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.[解析]从丙种型号的产品中抽取的件数为60×300200+400+300+100=18.[答案]184.(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)的估计值(精确到0.01).附:.K2=(a+b)(c+d)(a+c)(b+d)[解](1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”.由题意知P(A)=P(BC)=P(B)P(C).旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)×5=0.66,故P (C )的估计值为0.66.因此,事件A 的概率估计值为0.62×0.66=0.4092. (2)根据箱产量的频率分布直方图得列联表K 2=200×(62×66-34×38)2100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关. (3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5,故新养殖法箱产量的中位数的估计值为50+0.5-0.340.068≈52.35(kg).考点一 正态分布1.正态曲线的性质(1)曲线位于x 轴上方,与x 轴不相交;曲线关于直线x =μ对称,且在x =μ处达到峰值.(2)曲线与x 轴之间的面积为1.(3)当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.2.正态分布X~N(μ,σ2)的三个常用数据(1)P(μ-σ<X≤μ+σ)=0.6826;(2)P(μ-2σ<X≤μ+2σ)=0.9544;(2)P(μ-3σ<X≤μ+3σ)=0.9974.[思维流程][解](1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.9974,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.0026,故X~。

2018年高考数学(理)总复习双基过关检测:“统计与统计案例”含解析

2018年高考数学(理)总复习双基过关检测:“统计与统计案例”含解析

“统计与统计案例”双基过关检测一、选择题1.(2017·邯郸摸底)某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n 人中,抽取35人进行问卷调查.已知高二被抽取的人数为13,则n =( )A .660B .720C .780D .800解析:选B 由已知条件,抽样比为13780=160,从而35600+780+n =160,解得n =720.2.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5D.y ^=-0.3x +4.4解析:选 A 依题意知,相应的回归直线的斜率应为正,排除C ,D.且直线必过点(3,3.5),代入A ,B 得A 正确.3.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C ,则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15解析:选C 由题意知应将960人分成32组,每组30人.设每组选出的人的号码为30k +9(k =0,1,…,31).由451≤30k +9≤750,解得44230≤k ≤74130,又k ∈N ,故k =15,16,…,24,共10人.4.根据如下样本数据得到的回归方程为y ^=b ^x +a ^,则( )A.a ^>0,b ^>0B.a ^>0,b ^<0C.a ^<0,b ^>0 D.a ^<0,b ^<0解析:选B 把样本数据中的x ,y 分别当作点的横、纵坐标,在平面直角坐标系xOy 中作出散点图(图略),由图可知b ^<0,a ^>0.故选B.5.如图是某学校举行的运动会上七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )7 98 4 4 6 4 793A .84,4.84B .84,1.6C .85,1.6D .85,4解析:选C 依题意,所剩数据的平均数是80+15×(4×3+6+7)=85,所剩数据的方差是15×[3×(84-85)2+(86-85)2+(87-85)2]=1.6.6.如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35)、[35,40)、[40,45]的网民人数成递减的等差数列,则年龄在[35,40)的网民出现的频率为( )A .0.04B .0.06C .0.2D .0.3解析:选C 由题意得,年龄在[20,25)的网民出现的频率为0.01×5=0.05,[25,30)的网民出现的频率为0.07×5=0.35,又[30,35)、[35,40)、[40,45]的网民人数成递减的等差数列,则其频率也成等差数列,又[30,45]的频率为1-0.05-0.35=0.6,则年龄在[35,40)的网民出现的频率为0.2.7.通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如表所示的2×2列联表:由K 2=n ad -bc 2a +bc +d a +cb +d,算得K 2=-260×50×60×50≈7.8.附表:参照附表,得到的正确结论是( )A .有99%以上的把握认为“选择过马路的方式与性别有关”B .有99%以上的把握认为“选择过马路的方式与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关” 解析:选A 由K 2≈7.8,得P (K 2≥6.635)=0.01=1-99%,∴有99%以上的把握认为“选择过马路的方式与性别有关”.8.(2017·长沙一模)下面的茎叶图是某班学生在一次数学测试时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( ) A .15名女生成绩的平均分为78 B .17名男生成绩的平均分为77C .女生成绩和男生成绩的中位数分别为82,80D .男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重解析:选C 对于A,15名女生成绩的平均分为115×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A 正确;对于B,17名男生成绩的平均分为117×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B 正确;对于D ,观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D 正确;对于C ,根据女生和男生成绩数据分析可得,两组数据的中位数均为80,C 错误.二、填空题9.某中学采用系统抽样方法,从该校高一年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号.已知从33~48这16个数中取的数是39,则在第1小组1~16中随机抽到的数是________.解析:间隔数k =80050=16,即每16人抽取一个人.由于39=2×16+7,所以第1小组中抽取的数为7.答案:710.(2017·南昌一模)若1,2,3,4,m 这五个数的平均数为3,则这五个数的方差为________.解析:由1+2+3+4+m 5=3得m =5,所以这五个数的方差为15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2.答案:211.(2016·抚顺模拟)某学院的A ,B ,C 三个专业共有1 200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本,已知该学院的A 专业有380名学生,B 专业有420名学生,则在该学院的C 专业应抽取学生________名.解析:抽样比为1201 200=110,∴A ,B 专业共抽取38+42=80名,故C 专业抽取120-80=40名.答案:4012.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2≈3.918,经查临界值表知P (K 2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.①有95%的把握认为“这种血清能起到预防感冒的作用”; ②若某人未使用该血清,那么他在一年中有95%的可能性得感冒; ③这种血清预防感冒的有效率为95%; ④这种血清预防感冒的有效率为5%.解析:K 2≈3.918≥3.841,而P (K 2≥3.814)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.答案:①三、解答题13.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y=b x+a;(2)利用(1)中所求出的回归直线方程预测该地2016年的粮食需求量.解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:对预处理后的数据,容易算得,x=0,y=3.2,b^=--+--+2×19+4×29-5×0×3.2-2+-2+22+42-5×02=26040=6.5,a^=y-b^x=3.2.由上述计算结果,知所求回归直线方程为y^-257=b^(x-2010)+a^=6.5(x-2010)+3.2,即y^=6.5(x-2010)+260.2.(*)(2)利用回归直线方程(*),可预测2016年的粮食需求量为6.5(2016-2010)+260.2=6.5×6+260.2=299.2(万吨).14.(2017·唐山统考)为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了m名学生进行体育测试.根据体育测试得到了这m名学生的各项平均成绩(满足100分),按照以下区间分为七组:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并得到频率分布直方图(如图).已知测试平均成绩在区间[30,60)内有20人.(1)求m的值及中位数n;(2)若该校学生测试平均成绩小于n,则学校应适当增加体育活动时间.根据以上抽样调查数据,该校是否需要增加体育活动时间?解:(1)由频率分布直方图知第1组,第2组和第3组的频率分别是0.02,0.02和0.06,则m×(0.02+0.02+0.06)=20,解得m=200.由直方图可知,中位数n位于[70,80)内,则0.02+0.02+0.06+0.22+0.04(n-70)=0.5,解得n=74.5.(2)设第i(i=1,2,3,4,5,6,7)组的频率和频数分别为p i和x i,由图知,p1=0.02,p2=0.02,p3=0.06,p4=0.22,p5=0.40,p6=0.18,p7=0.10,则由x i=200×p i,可得x1=4,x2=4,x3=12,x4=44,x5=80,x6=36,x7=20,故该校学生测试平均成绩是x=35x1+45x2+55x3+65x4+75x5+85x6+95x7200=74<74.5,所以学校应该适当增加体育活动时间.。

2018版高考数学理 全国甲卷大二轮总复习与增分策略配套课件 专题七 概率与统计第2讲 精品

2018版高考数学理 全国甲卷大二轮总复习与增分策略配套课件 专题七 概率与统计第2讲 精品
解析答案
(2)求系统A在3次相互独立的检测中不发生故障的次数大于发生故障的 次数的概率.
思维升华
解析答案
跟踪演练2 (1)把一枚骰子连续抛掷两次,记“第一次抛出的是素数点”
为事件A,“第二次抛出的是合数点”为事件B,则P(B|A)等于( )
A.12
B.14
C.16
√D.13
解析
(2)如图所示,某快递公司送货员从公司A处准备开车送货到某单位B处,
例 2 某居民小区有两个相互独立的安全防范系统(简称系统)A 和 B,系 统 A 和系统 B 在任意时刻发生故障的概率分别为110和 p. (1)若在任意时刻至少有一个系统不发生故障的概率为5409,求 p 的值; 解 设“至少有一个系统不发生故障”为事件C, 那么 1-P( C )=1-110·p=4590,解得 p=15.
数分别是 a,b,则函数 f′(x)在 x=1 处取得最值的概率是( )
1
1
A.36
B.18
√C.112
1 D.6
解析
(2)如图,大正方形的面积是34,四个全等直角三角形
围成一个小正方形,直角三角形的较短边长为3,向大
正方形内抛一枚幸运小花朵,则小花朵落在小正方形
内的概率为( )
1 A.17
√B.127
(x-5)2+y2=9相交”发生的概率为__4______. 解析 由已知得,圆心(5,0)到直线y=kx的距离小于半径, ∴ k|52k+| 1<3,解得-34<k<34, 由几何概型得 P=134----341=34.
思维升华
解析答案
跟踪演练 1 (1)已知函数 f(x)=13ax3-12bx2+x,连续抛掷两颗骰子得到点

2018届高三数学文二轮新课标专题复习课件:1.7.1统计、统计案例 精品

2018届高三数学文二轮新课标专题复习课件:1.7.1统计、统计案例 精品

女生 男生
高一年级 373 327
高二年级 y z
高三年级 x
340
A.14
B.15
C.16
D.17
【解析】选B.由已知得高三女生数x=2 000×0.18=360. 故高三年级总共有360+340=700(人). 而高一年级共有373+327=700(人). 所以高二年级共有2 000-700-700=600(人). 设高二年级应抽取的学生数为n,则由分层抽样的特点 知, n 6解00得,n=15.
A.56
B.60
C.120
D.140
【解题导引】利用频率乘以总体容量等于频数求解.
【规范解答】选D.由频率分布直方图可知,每周自习时 间不少于22.5小时的学生所占频率为 2.5×(0.16+0.08 +0.04)=0.7,所以每周自习时间不 少于22.5小时的学生人数为200×0.7=140.
3.重要性质及结论
(1)频率分布直方图的三个结论 ①小长方形的面积=_组__距___组 频__距 率_=频率;
②各小长方形的面积之和等于1;
频率
③小长方形的高=_组__距__,所有小长方形高的和为
1 组距
.
(2)回归直线方程:一组具有线性相关关系的数据
(x1,y1),(x2,y2),…,(xn,yn).其回归方程 y =__b_x__a_,其 过样本点中心_(_x_, y_)_.
50 2 000
【加固训练】 1.总体由编号为01,02,…,19,20的20个个体组成,利用 下面的随机数表选取5个个体,选取方法是从随机数表 第1行的第5列和第6列数字开始由左到右依次选取两个 数字,则选出来的第5个个体的编号为 ( )

2018届高考数学高考复习指导大二轮专题复习课后强化训练:专题7 第1讲统计与统计案例 含解析 精品

2018届高考数学高考复习指导大二轮专题复习课后强化训练:专题7 第1讲统计与统计案例 含解析 精品

第一部分 专题七 第一讲A 组1.(2017·山东卷,5)为了研究某班学生的脚长x (单位:cm)和身高y (单位:cm)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系.设其回归直线方程为y ^=b ^x +a ^.已知∑i =110x i =225,∑i =110y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为导学号 52134822( C )A .160B .163C .166D .170[解析] ∵∑i =110x i =225,∴x =110∑i =110x i =22.5.∵∑i =110y i =1 600,∴y =110∑i =110y i =160.又b ^=4,∴a ^=y -b ^x =160-4×22.5=70. ∴回归直线方程为y ^=4x +70.将x =24代入上式得y ^=4×24+70=166. 故选C .2.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为导学号 52134823( C )A .93B .123C .137D .167[解析] 由图可知该校女教师的人数为110×70%+150×(1-60%)=77+60=137,故选C .3.(文)(2017·豫东、豫北十所名校联考)某厂生产A 、B 、C 三种型号的产品,产品数量之比为3∶2∶4,现用分层抽样的方法抽取一个样本容量为180的样本,则样本中B 型号的产品的数量为导学号 52134824( B )A .20B .40C .60D .80[解析] 由分层抽样的定义知,B 型号产品应抽取180×23+2+4=40件.(理)(2017·济南模拟)某全日制大学共有学生5600人,其中专科生有1300人,本科生有3000人,研究生1300人,现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本为280人,则应在专科生,本科生与研究生这三类学生中分别抽取导学号 52134825( A )A .65人,150人,65人B .30人,150人,100人C .93人,94人,93人D .80人,120人,80人[解析]2805600=120,1300×120=65,3000×120=150,故选A . 4.(文)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n }.已知a 2=2a 1,且样本容量为300,则小长方形面积最大的一组的频数为导学号 52134826( A )A .100B .120C .150D . 200[解析] 设公差为d ,则a 1+d =2a 1,∴a 1=d ,∴d +2d +3d +4d +5d =1,∴d =115,∴面积最大的一组的频率等于115×5=13.∴小长方形面积最大的一组的频数为300×13=100.(理)某电视传媒公司为了了解某类体育节目的收视情况,随机抽取了100名观众进行调查,如图是根据调查结果绘制的观众日均收看该类体育节目时间的频率分布直方图,其中收看时间分组区间是:[0,10),[10,20),[20,30),[30,40),[40,50),[50,60].将日均收看该类体育节目时间不低于40分钟的观众称为“体育迷”,则图中x 的值为导学号 52134827( A )A .0.01B .0.02C .0.03D .0.04[解析] 由题设可知(0.005+x +0.012+0.02+0.025+0.028)×10=1,解得x =0.01,选A .5.等差数列x 1,x 2,x 3,…,x 9的公差为1,若以上述数据x 1,x 2,x 3,…,x 9为样本,则此样本的方差为导学号 52134828( A )A .203B .103C .60D .30[解析] 令等差数列为1,2,3…9,则样本的平均值x =5,∴s 2=19[(1-5)2+(2-5)2+…+(9-5)2]=609=203.6.(文)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为y ^=-4x +a .若在这些样本点中任取一点,则它在回归直线左下方的概率为导学号 52134829( B )A .16B .13C .12D .23[解析] x =4+5+6+7+8+96=132,y =90+84+83+80+75+686=80,∵回归直线过点(132,80),∴a =106,∴y ^=-4x +106,∴点(5,84),(9,68)在回归直线左下方,故所求概率P =26=13.(理)关于统计数据的分析,有以下几个结论,其中正确的个数为导学号 52134830( A )①利用残差进行回归分析时,若残差点比较均匀地落在宽度较窄的水平带状区域内,则说明线性回归模型的拟合精度较高;②将一组数据中的每个数据都减去同一个数后,期望与方差均没有变化;③调查剧院中观众观后感时,从50排(每排人数相同)中任意抽取一排的人进行调查是分层抽样法;④已知随机变量X 服从正态分布N (3,1),且P (2≤X ≤4)=0.682 6,则P (X >4)等于0.158 7⑤某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人.为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为7人,则样本容量为15人.A .2B .3C .4D .5[解析] ①④正确,②③⑤错误,⑤设样本容量为n ,则3501500=7n ,∴n =30,故⑤错.7.(2017·石家庄质检二)将高三(1)班参加体检的36名学生,编号为:1,2,3,…,36,若采用系统抽样的方法抽取一个容量为4的样本,已知样本中含有编号为6、24、33的学生,则样本中剩余一名学生的编号是__15__.导学号 52134831[解析] 根据系统抽样的特点可知抽取的4名学生的编号依次成等差数列,故剩余一名学生的编号是15.8.(2017·豫北十校联考)2015年的NBA 全明星赛于北京时间2015年2月14日举行,如图是参加此次比赛的甲、乙两名篮球运动员以往几场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是__64__.导学号 52134832[解析] 应用茎叶图的知识得,甲、乙两人这几场比赛得分的中位数分别为28,36,因此甲、乙两人这几场比赛得分的中位数之和是64.9.(2017·吉林通化月考)某产品的广告费用x (万元)与销售额y (万元)的统计数据如下表:根据上表可得回归方程y ^=b ^x +a ^中的b ^为7.据此模型预测广告费用为10万元时销售额为__73.5__万元.导学号 52134833[解析] 由题表可知,x =4.5,y =35,代入回归方程y ^=7x +a ^,得a ^=3.5,所以回归方程为y ^=7x +3.5.所以当x =10时,y ^=7×10+3.5=73.5.10.班主任为了对本班学生的考试成绩进行分析,决定从全班25位女同学,24位男同学中随机抽取一个容量为8的样本进行分析.若这8位同学的数学、物理分数对应如下表:导学号 52134834上表数据表示变量y 与x 的相关关系.(1)画出样本的散点图,并说明物理分数y 与数学分数x 之间是正相关还是负相关; (2)求y 与x 的线性回归直线方程(系数精确到0.01),并指出某学生数学83分,物理约为多少分(精确到1分)?参考公式:回归直线的方程是:y ^=b ^x +a ^,其中b ^=∑i =1n(x i -x -)(y i -y -)∑i =1n(x i -x -)2,a ^=y --b ^x -.参考数据:x -=77.5,y -≈85,∑i =18 (x i -x -)2=1050,∑i =18(x i -x -)(y i -y -)≈688.[解析] (1)画样本散点图如下:由图可知:物理分数y 与数学分数x 之间是正相关关系.(2)从散点图中可以看出,这些点分布在一条直线附近,因此以用公式计算得,b ^=∑i =18(x i -x -)(y i -y -)∑i =18(x i -x -)2=6881050≈0.66, 由x -=77.5,y -≈85,得a ^=y --b ^x -=85-0.66×77.5≈33.85. 所以回归直线方程为y ^=0.66x +33.85.当x =83时,y ^=0.66×83+33.85=88.63≈89. 因此某学生数学83分时,物理约为89分.B 组1.(文)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为导学号 52134835( C )A .90B .100C .180D .300[解析] 由题意,总体中青年教师与老年教师比例为1 600900=169.设样本中老年教师的人数为x ,由分层抽样的性质可得总体与样本中青年教师与老年教师的比例相等,即320x =169,解得x =180.故选C .(理)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,收集数据如下:设回归方程为y =bx +a ,则点(a ,b )在直线x +45y -10=0的导学号 52134836( C ) A .左上方 B .左下方 C .右上方D .右下方[解析] ∵x -=45,y -=85,∴a +45b =85,∴a +45b -10>0,故点(a ,b )在直线x +45y -10=0的右上方,故选C .2.在某次测量中得到的A 样本数据如下:42,43,46,52,42,50,若B 样本数据恰好是A 样本数据每个都减5后所得数据,则A 、B 两样本的下列数字特征对应相同的是导学号 52134837( B )A .平均数B .标准差C .众数D .中位数[解析] 因为A 组数据为:42,43,46,52,42,50 B 组数据为:37,38,41,47,37,45.可知平均数、众数、中位数都发生了变化,比原来A 组数据对应量都减小了5,但标准差不发生变化,故选B .3.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y ^=b ^x +a ^,其中b ^=0.76,a ^=y -b ^x .据此估计,该社区一户年收入为15万元家庭的年支出为导学号 52134838( B )A .11.4万元B .11.8万元C .12.0万元D .12.2万元[解析] 由已知得x =8.2+8.6+10.0+11.3+11.95=10(万元),y =6.2+7.5+8.0+8.5+9.85=8(万元),故a ^=8-0.76×10=0.4.所以回归直线方程为y ^=0.76x +0.4,社区一户年收入为15万元家庭的年支出为y ^=0.76×15+0.4=11.8(万元),故选B .4.(文)某养兔场引进了一批新品种,严格按照科学配方进行喂养,四个月后管理员称其体重(单位:kg),将有关数据进行整理后分为五组,并绘制频率分布直方图(如图所示).根据标准,体重超过6kg 属于超重,低于5kg 的不够分量.已知图中从左到右第一、第三、第四、第五小组的频率分别为0.25、0.20、0.10、0.05,第二小组的频数为400,则该批兔子的总数和体重正常的频率分别为导学号 52134839( D )A .1000,0.50B .800,0.50C .800,0.60D .1000,0.60[解析] 第二组的频率为1-0.25-0.20-0.10-0.05=0.40,所以兔子总数为4000.40=1000只,体重正常的频率为0.40+0.20=0.60.故选D .(理)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为导学号 52134840( C )A .6B .8C .12D .18[解析] 第一、二两组的频率为0.24+0.16=0.4 ∴志愿者的总人数为200.4=50(人). 第三组的人数为:50×0.36=18(人) 有疗效的人数为18-6=12(人)5.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:试根据样本估计总体的思想,估计约有__99%__的把握认为“喜爱该节目与否和性别有关”.导学号 52134841参考附表:(参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d )[解析] 分析列联表中数据,可得k 2=110×(40×30-20×20)260×50×60×50≈7.822>6.635,所以有99%的把握认为“喜爱该节目与否和性别有关”.6.某种产品的广告费支出x 与销售额y 之间有如下对应数据(单位:百万元).根据上表提供的数据,求出y 关于x 的线性回归方程为y ^=6.5x +17.5,则表中t 的值为__50__.导学号 52134842[解析] 由题意,x -=5,y -=40+t 5,且点(x -,y -)一定在回归直线y ^=6.5x +17.5上,代入得40+t5=6.5×5+17.5,解得t =50.7.为加强中学生实践、创新能力和团队精神的培养,促进教育教学改革,郑州市教育局举办了全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了解成绩情况,从中选取50名学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表,解答下列问题:导学号 52134843(1)若用系统抽样的方法抽取50个样本,现将所有学生随机地编号为000,001,002,…,199,试写出第二组第一位学生的编号;(2)求出a 、b 、c 、d 、e 的值(直接写出结果),并作出频率分布直方图;(3)若成绩在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人.[解析] (1)004(2)a ,b ,c ,d ,e 的值分别为13,4,0.30,0.08,1. 频率分布直方图如下:(3)由样本中成绩在80.5~90.5的频数为18,成绩在90.5~100.5的频数为4,可估计成绩在85.5~95.5的人数为11人,故获得二等奖的学生约为20050×11=44人.8.(2017·全国卷Ⅱ,19)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:导学号 52134844(1)设A 表示事件“旧养殖法的箱产量低于50 kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有90%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ). [解析] (1)旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,因此,事件A 的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表K 2=200×(62×66-34×38)100×100×96×104≈15.705. 由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.。

2018年高考数学 专题12.3 统计与统计案例试题 理

2018年高考数学 专题12.3 统计与统计案例试题 理

统计与统计案例【三年高考】1. 【2017课标3,理3】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A .月接待游客量逐月增加B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳【答案】A【解析】观察折线图,每年7月到8月折线图呈下降趋势,月接待游客量减少,选项A 说法错误;折线图整体呈现出增长的趋势,年接待游客量逐年增加,选项B 说法正确;每年的接待游客量七八月份达到最高点,即各年的月接待游客量高峰期大致在7,8月,选项C 说法正确;每年1月至6月的月折线图平稳,月接待游客量波动性更小,7月至12月折线图不平稳,月接待游客量波动性大,选项D 说法正确;2. 【2017山东,理5】为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为(A )160 (B )163 (C )166 (D )170【答案】C【解析】由已知22.5,160,160422.570,42470166x y a y ==∴=-⨯==⨯+= ,选C.3.【2017江苏,3】 某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 ▲ 件. 【答案】18【解析】所求人数为300601810000⨯=,故答案为18.4.【2017课标II ,理18】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg )某频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A 表示事件:“旧养殖法的箱产量低于50kg, 新养殖法的箱产量不低于50kg”,估计A 的概率;(2) 填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3) 根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01) 附:22()()()()()n ad bc K a b c d a c b d -=++++(2)根据箱产量的频率分布直方图得列联表()222006266343815.70510010096104K ⨯⨯-⨯=≈⨯⨯⨯由于15.705 6.635>,故有99%的把握认为箱产量与养殖方法有关。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

专题检测(七)统计与统计案例一、选择题1.(2018届高三·西安八校联考)某班对八校联考成绩进行分析,利用随机数法抽取样本时,先将60个同学按01,02,03,…,60进行编号,然后从随机数表第9行第5列的数开始向右读,则选出的第6个个体是()(注:下表为随机数表的第8行和第9行)6301 6378 5916 9555 6719 9810 5071 7512 8673 5807 44395238 793321 1234 2978 6456 0782 5242 0744 3815 5100 1342 99660279 54A.07B.25C.42 D.52解析:选D依题意得,依次选出的个体分别是12,34,29,56,07,52,…因此选出的第6个个体是52.2.(2016·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个解析:选D由图形可得各月的平均最低气温都在0 ℃以上,A正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,故B正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C正确;故D错误.3.为了了解高一、高二、高三学生的身体状况,现用分层抽样的方法抽取一个容量为1 200的样本,三个年级学生人数之比依次为k∶5∶3,已知高一年级共抽取了240人,则高三年级抽取的人数为()A.240 B.300C .360D .400解析:选C 因为高一年级抽取学生的比例为2401 200=15,所以k k +5+3=15,解得k =2,故高三年级抽取的人数为1 200×32+5+3=360.4.某同学为了解自己记忆成语的个数与所花费的时间(单位:秒)的关系,做了5次试验,收集到的数据如表所示,由最小二乘法求得的回归直线方程为y ^=0.74x +50.则m +n 的值为( ) A .130 B .129 C .121D .118 解析:选A 由表中数据得,x =30,y =15(61+m +n +81+89)=15(231+m +n ),将x =30,y =15(231+m +n )代入回归直线方程,得m +n =130.5.(2017·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( )A .5B .7C .10D .50解析:选D 根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50.6.为比较甲、乙两地某月11时的气温情况,随机选取该月中的5天,将这5天中11时的气温数据(单位:℃)制成如图所示的茎叶图,考虑以下结论:①甲地该月11时的平均气温低于乙地该月11时的平均气温 ②甲地该月11时的平均气温高于乙地该月11时的平均气温 ③甲地该月11时的气温的标准差小于乙地该月11时的气温的标准差 ④甲地该月11时的气温的标准差大于乙地该月11时的气温的标准差 其中根据茎叶图能得到的正确结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:选C 由茎叶图和平均数公式可得甲、乙两地的平均数分别是30,29,则甲地该月11时的平均气温高于乙地该月11时的平均气温,①错误,②正确,排除A 和B ;又甲、乙两地该月11时的标准差分别是s 甲=4+1+1+45=2,s 乙=9+1+4+45=185,则甲地该月11时的气温的标准差小于乙地该月11时的气温的标准差,③正确,④错误,故选项C 正确.7.(2017·石家庄一模)下列说法错误的是( ) A .回归直线过样本点的中心(x ,y )B .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C .对分类变量X 与Y ,随机变量K 2的观测值k 越大,则判断“X 与Y 有关系”的把握程度越小D .在回归直线方程y ^=0.2x +0.8中,当解释变量x 每增加1个单位时,预报变量y ^就增加0.2个单位解析:选C 根据相关定义知选项A 、B 、D 均正确;选项C 中,对分类变量X 与Y ,随机变量K 2的观测值k 越大,对判断“X 与Y 有关系”的把握程度越大,故C 错误.8.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数解析:选B 标准差能反映一组数据的稳定程度.故选B.9.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n },若a 3=8,且a 1,a 3,a 7成等比数列,则此样本的平均数和中位数分别是( )A .13,12B .13,13C .12,13D .13,14解析:选B 设等差数列{a n }的公差为d (d ≠0),a 3=8,a 1a 7=a 23=64,(8-2d )(8+4d )=64,即2d -d 2=0,又d ≠0,故d =2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为(4+22)×510=13,中位数为12+142=13.10.通过随机询问110名学生是否爱好打篮球,得到如下的列联表:附:K 2=n (ac -bd )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .参照附表:得到的正确结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“爱好打篮球与性别无关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好打篮球与性别有关”C .有99%以上的把握认为“爱好打篮球与性别无关”D .有99%以上的把握认为“爱好打篮球与性别有关”解析:选D 因为K 2=110×(40×30-20×20)260×50×60×50≈7.822>6.635,所以在犯错误的概率不超过1%的前提下,即有99%以上的把握认为“爱好打篮球与性别有关”.11.给出下列四个命题:①某班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中另一位同学的编号为23;②一组数据1,2,3,3,4,5的平均数、众数、中位数都相同; ③若一组数据a,0,1,2,3的平均数为1,则其标准差为2;④根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y ^=a ^+b ^x ,其中a ^=2,x =1,y =3,则b ^=1.其中真命题有( ) A .①②④ B .②④ C .②③④ D .③④解析:选B 在①中,由系统抽样知抽样的分段间隔为52÷4=13,故抽取的样本的编号分别为7号、20号、33号、46号,故①是假命题;在②中,数据1,2,3,3,4,5的平均数为16(1+2+3+3+4+5)=3,中位数为3,众数为3,都相同,故②是真命题;在③中,因为样本的平均数为1,所以a +0+1+2+3=5,解得a =-1,故样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,标准差为2,故③是假命题;在④中,回归直线方程为y ^=b ^x +2,又回归直线过点(x ,y ),把(1,3)代入回归直线方程y ^=b ^x +2,得b ^=1,故④是真命题.12.某中学为了普及奥运会知识和提高学生参加体育运动的积极性,举行了一次奥运知识竞赛.随机抽取了30名学生的成绩,绘成如图所示的茎叶图.若规定成绩在75分以上(包括75分)的学生为甲组,成绩在75分以下(不包括75分)的学生为乙组.已知在这30名学生中,甲组学生中有男生9人,乙组学生中有女生12人,则认为“成绩分在甲组或乙组与性别有关”的把握有( )A .90%B .95%C .99%D .99.9%附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解析:选B 根据茎叶图的知识作出2×2列联表为由列联表中的数据代入公式得K 2的观测值k =30×(9×12-3×6)212×18×15×15=5,因为5>3.841,故有95%的把握认为“成绩分在甲组或乙组与性别有关”.二、填空题13.如图是某学校一名篮球运动员在10场比赛中所得分数的茎叶图,则该运动员在这10场比赛中得分的中位数为________.解析:把10场比赛的所得分数按顺序排列:5,8,9,12,14,16,16,19,21,24,中间两个为14与16,故中位数为14+162=15.答案:1514.为了研究雾霾天气的治理,某课题组对部分城市进行空气质量调查,按地域特点把这些城市分成甲、乙、丙三组,已知三组城市的个数分别为4,y ,z 依次构成等差数列,且4,y ,z +4成等比数列,若用分层抽样抽取6个城市,则乙组中应抽取的城市个数为________.解析:由题意可得⎩⎪⎨⎪⎧2y =4+z ,y 2=4×(z +4),即⎩⎪⎨⎪⎧y =2+z2,y 2=4z +16,解得z =12,或z =-4(舍去),故y =8.所以甲、乙、丙三组城市的个数分别为4,8,12.因为一共要抽取6个城市,所以抽样比为64+8+12=14.故乙组城市应抽取的个数为8×14=2.答案:215.(2017·惠州三调)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表):由最小二乘法求得回归方程y ^=0.67x +a ^,则a ^的值为________. 解析:因为x =10+20+30+40+505=30,y =62+68+75+81+895=75,所以回归直线一定过样本点的中心(30,75),则由y ^=0.67x +a ^可得75=30×0.67+a ^,求得a ^=54.9.答案:54.916.(2017·合肥质检)某同学在高三学年的五次阶段性考试中,数学成绩依次为110,114,121,119,126,则这组数据的方差是________.解析:因为对一组数据同时加上或减去同一个常数,方差不变,所以本题中可以先对这5个数据同时减去110,得到新的数据分别为0,4,11,9,16,其平均数为8,根据方差公式可得s 2=15[(0-8)2+(4-8)2+(11-8)2+(9-8)2+(16-8)2]=30.8.答案:30.8。

相关文档
最新文档