2021届高考数学(理)培优专题提升训练精选精编《第17讲 统计与统计案例》(解析版)

合集下载

高中数学:统计与统计案例练习

高中数学:统计与统计案例练习

高中数学:统计与统计案例练习一、选择题1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100 名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1 : 3 : 5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为()领率组距A. 200 C. 400 0.0350.015B. 240D. 48010平均每周上网时间(h)解析:选C 设频率分布直方图中从左到右前3个小矩形的面积分别为A3K5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)X2 = 0.1.由于频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即尸=0.1.所以平均每周上网时间少于4h的学生所占比例为尸+3P=0.4,由此估计学生人数为0.4X1 000 =400.2. AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0〜50),二级良(51〜100),三级轻度污染(101〜150),四级中度污染(151〜200),五级重度污染(201〜300),六级严重污染(大于300).如图是昆明市2021年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2021年4月份空气质量优的天数为 ()A. 3B. 4C. 12D. 2142解析:选c 从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为 1 V.Z 22所以估计昆明市2021年4月份空气质量为优的天数为30X5=12,应选C.3.〔成都模拟〕某城市收集并整理了该市2021年1月份至10月份各月最低气温与最高气 温〔单位:C 〕的数据,绘制了下面的折线图.该城市各月的最低气温与最高气温具有较好的线性关系,那么根据折线图,以下结论错误 的是〔〕A.最低气温与最高气温为正相关B. 10月的最高气温不低于5月的最高气温C.月温差〔最高气温减最低气温〕的最大值出现在1月D.最低气温低于0C 的月份有4个解析:选D 在A 中,最低气温与最高气温为正相关,故A 正确;在B 中,10月的最高气温 不低于5月的最高气温,故B 正确;在C 中,月温差〔最高气温减最低气温〕的最大值出现在1月, 故C 正确:在D 中,最低气温低于0℃的月份有3个,故D 错误.应选D.4 .〔承德模拟〕为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取 了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体 中倾向选择生育二胎与倾向选择不生育二胎的人数比例图〔如下图〕,其中阴影局部表示倾向 选择生育二胎的对应比例,那么以下表达中错误的选项是〔〕A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关♦最高气温 ♦最低气温C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数解析:选C 由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关;倾向选择不 生育二胎的人员中,农村户籍人数少于城镇户籍人数;倾向选择生育二胎的人员中,男性人数为 60X60% =36,女性人数为40X60%=24,不相同.应选C.5 .(石家庄模拟)某学校48两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过 茎叶图比拟两个班兴趣小组成绩的平均值及标准差.3 4 28 8 4 6 8 65152①A 班兴趣小组的平均成绩高于B 班兴趣小组的平均成绩; ②B 班兴趣小组的平均成绩高于A 班兴趣小组的平均成绩; ③A 班兴趣小组成绩的标准差大于B 班兴趣小组成绩的标准差;@B 班兴趣小组成绩的标准差大于A 班兴趣小组成绩的标准差. 其中正确结论的编号为()A.①④C. ®®其方差为白义[(53—78尸+(62—78/ +…+ (95—78)2]=121.6, 那么其标准差为'121.6%11.03;45+48+5H -------- F91B 班兴趣小组的平均成成为'」=66,其方差为表义[(45—66)2+(48 - 66)2 + ... + (91-66)2] =169.2, 那么其标准差为1169.2%13.01.应选A.6 .某商场对某一商品搞活动,该商品每一个的进价为3元,销售价为8元,每天售出的 第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如下图,设M 个)为每天商 品的销量,M 元)为该商场每天箱售这种商品的利润.从日利润不少于96元的几天里任选2天, 那么选出的这2天日利润都是97元的概率为()4 5 5 1 6 2 7 38班8 3 6 4 5 3 4 02B.②③D.①③解析:选A A 班兴趣小组的平均成绩为 53+62+64+…+92+95--------------- ---------------- =785x, x=18, 19, y =<l95+(x-19)(4-3), x=20, 21, J5x, x=18, 19, 即 L176+x, x=20, 21.当日销量不少于20个时,日利泗不少于96元, 当日销量为20个时,日利润为96元, 当日销量为21个时,日利润为97元,日利泗为96元的有3天,记为日利泗为97元的有2天,记为人丛从中任选2天有 (.4),(〃石),(.力),(.1),3/),(48),3«),(c4),(.,8),(48),共 10 种情况.其中选出的这2天日利泗都是97元的有(A,8)1种情况. 故所求概率为关.应选B. 二、填空题7 .某小卖部销售某品牌饮料的零售价与销量间的关系统计如下:单价x/元 3.0 3.2 3.4 3.6 3.8 4.0 销量w 瓶504443403528x,y 的关系符合回归方程£=£+2其中分=-20.假设该品牌饮料的进价为2元,为使利润 最大,零售价应定为 元.解析:依题意得:x =3.5, y =40,A所以.=40—(- 20)X3.5=110,所以回归直线方程为f=-20x+110,利润 L = (A —2)(-20A + 110)= -201+ 150x-220,B 选• •1 - 9 1 - 5 A.C 解BioD.g由题意知频数(天)0 18 19 20 2 俏量〔个〕所以x=* = 3.75元时,利润最大.答案:3.758.某高校调查了200名学生每周的自习时间(单位:小时),制成了如下图的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是.解析:设所求的人数为〃,由频率分布直方图,自习时间不少于22.5小时的频率为(0.04+0.08 +0.16) X 2.5=0.7, n=0.7 X 200=140.答案:1409.为比拟甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:C) 制成如下图的茎叶图,甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,那么甲地该月11时的平均气温的标准差为.甲9 8 2 62 m 03 I解析:甲地该月11时的气温数据(单位:℃)为28,29,30,30+〃?,32;乙地该月11时的气温数据(单位:℃)为26,28,29,31,31,那么乙地该月11时的平均气温为(26+28+29+31+31计5 = 29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m + 32)+5 = 30,解得〃?=1,那么甲地该月11时的平均气温的标准差为嗝义[(28 - 30产+(29 - 30)2+(30 - 30/+(31 - 30/+(32 - 30户]=\(2.答案:^2三、解做题10.某篮球运发动的投篮命中率为50%,他想提升自己的投篮水平,制定了一个夏季练习计划,为了了解练习效果,执行练习前他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为463执行练习后也统计了10场比赛的得分,茎叶图如下图:0 8 91 2 4 4 5 6 82 1 3(1)请计算该篮球运发动执行练习后统计的10场比赛得分的中位数、平均得分与方差;⑵如果仅从执行练习前后统计的各10场比赛得分数据分析,你认为练习方案对该运发动的投篮水平的提升是否有帮助?为什么?解:(1)练习后得分的中位数为上芋=14.5;平均得分为8+9+12+14+14+15+16+18 + 21+23= 15:10方差为击义[(8—15)2 + (9 — 15>+(12 —15>+(14 — 15)2+(14 — 15> + (15 —15>+(16 — 15产+(18-15)2+(21-15)2+(23 —15)2]=20.6.(2)尽管中位数练习后比练习前稍小,但平均得分一样,练习前方差20.6小于练习前方差46.3, 说明练习后得分稳定性提升了(阐述观点合理即可),这是投篮水平提升的表现.故此练习方案对该篮球运发动的投篮水平的提升有帮助.11.(西安八校联考)在2021年俄罗斯世界杯期间,莫斯科的局部餐厅销售了来自中国的小龙虾,这些小龙虾均标有等级代码.为得到小龙虾等级代码数值x与销售单价y(单位:元)之间的关系,经统计得到如下数据:⑴销售单价),与等级代码数值x之间存在线性相关关系,求),关于x的线性回归方程(系数精确到0.1);(2)假设莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?参考公式:对于一组数据(xi1 ),3,光),…其回归直线f=源+2的斜率和截距的最小2Xyi一〃x y八 '। A — A——二乘估计分别为Z? = ----------------- a= y —b x .n _Xxr-n x 26 6参考数据:2>»=8 440, 2e = 25 564.—38+48 + 58 + 68 + 78 + 88解:(1)由题意,得x -■= 63,- 16.8+18.8+20.8 + 22.8 + 24+25.8 _y = 6 =21.5,yA_8 440 - 6X63X21.5〜h = ~~6Z—=25 564—6X63X63「026 A 2A — A 一a= y -bx =21.5-0.2X63 = 8.9.故所求线性回归方程为f=0.2x+8.9.⑵由(1)知,当%=98 时,>=0.2X98+8.9=28.5.・•・估计该等级的中国小龙虾销售单价为28.5元.12.(长沙模拟)某职称晋级评定机构对参加某次专业技术测试的100人的成绩进行了统计, 绘制的频率分布直方图如下图.规定80分以上者晋级成功,否那么晋级失败(总分值为100分).(1)求图中.的值;(2)估计该次测试的平均分不(同一组中的数据用该组的区间中点值代表);(3)根据条件完成下面2X2列联表,并判断能否有85%的把握认为“晋级成功〞与性别有关.P(K?2k)0.40 0.25 0.15 0.1()0.050.025k0.708 1.323 2.072 2.706 3.841 5.024解:(1)由频率分布直方图中各小长方形面积总和为1,得(2.+ 0.020+0.03.+0.040)义10=1,解得〃=0...5.⑵由频率分布直方图知洛小组的中点值依次是55,65,75,85,95, 对应的频率分别为0.05.30,0.40,0.20.05,那么估计该次测试的平均分为 x = 55X0.05 + 65X0.30 + 75X0.40 + 85X0.20 + 95X0.05 = 74(分). ⑶由频率分布直方图知,晋级成功的频率为0.20+0.05=0.25, 故晋级成功的人数为100X0.25 = 25,填写2X2列联表如下:晋级成功 晋级失败合计男 16 34 50 女 9 41 50 合计2575100100X(16X41 ——25X75X50X50^2,613>2.072,所以有85%的把握认为“晋级成功〞与性别有关.1 .为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单 位:小时)如下:248 256 232 243 188 268 278 266 289 312 274296 288 302 295 228 287 217 329 283K 2=n(acl-bc)2(1)完成下面的频率分布表,并作出频率分布直方图;(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时;(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.解:(1)频率分布表及频率分布直方图如下所示:0.0100 ——⑵由题意可得8乂(0.30+0.10+0.05) = 3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x =190X0.05 + 210X0.05 + 230X0.10 + 250X0.15 + 270X0.20 + 290X0.30 + 310X0.10 + 330X0.05 = 269(小时),所以样本的平均无故障连续使用时限为269小时.2 .海水养殖场进行某水产品的新、旧网箱养殖方法的产量比照,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg 〞,估计A 的概率;⑵填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量V50 kg箱产量250 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比拟. 附:P (心2)0.050 0.010 0.001 k3.841 6.635 10.8280.01500.0125频率 仇距0.0075 0.0050 0.0025.厂工丁丁丁丁厂!无故障连续使用时用/小时新养殖法、n(ad-bc)1 _ .K-= . , , ,,其中〃=a+/?+c+d.(a+Z?)(c 十d)(a十c)(Z?+d)解:⑴旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)X5=0.62.因此,事件A的概率估计值为0.62.⑵根据箱产量的频率分布直方图得到联表:K2=---------- -------------------- 15 705100X100 X 96X104由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图说明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.3.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得x =+£即=9.97,5=、*ZG L x )21 /=1 \ / 1O/=1/ 1 16 _ / 16 16 _=、/讳16 X 2比0.212, / L G-8.5)2^ 18.439,Z (x,- x )(L8.5)=—2.78,其中为为抽取的第i个零件的尺寸,i= 1,2, (16)(1)求⑶,i)(i= 12…,16)的相关系数二并答复是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(假设加V0.25,那么可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(刀-35,7 +3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(7 -35,7 +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(H,v)(i = 12…4的相关系数£(X,-7)(57-7)r=I ______/ / ・、/(),008公丫0・09・、/ £ d )2、/ £ 8 - 5 )216 _Z (XL x )(/—8.5)尸1解:(1)由样本数据得8,i)(i= 1,2,…,16)的相关系数为r= --------- /--- 1/16 _ / 16、/ Z (即- X C-8.5)2 -2.78剔除第13个数据,剩下数据的样本方差为aX 〔1 591.134 —9.22?—15X 10.022〕=0.008,A Q 这条生产线当天生产的零件尺寸的标准差的估计值为廊而比0.09.4.〔昆明模拟〕〞工资条里显红利,个税新政入民心〞.随着2021年新年钟声的敲响,我国 自1980年以来,力度最大的一次个人所得税〔简称个税〕改革迎来了全面实施的阶段.某IT 从业 者为了解自己在个税新政下能享受多少税收红利,绘制了他在26〜35岁〔2021〜2021年〕之间各 年的月平均收入〕,〔单位:千元〕的散点图:20・・・・ 16- ・ , 12- ., 8 ■ •4°123456789 io"年龄代码工注:年龄代码1~10分别对应年的26〜35岁⑴由散点图知,可用回归模型y=h\n x+a 拟合〕,与x 的关系,试根据有关数据建立〕,关于x 的回归方程;〔2〕如果该IT 从业者在个税新政下的专项附加扣除为3 000元/月,试利用〔1〕的结果,将月平 均收入视为月收入,根据新旧个税政策,估计他36岁时每个月少缴纳的个人所得税.1010 10 _10_ _ 10附注:参考数据:= 55,2〕〉= 155.5,N 〔即一x 〕2 =82.5,2 — x〕〔F — y 〕 = 94.9,26= i=li=li=lJ =1io _ io _ _15.1,2 缶- 1〕2=4.84,£〔力一 t 〕〔yi- y 〕 =242其中"=ln 为;取 In 11 =24,In 36=361=1 /=1参考公式:回归方程.=筋+味中斜率和截距的最小二乘估计分别为公= n ______ _X 〔出一〃〕〔.- V 〕 曰 A - A — -------------------------- \a= v —b u .Z 〔3一 〃 〕2月平均收入y千元解:(1)令 f=lnx,那么 y=bf+a10__Z & -,)()L y)24.2, b ~ ~__Z _痴_5ze —)2r=l10Zu-_2__155.5-_2_=而=-^-=15.55, t =苗A — A —a= y —b t = 15.55 —5X 1.51=8,所以〕,关于/的回归方程为〕,=5/+8.1015.1 lo"=L51由于/=lnx,所以y关于x的回归方程为y=51nx+8.⑵由⑴得,该IT从业者36岁时月平均收入为y=51n 11+8 = 5X2.4+8 = 20〔千元〕.旧个税政策下每个月应缴纳的个人所得税为1 500X3%+3 000X10%+4 500X20%+〔20 000-3 500-9 000〕X25% = 3 120〔元〕.新个税政策下每个月应缴纳的个人所得税为3 000X3%+〔20 000-5 OOO-3OOO-3 000〕X 10%=990〔元〕.故根据新旧个税政策,该IT从业者36岁时每个月少缴纳的个人所得税为3 120-990=2 130(70).I— 0 180.212X716X18.439 ',由于lrlV0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于7 =9.97,产0.212,由样本数据可以看出抽取的第13个零件的尺寸在(T—3s,7 + 3s)以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为右义(16义9.97—9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.162X?=16X0.212I2+16X9.972^1 591.134,。

高考数学统计与统计案例.doc

高考数学统计与统计案例.doc

高考数学统计与统计案例1.小吴一星期的总开支分布如图 1 所示,一星期的食品开支如图 2 所示,则小吴一星期的鸡蛋开支占总开支的百分比为()A.1%B.2%C.3%D.5%C[ 由图 1 所示,食品开支占总开支的 30%,由图 2 所示,鸡蛋开支占食品开支的30 = 1 ,30+40+100+80+ 50 101∴鸡蛋开支占总开支的百分比为30%×10=3%.故选 C.]2.(2019 德·州模拟 )某人到甲、乙两市各7 个小区调查空置房情况,调查得到的小区空置房的套数绘成了如图所示的茎叶图,则调查中甲市空置房套数的中位数与乙市空置房套数的中位数之差为()A.4B. 3C.2D.1B[ 由茎叶图可以看出甲、乙两市的空置房的套数的中位数分别是79,76,因此其差是 79- 76=3,故选 B.]3.某工厂对一批新产品的长度(单位: mm)进行检测,如图是检测结果的频率分布直方,据此估批品的中位数()A.20B. 25C.22.5D.22.75C[ 品的中位数出在概率是 0.5 的地方 . 自左至右各小矩形面依次0.1,0.2,0.4,⋯⋯,中位数是 x,由 0.1+0.2+0.08 ·(x-20)=0.5,得 x= 22.5,故 C.]4.(2019 ·三明模 )在某次高中数学中,随机抽取 90 名考生,其分数如所示,若所得分数的平均数,众数,中位数分 a, b, c, a,b,c 的大小关系 ()A.b<a<c B.c<b<aC.c<a<b D.b<c<a2 50+ 60D [算得平均a=593,众数b=50,中位数c= 2 =55,故b<c<a, A.]5.(2019 南·充模 )如表是我国某城市在2017 年 1 月份至 10 月份各月最低温与最高温 (℃ )的数据一表.月份 1 2 3 4 5 6 7 8 9 10最高温 5 9 9 11 17 24 27 30 31 21最低温-12 - 3 1 - 2 7 17 19 23 25 10 已知城市的各月最低温与最高温具有相关关系,根据一表,下列的是 ()A.最低温与最高温正相关B.每月最高温与最低温的平均在前8 个月逐月增加C.月温差 (最高温减最低温 )的最大出在 1 月D.1 月至 4 月的月温差 (最高温减最低温 )相于 7 月至 10 月,波性更大B[ 根据意,依次分析:于 A ,知城市的各月最低温与最高温具有相关关系,由数据分析可得最低温与最高温正相关, A 正确;于B,由表中数据,每月最高温与最低温的平均依次:-3.5,3,5,4.5,12,20.5,23,26.5,28,15.5,在前 8 个月不是逐月增加, B ;于 C,由表中数据,月温差依次: 17,12,8,13,10,7,8,7,6,11;月温差的最大出在 1 月,C 正确;于 D,有 C 的,分析可得 1 月至 4 月的月温差相于 7 月至 10 月,波性更大, D 正确;故B.]6.某中学的高中女生体重y(位: kg)与身高 x(位: cm)具有性相关关系,根据本数据 (x i, y i )(i =1,2,3,⋯, n),用最小二乘法近似得到回直^方程 y=0.85x-85.71,下列中不正确的是()A.y 与 x 具有正性相关关系––B.回直本点的中心( x , y )C.若中学某高中女生身高增加 1 cm,其体重增加0.85 kgD.若中学某高中女生身高160 cm,可断定其体重必50.29 kg^D[ 因回直方程 y=0.85x-85.71 中 x 的系数 0.85>0,因此 y 与 x 具有正性相关关系,所以 A 正确;由最小二乘法及回直方程的求解––可知回直本点的中心( x , y ),所以 B 正确;由于用最小二乘法得到的回直方程是估,而不是具体,若中学某高中女生身高增加 1 cm,其体重增加0.85 kg,所以 C 正确, D 不正确. ]7.(2018 ·永州三模 )党的十九大告明确提出:在共享等域培育增点、形成新能.共享是公众将置源通社会化平台与他人共享,而得收入的象.考察共享企活度的影响,在四个不同的企各取两个部行共享比,根据四个企得到的数据画出如下四个等高条形图,最能体现共享经济对该部门的发展有显著效果的图形是()D[ 根据四个列联表中的等高条形图可知,图中 D 中共享与不共享的企业经济活跃度的差异最大,它最能体现共享经济对该部门的发展有显著效果,故选D.]8.(2019 ·州模拟惠)已知 x 与 y 之间的几组数据如下表:x 1 2 3 4 5 6y 0 2 1 3 3 4假设根据上表数据所得的线性回归方程为^ ^ ^y= b +若某同学根据上表中的x a.前两组数据 (1,0)和 (2,2)求得的直线方程为y= b′ x+a′,则以下结论正确的是()^ ^ ^ ^A.b>b′, a>a′B.b>b′, a<a′^ ^ ^ ^C.b<b′, a>a′D.b<b′, a<a′C[ 由两组数据 (1,0)和(2,2)可求得直线方程为 y=2x-2,b′=2,a′=-^ 2.而利用线性回归方程的公式与已知表格中的数据,可求得 b =5 ^ – ^– 13 5==7,a= y -b x =6-771^^×2=-3,所以 b<b′,a>a′.]9.(2019 天·津模 )某校高中共有 720 人,其中理科生 480 人,文科生 240 人,采用分抽的方法从中抽取 90 名学生参加研,抽取理科生的人数________.48060[由分抽的定得抽取理科生的人数720×90=60.]–10.已知本数据x1,x2,⋯, x n的平均数 x = 5,本数据2x1+1,2x2 +1,⋯, 2x n+1 的平均数 ________.11[ 由 x1,x2,⋯,x n的平均数 x= 5,得 2x1+1,2x2+1,⋯,2x n+1 的平–均数 2 x +1= 2× 5+ 1= 11.]11.某学校随机抽取部分新生其上学所需(位:分 ),并将所得数据制成率分布直方(如 ),其中,上学所需的范是[0,100] ,本数据分 [0,20),[20,40),[40,60), [60,80), [80,100],(1)中的 x= ________;(2)若上学所需不少于 1 小的学生可申在学校住宿,校600 名新生中估有 ________名学生可以申住宿.0.0125 72[(1) 由率分布直方知20x= 1-20×(0.025+ 0.0065+ 0.003 +0.003),解得 x=0.0125.(2)上学不少于 1 小的学生的率0.12,因此估有0.12×600=72(人)可以申住宿. ]12.以下四个命题,其中正确的序号是________.①从匀速传递的产品生产流水线上,质检员每20 分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;^③在线性回归方程 y=0.2x+12 中,当解释变量x 每增加一个单位时,预报^变量 y平均增加 0.2 个单位;④对分类变量 X 与 Y 的统计量 K2来说, K2越小,“ X 与 Y 有关系”的把握程度越大.②③[①是系统抽样;对于④,统计量 K2越小,说明两个相关变量有关系的把握程度越小. ]。

2021届高考数学(理)一轮专题重组卷:第一部分专题二十统计、统计案例

2021届高考数学(理)一轮专题重组卷:第一部分专题二十统计、统计案例

专题二十统计、统计案例本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分150分,考试时间120分钟.第Ⅰ卷(选择题,共60分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.(2019·陕西榆林二中模拟)某方便面生产线上每隔15分钟抽取一包进行检验,该抽样方法为①,从某中学的40名数学爱好者中抽取5人了解学习负担情况,该抽样方法为②,那么①和②分别为()A.①系统抽样,②分层抽样B.①分层抽样,②系统抽样C.①系统抽样,②简单随机抽样D.①分层抽样,②简单随机抽样答案 C解析由随机抽样的特征可知,①为等距抽样,是系统抽样;②是简单随机抽样,故选C.2.(2019·湖南六校联考)对某两名高三学生在连续9次数学测试中的成绩(单位:分)进行统计得到如下折线图,下面是关于这两位同学的数学成绩分析.①甲同学的成绩折线图具有较好的对称性,故平均成绩为130分;②根据甲同学成绩折线图提供的数据进行统计,估计该同学平均成绩在区间[100,120]内;③乙同学的数学成绩与测试次号具有比较明显的线性相关性,且为正相关;④乙同学连续九次测验成绩每一次均有明显进步.其中正确的个数为()A.4 B.3 C.2 D.1答案 C解析甲同学的成绩折线图有较好的对称性,最高130分,平均成绩低于130分,①错误;根据甲同学成绩折线图提供的数据进行统计,估计该同学平均成绩在区间[100,120]内,②正确;乙同学的数学成绩与测试次号具有比较明显的线性相关性,具有正相关,③正确;乙同学在连续九次测验中第四次,第七次成绩较上一次有退步,故④不正确,故选C.3.(2019·贵阳监测)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是()A.15 B.18 C.20 D.25答案 A解析根据频率分布直方图,得第二小组的频率是0.04×10=0.4,∵频数是40,∴样本容量是400.4=100,又成绩在80~100分的频率是(0.01+0.005)×10=0.15,∴成绩在80~100分的学生人数是100×0.15=15.故选A.4.(2019·成都市高三第二次诊断性检测)为比较甲、乙两名篮球运动员的近期竞技状态,选取这两名球员最近五场比赛的得分制成如图所示的茎叶图,有以下结论:①甲最近五场比赛得分的中位数高于乙最近五场比赛得分的中位数;②甲最近五场比赛得分平均数低于乙最近五场比赛得分的平均数;③从最近五场比赛的得分看,乙比甲更稳定;④从最近五场比赛的得分看,甲比乙更稳定.其中所有正确结论的编号为()A.①③B.①④C.②③D.②④答案 C解析甲的中位数为29,乙的中位数为30,故①不正确;甲的平均数为29,乙的平均数为30,故②正确;从比分来看,乙的高分集中度比甲的高分集中度高,故③正确,④不正确.故选C.5.(2019·上海市复旦附中模拟)一个公司有8名员工,其中6名员工的月工资分别为5200,5300,5500,6100,6500,6600,另两名员工数据不清楚,那么8位员工月工资的中位数不可能是()A.5800 B.6000 C.6200 D.6400答案 D解析∵一个公司有8名员工,其中6名员工的月工资分别为5200,5300,5500,6100,6500,6600,∴当另外两名员工的工资都不超过5300时,中位数为5300+55002=5400,当另外两名员工的工资都不小于6500时,中位数为6100+65002=6300,∴8位员工月工资的中位数的取值区间为[5400,6300],∴8位员工月工资的中位数不可能是6400.故选D.6.(2019·河南省名校联考)如图给出的是某小区居民一段时间内访问网站的比例图,则下列选项中不超过21%的为()A.腾讯与百度的访问量所占比例之和B.网易与搜狗的访问量所占比例之和C.淘宝与论坛的访问量所占比例之和D.新浪与小说的访问量所占比例之和答案 B解析由于网易与搜狗的访问量所占比例之和为18%,不超过21%,故选B.7.(2019·济南模拟)随着我国经济实力的不断提升,居民收入也在不断增加.某家庭2018年全年的收入与2014年全年的收入相比增加了一倍,实现翻番.同时该家庭的消费结构随之也发生了变化,现统计了该家庭这两年不同品类的消费额占全年总收入的比例,得到了如下折线图:则下列结论中正确的是()A.该家庭2018年食品的消费额是2014年食品的消费额的一半B.该家庭2018年教育医疗的消费额与2014年教育医疗的消费额相当C.该家庭2018年休闲旅游的消费额是2014年休闲旅游的消费额的五倍D.该家庭2018年生活用品的消费额是2014年生活用品的消费额的两倍答案 C解析2018年食品消费占0.2,2014年食品消费占0.4,因2018年全年的收入与2014年全年的收入相比增加了一倍,所以两年的食品消费额相当,故A错误.2018年教育医疗消费占0.2,2014年教育医疗消费占0.2,因2018年全年的收入与2014年全年的收入相比增加了一倍,所以2018年教育医疗消费额是2014年的两倍,故B错误.2018年休闲旅游消费占0.25,2014年休闲旅游消费占0.1,因2018年全年的收入与2014年全年的收入相比增加了一倍,所以2018年休闲旅游的消费额是2014年的五倍,故C正确.2018年生活用品消费占0.3,2014年生活用品消费占0.15,因2018年全年的收入与2014年全年的收入相比增加了一倍,所以2018年生活用品消费额是2014年的四倍,故D错误.故选C.8.(2019·日照二模)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90后从事互联网行业者岗位分布条形图,则下列结论中不一定正确的是()注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中90后占一半以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后比80前多D.互联网行业中从事技术岗位的人数90后比80后多答案 D解析由题图易知互联网行业从业人员90后占56%,A正确;仅90后从事技术岗位的人数占总人数比为0.56×0.396=0.22176超过20%,B正确;90后从事运营岗位的人数占总人数比为0.56×0.17=0.0952>0.03,C正确;90后从事技术岗位的人数占总人数比为0.56×0.396=0.22176<0.41,而题中未给出80后从事互联网行业岗位分布情况,故D不一定正确.9.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是() A.中位数B.平均数C.方差D.极差答案 A解析中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.10.(2019·新疆高三一模)在发生某公共卫生事件期间,我国有关机构规定:“该事件在一段时间没有发生规模群体感染的标志为连续10天,每天新增加疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是()A.甲地总体均值为3,中位数为4B .乙地总体均值为2,总体方差大于0C .丙地中位数为3,众数为3D .丁地总体均值为2,总体方差为3答案 D解析 由于平均数和中位数不能限制某一天的病例超过7人,A 不正确;当总体方差大于0,不知道总体方差的具体数值,因此不能确定数据的波动大小,B 不正确;中位数和众数也不能限制某一天的病例超过7人,C 不正确;当总体平均数是2,若有一个数据超过7,则方差就超过3,D 正确.故选D.11.(2019·沈阳市东北育才学校高三一模)甲、乙两名同学6次考试的成绩统计如图,甲、乙两名同学成绩的平均数分别为x -甲、x -乙,标准差分别为σ甲,σ乙,则( )A.x -甲<x -乙,σ甲<σ乙B.x -甲<x -乙,σ甲>σ乙C.x -甲>x -乙,σ甲<σ乙D.x -甲>x -乙,σ甲>σ乙答案 C解析 甲、乙两名同学6次考试的成绩统计如图,甲、乙两名同学成绩的平均数分别为x -甲,x -乙,标准差分别为σ甲,σ乙,由折线图得x -甲>x -乙,σ甲<σ乙.故选C.12.(2019·南阳市一中第九次目标考试)为考察A ,B 两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图.根据图中信息,在下列各项中,说法最佳的一项是()A.药物B的预防效果优于药物A的预防效果B.药物A的预防效果优于药物B的预防效果C.药物A,B对该疾病均有显著的预防效果D.药物A,B对该疾病均没有预防效果答案 B解析由题图可得服用药物A的患病人数少于服用药物B的患病人数,而服用药物A的未患病人数多于服用药物B的未患病人数,所以药物A的预防效果优于药物B的预防效果.故选B.第Ⅱ卷(非选择题,共90分)二、填空题(本大题共4小题,每小题5分,共20分)13.(2019·江苏省海安高级中学月考)为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在区间[40,80]中,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在区间[40,60)内的汽车有________辆.答案80解析由频率分布直方图得,时速在区间[40,60)内的汽车的频率为(0.01+0.03)×10=0.4.∴时速在区间[40,60)内的汽车有0.4×200=80(辆).14.(2019·湖北名校4月模拟)某学校从编号依次为01,02,…,90的90个学生中用系统抽样(等间距抽样)的方法抽取一个样本,已知样本中相邻的两个组的编号分别为14,23,则该样本中来自第四组的学生的编号为________.答案32解析样本间隔为23-14=9,则第一个编号为5,第四个编号为23+9=32.15.(2019·兰州二模)某单位200名职工的年龄分布情况如图所示.现要从中抽取50名职工作样本,若采用分层抽样方法,则40~50岁年龄段应抽取________人.答案15解析40~50岁年龄段应抽取50×30%=15人.16.(2019·北京模拟)如图是某地区2002年至2018年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2020年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2002年至2018年的数据(时间变量t的值依次为1,2,…,17)建立模型①:y^=-30.4+13.5t;根据2012年至2018年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y^=99+17.5t.利用这两个模型,该地区2020年的环境基础设施投资额的预测值分别为________,________;并且可以判断利用模型________得到的预测值更可靠.答案226.1(亿元)256.5(亿元)②^=-30.4+13.5×19=226.1(亿元),解析①y^=99+17.5×9=256.5(亿元);②y当年份为2018时,对于模型①:t=17,y^=-30.4+13.5×17=199.1(亿元),对于模型②:t=7,y^=99+17.5×7=221.5(亿元),所以②的准确度较高,①偏差较大,所以选择模型②得到的预测值更可靠.三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)17.(本小题满分10分)(2019·徐州联考)某人在甲、乙两社区各经营一个小商品店,他记录了连续25天的营业额(单位:拾元),结果用茎叶图表示如下图.(1)根据茎叶图,对甲、乙两店的营业额作比较,写出两个统计结论;(2)若从两店营业额超过3300元的天中随机抽取4天作进一步分析,设抽到甲店的天数为X,求X的均值.解(1)由茎叶图可以得到如下结论:①乙店营业额的平均数大于甲店营业额的平均数.②甲店营业额较乙店营业额更分散.(或:乙店营业额较甲店营业额更集中(稳定).甲店营业额分散程度比乙店营业额的分散程度更大)③甲店营业额的中位数为3070元,乙店营业额的中位数为3180元.④乙店营业额基本上是对称的,而且大多集中在中间(均值附近).甲店营业额除一个特殊值(3520)外,也大致对称,其分布较均匀.(2)由茎叶图可知,两店营业额超过3300元的共有10天,其中,甲店有4天,乙店有6天.由题意得X可能的取值为0,1,2,3,4,P (X =0)=C 46C 410=114,P (X =1)=C 36C 14C 410=821, P (X =2)=C 26C 24C 410=37,P (X =3)=C 16C 34C 410=435, P (X =4)=C 44C 410=1210. 于是,X 的概率分布列如下:X0 1 2 3 4 P 114 821 37 435 1210故X 的均值E (X )=0×114+1×821+2×37+3×435+4×1210=5635.18.(本小题满分12分)(2019·广西联考)某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第x 年与年销售量y (单位:万件)之间的关系如表:x1 2 3 4 y 12 28 42 56(1)在图中画出表中数据的散点图;(2)根据(1)中的散点图拟合y 与x 的回归模型,并用相关系数加以说明;(3)建立y 关于x 的回归方程,预测第5年的销售量约为多少?参考数据: ∑4i =1 (y i -y -)2≈32.7,5≈2.24,∑4i =1x i y i =418. 参考公式:相关系数r =∑n i =1(x i -x -)(y i -y -)∑n i =1 (x i -x -)2∑n i =1 (y i -y -)2,回归方程y ^=a ^+b ^x 的斜率和截距的最小二乘估计分别为b^=∑ni =1(x i -x -)(y i -y -)∑ni =1(x i -x -)2=∑ni =1x i y i -n x -y-∑ni =1x 2i -n x-2,a ^=y --b^x -.解 (1)作出的散点图如图:(2)由(1)散点图可知,各点大致分布在一条直线附近,由题中所给表格及参考数据得,x -=52,y -=692,∑4i =1x i y i =418,∑4i =1(y i -y -)2≈32.7,∑4i =1x 2i =30,∑4i =1(x i -x -)(y i -y -)=∑4i =1x i y i -4x -y -=418-4×52×692=73,∑4i =1(x i -x -)2=∑4i =1x 2i -4x -2=30-4×⎝ ⎛⎭⎪⎫522=5≈2.24,∴r =∑4i =1 (x i -x -)(y i -y -)∑4i =1(x i -x -)2∑4i =1(y i -y -)2≈732.24×32.7≈0.9966.∵y 与x 的相关系数近似为0.9966,说明y 与x 的线性相关程度相当强, ∴可以用线性回归模型拟合y 与x 的关系.(3)由(2)知x -=52,y -=692,∑4i =1x i y i =418,∑4i =1x 2i =30,∴b^=∑4i =1x i y i -4x -y-∑4i =1x 2i -4x-2=735,a ^=y --b ^x -=692-735×52=-2.故y 关于x 的回归直线方程为y ^=735x -2, 当x =5时,y ^=735×5-2=71, ∴预测第5年的销售量约为71万件.19.(本小题满分12分)(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于 5.5”,根据直方图得到P (C )的估计值为0.70.(1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解 (1)由已知得0.70=a +0.20+0.15, 故a =0.35,b =1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.20.(本小题满分12分)(2019·晋江模拟)中国已经成为全球最大的电商市场,但是实体店仍然是消费者接触商品和品牌的重要渠道.某机构随机抽取了年龄介于10岁到60岁的消费者200人,对他们的主要购物方式进行问卷调查.现对调查对象的年龄分布及主要购物方式进行统计,得到如下图表:主要购物方式年龄阶段网络平台购物实体店购物总计40岁以下7540岁或40岁以上55总计(1)0.1%的前提下,认为消费者主要的购物方式与年龄有关?(2)用分层抽样的方法从通过网络平台购物的消费者中随机抽取8人,然后再从这8名消费者中抽取5名进行座谈.设抽到的消费者中40岁以下的人数为X,求X的分布列和数学期望.附:参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)临界值表:P(K2≥k0)0.0500.0250.0100.0050.001k0 3.841 5.024 6.6357.87910.828解0.3)=120人,40或40岁以上的消费者有80人,故根据数据完成列联表如下:主要购物方式年龄阶段网络平台购物实体店购物总计40岁以下 75 45 120 40岁或40岁以上25 55 80 总计1001002002K 2=200×(75×55-25×45)2120×80×100×100=754=18.75>10.828.故可以在犯错误的概率不超过0.1%的前提下,认为消费者主要的购物方式与年龄有关.(2)从通过网络平台购物的消费者中随机抽取8人,其中40岁以下的有6人,40岁或40岁以上的有2人,从这8名消费者中抽取5名进行座谈,设抽到的消费者中40岁以下的人数为X ,则X 的可能取值为3,4,5且P (X =3)=C 22C 36C 58=2056=514,P (X =4)=C 12C 46C 58=3056=1528,P (X =5)=C 02C 56C 58=656=328,则X 的分布列为X 3 4 5 P5141528328E (X )=3×514+4×1528+5×328=154=3.75. 故X 的数学期望为3.75.21.(本小题满分12分)(2019·昆明模拟)某县畜牧技术员张三和李四9年来一直对该县山羊养殖业的规模进行跟踪调查,张三提供了该县某山羊养殖场年养殖数量y (单位:万只)与相应年份x (序号)的数据表和散点图(如图所示),根据散点图,发现y 与x 有较强的线性相关关系,李四提供了该县山羊养殖场的个数z (单位:个)关于x 的回归方程z ^=-2x +30.(2)试估计:①该县第一年养殖山羊多少万只?②到第几年,该县养殖山羊的数量与第1年相比减少了?参考统计量:∑9i =1(x i -x -)2=60,∑9i =1(x i -x -)(y i -y -)=12.附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =βu +α的斜率和截距的最小二乘估计分别为β^=∑ni =1 (u i -u -)(v i -v -)∑ni =1(u i -u -)2,α^=v --β^u -.解 (1)设y 关于x 的线性回归方程为y =bx +a , x -=1+2+3+4+5+6+7+8+99=5,y -=1.2+1.5+1.6+1.6+1.8+2.5+2.5+2.6+2.79=2,b^=∑9i =1 (x i -x -)(y i -y -)∑9i =1 (x i -x -)2=1260=0.2,a^=2-0.2×5=1. 所以y 关于x 的线性回归方程为y ^=0.2x +1.(2)估计第x 年山羊养殖的只数为z ^·y ^=(0.2x +1)·(-2x +30)=-0.4x 2+4x +30. 令x =1,则-0.4+4+30=33.6, 故该县第一年养殖山羊约33.6万只. 由题意,得-0.4x 2+4x +30<33.6,整理得 (x -9)(x -1)>0,解得x >9或x <1(舍去),所以到第10年该县养殖山羊的数量相比第1年减少了.22.(本小题满分12分)(2019·北京东城一模)改革开放40年来,体育产业蓬勃发展反映了“健康中国”理念的普及.下图是我国2006年至2016年体育产业年增加值及年增速图.其中条形图为体育产业年增加值(单位:亿元),折线图为体育产业年增长率(%).(1)从2007年至2016年随机选择1年,求该年体育产业年增加值比前一年的体育产业年增加值多500亿元以上的概率;(2)从2007年至2016年随机选择3年,设X是选出的三年中体育产业年增长率超过20%的年数,求X的分布列与数学期望;(3)由图判断,从哪年开始连续三年的体育产业年增长率方差最大?从哪年开始连续三年的体育产业年增加值方差最大?(结论不要求证明)解(1)设A表示事件“从2007年至2016年随机选出1年,该年体育产业年增加值比前一年的体育产业年增加值多500亿元以上”.由题意可知,2009年,2011年,2015年,2016年满足要求,故P(A)=410=25.(2)由题意可知,X的所有可能取值为0,1,2,3,且2007年至2016年10年中有6年年增长率没超过20%,所以P(X=0)=C36C310=16,P(X=1)=C14C26C310=12,P(X=2)=C24C16C310=310,P(X=3)=C34C310=130.所以X的分布列为X 0123P 1612310130故X的数学期望E(X)=0×16+1×12+2×310+3×130=65.(3)从2008年或2009年开始连续三年的体育产业年增长率方差最大.从2014年开始连续三年的体育产业年增加值方差最大.莘莘学子,最重要的就是不要去看远方模糊的,而要做手边清楚的事。

高中数学【统计与统计案例】专题练习

高中数学【统计与统计案例】专题练习

高中数学【统计与统计案例】专题练习1.(多选)下列统计量中,能度量样本x 1,x 2,…,x n 的离散程度的是( ) A.样本x 1,x 2,…,x n 的标准差 B.样本x 1,x 2,…,x n 的中位数 C.样本x 1,x 2,…,x n 的极差 D.样本x 1,x 2,…,x n 的平均数 答案 AC解析 由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选AC.2.某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下: 旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7 新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x -和y -,样本方差分别记为s 21和s 22. (1)求x -,y -,s 21,s 22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y --x -≥2s 21+s 2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解 (1)x -=9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.710=10,y -=10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.510=10.3,s 21=0.22+0.32+0+0.22+0.12+0.22+0+0.12+0.22+0.3210=0.036,s 22=0.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.12+0.2210=0.04. (2)由(1)知,y --x -=0.3; 2s 21+s 2210=20.036+0.0410=20.007 6.又(y --x -)2=0.09>(20.007 6)2=0.030 4,则y --x ->2s 21+s 2210,所以新设备生产产品的该项指标的均值较旧设备有显著提高.3.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑20i =1x i =60,∑20i =1y i =1 200,∑20i =1(x i -x -)2=80,∑20i =1(y i-y -)2=9 000,∑20i =1(x i -x -)(y i -y -)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r =∑ni =1 (x i -x -)(y i -y -)∑n i =1(x i -x -)2∑n i =1 (y i -y -)2,2≈1.414.解 (1)由已知得样本平均数y -=120∑20i =1y i =60,从而该地区这种野生动物数量的估计值为60×200=12 000.(2)样本(x i ,y i )(i =1,2,…,20)的相关系数r =∑20i =1 (x i -x -)(y i -y -)∑20i =1(x i -x -)2∑20i =1(y i -y -)2=80080×9 000=223≈0.94.(3)分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.1.抽样方法抽样方法包括简单随机抽样、分层随机抽样,两种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 2.统计中的五个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数. (3)平均数:样本数据的算术平均数,即x -=1n (x 1+x 2+…+x n ).(4)第p 百分位数:将一组数据(共n 个)按从小到大排列,计算i =n ×p %,若i 不是整数,而大于i 的比邻整数为j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第(i +1)项数据的平均数.(5)方差与标准差.s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],s =1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].3.频率分布直方图的两个结论 (1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1. 4.回归分析与独立性检验(1)回归直线y ^=b ^x +a ^经过样本点的中心(x -,y -),若x 取某一个值代入回归直线方程y ^=b ^x +a ^中,可求出y 的估计值. (2)独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:X Y 合计 y 1 y 2 x 1 a b a +b x 2 c d c +d 合计a +cb +dn则χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d 为样本容量).热点一 用样本估计总体考向1 数字特征与统计图表的应用【例1】 (1)空气质量指数分为六级,指数越大说明污染的情况越严重,对人体危害越大,其中指数范围[0,50],[51,100],[101,150],[151,200],[201,300]分别对应“优”“良”“轻度污染”“中度污染”“重度污染”五个等级.如图是某市连续14天的空气质量指数趋势图,下列说法不正确的是( )A.这14天中有4天空气质量为“良”B.这14天中空气质量指数的中位数是103C.从2日到5日空气质量越来越差D.连续三天中空气质量指数方差最小的是9日到11日(2)2020年我国突发新冠肺炎疫情,疫情期间中小学生“停课不停学”.已知某地区中小学生人数情况如甲图所示,各学段学生在疫情期间“家务劳动”的参与率如乙图所示.为了进一步了解该地区中小学生参与“家务劳动”的情况,现用分层随机抽样的方法抽取4%的学生进行调查,则抽取的样本容量、抽取的高中生中参与“家务劳动”的人数分别为()A.2 750,200B.2 750,110C.1 120,110D.1 120,200答案(1)B(2)C解析(1)在这14天中,1日、3日、12日、13日的空气质量为良,共4天,故A正确.14天中空气质量指数的中位数为86+1212=103.5,故B错误.从2日到5日,空气质量指数越来越高,故空气质量越来越差,C正确.观察题图可得,9日至11日空气质量指数偏差最小,因此方差最小,D正确.综上知,说法不正确的是B.(2)学生总数为15 500+5 000+7 500=28 000(人),由于抽取4%的学生进行调查,则抽取的样本容量为28 000×4%=1 120.故高中生应抽取的人数为5 000×4%=200,而抽取的高中生中参与“家务劳动”的比率为0.55,故抽取的高中生中参与“家务劳动”的人数为200×0.55=110.探究提高 1.解题的关键是理解统计图表的含义,从中提取数字信息,平均数、众数、中位数描述数据的集中趋势,方差与标准差描述数据的波动大小,标准差、方差越小,数据的离散程度越小,越稳定.2.进行分层随机抽样的相关计算时,常用到的两个关系:(1)样本容量n总体的个数N=该层抽取的个体数该层的个体数;(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.【训练1】(1)以下数据为参加数学竞赛决赛的15人的成绩:(单位:分)78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是()A.90B.90.5C.91D.91.5(2)(多选) 2020年上半年,中国养猪企业受猪价高位的利好影响,大多收获史上最佳半年报业绩,部分企业半年报营业收入同比增长超过1倍.某养猪场抓住机遇,加大了生猪养殖规模,为了检测生猪的养殖情况,该养猪场对2 000头生猪的体重(单位:kg)进行了统计,得到如图所示的频率分布直方图,则下列说法正确的是()A.这2 000头生猪体重的众数为160 kgB.这2 000头生猪中体重不低于200 kg的有80头C.这2 000头生猪体重的中位数落在区间[140,160)内D.这2 000头生猪体重的平均数为152.8 kg答案(1)B(2)BCD解析(1)把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是90+912=90.5.(2)由频率分布直方图可知,[140,160)这一组的数据对应的小长方形最高,所以这2 000头生猪的体重的众数为150 kg,A错误;这2 000头生猪中体重不低于200 kg的有0.002×20×2 000=80(头),B正确;因为生猪的体重在[80,140)内的频率为(0.001+0.004+0.01)×20=0.3,在[140,160)内的频率为0.016×20=0.32,且0.3+0.32=0.62>0.5,所以这2 000头生猪体重的中位数落在区间[140,160)内,C正确;这2 000头生猪体重的平均数为(0.001×90+0.004×110+0.01×130+0.016×150+0.012×170+0.005×190+0.002×210)×20=152.8(kg),D正确.考向2用样本的频率分布估计总体分布【例2】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.探究提高 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.2.在例2中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.【训练2】(多选)为了更好地支持中小型企业的发展,某市决定对部分企业的税收进行适当的减免,现调查了当地100家中小型企业年收入(单位:万元)情况,并根据所得数据画出了如图所示的频率分布直方图,则下列结论正确的是()A.样本在区间[500,700]内的频数为18B.如果规定年收入在300万元以内的企业才能享受减免税收政策,估计有30%的当地中小型企业能享受到减免税收政策C.样本的中位数大于350万元D.可估计当地中小型企业年收入的平均数超过400万元(同一组中的数据用该组区间的中点值作代表)答案ABC解析依题意,(0.001+0.002+0.002 6×2+a+0.000 4)×100=1,所以a=0.001 4.对于A,样本在[500,700]内的频率为(0.001 4+0.000 4)×100=0.18,故频数为0.18×100=18,故A正确.对于B,年收入在300万元以内的频率为(0.001+0.002)×100=0.3,故B正确. 对于C,设样本的中位数为x,易知中位数位于[300,400]内,则0.3+(x-300)×0.002 6=0.5,解得x≈376.9,376.9>350,故C正确.因为样本的平均数为150×0.1+250×0.2+350×0.26+450×0.26+550×0.14+650×0.04=376<400,所以估计当地中小型企业年收入的平均数小于400万元,故D 错误. 热点二 回归分析【例3】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据进行了初步处理,得到如图所示散点图及一些统计量的值.x -y -w -∑8i =1(x i -x -)2∑8i =1(w i -w -)2∑8i =1(x i -x -)·(y i -y -) ∑8i =1(w i -w -)·(y i -y -) 46.65636.8289.8 1.61 469108.8表中w i =x i ,w -=18∑8i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个更适宜作为年销售量y 关于年宣传费x 的回归方程?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为:β^=∑ni =1(u i -u -)(v i -v -)∑n i =1(u i -u -)2,α^=v --β^u -.解 (1)由散点图可以判断,y =c +d x 更适宜作为年销售量y 关于年宣传费x 的回归方程.(2)易知w =x ,则y ^=d ^w +c ^.由题意得d ^=∑8i =1(w i -w -)(y i -y -)∑8i =1(w i -w -)2=108.81.6=68,所以c ^=y --d ^w -=563-68×6.8=100.6.所以y 关于w 的线性回归方程为y ^=100.6+68w , 所以y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值为y ^=100.6+6849=576.6,年利润z 的预报值为z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x =-x +13.6x +20.12,所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大. 探究提高 1.求回归直线方程的关键及实际应用 (1)关键:正确理解b ^,a ^的计算公式并准确地计算.(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 2.相关系数(1)当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关. (2)当|r |>0.75时,认为两个变量具有较强的线性相关关系.【训练3】 (多选)我国5G 技术研发试验在2016~2018年进行,分为5G 关键技术试验、5G 技术方案验证和5G 系统验证三个阶段.2020年初以来,5G 技术在我国已经进入高速发展的阶段,5G 手机的销量也逐渐上升.某手机商城统计了2021年5个月5G 手机的实际销量,如下表所示:若y 与x 线性相关,且求得线性回归方程为y ^=45x +5,则下列说法正确的是( ) A.a =142 B.y 与x 正相关C.y 与x 的相关系数为负数D.2021年7月该手机商城的5G 手机销量约为365部 答案 AB解析 x -=1+2+3+4+55=3,y -=50+96+a +185+2275=558+a 5,因为点(x -,y -)在回归直线上,所以558+a5=45×3+5,解得a =142,所以选项A 正确;从表格数据看,y 随x 的增大而增大,所以y 与x 正相关,所以选项B 正确;因为y 与x 正相关,所以y 与x 的相关系数为正数,所以选项C 错误;2021年7月对应的月份编号x =7,当x =7时,y ^=45×7+5=320,所以2021年7月该手机商城的5G 手机销量约为320部,所以选项D 错误.故选AB.热点三 独立性检验【例4】 为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO 2浓度(单位:μg/m 3),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO 2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:(3)根据(2)中的列联表,依据小概率值α=0.01的χ2独立性检验,能否认为该市一天空气中PM2.5浓度与SO 2浓度有关? 附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),解 (1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO 2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO 2浓度不超过150的概率的估计值为64100=0.64. (2)根据抽查数据,可得2×2列联表:(3)零假设为H 0:该市一天空气中PM2.5浓度与SO 2浓度无关.根据(2)的列联表得χ2=100×(64×10-16×10)280×20×74×26≈7.484>6.635=x 0.01.根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为该市一天空气中PM2.5浓度与SO 2浓度有关,此推断犯错误的概率不超过0.01. 探究提高 1.独立性检验的一般步骤 (1)根据样本数据列成2×2列联表; (2)根据公式χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),计算χ2的值;(3)查表比较χ2与临界值的大小关系,作统计判断.2.χ2的值越大,对应假设事件H 0成立(两类变量相互独立)的概率越小,H 0不成立的概率越大.【训练4】 甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)依据小概率值α=0.01的χ2独立性检验,能否认为甲机床的产品质量与乙机床的产品质量有差异?附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),α 0.050 0.010 0.001 x α3.8416.63510.828解 (1)根据2×2列联表知:甲机床生产的产品中一级品的频率为150200=75%, 乙机床生产的产品中一级品的频率为120200=60%.(2)零假设为H 0:甲机床的产品质量与乙机床的产品质量没有差异.由2×2列联表,得χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=400×(150×80-120×50)2270×130×200×200=40039≈10.256>6.635=x 0.01.根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异,此推断犯错误的概率不超过0.01.一、选择题1.设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为( ) A.0.01 B.0.1 C.1 D.10答案 C解析 10x 1,10x 2,…,10x n 的方差为102×0.01=1.2.为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( ) A.160 B.163 C.166 D.170答案 C解析 ∵x -=110∑10i =1x i =110×225=22.5,y -=110∑10i =1y i=160, ∴a ^=y --b ^x -=160-4×22.5=70, ∴回归直线方程为y ^=4x +70. 因此估计其身高y ^=4×24+70=166.3.从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A.10B.18C.20D.36答案 B解析 因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以零件的个数为0.225×80=18.4.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案 D解析由雷达图易知A,C正确;七月的平均最高气温超过20 ℃,平均最低气温约为12 ℃,一月的平均最高气温约为6 ℃,平均最低气温约为2 ℃,所以七月的平均温差比一月的平均温差大,B正确;由雷达图知平均最高气温超过20 ℃的月份有3个月,D错误.5.(多选) 5G时代已经到来,5G的发展将直接带动包括运营、制造、服务在内的通信行业整体的快速发展,进而对GDP增长产生直接贡献,并通过产业间的关联效应,间接带动国民经济各行业的发展,创造出更多的经济增加值.如图,某单位结合近年数据,对今后几年的5G经济产出作出预测.由上图提供的信息可知()A.运营商的经济产出逐年增加B.设备制造商的经济产出前期增长较快,后期放缓C.设备制造商在各年的总经济产出中一直处于领先地位D.信息服务商与运营商的经济产出的差距有逐步拉大的趋势 答案 ABD解析 对于A ,由图知,运营商的经济产出逐年增加,故A 正确;对于B ,由图知,设备制造商的经济产出在2020~2023年间增长较快,后几年增长逐渐趋于平缓,故B 正确;对于C ,由图可知,设备制造商在各年的总经济产出中在前期处于领先地位,而后期是信息服务商处于领先地位,故C 错误;对于D ,由图知,在2020~2025年间信息服务商与运营商的经济产出的差距不大,后几年中信息服务商的经济产出增长速度明显高于运营商的经济产出增长速度,两者间的差距有逐步拉大的趋势,故D 正确.综上所述,选ABD.6.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x -,方差为s 2,则( )A.x -=4,s 2<2B.x -=4,s 2>2 C.x ->4,s 2<2 D.x ->4,s 2>2答案 A解析 ∵某7个数的平均数为4,∴这7个数的和为4×7=28.∵加入一个新数据4,∴x -=28+48=4.又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s 2=7×2+(4-4)28=74<2,故选A.二、填空题 7.给出如下列联表非 30 50 80 合计5060110根据独立性检验,__________在犯错误的概率不超过0.01的前提下认为“高血压与患心脏病有关”(填“能”或“不能”). 答案 能解析 零假设为H 0:高血压与患心脏病无关. 由列联表中的数据可得 χ2=110×(20×50-10×30)230×80×50×60≈7.486>6.635=x 0.01,根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为高血压与患心脏病有关,此推断犯错误的概率不超过0.01,即能在犯错误的概率不超过0.01的前提下,认为高血压与患心脏病有关.8.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,测试成绩(单位:分)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x -,则m e ,m 0与x -的大小关系是________.答案 m 0<m e <x -解析 由图可知,30名学生的得分情况依次为得3分的有2人,得4分的有3人,得5分的有10人,得6分的有6人,得7分的有3人,得8分的有2人,得9分的有2人,得10分的有2人.中位数为第15、16个数(分别为5、6)的平均数,即m e =5.5.5出现的次数最多,故m 0=5,x -=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.于是得m 0<m e <x -.9.下面的折线图给出的是甲、乙两只股票在某年中每月的收盘价格,已知股票甲的极差是6.88元,标准差为2.04元;股票乙的极差为27.47元,标准差为9.63元,根据这两只股票在这一年中的波动程度,给出下列结论:①股票甲在这一年中波动相对较小,表现的更加稳定;②购买股票乙风险高但可能获得高回报;③股票甲的走势相对平稳,股票乙的收盘价格波动较大;④两只股票在全年都处于上升趋势.其中正确的结论是________(填序号).答案 ①②③解析 由题意可知,甲的标准差为2.04元,乙的标准差为9.63元,可知股票甲在这一年中波动相对较小,表现的更加稳定,故①正确;甲的极差是6.88元,乙的极差为27.47元,可知购买股票乙风险高但可能获得高回报,故②正确;通过折线图可知股票甲的走势相对平稳,股票乙的收盘价格波动较大,故③正确;通过折线图可得乙在6月到8月明显是下降趋势,故④错误. 三、解答题10.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:性别对该商场的服务 合计满意不满意(1)分别估计男、女顾客对该商场服务满意的概率;(2)依据小概率值α=0.05的χ2独立性检验,能否认为男、女顾客对该商场服务的评价有差异?附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6. (2)零假设为H 0:男、女顾客对该商场服务的评价没有差异. 由列联表中的数据,得 χ2=100×(40×20-30×10)250×50×70×30≈4.762>3.841=x 0.05.根据小概率值α=0.05的χ2独立性检验,我们推 断H 0不成立,即认为男、女顾客对商场服务的评价有差异,此推断犯错误的概率不大于0.05.11.某互联网公司为了确定下季度的前期广告投入计划,收集了近6个月广告投入量x (单位:万元)和收益y (单位:万元)的数据如表:他们分别用两种模型①y =bx +a ,②y =a e bx 进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值.x -y -∑6i =1x i y i∑6i =1x 2i7301 464.24 364(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由; (2)残差绝对值大于2的数据被认为是异常数据,需要剔除. (ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程; (ⅱ)若广告投入量x =18,则该模型收益的预报值是多少?附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为:b ^=∑n i =1(x i -x -)(y i -y -)∑n i =1(x i -x -)2=∑ni =1x i y i -nx -·y -∑n i =1x 2i -n ·x -2,a ^=y --b ^x -. 解 (1)由于模型①残差波动小,应该选择模型①. (2)(ⅰ)剔除异常数据,即3月份的数据, 剩下数据的平均数为x -=15×(7×6-6)=7.2,y -=15×(30×6-31.8)=29.64,∑5i =1x i y i -5x -·y -=206.4,∑5i =1x 2i -5·x -2=68.8. ∴b ^=206.468.8=3,a ^=y --b ^x -=29.64-3×7.2=8.04.∴所选模型的回归方程为y ^=3x +8.04. (ⅱ)若广告投入量x =18,则该模型收益的预报值是3×18+8.04=62.04(万元).12.(多选)2020年7月国家统计局发布了我国2020年上半年国内经济数据,图1为国内三大产业生产总值的比重,图2为第三产业中各行业生产总值的比重.以下关于我国2020年上半年经济数据的说法正确的是()A.在第三产业中,“批发和零售业”与“金融业”的生产总值之和同“其他服务业”的生产总值基本持平B.若“租赁和商务服务业”生产总值为15 000亿元,则“房地产业”生产总值为32 500亿元C.若“金融业”的生产总值为42 000亿元,则第三产业生产总值为262 500亿元D.若“金融业”的生产总值为42 000亿元,则第一产业生产总值为45 000亿元答案ABC解析对于选项A,在第三产业中,“批发和零售业”与“金融业”的生产总值之和占比为16%+16%=32%,“其他服务业”的生产总值占比为32%,所以“批发和零售业”与“金融业”的生产总值之和同“其他服务业”的生产总值基本持平,故选项A正确.对于选项B,若“租赁和商务服务业”生产总值为15 000亿元,在第三产业中,因为“租赁和商务服务业”生产总值占比为6%,所以第三产业生产总值为15 000=250 000(亿元),又“房地产业”生产总值占比为13%,所以“房地产6%业”生产总值为13%×250 000=32 500(亿元),故选项B正确.对于选项C ,在第三产业中,若“金融业”的生产总值为42 000亿元,因为“金融业”生产总值占比为16%,所以第三产业生产总值为42 00016%=262 500(亿元),故选项C 正确.对于选项D ,第三产业生产总值在三大产业中占比为57%,第一产业生产总值在三大产业中占比为6%,由C 选项知第三产业生产总值为262 500亿元,所以第一产业生产总值为262 50057%×6%≈27 632(亿元),所以选项D 错误.13.由于受到网络电商的冲击,某品牌的洗衣机在线下的销售受到影响,承受了一定的经济损失,现将A 地区200家实体店该品牌洗衣机的月经济损失统计如图所示,估算月经济损失的平均数为m ,中位数为n ,则m -n =________.答案 360解析 第一块小矩形的面积S 1=0.3,第二块小矩形的面积S 2=0.4,故n =2 000+0.5-0.30.000 2=3 000;又第四、五块小矩形的面积均为S =0.06,故a =12 000[1-(0.3+0.4+0.06×2)]=0.000 09,所以m =1 000×0.3+3 000×0.4+5 000×0.18+(7 000+9 000)×0.06=3 360,故m -n =360.14.某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y (单位:万件)的统计表:月份代码t 1 2 3 4 5 6 7 销售量y (万件)y 1y 2y 3y 4y 5y 6y 7但其中数据污损不清,经查证∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1(y i -y -)2=0.55.。

(新高三)暑期作业高考复习方法策略17讲_第17讲 统计与统计案例(含答案解析)

(新高三)暑期作业高考复习方法策略17讲_第17讲 统计与统计案例(含答案解析)

第17讲统计与统计案例统计与现实生活联系较为紧密,应用性非常强,理论要求低,难度不大,在复习中要深入课本,牢牢把握统计的基本思想和统计方法,掌握随机抽样、用样本估计总体、线性回归分析的方法.对于统计案例,知道回归分析、独立性检验的基本思想、方法及简单应用,会解决简单独立性检验问题.1.把握统计的基本思想.通过复习课本,从中提炼出统计的基本思想,即用样本估计总体,它主要研究两个主要问题,一是如何从总体中抽取样本,二是如何通过对所抽取的样本进行数据处理、分析,对总体的情况作出判断和分析.把握了统计的基本思想,就抓住了统计方法的主线.2.能根据样本的特点正确抽样.明确简单随机抽样、分层抽样与系统抽样的共同点,各自特点,适用范围,清楚它们之间的相互联系,用表格的形式把它们作一对比.3.掌握用样本估计总体的方法.利用图表分析数据是统计的基本要求,频率分布表、频数分布表、2×2列联表是统计数据的数字体现,频率分布直方图、茎叶图、散点图是统计数据的直观体现.会用样本的频率分布直方图、茎叶图估计总体分布,会用样本的数字特征估计总体的数字特征,会根据散点图判断两组变量的相关关系.4.了解回归分析、独立性检验的原理.对于回归分析、独立性检验,了解其基本思想、方法及简单应用即可,知道独立性检验的步骤,会按照公式计算,能和临界值表对照得出正确结论.例1某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11 B.12 C.13 D.14解后反思利用简单随机抽样抽取出的样本号码没有规律性;分层抽样中,在每一层抽取的号码个数m等于该层所含个体数目与抽样比的积,并且应该恰有m个号码在该层的号码段内;利用系统抽样取出的样本号码有规律性,其号码按从小到大的顺序排列,则所抽取的号码是:l,l+k,l+2k,…,l+(n-1)k.其中,n为样本容量,l是第一组中的号码,k为分段间隔=总体容量/样本容量.例2某市2013年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表.(2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.解后反思1.用样本估计总体是统计的基本思想,当样本容量较大时,将样本数据恰当分组,通过频率分布表或频率分布直方图,用各组的频率分布描述总体的分布.2.在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.例3从某居民区随机抽取10个家庭,获得第i个家庭的月收入x i(单位:千元)与月储蓄y i(单位:千元)的数据资料,算得(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;(2)判断变量x与y(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.解后反思2.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.例4某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”..附:K2=(a+b)(c+d)(a+c)(b+d)解后反思独立性检验是一种假设检验(先假设,再推翻假设),其基本思想类似反证法:(1)提出假设:即假设两个分类变量没有关系;(2)在此假设下随机变量K2应该很小,如果由观测数据计算得到K2的观测值k很大,则在一定程度上说明假设不合理.然后根据随机变量K2的含义,评价该假设不合理的程度,继而得出在多大程度上认为两个分类变量有关系.总结感悟1.用样本估计总体是统计的基本思想,科学的统计方法是保证.一要合理抽样,使样本更具有代表性,二要对所抽取的样本进行数据处理、分析,对总体的情况作出判断.2.利用图表分析数据是统计的基本方法,能熟练作频率分布表、频数分布表、2×2列联表,它们是作图、计算的基础,频率分布直方图、茎叶图、散点图,是统计数据的直观体现,是识图和用图的基础.3.独立性检验是一种假设检验(先假设,再推翻假设),其基本思想类似反证法.A级1.为了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样2.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480C.450 D.1203.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y^=0.85x-85.71,则下列结论中不正确...的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg4.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()A.0.2 B.0.4 C.0.5 D.0.65.一个容量为20的样本,数据的分组及各组的频数如下:[10,20),2;[20,30),3;[30,40),x;[40,50),5;[50,60),4;[60,70),2;则x=________;根据样本的频率分布估计,数据落在[10,50)的概率约为________.6.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号,分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人.7.下面茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,若乙的平均分是89,求被污损的数字.B级8.已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得的线性回归方程可能是()A.y=0.4x+2.3 B.y=2x-2.4C.y=-2x+9.5 D.y=-0.3x+4.49.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e,众数为m o,平均值为x,则()A.m e=m o=x B.m e=m o<xC.m e<m o<x D.m o<m e<x10.(2015·全国Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图.以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关11.某中学为了解学生数学课程的学习情况,在 3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测这3 000名学生在该次数学考试中成绩小于60分的学生数是________.12.下表是某数学老师及他的爷爷、父亲和儿子的身高数据:身高为________.13.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n.14.为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:kg),并将所得数据分组,画出频率分布直方图(如图所示).(1)在下面表格中填写相应的频率;(2)估计数据落在[1.15,1.30中的概率为多少;(3)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条.请根据这一情况来估计该水库中鱼的总条数.第17讲 统计与统计案例题型分析例1 B [由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12(人).] 例2 解 (1)频率分布表:(2)频率分布直方图如图所示.(3)答对下述两条中的一条即可:①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,共有17天,占当月天数的1730,超过50%;说明该市空气质量有待进一步改善.例3 解 (1)由题意知n =10,x =1n ∑i =1n x i =8010=8,y =1n ∑i =1n y i =2010=2,又l xx =错误!i y i -n x y =184-10×8×2=24,由此得b=l xyl xx=2480=0.3,a=y-b x=2-0.3×8=-0.4,故所求线性回归方程为y=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(b=0.3>0),故x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).例4解(1)300×4 50015 000=90,所以应收集90位女生的样本数据.(2)由频率分布直方图得1-2×(0.025+0.100)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有300×0.75=225(人)的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表结合列联可算得K 2=300×(45×60-165×30)275×225×210×90=10021≈4.762>3.841.所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”. 线下作业1.C [不同的学段在视力状况上有所差异,所以应该按照学段分层抽样.] 2.B [少于60分的学生人数600×(0.05+0.15)=120(人), ∴不少于60分的学生人数为480人.]3.D [根据线性回归方程中各系数的意义求解. 由于线性回归方程中x 的系数为0.85,因此y 与x 具有正的线性相关关系,故A 正确. 又线性回归方程必过样本点的中心(x ,y ),因此B 正确.由线性回归方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,故C 正确.当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值,因此D 不正确.]4.B [10个数据落在区间[22,30)内的数据有22,22,27,29,共4个,因此,所求的频率为410=0.4.故选B.] 5.4 0.7解析 x =20-(2+3+5+4+2)=4, P =2+3+4+520=0.7或P =1-4+220=0.7.6.37 20解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x 人,则40200=x100,解得x =20.7.解 设污损的数字对应的成绩是x ,由茎叶图可得89×5=83+83+87+x +99,所以x =93,故污损的数字是3.8.A [因为变量x 和y 正相关,则回归直线的斜率为正,故可以排除选项C 和D.因为样本点的中心在回归直线上,把点(3,3.5)分别代入选项A 和B 中的直线方程进行检验,可以排除B ,故选A.]9.D [由题目所给的统计图示可知,30个得分中,按大小顺序排好后,中间的两个得分为5,6,故中位数m e =6+52=5.5, 又众数m o =5,平均值x =3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=17930,∴m o <m e <x .]10.D [从2006年起,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A 选项正确; 2007年二氧化硫排放量较2006年降低了很多,B 选项正确;虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,即C 选项正确;自2006年以来我国二氧化硫年排放量与年份负相关,D 选项错误,故选D.] 11.600解析 由频率分布直方图易得,成绩低于60分的频率为0.002×10+0.006×10+0.012×10=0.2,故3 000名学生中成绩低于60分的学生数为:3 000×0.2=600(人).12.185 cm13.解总体容量为6+12+18=36.当样本容量是n时,由题意知,系统抽样的间隔为36n,分层抽样的比例是n36,抽取的工程师人数为n36×6=n6,技术员人数为n36×12=n3,技工人数为n36×18=n2,所以n应是6的倍数,36的约数,即n=6,12,18.当样本容量为(n+1)时,总体容量是35人,系统抽样的间隔为35n+1,因为35n+1必须是整数,所以n只能取6.即样本容量n=6.14.解(1)根据频率分布直方图可知,频率=组距×(频率/组距),故可得下表:(2)0.30+0.15+0.02=0.47,所以数据落在[1.15,1.30)中的概率约为0.47.(3)120×1006=2 000,所以水库中鱼的总条数约为2 000.。

高考数学统计与统计案例专题卷(附答案)

高考数学统计与统计案例专题卷(附答案)

高考数学统计与统计案例专题卷(附答案)一、单选题1.新高考改革后,某校2000名学生参加物理学考,该校学生物理成绩的频率分布直方图如图所示,若规定分数达到90分以上为A级,则该校学生物理成绩达到A级的人数是()A. 600B. 300C. 60D. 302.国庆70周年庆典磅礴而又欢快的场景,仍历历在目.已知庆典中某省的游行花车需要用到某类花卉,而该类花卉有甲、乙两个品种,花车的设计团队对这两个品种进行了检测.现从两个品种中各抽测了10株的高度,得到如下茎叶图.下列描述正确的是()A. 甲品种的平均高度大于乙品种的平均高度,且甲品种比乙品种长的整齐B. 甲品种的平均高度大于乙品种的平均高度,但乙品种比甲品种长的整齐C. 乙品种的平均高度大于甲品种的平均高度,且乙品种比甲品种长的整齐D. 乙品种的平均高度大于甲品种的平均高度,但甲品种比乙品种长的整齐3.某次歌唱比赛中,7位评委为某选手打出的分数分别为83,91,91,94,94,95,96,去掉一个最高分和一个最低分后,所剩数据的平均数为()A. 94B. 93C. 92D. 914.为了解某市居民用水情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨).将数据按照,…,分成9组,绘制了如图所示的频率分布直方图.政府要试行居民用水定额管理,制定一个用水量标准.使的居民用水量不超过,按平价收水费,超出的部分按议价收费,则以下比较适合做为标准的是()A. 2.5吨B. 3吨C. 3.5吨D. 4吨5.某校高三年级有男生220人,学籍编号为1,2,...,220;女生380人,学籍编号为221,222, (600)为了解学生学习的心理状态,按学籍编号采用系统抽样的方法从这600名学生中抽取10人进行问卷调查(第一组采用简单随机抽样,抽到的号码为10),再从这10名学生中随机抽取3人进行座谈,则这3人中既有男生又有女生的概率是()A. B. C. D.6.如图的折线图是某超市2018年一月份至五月份的营业额与成本数据,根据该折线图,下列说法正确的是()A. 该超市2018年的前五个月中三月份的利润最高B. 该超市2018年的前五个月的利润一直呈增长趋势C. 该超市2018年的前五个月的利润的中位数为0.8万元D. 该超市2018年前五个月的总利润为3.5万元7.为了从甲、乙两组学生中选一组参加“喜迎祖国七十华诞,共建全国文明城市”知识竞赛活动,班主任老师将这两组学生最近6次的测试成绩进行统计,得到如图所示的茎叶图.若甲、乙两组的平均成绩分别是,则下列说法正确的是()A. ,乙组比甲组成绩稳定,应选乙组参加竞赛B. ,甲组比乙组成绩稳定,应选甲组参加竞赛C. ,甲组比乙组成绩稳定,应选甲组参加竞赛D. ,乙组比甲组成绩稳定,应选乙组参加竞赛8.为了节能减排,发展低碳经济,我国政府从2001年起就通过相关政策推动新能源汽车产业发展.下面的图表反映了该产业发展的相关信息:根据上述图表信息,下列结论错误的是()A. 2017年3月份我国新能源汽车的产量不超过万辆B. 2017年我国新能源汽车总销量超过万辆C. 2018年8月份我国新能源汽车的销量高于产量D. 2019年1月份我国插电式混合动力汽车的销量低于万辆9.某学校运动会的立定跳远和秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为名学生的预赛成绩,其中有三个数据模糊.秒跳绳(单位:次)在这名学生中,进入立定跳远决赛的有人,同时进入立定跳远决赛和30秒跳绳决赛的有6人,则()A. 号学生进入秒跳绳决赛B. 号学生进入秒跳绳决赛C. 号学生进入秒跳绳决赛D. 号学生进入秒跳绳决赛10.2010-2018年之间,受益于基础设施建设对光纤产品的需求,以及个人计算机及智能手机的下一代规格升级,电动汽车及物联网等新机遇,连接器行业增长呈现加速状态.根据该折线图,下列结论正确的个数为()①每年市场规模量逐年增加;②增长最快的一年为2013~2014;③这8年的增长率约为40%;④2014年至2018年每年的市场规模相对于2010年至2014年每年的市场规模,数据方差更小,变化比较平稳A. 1B. 2C. 3D. 4二、填空题(共7题;共7分)11.己知随机变量与有相关关系,当时,的预报值为________.12.若数据的方差为,则________.13.某学校高一、高二、高三年级的学生人数成等差数列,现用分层抽样的方法从这三个年级中抽取90人,则应从高二年级抽取的学生人数为________.14.某班的全体学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为:、、、,若低于分的人数是,则成绩不低于分的学生人数是________.15.已知样本7,8,9,的平均数是9,且,则此样本的方差是________.16.某中学采用系统抽样方法,从该校高三年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号.已知从33~48这16个数中取的数是42,则在第1小组1~16中随机抽到的数是________.17.2020年年初,新冠肺炎疫情袭击全国.口罩成为重要的抗疫物资,为了确保口罩供应,某工厂口罩生产线高速运转,工人加班加点生产.设该工厂连续5天生产的口罩数依次为,,,,(单位:十万只),若这组数据,,,,的方差为1.44,且,,,,的平均数为4,则该工厂这5天平均每天生产口罩________十万只.三、解答题(共6题;共60分)18.每年的12月4日为我国“法制宣传日”.天津市某高中团委在2019年12月4日开展了以“学法、遵法、守法”为主题的学习活动.已知该学校高一、高二、高三的学生人数分别是480人、360人、360人.为检查该学校组织学生学习的效果,现采用分层抽样的方法从该校全体学生中选取10名学生进行问卷测试.具体要求:每位被选中的学生要从10个有关法律、法规的问题中随机抽出4个问题进行作答,所抽取的4个问题全部答对的学生将在全校给予表彰.(1)求各个年级应选取的学生人数;(2)若从被选取的10名学生中任选3人,求这3名学生分别来自三个年级的概率;(3)若被选取的10人中的某学生能答对10道题中的7道题,另外3道题回答不对,记表示该名学生答对问题的个数,求随机变量的分布列及数学期望.19.清华大学自主招生考试题中要求考生从A,B,C三道题中任选一题作答,考试结束后,统计数据显示共有600名学生参加测试,选择A,B,C三题答卷数如下表:(Ⅰ)负责招生的教授为了解参加测试的学生答卷情况,现用分层抽样的方法从600份答案中抽出若干份答卷,其中从选择A题作答的答卷中抽出了3份,则应分别从选择B,C题作答的答卷中各抽出多少份?(Ⅱ)测试后的统计数据显示,A题的答卷得优的有60份,若以频率作为概率,在(Ⅰ)问中被抽出的选择A题作答的答卷中,记其中得优的份数为,求的分布列及其数学期望.20.近年来,国资委.党委高度重视扶贫开发工作,坚决贯彻落实中央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效,某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积以及相应的管理时间的关系如下表所示:土地使用面积(单位:亩) 1 2管理时间(单位:月)并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:参考公式:其中.临界值表:0.100 0.050 0.025 0.010 0.001参考数据:(1)求出相关系数的大小,并判断管理时间与土地使用面积是否线性相关?(2)是否有99.9%的把握认为村民的性别与参与管理的意愿具有相关性?(3)若以该村的村民的性别与参与管理意愿的情况估计贫困县的情况,则从该贫困县中任取3人,记取到不愿意参与管理的男性村民的人数为,求的分布列及数学期望.21.出版商为了解某科普书一个季度的销售量y(单位:千本)和利润x(单位:元/本)之间的关系,对近年来几次调价之后的季销售量进行统计分析,得到如下的10组数据.根据上述数据画出如图所示的散点图:参考公式及参考数据:①对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归直线的斜率和截距的公式分别为, .②参考数据:表中u i=Inx i,= .另:In4.06≈1.40.计算时,所有的小数都精确到0.01.(1)根据图中所示的散点图判断y=ax+b和y=clnx+d哪个更适宜作为销售量y关于利润x的回归方程类型?(给出判断即可,不需要说明理由);(2)根据(1)中的判断结果及参考数据,求出y关于x的回归方程;(3)根据回归方程分析:设该科普书一个季度的利润总额为:(单位:千元),当季销售量y为何值时,该书一个季度的利润总额预报值最大?(季利润总额=季销售量×每本书的利润)22.某险种的基本保费为(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:(I)记A为事件:“一续保人本年度的保费不高于基本保费”.求P(A)的估计值;(Ⅱ)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求P(B)的估计值;(Ⅲ)求续保人本年度的平均保费估计值.23.为了研究55岁左右的中国人睡眠质量与心脑血管病是否有关联,某机构在适龄人群中随机抽取了100万个样本,调查了他们每周是否至少三个晚上出现了三种失眠症状,症状:入睡困难;症状:醒得太早;症状:不能深度入睡或做梦,得到的调查数据如下:数据1:出现症状人数为8.5万,出现症状人数为9.3万,出现症状人数为6.5万,其中含症状同时出现1.8万人,症状同时出现1万人,症状同时出现2万人,症状同时出现0.5万人;数据2:同时有失眠症状和患心脑血管病的人数为5万人,没有失眠症状且无心脑血管病的人数为73万人.(Ⅰ)依据上述数据试分析55岁左右的中国人患有失眠症的比例大约多少?(Ⅱ)根据以上数据完成如下列联表,并根据所填列联表判断能否有95%的把握说明失眠与心脑血管病存在“强关联”?参考数据如下:0.500.05参考公式:答案一、单选题1. B2. D3. B4. B5. D6. D7. D8. D9. B 10. C二、填空题11. 7 12. 13. 30 14. 15 15. 2 16. 10 17. 1.6三、解答题18. (1)解:由题意,知高一、高二、高三年级的人数之比为,由于采用分层抽样方法从中选取人,因此,高一年级应选取人,高二年级应选取人,高三年级应选取人.(2)解:由(1)知,被选取的名学生高一、高二、高三年级分别有人、人、人,所以,从这名学生任选名,且名学生分别来自三个年级的概率为.(3)解:由题意知,随机变量的所有可能取值为,且服从超几何分布,().所以,随机变量的分布列为所以,随机变量的数学期望为.19. 解:解:(Ⅰ)由题意可得:应分别从B,C题的答卷中抽出5份,2份.(Ⅱ)由题意可知,A题答案得优的概率为,显然被抽出的A题的答案中得优的份数x的可能取值为0,1,2,3,且.;;;随机变量x的分布列为:所以.20. (1)解:依题意:故则,故管理时间与土地使用面积线性相关.(2)解:依题意,完善表格如下:计算得的观测值为故有99.9%的把握认为村民的性别与参与管理的意愿具有相关性.(3)解:依题意,的可能取值为0,1,2,3,从该贫困县中随机抽取一名,则取到不愿意参与管理的男性村民的概率为,故故的分布列为则数学期望为(或由,得21. (1)解:y=cln x+d更适宜作为销售量y关于利润x的回归方程类型(2)解:令u=lnx,先建立y关于u的线性回归方程,由于,=6.63+10.20×1.75=24.48,所以x关于u的线性回归方程为=24.48-10.20u,即y关于x的回归方程为=24.48-10.20lnx.(3)解:由题意得z=xy=x(24.48-10.20lnx),z'=[x(24.48-10.20lnx)]'=14.28-10.20lnx,令z'=0 即14.28-10.20lnx=0,解得lnx=1.40,所以x≈4.06.当x∈(0,4.06)时,z'>0,所以z在(0,4.06)上单调递增,当x∈(4.06,+∞)时,z'<0,所以z在(4.06,+∞)上单调递减,所以当x=4.06时,即季销量y=10.20千本时,季利润总额预报值最大22. 解:(I)记A为事件:“一续保人本年度的保费不高于基本保费”.事件A的人数为:60+50=110,该险种的200名续保,P(A)的估计值为:;(Ⅱ)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.事件B的人数为:30+30=60,P(B)的估计值为:;(Ⅲ)续保人本年度的平均保费估计值为1.1925a.23. 解:(Ⅰ)设{出现症状的人}、{出现症状的人}、{出现症状的人}(表示有限集合元素个数)根据数据1可知,,,,所以得患失眠症总人数为20万人,比例大约为20%(Ⅱ)根据数据2可得:有95%的把握说明失眠与中风或心脏病存在“强关联”.第11 页共11 页。

高考数学(命题热点突破)专题17 统计与统计案例 文(2021年最新整理)

高考数学(命题热点突破)专题17 统计与统计案例 文(2021年最新整理)

2017年高考数学(考点解读+命题热点突破)专题17 统计与统计案例文编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2017年高考数学(考点解读+命题热点突破)专题17 统计与统计案例文)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2017年高考数学(考点解读+命题热点突破)专题17 统计与统计案例文的全部内容。

专题17 统计与统计案例文【命题热点突破一】抽样方法某工厂生产的甲、乙、丙、丁四种不同型号的产品分别有150件、120件、180件、150件.为了调查产品的情况,需从这600件产品中抽取一个容量为100的样本,若采用分层抽样法,设甲产品中应抽取的产品件数为x,某件产品A被抽到的概率为y,则x,y的值分别为()A.25,错误! B.20,错误!C.25,错误! D.25,错误!【答案】D【特别提醒】三种抽样方法均是等概率抽样,当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.【变式探究】从编号分别为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为10的样本,若编号为58的产品在样本中,则该样本中产品的最大编号为________.【答案】74【解析】每8件产品抽取一件,编号为58的产品在样本中,则样本中产品的最大编号为58+16=74.【命题热点突破二】用样本估计总体【2016高考山东】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20), [20,22.5),[22。

5,25),[25,27.5),[27.5,30).根据直方图,这200名学生中每周的自习时间不少于22。

2021高考数学一复习统计与统计案例专项练习(含答案)题型归纳

2021高考数学一复习统计与统计案例专项练习(含答案)题型归纳

2021高考数学一复习统计与统计案例专项练习(含答案)题型归纳每一门科学都有其建立、发展和客观条件,统计科学则是统计工作经验、社会经济理论、计量经济方法融合、提炼、发展而来的一种边缘性学科。

以下是____-____高考数学一复习统计与统计案例专项练习,请考生掌握。

一、选择题11.(文)(____重庆理,3)已知变量_与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得线性回归方程可能为()A.=0.4_+2.3B.=2_-2.4C.=-2_+9.5D.=-0.3_+4.4[答案] A[解析] 因为变量_和y正相关,所以回归直线的斜率为正,排除C、D;又将点(3,3.5)代入选项A和B的方程中检验排除B,所以选A.(理)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,收集数据如下:零件数_(个) 10 20 30 40 50 60 70 80 加工时间y(min) 62 68 75 81 89 95 102 108 设回归方程为y=b_+a,则点(a,b)在直线_+45y-10=0的()A.左上方B.左下方C.右上方D.右下方[答案] C[解析] =45,=85,a+45b=85,a+45b-100,故点(a,b)在直线_+45y-10=0的右上方,故选C.12.(____沈阳市质检)某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机调查了24名笔试者的成绩,如下表所示:分数段 [60,65) [65,70) [70,75) [75,80) [80,85) [85,90) 人数 2 3 4 9 51 据此估计允许参加面试的分数线大约是()A.75B.80C.85D.90[答案] B[解析] 由题可知,在24名笔试者中应选出6人参加面试.由表可得面试分数线大约为80.故选B.13.(____陕西文,5)对一批产品的长度(单位:毫米)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上为一等品,在区间[15,20)和[25,30)上为二等品,在区间[10,15)和[30,35]上为三等品.用频率估计概率,现从该批产品中随机抽取1件,则其为二等品的概率是()A.0.09B.0.20C.0.25D.0.45[答案] D[解析] 解法1:用样本估计总体.在区间[15,20)和[25,30)上的概率为0.045+[1-(0.02+0.04+0.06+0.03)5=0.45.解法2:由图可知,抽得一等品的概率P1=0.065=0.3;抽得三等品的概率为P3=(0.02+0.03)5=0.25.故抽得二等品的概率为1-(0.3+0.25)=0.45.14.(____江西理,6)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()A.成绩B.视力C.智商D.阅读量[答案] D[解析] A中,K2==;B中,K2==;C中,K2==;D中,K2==.因此阅读量与性别相关的可能性最大,所以选D.15.(文)某养兔场引进了一批新品种,严格按照科学配方进行喂养,四个月后管理员称其体重(单位:kg),将有关数据进行整理后分为五组,并绘制频率分布直方图(如图所示).根据标准,体重超过6kg属于超重,低于5kg的不够分量.已知图中从左到右第一、第三、第四、第五小组的频率分别为0.25、0.20、0.10、0.05,第二小组的频数为400,则该批兔子的总数和体重正常的频率分别为()A.1000,0.50B.800,0.50C.800,0.60D.1000,0.60[答案] D[解析] 第二组的频率为1-0.25-0.20-0.10-0.05=0.40,所以兔子总数为=1000只,体重正常的频率为0.40+0.20=0.60.故选D.(理)(____山东理,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18[答案] C[解析] 第一、二两组的频率为0.24+0.16=0.4志愿者的总人数为=50(人).第三组的人数为:500.36=18(人)有疗效的人数为18-6=12(人)二、填空题16.(____辽宁文,16)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.[答案] 10[解析] 设5个班级中参加的人数分别为_1,_2,_3,_4,_5,则=7,=4,即5个整数平方和为20,_1,_2,_3,_4,_5这5个数中最大数比7大,但不能超过10,因此最大为10,平方和20=0+1+1+9+9=(7-7)2+(8-7)2+(6-7)2+(10-7)2+(4-7)2.因此参加的人数为4,6,7,8,10,故最大值为10,最小值为4.三、解答题17.(文)(____重庆文,17)20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:(1)求频率分布直方图中a的值;(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率. [分析] 由频率之和为1,求a,然后求出落在[50,60)和[60,70)中的人数,最后用列举法求古典概型的概率.[解析] (1)组距为10,(2a+3a+6a+7a+2a)10=200a=1,a==0.005.(2)落在[50,60)中的频率为2a10=20a=0.1,落在[50,60)中的人数为2.落在[60,70)中的学生人数为3a1020=30.0051020=3.(3)设落在[50,60)中的2人成绩为A1,A2,落在[60,70)中的3人为B1,B2,B3.则从[50,70)中选2人共有10种选法,={(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3)}其中2人都在[60,70)中的基本事件有3个:(B1,B2),(B1,B3),(B2,B3),故所求概率p=.(理)(____辽宁理,18)一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示.将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.(1)求在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个的概率;(2)用_表示在未来3天里日销售量不低于100个的天数,求随机变量_的分布列,期望E(_)及方差D(_).[解析] (1)设A1表示事件日销售量不低于100个,A2表示事件日销售量低于50个,B表示事件在未来连续3天是有连续2天日销售量不低于100个且另一天销售量低于50个,因此P(A1)=(0.006+0.004+0.002)50=0.6P(A2)=0.00350=0.15,P(B)=0.60.60.152=0.108.(2)_可能取的值为0,1,2,3,相应的概率为P(_=0)=C(1-0.6)3=0.064,P(_=1)=C0.6(1-0.6)2=0.288.P(_=2)=C0.62(1-0.6)=0.432.P(_=3)=C0.63=0.216.分布列为_ 0 1 2 3 P 0.064 0.288 0.432 0.216 因为_~B(3,0.6)所以期望E(_)=30.6=1.8,方差D(_)=30.6(1-0.6)=0.72.18.(文)为加强中学生实践、创新能力和团队精神的培养,促进教育教学改革,郑州市教育局举办了全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了解成绩情况,从中选取50名学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表,解答下列问题:分组频数频率一 60.5~70.5 a 0.26 二 70.5~80.5 15 c 三 80.5~90.5 18 0.36 四 90.5~100.5 b d 合计 50 e (1)若用系统抽样的方法抽取50个样本,现将所有学生随机地编号为000,001,002,,199,试写出第二组第一位学生的编号;(2)求出a、b、c、d、e的值(直接写出结果),并作出频率分布直方图;(3)若成绩在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人.[解析] (1)004(2)a,b,c,d,e的值分别为13,4,0.30,0.08,1.频率分布直方图如下:(3)由样本中成绩在80.5~90.5的频数为18,成绩在90.5~100.5的频数为4,可估计成绩在85.5~95.5的人数为11人,故获得二等奖的学生约为11=44人. (理)(____山西省高考联合模拟)为了了解某年级1000名学生的百米成绩情况,随机抽取了若干学生的百米成绩,成绩全部介于13s与18s之间,将成绩按如下方式分成五组:第一组[13,14);第二组[14,15);第五组[17,18].按上述分组方法得到的频率分布直方图如图所示,已知图中从左到右的前3个组的频率之比为3819,且第二组的频数为8.(1)将频率当作概率,求调查中随机抽取了多少个学生的百米成绩;(2)若从第一、五组中随机取出两个成绩,求这两个成绩的差的绝对值大于1秒的概率.[解析] (1)设图中从左到右前3个组的频率分别为3_,8_,19_依题意,得3_+8_+19_+0.321+0.081=1,_=0.02,设调查中随机抽取了n个学生的百米成绩,则80.02=,n=50,调查中随机抽取了50个学生的百米成绩.(2)百米成绩在第一组的学生数为30.02150=3,记他们的成绩为a、b、c百米成绩在第五组的学生数有0.08150=4,记他们的成绩为m、n、p、q,则从第一、五组中随机取出两个成绩,基本事件有{a,b}、{a,c}、{a,m}、{a,n}、{a,p}、{a,q}、{b,c}、{b,m}、{b,n}、{b,p}、{b,q}、{c,m}、{c,n}、{c,p}、{c,q}、{m,n}、{m,p}、{m,q}、{n,p}、{n,q}、{p,q},共21个其中满足成绩的差的绝对值大于1s所包含的基本事件有{a,m}、{a,n}、{a,p}、{a,q}、{b,m}、{b,n}、{b,p}、{b,q}、{c,m}、{c,n}、{c,p}、{c,q},共12个,所以P==.____-____高考数学一复习统计与统计案例专项练习及答案解析的全部内容就是这些,希望考生可以取得优异的成绩。

2021《单元滚动检测卷》高考复习数学(理)(北师大全国)精练十 统计与统计案例

2021《单元滚动检测卷》高考复习数学(理)(北师大全国)精练十 统计与统计案例

高三单元滚动检测卷·数学考生留意:1.本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分,共4页。

2.答卷前,考生务必用蓝、黑色字迹的钢笔或圆珠笔将自己的姓名、班级、学号填写在相应位置上。

3.本次考试时间120分钟,满分150分。

单元检测十 统计与统计案例第Ⅰ卷一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.为规范学校办学,省训练厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名同学,现将该班同学随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应为( ) A .13 B .19 C .20 D .512.从N 个编号中抽取n 个号码入样,若接受系统抽样方法进行抽取,则分段间隔应为( ) A.Nn B .n C .[N n]D .[Nn]+13.已知一组数据:a 1,a 2,a 3,a 4,a 5,a 6,a 7构成公差为d 的等差数列,且这组数据的方差等于1,则公差d 等于( ) A .±14B .±12C .±128D .无法求解4.高二其次学期期中考试,依据甲、乙两个班级同学数学考试成果优秀和不优秀统计后,得到如下列联表: 班级与成果列联表优秀 不优秀 总计 甲班 11 34 45 乙班 8 37 45 总计197190则随机变量χ2的值约为( )A .0.600B .0.828C .2.712D .6.0045.从某项综合力气测试中抽取100人的成果,统计如下表,则这100人成果的标准差为( )分数 5 4 3 2 1 人数2010303010A. 3 B .3 C.2105 D.856.如图是一次选秀节目上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数为85,则a 2+b 2的最小值是( )A .24B .32C .36D .487.(2022·重庆)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( ) A .y =0.4x +2.3 B .y =2x -2.4 C .y =-2x +9.5D .y =-0.3x +4.48.某校为了争辩同学的性别和对待某一活动的态度(支持和不支持)的关系,运用2×2列联表进行独立性检验,经计算χ2=7.069,则所得到的统计学结论是:有多大的把握认为“同学性别与支持该活动有关系.”( ) 附:P (χ2≥k 0)0.100 0.050 0.025 0.010 0.001 k 02.7063.8415.0246.63510.828A.0.1% B .1% C .99%D .99.9%9.一个频率分布表(样本容量为30)不当心被损坏了一部分(如图),只记得样本中数据在[20,60)上的频率为0.8,则估量样本分别在[40,50),[50,60)上的数据个数可能是( )A .7和6B .6和9C .8和9D .9和1010.对四组数据进行统计,获得图所示的散点图,关于其相关系数的比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 311.(2021·驻马店模拟)中心电视台为了调查近三年的春晚节目中各类节目的受欢迎程度,用分层抽样的方法,从2011年至2021年春晚的50个歌舞类节目,40个戏曲类节目,30个小品类节目中抽取样本进行调查,若样本中的歌舞类和戏曲类节目共有27个,则样本容量为( ) A .36 B .35 C .32 D .30 12.(2021·蚌埠模拟)给出以下命题: ①若p 或q 为假命题,则p 与q 均为假命题;②对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i ) (i =1,2,…,8),其线性回归方程是y =13x +a ,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a =14;③对于分类变量X 与Y 的随机变量χ2来说,χ2越小,“X 与Y 有关联”的把握程度越大; ④已知x -12-x ≥0,则函数f (x )=2x +1x 的最小值为16.其中真命题的个数为( ) A .0 B .1 C .2 D .3 第Ⅱ卷二、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中横线上)13.从某中学高一班级中随机抽取100名同学,将他们的成果(单位:分)数据绘制成频率分布直方图(如图).则这100名同学成果的平均数,中位数分别为________.14.某企业三月中旬生产A 、B 、C 三种产品共3 000件,依据分层抽样的结果,该企业统计员制作了如下的统计表格:产品类别 A B C 产品数量(件) 1 300 样本容量(件)130由于不当心,表格中A 、C 产品的有关数据已被污染看不清楚,统计员记得A 产品的样本容量比C 产品的样本容量多10,依据以上信息,可得C 产品的数量是________件.15.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:时间x 1 2 3 4 5 命中率y0.40.50.60.60.4小李这5天的平均投篮命中率为________;用线性回归分析的方法,猜想小李该月6号打6小时篮球的投篮命中率为________.16.关于统计数据的分析,有以下几个结论: ①一组数不行能有两个众数;②将一组数据中的每个数据都减去同一个数后,方差没有变化;③调查剧院中观众观看感受时,从50排(每排人数相同)中任意抽取一排的人进行调查,属于分层抽样; ④一组数据的方差确定是正数;⑤如图是随机抽取的200辆汽车通过某一段大路时的时速频率分布直方图,依据这个直方图,可以得到时速在[50,60)的汽车大约是60辆,则这五种说法中错误的是________.三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)17.(10分)(2021·济南模拟)从某高校高三班级800名男生中随机抽取50名同学测量其身高,据测量,被测同学的身高全部在155 cm 到195 cm 之间,将测量结果按如下方式分成8组:第一组[155,160),其次组[160,165),…,第八组[190,195],下图是按上述分组得到的频率分布直方图的一部分.已知第一组与第八组的人数相同,第七组与第六组的人数差恰好为第八组与第七组的人数差.求下列频率分布表中所标字母的值,并补充完成频率分布直方图.频率分布表:分组频数频率频率/组距…………[180,185)x y z[185,190)m n p…………18.(12分)(2021·江西八所重点中学联考)“双节”期间,高速大路车辆较多,某调查公司在一服务区从七座以下小型汽车中按进服务区的先后每间隔50辆就抽取一辆的抽样方法抽取40名驾驶员进行询问调查,将他们在某段高速大路的车速(km/h)分成六段:[60,65),[65,70),[70,75),[75,80),[80,85),[85,90]后得到如图所示的频率分布直方图.(1)求这40辆小型汽车车速的众数和中位数的估量值;(2)若从车速在[60,70)内的车辆中任抽取2辆,求车速在[65,70)内的车辆恰有一辆的概率.19.(12分)(2022·课标全国Ⅱ)某地区2007年至2021年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2007200820092010201120222021年份代号t1234567人均纯收入y 2.9 3.3 3.6 4.4 4.8 5.2 5.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2021年该地区农村居民家庭人均纯收入的变化状况,并猜想该地区2021年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估量公式分别为:b=∑i=1n(t i-t)(y i-y)∑i=1n(t i-t)2,a=y-b t.20.(12分)为使同学更好地了解中华民族宏大复兴的历史学问,某校组织了一次以“我的梦,中国梦”为主题的学问竞赛,每班选25名同学参与竞赛,成果分为A,B,C,D四个等级,其中相应等级的得分依次记为100分、90分、80分、70分,学校将某班级的一班和二班的成果整理并绘制成统计图:请依据以上供应的信息解答下列问题:(1)把一班竞赛成果统计图补充完整;(2)写出下表中a,b,c的值.平均数(分)中位数(分)众数(分)一班a b90二班87.680c(3)①从平均数和中位数方面来比较一班和二班的成果;②从平均数和众数方面来比较一班和二班的成果;③从B级以上(包括B级)的人数方面来比较一班和二班的成果.21.(12分)某个体服装店经营某种服装,一周内获纯利y(元)与该周每天销售这种服装的件数x之间的一组数据如下:已知:∑7i =1x 2i =280,∑7i =1y 2i =45 309,∑i =1x i y i =3 487. (1)求x ,y ;(2)推断纯利润y 与每天销售件数x 之间是否线性相关,假如线性相关,求出线性回归方程.22.(12分)(2021·沈阳质量监测二)在一次数学测验后,班级学委对选答题的选题状况进行统计,如下表:(1)以得到如下2×2列联表:(2)在原统计结果中,假如不考虑性别因素,按分层抽样的方法从选做不同选做题的同学中随机选出7名同学进行座谈,已知这名学委和两名数学课代表都在选做“不等式选讲”的同学中. (i)求在这名学委被选中的条件下,两名数学课代表也被选中的概率; (ii)记抽取到数学课代表的人数为X ,求X 的分布列及均值EX . 下面临界值表仅供参考:(参考公式:χ2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ))答案解析1.C [抽样间隔为46-33=13,故另一位同学的编号为7+13=20,选C.] 2.C3.B [这组数据的平均数为a 1+a 2+a 3+a 4+a 5+a 6+a 77=7a 47=a 4.又由于这组数据的方差等于1,所以17[(a 1-a 4)2+(a 2-a 4)2+(a 3-a 4)2+(a 4-a 4)2+(a 5-a 4)2+(a 6-a 4)2+(a 7-a 4)2]=(-3d )2+(-2d )2+(-d )2+0+(d )2+(2d )2+(3d )27=1.即4d 2=1, 解得d =±12.]4.A [由题意知a =11,b =34,c =8,d =37,n =90, 则χ2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )的值约为0.600,故选A.]5.C [x =20×5+10×4+30×3+30×2+10×1100=3,s =1100[20×(5-3)2+10×(4-3)2+30×(3-3)2+30×(2-3)2+10×(1-3)2] =1100(80+10+30+40)= 160100=41010=2105.] 6.B [依据题意,得4+a +6+b +75=5,得a +b =8.方法一 由b =8-a ,得a 2+b 2=a 2+(8-a )2=2a 2-16a +64, 其中a ,b 满足0≤a ≤9,0≤b ≤9, 所以0≤a ≤9,0≤8-a ≤9, 即0≤a ≤8且a 是整数,设函数f (a )=2a 2-16a +64,分析知当a =4时, f (a )取得最小值32,所以a 2+b 2的最小值是32.故选B.方法二 由a +b =8,且a ,b ≥0, 得8≥2ab ,故ab ≤16,则a 2+b 2=(a +b )2-2ab ≥64-32=32, 当且仅当a =b =4时等号成立, 所以a 2+b 2的最小值是32.]7.A [由于变量x 和y 正相关,则回归直线的斜率为正,故可以排解选项C 和D.由于样本点的中心在回归直线上,把点(3,3.5)分别代入选项A 和B 中的直线方程进行检验,可以排解B ,故选A.]8.C [由于7.069与附表中的6.635最接近,所以得到的统计学结论是:有1-0.010=0.99=99%的把握认为“同学性别与支持该活动有关系”,选C.] 9.B [因样本中数据在[20,60)上的频率为0.8, 则样本中数据在[20,60)上的频数为30×0.8=24. 又由于样本中数据在[20,40)上的频数为4+5=9, 所以样本在[40,60)上的数据的个数为24-9=15. 由选项知B 符合.]10.A [易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线四周,则r 2<r 4<0<r 3<r 1.]11.A [设从30个小品类节目中抽取x 个,则有x 30=2750+40,解得x =9.则27+9=36,所以样本容量为36.]12.B [①正确.②中a =18,所以②不正确.③中χ2越小,“X 与Y 有关联”的把握程度越小,所以③不正确.由x -12-x ≥0可得1≤x <2,由于f (x )=2x +1x ≥22=4,当且仅当x =1时取等号,所以④不正确.]13.125,124解析 由图可知(a +a -0.005)×10=1-(0.010+0.015+0.030)×10,解得a =0.025, 则x =105×0.1+115×0.3+125×0.25+135×0.2+145×0.15=125. 中位数在120~130之间,设为x ,则0.01×10+0.03×10+0.025×(x -120)=0.5,解得x =124. 14.800解析 设C 产品的数量为x ,C 产品的样本容量为a , 则A 产品的数量为1 700-x , A 产品的样本容量为10+a ,由分层抽样的定义可知:1 700-x a +10=x a =1 300130,∴x =800.15.0.5 0.53解析 平均投篮命中率y =15(0.4+0.5+0.6+0.6+0.4)=0.5,而x =3.∑i =15(x i -x )(y i -y )=(-2)×(-0.1)+(-1)×0+0×0.1+1×0.1+2×(-0.1)=0.1,∑i =15(x i -x )2=(-2)2+(-1)2+02+12+22=10,于是b =0.01,a =y -b x =0.47,∴y =0.01x +0.47,令x =6,得y =0.53. 16.①③④解析 一组数中可以有两个众数,故①错误;依据方差的计算法可知②正确;③属于简洁随机抽样,错误;④错误,由于方差可以是零;⑤正确.17.解 由频率分布直方图可知前五组的频率和是 (0.008+0.016+0.04+0.04+0.06)×5=0.82, 第八组的频率是0.008×5=0.04,所以第六、七组的频率和是1-0.82-0.04=0.14,所以第八组的人数为50×0.04=2,第六、七组的总人数为50×0.14=7. 由已知得x +m =7,m -x =2-m , 解得x =4,m =3.所以y =0.08,n =0.06,z =0.016,p =0.012.补充完成频率分布直方图如图所示.18.解 (1)众数的估量值为77.5,设中位数的估量值为x ,则0.01×5+0.02×5+0.04×5+0.06×(x -75)=0.5,解得x =77.5,即中位数的估量值为77.5.(2)从题图中可知,车速在[60,65)内的车辆数为0.01×5×40=2,车速在[65,70)内的车辆数为0.02×5×40=4,记车速在[60,65)内的两辆车为a ,b ,车速在[65,70)内的四辆车为c ,d ,e ,f ,则全部基本大事有 (a ,b ),(a ,c ),(a ,d ),(a ,e ),(a ,f ), (b ,c ),(b ,d ),(b ,e ),(b ,f ), (c ,d ),(c ,e ),(c ,f ), (d ,e ),(d ,f ), (e ,f ), 共15个,其中车速在[65,70)内的车辆恰有一辆的大事有:(a ,c ),(a ,d ),(a ,e ),(a ,f ),(b ,c ),(b ,d ),(b ,e ),(b ,f ),共8个.所以若从车速在[60,70)内的车辆中任抽取2辆,则车速在[65,70)内的车辆恰有一辆的概率为P =815.19.解 (1)由所给数据计算得t =17(1+2+3+4+5+6+7)=4,y =17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i =17(t i -t )2=9+4+1+0+1+4+9=28,∑i =17(t i -t )(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b =∑i =17(t i -t )(y i -y )∑i =17(t i -t )2=1428=0.5, a =y -bt =4.3-0.5×4=2.3, 所求线性回归方程为 y =0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2007年至2021年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2021年的年份代号t =9代入(1)中的回归方程,得y =0.5×9+2.3=6.8,故猜想该地区2021年农村居民家庭人均纯收入为6.8千元. 20.解 (1)25-6-12-5=2(人).(2)a =87.6,b =90,c =100.(3)①一班和二班平均数相等,一班的中位数大于二班的中位数,故一班的成果好于二班. ②一班和二班平均数相等,一班的众数小于二班的众数,故二班的成果好于一班; ③B 级以上(包括B 级)一班18人,二班12人, 故一班的成果好于二班.21.解 (1)x =17(3+4+5+6+7+8+9)=6,y =17(66+69+73+81+89+90+91)≈79.86.(2)依据已知∑7i =1x 2i =280,∑7i =1y 2i =45 309, ∑7i =1x i y i =3 487,得相关系数r =3 487-7×6×79.86(280-7×62)(45 309-7×79.862)≈0.973.由于0.973>0.75,所以纯利润y 与每天销售件数x 之间具有显著的线性相关关系. 利用已知数据可求得线性回归方程为 y =4.75x +51.36. 22.解 (1)由题意得 χ2=42×(16×12-8×6)224×18×20×22=25255≈4.582>3.841. 所以,据此统计有95%的把握认为选做“几何类”或“代数类”与性别有关. (2)由题意可知在“不等式选讲”的18位同学中,要选取3位同学. (i)令大事A 为“这名学委被选中”;大事B 为“两名数学课代表被选中”, 则P (A ∩B )=C 33C 318,P (A )=C 217C 318.所以P (B |A )=P (A ∩B )P (A )=C 33C 217=217×16=1136.另解:令大事A 为“在这名学委被选中的条件下,两名数学课代表也被选中”,则P (A )=C 22C 217=217×16=1136.(ii)由题意知X 的可能取值有0,1,2, 依题意P (X =0)=C 316C 318=3551,P (X =1)=C 216C 12C 318=517,P (X =2)=C 116C 22C 318=151.从而X 的分布列为于是EX =0×3551+1×517+2×151=1751=13.。

高考数学考点二十《统计与统计案例》课件

高考数学考点二十《统计与统计案例》课件

100
200
则 K2=2001×00(×6100×0×601-004×0×10400)2=8>6.635,
所以有 99%以上的把握认为是否持乐观态度与国内外差异有关.
四、解答题 13.(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设 备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了 10 件产品,得到各件产品该项指标数据如下:
考点二十 统计与统计案例
一、选择题(在每小题给出的四个选项中,只有一项符合题目要求) 1.(2021·河北张家口第三次模拟)某中学春季运动会上,12 位参加跳高 半决赛同学的成绩各不相同,按成绩从高到低取前 6 位进入决赛,如果小明 知道了自己的成绩后,则他可根据其他 11 位同学成绩的哪个数据判断自己 能否进入决赛( )
A.r2<r4<0<r3<r1 C.r4<r2<0<r3<r1
B.r4<r2<0<r1<r3 D.r2<r4<0<r1<r3
答案 A 解析 易知题中图(1)和图(3)是正相关,图(2)与图(4)是负相关,且图(1) 与图(2)中的样本点集中分布在一条直线附近,则 r2<r4<0<r3<r1.故选 A.
5.通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如
下列联表:


总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110

K2

n(ad-bc)2 (a+b)(c+d)(a+c)(b+d)

2021届高考数学-统计与统计案例提分练(详解)

2021届高考数学-统计与统计案例提分练(详解)

2021届高考数学-统计与统计案例提分练(详解)1.完成下列抽样调查,较为合理的抽样方法依次是()①从30件产品中抽取3件进行检查;②某校高中三个年级共有2460人,其中高一830人、高二820人、高三810人,为了了解学生对数学的建议,拟抽取一个容量为300的样本;③某剧场有28排,每排有32个座位,在一次报告中恰好坐满了听众,报告结束后,为了了解听众意见,需要请28名听众进行座谈.A.①简单随机抽样,②系统抽样,③分层抽样B.①分层抽样,②系统抽样,③简单随机抽样C.①系统抽样,②简单随机抽样,③分层抽样D.①简单随机抽样,②分层抽样,③系统抽样【答案】D【解析】①中,总体数量不多,适合用简单随机抽样;②中,某校高中三个年纪共有2460人,其中高一830人、高二820人、高三810人,适合于分层抽样;③中,总体数量较多且编号有序,适合于系统抽样.故选D.2.调查机构对某高科技行业进行调查统计,得到该行业从业者学历分布饼状图、从事该行业岗位分布条形图,如图所示.给出下列三种说法:①该高科技行业从业人员学历为博士的占一半以上;②该高科技行业中从事科技岗位的人数超过总人数的30%;③该高科技行业中从事运营岗位的人员主要是本科生.其中正确的个数为()A.0个B.1个C.2个D.3个【答案】C【解析】在①中,由该行业从业者学历分布饼状图得到:该高科技行业人员中学历为博士的占一半以上,故①正确;一、选择题在②中,由从事该行业岗位分布条形图得到:在高科技行业中从事科技岗位的人数超过总人数的30%, 故②正确;在③中,由该行业从业者学历分布饼状图、从事该行业岗位分布条形图,无法得到该高科技行业中从事运营岗位的人员主要是本科生,故③错误.故选C .3.某市为最大限度的吸引“高精尖缺”人才,向全球“招贤纳士”,推进了人才引入落户政策,随着人口增多,对住房要求也随着而来,而选择购买商品房时,住户对商品房的户型结构越来越重视,因此某商品房调查机构随机抽取n 名市民,针对其居住的户型机构和满意度进行了调查,如图1调查的所有市民中四居室共200户,所占比例为13,二居室住户占16,如图2是有分层抽样的方法从所有调查的市民的满意度问卷中,抽取10%的调查结果绘制成的统计图,则下列说法正确的是( )A .样本容量为70B .样本中三居室住户共抽取了25户C .根据样本可估计对四居室满意的住户有70户D .样本中对三居室满意的有15户【答案】D【解析】如图1调查的所有市民中四居室共200户,所占比例为13,二居室住户占16, ∴20060013=,二居室有16001006⨯=户,三居室有300户, 由频率分布直方图和扇形统计图得:在A 中,样本容量为60010%60n =⨯=,故A 错误;在B 中,样本中三居室住户共抽取了30010%30⨯=户,故B 错误;在C 中,根据样本可估计对四居室满意的住户有20040%80⨯=户,故C 错误;在D 中,样本中对三居室满意的有30010%50%15⨯⨯=户,故D 正确,故选D .4.如图是某市2017年3月1日至3月16日的空气质量指数趋势统计图,空气质量指数(AQI )小于100表示空气质量油量,空气质量指数大于200表示空气重度污染,则关于该市这16日的空气质量,下列说法不正确的是()A.出现过连续4天空气重度污染B.空气重度污染的频率为0.5C.相邻两天空气质量指数之差的最大值195D.空气质量指数的平均值小于200【答案】C∼日这4天连续重度污染,故A正确;【解析】依题意,根据图中信息,121516天中有8天重度污染,故B正确;-=≠,故C错误;相邻两天空气质量指数之差的最大的为7日和8日,最大值为2608317719516个数据中大于200和小于200的各有8个,大于200的8个数据接近200,而小于200的8个数据与200相差较大,故平均值小于200,故D正确,故选C.5.如图是某赛季甲,乙两名篮球运动员9场比赛所得分数的茎叶图,则下列说法错误的是()A.甲所得分数的极差为22B.乙所得分数的中位数为18C.两人所得分数的众数相等D.甲所得分数的平均数低于乙所得分数的平均数【答案】D-=,A正确;【解析】甲所得分数的极差为331122乙所得分数的中位数为18,B正确;甲所得分数的众数为22,乙所得分数的众数为22,C正确,故选D.6.甲、乙两名运动员分别进行了5次射击训练,成绩如下:甲:7,7,8,8,10;乙:8,9,9,9,10;。

高考数学第二轮复习专题升级训练17概率、统计与统计案例理试题 2

高考数学第二轮复习专题升级训练17概率、统计与统计案例理试题 2

专题晋级训练17 概率、统计与统计案例(时间是:60分钟 满分是:100分)一、选择题(本大题一一共8小题,每一小题5分,一共40分)1.从2 007名学生中选取50名学生参加全国数学联赛,假设采用下面的方法选取:先用简单随机抽样从2 007人中剔除7人,剩下的2 000人再按系统抽样的方法抽取,那么每人入选的概率( ).A .不全相等B .均不相等C .都相等,且为502 007D .都相等,且为1402.(2021·高考冲刺卷,4)在某项体育比赛中,七位裁判为一选手打出的分数如下: 90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( ).3.向假设的三座互相毗邻的HY 火库投掷一颗炸弹,只要炸中其中任何一座,另外两座也要发生爆炸.炸中第一座HY 火库的概率为0.2,炸中第二座HY 火库的概率为0.3,炸中第三座HY 火库的概率为0.1,那么HY 火库发生爆炸的概率是( ).A .0.006B .0.4 C4.(2021·高考名校?创新?冲刺卷,6)甲和乙等五名志愿者被随机地分到A ,B ,C ,D 四个不同的岗位效劳,每个岗位至少有一名志愿者,那么甲和乙不在同一岗位效劳的概率为( ).A .110B .910C .14D .486255.在样本的频率分布直方图中,一共有11个小长方形,假设中间一个长方形的面积等于其他10个小长方形面积和的14,且样本容量为160,那么中间一组的频数为( ).A .32B .0.2 C6.(2021·重点中学高三联考,理3)在三次HY 重复试验中,事件A 在每次试验中发生的概率一样,假设事件A 至少发生一次的概率为6364,那么事件A 恰好发生一次的概率为( ).A .14B .34C .964D .27647.(2021·高考冲刺卷,理10)将一颗骰子投掷两次,第一次出现的点数记为a ,第二次出现的点数记为b ,设两条直线l 1:ax +by =2,l 2:x +2y =2平行的概率为P 1,相交的概率为P 2,试问点(P 1,P 2)与直线l 2:x +2y =2的位置关系是( ).A .P 在直线l 2的右下方B .P 在直线l 2的左下方C .P 在直线l 2的右上方D .P 在直线l 2上8.从标有1,2,3,…,7的7个小球中取出一球,记下它上面的数字,放回后再取出一球,记下它上面的数字,然后把两数相加得和,那么获得的两球上的数字之和大于11或者者能被4整除的概率是( ).A .1649B .1549C .27D .1349二、填空题(本大题一一共4小题,每一小题4分,一共16分)9.某校有高一学生400人,高二学生302人,高三学生250人,如今按年级分层抽样,从所有学生中抽取一个容量为190人的样本,应该从高______学生中剔除______人,高一、高二、高三抽取的人数依次是________.10.现有10个数,它们能构成一个以1为首项,-3为公比的等比数列,假设从这10个数中随机抽取一个数,那么它小于8的概率是__________.11.(2021·十校高考模拟,理17)如下图的正方形中,将边AB ,AD 各4等分,分别作AB ,AD 的平行线段成4×4方格网,那么从图中取出一由网格线形成的矩形,恰好为正方形的概率是__________.12.(2021·高考冲刺卷,理15)将3个完全一样的小球随机地放入编号依次为1,2,3,4,5的盒子里,用随机变量ξ表示有球盒子编号的最大值,那么ξ的数学期望E(ξ)=__________.三、解答题(本大题一一共4小题,一共44分.解容许写出必要的文字说明、证明过程或者演算步骤)13.(本小题满分是10分)某校100名学生期中考试语文成绩的频率分布直方图如下图,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均数;(3)假设这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比方下表所示,求数学成绩在[50,90)之外的人数.14当两条棱相交时,ξ=0;当两条棱平行时,ξ的值是两条棱之间的间隔;当两条棱异面时,ξ=1.(1)求概率P(ξ=0);(2)求ξ的分布列,并求其数学期望E(ξ).15.(本小题满分是12分)某单位招聘面试,每次从试题库中随机调用一道试题.假设调用的是A类型试题,那么使用后该试题回库,并增补一道A类型试题和一道B类型试题入库,此次调题工作完毕;假设调用的是B类型试题,那么使用后该试题回库,此次调题工作完毕.试题库中现有n+m道试题,其中有n道A类型试题和m道B类型试题.以X表示两次调题工作完成后,试题库中A类型试题的数量.(1)求X=n+2的概率;(2)设m=n,求X的分布列和均值(数学期望).16.(本小题满分是12分)某校要用三辆汽车从新校区把教职工接到老校区,从新校区到老校区有两条公路,汽车走公路①堵车的概率为14,不堵车的概率为34;汽车走公路②堵车的概率为p,不堵车的概率为1-p.假设甲、乙两辆汽车走公路①,丙汽车由于其他原因走公路②,且三辆车是否堵车互相之间没有影响.(1)假设三辆汽车中恰有一辆汽车被堵的概率为716,求走公路②堵车的概率;(2)在(1)的条件下,求三辆汽车中被堵车辆的个数ξ的分布列和数学期望.参考答案一、选择题 1.C2.B 解析:去掉一个最高分和一个最低分后,所剩数据为90,90,93,94,93,那么平均值为90+90+93+94+935=92,方差为2.8,应选B.3.D 解析:设A ,B ,C 分别表示炸中第一、第二、第三座HY 火库这三个事件,那么P (A )=0.2,P (B )=0.3,P (CD 表示“HY 火库爆炸〞,那么D =A ∪B ∪C .又∵A ,B ,C 彼此互斥,∴P (D )=P (A ∪B ∪C )=P (A )+P (B )+P (C )=0.2+0.3+0.1=0.6.4.B 解析:甲和乙在同一岗位效劳的概率为P =C 14×A 33C 25×A 44=110,故甲和乙不在同一岗位效劳的概率为1-P =910.5.A 解析:设中间的长方形面积为x ,那么其他的10个小长方形的面积为4x ,所以可得x +4x =1,得x =0.2;又因为样本容量为160,所以中间一组的频数为160×0.2=32,应选A.6.C 解析:设事件A 在每次试验中发生的概率为p ,那么有1-(1-p )3=6364,得p =34,那么事件A 恰好发生一次的概率为C 13×34×⎝ ⎛⎭⎪⎫142=964.7.B 解析:因为两直线平行的充要条件是b =2a ,且a ≠1,故只能是a =2,b =4和a =3,b =6两种情形,那么P 1=236=118.从而有P 2=1-118-136=1112.又点⎝ ⎛⎭⎪⎫118,1112在直线l 2的左下方,应选B.8.A 二、填空题9.二 2 80,60,50 解析:总体人数为400+302+250=952(人),∵952190=5……2,4005=80,302-25=60,2505=50,∴从高二年级中剔除2人.从高一,高二,高三年级中分别抽取80人、60人、50人.10.35 解析:∵以1为首项,-3为公比的等比数列的10个数为1,-3,9,-27,…,其中有5个负数,1个正数一一共6个数小于8,∴从这10个数中随机抽取一个数,它小于8的概率是610=35.11.310 解析:网格线形成的矩形个数为C 25×C 25=100个,其中正方形的个数为1+22+32+42=30个,那么所求概率为30100=310.12.4 解析:当ξ=1时,只有1种放法;当ξ=2时,那么2号盒子里放1个球时,有1种放法;2号盒子里放2个球时,有1种放法;2号盒子里放3个球时,有1种放法;一共有3种放法;当ξ=3时,那么3号盒子里放一个球时,另2个球放入1,2号盒子里,有3种放法;3号盒子里放2个球时,另1个球放入1,2号盒子里,有2种放法;3号盒子里放3个球时,有1种放法;一共有6种放法.当ξ=4时,那么4号盒子里放一个球时,另2个球放入1,2,3号盒子里,有3+C 23=6种放法;4号盒子里放2个球时,另1个球放入1,2,3号盒子里,有3种放法;4号盒子里放3个球时,有1种放法;一共有10种放法;当ξ=5时,那么5号盒子里放一个球时,另2个球放入1,2,3,4号盒子里,有4+C 24=10种放法;5号盒子里放2个球时,另1个球放入1,2,3,4号盒子里,有4种放法;5号盒子里放3个球时,有1种放法;一共有15种放法.从而3个完全一样的小球随机地放入编号依次为1,2,3,4,5的盒子里总一共有35种放法,那么有P (ξ=1)=135,P (ξ=2)=335,P (ξ=3)=635,P (ξ=4)=1035,P (ξ=5)=1535,故E (ξ)=1×135+2×335+3×635+4×1035+5×1535=4.三、解答题13.解:(1)依题意得,10×(2a +0.02+0.03+0.04)=1,解得a =0.005.(2)这100名学生语文成绩的平均数为:55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.(3)数学成绩在[50,60)的人数为:100×0.05=5, 数学成绩在[60,70)的人数为: 100×0.4×12=20,数学成绩在[70,80)的人数为: 100×0.3×43=40,数学成绩在[80,90)的人数为: 100×0.2×54=25,所以数学成绩在[50,90)之外的人数为:100-5-20-40-25=10.14.解:(1)假设两条棱相交,那么交点必为正方体8个顶点中的1个,过任意1个顶点恰有3条棱,所以一共有8C 23对相交棱,因此P (ξ=0)=8C 23C 212=8×366=411.(2)假设两条棱平行,那么它们的间隔 为1或者2,其中间隔 为2的一共有6对,故P (ξ=2)=6C 212=111,于是P (ξ=1)=1-P (ξ=0)-P (ξ=2)=1-411-111=611,所以随机变量ξ的分布列是因此E (ξ)=1×61115.解:以A i 表示第i 次调题调用到A 类型试题,i =1,2. (1)P (X =n +2)=P (A 1A 2)=nm +n ·n +1m +n +2=n n +1m +n m +n +2.(2)X 的可能取值为n ,n +1,n +2.P (X =n )=P (A 1A 2)=n n +n ·n n +n =14.P (X =n +1)=P (A 1A 2)+P (A 1A 2)=nn +n ·n +1n +n +2+n n +n ·n n +n =12,P (X =n +2)=P (A 1A 2)=n n +n ·n +1n +n +2=14,从而X 的分布列是X nn +1n +2P141214E (X )=n ×14+(n +1)×2+(n +2)×4=n +1.16.解:(1)由条件得C 12·14·34·(1-p )+⎝ ⎛⎭⎪⎫342·p =716,即3p =1,那么p =13.即走公路②堵车的概率为13.(2)ξ可能的取值为0,1,2,3,P (ξ=0)=34·34·23=38,P (ξ=1)=716,P (ξ=2)=14·14·23+C 12·14·34·13=16,P (ξ=3)=14·14·13=148. ξ的分布列为:ξ 0 1 2 3 P3871616148所以E (ξ)=0×38+1×716+2×16+3×148=56.四季寄语情感寄语在冬天里,心中要装着春天;而在春天,却不能忘记冬天的寒冷. 落红不是无情物,化作春泥更护花. 愿是只燕,衔着春光,翩翩向你窗.请紧紧把握现在/让我们把一种期翼/或者是一种愿望/种进大地/明春/它就会萌生绿色的叶片.此刻又是久违的秋季/又是你钟爱的季节/于是/秋风秋雨秋云秋月/都化作你的笑颜身影/在我的心底落落起起.此刻已是秋季/你可体验到/收获怀念的感觉/和秋雨一样真实动人. 一条柳枝/愿是你生活的主题/常绿常新/在每一个春季雨声蝉鸣叶落风啸/又一个匆匆四季/在这冬末春初/向遥远的你/问安!又是夏季/时常有暴雨雷鸣/此刻/你可以把我当作大雨伞/直至雨过天晴/留给你一个/彩虹的夏季!在纷繁的人群中/牵手走过岁月/就像走过夏季/拥挤的海滩在我居住的江南/已是春暖花开季节/采几片云彩/轻捧一掬清泉/飘送几片绿叶/用我的心/盛着寄给/北国的你不要想摆脱冬季/看/冰雪覆盖的世界/美好的这样完整/如我对你的祝福/完整地这样美好 挡也挡不住的春意/像挡也挡不住的/想你的心情/它总在杨柳枝头/泄露我的秘密往事的怀念/爬上琴弦/化作绵绵秋雨/零零落落我诚挚的情怀/如夏日老树下的绿荫/斑斑驳驳虽只是一个小小的祝福/却化做了/夏季夜空/万点星辰中的一颗 对你的思念/温暖了/我这些个漫长的/冬日从春到夏,从秋到冬......只要你的帘轻动,就是我的思念在你窗上走过.在那个无花果成熟的季节,我才真正领悟了你不能表达的缄默.我又错过了一个花期/只要你知道无花也是春天/我是你三月芳草地 燕子声声里,相思又一年 朋友,愿你心中,没有秋寒.一到冬天,就想起/那年我们一起去吃的糖葫芦/那味道又酸又甜/就像......爱情.谢谢你/在我孤独时刻/拜访我这冬日陋室只要有个窗子/就拥有了四季/拥有了世界 愿你:俏丽如三春之桃,清素若九秋之菊 没有你在身边,我的生活永远是冬天! 让我们穿越秋天/一起去领略那收获的喜悦!。

2021新高考数学精选考点专项突破:统计与统计案例

2021新高考数学精选考点专项突破:统计与统计案例

统计与统计案例一、单选题1、(江苏金陵中学开学初调研)已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测的数据算得的线性回归方程可能是( )A .0.4.3ˆ2yx =+ B .2 2.4ˆyx =- C .9ˆ2.5yx =-+ D .0.3 4.4ˆyx =-+ 【答案】A 【解析】 因为与正相关,排除选项C 、D ,又因为线性回归方程恒过样本点的中心,故排除选项B ;故选A .2、(山东青岛中学调研)已知两个变量x 和y 之间有线性相关关系,经调查得到如下样本数据,根据表格中的数据求得同归方程ˆˆˆybx a =+,则下列说法正确的是( ) A .0a >,0b > B .0a >,0b < C .0a <,0b > D .0a <,0b <【答案】B【解析】由已知数据,可知y 随着x 的增大而减小, 则变量x 和变量y 之间存在负相关的关系,0b ∴<, 当0x =时,则 3.50a y =>>, 即:0a >,0b <. 故选:B.3、(2020届山东省济宁市高三3月月考)下列说法正确的是( )A .回归直线ˆˆˆy bx a =+至少经过其样本数据()()()122,,,,,i n n x y x y x y 中的一个点B .从独立性检验可知有99%的把握认为吃地沟油与患胃肠癌有关系时,我们就说如果某人吃地沟油,那么他有99%可能患胃肠癌C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D .将一组数据的每一个数据都加上或减去同一个常数后,其方差也要加上或减去这个常数 【答案】C【解析】回归直线ˆˆˆy bx a =+可以不经过其样本数据()()()122,,,,,i n n x y x y x y 中的一个点,则A 错误;从独立性检验可知有99%的把握认为吃地沟油与患胃肠癌有关系时,我们就说如果某人吃地沟油,那么他有99%可能患胃肠癌,则B 错误;在残差图中,残差点分布的带状区域的宽度越窄,表示数据的残差越小,其模型拟合的精度越高,即C 正确;将一组数据的每一个数据都加上或减去同一个常数后,其平均数也加上或减去同一个常数,则其方差不变,故D 错误, 故选:C4、(江西省抚州市临川区第一中学2017-2018学年高二下学期期末)临川一中舞蹈社为了研究男女学生对舞蹈的喜爱程度,随机调查学校110名学生是否喜欢跳舞,由列联表和公式()()()()()22n ad bc K a b c d a c b d -=++++计算出2K ,并由此作出结论:“有99%的可能性认为学生喜欢跳舞与性别有关”,则2K 可以为( )A.3.565B.4.204C.5.233D.6.842【答案】D 【解析】利用所给数据,在2 6.635K ≥时,可作出结论:“有99%的可能性认为学生喜欢跳舞与性别有关”,只有D 满足. 故选D.5、(2020年高考全国Ⅰ卷理数)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+【答案】D【解析】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D.6、(2020届山东省济宁市第一中学高三一轮检测)某次考试,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理分数对应如下表:绘出散点图如下:根据以上信息,判断下列结论:①根据此散点图,可以判断数学成绩与物理成绩具有线性相关关系;②根据此散点图,可以判断数学成绩与物理成绩具有一次函数关系;③甲同学数学考了80分,那么,他的物理成绩一定比数学只考了60分的乙同学的物理成绩要高.其中正确的个数为().A.0B.3C.2D.1【答案】D【解析】对于①,根据此散点图知,各点都分布在一条直线附近,可以判断数学成绩与物理成绩具有较强的线性相关关系,①正确;对于②,根据此散点图,可以判断数学成绩与物理成绩具有较强的线性相关关系,不是一次函数关系,②错误;对于③,甲同学数学考了80分,他的物理成绩可能比数学只考了60分的乙同学的物理成绩要高,所以③错误.综上,正确的命题是①,只有1个.故选:D.7、(2020年山东一中调研)学生会为了调查学生对2018年俄罗斯世界杯的关注是否与性别有关,抽样调查100人,得到如下数据:根据表中数据,通过计算统计量()()()()()22n ad bcKa b c d a c b d-=++++,并参考以下临界数据:若由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过()A.0.10 B.0.05 C.0.025 D.0.01【答案】A 【解析】因为()()()()()()22210030101545=3.030 2.70645255575n ad bc K a b c d a c b d -⨯-⨯=≈>++++⨯⨯⨯,所以若由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过0.10,故选A..8、(江苏淮阴中学调研)通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:由2222()110(40302030),7.8()()()()60506050n ad bc K K a b c d a c b d -⨯⨯-⨯==≈++++⨯⨯⨯算得 附表:参照附表,得到的正确结论是( )A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 【答案】A 【解析】由27.8 6.635K ≈>,而()2 6.6350.010P K ≥=,故由独立性检验的意义可知选A9、(江苏南通中学开学初调研)下列说法中,正确说法的个数是( )①在用22⨯列联表分析两个分类变量A 与B 之间的关系时,随机变量2K 的观测值k 越大,说明“A 与B 有关系”的可信度越大②以模型kxy ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0. 3③已知两个变量具有线性相关关系,其回归直线方程为y a bx =+,若2b =,1,3x y ==,则1a = A .0 B .1 C .2 D .3【答案】D【解析】对于①,分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; 对于②,kx y ce =,∴两边取对数,可得()ln ln ln ln ln kx kxy ce c e c kx ==+=+,令ln z y =,可得ln ,0.34,ln 4,0.3z c kx z x c k =+=+∴==, 4c e ∴=.即②正确;对于③,根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1b x ==,3y =,则1a =.故 ③正确因此,本题正确答案是:①②③ 答案选D10、(南京一中学情调研)某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据如下表:根据表中数据得到()2277520450530025750320455K ⨯⨯-⨯=⨯⨯⨯≈15.968,因为2K ≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) 附表:A. 0.1B. 0.05C. 0.01D. 0.001 【答案】D点睛:独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.二、多选题11、(2021年山东日照一中开学调研)经过对2K 的统计量的研究,得到了若干个临界值,当2K 的观测值3.841k >时,我们( )A .在犯错误的概率不超过0.05的前提下可认为A 与B 有关 B .在犯错误的概率不超过0.05的前提下可认为A 与B 无关C .有99%的把握说A 与B 有关D .有95%的把握说A 与B 有关 【答案】AD .【解析】:根据独立性检验原理知,当2K 的观测值 3.841k >时,我们有以下结论:在犯错误的概率不超过0.05的前提下可认为A 与B 有关; 即有95%的把握说A 与B 有关; 所以选项A 、D 正确. 故选:AD .12、(2020届山东省德州市高三上期末)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人 附表:附:()()()()()22n ad bc K a b c d a c b d -=++++ A .25 B .45C .60D .75【答案】BC【解析】设男生的人数为()5n n N*∈,根据题意列出22⨯列联表如下表所示:则()221042310557321n n n n n n K n n n n ⨯⨯-⨯==⨯⨯⨯,由于有95%的把握认为是否喜欢抖音和性别有关,则23.841 6.632K ≤<, 即103.841 6.63221n≤<,得8.066113.9272n ≤<, n N *∈,则n 的可能取值有9、10、11、12,因此,调查人数中男生人数的可能值为45或60. 故选:BC.13、(2020届山东省烟台市高三上期末)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如图所示的列联表.经计算2K 的观测值 4.762k ≈,则可以推断出( )A .该学校男生对食堂服务满意的概率的估计值为5B .调研结果显示,该学校男生比女生对食堂服务更满意C .有95%的把握认为男、女生对该食堂服务的评价有差异D .有99%的把握认为男、女生对该食堂服务的评价有差异 【答案】AC【解析】对于选项A,该学校男生对食堂服务满意的概率的估计值为30330205=+,故A 正确;对于选项B,该学校女生对食堂服务满意的概率的估计值为4043401055=>+,故B 错误; 因为 4.762 3.841k ≈>,所以有95%的把握认为男、女生对该食堂服务的评价有差异,故C 正确,D 错误 故选:AC14、(2010德州期末)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人 附表:k附:2()()()()()n ad bc K a b c d a c b d -=++++A .25B .45C .60D .75【答案】BCD .【解析】:设男生可能有x 人,依题意可得列联表如下;若有95%的把握认为是否喜欢抖音和性别有关,则2 3.841K >,由2242312()25555 3.841732155x x x x x x K x x x x -==>,解得40.335x >, 由题意知0x >,且x 是5的整数倍,所以45,60,和75都满足题意. 故选:BCD .15、(2020·山东滕州市第一中学高三3月模拟)(多选题)下列说法中,正确的命题是( ) A .已知随机变量ξ服从正态分布()22,N δ,()40.84P ξ<=,则()240.16P ξ<<=.B .以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则c ,k 的值分别是4e 和0.3.C .已知两个变量具有线性相关关系,其回归直线方程为y a bx =+,若2b =,1x =,3y =,则1a =.D .若样本数据1x ,2x ,…,10x 的方差为2,则数据121x -,221x -,…,1021x -的方差为16. 【答案】BC【解析】因为随机变量ξ服从正态分布()22,N δ,()40.84P ξ<=,所以()()2440.50.840.50.340.16P P ξξ<<=<-=-=≠,即A 错;ln ln()ln ln kx kx y ce y ce y kx c =∴=∴=+,0.34ln 0.34z x y x =+∴=+,从而40.3,ln 40.3,k c k c e ==∴==,即B 正确;y a bx =+过(,)x y , 321a b b a =+=∴=,即C 正确;因为样本数据1x ,2x ,…,10x 的方差为2,所以数据121x -,221x -,…,1021x -的方差为222=8⨯,即D 错误; 故选:BC16、下列命题中正确的命题是( )A .标准差越小,则反映样本数据的离散程度越大B .在回归直线方程ˆ0.43yx =-+中,当解释变量x 每增加1个单位时,则预报变量y 减少0.4个单位 C .对分类变量X 与Y 来说,它们的随机变量2K 的观测值k 越小,“X 与Y 有关系”的把握程度越大 D .在回归分析模型中,残差平方和越小,说明模型的拟合效果越好 【答案】BD【解析】:标准差越小,则反映样本数据的离散程度越小,因此A 不正确;在回归直线方程ˆ0.43y x =-+中,当解释变量x 每增加1个单位时,则预报变量y 减少0.4个单位,B 正确;对分类变量X 与Y 来说,它们的随机变量2K 的观测值k 越小,“X 与Y 有关系”的把握程度越小,因此C 不正确;在回归分析模型中,残差平方和越小,说明模型的拟合效果越好,D 正确. 故选:BD . 三、填空题17、(山东师范大学附属中学调研)某设备的使用年限x 与所支出的维修费用y 的统计数据如下表:根据上表可得回归直线方程为 1.3y x a =+,据此模型预测,若使用年限为14年,估计维修费约为__________万元. 【答案】18 【解析】23456 1.5 4.5 5.5 6.57.04,555x y ++++++++====,则中心点为()4,5,代入回归直线方程可得5 1.34.2ˆ0a=-⨯=-, 1.30.2y x =-. 当14x =时, 1.3140.218y =⨯-=(万元), 即估计使用14年时,维修费用是18万元. 故答案为:18.18、(江苏南通一中调研)如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________. 【答案】5%19、(江苏栟茶中学开学初调研)某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:在犯错误的概率不超过________的前提下性别与休闲方式有关系.【答案】0.10【解析】由列联表中的数据,得K 2的观测值为k =()289242631855343257⨯⨯-⨯⨯⨯⨯ ≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系. 故答案:0.1020、(江苏徐州一中调研)为了了解司机开车时礼让斑马线行人的情况,交警部门调查了100名机动车司机,得到以下统计数据:若以2χ为统计量进行独立性检验,则2χ的值是__________.(结果保留2位小数)参考公式()1122122121212n n n n n n n n n χ++++-=【答案】8.25【解析】填写2×2列联表,如下:根据数表,计算()()()()()22n ad bc a b c d a c b d -X =++++=()21004025201555456040⨯⨯-⨯⨯⨯⨯≈8.25>7.879,所以有99.5%的把握认为开车时使用手机与司机的性别有关; 21、(2021年江苏淮阴中学调研)某单位为了了解用电量y 度与气温之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程中,,预测当气温为时,用电量的度数约为。

高考数学第一轮复习提分专练习题:统计及统计案例

高考数学第一轮复习提分专练习题:统计及统计案例

高考数学第一轮复习提分专练习题:统计及统计案例查字典数学网高中频道搜集和整理了2021年高考数学第一轮温习提分专练习题:统计及统计案例,以便高三先生更好的梳理知识,轻松备战。

一、选择题1.对某商店一个月内每天的顾主人数停止统计,失掉样本的茎叶图(如下图),那么该样本的中位数、众数、极差区分是()A.46,45,56B.46,45,53C.47,45,56D.45,47,53答案:A 命题立意:此题考察中位数、众数、极差等特征数与茎叶图,难度中等.解题思绪:应用相关概念求解.由茎叶图可知,第15个数据是45,第16个数据是47,所以30天中的顾主人数的中位数是45和47的平均数,即为46.出现次数最多的是45,故众数是45;最大数据68与最小数据12的差是56,即极差是56,应选A.2.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:采用复杂随机抽样法,将零件编号为00,01,02,,99,从中抽出20个;采用系统抽样法,将一切零件分红20组,每组5个,然后每组中随机抽取1个;采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个,那么()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是B.两种抽样方法,这100个零件中每个被抽到的概率都是,并非如此C.两种抽样方法,这100个零件中每个被抽到的概率都是,并非如此D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相反答案:A 解题思绪:由于复杂随机抽样法、系统抽样法与分层抽样法均是等能够性抽样,因此不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是,应选A.3.从某中学一、二两个班中各随机抽取10名先生,测量他们的身高(单位:cm)后取得身高数据的茎叶图如图甲,在这20人中,记身高在[150,160),[160,170),[170,180),[180,190]的人数依次为A1,A2,A3,A4,图乙是统计样本中身高在一定范围内的人数的顺序框图,那么以下说法正确的选项是()A.甲可知一、二两班中平均身高较高的是一班,图乙输入的S的值为18B.甲可知一、二两班中平均身高较高的是二班,图乙输入的S的值为16C.甲可知一、二两班中平均身高较高的是二班,图乙输入的S的值为18D.甲可知一、二两班中平均身高较高的是一班,图乙输入的S的值为16答案:C 命题立意:此题主要考察统计与顺序框图的相关知识,统计效果与顺序框图的结合有能够成为高考命题的热点,此类标题考察的方式多样,难度适中.在该题中对顺序框图的考察主要表达在对其循环结构的考察.此类标题易出现的效果主要是不能从全体上准确掌握顺序框图,无法确定赋值语句、输入语句中各个变量与实践效果的联络,从而不能确定顺序框图所要处置的实践效果中的相关数据.所以处置此类效果首先要明白顺序框图中的各类数据与实践效果中数据之间的对应关系,准确掌握实践效果中数据的实践意义.解题思绪:由茎叶图可知,一班先生身高的平均数为170.3,二班先生身高的平均数为170.8,故二班先生的平均身高较高.由题意可知,A1=2,A2=7,A3=9,A4=2,由顺序框图易知,最后输入的结果为S=7+9+2=18.4.下表是降耗技术改造后消费甲产品进程中记载的产量(吨)与相应的消费能耗y(吨规范煤)的几组对应数据,依据表中提供的数据,求出y关于x的线性回归方程=0.7x+0.35,那么表中m的值为()x 3 4 5 6 y 2.5 m 4 4.5 A.4 B.3.5C.3D.4.5答案:C 命题立意:此题考察统计的相关知识,难度中等. 解题思绪:依题意得=(3+4+5+6)=4.5,=(2.5+m+4+4.5)=,由于回归直线必经过样本中心点,于是有=0.74.5+0.35,解得m=3,应选C.5.某调查机构对本市小先生课业担负状况停止了调查,设平均每人每天做作业的时间为x分钟.有1 000名小先生参与了此项调查,调查所得数据用顺序框图处置,假定输入的结果是680,那么平均每天做作业的时间在0~60分钟内的先生的频率是()A.680B.320C.0.68D.0.32答案:D 解题思绪:顺序框图统计的是作业时间为60分钟以上的先生的数量,因此由输入结果为680知,有680名先生的作业时间超越60分钟,因此作业时间在0~60分钟内的先生总数有320人,故所求频率为0.32.6.两组各7名同窗体重(单位:kg)数据的茎叶图.设,两组数据的平均数依次为1,2,规范差依次为s1和s2,那么()A.12,s1s2B.12,s1s2 D.12,s13.841,因此有95%的掌握以为效果与班级有关系.(3)抽取两次所得编号的基身手情为(1,1),(1,2),(1,3),,(1,6),(2,1),(2,2),(2,3),,(2,6),,(6,1),(6,2),(6,3),,(6,6),共36个.编号之和为6的倍数的基身手情为(1,5),(2,4),(3,3),(4,2),(5,1),(6,6),共6个.2021年高考数学第一轮温习提分专练习题:统计及统计案例曾经呈如今各位同窗面前,望各位同窗可以努力妥协,更多精彩尽在查字典数学网高考频道!。

高考数学二轮复习讲义(新高考版)专题5培优点17概率与统计的创新题型(学生版+解析)

高考数学二轮复习讲义(新高考版)专题5培优点17概率与统计的创新题型(学生版+解析)

培优点17 概率与统计的创新题型概率统计问题在近几年的高考中背景取自现实,题型新颖,综合性增强,难度加深,掌握此类问题的解题策略在高考中就显得非常重要.【典例】 (2020·青岛模拟)某网络购物平台每年11月11日举行“双十一”购物节,当天有多项优惠活动,深受广大消费者喜爱.(1)已知该网络购物平台近5年“双十一”购物节当天成交额如表所示:求成交额y (百亿元)与时间变量x (记2016年为x =1,2017年为x =2,…依次类推)的线性回归方程,并预测2021年该平台“双十一”购物节当天的成交额(百亿元);(2)在2021年“双十一”购物节前,某同学的爸爸、妈妈计划在该网络购物平台上分别参加A ,B 两店各一个订单的“秒杀”抢购,若该同学的爸爸、妈妈在A ,B 两店订单“秒杀”成功的概率分别为p ,q ,记该同学的爸爸和妈妈抢购到的订单总数量为X . ①求X 的分布列及E (X );②已知每个订单由k (k ≥2,k ∈N *)件商品W 构成,记该同学的爸爸和妈妈抢购到商品W 的总数量为Y ,假设p =7sin πk 4k -πk 2,q =sinπk4k,求E (Y )取最大值时正整数k 的值.【拓展训练】一种掷骰子走跳棋的游戏:棋盘上标有第0站、第1站、第2站…第100站,共101站,设棋子跳到第n站的概率为P n,一枚棋子开始在第0站,棋手每掷一次骰子,棋子向前跳动一次.若掷出奇数点,棋子向前跳一站;若掷出偶数点,棋子向前跳两站,直到棋子跳到第99站(获胜)或第100站(失败)时,游戏结束(骰子是用一种均匀材料做成的立方体形状的游戏玩具,它的六个面分别标有点数1,2,3,4,5,6).(1)求P0,P1,P2,并根据棋子跳到第n站的情况,试用P n-2和P n-1表示P n;(2)求证:{P n-P n-1}(n=1,2,…,99)为等比数列;(3)求玩该游戏获胜的概率.培优点17 概率与统计的创新题型概率统计问题在近几年的高考中背景取自现实,题型新颖,综合性增强,难度加深,掌握此类问题的解题策略在高考中就显得非常重要.【典例】 (2020·青岛模拟)某网络购物平台每年11月11日举行“双十一”购物节,当天有多项优惠活动,深受广大消费者喜爱.(1)已知该网络购物平台近5年“双十一”购物节当天成交额如表所示:求成交额y (百亿元)与时间变量x (记2016年为x =1,2017年为x =2,…依次类推)的线性回归方程,并预测2021年该平台“双十一”购物节当天的成交额(百亿元);(2)在2021年“双十一”购物节前,某同学的爸爸、妈妈计划在该网络购物平台上分别参加A ,B 两店各一个订单的“秒杀”抢购,若该同学的爸爸、妈妈在A ,B 两店订单“秒杀”成功的概率分别为p ,q ,记该同学的爸爸和妈妈抢购到的订单总数量为X . ①求X 的分布列及E (X );②已知每个订单由k (k ≥2,k ∈N *)件商品W 构成,记该同学的爸爸和妈妈抢购到商品W 的总数量为Y ,假设p =7sin πk 4k -πk 2,q =sinπk4k ,求E (Y )取最大值时正整数k 的值.【解析】解 (1)由已知可得 x =1+2+3+4+55=3,y =9+12+17+21+275=17.2,i y i =1×9+2×12+3×17+4×21+5×27=303, 2i=12+22+32+42+52=55. 所以b ^=303-5×3×17.255-5×32=4510=4.5,所以a ^=y -b ^x =17.2-4.5×3=3.7, 所以y ^=4.5x +3.7.当x =6时,y ^=4.5×6+3.7=30.7(百亿元),所以预测2021年该平台“双十一”购物节当天的成交额为30.7百亿元.(2)①由题意知,X 的所有可能取值为0,1,2. P (X =0)=(1-p )(1-q ), P (X =1)=(1-p )q +(1-q )p , P (X =2)=pq . 所以X 的分布列为E (X )=0×(1-p )(1-q )+(p +q -2pq )+2pq =p +q . ②因为Y =kX ,所以E (Y )=kE (X )=k (p +q ) =k ⎝ ⎛⎭⎪⎫7sin πk 4k -πk 2+sin πk 4k =2sin πk -πk . 令t =1k ∈⎝⎛⎦⎤0,12, 设f (t )=2sin πt -πt ,则E (Y )=f (t ).因为f ′(t )=2πcos πt -π=2π⎝⎛⎭⎫cos πt -12,且πt ∈⎝⎛⎦⎤0,π2,所以,当t ∈⎝⎛⎭⎫0,13时,f ′(t )>0, 所以f (t )在区间⎝⎛⎭⎫0,13上单调递增; 当t ∈⎝⎛⎭⎫13,12时,f ′(t )<0, 所以f (t )在区间⎝⎛⎭⎫13,12上单调递减, 所以,当t =13时,f (t )max =3-π3,即E (Y )取最大值时,正整数k 的值为3.【方法总结】概率统计问题考查学生的数据分析能力,要从已知数表中经过阅读分析判断获取关键信息,搞清各数据、各事件间的关系,建立适当的数学模型.【拓展训练】一种掷骰子走跳棋的游戏:棋盘上标有第0站、第1站、第2站…第100站,共101站,设棋子跳到第n 站的概率为P n ,一枚棋子开始在第0站,棋手每掷一次骰子,棋子向前跳动一次.若掷出奇数点,棋子向前跳一站;若掷出偶数点,棋子向前跳两站,直到棋子跳到第99站(获胜)或第100站(失败)时,游戏结束(骰子是用一种均匀材料做成的立方体形状的游戏玩具,它的六个面分别标有点数1,2,3,4,5,6).(1)求P 0,P 1,P 2,并根据棋子跳到第n 站的情况,试用P n -2和P n -1表示P n ; (2)求证:{P n -P n -1}(n =1,2,…,99)为等比数列;(3)求玩该游戏获胜的概率.【解析】(1)解 棋子开始在第0站是必然事件,所以P 0=1.棋子跳到第1站,只有一种情形,第一次掷骰子出现奇数点,其概率为12,所以P 1=12.棋子跳到第2站,包括两种情形,①第一次掷骰子出现偶数点,其概率为12;②前两次掷骰子都出现奇数点,其概率为14,所以P 2=12+14=34.棋子跳到第n (2≤n ≤99)站,包括两种情形,①棋子先跳到第n -2站,又掷骰子出现偶数点,其概率为12P n -2;②棋子先跳到第n -1站,又掷骰子出现奇数点,其概率为12P n -1.故P n =12P n -2+12P n -1(2≤n ≤99,n ∈N *).棋子跳到100站只有一种情况,棋子先跳到第98站,又掷骰子出现偶数点,其概率为12P 98,所以P 100=12P 98.(2)证明 由(1)知,当2≤n ≤99时, P n =12P n -2+12P n -1,所以P n -P n -1=-12(P n -1-P n -2).又因为P 1-P 0=-12,所以{P n -P n -1}(n =1,2,…,99)是首项为-12,公比为-12的等比数列.(3)解 由(2)知,P n -P n -1=-12⎝⎛⎭⎫-12n -1=⎝⎛⎭⎫-12n. 所以P 99=(P 99-P 98)+(P 98-P 97)+…+(P 1-P 0)+P 0 =⎝⎛⎭⎫-1299+⎝⎛⎭⎫-1298+…+⎝⎛⎭⎫-12+1 =⎝⎛⎭⎫-12⎣⎡⎦⎤1-⎝⎛⎭⎫-12991-⎝⎛⎭⎫-12+1=23⎝⎛⎭⎫1-12100. 所以玩该游戏获胜的概率为23⎝⎛⎭⎫1-12100.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第17讲 统计与统计案例A 组一、选择题1.某书法社团有男生30名,女生20名,从中抽取一个5人的样本,恰好抽到了2名男生和3名女生①该抽样一定不是系统抽样;②该抽样可能是随机抽样;③该抽样不可能是分层抽样;④男生被抽到的概率大于女生被抽到的概率,其中说法正确的为( )A .①②③B .②③C . ③④D .①④ 【答案】B【解析】由题意得,从男生30名,女生20名,从中抽取一个5人的样本,恰好抽到了2名男生和3名女生,该抽样应该是简单的随机抽样,其中男生被抽到的概率为135P =,女生被抽到的概率为225P =,所以只有②③是正确的,故选B.2.如下图所示的茎叶图记录了甲、乙两组各5名学生在一次英语听力测试中的成绩(单位:分)。

已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A .2,5B .5,5C .5,8D .8,8 【答案】C【解析】由中位数的定义可知5=x ,因8.16524930)85(⨯=+++++y ,故8=y ,应选C 。

3.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设0H :“这种血清不能起到预防感冒的作用”,利用2×2列联表计算的结果,认为0H 成立的可能性不足1%,那么2K 的一个可能取值为( )A .7.897 B.6.635 C. 5.024 D. 3.841 【答案】A【解析】由题这种血清能起到预防感冒的作用为99%的有效率,显然0 6.635,k >所以选A. 4.下列说法正确的是 ( )A .在统计学中,回归分析是检验两个分类变量是否有关系的一种统计方法B .线性回归方程对应的直线至少经过其样本数据点 中的一个点C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D .在回归分析中,相关指数为的模型比相关指数为的模型拟合的效果差a xb yˆˆˆ+=),,(11y x ),,(22y x ),(,33y x ),(n n y x 2R 98.02R 80.0【答案】C【解析】A .回归分析反映两个变量相关关系的数学方法,由建立回归方程来预报变量的情况。

错误;B .线性回归方程对应的直线,过其样本数据平均数点,错误;D .相关指数越大,则相关性越强,模型的拟合效果越好。

错误;C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高. 正确。

二、填空题5.甲、乙、丙三名射击运动员在某次测试中各射击20次,三人的测试成绩如下表分别表示甲、乙、丙三名运动员这次测试成绩的平均数,则的大小关系为 ;分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则的大小关系为 . 【答案】123x x x ==;213s s s >>6.某班有55人,现根据学生的学号,用系统抽样的方法,抽取一个容量为5的样本,已知3号、25号、47号同学在样本中,那么样本中还有两个同学的学号分别为 和 。

【答案】14和36三、解答题7. 某生产企业对其所生产的甲、乙两种产品进行质量检测,分别各抽查10件产品,检测其重量的误差,测得数据如下(单位:mg ): 甲:13 15 14 14 9 14 21 9 10 11 乙:10 14 9 1 15 21 23 19 22 16(Ⅰ)画出样本数据的茎叶图,并指出甲,乙两种商品重量误差的中位数; (Ⅱ)计算甲种商品重量误差的样本方差; (Ⅲ)根据茎叶图分析甲、乙两种产品的质量. 【解析】茎叶图如图.甲,乙两种商品重量误差的中位数分别为13.5,15.5.(Ⅱ)1315141491421111091310x +++++++++==.∴ 甲种商品重量误差的样本方差为()()()()222221[(1313)15131413141391310-+-+-+-+-a xb y ˆˆˆ+=2R 123,,x x x 123,,x x x 123,,s s s 123,,s ss()()()()()222221413211311131013913]+-+-+-+-+-=11.6(Ⅲ)由茎叶图知,乙产品的重量误差的中位数高于甲产品的重量误差的中位数,而且由茎叶图可以大致看出乙产品的重量误差的的标准差要大于甲产品的重量误差的的标准差,说明甲产品的质量较好,而且较稳定. 8.某工厂36名工人的年龄数据如下表: (1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据; (2)计算(1)中样本的平均值x 和方差2s ;(3)求这36名工人中年龄在(),x s x s -+内的人数所占的百分比.【解析】(1)根据系统抽样的方法,抽取容量为9的样本,应分为9组,每组4人. 由题意可知,抽取的样本编号依次为:2,6,10,14,18,22,26,30,34, 对应样本的年龄数据依次为:44,40,36,43,36,37,44,43,37. (2)由(1),得444036433637444337409x ++++++++==,()()()()()()()()()2222222222444040403640434036403740110099444043403740s ⎡⎤-+-+-+-+-+-+⎢⎥==⎢⎥-+-+-⎣⎦. (3)由(2),得1040,3x s ==,∴2136,4333x s x s -=+=,由表可知,这36名工人中年龄在(),x s x s -+内共有23人,所占的百分比为23100%63.89%36⨯≈.x 和判断力y 进行统计分析,得下表数据:(1)请在图中画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y bx a =+; (3)试根据(2)求出的线性回归方程,预测记忆力为9的同学的判断力。

【解析】(1)如图所示.(2)1ni ii x y=∑=6×2+8×3+10×5+12×6=158,9,4x y ==21nii x=∑=62+82+102+122=344, 0.7b =,a bx y =-=4-0.7×9=-2.3,故线性回归方程为ˆy=0.7x -2.3. (3)由回归直线方程,当x =9时,ˆy=6.3-2.3=4,所以预测记忆力为9的同学的判断力约为4. 10.2019年全国两会,即中华人民共和国第十二届全国人民代表大会第四次会议和中国人民政治协商会议第十二届全国委员会第四次会议,分别于2019年3月5日和3月3日在北京开幕.为了解哪些人更关注两会,某机构随机抽取了年龄在1575岁之间的100人进行调查,并按年龄绘制的频率分布直方图如下图所示,其分组区间为:[)[)[)[)[]15,25,25,35,35,45,55,65,65,75.把年龄落在区间[)15,35和[]35,75内的人分别称为“青少年人”和“中老年人”,经统计“青少年人”与“中老年人”的人数之比为9:11.(1)求图中a b 、的值;(2)若“青少年人”中有15人在关注两会,根据已知条件完成下面的22⨯列联表,根据此统计结果能否 有99%的把握认为“中老年人”比“青少年人”更加关注两会? 附参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【解析】(1)依频率分布直方图可知:()()45100.0310055100.0100.0050.005100b a ⎧⨯+=⎪⎪⎨⎪⨯+++=⎪⎩,解之,得0.0350.015a b =⎧⎨=⎩, (2)依题意可知:“青少年人”共有()1000.0150.03045⨯+=人,22⨯列联表如下: 结合列联表的数据得:()()()()()()222100303520159.0915*******n ad bc K a b c d a c b d -⨯⨯-⨯==≈++++⨯⨯⨯因为()2 6.6350.01,9.091 6.635P K >=>,所以有超过99%的把握认为“中老年人”比“青少年人”更加关注两会B 组一、选择题1.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)如图所示;若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数为( )A 、3B 、4C 、5D 、6 【答案】B【解析】根据茎叶图中的数据得,成绩在区间[139,151]上的运动员人数是20,用系统抽样方法从35人中抽取7人,成绩在区间[139,151]上的运动员应抽取207435⨯= (人),故选B. 2.从实验小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图由图中数据可知身高在[120,130]内的学生人数为( )A .3B .25C .30D .35 【答案】C【解析】由图知,(0.035+a+0.020+0.010+0.005)×10=1,解得a=0.03 ∴身高在[120,130]内的学生人数在样本的频率为0.03×10=0.3 故身高在[120,130]内的学生人数为0.3×100=30 3.已知x 与y 之间的一组数据: x 0 1 2 3 y m 3 5.5 7已求得关于y 与x 的线性回归方程为 2.10.85y x =+,则m 的值为( )A .1B .0.85C .0.7D .0.5 【答案】D 【解析】因45.15,5.143210+==+++=m y x ,故将其代入 2.10.85y x =+,可得5.0=m .应选D.4.在一次独立性检验中,得出2×2列联表如下: y 1 y 2 合计 x 1 200 800 1000 x 2 180 m 180+m 合计380800+m1180+m最后发现,两个分类变量x 和y 没有任何关系,则m 的可能值是( )A .200B .720C .100D .180 【答案】B【解析】由独立性检验,已知使两个分类变量无关,则可得;720,800380180=+=m mm二、填空题5.为了了解我校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则报考飞行员的学生人数是 . 【答案】48. 【解析】设图中从左到右的第1小组的频率为x ,则第2小组的频率为2x ,第3小组的频率为3x ,由频率分布直方图的性质,得:230.03750.01351x x x +++⨯+⨯=,解得:0.125x =,∴第2小组的频率为20.25x =,又已知第2小组的频数为12, ∴报考飞行员的学生人数是:120.2548÷=.故答案应填:48.6.某村有2500人,其中青少年1000人,中年人900人,老年人600人,为了调查本村居民的血压情况,采用分层抽样的方法抽取一个样本,若从中年人中抽取36人,从青年人和老年人中抽取的个体数分别为,a b ,则直线80ax by ++=上的点到原点的最短距离为___________.【答案】3434 【解析】2436900600,40369001000=⨯==⨯=b a ,因此直线80ax by ++=上的点到原点的最短距离为34342440822=+ 三、解答题7.今年的NBA 西部决赛勇士和雷霆共进行了七场比赛,经历了残酷的“抢七”比赛,两队的当家球星库里和杜(1)绘制两人得分的茎叶图;(2)分析并比较两位球星的七场比赛的平均得分及得分的稳定程度. 【解析】(1)如图(2)库里的平均得分28)36293122242826(711=++++++=x 分 方差7130]813)6()4(0)2[(71222222221=+++-+-++-=s .杜兰特的平均得分30)27294026332926(712=++++++=x 分方差7152])3()1(10)4(3)1()4[(71222222222=-+-++-++-+-=s . ∴222121,s s x x <<,则这七场比赛库里的平均得分低于杜兰特,但库里的得分更稳定一些.8.100名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示.(1)估计这100名学生的数学成绩落在[50,60)中的人数; (2)求频率分布直方图中a 的值;(3)估计这次考试的中位数n (结果保留一位小数).【解析】(1)由图可知落在[50,60)的频率为0.01×10=0.1由频数=总数×频率,从而得到该范围内的人数为100×0.1=10. (2)由频率分布直方图知组距为10,频率总和为1,可列如下等式:(0.01+0.015+0.03++0.01+a )×10=1 解得a =0.035.(3)前两个小矩形面积为0.01×10+0.015×10=0.25. 第三个小矩形的面积为0.035×10=0.35∵中位数要平分直方图的面积. 1.771.770035.025.05.070=+≈+=∴—n9.甲、乙两所学校高三年级分别有1200人,1000人,为了了解两所学校全体高三年级学生在该地区六校联考的110名学生的数学成绩,并作出了频数分布 统计表如下:(1)计算,的值;(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率;(3)根据以上统计数据完成2×2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.【解析】(1)甲校抽取110×60人,乙校抽取110×=50人, 故x =10, y =7,(2)估计甲校优秀率为, 乙校优秀率为=40%.(3)表格填写如图, k 2=≈2.83>2.706又因为1-0.10=0.9,故有90%的把握认为两个学校的数学成绩有差异. 10.下表提供了甲产品的产量(吨)与利润(万元)的几组对照数据.x y 12002200=100022001525%60=20502110(15302045)60503575⨯-⨯⨯⨯⨯x y(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程; (2)计算相关指数的值,并判断线性模型拟合的效果.参考公式:,【解析】(1) ∴, ,∴,∴ ∴关于的线性回归方程 (2)∴∴线性模型拟合的效果较好C 组一、选择题1.某学校高一、高二、高三年级分别有720、720、800人,现从全校随机抽取56人参加防火防灾问卷调查.先采用分层抽样确定各年级参加调查的人数,再在各年级内采用系统抽样确定参加调查的同学,若将高三年级的同学依次编号为001,002,…,800,则高三年级抽取的同学的编号不可能为( ) A .001,041,……761 B .031,071,……791 C .027,067,……787 D .055,095,……795 【答案】D【解析】由根据分层抽样可得高三年级抽取出20人,利用系统抽样可分成40组得到的数据特征应成等差数列,经计算答案中的数据740055795=-不是40的整数倍,因此这组数据不合系统抽样得到的,故应选D.y x ˆˆˆybx a =+2R 1122211()()ˆˆˆ,()n niii ii i nniii i x x y y x y nx ybay bx x x xnx====---===---∑∑∑∑22121ˆ()1()niii nii y yR y y ==-=--∑∑4.5, 3.5x y ==224 4.5 3.563,4 4.581nx y nx ⋅=⨯⨯==⨯=17.512202766.5ni i i x y ==+++=∑21916253686ni i x ==+++=∑122166.563ˆ0.78681ni ii ni i x y nx ybx nx==--===--∑∑ˆˆ 3.50.7 4.50.35a y bx =-=-⨯=y x ˆ0.70.35yx =+222221()(2.5 3.5)(3 3.5)(4 3.5)(4.5 3.5) 2.5nii y y =-=-+-+--=∑222221ˆ()(2.5 2.45)(3 3.15)(4 3.85)(4.5 4.55)0.05niii y y=-=-+-+--=∑22121ˆ()0.05110.982.5()niii nii y yR y y ==-=-=-=-∑∑2.已知一组数据54321,,,,x x x x x 的平均数是2,方差是31,那么另一组数据23,23,23,23,2354321-----x x x x x 的平均数,方差是( )A .31,2B .1,2C .32,4 D .3,4 【答案】D【解析】因为数据54321,,,,x x x x x 的平均数是2,方差是31,所以31)2(51,2512=-=∑=i i x x ,因此数据23,23,23,23,2354321-----x x x x x 的平均数为:42513)23(515151=-⨯=-∑∑==i i i i x x ,方差为:3319)2(519)63(51)23(51512512251=⨯=-⨯=-=--∑∑∑===i i i i i i x x x x .3.已知关于某设备的使用年限(单位:年)和所支出的维修费用(单位:万元)有如下的统计资料,由上表可得线性回归方程,若规定当维修费用时该设备必须报废,据此模型预报该设备使用年限的最大值为( )A .7B .8C .9D .10 【答案】C【解析】由已知表格得:1(23456)45x =++++=,1(2.2 3.8 5.5 6.57.0)55y =++++= , 由于线性回归直线恒过样本中心点(),x y ,所以有:540.08b =+,解得: 1.23b =, 所以线性回归方程^1.230.08y x =+,由得:1.230.0812x +>解得:9.69x >, 由于*x N ∈,所以据此模型预报该设备使用年限的最大值为9.故选C.则,x y 的函数关系与下列( )类函数最接近(其中,a b 为待定系数) A .y a bx =+ B . xy a b =+ C. 2y ax b =+ D. by a x=+【答案】B【解析】由表格数据逐个验证,观察图象,类似于指数函数,分析选项可知模拟函数为y=a+b x .故选B .x y 0.08y bx =+12y >12y >二、填空题5.一个总体中的80个个体编号为0,1,2,…,79,并依次将其分为8个组,组号为0,1,…,9,要用(错位)系统抽样的方法抽取一个容量为8的样本,即规定先在第1组随机抽取一个号码,记为i ,依次错位地得到后面各组的号码,即第k 组中抽取个位数为i k +(当10i k +<)或10i k +-(当10i k +≥)的号码,在6i =时,所抽到的第8组的号码是 . 【答案】73【解析】第1组抽取号码为6,第8组抽取号码为68106973+-+=6.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程ˆ0.110yx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是 .【答案】②④⑤【解析】线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱,故①错;回归直线方程一定经过样本中心点(),x y P ,所以②正确;③的抽样方式为系统抽样,故③错;由在含有一个解释变量的线性模型中,R 2恰好等于相关系数r 的平方。

相关文档
最新文档