2021届全国新高考数学备考复习 统计与统计案例
2021届高考数学(理)复习之小题必练12 统计与统计案例(理)-学生版
![2021届高考数学(理)复习之小题必练12 统计与统计案例(理)-学生版](https://img.taocdn.com/s3/m/3cc2018d2e3f5727a4e962b0.png)
统计与统计案例是高中数学的重要内容,高考主要考查排列组合,二项式定理,随机抽样,用样本估计总体,变量的相关性,随机事件的概率,古典概型,几何概型,回归分析,独立性检验,离散型随机变量的分布列、期望、方差,正态分布.考查重点是用样本估计总体,古典概率,离散型随机变量的分布列、期望、方差,应用回归分析与独立性检验思想方法解决简单实际问题的能力.试题强调应用性,以实际问题为背景,构建数学模型,突出考查统计与概率的思想和考生的数据处理能力及应用意识.1.【2020全国Ⅰ卷】某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)i ix y(1,2,20)i=得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y a bx=+B.2y a bx=+C.xy a be=+D.lny a b x=+2.【2020全国Ⅲ卷】在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p,且411iip==∑,则下面四种情形中,对应样本的标准差最大的一组是()A.140.1p p==,230.4p p==B.140.4p p==,230.1p p==C.140.2p p==,230.3p p==D.140.3p p==,230.2p p==一、选择题.1.近年来,随着“一带一路”倡议的推进,中国与沿线国家旅游合作越来越密切,中国到“一带一路”沿线国家的游客人也越来越多,如图是20132018-年中国到“一带一路”沿线国家的游客人次情况,则下列说法正确的是( )①20132018-年中国到“一带一路”沿线国家的游客人次逐年增加②20132018-年这6年中,2014年中国到“一带一路”沿线国家的游客人次增幅最小 ③20162018-年这3年中,中国到“一带一路”沿线国家的游客人次每年的增幅基本持平 A .①②③B .②③C .①②D .③2.盒子里装有大小相同的2个红球和1个白球,从中随机取出1个球,取到白球的概率是( ) A .13B .12C .23D .13.设随机变量ξ的分布列如下:其中1a ,2a ,…,6a 构成等差数列,则16a a ⋅的( ) A .最大值为19B .最大值为136C .最小值为19D .最小值为1364.某同学进行3分投篮训练,若该同学投中的概率为12,他连续投篮n 次至少得到3分的概率大于0.9, 那么n 的最小值是( ) A .3B .4C .5D .65.为了调查患胃病是否与生活不规律有关,在患胃病与生活不规律这两个分类变量的计算中,下列说法正确的是( )A .k 越大,“患胃病与生活不规律没有关系”的可信程度越大B .k 越大,“患胃病与生活不规律有关系”的可信程度越小。
2021新高考数学精选考点专项突破:统计与统计案例
![2021新高考数学精选考点专项突破:统计与统计案例](https://img.taocdn.com/s3/m/8e83a3813b3567ec112d8aa3.png)
统计与统计案例一、单选题1、(江苏金陵中学开学初调研)已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测的数据算得的线性回归方程可能是( )A .0.4.3ˆ2yx =+ B .2 2.4ˆyx =- C .9ˆ2.5yx =-+ D .0.3 4.4ˆyx =-+ 【答案】A 【解析】 因为与正相关,排除选项C 、D ,又因为线性回归方程恒过样本点的中心,故排除选项B ;故选A .2、(山东青岛中学调研)已知两个变量x 和y 之间有线性相关关系,经调查得到如下样本数据,根据表格中的数据求得同归方程ˆˆˆybx a =+,则下列说法正确的是( ) A .0a >,0b > B .0a >,0b < C .0a <,0b > D .0a <,0b <【答案】B【解析】由已知数据,可知y 随着x 的增大而减小, 则变量x 和变量y 之间存在负相关的关系,0b ∴<, 当0x =时,则 3.50a y =>>, 即:0a >,0b <. 故选:B.3、(2020届山东省济宁市高三3月月考)下列说法正确的是( )A .回归直线ˆˆˆy bx a =+至少经过其样本数据()()()122,,,,,i n n x y x y x y 中的一个点B .从独立性检验可知有99%的把握认为吃地沟油与患胃肠癌有关系时,我们就说如果某人吃地沟油,那么他有99%可能患胃肠癌C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D .将一组数据的每一个数据都加上或减去同一个常数后,其方差也要加上或减去这个常数 【答案】C【解析】回归直线ˆˆˆy bx a =+可以不经过其样本数据()()()122,,,,,i n n x y x y x y 中的一个点,则A 错误;从独立性检验可知有99%的把握认为吃地沟油与患胃肠癌有关系时,我们就说如果某人吃地沟油,那么他有99%可能患胃肠癌,则B 错误;在残差图中,残差点分布的带状区域的宽度越窄,表示数据的残差越小,其模型拟合的精度越高,即C 正确;将一组数据的每一个数据都加上或减去同一个常数后,其平均数也加上或减去同一个常数,则其方差不变,故D 错误, 故选:C4、(江西省抚州市临川区第一中学2017-2018学年高二下学期期末)临川一中舞蹈社为了研究男女学生对舞蹈的喜爱程度,随机调查学校110名学生是否喜欢跳舞,由列联表和公式()()()()()22n ad bc K a b c d a c b d -=++++计算出2K ,并由此作出结论:“有99%的可能性认为学生喜欢跳舞与性别有关”,则2K 可以为( )A.3.565B.4.204C.5.233D.6.842【答案】D 【解析】利用所给数据,在2 6.635K ≥时,可作出结论:“有99%的可能性认为学生喜欢跳舞与性别有关”,只有D 满足. 故选D.5、(2020年高考全国Ⅰ卷理数)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+【答案】D【解析】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D.6、(2020届山东省济宁市第一中学高三一轮检测)某次考试,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理分数对应如下表:绘出散点图如下:根据以上信息,判断下列结论:①根据此散点图,可以判断数学成绩与物理成绩具有线性相关关系;②根据此散点图,可以判断数学成绩与物理成绩具有一次函数关系;③甲同学数学考了80分,那么,他的物理成绩一定比数学只考了60分的乙同学的物理成绩要高.其中正确的个数为().A.0B.3C.2D.1【答案】D【解析】对于①,根据此散点图知,各点都分布在一条直线附近,可以判断数学成绩与物理成绩具有较强的线性相关关系,①正确;对于②,根据此散点图,可以判断数学成绩与物理成绩具有较强的线性相关关系,不是一次函数关系,②错误;对于③,甲同学数学考了80分,他的物理成绩可能比数学只考了60分的乙同学的物理成绩要高,所以③错误.综上,正确的命题是①,只有1个.故选:D.7、(2020年山东一中调研)学生会为了调查学生对2018年俄罗斯世界杯的关注是否与性别有关,抽样调查100人,得到如下数据:根据表中数据,通过计算统计量()()()()()22n ad bcKa b c d a c b d-=++++,并参考以下临界数据:若由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过()A.0.10 B.0.05 C.0.025 D.0.01【答案】A 【解析】因为()()()()()()22210030101545=3.030 2.70645255575n ad bc K a b c d a c b d -⨯-⨯=≈>++++⨯⨯⨯,所以若由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过0.10,故选A..8、(江苏淮阴中学调研)通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:由2222()110(40302030),7.8()()()()60506050n ad bc K K a b c d a c b d -⨯⨯-⨯==≈++++⨯⨯⨯算得 附表:参照附表,得到的正确结论是( )A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 【答案】A 【解析】由27.8 6.635K ≈>,而()2 6.6350.010P K ≥=,故由独立性检验的意义可知选A9、(江苏南通中学开学初调研)下列说法中,正确说法的个数是( )①在用22⨯列联表分析两个分类变量A 与B 之间的关系时,随机变量2K 的观测值k 越大,说明“A 与B 有关系”的可信度越大②以模型kxy ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0. 3③已知两个变量具有线性相关关系,其回归直线方程为y a bx =+,若2b =,1,3x y ==,则1a = A .0 B .1 C .2 D .3【答案】D【解析】对于①,分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; 对于②,kx y ce =,∴两边取对数,可得()ln ln ln ln ln kx kxy ce c e c kx ==+=+,令ln z y =,可得ln ,0.34,ln 4,0.3z c kx z x c k =+=+∴==, 4c e ∴=.即②正确;对于③,根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1b x ==,3y =,则1a =.故 ③正确因此,本题正确答案是:①②③ 答案选D10、(南京一中学情调研)某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据如下表:根据表中数据得到()2277520450530025750320455K ⨯⨯-⨯=⨯⨯⨯≈15.968,因为2K ≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) 附表:A. 0.1B. 0.05C. 0.01D. 0.001 【答案】D点睛:独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.二、多选题11、(2021年山东日照一中开学调研)经过对2K 的统计量的研究,得到了若干个临界值,当2K 的观测值3.841k >时,我们( )A .在犯错误的概率不超过0.05的前提下可认为A 与B 有关 B .在犯错误的概率不超过0.05的前提下可认为A 与B 无关C .有99%的把握说A 与B 有关D .有95%的把握说A 与B 有关 【答案】AD .【解析】:根据独立性检验原理知,当2K 的观测值 3.841k >时,我们有以下结论:在犯错误的概率不超过0.05的前提下可认为A 与B 有关; 即有95%的把握说A 与B 有关; 所以选项A 、D 正确. 故选:AD .12、(2020届山东省德州市高三上期末)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人 附表:附:()()()()()22n ad bc K a b c d a c b d -=++++ A .25 B .45C .60D .75【答案】BC【解析】设男生的人数为()5n n N*∈,根据题意列出22⨯列联表如下表所示:则()221042310557321n n n n n n K n n n n ⨯⨯-⨯==⨯⨯⨯,由于有95%的把握认为是否喜欢抖音和性别有关,则23.841 6.632K ≤<, 即103.841 6.63221n≤<,得8.066113.9272n ≤<, n N *∈,则n 的可能取值有9、10、11、12,因此,调查人数中男生人数的可能值为45或60. 故选:BC.13、(2020届山东省烟台市高三上期末)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如图所示的列联表.经计算2K 的观测值 4.762k ≈,则可以推断出( )A .该学校男生对食堂服务满意的概率的估计值为5B .调研结果显示,该学校男生比女生对食堂服务更满意C .有95%的把握认为男、女生对该食堂服务的评价有差异D .有99%的把握认为男、女生对该食堂服务的评价有差异 【答案】AC【解析】对于选项A,该学校男生对食堂服务满意的概率的估计值为30330205=+,故A 正确;对于选项B,该学校女生对食堂服务满意的概率的估计值为4043401055=>+,故B 错误; 因为 4.762 3.841k ≈>,所以有95%的把握认为男、女生对该食堂服务的评价有差异,故C 正确,D 错误 故选:AC14、(2010德州期末)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人 附表:k附:2()()()()()n ad bc K a b c d a c b d -=++++A .25B .45C .60D .75【答案】BCD .【解析】:设男生可能有x 人,依题意可得列联表如下;若有95%的把握认为是否喜欢抖音和性别有关,则2 3.841K >,由2242312()25555 3.841732155x x x x x x K x x x x -==>,解得40.335x >, 由题意知0x >,且x 是5的整数倍,所以45,60,和75都满足题意. 故选:BCD .15、(2020·山东滕州市第一中学高三3月模拟)(多选题)下列说法中,正确的命题是( ) A .已知随机变量ξ服从正态分布()22,N δ,()40.84P ξ<=,则()240.16P ξ<<=.B .以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则c ,k 的值分别是4e 和0.3.C .已知两个变量具有线性相关关系,其回归直线方程为y a bx =+,若2b =,1x =,3y =,则1a =.D .若样本数据1x ,2x ,…,10x 的方差为2,则数据121x -,221x -,…,1021x -的方差为16. 【答案】BC【解析】因为随机变量ξ服从正态分布()22,N δ,()40.84P ξ<=,所以()()2440.50.840.50.340.16P P ξξ<<=<-=-=≠,即A 错;ln ln()ln ln kx kx y ce y ce y kx c =∴=∴=+,0.34ln 0.34z x y x =+∴=+,从而40.3,ln 40.3,k c k c e ==∴==,即B 正确;y a bx =+过(,)x y , 321a b b a =+=∴=,即C 正确;因为样本数据1x ,2x ,…,10x 的方差为2,所以数据121x -,221x -,…,1021x -的方差为222=8⨯,即D 错误; 故选:BC16、下列命题中正确的命题是( )A .标准差越小,则反映样本数据的离散程度越大B .在回归直线方程ˆ0.43yx =-+中,当解释变量x 每增加1个单位时,则预报变量y 减少0.4个单位 C .对分类变量X 与Y 来说,它们的随机变量2K 的观测值k 越小,“X 与Y 有关系”的把握程度越大 D .在回归分析模型中,残差平方和越小,说明模型的拟合效果越好 【答案】BD【解析】:标准差越小,则反映样本数据的离散程度越小,因此A 不正确;在回归直线方程ˆ0.43y x =-+中,当解释变量x 每增加1个单位时,则预报变量y 减少0.4个单位,B 正确;对分类变量X 与Y 来说,它们的随机变量2K 的观测值k 越小,“X 与Y 有关系”的把握程度越小,因此C 不正确;在回归分析模型中,残差平方和越小,说明模型的拟合效果越好,D 正确. 故选:BD . 三、填空题17、(山东师范大学附属中学调研)某设备的使用年限x 与所支出的维修费用y 的统计数据如下表:根据上表可得回归直线方程为 1.3y x a =+,据此模型预测,若使用年限为14年,估计维修费约为__________万元. 【答案】18 【解析】23456 1.5 4.5 5.5 6.57.04,555x y ++++++++====,则中心点为()4,5,代入回归直线方程可得5 1.34.2ˆ0a=-⨯=-, 1.30.2y x =-. 当14x =时, 1.3140.218y =⨯-=(万元), 即估计使用14年时,维修费用是18万元. 故答案为:18.18、(江苏南通一中调研)如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________. 【答案】5%19、(江苏栟茶中学开学初调研)某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:在犯错误的概率不超过________的前提下性别与休闲方式有关系.【答案】0.10【解析】由列联表中的数据,得K 2的观测值为k =()289242631855343257⨯⨯-⨯⨯⨯⨯ ≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系. 故答案:0.1020、(江苏徐州一中调研)为了了解司机开车时礼让斑马线行人的情况,交警部门调查了100名机动车司机,得到以下统计数据:若以2χ为统计量进行独立性检验,则2χ的值是__________.(结果保留2位小数)参考公式()1122122121212n n n n n n n n n χ++++-=【答案】8.25【解析】填写2×2列联表,如下:根据数表,计算()()()()()22n ad bc a b c d a c b d -X =++++=()21004025201555456040⨯⨯-⨯⨯⨯⨯≈8.25>7.879,所以有99.5%的把握认为开车时使用手机与司机的性别有关; 21、(2021年江苏淮阴中学调研)某单位为了了解用电量y 度与气温之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程中,,预测当气温为时,用电量的度数约为。
2021版新高考数学一轮复习课件:第10章 统计、统计案例(共3个课时)
![2021版新高考数学一轮复习课件:第10章 统计、统计案例(共3个课时)](https://img.taocdn.com/s3/m/7fc3ac5bde80d4d8d15a4fe9.png)
可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合
适的抽样方法是____________.
分层抽样
• [解析] 因为不同年龄段客户对其服务的评价有较大差异,所以根据三 种抽样方法的特点可知最合适的抽样方法是分层抽样.
• 5.(2019·课标全国Ⅰ)某学校为了解1 000名新生的身体素质,将这些
• 知识点四 分层抽样
• 一般地,在抽样时将总体分成互不交叉的层,然后按一照定的比例 ______________,从各层独立地抽取一定数量的个体,将各层取出的 个体合在一起作为样本,这种抽样方法叫做分层抽样.
• 分层抽样的应用范围:当总体是由______________________组成时,
往往选用分层抽样的方法.
第十章 统计、统计案例
第一讲 随机抽样
1 知识梳理 • 双基自测 2 考点突破 • 互动探究 3 名师讲坛 • 素养提升
知识梳理 • 双基自测
• 知识点一 总体、个体、样本、样本容量的概念
• 统计中所考察对象的全体构成的集合看做总体,构成总体的每个元素 作样为本个 中体 个, 体从 的总___体__中_一_抽_部叫取分做的个样_体_本___容_量___._____所组成的集合叫做样本,
()
• A.33,34,33 B.25,56,19
B
• C.30,40,30 D.30,50,20
• [解析] 因为125 280 95=25 56 19,所以抽取人数分别为 25,56,19.
• 3取.一(P个59容T2)量某为班4共的有样5本2人,,已现知根3号据,学2生9号的,学4号2号,学用生系在统样抽本样中的,方那法么,样抽
本中还有一个学生的学号是
()
新高考数学复习专题-专题二十 统计与统计案例(原卷版)
![新高考数学复习专题-专题二十 统计与统计案例(原卷版)](https://img.taocdn.com/s3/m/8221da056d85ec3a87c24028915f804d2b168748.png)
专题二十 统计与统计案例一、单选题1.(2021·河南高二月考(文))有下列四个命题:( ) ①在回归分析中,残差的平方和越小,模型的拟合效果越好;②在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ③若数据1x ,2x ,…,n x 的平均数为1,则12x ,22x ,…2n x 的平均数为2; ④对分类变量x 与y 的随机变量2K 的观测值k 来说,k 越小,判断“x 与y 有关系”的把握越大.其中真命题的个数为( ) A .1B .2C .3D .42.(2021·全国高二课时练习)若由一个22⨯列联表中的数据计算得2 4.013K =,那么有( )把握认为两个变量有关系.20()P K k ≥ 0.150.10 0.05 0.025 0.010 0.005 0.0010k2.072 2.7063.841 5.024 6.635 7.879 10.828A .95%B .97.5%C .99%D .99.9%第II 卷(非选择题)请点击修改第II 卷的文字说明二、解答题3.(2021·广东汕头市·高三一模)为确保我国如期全面建成小康社会,实现第一个百年奋斗目标打下了坚实的基础.在产业扶贫政策的大力支持下,某玩具厂对原有的生产线进行技术升级,为了更好地对比升级前和升级后的效果,其中甲生产线继续使用旧的生产模式,乙生产线采用新的生产模式.质检部门随机抽检了甲、乙两条生产线的各100件玩具,在抽取的200件玩具中,根据检测结果将它们分为“A ”、“B ”、“C ”三个等级,,A B 等级都是合格品,C 等级是次品,统计结果如表所示:等级ABC频数 100 75 25(表二)合格品 次品 合计 甲 80 乙 5 合计在相关政策扶持下,确保每件合格品都有对口销售渠道,但从安全起见,所有的次品必须由厂家自行销毁.(1)请根据所提供的数据,完成上面的22⨯列联表(表二),并判断是否有99.5%的把握认为产品的合格率与技术升级有关?(2)每件玩具的生产成本为20元,,A B 等级产品的出厂单价分别为m 元、40元.若甲生产线抽检的玩具中有35件为A 等级,用样本的频率估计概率,若进行技术升级后,平均生产一件玩具比技术升级前多盈利12元,则A 等级产品的出产单价为多少元?附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥0.05 0.025 0.010 0.005 0.0010k3.841 5.024 6.635 7.879 10.8284.(2021·河南高二月考(文))某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,得出以下22⨯列联表:积极参加班级工作不太主动参加班级工作总计 学习积极性高 18725 学习积极性一般ab25 总计cd50如果随机抽查该班的一名学生,那么抽到积极参加班级工作的学生的概率是1225. (1)求a ,b ,c ,d 的值.(2)试运用独立性检验的思想方法分析:能否有99.9%的把握认为学生的学习积极性与对待班级工作的态度有关系?并说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:20()P K k ≥0.10 0.05 0.025 0.010 0.005 0.0010k2.7063.841 5.024 6.635 7.879 10.8285.(2021·内蒙古包头市·高三一模(文))某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积以及相应的管理时间的关系如下表: 土地使用面积x (单位:亩) 1 2 3 4 5 管理时间y (单位:月)911142620并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:愿意参与管理不愿意参与管理男性村民 140 60 女性村民40(1)求相关系数r 的大小(精确到0.01),并判断管理时间y 与土地使用面积x 的线性相关程度;(2)是否有99.9%的把握认为村民的性别与参与管理的意愿具有相关性?参考公式:()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑,()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.临界值表:()20P K k ≥0.100 0.050 0.025 0.010 0.0010k2.7063.841 5.024 6.635 10.82848522.02≈.6.(2021·聊城市·山东聊城一中高三一模)已知某班有50位学生,现对该班关于“举办辩论赛”的态度进行调查,,他们综合评价成绩的频数分布以及对“举办辩论赛”的赞成人数如下表:综合评价成绩(单位:分) [40,50)[50,60)[60,70)[70,80)[80,90)[90,100)频数 510151055赞成人数4812431(1)请根据以上统计数据填写下面2×2列联表,并回答:是否有95%的把握认为“综合评价成绩以80分位分界点”对“举办辩论赛”的态度有差异?综合评价成绩小于80分的人数综合评价成绩不小于80分的人数合计赞成 不赞成 合计(2)若采用分层抽样在综合评价成绩在[60,70),[70,80)的学生中随机抽取10人进行追踪调查,并选其中3人担任辩论赛主持人,求担任主持人的3人中至少有1人在[60,70)的概率.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:P()20Kk ≥0.10 0.050.010 0.005 k 02.7063.8416.6357.8797.(2021·全国高三月考(理))某购物网站统计了,A B 两款手机在2020年7月至11月的总销售量y (单位:百部),得到以下数据: 月份x 7 8 9 10 11 销售量y100120110120200(Ⅰ)已知销售量y 与月份x 满足线性相关关系,求出y 关于x 的线性回归方程,ˆˆˆybx a =+,并预测12月的手机销售量; (Ⅱ)网站数据分析人员发现:,A B 两款手机11月的销售量与顾客性别有关.请填写下面的22⨯列联表,并判断能否有超过99.5%的把握认为“,A B 两款手机11月的销售量与顾客性别有关”?男性顾客女性顾客合计A 款销售量90B 款销售量50合计90参考公式:()()()121niii ni i x x y y b x x ==--=-∑∑,ˆˆay bx =-, ()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.临界值表:()20P K k ≥ 0.010 0.005 0.0010k6.6357.879 10.8288.(2021·湖北高三月考)近年来,明代著名医药学家李时珍故乡黄冈市蕲春县大力发展大健康产业,蕲艾产业化种植已经成为该县脱贫攻坚的主要产业之一,已知蕲艾的株高y (单位:cm)与一定范围内的温度x (单位:℃)有关,现收集了蕲艾的13组观测数据,得到如下的散点图:现根据散点图利用y a x =+dy c x=+建立y 关于x 的回归方程,令s x =,1t x=得到如下数据: xyst10.15109.943.040.16113ni ii s y s y =-⋅∑ 13113i ii t yt y =-⋅∑1322113ik ss =-∑1322113ii tt =-∑1322113ii yy =-∑13.94 -2.1 11.67 0.21 21.22且(i s ,i y )与(i t ,i y )(i =1,2,3,…,13)的相关系数分别为1r ,2r ,且2r =﹣0.9953. (1)用相关系数说明哪种模型建立y 与x 的回归方程更合适; (2)根据(1)的结果及表中数据,建立y 关于x 的回归方程;(3)已知蕲艾的利润z 与x 、y 的关系为1202z y x =-,当x 为何值时,z 的预报值最大.参考数据和公式:0.21×21.22=4.4562,11.67×21.22=247.6374,247.637415.7365,对于一组数据(i u ,i v )(i =1,2,3,…,n ),其回归直线方程v u αβ=+的斜率和截距的最小二乘法估计分别为1221ni i i nii u vnu v unuβ==-⋅=-∑∑,v u αβ=-,相关系数222211ni i nniii i u vnu vr unu vnv==-⋅=-⋅-∑∑∑.9.(2021·辽宁高三期末(文))2019年4月,中国电信公布了2019年的终端洞察报告,其中,国产手机品牌表现抢眼,统治地位不容置疑.在2018年6—11月上市的新机中,用户最满意机型与用户推荐机型的项目中国产手机优势明显,华为及荣耀手机分别占据不同价位段的榜单第一,OPPO 、vivo 、小米、魅族均有机型占据榜单.在用户满意机型调研项目中,曾经位于神坛地位的苹果手机也仅仅只有iPhoneXR 一款位列第三.最满意度机型TOP3 中国电信大于3500 2500-3499 1500-2499 1000-1499 1000元以下 第一名华为P30 ProvivoiQoo荣耀9X Vivo Z5x华为畅享9e第二名三星S10+荣耀20Pro红米K20ProOPPO A9红米7第三名iPhone XRVivo X27化为 麦芒8华为畅享9plus中兴BladeA7 (1)从上表中“华为(不含荣耀)”和“iPhoneXR ”的5个机型中任取2个,求这两个机型都是华为的概率;(2)测试数据源于消费者的反馈,从反馈信息中随机抽取500个“华为畅享9plus ”消费者,其中来自城市300个,来自农村200个,统计他们对“华为畅想9plus ”的满意情况如下:满意不满意城市 270 30 农村17030根据上表数据,问是否有95%的把握认为消费者是否满意与城市用户还是农村用户有关?(附:()()()()()22n ad bc X a b c d a c b d -=++++;当2 3.841X >时,有95%的把握说事件A与B 有关;当2 6.635X >时,有99%的把握说事件A 与B 有关;当2 3.841X ≤时,认为事件A 与B 是无关的)10.(2021·全国高三其他模拟)在我国,大学生就业压力日益严峻,伴随着政府政策的引导与社会观念的转变,大学生的创业意识与就业方向也悄然发生转变.某大学生在国家提供的税收,担保贷款等多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数i y (单位:万元)与时间i t (单位:年)的数据,列表如下:i t1 2 3 4 5i y2.4 2.7 4.1 6.4 7.9(1)依据表中给出的数据,是否可用线性回归模型拟合与t 的关系,请计算相关系数r 并加以说明(计算结果精确到0.01).(若0.75r>,则线性相关程度很高,可用线性回归模型拟合)(2)该专营店为吸引顾客,特推出两种促销方案. 方案一:每满500元可减50元;方案二:每满500元可抽奖一次,每次中奖的概率都为25,中奖就可以获得100元现金奖励,假设顾客每次抽奖的结果相互独立.(ⅰ)某位顾客购买了1050元的产品,该顾客选择参加两次抽奖,求该顾客换得100元现金奖励的概率(ⅱ)某位顾客购买了2000元的产品,作为专营店老板,是希望该顾客直接选择方案一返回200元现金,还是选择方案二参加四次抽奖?说明理由.附:相关系数公式:()()()()()()1122221111nnii i ii i nnnniiiii i i i tt y y t yntyr tt yy tt yy ======---=----∑∑∑∑∑∑,参考数据:56.957.547≈,5185.2i i i t y ==∑,()52110i i t t =-=∑,()52122.78i i y y =-∑11.(2021·全国高三其他模拟)人均可支配收入是反映一个地区居民收入水平和城市经济发展水平的重要指标,并且对人均消费水平有重大影响,下图是根据国家统计局发布的《2020年上半年居民收入和消费支出情况》绘制的,是我国31个省(区、市)2020年上半年人均可支配收入x (单位:元)与人均消费支出y (单位:元)的散点图.(1)由散点图可以看出,可以用线性回归模型ˆˆybx a =+拟合人均消费支出y 与人均可支配收入x 的关系,请用相关系数加以说明; (2)建立y 关于x 的线性回归方程(精确到0.01);(3)根据(2)的结论,规定半年人均盈余(人均可支配收入-人均消费支出)不低于4620元的省(区、市)达到阶段小康的标准,则估计达到阶段小康标准的省(区、市)的半年人均可支配收入至少为多少元? 参考数据:xy()3121=-∑ii xx()()311=--∑ii i xx y y()3121=-∑ii xx()3121=-∑ii yy15500 9632 1412000000 683900000 38000 18400参考公式:相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑回归方程ˆˆˆybx a =+中斜率和截距的最小二乘估计公式分别为()()()121ˆniii nii x x y y b x x ==--=-∑∑,ˆˆay bx =-. 12.(2021·甘肃兰州市·高三其他模拟(文))某校高二生物研究性学习小组的同学们为了研究当地某种昆虫的产卵数与温度的变化关系,他们收集了一只该种昆虫在温度C x ︒时相对应产卵数个数为y 的8组数据,为了对数据进行分析,他们绘制了如下散点图:(1)根据散点图,甲、乙两位同学分别用y bx a =+和z dx c =+(其中ln z y =)两种模型进行回归分析,试判断这两位同学得到的回归方程中,哪一个的相关指数2R 更接近1;(给出判断即可,不必说明理由)(2)根据(1)的结论选定上述两个模型中更适宜作为对昆虫产卵数与温度变化关系进行回归分析的模型,并利用下表中数据,计算该模型的回归方程: (方程表示为()y f x =的形式,数据计算结果保留两位小数) xyz81i ii x y =∑81i i i x z =∑821ii x=∑26 72 3.3 11871 757 5722(3)据测算,若只此种昆虫的产卵数超过4e ,则会发生虫害.研究性学习小组的同学通过查阅气象资料得知近期当地温度维持在25C ︒左右,试利用(2)中的回归方程预测近期当地是否会发生虫害.附:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线v u βα=+的斜率和截距的最小二乘估计分别为1221ˆˆˆ,nl i i ni i u v nuvv u unu βαβ==-==--∑∑. 13.(2021·全国高三月考(文))2020年11月24日我国使用长征五号运载火箭成功发射嫦娥五号月球探测器,12月17日嫦娥五号返回器携带月球样品在预定地区安全着陆,探月工程嫦娥五号任务取得圆满成功.某大学为此举行了与嫦娥系列探测工程有关的知识测试,测试满分为100分,该校某专业的100名大一学生参加了学校举行的测试,记录这100名学生的分数,将数据分成7组; [)[)[]30,40,40,50,,90,100⋯,并整理得到如下频率分布直方图:(1)估计这100名学生测试分数的中位数;(2)把分数不低于80分的称为优秀,已知这100名学生中男生有70人,其中测试优秀的男生有45人,填写下面列联表,并根据列联表判断是否有95%的把握认为测试优秀与性别有关: 男生 女生 优秀 不优秀附:20()P K k ≥0.050 0.010 0.0010k 3.841 6.635 10.828()()()()()22n ad bc K a b c d a c b d -=++++ (3)对于样本中分数在[)[]80,90,90,100的人数,学校准备按比例从这2组中抽取12人,在从这12人中随机抽取3人参与学校有关的宣传活动,记这3人分数不低于90分的学生数为,X 求X 的分布列.14.(2021·江西高三其他模拟(文))某疫苗进行安全性临床试验.该疫苗安全性的一个重要指标是:注射疫苗后人体血液中的高铁血红蛋白(MetHb )的含量(以下简称为“M 含量”)不超过1%,则为阴性,认为受试者出现血症.若一批受试者的M 含量平均数不超过0.65%,出现血症的被测试者的比例不超过5%,同时满足这两个条件则认为该疫苗在M 含量指标上是“安全的”;否则为“不安全”.现有男、女志愿者各200名接受了该疫苗注射.经数据整理,制得频率分布直方图如图.(注:在频率分布直方图中,同一组数据用该区间的中点值作代表.)(1)请说明该疫苗在M 含量指标上的安全性;(2)按照性别分层抽样,随机抽取50名志愿者进行M 含量的检测,其中女性志愿者被检测出阳性的恰好1人.请利用样本估计总体的思想,完成这400名志愿者的22⨯列联表,并判断是否有超过95%的把握认为,注射该疫苗后,高铁血红蛋白血症与性别有关?性别 阴性阳性男 女 合计阳性 阴性合计附:()()()()()22n ad bcKa b c d a c b d-=++++.()2P K k≥0.050 0.010 0.001 0k 3.841 6.635 10.82815.(2021·全国高三专题练习(文))在关研究表明,正确佩戴安全头盔,规范使用安全带能够将交通事故死亡风险大幅降低,对保护群众生命安全具有重要作用.2020年4月,“一盔一带”安全守护行动在全国各地开展.行动期间,公安交管部门将加强执法管理,依法查纠摩托车和电动自行车骑乘人员不佩戴安全头盔,汽车驾乘人员不使用安全带的行为,助推养成安全习惯.该行动开展一段时间后,某市针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查的1000名骑行人员中,记录其年龄和是否佩戴头盔情况,得到如下的统计图表:(Ⅰ)估算该市电动自行车骑乘人员的平均年龄;(Ⅱ)根据所给的数据,完成下面的列联表:是否佩戴头盔年龄是否[)20,40[]40,70(Ⅲ)根据(Ⅱ)中的列联表,判断是否有99%把握认为遵守佩戴安全头盔与年龄有关?附:()()()()()22n ad bcKa b c d a c b d-=++++,()2P K k≥0.050 0.010 0.001k 3.841 6.635 10.82816.(2021·全国高三专题练习(文))针对偏远地区因交通不便、消息闭塞导致优质农产品藏在山中无人识的现象,各地区开始尝试将电商扶贫作为精准扶贫的重要措施.为了解电商扶贫的效果,某部门随机就100个贫困地区进行了调查,其当年的电商扶贫年度总投入(单位:万元)及当年人均可支配年收入(单位:元)的贫困地区数目的数据如下表:人均可支配年收入(元)电商扶贫年度总投入(万元)(5000,10000] (10000,15000] (15000,20000] (0,500] 5 3 2(500,1000] 3 21 6(1000,3000) 2 34 24(1)估计该年度内贫困地区人均可支配年收入过万的概率,并求本年度这100个贫困地区的人均可支配年收入的平均值的估计值(同一组数据用该组数据区间的中间值代表);(2)根据所给数据完成下面的列联表,并判断是否有99%的把握认为当地的人均可支配年收入是否过万与当地电商扶贫年度总投入是否超过千万有关.人均可支配年收入≤10000元人均可支配年收入>10000元电商扶贫年度总投入不超过1000万电商扶贫年度总投入超过1000万附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()2P K k ≥0.050 0.01 0.005 k3.8416.6357.87917.(2021·全国高三专题练习(文))为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异?(3)若男生身高低于165厘米为偏矮,不低于165厘米且低于175厘米为正常,不低于175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.0010k2.7063.8415.0246.6357.879 10.828参照公式:()()()()()22n ad bc k a b c d a c b d -=++++ 18.(2021·全国高三专题练习(文))某生物研究所研发了某种型号的新冠疫苗,为检验该种型号疫苗的效果,研究所将疫苗用在小白鼠身上进行科研实验,得到如下数据:未感染病毒感染病毒 总计未注射疫苗 a 60 m 注射疫苗 b30 n总计11090200从未注射疫苗的小白鼠中任取1只,取到“未感染病毒”的小白鼠的概率为5. (1)能否有99.9%的把握认为注射此疫苗有效?(2)在感染病毒的小白鼠中,按未注射疫苗和注射疫苗的比例抽取6只进行病理分析,然后从这6只小白鼠中随机抽取2只对注射疫苗的情况进行核实,求至少有1只为注射过疫苗的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++. ()2P K k ≥0.05 0.025 0.010 0.005 0.001 k3.8415.0246.6357.87910.82819.(2021·全国高三专题练习(文))某研究部门为了研究气温变化与患流感人数多少之间的关系,在某地随机对50人进行了问卷调查得到如下列表:(附22()()()()()n ad bc K a b c d a c b d -=++++)高于22.5C ︒ 不高于22.5C ︒ 合计 患流感2025不患流感15合计50(1)对上述22⨯列联表进行填空,并判断是否有99%的把握认为患流感与温度有关,说明你的理由;(2)为了了解患流感与年龄的关系,已知某地患有流感的老年、中年、青年的人数分别为108人,72人,36人.按分层抽样的方法随机抽取6人进行问卷调查,再从6人中随机抽取2人进行调查结果对比,求这2人中至少一人是中年人的概率.()2>0.10 0.05 0.025 0.01 P K kk 2.701 3.841 5.024 6.63520.(2021·山东德州市·高三一模)2021年春晚首次采用“云”传播,“云”互动形式,实现隔空连线心意相通,全球华人心连心“云团圆”,共享新春氛围,“云课堂”亦是一种真正完全突破时空限制的全方位互动性学习模式.某市随机抽取200人对“云课堂”倡议的了解情况进行了问卷调查,记Y表示了解,N表示不了解,统计结果如下表所示:(表一)了解情况Y N人数140 60(表二)男女合计Y80N40合计(1)请根据所提供的数据,完成上面的22⨯列联表(表二),并判断是否有99%的把握认为对“云课堂”倡议的了解情况与性别有关系;(2)用样本估计总体,将频率视为概率,在男性市民和女性市民中各随机抽取4人,记“4名男性中恰有3人了解云课堂倡议”的概率为1P,“4名女性中恰有3人了解云课堂倡议”的概率为2P .试求出1P 与2P ,并比较1P 与2P 的大小. 附:临界值参考表的参考公式()20p K K ≥0.10 0.05 0.025 0.010 0.005 0.0010K 2.7063.841 5.024 6.635 7.879 10.828()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++) 21.(2021·吉林长春市·高三二模(理))随着互联网行业、传统行业和实体经济的融合不断加深,互联网对社会经济发展的推动效果日益显著,某大型超市计划在不同的线上销售平台开设网店,为确定开设网店的数量,该超市在对网络上相关店铺做了充分的调查后,得到下列信息,如图所示(其中x 表示开设网店数量,y 表示这x 个分店的年销售额总和),现已知55118850,2000i ii i i x yy ====∑∑,求解下列问题;(1)经判断,可利用线性回归模型拟合y 与x 的关系,求解y 关于x 的回归方程; (2)按照经验,超市每年在网上销售获得的总利润w (单位:万元)满足25140w y x =--,请根据(1)中的线性回归方程,估算该超市在网上开设多少分店时,才能使得总利润最大.参考公式;线性回归方程y bx a =+,其中515221,i ii ii x y nx ya y bxb xnx==-=-=-∑∑22.(2021·河南高三月考(文))2020年初,新冠病毒肆虐.疫情期间,停课不停教学,各学校以网课形式进行教学.教育局抽样对某所学校的高三1000名学生某一周每天学习时间以及考试进行了调查,得如下频数分布表 学习时间(分钟) [)7,7.5[)7.5,8[)8,8.5[)8.5,9[)9,9.5[]9.5,10人数160190200180150120从1000名学生中抽取50名学生,调查学习时间与成绩的关系,得如下二阶列联表学习时间9小时以上(含9小时)学习时间9小时以下合计总分600分以上(含600分) 7 3 10 总分600分以下 17 23 40 合计242650(1)求出第一星期这1000名学生学习时间的中位数;(2)为了解学生们的学习状况,一次考试结束,从全年级随机抽取50人根据学习时间的多少和成绩的是否优秀列成以下列联表计算说明:有没有90%的把握认为总分600分以上和学习时间超过9小时有关附公式及表如下:()()()()()22n ad bc K a b c d a c b d -=++++ ()20P K K ≥ 0.150.10 0.05 0.025 0.010 0.005 0.0010k2.0722.7063.841 5.024 6.635 7.879 10.82823.(2021·全国高三专题练习)垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调查产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据()(),1,2,,20i i x y i =⋅⋅⋅,其中i x 和i y 分别表示第i 个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得20180i i x ==∑,2014000i i y ==∑,()202180i i x x=-=∑,()20218000ii y y =-=∑,()()201700i ii x xy y =--=∑.(1)请用相关系数说明该组数据中y 与x 之间的关系可用线性回归模型进行拟合; (2)求y 关于x 的线性回归方程,用所求回归方程预测该市10万人口的县城年垃圾产生总量约为多少吨?参考公式:相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑,对于一组具有线性相关关系的数据()(),1,2,3,,i i x y i n =⋅⋅⋅,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-.24.(2021·全国高三专题练习(文))随着冬季的到来,是否应该自觉佩戴口罩成为了人们热议的一个话题.为了调查佩戴口罩的态度与性别是否具有相关性,研究人员作出相应调查,并统计数据如表所示: 认为冬季佩戴口罩十分必要 认为冬季佩戴口罩没有必要 男性 300 200 女性150150(1)判断是否有99.9%的把握认为佩戴口罩的态度与性别有关?(2)若按照分层抽样的方法从男性中随机抽取5人,再从这5人中随机抽取2人,求恰有1人认为冬季佩戴口罩十分必要的概率.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:()20P K k0.100 0.050 0.010 0.001k 2.706 3.841 6.635 10.82825.(2021·全国高三专题练习)在新型冠状病毒疫情期间,某高中学校实施线上教学,为了解线上教学的效果,随机抽取了100名学生对线上教学效果进行评分(满分100分),记低于80的评分为“效果一般”,不低于80分为“效果较好”.(1)请补充完整22⨯列联表;通过计算判断,有没有99%的把握认为线上教学效果评分为“效果较好”与性别有关?效果一般效果较好合计男20女1555合计(2)用(1)中列联表的数据估计全校线上教学的效果,用频率估计概率.从该校学生中任意抽取3人,记所抽取的3人中线上教学“效果较好”的人数为X,求X的分布列和数学期望.附表及公式:()2P K k0.150.100.050.0250.010 0k 2.072 2.706 3.841 5.024 6.635其中()()()()()22n ad bcka b c d a c b d-=++++,n a b c d=+++.26.(2021·全国高三专题练习)近年来,我国的电子商务行业发展迅速,与此同时,相关管理部门建立了针对电商的商品和服务评价系统.现从评价系统中选出200次成功的交易,并对其评价进行统计,对商品的好评率为35,对服务的好评率为710;其中对商品和服务均为好评的有80次(1)是否可以在犯错误概率不超过0.1的前提下,认为商品好评与服务好评有关?(2)若将频率视为概率,某人在该购物平台上进行的4次购物中,设对商品和服务全好评的次数为随机变量X:求对商品和服务全好评的次数X的分布列及其期望.()20P K k 0.15 0.10 0.05 0.025 0.010 0.005 0.0010k2.072 2.7063.841 5.024 6.635 7.879 10.82822()()()()()n ad bc K a b c d a c b d -=++++(其中n a b c d =+++)27.(2021·全国高三专题练习)某校高一年级进行安全知识竞赛(满分为100分),所有学生的成绩都不低于75分,从中抽取100名学生的成绩进行分组调研,第一组[)75,80,第二组[)80,85,,第五组[]95,100(单位:分),得到如下的频率分布直方图.(1)若竞赛成绩不低于85分为优秀,低于85分为非优秀,且成绩优秀的男学生人数为35,成绩非优秀的女学生人数为25,请判断是否有95%的把握认为竞赛成绩的优秀情况与性别有关;(2)用分层抽样方法,在成绩不低于85的学生中抽取6人,再从这6人中随机选3人发言谈体会,设这3人中成绩在[)85,90的人数为ξ,求ξ的分布列与数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.临界值表:()20P K k ≥ 0.10 0.05 0.025 0.01 0.0050k2.7063.841 5.024 6.635 7.87928.(2021·全国高三专题练习)支付宝为人们的生活带来许多便利,为了了解支付宝在某市的使用情况,某公司随机抽取了100名支付宝用户进行调查,得到如下数据: 每周使用支付宝次数 1 2 3 4 5 6及以上 40岁及以下人数 3 3 4 8 7 30 40岁以上人数 4 5 6 6 4 20 合计7810141150(1)如果认为每周使用支付宝超过3次的用户“喜欢使用支付宝”,完成下面22⨯列联表,并判断能否在犯错误概率不超过0.05的前提下,认为是否“喜欢使用支付宝”与年龄有关?不喜欢使用支付宝 喜欢使用支付宝 合计 40岁及以下人数 40岁以上人数 合计(2)每周使用支付宝6次及以上的用户称为“支付宝达人”,视频率为概率,在该市所有“支付宝达人”中,随机抽取3名用户.①求抽取的3名用户中,既有40岁及以下“支付宝达人”又有40岁以上“支付宝达人”的概率;②为了鼓励40岁以上用户使用支付宝,对抽出的40岁以上“支付宝达人”每人奖励500元,记奖励总金额为X (单位:元),求X 的数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥ 0.15 0.10 0.05 0.025 0.010 0.005 0.0010k2.0722.7063.841 5.024 6.635 7.879 10.82829.(2021·全国高三专题练习)2019年4月,江苏省发布了高考综合改革实施方案,试行“312++”高考新模式.为调研新高考模式下,某校学生选择物理或历史与性别是否有。
2021年高考数学一轮复习考点与题型总结第十章统计与统计案例
![2021年高考数学一轮复习考点与题型总结第十章统计与统计案例](https://img.taocdn.com/s3/m/3086369927284b73f3425096.png)
第十章统计与统计案例第一节随机抽样一、基础知识1.简单随机抽样(1)定义:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.(2)常用方法:抽签法和随机数法.2.分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.系统抽样(1)定义:当总体中的个体数较多时,可以将总体分成均衡的几部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需的样本,这种抽样的方法叫做系统抽样.(2)系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本.n 是样本容量)是整数时,取k=Nn当总体中的个体数不能被样本容量整除时,可先用简单随机抽样的方法从总体中剔除几个个体,使剩下的个体数能被样本容量整除,然后再按系统抽样进行.这时在整个抽样过程中每个个体被抽取的可能性仍然相等.;二、常用结论(1)不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.(3)分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.(4)三种抽样方法的特点、联系及适用范围考点一简单随机抽样[典例] 下列抽取样本的方式属于简单随机抽样的个数有( )①从无限多个个体中抽取100 个个体作为样本;②盒子里共有80 个零件,从中选出5 个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;③用抽签方法从10 件产品中选取3 件进行质量检验;④某班有56 名同学,指定个子最高的 5 名同学参加学校组织的篮球赛.A.0 个B.1 个C.2 个D.3 个[解析] ①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样,因为它是有放回抽样;③明显为简单随机抽样;④不是简单随机抽样,因为不是等可能抽样.[答案] B[解题技法] 应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的 数字舍去.[题组训练]A.08 C .02 D .012.利用简单随机抽样,从 n 个个体中抽取一个容量为 10 的样本.若第二次抽取时,余 下的每个个体被抽到的概率为1,则在整个抽样过程中,每个个体被抽到的概率为()3A.1 4C. 5 14解析:选 C 根据题意, 9 1B.1 3 D.10 27解得 n =28.= , n -1 3故在整个抽样过程中每个个体被抽到的概率为10= 5.28 14考点二 系统抽样[典例] (1)某校为了解 1 000 名高一新生的身体生长状况,用系统抽样法(按等距的规A .16B .17C .18D .19(2)中央电视台为了解观众对某综艺节目的意见,准备从 502 名现场观众中抽取 10%进行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除个个体,抽样间隔为 .[解析] (1)因为从 1 000 名学生中抽取一个容量为 40 的样本,所以系统抽样的分段间隔 为1 000=25,40设第一组随机抽取的号码为 x ,(2)把 502 名观众平均分成 50 组,由于 502 除以 50 的商是 10,余数是 2,所以每组有 10 名观众,还剩 2 名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从 502500,并均匀分成 50 段,每段含50010 个个体.所以需剔除 2 个个体,抽样间隔为 10. 50[答案] (1)C (2)2 10[变透练清]解析:从 1 000 名学生中抽取一个容量为 40 的样本,系统抽样分 40 组,每组1 000=2540 个号码,每组抽取一个,从 501 到 750 恰好是第 21 组到第 30 组,共抽取 10 人.答案:10本,若在第 1 组中随机抽取的号码为 5,则在第 6 组中抽取的号码为.解析:由题知分组间隔为64=8,又第 1 组中抽取的号码为 5,所以第 6 组中抽取的号8 码为 5×8+5=45.答案:45系统抽样又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是 第 1 组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.[提醒] 系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽 样从总体中剔除几个个体,然后再按系统抽样进行.考点三 分层抽样=[典例] 某电视台在网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000 人,其中各种态度对应的人数如下表所示:电视台为了了解观众的具体想法和意见,打算从中抽取100 人进行详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为( ) A.25,25,25,25 B.48,72,64,16C.20,40,30,10 D.24,36,32,8[ 解析] 法一:因为抽样比为100 = 1 ,所以每类人中应抽取的人数分别为20 000 2004 800×1=24,7 200×1=36,6 400×1=32,1 600×1=8. 200 200 200 200法二:最喜爱、喜爱、一般、不喜欢的比例为4 800∶7 200∶6 400∶1 600=6∶9∶8∶2,所以每类人中应抽取的人数分别为6×100=24,9×100=36,6+9+8+28 2×100=32,×100=8.6+9+8+26+9+8+2[答案] D6+9+8+2[解题技法] 分层抽样问题的类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.(3) 分层抽样的计算应根据抽样比构造方程求解,其中“ 抽样比=样本容量=总体容量各层样本数量”.各层个体数量[题组训练]1.(2019·山西五校联考)某校为了解学生的学习情况,采用分层抽样的方法从高一1 000 人、高二1 200 人、高三n 人中抽取81 人进行问卷调查,若高二被抽取的人数为30,则n =( )A.860 B.720C.1 020 D.1 040解析:选D 由已知条件知抽样比为30=1,从而81=1,解得n=1 200 40 1 000+1 200+n 40= ,06 32 35 92 46 22 54 10 02 78 49 82 18 86 70 48 05 46 88 15 19 20 491 040,故选 D.2.(2018·广州高中综合测试)已知某地区中小学学生人数如图所示.为 了解该区学生参加某项社会实践活动的意向,拟采用分层抽样的方法来进 行调查.若高中需抽取 20 名学生,则小学与初中共需抽取的学生人数为.解析:设小学与初中共需抽取的学生人数为 x ,依题意可得1 20020解得 x =85.答案:85[课时跟踪检测]2 700+2 400+1 200 x +201.从 2 019 名学生中选取 50 名学生参加全国数学联赛,若采用以下方法选取:先用简 单随机抽样法从 2 019 名学生中剔除 19 名学生,剩下的 2 000 名学生再按系统抽样的方法抽取,则每名学生入选的概率()A .不全相等B .均不相等C .都相等,且为 502 019解析:选 C 从 N 个个体中抽取 M名学生入选的概率都相等,且为 50.2 019D .都相等,且为 140个个体,则每个个体被抽到的概率都等于M,故每N2.福利彩票“双色球”中红球的号码可以从 01,02,03,…,32,33 这 33 个两位号码中选取,小明利用如下所示的随机数表选取红色球的 6 个号码,选取方法是从第 1 行第 9 列的数字开始,从左到右依次读取数据,则第四个被选中的红色球的号码为( )A.12 B .33 C .06D .16解析:选 C 被选中的红色球的号码依次为 17,12,33,06,32,22,所以第四个被选中的红色球的号码为 06.3.某班共有学生 52 人,现根据座号,用系统抽样的方法,抽取一个容量为 4 的样本.已知 5 号、18 号、44 号同学在样本中,那么样本中还有一个同学的座号是()A .23B .2781 47 23 68 63 93 17 90 12 69 86 81 62 93 50 60 91 33 75 85 61 39 85C .31D .33解析:选 C 分段间隔为52=13,故样本中还有一个同学的座号为 18+13=31.4 4.某工厂在 12 月份共生产了 3 600 双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为 a ,b ,c ,且 a ,b , c 构成等差数列,则第二车间生产的产品数为()A .800 双B .1 000 双C .1 200 双D .1 500 双解析:选 C 因为 a ,b ,c 成等差数列,所以 2b =a +c ,即第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占 12 月份生产 总数的三分之一,即为 1 200 双皮靴.5.(2018·南宁摸底联考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A .100,20B .200,20C .200,10D .100,10解析:选 B 由题图甲可知学生总人数是 10 000,样本容量为 10 000×2%=200,抽取的高中生人数是 2 000×2%=40,由题图乙可知高中生的近视率为 50%,所以抽取高中生的近视人数为 40×50%=20,故选 B.=6,则在第 7 组中抽取的号码是() A .63 B .64 C .65D .66解析:选 A 若 m =6,则在第 7 组中抽取的号码个位数字与 13 的个位数字相同,而第A .7B .9C .10D .15解析:选 C 960÷32=30,故由题意可得抽到的号码构成以 9 为首项,以 30 为公差的等差数列,其通项公式为 a n =9+30(n -1)=30n -21.由 450<30n -21≤750,解得 15.7< n ≤25.7.又 n 为正整数,所以 16≤n ≤25,故做问卷 B 的人数为 25-16+1=10.故选 C.8.某企业三月中旬生产 A ,B ,C 三种产品共 3 000 件,根据分层抽样的结果,企业统计员制作了如下的统计表格:产品类别 A B C产品数量(件) 1 300 样本容量(件)130A 产品的样本容量比 C 产品的样本容量多 10,根据以上信息,可得 C 的产品数量是件.解析:设样本容量为 x ,则 x ×1 300=130,∴x =300.3 000 ∴A 产品和 C 产品在样本中共有 300-130=170(件). 设 C 产品的样本容量为 y ,则 y +y +10=170,∴y =80.∴C 产品的数量为3 00080=800(件). 300 答案:8009.某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取 100 件做使用寿命的测试,则第一分厂应抽取的件数为;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为 1 020 小时、980 小时、1 030 小时,估计这个企业所生产的该产品的平均使用寿命为小时.解析:第一分厂应抽取的件数为 100×50%=50;该产品的平均使用寿命为 1 020×0.5 +980×0.2+1 030×0.3=1 015.答案:50 1 015×5 抽得的号码为 004,这 600 名选手穿着三种颜色的衣服,从 001 到 301 穿红色衣服,从 302 到 496 穿白色衣服,从 497 到 600 穿黄色衣服,则抽到穿白色衣服的选手人数为.2 5≤k ≤42,因此抽到穿白色衣服的选手人数为 42-25=17(人). 6答案:1711.某初级中学共有学生 2 000 名,各年级男、女生人数如下表:(1)求 x 的值;(2)现用分层抽样的方法在全校抽取 48 名学生,问应在初三年级抽取多少名? 解 :(1)∵ x=0.19,∴x =380.2 000(2)初三年级人数为 y +z =2 000-(373+377+380+370)=500,现用分层抽样的方法在 全校抽取 48 名学生,应在初三年级抽取的人数为 48×500=12(名).2 000第二节 用样本估计总体一、基础知识1.频率分布直方图(1)纵轴表示频率频率;(2),即小长方形的高= 组距 组距频率=频率; 小长方形的面积=组距×组距(3)各个小方形的面积总和等于 1 . 2.频率分布表的画法极差第一步:求极差,决定组数和组距,组距= ;组数第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. 3.茎叶图茎叶图是统计中用来表示数据的一种图, 茎是指中间的一列数,叶就是从茎的旁 边生长出来的数.4.中位数、众数、平均数的定义 (1)中位数将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数) 叫做这组数据的中位数.(2)众数一组数据中出现次数最多的数据叫做这组数据的众数. (3)平均数一组数据的算术平均数即为这组数据的平均数,n 个数据 x 1,x 2,…,x n 的平均数 x = 1(x 1+x 2+…+x n ). n5.样本的数字特征如果有 n 个数据 x 1,x 2,…,x n ,那么这 n 个数的(1)平均数 x =1(x 1+x 2+…+x n ).n(2)标准差 s =(3)方差s2=1-x )2+(x -x )2+…+(x -x )2].[(x1 2 nn二、常用结论1.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为x ,则mx1+a,mx2+a,mx3+a,…,mx n+a 的平均数是m x +a.(2)若数据x1,x2,…,x n的方差为s2,则数据ax1+b,ax2+b,…,ax n+b 的方差为a2s2.考点一茎叶图[典例] (2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A.3,5 B.5,5C.3,7 D.5,7[解析] 由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以15×[56+62+65+74+(70+x)]=1×(59+61+67+65+78),解得x=3.5[答案] A[解题技法] 茎叶图的应用(1)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.(2)给定两组数据的茎叶图,比较数字特征时,“重心”下移者平均数较大,数据集中者方差较小.甲 乙[题组训练]1.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清, 但曾计算得该组数据的极差与中位数之和为 61,则被污染的数字为()A .1B .2C .3D .4解析:选 B 由图可知该组数据的极差为 48-20=28,则该组数据的中位数为 61-28 =33,易得被污染的数字为 2.2.甲、乙两名篮球运动员 5 场比赛得分的原始记录如茎叶图所示,若甲、乙两人的平均得分分别为 x 甲, x 乙,则下列结论正确的是()A. x 甲< x 乙;乙比甲得分稳定B. x 甲> x 乙;甲比乙得分稳定C. x 甲> x 乙;乙比甲得分稳定D. x 甲< x 乙;甲比乙得分稳定解析:选 A 因为 x =2+7+8+16+22=11, x 5 =8+12+18+21+25=16.8,所5以 x < x 且乙比甲成绩稳定.考点二 频率分布直方图[典例] 某城市 100 户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200), [200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中 x 的值;(2)求月平均用电量的众数和中位数.[解] (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1,解得 x =0.007 5.即直方图中 x 的值为 0.007 5.甲乙=(2)月平均用电量的众数是220+240=230. 2∵(0.002+0.009 5+0.011)×20=0.45<0.5, (0.002+0.009 5+0.011+0.012 5)×20=0.7>0.5, ∴月平均用电量的中位数在[220,240)内.设中位数为 a ,则 0.45+0.012 5×(a -220)=0.5,解得 a =224,即中位数为 224. [变透练清]1.某校随机抽取 20 个班,调查各班有出国意向的人数,所得数据的茎叶图如图所示.以 5 为组距将数据分组为[0,5),[5,10),…,[30,35),[35,40],所作的频率分布直方图是()解析:选 A 以 5 为组距将数据分组为[0,5),[5,10),…,[30,35),[35,40],各组的频数依次为 1,1,4,2,4,3,3,2,可知画出的频率分布直方图为选项 A 中的图.2.(变结论)在本例条件下,在月平均电量为[220,240),[240,260),[260,280),[280,300] 的四组用户中,用分层抽样的方法抽取 11 户居民,则月平均用电量在[220,240)的用户中应抽取户.解析:月平均用电量在[220,240)的用户有 0.012 5×20×100=25(户).同理可得月平均 用电量在[240,260)的用户有 15 户,月平均用电量在[260,280]的用户有 10 户,月平均用电 量在[280,300]的用户有 5 户,故抽取比例为111.25+15+10+5 5所以月平均用电量在[220,240)的用户中应抽取 25×1=5(户).5 答案:53.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年 100 位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9 组,制成了如图所示的频率分布直方图.(1) 求直方图中 a 的值;(2)设该市有30 万居民,估计全市居民中月均用水量不低于3 吨的人数,说明理由.解:(1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]6组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)估计全市居民中月均用水量不低于3 吨的人数为3.6 万.理由如下:由(1)知,100 位居民中月均用水量不低于3 吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30 万居民中月均用水量不低于 3 吨的人数为300 000×0.12=36 000=3.6(万).考点三样本的数字特征考法(一) 样本的数字特征与频率分布直方图交汇[典例] (2019·辽宁师范大学附属中学模拟)某校初三年级有400 名学生,随机抽查了40 名学生测试1 分钟仰卧起坐的成绩(单位:次),将数据整理后绘制成如图所示的频率分布直方图.用样本估计总体,下列结论正确的是( )A.该校初三学生1 分钟仰卧起坐的次数的中位数为25B.该校初三学生1 分钟仰卧起坐的次数的众数为24C.该校初三学生1 分钟仰卧起坐的次数超过30 的人数约有80D.该校初三学生1 分钟仰卧起坐的次数少于20 的人数约为8[解析] 第一组数据的频率为0.02×5=0.1,第二组数据的频率为0.06×5=0.3,第三.组数据的频率为 0.08×5=0.4,∴中位数在第三组内,设中位数为 25+x ,则 x ×0.08=0.5 -0.1-0.3=0.1,∴x =1.25,∴中位数为 26.25,故 A 错误;第三组数据所在的矩形最高, 第三组数据的中间值为 27.5,∴众数为 27.5,故 B 错误;1 分钟仰卧起坐的次数超过 30 的频率为 0.2,∴超过 30 次的人数为 400×0.2=80,故 C 正确;1 分钟仰卧起坐的次数少于20 的频率为 0.1,∴1 分钟仰卧起坐的次数少于 20 的人数为 400×0.1=40,故 D 错误.故选 C.[答案] C [解题技法]频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标为众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.考法(二) 样本的数字特征与茎叶图交汇[典例] 将某选手的 9 个得分去掉 1 个最高分,去掉 1 个最低分,7 个剩余分数的平均分为 91.现场作的 9 个分数的茎叶图后来有 1 个数据模糊,无法辨认,在图中以 x 表示,则7 个剩余分数的方差为.[解析] 由茎叶图可知去掉的两个数是 87,99,所以 87+90×2+91×2+94+90+x =91×7,解得 x =4.故 s 2=1[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=36 [答案] 367 [解题技法]7 7样本的数字特征与茎叶图综合问题的注意点(1)在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.(2)茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据, 因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个数,或中间两个数的平均数)等.考法(三) 样本的数字特征与优化决策问题交汇[典例] (2018·周口调研)甲、乙两人在相同条件下各射击 10 次,每次中靶环数情况如图所示.(1)请填写下表(写出计算过程):平均数 方差命中 9环及 9 环以上的次数甲 乙(2)①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和命中 9 环及 9 环以上的次数相结合看(分析谁的成绩好些); ③从折线图上两人射击命中环数的走势看(分析谁更有潜力). [解] 由题图,知甲射击 10 次中靶环数分别为 9,5,7,8,7,6,8,6,7,7. 将它们由小到大排列为 5,6,6,7,7,7,7,8,8,9. 乙射击 10 次中靶环数分别为 2,4,6,8,7,7,8,9,9,10. 将它们由小到大排列为 2,4,6,7,7,8,8,9,9,10.(1) x = 1 ×(5+6×2+7×4+8×2+9)=7(环), 10x = 1 ×(2+4+6+7×2+8×2+9×2+10)=7(环), 10 s 2 = 1 ×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]= 1 ×(4+2+0+2+4) 10 10 =1.2,s 2 = 1 ×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2] 10 = 1×(25+9+1+0+2+8+9)=5.4. 10 填表如下:平均数 方差 命中 9 环及 9 环以上的次数甲乙甲乙(2)甲乙∴甲成绩比乙稳定.②∵平均数相同,命中9 环及9 环以上的次数甲比乙少,∴乙成绩比甲好些.③∵甲成绩在平均数上下波动,而乙处于上升势头,从第三次以后就没有比甲少的情况发生,∴乙更有潜力.[解题技法]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[题组训练]1.对某商店一个月内每天的顾客人数进行统计,得到样本的茎叶图(如图所示),则该样本中的中位数、众数、极差分别是( )A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53解析:选A 样本共3045+47个,中位数为=46;显然样本数据出现次数最多的为45,2故众数为45;极差为68-12=56,故选A.2.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:平均环数x8.3 8.88.8 8.7方差s2 3.5 3.6 2.2 5.4) A.甲B.乙C.丙D.丁解析:选C 由表格中数据可知,乙、丙平均环数最高,但丙方差最小,说明成绩好,且技术稳定,选C.3.某仪器厂从新生产的一批零件中随机抽取40 个进行检测,如图是根据抽样检测得到的零件的质量(单位:克)绘制的频率分布直方图,样本数据按照[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96]分成8 组,将其按从左到右的顺序分别记为第一组,第二组,……,第八组.则样本数据的中位数在第组.解析:由题图可得,前四组的频率为(0.037 5+0.062 5+0.075 0+0.100 0)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.100 0×2=8,故中位数在第四组.答案:四[课时跟踪检测]A 级1.一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60) 上的频率为0.8,则估计样本在[40,60)内的数据个数为( )A.14 B.15C.16 D.17解析:选B 由题意,样本中数据在[20,60)上的频数为30×0.8=24,所以估计样本在[40,60)内的数据个数为24-4-5=15.2.(2019·长春质检)如图所示是某学校某年级的三个班在一学期内的六次数学测试的平均成绩 y 关于测试序号 x 的函数图象,为了容易看出一个班级的成绩变化,将离散的点用虚线连接,根据图象,给出下列结论:①一班成绩始终高于年级平均水平,整体成绩比较好; ②二班成绩不够稳定,波动程度较大;③三班成绩虽然多数时间低于年级平均水平,但在稳步提升. 其中正确结论的个数为()A .0B .1C .2D .3解析:选 D ①由图可知一班每次考试的平均成绩都在年级平均成绩之上,故①正确.② 由图可知二班平均成绩的图象高低变化明显,可知成绩不稳定,波动程度较大,故②正确.③ 由图可知三班平均成绩的图象呈上升趋势,并且图象的大部分都在年级平均成绩图象的下方,故③正确.故选 D.3.(2018·贵阳检测)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行 整理后分为 5 组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是 40,则成绩在 80~100 分的学生人数是()A .15B .18C .20D .25解析:选 A 根据频率分布直方图,得第二小组的频率是 0.04×10=0.4,∵频数是 40, ∴样本容量是40=100,又成绩在 80~100 分的频率是(0.01+0.005)×10=0.15,∴成绩在0.4 80~100 分的学生人数是 100×0.15=15.故选 A.4.2017 年 4 月,泉州有四处湿地被列入福建省首批重要湿地名录,某同学决定从其中 A ,B 两地选择一处进行实地考察.因此,他通过网站了ABA B A B解上周去过这两个地方的人对它们的综合评分,并将评分数据记录为右图的茎叶图,记 A ,B 两地综合评分数据的均值分别为 x A , x B ,方差分别为 s 2 ,s 2 .若以备受好评为依据,则AB下述判断较合理的是( )A .因为 x A > xB ,s 2 >s 2,所以应该去A 地B .因为 x > x ,s 2 <s 2 ,所以应该去 A 地ABABC .因为 x < x ,s 2 >s 2 ,所以应该去 B 地ABABD .因为 x A < x B ,s 2 <s 2 ,所以应该去 B 地解析:选 B 因 为 x A =1×(72+86+87+89+92+94)≈86.67,x B =1×(74+73+88 6 6 +86+95+94)=85,s 2 ≈1[(72-86.67)2+(86-86.67)2+(87-86.67)2+(89-86.67)2+(92-86.67)2+(94- 6 86.67)2]≈50.56,s 2 =1[(74-85)2+(73-85)2+(88-85)2+(86-85)2+(95-85)2+(94-85)2]=76, 6所以 x > x ,s 2 <s 2 (A 数据集中,B 数据分散),ABAB所以 A 地好评分高,且评价稳定.故选 B.5.(2018·青岛三中期中)已知数据 x 1,x 2,…,x n 的平均数 x =5,方差 s 2=4,则数据 3x 1+7,3x 2+7,…,3x n +7 的平均数和标准差分别为()A .15,36B .22,6C .15,6D .22,36解析:选 B ∵x 1,x 2,x 3,…,x n 的平均数为 5, x 1+x 2+…+x n 3x 1+3x 2+…+3x n 3(x 1+x 2+…+x n ) ∴ =5,∴ n +7= n n +7=3×5+7=22.∵x 1,x 2,x 3,…,x n 的方差为 4,∴3x 1+7,3x 2+7,3x 3+7,…,3x n +7 的方差是 32×4 =36,故数据 3x 1+7,3x 2+7,…,3x n +7 的平均数和标准差分别为 22,6,故选 B.6.(2018·江苏高考)已知5 位裁判给某运动员打出的分数的茎叶图如图所示那么这 5 位裁判打出的分数的平均数为 .解析:这 5 位裁判打出的分数分别是 89,89,90,91,91,因此这 5 位裁判打出的分数的平89+89+90+91+91均数为 5答案:90=90.7.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前 3 个小组的频率之比为 1∶ 3∶5,第 2 个小组的频数为 15,则被抽查的美术生的人数是.解析:设被抽查的美术生的人数为n ,因为后2 个小组的频率之和为(0.037 5+ 0.0125)×5=0.25,所以前 3 个小组的频率之和为 0.75.又前 3 个小组的频率之比为 1∶3∶5,第 2个小组的频数为 15,所以前 3 个小组的频数分别为 5,15,25,所以 n =5+15+25 60.0.75答案:608.某人 5 次上班途中所花的时间(单位:分钟)分别为 x ,y,10,11,9.已知这组数据的平均数为 10,方差为 2,则|x -y |的值为.解析:由题意知这组数据的平均数为 10,方差为 2, 可得 x +y =20,(x -10)2+(y -10)2=8,设 x =10+t ,y =10-t ,由(x -10)2+(y -10)2=8 得 t 2=4, 所以|x -y |=2|t |=4. 答案:49.某班 100 名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中 a 的值;(2)根据频率分布直方图,估计这 100 名学生语文成绩的平均分;(3)若这 100 名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如表所示,求数学成绩在[50,90)之外的人数.分数段 [50,60) [60,70) [70,80) [80,90) x ∶y1∶12∶13∶44∶5(2)因为55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.所以这100 名学生语文成=。
高三数学复习专题三统计与案例
![高三数学复习专题三统计与案例](https://img.taocdn.com/s3/m/2d0deff74793daef5ef7ba0d4a7302768e996ffa.png)
专题三统计与案例学校:___________姓名:___________班级:___________考号:___________一、解答题1.某高校数学系为了控制大一学生上课使用手机,针对上课使用手机情况,进行量化比,若发现上课使用手机则扣除其对应的积分,根据调查发现每次被扣分数与本系一大学生每周上课使用手机人数的关系如下表所示:(1)试根据以上数据,建立y 关于x 的回归直线方程(结果保留一位小数);参考公式:线性回归方程y bx a =+中,1221,ni ii nii x ynxy b a y bx xnx==-==--∑∑.(2)根据上述回归直线方程分析:每次扣分为多少时(精确到整数分)该系大一新生被扣分的总数最大; (3)若学校规定,大一新生每学期(按20周上课计算)因为上课使用手机被扣分总数不超过1000分,则该系大一被定为控制手机合格,那么,每周上课使用手机至少扣多少分时(扣分不低于5分,精确到整数),31.6≈)2.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金,现该企业为了解年研发资金投入额x (单位:亿元)对年盈利额y (单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额i x 和年盈利额i y 的数据.通过对比分析,建立了两个函数模型:①2y x αβ=+;②e x t y λ+=,其中,,,tαβλ均为常数,e 为自然对数的底数.令2i i u x =,ln (1,2,,10)i v y i ==,经计算得如下数据:(1)请从相关系数的角度,分析哪一个模型拟合程度更好;(2)根据(1)的选择及表中数据,建立y 关于x 的回归方程(回归系数精确到0.01).附:相关系数()()niix x y y r --=∑线性回归直线方程y bx a =+,其中附:()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-.3.2021年10月16日,搭载“神州十三号”的火箭发射升空,这是一件让全国人民普遍关注的大事,因此每天有很多民众通过手机、电视等方式观看有关新闻.某机构将每天关注这件大事的时间在2小时以上的人称为“天文爱好者”,否则称为“非天文爱好者”,该机构通过调查,并从参与调查的人群中随机抽取了100人进行分析,得到下表(单位:人)(1)将上表中的数据填写完整,并判断能否在犯错误的概率不超过0.005的前提下认为“天文爱好者”或“非天文爱好者”与性别有关?(2)现从抽取的女性人群中,按“天文爱好者”和“非天文爱好者”这两种类型进行分层抽样抽取5人,然后再从这5人中随机选出3人,求其中至少有1人是“天文爱好者”的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.4.COP15大会原定于2020年10月15-28日在昆明举办,受新冠肺炎疫情影响,延迟到今年10月11-24日在云南昆明举办,同期举行《生物安全议定书》、《遗传资源议定书》缔约方会议.为助力COP15的顺利举行,来自全省各单位各部门的青年志愿者们发扬无私奉献精神,用心用情服务,展示青春风采.会议结束后随机抽取了50名志愿者,统计了会议期间每个人14天的志愿服务总时长,得到如图的频率分布直方图:(1)求x的值,估计抽取的志愿者服务时长的中位数;20,40,80,100这两组样本中随机抽取6名志愿者,记录每个人的服务总时长得(2)用分层抽样的方法从[)[)到如图所示的茎叶图:①已知这6名志愿者服务时长的平均数为67,求m的值;80,100这组的概率.②若从这6名志愿者中随机抽取2人,求所抽取的2人恰好都是[)5.为了了解高二学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3;第二小组频数为12.(1)第二小组的频率是多少,样本容量是多少;(2)若次数在110以上(含110次)为达标,试估计该学校全体高二学生的达标率是多少;(3)在这次测试中,估计学生跳绳次数的众数和中位数、平均数各是多少.(结果均保留整数.)6.2021年10月16日,搭载“神州十三号”的火箭发射升空,这是一件让全国人民普遍关注的大事,因此每天有很多民众通过手机、电视等方式观看有关新闻.某机构将每天关注这件大事的时间在2小时以上的人称为“天文爱好者”,否则称为“非天文爱好者”,该机构通过调查,并从参与调查的人群中随机抽取了100人进行分析,得到下表(单位:人):(1)将上表中的数据填写完整,并判断能否在犯错误的概率不超过0.005的前提下认为“天文爱好者”或“非天文爱好者”与性别有关?(2)现从抽取的女性人群中,按“天文爱好者”和“非天文爱好者”这两种类型进行分层抽样抽取5人,然后再从这5人中随机选出3人,记其中“天文爱好者”的人数为X,求X的分布列和数学期望.附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.7.某投资公司2012年至2021年每年的投资金额x (单位:万元)与年利润增量y (单位:万元)的散点图如图:该投资公司为了预测2022年投资金额为20万元时的年利润增量,建立了y 关于x 的两个回归模型;模型①:由最小二乘公式可求得y 与x 的线性回归方程: 2.5020ˆ.5yx =-;模型②:由图中样本点的分布,可以认为样本点集中在由线:ln y b x a =+的附近,对投资金额x 做换元,令ln t x =,则y b t a =⋅+,且有101010102111122.00,230,569.00,50.92ii i i i i i i i ty t y t ========∑∑∑∑,(1)根据所给的统计量,求模型②中y 关于x 的回归方程;(2)分别利用这两个回归模型,预测投资金额为20万元时的年利润增量(结果保留两位小数);附:样本()()1,1,2,,i t y i n =⋯的最小乘估计公式为()()()121ˆˆˆ,niii ni i t t y y bay bt t t ==--==--∑∑;参考数据:ln20.6931,ln5 1.6094≈≈.8.下图是立德学校高二育才班摸底考试数学成绩不低于90分的人数的频率分布直方图,为激励学生的学习热情,班级决定对数学成绩高于110分的同学进行奖励.(1)若图中成绩在[100,110)分数段的人数为12人,求此次考试应奖励的人数;(2)用统计学知识估计数学成绩在90分及以上学生的数学成绩的中位数和平均数.(结果保留整数)9.某城市在进行新冠疫情防控中,为了解居民对新冠疫情防控的满意程度,组织居民给活动打分(分数为40,100内﹒现将这些分整数,满分为100分),从中随机抽取一个容量为180的样本,发现所有数据均在[]数分成以下6组并画出了样本的频率分布直方图,但不小心污损了部分图形,如图所示﹒观察图形,回答下列问题:60,70的频数;(1)算出第三组[)(2)请根据频率分布直方图,估计样本的众数、中位数和平均数﹒(每组数据以区间的中点值为代表) 10.某生物小组为了研究温度对某种酶的活性的影响进行了一组实验,实验数据经整理得到如下的折线图:由图可以看出,这种酶的活性指标值y 与温度x 具有较强的线性相关关系,请用相关系数加以说明.附:()()6185i ii x xy y =--=∑5.5= 2.65≈,样本相关系数()()niix x y y r --=∑11.新个体经济是中国经济社会数字化转型条件下出现的新生事物,指微商电商,网络直播、职业创作者等,下表是2021年1至4月份某市新增“微商电商”的统计数据:(1)请利用所给数据求新增微商电商个数y 与月份x 之间的线性回归方程ˆˆˆybx a =+,并预测该市2021年5月新增“微商电商”的个数(结果用四舍五入法保留整数);(2)一般认为当||0.9r ≥时,线性回归方程的拟合效果非常好;当0.75|0.9|r <≤时,线性回归方程的拟合效果良好.试问该线性回归方程的拟合效果是非常好还是良好?说明你的理由.1122211()()ˆ()()n ni iiii i nniii i x y nxy x x y x bxn x x x ====---==--∑∑∑∑,()()nni iiix y nxyx x yy r---=∑∑ˆˆ17.0294ay bx =-≈18.1659≈19.2354≈.。
2021高考数学一复习统计与统计案例专项练习(含答案)题型归纳
![2021高考数学一复习统计与统计案例专项练习(含答案)题型归纳](https://img.taocdn.com/s3/m/1ed8aeb6b307e87100f696e9.png)
2021高考数学一复习统计与统计案例专项练习(含答案)题型归纳每一门科学都有其建立、发展和客观条件,统计科学则是统计工作经验、社会经济理论、计量经济方法融合、提炼、发展而来的一种边缘性学科。
以下是____-____高考数学一复习统计与统计案例专项练习,请考生掌握。
一、选择题11.(文)(____重庆理,3)已知变量_与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得线性回归方程可能为()A.=0.4_+2.3B.=2_-2.4C.=-2_+9.5D.=-0.3_+4.4[答案] A[解析] 因为变量_和y正相关,所以回归直线的斜率为正,排除C、D;又将点(3,3.5)代入选项A和B的方程中检验排除B,所以选A.(理)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,收集数据如下:零件数_(个) 10 20 30 40 50 60 70 80 加工时间y(min) 62 68 75 81 89 95 102 108 设回归方程为y=b_+a,则点(a,b)在直线_+45y-10=0的()A.左上方B.左下方C.右上方D.右下方[答案] C[解析] =45,=85,a+45b=85,a+45b-100,故点(a,b)在直线_+45y-10=0的右上方,故选C.12.(____沈阳市质检)某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机调查了24名笔试者的成绩,如下表所示:分数段 [60,65) [65,70) [70,75) [75,80) [80,85) [85,90) 人数 2 3 4 9 51 据此估计允许参加面试的分数线大约是()A.75B.80C.85D.90[答案] B[解析] 由题可知,在24名笔试者中应选出6人参加面试.由表可得面试分数线大约为80.故选B.13.(____陕西文,5)对一批产品的长度(单位:毫米)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上为一等品,在区间[15,20)和[25,30)上为二等品,在区间[10,15)和[30,35]上为三等品.用频率估计概率,现从该批产品中随机抽取1件,则其为二等品的概率是()A.0.09B.0.20C.0.25D.0.45[答案] D[解析] 解法1:用样本估计总体.在区间[15,20)和[25,30)上的概率为0.045+[1-(0.02+0.04+0.06+0.03)5=0.45.解法2:由图可知,抽得一等品的概率P1=0.065=0.3;抽得三等品的概率为P3=(0.02+0.03)5=0.25.故抽得二等品的概率为1-(0.3+0.25)=0.45.14.(____江西理,6)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()A.成绩B.视力C.智商D.阅读量[答案] D[解析] A中,K2==;B中,K2==;C中,K2==;D中,K2==.因此阅读量与性别相关的可能性最大,所以选D.15.(文)某养兔场引进了一批新品种,严格按照科学配方进行喂养,四个月后管理员称其体重(单位:kg),将有关数据进行整理后分为五组,并绘制频率分布直方图(如图所示).根据标准,体重超过6kg属于超重,低于5kg的不够分量.已知图中从左到右第一、第三、第四、第五小组的频率分别为0.25、0.20、0.10、0.05,第二小组的频数为400,则该批兔子的总数和体重正常的频率分别为()A.1000,0.50B.800,0.50C.800,0.60D.1000,0.60[答案] D[解析] 第二组的频率为1-0.25-0.20-0.10-0.05=0.40,所以兔子总数为=1000只,体重正常的频率为0.40+0.20=0.60.故选D.(理)(____山东理,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18[答案] C[解析] 第一、二两组的频率为0.24+0.16=0.4志愿者的总人数为=50(人).第三组的人数为:500.36=18(人)有疗效的人数为18-6=12(人)二、填空题16.(____辽宁文,16)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.[答案] 10[解析] 设5个班级中参加的人数分别为_1,_2,_3,_4,_5,则=7,=4,即5个整数平方和为20,_1,_2,_3,_4,_5这5个数中最大数比7大,但不能超过10,因此最大为10,平方和20=0+1+1+9+9=(7-7)2+(8-7)2+(6-7)2+(10-7)2+(4-7)2.因此参加的人数为4,6,7,8,10,故最大值为10,最小值为4.三、解答题17.(文)(____重庆文,17)20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:(1)求频率分布直方图中a的值;(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率. [分析] 由频率之和为1,求a,然后求出落在[50,60)和[60,70)中的人数,最后用列举法求古典概型的概率.[解析] (1)组距为10,(2a+3a+6a+7a+2a)10=200a=1,a==0.005.(2)落在[50,60)中的频率为2a10=20a=0.1,落在[50,60)中的人数为2.落在[60,70)中的学生人数为3a1020=30.0051020=3.(3)设落在[50,60)中的2人成绩为A1,A2,落在[60,70)中的3人为B1,B2,B3.则从[50,70)中选2人共有10种选法,={(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3)}其中2人都在[60,70)中的基本事件有3个:(B1,B2),(B1,B3),(B2,B3),故所求概率p=.(理)(____辽宁理,18)一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示.将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.(1)求在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个的概率;(2)用_表示在未来3天里日销售量不低于100个的天数,求随机变量_的分布列,期望E(_)及方差D(_).[解析] (1)设A1表示事件日销售量不低于100个,A2表示事件日销售量低于50个,B表示事件在未来连续3天是有连续2天日销售量不低于100个且另一天销售量低于50个,因此P(A1)=(0.006+0.004+0.002)50=0.6P(A2)=0.00350=0.15,P(B)=0.60.60.152=0.108.(2)_可能取的值为0,1,2,3,相应的概率为P(_=0)=C(1-0.6)3=0.064,P(_=1)=C0.6(1-0.6)2=0.288.P(_=2)=C0.62(1-0.6)=0.432.P(_=3)=C0.63=0.216.分布列为_ 0 1 2 3 P 0.064 0.288 0.432 0.216 因为_~B(3,0.6)所以期望E(_)=30.6=1.8,方差D(_)=30.6(1-0.6)=0.72.18.(文)为加强中学生实践、创新能力和团队精神的培养,促进教育教学改革,郑州市教育局举办了全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了解成绩情况,从中选取50名学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表,解答下列问题:分组频数频率一 60.5~70.5 a 0.26 二 70.5~80.5 15 c 三 80.5~90.5 18 0.36 四 90.5~100.5 b d 合计 50 e (1)若用系统抽样的方法抽取50个样本,现将所有学生随机地编号为000,001,002,,199,试写出第二组第一位学生的编号;(2)求出a、b、c、d、e的值(直接写出结果),并作出频率分布直方图;(3)若成绩在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人.[解析] (1)004(2)a,b,c,d,e的值分别为13,4,0.30,0.08,1.频率分布直方图如下:(3)由样本中成绩在80.5~90.5的频数为18,成绩在90.5~100.5的频数为4,可估计成绩在85.5~95.5的人数为11人,故获得二等奖的学生约为11=44人. (理)(____山西省高考联合模拟)为了了解某年级1000名学生的百米成绩情况,随机抽取了若干学生的百米成绩,成绩全部介于13s与18s之间,将成绩按如下方式分成五组:第一组[13,14);第二组[14,15);第五组[17,18].按上述分组方法得到的频率分布直方图如图所示,已知图中从左到右的前3个组的频率之比为3819,且第二组的频数为8.(1)将频率当作概率,求调查中随机抽取了多少个学生的百米成绩;(2)若从第一、五组中随机取出两个成绩,求这两个成绩的差的绝对值大于1秒的概率.[解析] (1)设图中从左到右前3个组的频率分别为3_,8_,19_依题意,得3_+8_+19_+0.321+0.081=1,_=0.02,设调查中随机抽取了n个学生的百米成绩,则80.02=,n=50,调查中随机抽取了50个学生的百米成绩.(2)百米成绩在第一组的学生数为30.02150=3,记他们的成绩为a、b、c百米成绩在第五组的学生数有0.08150=4,记他们的成绩为m、n、p、q,则从第一、五组中随机取出两个成绩,基本事件有{a,b}、{a,c}、{a,m}、{a,n}、{a,p}、{a,q}、{b,c}、{b,m}、{b,n}、{b,p}、{b,q}、{c,m}、{c,n}、{c,p}、{c,q}、{m,n}、{m,p}、{m,q}、{n,p}、{n,q}、{p,q},共21个其中满足成绩的差的绝对值大于1s所包含的基本事件有{a,m}、{a,n}、{a,p}、{a,q}、{b,m}、{b,n}、{b,p}、{b,q}、{c,m}、{c,n}、{c,p}、{c,q},共12个,所以P==.____-____高考数学一复习统计与统计案例专项练习及答案解析的全部内容就是这些,希望考生可以取得优异的成绩。
高考数学考点二十《统计与统计案例》课件
![高考数学考点二十《统计与统计案例》课件](https://img.taocdn.com/s3/m/01cf9cddf80f76c66137ee06eff9aef8941e4819.png)
100
200
则 K2=2001×00(×6100×0×601-004×0×10400)2=8>6.635,
所以有 99%以上的把握认为是否持乐观态度与国内外差异有关.
四、解答题 13.(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设 备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了 10 件产品,得到各件产品该项指标数据如下:
考点二十 统计与统计案例
一、选择题(在每小题给出的四个选项中,只有一项符合题目要求) 1.(2021·河北张家口第三次模拟)某中学春季运动会上,12 位参加跳高 半决赛同学的成绩各不相同,按成绩从高到低取前 6 位进入决赛,如果小明 知道了自己的成绩后,则他可根据其他 11 位同学成绩的哪个数据判断自己 能否进入决赛( )
A.r2<r4<0<r3<r1 C.r4<r2<0<r3<r1
B.r4<r2<0<r1<r3 D.r2<r4<0<r1<r3
答案 A 解析 易知题中图(1)和图(3)是正相关,图(2)与图(4)是负相关,且图(1) 与图(2)中的样本点集中分布在一条直线附近,则 r2<r4<0<r3<r1.故选 A.
5.通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如
下列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由
K2
=
n(ad-bc)2 (a+b)(c+d)(a+c)(b+d)
2021版新高考数学一轮复习第十章统计与统计案例10.2用样本估计总体课件新人教B版
![2021版新高考数学一轮复习第十章统计与统计案例10.2用样本估计总体课件新人教B版](https://img.taocdn.com/s3/m/8c29dfc36edb6f1aff001fe8.png)
x
=
4.7+4.8+5.1+5.4+5.5 5
=5.1,所以它们的方差
s2= 1 [(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.
5
答案:0.1
考点一 茎叶图
【题组练透】
1.(2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量
典题索引 考点一、T1,4 考点二、例
考点三、角度1
考点三、角度3
【教材·基础自测】 1.(必修3P62例改编)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所 示,则这组数据的中位数和平均数分别是 ( ) A.91.5和91.5 B.91.5和92 C.91和91.5 D.92和92
【解析】选A.这组数据由小到大排列为87,89,90,91,92,93,94,96,所以中位数
2.利用茎叶图解题的关键是抓住“叶”的分布特征,准确从中提炼信息. 在使 用茎叶图时,一定要注意看清楚所有的样本数据,弄清楚这个图中的数字特点, 不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.
考点二 频率分布直方图 【典例】(2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女 学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分 数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图频率分布直 方图:
【知识点辨析】 (正确的打“√”,错误的打“×”) (1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势. ( ) (2)一组数据的方差越大,说明这组数据越集中. ( ) (3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大. () (4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相 同的数据可以只记一次. ( )
高考数学一轮复习专题10.2统计与统计案例(讲)(2021年整理)
![高考数学一轮复习专题10.2统计与统计案例(讲)(2021年整理)](https://img.taocdn.com/s3/m/162099323186bceb18e8bbcc.png)
专题10.2 统计与统计案例【最新考纲解读】1。
统计均是以填空题的形式进行考查,题目多为中低档题,着重考查学生运算求解能力、数据处理及分析问题解决问题的能力.统计一般不与其它章节知识结合考查,常单独设置题目。
2。
统计是高考中的常考题,统计考查的难度中等偏简单,复习时应以基础题为主。
复习中,要在全面掌握的基础上理解相关概念,如分层抽样、频率分布直方图、方差等.要务实统计的基础知识,熟悉统计问题的基本解法,从而提高应用统计知识去分析问题和解决问题的能力.【课前检测训练】【判一判】判断下面结论是否正确(请在括号中打“√"或“×”)(1)简单随机抽样是一种不放回抽样。
( )(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关。
()(3)系统抽样在起始部分抽样时采用简单随机抽样.()(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平。
( )(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关。
( )(6)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(7)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.()(8)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( )(9)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次。
()(10)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.()(11)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的。
()1。
√2。
×3。
√4。
×5.×6.√7.×8.√9.×10。
√11。
×【练一练】1。
某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( )A。
2021届高考数学一轮复习第九篇统计与统计案例第1节随机抽样训练理新人教版
![2021届高考数学一轮复习第九篇统计与统计案例第1节随机抽样训练理新人教版](https://img.taocdn.com/s3/m/ab13260bb9f3f90f76c61bf4.png)
2021届高考数学一轮复习第九篇统计与统计案例第1节随机抽样训练理新人教版知识点、方法题号简单随机抽样1,12系统抽样2,4,6,7分层抽样3,5,8,9,11,13三种抽样方法的综合10,14基础巩固(时刻:30分钟)1.(2021·福州一模)在检测一批相同规格共500 kg航空耐热垫片的品质时,随机抽取了280片,检测到有5片非优质品,则这批垫片中非优质品约为( B )(A)2.8 kg (B)8.9 kg (C)10 kg (D)28 kg解析:由题意,这批垫片中非优质品约为×500≈8.9 kg.故选B.2.用系统抽样法(按等距离的规则),要从160名学生中抽取容量为20的样本,将160名学生从1~160进行编号.按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组应抽出的号码为125,则第一组中按此抽签方法确定的号码是( B )(A)7 (B)5 (C)4 (D)3解析:设第一组确定的号码是x,则x+(16-1)×8=125,解得x=5.故选B.3.从1 008名学生中抽取20人参加义务劳动,规定采纳下列方法选取:先用简单随机抽样的方法从1 008人中剔除8人,剩下1 000人再按系统抽样的方法抽取,那么这1 008人中每个人入选的概率是( B )(A)都相等且等于(B)都相等且等于(C)不全相等(D)均不相等解析:在抽取时,每个人被抽到的概率均为=.故选B.4.某中学采纳系统抽样方法,从该校高一年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号.已知从33~48这16个数中取的数是39,则在第1小组1~16中随机抽到的数是( B )(A)5 (B)7 (C)11 (D)13解析:间隔数k==16,即每16人抽取一个人.由于39=2×16+7,因此第1小组中抽取的数为7. 故选B.5.某地区共有10万户居民,该地区都市住户与农村住户之比为4∶6.依照分层抽样方法,调查了该地区1 000户居民冰箱拥有情形,调查结果如表所示,那么能够估量该地区农村住户中无冰箱的户数约为( A )都市/户农村/户有冰箱356 440无冰箱44 160(A)1.6万户 (B)4.4万户(C)1.76万户 (D)0.24万户解析:由分层抽样按比例抽取,可得农村住户中无冰箱的户数为×100 000=16 000.故选A.6.(2021·大连调研)某单位有840名职工,现采纳系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( B ) (A)11 (B)12 (C)13 (D)14解析:由系统抽样定义可知,组距为=20,每组抽取一个,因为包含整数个组,因此抽取个体在区间[481,720]的数目为(720-480)÷20=12.故选B.7.已知某商场新进3 000袋奶粉,为检查其是否达标,现采纳系统抽样的方法从中抽取150袋检查,若第一组抽出的号码是11,则第六十一组抽出的号码为.解析:每组袋数d==20,由题意知这些号码是以11为首项,20为公差的等差数列.a61=11+60×20=1 211.答案:1 2118.某高中在校学生有2 000人,为了响应“阳光体育运动”的号召,学校开展了跑步和登山竞赛活动.每人都参与而且只参与其中一项竞赛,各年级参与竞赛的人数情形如表:高一年级高二年级高三年级跑步 a b c登山x y z其中a∶b∶c=2∶3∶5,全校参与登山的人数占总人数的.为了解学生对本次活动的中意程度,从中抽取一个200人的样本进行调查,则从高二年级参与跑步的学生中应抽取.解析:依照题意可知样本中参与跑步的人数为200×=120,因此从高二年级参与跑步的学生中应抽取的人数为120×=36.答案:36能力提升(时刻:15分钟)9.某地区高中分三类,A类学校共有学生2 000人,B类学校共有学生3 000人,C类学校共有学生4 000人,若采取分层抽样的方法抽取900人,则A类学校中的学生甲被抽到的概率为( A )(A)(B)(C)(D)解析:利用分层抽样,每个学生被抽到的概率是相同的,故所求的概率为=.故选A.10.采纳系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2, (960)分组后在第一组采纳简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为( C )(A)7 (B)9 (C)10 (D)15解析:采纳系统抽样方法从960人中抽取32人,则每30人抽取1人,在[451,750]号之间抽取人数为=10.故选C.11.(2021·新乡市二模)已知某居民小区户主人数和户主对户型结构的中意率分别如图1和图2所示,为了解该小区户主对户型结构的中意程度,用分层抽样的方法抽取20%的户主进行调查,则样本容量和抽取的户主对四居室中意的人数分别为( A )(A)100,8 (B)80,20 (C)100,20 (D)80,8解析:样本容量为(150+250+100)×20%=100,因此抽取的户主对四居室中意的人数为100××40%=8.故选A.12.利用随机数表法对一个容量为500,编号为000,001,002,…,499的产品进行抽样检验,抽取一个容量为10的样本,选取方法是从随机数表第12行第5列、第6列、第7列数字开始由左到右依次选取三个数字(下面摘取了随机数表中的第11行至第12行),依照下表,读出的第3个数是.18 18 07 92 45 44 17 16 58 09 79 83 86 19 62 06 76 50 03 10 55 23 64 05 0526 62 38 97 75 84 16 07 44 99 83 11 46 32 24 20 14 85 88 45 10 93 72 88 71解析:最先读到的数据的编号是389,向右读下一个数是775,775大于499,故舍去,再下一个数是841,舍去,再下一个数是607,舍去,再下一个数是449,再下一个数是983,舍去,再下一个数是114.故读出的第3个数是114.答案:11413.(2021·乌鲁木齐市二诊)某高中有学生2 000人,其中高一年级有760人,若从全校学生中随机抽出1人,抽到的学生是高二学生的概率为0.37,现采纳分层抽样(按年级分层)在全校抽取20人,则应在高三年级中抽取的人数为.解析:因为在全校学生中抽取1名学生,抽到高二年级学生的概率为0.37,因此高二人数为0.37×2 000=740,高三人数为2 000-760-740=500,从高三抽取的人数为×500=5.答案:514.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采纳系统抽样方法,按1~200编号分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码为.若采纳分层抽样,40岁以下年龄段应抽取人.解析:将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x人,则=,解得x=20.答案:37 20。
2021高考数学二轮专题复习专题五第1讲 统计与统计案例
![2021高考数学二轮专题复习专题五第1讲 统计与统计案例](https://img.taocdn.com/s3/m/2f40b0f3cc7931b764ce151e.png)
第1讲 统计与统计案例[考情分析] 高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体,线性回归方程的求解与运用,独立性检验问题.常与概率综合考查,中等难度. 考点一 统计图表 核心提炼1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距.2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数. 频率分布直方图中:(1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.例1 (1)(多选)(2020·新高考全国Ⅱ)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( )A .这11天复工指数和复产指数均逐日增加B .这11天期间,复产指数增量大于复工指数的增量C .第3天至第11天复工复产指数均增大都超过80%D .第9天至第11天复产指数增量大于复工指数的增量 答案 CD(2)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的学生称为“阅读霸”,则下列结论正确的是( )A.抽样表明,该校约有一半学生为阅读霸B.该校只有50名学生不喜欢阅读C.该校只有50名学生喜欢阅读D.抽样表明,该校有50名学生为阅读霸答案 A解析根据频率分布直方图可列下表:阅读时间(分钟)[0,10)[10,20)[20,30)[30,40)[40,50)[50,60]抽样人数(名)1018222520 5抽样100名学生中有50名为阅读霸,占一半,据此可判断该校约有一半学生为阅读霸.易错提醒(1)对于给出的统计图表,一定要结合问题背景理解图表意义,不能似懂非懂.(2)频率分布直方图中纵坐标不要误以为频率.跟踪演练1 (1)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温不低于20 ℃的月份有5个答案 D解析由题中雷达图易知A,C正确.七月份平均最高气温超过20 ℃,平均最低气温约为13 ℃;一月份平均最高气温约为6 ℃,平均最低气温约为2 ℃,所以七月的平均温差比一月平均温差大,故B正确.由题图知平均最高气温不低于20 ℃的月份为六、七、八月,有3个.(2)(多选)(2020·重庆模拟)新高考方案规定,普通高中学业水平考试分为合格性考试(合格考)和选择性考试(选择考),其中“选择考”成绩将计入高考总成绩,即将学生考试时的原始卷面分数由高到低进行排序,评定为A,B,C,D,E五个等级,再转换为分数计入高考总成绩.某试点高中2020年参加“选择考”总人数是2018年参加“选择考”总人数的2倍,为了更好地分析该校学生“选择考”的水平情况,统计了该校2018年和2020年“选择考”成绩等级结果,得到如图所示的统计图.针对该校“选择考”情况,2020年与2018年比较,下列说法正确的是( ) A .获得A 等级的人数增加了 B .获得B 等级的人数增加了1.5倍 C .获得D 等级的人数减少了一半 D .获得E 等级的人数相同 答案 AB解析 设2018年参加“选择考”的总人数为x ,则2020年参加“选择考”的总人数为2x ,根据图表得出2018年和2020年各个等级的人数如表所示.等级年份 AB C D E2018 0.28x 0.32x 0.30x 0.08x 0.02x 20200.48x0.8x0.56x0.12x0.04x由表可知,获得A 等级的人数增加了,故A 正确;获得B 等级的人数增加了0.8x -0.32x0.32x=1.5倍,故B 正确;获得D 等级的人数增加了,故C 错误;获得E 等级的人数不相同,故D 错误.考点二 回归分析 核心提炼在分析两个变量的相关关系时,可根据样本数据作出散点图来判断两个变量之间是否具有相关关系.若具有线性相关关系,则回归直线过样本点的中心(x ,y ),并且可通过线性回归方程估计预报变量的值.例2 (2020·全国Ⅱ)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑i =120x i =60,∑i =120y i =1 200,∑i =120(x i -x )2=80,∑i =120(y i -y )2=9 000,∑i =120(x i -x )(y i -y )=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r =∑i =1n(x i -x )(y i -y)∑i =1n(x i -x )2∑i =1n(y i -y)2,2≈1.414.解 (1)由已知得样本平均数y =120∑i =120y i =60,从而该地区这种野生动物数量的估计值为 60×200=12 000.(2)样本(x i ,y i )(i =1,2,…,20)的相关系数r =∑i =120(x i -x )(y i -y)∑i =120(x i -x )2∑i =120(y i -y)2=80080×9 000=223≈0.94.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计. 规律方法 样本数据的相关系数r =∑ni =1 (x i -x )(y i -y )∑n i =1(x i -x )2∑ni =1(y i -y )2,反映样本数据的相关程度,|r |越大,则相关性越强.跟踪演练2 (1)已知某产品的销售额y 与广告费用x 之间的关系如下表:若求得其线性回归方程为y ^=6.5x +a ^,则预计当广告费用为6万元时的销售额为( ) A .42万元 B .45万元 C .48万元 D .51万元 答案 C解析 由题意,根据上表中的数据, 可得x =2,y =22, 即样本点的中心为(2,22),又线性回归方程y ^=6.5x +a ^经过样本点的中心,所以22=6.5×2+a ^,解得a ^=9,所以y ^=6.5x +9,当x =6时,y ^=48.(2)(2020·河北衡水中学月考)有一散点图如图所示,在5个(x ,y )数据中去掉D (3,10)后,下列说法正确的是( )A.残差平方和变小B.相关系数r变小C.相关指数R2变小D.解释变量x与预报变量y的相关性变弱答案 A解析∵从散点图可分析得出:只有D点偏离直线远,去掉D点,解释变量x与预报变量y的线性相关性变强,∴相关系数变大,相关指数变大,残差平方和变小,故选A.考点三独立性检验核心提炼假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+dK2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d)(其中n=a+b+c+d为样本容量).例3 (2020·新高考全国Ⅰ)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:SO2 [0,50](50,150](150,475](1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),解(1)由表格可知,该市100天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+6+18+8=64,所以该市一天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为64100=0.64.(2)由所给数据,可得2×2列联表:(3)根据2×2列联表中的数据可得K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(64×10-16×10)2 80×20×74×26≈7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.规律方法独立性检验的关键(1)根据2×2列联表准确计算K2,若2×2列联表没有列出来,要先列出此表.(2)K2的观测值k越大,对应的假设H0成立的概率越小,H0不成立的概率越大.跟踪演练3 (1)随着国家二胎政策的全面放开,为了调查一线城市和非一线城市的二胎生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.附表:由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算得,K 2的观测值k =100×(45×22-20×13)258×42×35×65≈9.616,参照附表,得到的正确结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C .有99%以上的把握认为“生育意愿与城市级别有关”D .有99%以上的把握认为“生育意愿与城市级别无关” 答案 C解析 由题意知,K 2的观测值k ≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”.(2)某校团委对“学生性别和喜欢某视频APP 是否有关”做了一次调查,其中被调查的女生人数是男生人数的一半,男生喜欢某视频APP 的人数占男生人数的16,女生喜欢某视频APP 的人数占女生人数的23,若有95%的把握认为喜欢某视频APP 和性别有关,则男生至少有( ) 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).A .12人B .6人C .10人D .18人 答案 A解析 设被调查的男生人数为x ,则被调查的女生人数为x2,则2×2列联表为若有95%的把握认为喜欢某视频APP 和性别有关,则K 2≥3.841,即K 2=3x 2⎝ ⎛⎭⎪⎫x 6×x 6-5x 6×x 32x ×x 2×x 2×x=3x8≥3.841,则x ≥3.841×83≈10.243,又x 2,x 3,x6均为整数,所以男生至少有12人. 专题强化练一、单项选择题1.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x -y |的值为( ) A .4 B .3 C .2 D .1 答案 A解析 依题意有x +y +10+11+95=10,(x -10)2+(y -10)2+(10-10)2+(11-10)2+(9-10)2=5×2,解得x =8,y =12或x =12,y =8,故|x -y |=4.2.(2019·全国Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( ) A .0.5 B .0.6 C .0.7 D .0.8答案 C解析根据题意阅读过《红楼梦》《西游记》的人数用韦恩图表示如下:所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.3.(2020·全国Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i,y i)(i=1,2,…,20)得到下面的散点图:由此散点图可以看出,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )A.y=a+bx B.y=a+bx2C.y=a+b e x D.y=a+b ln x答案 D解析由散点图可以看出,点大致分布在对数型函数的图象附近.4.某生产车间的甲、乙两位工人生产同一种零件,这种零件的标准尺寸为85 mm,现分别从他们生产的零件中各随机抽取8件进行检测,其尺寸(单位:mm)用茎叶图表示如图所示,则估计( )A.甲、乙生产的零件尺寸的中位数相等B.甲、乙生产的零件质量相当C.甲生产的零件质量比乙生产的零件质量好D .乙生产的零件质量比甲生产的零件质量好 答案 D解析 甲生产的零件尺寸是93,89,88,85,84,82,79,78;乙生产的零件尺寸是90,88,86,85,85,84,84,78.故甲生产的零件尺寸的中位数是85+842=84.5,乙生产的零件尺寸的中位数是85+852=85,故A 错误;根据数据分析,乙的数据较稳定,故乙生产的零件质量比甲生产的零件质量好,故B ,C 错误.5.某校进行了一次创新作文大赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在[40,90]之间,其得分的频率分布直方图如图所示,则下列结论错误的是( )A .得分在[40,60)之间的共有40人B .从这100名参赛者中随机选取1人,其得分在[60,80)之间的概率为0.5C .估计得分的众数为55D .这100名参赛者得分的中位数为65 答案 D解析 根据频率和为1,计算(a +0.035+0.030+0.020+0.010)×10=1,解得a =0.005, 得分在[40,60)之间的频率是0.4,估计得分在[40,60)之间的有100×0.4=40(人),A 正确;得分在[60,80)之间的频率为0.5,可得从这100名参赛者中随机选取1人,得分在[60,80)之间的概率为0.5,B 正确;根据频率分布直方图知,最高的小矩形对应的底边中点为50+602=55,即估计众数为55,C 正确;根据频率分布直方图知,得分低于60分的直方图面积为(0.005+0.035)×10=0.4<0.5,而得分低于70分的直方图面积为(0.005+0.035+0.030)×10=0.7>0.5,所以100名参赛者得分的中位数估计为60+0.5-0.40.030≈63.3,D错误. 二、多项选择题6.(2020·烟台模拟)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下表所示的列联表,经计算K 2的观测值k ≈4.762,则可以推断出( )A.该学校男生对食堂服务满意的概率的估计值为35B .调研结果显示,该学校男生比女生对食堂服务更满意C .有95%的把握认为男、女生对该食堂服务的评价有差异D .有99%的把握认为男、女生对该食堂服务的评价有差异 答案 AC解析 对于选项A ,该学校男生对食堂服务满意的概率的估计值为3030+20=35,故A 正确;对于选项B ,该学校女生对食堂服务满意的概率的估计值为4040+10=45>35,故B 错误;因为k ≈4.762>3.841,所以有95%的把握认为男、女生对该食堂服务的评价有差异,故C 正确,D 错误.7.(2020·河北衡水中学月考)5G 时代已经到来,5G 的发展将直接带动包括运营、制造、服务在内的通信行业经济的快速增长,进而对GDP 增长产生直接贡献,并通过产业间的关联效应和波及效应,间接带动国民经济各行业的发展,创造出更多的经济增加值.如图是某单位结合近几年数据,对今后几年的5G 经济产出所做的预测.结合上图,下列说法正确的是( )A.5G的发展带动今后几年的总经济产出逐年增加B.设备制造商的经济产出前期增长较快,后期放缓C.信息服务商与运营商的经济产出的差距有逐步拉大的趋势D.设备制造商在各年的经济产出中一直处于领先地位答案ABC解析由图易知A,B,C正确,而设备制造商的经济产出在2029年和2030年将低于信息服务商的经济产出,故D 错误.8.(2020·青岛模拟)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,则下列结论正确的是( )注:90后指1990年及以后出生,80后指1980-1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后比80前多D.互联网行业中从事技术岗位的人数90后比80后多答案ABC解析选项A,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术和运营岗位的人数占的比分别为39.6%和17%,则“90后”从事技术和运营岗位的人数占总人数的56%×(39.6%+17%)≈31.7%.“80前”和“80后”中必然也有从事技术和运营岗位的人,则总的占比一定超过三成,故选项A 正确;选项B ,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术岗位的人数占的比为39.6%,则“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%.“80前”和“80后”中必然也有从事技术岗位的人,则总的占比一定超过20%,故选项B 正确;选项C ,“90后”从事运营岗位的人数占总人数的比为56%×17%≈9.5%,大于“80前”的总人数所占比3%,故选项C 正确;选项D ,“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%,“80后”的总人数所占比为41%,条件中未给出“80后”从事技术岗位的占比,故不能判断,所以选项D 错误. 三、填空题9.某企业的一种商品的产量与成本数据如下表:若根据表中提供的数据,求出y 关于x 的线性回归方程为y ^=-1.15x +28.1,则a 的值为________. 答案 5解析 由题意知x =14+16+18+20+225=905=18,y =12+10+7+a +35=32+a5,又y =-1.15×18+28.1=7.4, 所以32+a5=7.4,解得a =5.10.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量为________,抽取的高中生近视人数为________.答案 200 20解析 由题图甲知,总人数为3 500+2 000+4 500=10 000,所以样本容量为10 000×2%=200,抽样比例为150,所以高中生抽取的学生数为40,所以抽取的高中生近视人数为40×50%=20.11.下面的折线图给出的是甲、乙两只股票在某年中每月的收盘价格,已知股票甲的极差是6.88元,标准差为2.04元;股票乙的极差为27.47元,标准差为9.63元,根据这两只股票在这一年中的波动程度,给出下列结论:①股票甲在这一年中波动相对较小,表现的更加稳定;②购买股票乙风险高但可能获得高回报;③股票甲的走势相对平稳,股票乙的收盘价格波动较大;④两只股票在全年都处于上升趋势.其中正确的结论是________.(填序号)答案 ①②③解析 由题意可知,甲的标准差为2.04元,乙的标准差为9.63元,可知股票甲在这一年中波动相对较小,表现的更加稳定,故①正确;甲的极差是6.88元,乙的极差为27.47元,可知购买股票乙风险高但可能获得高回报,故②正确;通过折线图可知股票甲的走势相对平稳,股票乙的收盘价格波动较大,故③正确;通过折线图可得乙在6月到8月明显是下降趋势,故④错误.12.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是________.(填序号)①y 与x 具有正的线性相关关系; ②回归直线过样本点的中心(x ,y );③若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ; ④若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg. 答案 ④解析 由于线性回归方程中x 的系数为0.85,因此y 与x 具有正的线性相关关系,故①正确;因为回归直线必过样本点的中心(x ,y ),所以②正确;由线性回归方程的意义知,某女生的身高增加1 cm ,其体重约增加0.85 kg ,故③正确;当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,这不是确定值,因此④不正确. 四、解答题13.某公司为了了解广告投入对销售收益的影响,在若干地区各投入3.5万元广告费用,并将各地的销售收益绘制成频率分布直方图,如图所示,由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从0开始计数的.(1)根据频率分布直方图计算图中各小长方形的宽度;(2)估计该公司投入3.5万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值); (3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:广告投入x (单位:万元) 1 2 3 4 5 销售收益y (单位:万元)2327表中的数据显示,x 与y 之间存在线性相关关系,请将(2)中的结果填入空白栏,并计算y 关于x 的线性回归方程.附:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b ^x .解 (1)设各小长方形的宽度为m ,由频率分布直方图中各小长方形面积总和为1,可知(0.08+0.10+0.14+0.12+0.04+0.02)·m =0.5m =1,故m =2.(2)由(1)知,各分组依次是[0,2),[2,4),[4,6),[6,8),[8,10),[10,12],其中点值分别为1,3,5,7,9,11,对应的频率分别为0.16,0.20,0.28,0.24,0.08,0.04,故可估计平均值为1×0.16+3×0.20+5×0.28+7×0.24+9×0.08+11×0.04=5.(3)空白栏中填5.由题意可知,x =1+2+3+4+55=3,y =2+3+2+5+75=3.8,∑5i =1x i y i =1×2+2×3+3×2+4×5+5×7=69,∑5i =1x 2i =12+22+32+42+52=55.根据公式可求得b ^=∑i =15x i y i -5 x y∑i =15x 2i -5x 2=69-5×3×3.855-5×32=1210=1.2, a ^=3.8-1.2×3=0.2,即线性回归方程为y ^=1.2x +0.2.14.(2020·全国Ⅲ)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)由频数分布表可知,该市一天的空气质量等级为1的概率为2+16+25100=0.43,等级为2的概率为5+10+12100=0.27,等级为3的概率为6+7+8100=0.21,等级为4的概率为7+2+0100=0.09.(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100×20+300×35+500×45100=350.(3)2×2列联表如下:K 2=100×(33×8-37×22)255×45×70×30≈5.820>3.841, 因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.。
2021高考第二轮复习:(理数)专题十八统计与统计案例
![2021高考第二轮复习:(理数)专题十八统计与统计案例](https://img.taocdn.com/s3/m/d903857ddaef5ef7bb0d3cdb.png)
2021高考第二轮复习:(理数)专题十八统计与统计案例20年高考第二轮复习(理数)专题十八统计与统计案例1.(20·山东,3,易)某高校调查了20名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20, 22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这20名学生中每周的自习时间不少于22.5小时的人数是( ) A.56 B.60 C.120 D.1401.D [考向2]由频率分布直方图可知,每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,所以每周的自习时间不少于22.5小时的人数是20×0.7=140.2.(20·课标Ⅲ,4,易)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个2.D 平均最高气温高于20 ℃的为七、八月份,∴D错.3.(20·安徽,5,易)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( )A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班男生成绩的平均数小于该班女生成绩的平均数3.C [考向1,3]五名男生成绩的平均数是eq \o(,\s\up6(-))男=eq\f(86+94+88+92+90,5)=90,五名女生成绩的平均数是eq \o(,\s\up6(-))女=eq \f(88+93+93+88+93,5)=91,五名男生成绩的方差是seq \o\al(2,男)=eq \f(1,5)(16+16+4+4+0)=8,五名女生成绩的方差是seq \o\al(2,女)=eq \f(1,5)(9+4+4+9+4)=6,由seq \o\al(2,男)>seq \o\al(2,女)知应该选C.4.(20·山东,7,中)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.6 B.8 C.12 D.184.C [考向2]由题图可知,第一组和第二组的频率之和为(0.24+0.16)×1=0.40,故该试验共选取志愿者eq \f(20,0.40)=50(人).所以第三组共有50×0.36=18(人),其中有疗效的人数为18-6=12.5.(20·天津,9,易)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取名学生.5.[考向1]【解析】一年级本科生人数占总人数的比例为eq \f(4,4+5+5+6)=eq \f(4,20)=eq \f(1,5),所以应从一年级本科生中抽取的学生数为300×eq\f(1,5)=60.【答案】606.(20·湖南,12,易)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是.6.[考向1,2]【解析】根据系统抽样原理,应将数据按照顺序分成7组,每组5人.区间[139,151]恰好包含第3组到第6组的数据,所以应该从中抽取4人.【答案】 47.(20·江苏,6,易)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100 cm.7.[考向2]【解析】由频率分布直方图可知,在抽测的60株树木中,底部周长小于100 cm的频率是(0.015+0.025)×10=0.4,所以底部周长小于100 cm的株数是60×0.4=24.【答案】248.(20·四川,16,12分,中)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准(吨),一位居民的月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85的居民每月的用水量不超过标准(吨),估计的值,并说明理由.8.[考向2]解:(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85.而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.730,b>0 B.a>0,b0 D.a0,bb′,eq \o(a,\s\up6(^))>a′ B.eq \o(b,\s\up6(^))>b′,eq \o(a,\s\up6(^))a′ D.eq \o(b,\s\up6(^))a′,所以选C.5.(20·湖南,4,中)设某大学的女生体重y(单位:kg)与身高(单位:cm)具有线性相关关系,根据一组样本数据(i,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为eq \o(y,\s\up6(^))=0.85-85.71,则下列结论中不正确的是( )A.y与具有正的线性相关关系B.回归直线过样本点的中心(eq \o(,\s\up6(-)),eq \o(y,\s\up6(-))) C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg5.D ∵0.85>0,∴y与正相关,∴A正确;∵线性回归方程经过样本点的中心(eq \o(,\s\up6(-)),eq \o(y,\s\up6(-))),∴B正确;∵Δy=0.85(+1)-85.71-(0.85-85.71)=0.85,∴C正确;体重58.79 kg为估计值,故选D.6.(20·课标Ⅲ,18,12分,中)如图是我国2021年至20年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2021~20.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测20年我国生活垃圾无害化处理量.附注:参考数据:eq \o(∑,\s\up6(7),\s\do4(i=1))yi=9.32,eq\o(∑,\s\up6(7),\s\do4(i=1))tiyi=40.17,eq \r(\o(∑,\s\up6(7),\s\do4(i =1)) (yi-\o(y,\s\up6(-)))2)=0.55,eq \r(7)≈2.646.参考公式:相关系数r=eq \f(\o(∑,\s\up6(n),\s\do4(i=1)) (ti-\o(t,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up6(n),\s\do4(i=1)) (ti-\o(t,\s\up6(-)))2\o(∑,\s\up6(n),\s\do4(i=1)) (yi-\o(y,\s\up6(-)))2)),回归方程eq \o(y,\s\up6(^))=eq \o(a,\s\up6(^))+eq\o(b,\s\up6(^))t中斜率和截距的最小二乘估计公式分别为:eq \o(b,\s\up6(^))=eq \f(\o(∑,\s\up6(n),\s\do4(i=1)) (ti-\o(t,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1)) (ti-\o(t,\s\up6(-)))2),eq \o(a,\s\up6(^))=eq \o(y,\s\up6(-))-eq \o(b,\s\up6(^))eq \o(t,\s\up6(-)).6.解:(1)由折线图中数据和附注中参考数据得eq \o(t,\s\up6(-))=4,eq \o(∑,\s\up6(7),\s\do4(i=1)) (ti-eq \o(t,\s\up6(-)))2=28,eq \r(\o(∑,\s\up6(7),\s\do4(i=1)) (yi-\o(y,\s\up6(-)))2)=0.55,eq \o(∑,\s\up6(7),\s\do4(i=1)) (ti-eq \o(t,\s\up6(-)))(yi-eq \o(y,\s\up6(-)))=eq \o(∑,\s\up6(7),\s\do4(i=1))tiyi-eq\o(t,\s\up6(-))eq \o(∑,\s\up6(7),\s\do4(i=1))yi=40.17-4×9.32=2.89,r≈eq \f(2.89,0.55×2×2.646)≈0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.(2)由eq \o(y,\s\up6(-))=eq \f(9.32,7)≈1.331及(1)得eq\o(b,\s\up6(^))=eq \f(\o(∑,\s\up6(7),\s\do4(i=1)) (ti-\o(t,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(7),\s\do4(i=1)) (ti-\o(t,\s\up6(-)))2)=eq \f(2.89,28)≈=0.103,eq \o(a,\s\up6(^))=eq \o(y,\s\up6(-))-eq \o(b,\s\up6(^))eq\o(t,\s\up6(-))≈1.331-0.103×4≈0.92.所以,y关于t的回归方程为eq\o(y,\s\up6(^))=0.92+0.10t.所以将20年对应的t=9代入回归方程得:eq\o(y,\s\up6(^))=0.92+0.10×9=1.82.所以预测20年我国生活垃圾无害化处理量约为1.82亿吨.7.(20·课标Ⅰ,19,12分,中)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费i和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.eq \o(,\s\up6(-))eq \o(y,\s\up6(-))eq \o(w,\s\up6(-))eq \o(∑,\s\up6(8),\s\do4(i=1)) (i-eq \o(,\s\up6(-)))2eq \o(∑,\s\up6(8),\s\do4(i=1)) (wi-eq \o(w,\s\up6(-)))2eq \o(∑,\s\up6(8),\s\do4(i=1)) (i-eq \o(,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))eq \o(∑,\s\up6(8),\s\do4(i=1)) (wi-eq \o(w,\s\up6(-)))·(yi-eq \o(y,\s\up6(-)))46.65636.8289.81.61 469108.8表中wi=eq \r(i),eq \o(w,\s\up6(-))=eq \f(1,8)eq\o(∑,\s\up6(8),\s\do4(i=1))wi.(1)根据散点图判断,y=a+b与y=c+deq \r哪一个适宜作为年销售量y关于年宣传费的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于的回归方程;(3)已知这种产品的年利润z与,y的关系为z=0.2y-,根据(2)的结果回答下列问题:①年宣传费=49时,年销售量及年利润的预报值是多少?②年宣传费为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为eq \o(β,\s\up6(^))=eq \f(\o(∑,\s\up6(n),\s\do4(i=1)) (ui-\o(u,\s\up6(-)))(vi-\o(v,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1)) (ui-\o(u,\s\up6(-)))2),eq \o(α,\s\up6(^))=eq \o(v,\s\up6(-))-eq \o(β,\s\up6(^)) eq \o(u,\s\up6(-)) .7.解:(1)由散点图可以判断,y=c+deq \r适宜作为年销售量y关于年宣传费的回归方程类型.(2)令w=eq \r,先建立y关于w的线性回归方程.由于eq \o(d,\s\up6(^))=eq \f(\o(∑,\s\up6(8),\s\do4(i=1)) (wi-\o(w,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(8),\s\do4(i=1)) (wi-\o(w,\s\up6(-)))2)=eq \f(108.8,1.6)=68,eq \o(c,\s\up6(^))=eq \o(y,\s\up6(-))-eq \o(d,\s\up6(^))eq\o(w,\s\up6(-))=563-68×6.8=100.6,所以y关于w的线性回归方程为eq \o(y,\s\up6(^))=100.6+68w,因此y 关于的回归方程为eq \o(y,\s\up6(^))=100.6+68eq \r.(3)①由(2)知,当=49时,年销售量y的预报值eq \o(y,\s\up6(^))=100.6+68eq \r(49)=576.6,年利润z的预报值eq \o(z,\s\up6(^))=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z的预报值eq \o(z,\s\up6(^))=0.2(100.6+68eq \r)-=-+13.6eq \r+20.12.所以当eq \r=eq \f(13.6,2)=6.8,即=46.24时,eq \o(z,\s\up6(^))取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.本考向在高考中灵活性不强,主要考查点有:(1)线性回归方程中系数的计算.公式不要求记忆,试卷会给出公式,会用即可;(2)正相关、负相关与系数b(斜率)的关系,有时也会涉及截距;(3)根据线性回归方程进行预测.注意:预测值是估计值,而不是精确值;(4)画散点图或根据散点图判断数据的相关性;(5)回归直线一定经过回归中心(eq \o(,\s\up6(-)),eq \o(y,\s\up6(-))).题目难度一般为容易题或中档题,各种题型都会出现.1(20·课标Ⅱ,19,12分)某地区207年至20年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2220年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析^p 207年至20年该地区农村居民家庭人均纯收入的变化情况,并预测该地区20年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:eq \o(b,\s\up6(^))=eq \f(\o(∑,\s\up6(n),\s\do4(i=1)) (ti-\o(t,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1)) (ti-\o(t,\s\up6(-)))2),eq \o(a,\s\up6(^))=eq \o(y,\s\up6(-))-eq \o(b,\s\up6(^))eq \o(t,\s\up6(-)).【解析】(1)由所给数据计算得eq \o(t,\s\up6(-))=eq \f(1,7)(1+2+3+4+5+6+7)=4,eq \o(y,\s\up6(-))=eq \f(1,7)(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,eq \o(∑,\s\up6(7),\s\do4(i=1)) (ti-eq \o(t,\s\up6(-)))2=9+4+1+0+1+4+9=28,eq \o(∑,\s\up6(7),\s\do4(i=1)) (ti-eq \o(t,\s\up6(-)))(yi-eq \o(y,\s\up6(-)))=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,eq \o(b,\s\up6(^))=eq \f(\o(∑,\s\up6(7),\s\do4(i=1)) (ti-\o(t,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(7),\s\do4(i=1)) (ti-\o(t,\s\up6(-)))2)=eq \f(14,28)=0.5,eq \o(a,\s\up6(^))=eq \o(y,\s\up6(-))-eq \o(b,\s\up6(^)) eq\a\vs4\al(\o(t,\s\up6(-)) )=4.3-0.5×4=2.3.所求回归方程为eq\o(y,\s\up6(^))=0.5t+2.3.(2)由(1)知,eq \o(b,\s\up6(^))=0.5>0,故207年至20年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将20年的年份代号t=9代入(1)中的回归方程,得eq \o(y,\s\up6(^))=0.5×9+2.3=6.8,故预测该地区20年农村居民家庭人均纯收入为6.8千元.(1)根据回归方程的定义求出回归方程;(2)将待预测的t代入(1)中回归方程,得预测结果.求线性回归。
2021高考北师版(理科)数学一轮复习讲义: 重点强化课5 统计与统计案例
![2021高考北师版(理科)数学一轮复习讲义: 重点强化课5 统计与统计案例](https://img.taocdn.com/s3/m/cb35f6f0b7360b4c2f3f64aa.png)
重点强化课(五) 统计与统计案例[复习导读] 本章是新课程改革增加内容,是命题的热点,以算法框图、回归分析、统计图表为重点,以客观题为主.命题注重背景新颖、角度灵活.但近几年统计与统计案例、统计与概率交汇,加大了考察力度.2021 年、2021年全国卷均以解答题的形式呈现,强化统计思想方法和创新应用意识的考察,复习过程中应引起注意,多变换角度,注重新背景、新材料题目的训练.重点1 算法框图及应用☞角度1 算法框图与数列交汇执行如图1的算法框图,如果输入的N =100,那么输出的X =( )【导学号:57962443】图1C [由算法框图知,输出的X 表示数列⎩⎨⎧⎭⎬⎫1n (n +1)的前99项和, ∴X =11×2+12×3+…+199×100=⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫12-13+…+⎝ ⎛⎭⎪⎫199-1100=99100.] ☞角度2 算法框图与统计的渗透(2021·合肥模拟)随机抽取某中学甲、乙两个班各10名同学,测量他们的身高获得身高数据的茎叶图如图2,在样本的20人中,记身高在[150,160),[160,170),[170,180),[180,190)的人数依次为A1,A2,A3,A4.如图3是统计样本中身高在一定范围内的人数的算法框图.假设图中输出的S=18,那么判断框应填________.图2图3i<5或i≤4[由于i从2开场,也就是统计大于或等于160的所有人数,于是就要计算A2+A3+A4,因此,判断框应填i<5或i≤4.]☞角度3算法框图与函数交汇渗透如图4所示的算法框图的输入值x∈[-1,3],那么输出值y的取值范围为()图4A.[1,2]B.[0,2]C.[0,1]D.[-1,2]B[当0≤x≤3时,1≤x+1≤4,所以,0≤log2(x+1)≤2.当-1≤x<0时,0<-x≤1⇒1<2-x≤2,所以,0<2-x-1≤1.因此输出值y的取值范围为[0,2].][规律方法] 1.完善算法框图:结合初始条件和输出结果,分析控制循环的变量应满足的条件或累加、累乘的变量的表达式.2.求解该类问题,关键是准确理解算法框图的构造,明确算法框图的功能,按照算法框图中的条件进展程序.重点2用样本估计总体(2021 ·全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.图5①A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表满意度评分分[50,60)[60,70)[70,80)[80,90)[90,100)组频数281410 6(1)在图5②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比拟两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图图5②(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.[解](1)如下图.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比拟集中,而A地区用户满意度评分比拟分散. 5分(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意〞;C B表示事件:“B 地区用户的满意度等级为不满意〞.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大. 12分[规律方法] 1.利用统计图表解决实际问题的关键在于从统计图表中提炼准确的数据信息.2.本例通过画频率分布直方图考察对数据的处理能力和数形结合的思想方法,通过求概率考察运算求解能力和实际应用意识.[对点训练1] 为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图6所示.图6(1)假设甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1,x 2,估计x 1-x 2的值.[解] (1)设甲校高三年级学生总人数为n . 由题意知30n =0.05,解得n =600.2分样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为⎝ ⎛⎭⎪⎫1-530×100%≈83%. 5分(2)设甲、乙两校样本平均数分别为x ′1,x ′2,根据样本茎叶图可知30(x′1-x′2)=30x′1-30x′2=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15,因此x′1-x′2=0.5,故x1-x2的估计值为0. 5分.12分重点3统计的应用(2021·全国卷Ⅰ)某公司方案购置1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购置这种零件作为备件,每个200元.在机器使用期间,如果备件缺乏再购置,那么每个500元.现需决策在购置机器时应同时购置几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:图7记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购置易损零件上所需的费用(单位:元),n表示购机的同时购置的易损零件数.(1)假设n=19,求y与x的函数解析式;(2)假设要求“需更换的易损零件数不大于n〞的频率不小于0.5,求n的最小值;(3)假设这100台机器在购机的同时每台都购置19个易损零件,或每台都购置20个易损零件,分别计算这100台机器在购置易损零件上所需费用的平均数,以此作为决策依据,购置1台机器的同时应购置19个还是20个易损零件?[解](1)当x≤19时,y=3 800;当x>19时,y=3 800+500(x-19)=500x-5 700,所以y与x的函数解析式为y =⎩⎪⎨⎪⎧3 800,x ≤19,500x -5 700,x >19(x ∈N ). 4分(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n 的最小值为19.8分(3)假设每台机器在购机同时都购置19个易损零件,那么这100台机器中有70台在购置易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购置易损零件上所需费用的平均数为1100(3 800×70+4 300×20+4 800×10)=4 000.10分假设每台机器在购机同时都购置20个易损零件,那么这100台机器中有90台在购置易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购置易损零件上所需费用的平均数为1100(4 000×90+4 500×10)=4 050.比拟两个平均数可知,购置1台机器的同时应购置19个易损零件. 12分 [规律方法] 1.此题将分段函数、频率分布、样本的数字特征交汇命题,表达了统计思想的意识和应用.2.此题易错点有两处:一是混淆频率分布直方图与柱状图致误;二是审题不清或不懂题意,导致解题无从入手.防止此类错误,需认真审题,读懂题意,并认真观察频率分布直方图与柱状图的区别,纵轴表示的意义.[对点训练2] 某旅行社为调查市民喜欢“人文景观〞景点是否与年龄有关,随机抽取了55名市民,得到数据如下表:点与年龄有关?(2)用分层抽样的方法从喜欢“人文景观〞景点的市民中随机抽取6人作进一步调查,将这6位市民作为一个样本,从中任选2人,求恰有1位“大于40岁〞的市民和1位“20岁至40岁〞的市民的概率.下面的临界值表供参考:(参考公式:χ2=⎝⎛⎭⎪⎫n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d ) 【导学号:57962444】[解] (1)χ2=55(20×20-10×5)230×25×25×30≈11.978>7.879,所以在犯错误的概率不超过0.5%的前提下认为喜欢“人文景观〞景点与年龄有关.5分(2)设所抽样本中有m 个“大于40岁〞市民,那么m 20=630,得m =4,所以样本中有4个“大于40岁〞的市民,2个“20岁至40岁〞的市民,分别记作B 1,B 2,B 3,B 4,C 1,C 2.从中任选2人的根本领件有(B 1,B 2),(B 1,B 3),(B 1,B 4),(B 1,C 1),(B 1,C 2),(B 2,B 3),(B 2,B 4),(B 2,C 1),(B 2,C 2),(B 3,B 4),(B 3,C 1),(B 3,C 2),(B 4,C 1),(B 4,C 2),(C 1,C 2),共15个.10分其中恰有1名“大于40岁〞和1名“20岁至40岁〞的市民的事件有(B 1,C 1),(B 1,C 2),(B 2,C 1),(B 2,C 2),(B 3,C 1),(B 3,C 2),(B 4,C 1),(B 4,C 2),共8个.所以恰有1名“大于40岁〞的市民和1名“20岁至40岁〞的市民的概率为P =815.12分。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ˆ 7)建立模型②:y =99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值. (2)你认为用哪个模型得到的预测值更可靠?并说明理由.
【解】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为 (亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为 (亿元).
第5节 统计与统计案例
(2)利用模型②得到的预测值更可靠.
理由如下:
(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线
上下,这说明利用2000年至2016年的数据建立的线性模型
①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环
(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值 226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型② 得到的预测值更可靠. (给出了2种理由,答出其中任意一种或其他合理理由均可)
第5节 统计与统计案例
4.[山东省2020届一模]如图给出了根据我国2012年~2018年水果人均占有量y(单位:kg)和 年份代码x绘制的散点图和线性回归方程的残差图(2012年~2018年的年份代码x为1~7).
【解析】∵对两个变量的散点图而言, 若样本点成带状分布,则两个变量具有 线性相关关系,∴两个变量具有线性相 关关系的图是①和④.
【答案】B
第5节 统计与统计案例
2.[湖南长沙长郡中学2019二模]某统计部门对四组数据进行统计分析后,获得如图所示 的散点图,关于相关系数的比较,其中正确的是( )
A.r4<r2<0<r1<r3 B.r2<r4<0<r1<r3 C.r2<r4<0<r3<r1 D.r4<r2<0<r3<r1
这样,回归直线的斜率为 ,截距为 ,即回归方程为
回归直线一定经过样本点的中心
,据此性质可以解决有关的计算问题
.同时可以应用回归方程作出预测.
第5节 统计与统计案例
4.相关系数r
①|r|≤1,当r>0时,两个变量________; 当r<0时,两个变量负相关.
②|r|越接近于1,两个变量的线性相关关 系________;|r|越接近于0,两个变量的线性 相关关系_________.通常当|r|>________时, 我们认为两个变量之间存在较强的线性相关关 系.当|r|=1时,所有点均在直线上.
第5节 统计与统计案例
2.两个变量线性相关的类型
①正相关:如果两个变量的散点图中的点散布在从__左_下__角___到__右__上__角__的区域,
对于两个变量的这种相关关系,我们将它称为正相关.
②负相关:如果两个变量的散点图中的点散布在从__左பைடு நூலகம்_上__角__到__右__下__角__的区域,
对于两个变量的这种相关关系,我们将它称为负相关.
第5节 统计与统计案例
5.相关指数R2
R2表达式中的
为确定的数,因此R2越大,意味着残差平方和
越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差.R2
2021届全国新高考数学备考复习 统计与统计案例
统计与统计案例
真题自测 考向速览 必备知识 整合提升 考点精析 考法突破
第5节 统计与统计案例
真题自测 考向速览
考点1 变量的相关性
1.[四川广元2019统考]下列四个图各反映了两个变量的某种关系,其中可以看作具有线 性相关关系的是( ) A.①③ B.①④ C.②③ D.①②
第5节 统计与统计案例
3.回归直线和回归方程
(1)如果散点图中点的分布从整体上看大致在__________附近,就称这两个变量之间 具有线性相关关系,这条直线叫做回归直线.这条回归直线的方程简称回归方程. (2)使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. 利用最小二乘法求回归方程:
境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直
线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长
趋势,利用2010年至2016年的数据建立的线性模型
可以较好
地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到
的预测值更可靠.
第5节 统计与统计案例
第5节 统计与统计案例
第5节 统计与统计案例
第5节 统计与统计案例
考点3 独立性检验
第5节 统计与统计案例
第5节 统计与统计案例
第5节 统计与统计案例
第5节 统计与统计案例
必备知识 整合提升
1.散点图
将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示具有相关关系的 两个变量的一组数据的图形叫做散点图,如图所示.
第5节 统计与统计案例
【解析】根据散点图的特征,数据大致呈增长趋势的是正相关,数据呈递减趋势 的是负相关;数据越集中分布在一条线附近,说明相关性越强.由题中数据,可 知图(1)(3)为正相关,图(2)(4)为负相关,故r1>0,r3>0,r2<0,r4<0. 又图(1)与(2)中的点更集中分布于一条直线附近,故r1>r3,r2<r4. 因此r2<r4<0<r3<r1.
【答案】C
第5节 统计与统计案例
考点2 回归分析
3.[课标全国Ⅱ2018·18]下图是某地区2000年至2016年环境基础设施投资额y(单位:
亿元)的折线图.
第5节 统计与统计案例
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回 归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型
第5节 统计与统计案例
利用散点图识别两个变量之间的关系 ①如果所有的样本点都落在某一直线附近,两变量之间就有线性相关关系, 如图(1). ②如果所有的样本点都落在某一函数曲线(不是一条直线)附近,两变量之间 就有非线性相关关系,如图(2). ③如果散点图中的点的分布几乎没有什么规则,这两个变量之间就不具有相 关关系,即两个变量之间是相互独立的,如图(3).