高一数学统计案例练习题
高一数学统计试题
高一数学统计试题1.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为()A.B.C.D.2【答案】D【解析】由题意知,解得a=-1,∴样本方差为S2=,故选D.【考点】方差与标准差.2.已知x与y之间的几组数据如下表:则y与x的线性回归方程=x+必过点()A.(1,2) B.(2,6) C. D.(3,7)【答案】C【解析】回归直线必过样本中心点,由表格可求得.【考点】回归分析.3.用秦九韶算法计算多项式在时的值时,的值为【答案】-57【解析】由秦九韶算法知,当时,.【考点】算法案例.4.为预防X病毒爆发,某生物技术公司研制出一种X病毒疫苗,为测试该疫苗的有效性(若疫苗有效的概率小于90%,则认为测试没有通过),公司选定2000个样本分成三组,测试结果如下表:组组组67390已知在全体样本中随机抽取1个,抽到组疫苗有效的概率是0.33.(1)现用分层抽样的方法在全体样本中抽取360个测试结果,应在组抽取样本多少个?(2)已知,,求通过测试的概率.【答案】(1)90(2)【解析】(I)根据分层抽样的定义,按每层中的比例即可计算出组抽取样本的个数;(II)由(I),再结合题设条件,列举出所有可能的组合的个数及没有通过测试的组合的个数,再由概率公式及概率的性质求出通过测试的概率.(I)∵,∴,∵,∴应在组抽取样个数是(个).(II)∵,,,∴(,)的可能性是 (465,35),(466,34),(467,33),(468,32),(469,31),(470,30),若测试没有通过,则,,(,)的可能性是(465,35),(466,34),通过测试的概率是.【考点】1、分层抽样;2.、古典概型;3、估测能力.5.某校从高一年级学生中随机抽取40名学生作为样本,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六组:,,后得到如图的频率分布直方图.(Ⅰ)求图中实数的值;(Ⅱ)若该校高一年级共有学生500人,试估计该校高一年级在考试中成绩不低于60分的人数;(Ⅲ)若从样本中数学成绩在与两个分数段内的学生中随机选取两名学生,试用列举法求这两名学生的数学成绩之差的绝对值不大于10的概率.【答案】(1)0.03(2)425(3)【解析】解:(Ⅰ)由可得 2分(Ⅱ)数学成绩不低于60分的概率为:4分数学成绩不低于60分的人数为人 5分(Ⅲ)数学成绩在的学生人数:人 6分数学成绩在的学生人数:人 7分设数学成绩在的学生为,数学成绩在的学生为 8分两名学生的结果为:,共种 10分其中两名学生的数学成绩之差的绝对值不大于10的情况有,,,,,,共7种, 12分因此,抽取的两名学生的数学成绩之差的绝对值不大于10的概率为 13分【考点】直方图以及古典概型点评:主要是考查了直方图以及古典概型概率的计算,属于基础题。
(完整版)高三复习高中数学统计案例习题(有详细答案)
2015年高三复习高中数学统计案例习题(有详细答案)一.选择题(共15小题)1.(2014•四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样2.(2014•湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A.20 B.24 C.30 D.363.(2014•湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,324.(2014•锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A.3000 B.6000 C.7000 D.80005.(2014•许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100 B.120 C.150 D.2006.(2014•云南模拟)已知一组数据如图所示,则这组数据的中位数是()A.27.5 B.28.5 C.27 D.287.(2014•青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横轴n表示日期,纵轴x表示气温),记A、B两城市这6天的最低气温平均数分别为和,标准差分别为s A和s B,则它们的大小关系是()A.>,sA>s B B.>,sA<s BC.<,sA<s BD.<,sA>s B8.(2014•天门模拟)如图是根据变量x,y的观测数据(x i,y i)(i=1,2,…10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④9.(2014•邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A.68.2 B.68 C.69 D.6710.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.12011.(2013•陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.4512.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.6013.(2012•成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.70 户B.17 户C.56 户D.25 户14.(2012•泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A.15 B.16 C.17 D.1815.(2012•绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A.2人B.3人C.4人D.5人二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m 的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13求y关于x的回归方程=x+所表示的直线必经的点.18.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取4次,绘制成茎叶图如图:甲乙9 7 78 1 2 8 535(Ⅰ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.19.下表是某单位在2013年1﹣5月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4 5用水量y 4.5 4 3 2.5 1.8(Ⅰ)若由线性回归方程得到的预测数据与实际检验数据的误差不超过0.05,视为“预测可靠”,通过公式得,那么由该单位前4个月的数据中所得到的线性回归方程预测5月份的用水量是否可靠?说明理由;(Ⅱ)从这5个月中任取2个月的用水量,求所取2个月的用水量之和小于7(单位:百吨)的概率.参考公式:回归直线方程是:,.20.某校高三数学竞赛初赛考试后,对考生的成绩进行统计(考生成绩均不低于90分,满分为150分),将成绩按如下方式分成六组,第一组[90,100)、第二组[100,110)…,第六组[140,150],如图为其频率分布直方图的一部分,若第四、五、六组的人数依次成等差数列,且第六组有4人.(Ⅰ)求第四和第五组频率,并补全频率分布直方图;(Ⅱ)若不低于120分的同学进入决赛,不低于140分的同学为种子选手,完成下面2×2列联表(即填写空格处的数据),并判断是否有99%的把握认为“进入决赛的同学成为种子选手与专家培训有关”.[120,140)[140,150]合计参加培训8 8未参加培训合计 4附:K2=P(K2≥k0)0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001K0 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82821.为了了解某中学高二女生的身高情况,该校对高二女生的身高进行了一次随机抽样测量,所得数据整理后列出了频率分布表如下:(单位:cm)(1)表中m、n、M、N所表示的数分别是多少?(2)绘制频率分布直方图;(3)估计该校女生身高小于162.5cm的百分比.22.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求x值;(2)(理科)从成绩不低于80分的学生中随机的选取2人,该2人中成绩在90以上(含90分)的人数记为ξ,求ξ的概率分布列及数学期望Eξ.(文)从从成绩不低于80分的学生中随机的选取3人,该3人中至少有2人成绩在90以上(含90分)的概率.23.某网站针对2014年中国好声音歌手A,B,C三人进行网上投票,结果如下观众年龄支持A 支持B 支持C20岁以下200 400 80020岁以上(含20岁)100 100 400(1)在所有参与该活动的人中,用分层抽样的方法抽取n人,其中有6人支持A,求n的值.(2)在支持C的人中,用分层抽样的方法抽取6人作为一个总体,从这6人中任意选取2人,求恰有1人在20岁以下的概率.24.某校100名学生期中考试数学成绩的频率分布直方图如图,其中成绩分组区间如下:组号第一组第二组第三组第四组第五组分组[50,60)[60,70)[70,80)[80,90)[90,100](Ⅰ)求图中a的值;(Ⅱ)根据频率分布直方图,估计这100名学生期中考试数学成绩的平均分;(Ⅲ)现用分层抽样的方法从第3、4、5组中随机抽取6名学生,将该样本看成一个总体,从中随机抽取2名,求其中恰有1人的分数不低于90分的概率?25.从某实验中,得到一组样本容量为60的数据,分组情况如下:(Ⅰ)求出表中m,a的值;分组5~15 15~25 25~35 35~45频数 6 2l m频率 a 0.05(Ⅱ)估计这组数据的平均数.26.某校高三文科分为四个班.高三数学调研测试后,随机地在各班抽取部分学生进行测试成绩统计,各班被抽取的学生人数恰好成等差数列,人数最少的班被抽取了22人.抽取出来的所有学生的测试成绩统计结果的频率分布条形图如图所示,其中120~130(包括120分但不包括130分)的频率为0.05,此分数段的人数为5人.(1)问各班被抽取的学生人数各为多少人?(2)求平均成绩;(3)在抽取的所有学生中,任取一名学生,求分数不小于90分的概率.27.在参加世界杯足球赛的32支球队中,随机抽取20名队员,调查其年龄为25,21,23,25,27,29,25,28,30,29,26,24,25,27,26,22,24,25,26,28.(1)填写下面的频率分布表(2)并画出频率分布直方图.(3)据此估计全体队员在哪个年龄段的人数最多?占总数的百分之几?分组频数频率20.5~22.522.5~24.524.5~26.526.5~28.528.5~30.5合计28.如图是调查某地某公司1000名员工的月收入后制作的直方图.(1)求该公司员工的月平均收入及员工月收入的中位数;(2)在收入为1000至1500元和收入为3500至4000元的员工中用分层抽样的方法抽取一个容量15的样本,员工甲、乙的月收入分别为1200元、3800元,求甲乙同时被抽到的概率.29.某市为了解全市居民日常用水量的分布情况,现采用抽样调查的方式,获得了n位居民某年的月均用水量(单位:t),样本统计结果如图表:(Ⅰ)分别求出x,n,y的值;(Ⅱ)若从样本中月均用水量在[5,6]内的5位居民a,b,c,d,e中任选2人作进一步的调查研究,求居民a被选中的概率.分组频数频率[0,1)25 y[1,2)0.19[2,3)50 x[3,4)0.23[4,5)0.18[5,6] 530.为了分析某次考试数学成绩情况,用简单随机抽样从某班中抽取25名学生的成绩(百分制)作为样本,得到频率分布表如下:分数[50,60)[60,70)[70,80)[80,90)[90,100]频数2 3 9 a 1频率0.08 0.12 0.36 b 0.04(Ⅰ)求样本频率分布表中a,b的值,并根据上述频率分布表,在下表中作出样本频率分布直方图;(Ⅱ)计算这25名学生的平均数及方差(同一组中的数据用该组区间的中点值作代表);(Ⅲ)从成绩在[50,70)的学生中任选2人,求至少有1人的成绩在[60,70)中的概率.参考答案与试题解析一.选择题(共15小题)1.(2014•四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样考点:分层抽样方法.专题:阅读型.分析:若总体由差异明显的几部分组成时,经常采用分层抽样的方法进行抽样解答:解:我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.了解某地区中小学生的视力情况,按学段分层抽样,这种方式具有代表性,比较合理.故选C.点评:本小题考查抽样方法,主要考查抽样方法,属基本题.2.(2014•湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A.20 B.24 C.30 D.36考点:分层抽样方法.专题:计算题.分析:根据社区里的高收入家庭户和高收入家庭户要抽取的户数,得到每个个体被抽到的概率,用求到的概率乘以低收入家庭户的户数,得到结果.解答:解:∵区现有480个住户,高收入家庭120户,抽取了6户∴每个个体被抽到的概率是∴该社区本次被抽取的总户数为=24,故选B.点评:本题考查分层抽样方法,这种题目类型是高考题目中一定会出现的题目,运算量不大,是一个必得分题目.3.(2014•湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,32考点:系统抽样方法.专题:计算题.分析:由系统抽样的特点知,将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,这时间隔一般为总体的个数除以样本容量.从所给的四个选项中可以看出间隔相等且组距为10的一组数据是由系统抽样得到的.解答:解:从50枚某型导弹中随机抽取5枚,采用系统抽样间隔应为=10,只有B答案中导弹的编号间隔为10,故选B.点评:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本.4.(2014•锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A.3000 B.6000 C.7000 D.8000考点:频率分布直方图.专题:概率与统计.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量.频率分布直方图中,小矩形的面积等于这一组的频率.底部周长小于100cm的矩形的面积求和乘以样本容量即可.解答:解:由图可知:底部周长小于100cm段的频率为(0.01+0.02)×10=0.3,则底部周长大于100cm的段的频率为1﹣0.3=0.7那么在这片树木中底部周长大于100cm的株树大约10000×0.7=7000人.故选C.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.5.(2014•许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100 B.120 C.150 D.200考点:频率分布直方图.专题:概率与统计.分析:根据直方图中的各个矩形的面积代表了频率,各个矩形面积之和为1,求出小长方形面积最大的一组的频率,再根据频数=频率×样本容量,求出频数即可.解答:解:∵直方图中的各个矩形的面积代表了频率,这5个小方形的面积由小到大构成等差数列{a n},a2=2a1,∴d=a1,a3=3a1,a4=4a1,a5=5a1根据各个矩形面积之和为1,则a1+a2+a3+a4+a5=15a1=1∴a1=,小长方形面积最大的一组的频率为a5=5×=根据频率=可求出频数=300×=100故选:A.点评:本题考查了频率、频数的应用问题,各小组频数之和等于样本容量,各小组频率之和等于1.6.(2014•云南模拟)已知一组数据如图所示,则这组数据的中位数是()A.27.5 B.28.5 C.27 D.28考点:众数、中位数、平均数.专题:概率与统计.分析:利用中位数的定义即可得出.解答:解:这组数据为16,17,19,22,25,27,28,30,30,32,36,40的中位数是=27.5.故选:A.点评:本题考查了中位数的定义及其计算方法,属于基础题.7.(2014•青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横轴n表示日期,纵轴x表示气温),记A、B两城市这6天的最低气温平均数分别为和,标准差分别为s A和s B,则它们的大小关系是()A.>,sA>s B B.>,sA<s BC.<,sA<s BD.<,sA>s B考点:众数、中位数、平均数.专题:概率与统计.分析:本题可以由折线图上的数据做出两个城市的平均气温和方差,也可以根据两个折线图的高低和变化的趋势即波动的大小,得到结果.解答:解:由折线图可知A市的平均气温是,B市的平均气温是=11.7,由折线图也可以看出B市的气温较高,可以看出B市的气温的变化不大,方差较小;故选D.点评:本题考查了折线图以及平均数和方差的求法;求两组数据的平均值和方差是研究数据常做的两件事,平均值反映数据的平均水平,而方差反映数据的波动大小,从两个方面可以准确的把握数据的情况.8.(2014•天门模拟)如图是根据变量x,y的观测数据(x i,y i)(i=1,2,…10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④考点:散点图.专题:计算题.分析:通过观察散点图可以知道,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.解答:解:由题图③可知,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,由题图④可知,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.故选D.点评:本题考查散点图,是通过读图来解决问题,考查读图能力,粗略的反应两个变量之间的关系,是不是线性相关,是正相关还是负相关.9.(2014•邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A.68.2 B.68 C.69 D.67考点:线性回归方程.专题:计算题;概率与统计.分析:由题意,将20代入可得68.2,故可能值为68.解答:解:由题意,y=0.68×20+54.6=68.2,又由表可知加工时间y(min)都是以整数记,故a可能为68,故选B.点评:本题考查了线性回归方程的应用及数学问题与实际问题的转化,属于基础题.10.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.120考点:频率分布直方图.专题:图表型.分析:根据频率分布直方图,成绩不低于60分的频率,然后根据频数=频率×总数可求出所求.解答:解:根据频率分布直方图,成绩不低于60(分)的频率为1﹣10×(0.005+0.015)=0.8.由于该校高一年级共有学生600人,利用样本估计总体的思想,可估计该校高一年级模块测试成绩不低于60(分)的人数为600×0.8=480人.故选B.点评:本小题主要考查频率、频数、统计和概率等知识,考查数形结合、化归与转化的数学思想方法,以及运算求解能力.11.(2013•陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.45考点:频率分布直方图.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,小矩形的面积等于这一组的频率,则所以面积和为1,建立等量关系即可求得长度在[25,30)内的频率即得.解答:解:设长度在[25,30)内的频率为a,根据频率分布直方图得:a+5×0.02+5×0.06+5×0.03=1⇒a=0.45.则根据频率分布直方图估计从该批产品中随机抽取一件,则其为二等品的概率为0.45.故选D.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.12.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.60考点:频率分布直方图.专题:概率与统计.分析:由已知中的频率分布直方图,我们可以求出成绩低于60分的频率,结合已知中的低于60分的人数是15人,结合频数=频率×总体容量,即可得到总体容量.解答:解:∵成绩低于60分有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20则成绩低于60分的频率P=(0.005+0.010)×20=0.3,又∵低于60分的人数是15人,则该班的学生人数是=50.故选B.点评:本题考查的知识点是频率分布直方图,结合已知中的频率分布直方图,结合频率=矩形的高×组距,求出满足条件的事件发生的频率是解答本题的关键.13.(2012•成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.70 户B.17 户C.56 户D.25 户考点:分层抽样方法.专题:概率与统计.分析:由分层抽样的计算方法:中等收入家庭的户数占总户数的比例再乘以要抽取的户数,即可得出答案.解答:解:由已知可得中等收入家庭中应抽选出的户数==56.故选C.点评:本题考查了分层抽样,掌握分层抽样的计算方法是解决问题的关键.14.(2012•泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A.15 B.16 C.17 D.18考点:分层抽样方法.专题:计算题.分析:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,由此解得x 的值.解答:解:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,解得x=18,故选D.点评:本题主要考查分层抽样的定义和方法,利用了总体中各层的个体数之比等于样本中对应各层的样本数之比,属于基础题.15.(2012•绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A.2人B.3人C.4人D.5人考点:分层抽样方法.专题:计算题.分析:先求出每个个体被抽到的概率,用该层的个体数乘以每个个体被抽到的概率,就等于该层应抽取的个体数.解答:解:每个个体被抽到的概率等于=,老年人中被抽取到参加健康检查的人数是40×=4,故选C.点评:本题主要考查分层抽样的定义和方法,用每层的个体数乘以每个个体被抽到的概率等于该层应抽取的个体数,属于基础题.二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m 的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?考点:频率分布直方图;频率分布表.专题:概率与统计.分析:(1)根据上表求出身高不低于1.65m且不高于1.71m的频率与不低于1.63m的频率;(2)将测量数据分组,求频数与频率,列出频率分布表,画出频率分布直方图;(3)根据图形得出正确的结论以及估计结果.解答:解:(1)根据上表得,身高不低于1.65m且不高于1.71m的频率是=≈0.567,∴约占总体的56.7%;不低于1.63m的频率是1﹣=1﹣0.15=0.85,约占总体的85%;(2)将测量数据分布6组,∴=0.033,∴组距是0.04,计算频数与频率,列出频率分布表,如下;分组频数频率156.5﹣160.5 7 0.11160.5﹣164.5 9 0.15164.5﹣168.5 15 0.25168.5﹣172.5 22 0.37172.5﹣176.5 6 0.10176.5﹣180.5 1 0.02合计60 1.00画出样本频率分布直方图,如图所示;(3)根据图形知,该校年满16周岁的男生在168.5﹣172.5内的人数所占的比例最大,如果年满16周岁的男生有360人,那么在这个范围的人数估计约为360×0.37=133人.点评:本题考查了频率分布直方图的应用问题,也考查了列表和画图的能力,解题时应根据图中数据进行有关的计算,是基础题.17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13求y关于x的回归方程=x+所表示的直线必经的点.考点:回归分析的初步应用.专题:计算题;概率与统计.分析:求平均值,回归直线必过样本点的中心.解答:解:==3,==8,故回归方程=x+所表示的直线必经过点(3,8).点评:本题考查了回归分析,回归直线必过样本点的中心,同时考查了平均数的求法,属于基础题.18.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取4次,绘制成茎叶图如图:甲乙9 7 78 1 2 8 535(Ⅰ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.考点:茎叶图;众数、中位数、平均数;极差、方差与标准差.专题:概率与统计.分析:(I)由茎叶图知甲乙两同学的成绩分别为:甲:82 81 79 88 乙:85 77 83 85.利用“列举法”及其古典概型的概率计算公式即可得出.(II)分别计算出甲乙的平均成绩及其方差即可得出.。
高三复习高中数学统计案例(有答案)
2015年高三复习高中数学统计案例(有答案)一.选择题(共18小题)1.(2014•四川)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读2.(2014•重庆)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性.=0.4x+2.3 =2x﹣2.4 C=﹣2x+9.5D.=﹣0.3x+4.4得到回归方程为=bx+a,则()4.(2014•唐山二模)用简单随机抽样的方法从含有100个个体的总体中依次抽取一个容量为5的样本,则个体m .C D.5.(2014•揭阳三模)某校高三一班有学生54人,二班有学生42人,现在要用分层抽样的方法从两个班抽出16人6.(2014•黄冈模拟)2014年3月,为了调查教师对第十二届全国人民代表大会二次会议的了解程度,安庆市拟采用分层抽样的方法从A,B,C三所不同的中学抽取60名教师进行调查.已知A,B,C学校中分别有180,270,7.(2014•湖北模拟)某学校用分层抽样的方法从三个年级抽取若干学生,调查“马年春节”学生参加社会实践活动情)8.(2014•闸北区三模)某初级中学领导采用系统抽样方法,从该校预备年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号,求得间隔数k==16,即每16人抽取一个人.在1~16中随机9.(2014•大连一模)某小礼堂有25排座位,每排有20个座位.一次心理讲座时礼堂中坐满了学生,讲座后为了10.(2014•江西模拟)月底,某商场想通过抽取发票的10%估计该月的销售总额.先将该月的全部销售发票存根进行了编号:1,2,3,…,然后拟采用系统抽样的方法获取一个样本.若从编号为1,2,…,10的前10张发票存根中随机抽取一张,然后再按系统抽样的方法依编号顺序逐次产生第二张、第三张、第四张、…,则抽样中产生的第11.(2014•福建模拟)为调查某校学生喜欢数学课的人数比例,采用如下调查方法:(1)在该校中随机抽取100名学生,并编号为1,2,3, (100)(2)在箱内放置两个白球和三个红球,让抽取的100名学生分别从箱中随机摸出一球,记住其颜色并放回;(3)请下列两类学生举手:(ⅰ)摸到白球且号数为偶数的学生;(ⅱ)摸到红球且不喜欢数学课的学生.13.(2014•安徽模拟)在样本的频率分布直方图中,共有11个小长方形,若中间一个长方形的面积等于其他十个小长方形面积的和的,且样本容量是160,则中间一组的频数为()14.(2014•江西模拟)在样本的频率分布直方图中,一共有m(m≥3)个小矩形,第3个小矩形的面积等于其余m﹣1个小矩形面积之和的,且样本容量为100,则第3组的频数是()15.(2014•许昌二模)在抽查产品尺寸的过程中,将尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组C D16.(2014•锦州二模)学校为了解学生在课外读物方面的支出情况,抽取了n个同学进行调查,结果显示这些同学的支出都在[10,50)(单位:元),其中支出在[30,50)(单位:元)的同学有67人,其频率分布直方图如图所示,则n的值为()17.(2014•浙江二模)如图是某班50位学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90)[90,100),则图中x的值等于()0.048C18.(2013•临汾模拟)某一个班全体学生参加物理测试,成绩的频率分布直方图如图,则该班的平均分估计是()二.解答题(共12小题)19.(2014•广东)随机观测生产某种零件的某工作厂25名工人的日加工零件个数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据1212(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.20.(2014•凉州区二模)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品,现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:(Ⅰ)分别估计用A配方,B配方生产的产品的优质品率;(Ⅱ)已知用B配方生成的一件产品的利润y(单位:元)与其质量指标值t的关系式为y=从用B配方生产的产品中任取一件,其利润记为X(单位:元),求X的分布列及数学期望.(以试验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)21.(2014•安徽)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300名学生每周平均体育运动时间的样本数据(单位:小时).(Ⅰ)应收集多少位女生的样本数据?(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4小时的概率;(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联附:K2=.22.(2014•辽宁)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表”;(Ⅱ)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.附:X2=23.(2014•烟台三模)某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果从中任取2人,求至少有1人的学历为研究生的概率;(Ⅱ)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取出1人,此人的年龄为50岁以上的概率为,求x,y的值.24.(2014•肇庆二模)为考察高中生的性别与是否喜欢数学课程之间的关系,在我市某普通中学高中生中随机抽取”?(2)若采用分层抽样的方法从不喜欢数学课的学生中随机抽取5人,则男生和女生抽取的人数分别是多少?(3)从(2)随机抽取的5人中再随机抽取3人,该3人中女生的人数记为ξ,求ξ的数学期望.25.(2014•仙游县模拟)如图所示是预测到的某地5月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择5月1日至5月13日中的某一天到达该市,并停留2天.(Ⅰ)求此人到达当日空气重度污染的概率;(Ⅱ)求此人在该市停留期间只有1天空气质量优良的概率;(Ⅲ)由图判断从哪天开始连续三天的空气质量指数方差最大?(结论不要求证明)26.(2014•唐山二模)某种水果的单个质量在500g以上视为特等品随机抽取1000个水果.结果有50个特等品.将这50个水果的质量数据分组,得到所示的频率分布表.(Ⅰ)估计该水果的质量不少于560g的概率;27.(2014•遵义二模)中华人民共和国《道路交通安全法》中将饮酒后违法驾驶机动车的行为分成两个档次:“酒后驾车”和“醉酒驾车”,其检测标准是驾驶人员血液中的酒精含量Q(简称血酒含量,单位是毫克/100毫升),当20≤Q≤80时,为酒后驾车;当Q>80时,为醉酒驾车.济南市公安局交通管理部门于2011年2月的某天晚上8点至11点在市区设点进行一次拦查行动,共依法查出了60名饮酒后违法驾驶机动车者,如图,为这60名驾驶员抽血检测后所得结果画出的频率分布直方图(其中Q≥140的人数计入120≤Q<140人数之内).(1)求此次拦查中醉酒驾车的人数;(2)从违法驾车的60人中按酒后驾车和醉酒驾车利用分层抽样抽取8人做样本进行研究,再从抽取的8人中任取3人,求3人中含有醉酒驾车人数x的分布列和期望.28.(2014•河南一模)某企业员工500人参加“学雷锋”志愿活动,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.6人,年龄在第1,2,3组的人数分别是多少?(Ⅲ)在(Ⅱ)的前提下,从这6人中随机抽取2人参加社区宣传交流活动,求至少有1人年龄在第3组的概率.29.(2014•大港区二模)某市为增强市民的环境保护意识,面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45],得到的频率分布直方图如图所示.(1)若从第3,4,5组中用分层抽样的方法抽取6名志愿者参广场的宣传活动,应从第3,4,5组各抽取多少名志愿者?(2)在(1)的条件下,该县决定在这6名志愿者中随机抽取2名志愿者介绍宣传经验,求第4组至少有一名志愿者被抽中的概率.30.(2014•太原二模)中华人民共和国《道路交通安全法》中将饮酒后违法驾驶机动车的行为分成两个档次:“酒后驾车”和“醉酒驾车”,其检测标准是驾驶人员血液中的酒精含量Q(简称血酒含量,单位是毫克/100毫升),当20≤Q≤80时,为“酒后驾车”;当Q>80时,为“醉酒驾车”某市公安局交通管理部门于2013年11月的某天晚上8点至11点在该市区解放路某处设点进行一次拦查行动,共依法查出了60名饮酒后违法驾驶机动车者,如图为这60名驾驶员抽血检测后所得结果画出的频率分布直方图(其中Q≥140的人数计入120≤Q<140人数之内).(Ⅰ)求此次拦查中“醉酒驾车”的人数;(Ⅱ)从违法驾车的60人中按“酒后驾车”和“醉酒驾车”利用分层抽样抽取8人做样本进行研究,再从抽取的8人中任取2人,求2人中其中1人为“酒后驾车”另1人为“醉酒驾车”的概率.参考答案与试题解析一.选择题(共18小题)1.(2014•四川)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读2.(2014•重庆)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性.=0.4x+2.3 =2x﹣2.4 C=﹣2x+9.5D.=﹣0.3x+4.4样本平均数=3.5得到回归方程为=bx+a,则()=5.5,∴=4.(2014•唐山二模)用简单随机抽样的方法从含有100个个体的总体中依次抽取一个容量为5的样本,则个体m .C D.个个体,某个个体被抽到的概率为×.5.(2014•揭阳三模)某校高三一班有学生54人,二班有学生42人,现在要用分层抽样的方法从两个班抽出16人=×=9×6.(2014•黄冈模拟)2014年3月,为了调查教师对第十二届全国人民代表大会二次会议的了解程度,安庆市拟采用分层抽样的方法从A,B,C三所不同的中学抽取60名教师进行调查.已知A,B,C学校中分别有180,270,7.(2014•湖北模拟)某学校用分层抽样的方法从三个年级抽取若干学生,调查“马年春节”学生参加社会实践活动情)故有=,,解得8.(2014•闸北区三模)某初级中学领导采用系统抽样方法,从该校预备年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号,求得间隔数k==16,即每16人抽取一个人.在1~16中随机9.(2014•大连一模)某小礼堂有25排座位,每排有20个座位.一次心理讲座时礼堂中坐满了学生,讲座后为了10.(2014•江西模拟)月底,某商场想通过抽取发票的10%估计该月的销售总额.先将该月的全部销售发票存根进行了编号:1,2,3,…,然后拟采用系统抽样的方法获取一个样本.若从编号为1,2,…,10的前10张发票存根中随机抽取一张,然后再按系统抽样的方法依编号顺序逐次产生第二张、第三张、第四张、…,则抽样中产生的第11.(2014•福建模拟)为调查某校学生喜欢数学课的人数比例,采用如下调查方法:(1)在该校中随机抽取100名学生,并编号为1,2,3, (100)(2)在箱内放置两个白球和三个红球,让抽取的100名学生分别从箱中随机摸出一球,记住其颜色并放回;(3)请下列两类学生举手:(ⅰ)摸到白球且号数为偶数的学生;(ⅱ)摸到红球且不喜欢数学课的学生.,摸到白球的概率为=0.4×0.4=2013.(2014•安徽模拟)在样本的频率分布直方图中,共有11个小长方形,若中间一个长方形的面积等于其他十个小长方形面积的和的,且样本容量是160,则中间一组的频数为()14.(2014•江西模拟)在样本的频率分布直方图中,一共有m(m≥3)个小矩形,第3个小矩形的面积等于其余m ﹣1个小矩形面积之和的,且样本容量为100,则第3组的频数是()15.(2014•许昌二模)在抽查产品尺寸的过程中,将尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组C D,列出方程求出∴∴=16.(2014•锦州二模)学校为了解学生在课外读物方面的支出情况,抽取了n个同学进行调查,结果显示这些同学的支出都在[10,50)(单位:元),其中支出在[30,50)(单位:元)的同学有67人,其频率分布直方图如图所示,则n的值为()根据频率计算公式,可得=0.6717.(2014•浙江二模)如图是某班50位学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90)[90,100),则图中x的值等于()0.048C18.(2013•临汾模拟)某一个班全体学生参加物理测试,成绩的频率分布直方图如图,则该班的平均分估计是()二.解答题(共12小题)19.(2014•广东)随机观测生产某种零件的某工作厂25名工人的日加工零件个数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据(1)确定样本频率分布表中n1,n2,f1和f2的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.为事件,的概率为=,),的概率为.20.(2014•凉州区二模)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品,现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:(Ⅱ)已知用B配方生成的一件产品的利润y(单位:元)与其质量指标值t的关系式为y=从用B配方生产的产品中任取一件,其利润记为X(单位:元),求X的分布列及数学期望.(以试验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)配方生产的产品中优质的频率为配方生产的产品中优质品的频率为21.(2014•安徽)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300名学生每周平均体育运动时间的样本数据(单位:小时).(Ⅰ)应收集多少位女生的样本数据?(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4小时的概率;(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联附:K2=.×=90≈22.(2014•辽宁)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表”;(Ⅱ)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.附:X2=人,共有名喜欢甜品,有=3人喜欢甜品的概率23.(2014•烟台三模)某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果从中任取2人,求至少有1人的学历为研究生的概率;(Ⅱ)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取出1人,此人的年龄为50岁以上的概率为,求x,y的值.∴人的教育程度为研究生的概率为)解:依题意得:∴24.(2014•肇庆二模)为考察高中生的性别与是否喜欢数学课程之间的关系,在我市某普通中学高中生中随机抽取”?(2)若采用分层抽样的方法从不喜欢数学课的学生中随机抽取5人,则男生和女生抽取的人数分别是多少?(3)从(2)随机抽取的5人中再随机抽取3人,该3人中女生的人数记为ξ,求ξ的数学期望.)∵)男生抽取的人数有:(人)∵,,1 2 3的数学期望为25.(2014•仙游县模拟)如图所示是预测到的某地5月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择5月1日至5月13日中的某一天到达该市,并停留2天.(Ⅰ)求此人到达当日空气重度污染的概率;(Ⅱ)求此人在该市停留期间只有1天空气质量优良的概率;(Ⅲ)由图判断从哪天开始连续三天的空气质量指数方差最大?(结论不要求证明)…=26.(2014•唐山二模)某种水果的单个质量在500g以上视为特等品随机抽取1000个水果.结果有50个特等品.将这50个水果的质量数据分组,得到所示的频率分布表.(Ⅰ)估计该水果的质量不少于560g的概率;,结合表格易得所要求的数据;=,解出+=0.16+0.04=0.2,解得27.(2014•遵义二模)中华人民共和国《道路交通安全法》中将饮酒后违法驾驶机动车的行为分成两个档次:“酒后驾车”和“醉酒驾车”,其检测标准是驾驶人员血液中的酒精含量Q(简称血酒含量,单位是毫克/100毫升),当20≤Q≤80时,为酒后驾车;当Q>80时,为醉酒驾车.济南市公安局交通管理部门于2011年2月的某天晚上8点至11点在市区设点进行一次拦查行动,共依法查出了60名饮酒后违法驾驶机动车者,如图,为这60名驾驶员抽血检测后所得结果画出的频率分布直方图(其中Q≥140的人数计入120≤Q<140人数之内).(1)求此次拦查中醉酒驾车的人数;(2)从违法驾车的60人中按酒后驾车和醉酒驾车利用分层抽样抽取8人做样本进行研究,再从抽取的8人中任取3人,求3人中含有醉酒驾车人数x的分布列和期望.===28.(2014•河南一模)某企业员工500人参加“学雷锋”志愿活动,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.(Ⅱ)现在要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,年龄在第1,2,3组的人数分别是多少?(Ⅲ)在(Ⅱ)的前提下,从这6人中随机抽取2人参加社区宣传交流活动,求至少有1人年龄在第3组的概率.29.(2014•大港区二模)某市为增强市民的环境保护意识,面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45],得到的频率分布直方图如图所示.(1)若从第3,4,5组中用分层抽样的方法抽取6名志愿者参广场的宣传活动,应从第3,4,5组各抽取多少名志愿者?(2)在(1)的条件下,该县决定在这6名志愿者中随机抽取2名志愿者介绍宣传经验,求第4组至少有一名志愿者被抽中的概率.,=.30.(2014•太原二模)中华人民共和国《道路交通安全法》中将饮酒后违法驾驶机动车的行为分成两个档次:“酒后驾车”和“醉酒驾车”,其检测标准是驾驶人员血液中的酒精含量Q(简称血酒含量,单位是毫克/100毫升),当20≤Q≤80时,为“酒后驾车”;当Q>80时,为“醉酒驾车”某市公安局交通管理部门于2013年11月的某天晚上8点至11点在该市区解放路某处设点进行一次拦查行动,共依法查出了60名饮酒后违法驾驶机动车者,如图为这60名驾驶员抽血检测后所得结果画出的频率分布直方图(其中Q≥140的人数计入120≤Q<140人数之内).(Ⅰ)求此次拦查中“醉酒驾车”的人数;(Ⅱ)从违法驾车的60人中按“酒后驾车”和“醉酒驾车”利用分层抽样抽取8人做样本进行研究,再从抽取的8人中任取2人,求2人中其中1人为“酒后驾车”另1人为“醉酒驾车”的概率.种,。
统计案例(精讲)(提升版)(原卷版)
8.5 统计案例(精讲)(提升版)思维导图考点一独立性检验【例1】(2022·吉林·梅河口市第五中学高三开学考试)某中学准备组建“文科”兴趣特长社团,由课外活动小组对高一学生进行了问卷调查,问卷共100道题,每题1分,总分100分,该课外活动小组随机抽取了100名学生的问卷成绩(单位:分)进行统计,将数据按照[0,20),[20,40),[40,60),[60,80),[80,100]分成5组,绘制的频率分布直方图如图所示,若将不低于60分的称为“文科方向”学生,低于60分的称为“理科方向”学生.(1)根据已知条件完成下面2×2列联表,并据此判断是否有99.5%的把握认为“文科方向”与性别有关?理科方向文科方向总计男40女45考点呈现例题剖析总计 1001人,共抽取4次,记被抽取的4人中“文科方向”的人数为X ,若每次抽取的结果是相互独立的,求X 的分布列和数学期望.参考公式:()()()()22()n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.参考临界值:()2P k αχ=0.10 0.05 0.025 0.010 0.005 0.001k2.7063.841 5.024 6.635 7.879 10.828【一隅三反】1.(2022·白山模拟)十三届全国人大四次会议表决通过了关于国民经济和社会发展第十四个五年规划和2035年远景目标纲要的决议,决定批准这个规划纲要,纲要指出:“加强原创性引领性科技攻关”.某企业集中科研骨干,攻克系列“卡脖子”技术,已成功实现离子注入机全谱系产品国产化,包括中束流、大束流、高能、特种应用及第三代半导体等离子注入机,工艺段覆盖至28nm,为我国芯片制造产业链补上重要一环,为全球芯片制造企业提供离子注入机一站式解决方案.此次技术的突破可以说为国产芯片的制造做出了重大贡献.该企业使用新技术对某款芯片进行试生产,在试产初期,生产一件该款芯片有三道工序,每道工序的生产互不影响,这三道工序的次品率分别为118,119,120.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.()2P K k≥0.0500.0100.0050.001 k 3.841 6.6357.87910.828(①P①100X(2)某手机生产厂商将该款芯片投入到某新款手机上使用,并对部分芯片做了技术改良,推出了两种型号的手机,甲型号手机采用没有改良的芯片,乙型号手机采用改良了的芯片,现对使用这两种型号的手机用户进行回访,就他们对开机速度进行满意度调查.据统计,回访的100名用户中,使用甲型号手机的有30人,其中对开机速度满意的有15人;使用乙型号手机的有70人,其中对开机速度满意的有55人.完成下列22⨯列联表,并判断是否有99.5%的把握认为该项技术改良与用户对开机速度的满意度有关.甲型号乙型号合计满意不满意合计2.(2022·陕西咸阳·三模(理))2022年北京冬奥组委发布的《北京2022年冬奥会和冬残奥会经济遗产报告(2022)》显示,北京冬奥会已签约45家赞助企业,冬奥会赞助成为一项跨度时间较长的营销方式.为了解该45家赞助企业每天销售额与每天线上销售时间之间的相关关系,某平台对45家赞助企业进行跟踪调查,其中每天线上销售时间不少于8小时的企业有20家,余下的企业中,每天的销售额不足30万元的企业占35,统计后得到如下22⨯列联表:销售额不少于30万元销售额不足30万元合计线上销售时间不少于8小时 17 20 线上销售时间不足8小时合计45售时间有关?(2)按销售额在上述赞助企业中采用分层抽样方法抽取5家企业.在销售额不足30万元的企业中抽取时,记“抽到线上销售时间不少于8小时的企业数”为X ,求X 的分布列和数学期望. 附: ()20P K k ≥0.050 0.010 0.001 0k3.841 6.635 10.828参考公式:()()()()2 n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.考点二 线性回归方程【例2-1】(2022·齐齐哈尔模拟)某单位为了解夏季用电量与月份的关系,对本单位2021年5月份到8月份的日平均用电量y (单位:千度)进行了统计分析,得出下表数据:月份(x )5 6 7 8 日平均用电量(y )1.93.4t7.11.7877ˆ.0y x =-t 的值为( )A .5.8B .5.6C .5.4D .5.2【例2-2】(2022·湖南模拟)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴.为助力乡村振兴,某电商平台为某地的农副特色产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:单价x (元/件) 8 8.2 8.4 8.6 8.8 9 销量y (万件)908483807568附:参考公式:回归方程ˆˆˆybx a =+,其中()()()iii ii 1i 1222iii 1i 1ˆnnx x y y x y nxyb x x xnx ====---==--∑∑∑∑,ˆˆay bx =-. 参考数据:614066i ii x y==∑,621434.2i i x ==∑.(1)(i )根据以上数据,求y 关于x 的线性回归方程;(ii )若该产品成本是7元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润.(2)为了解该产品的价格是否合理,在试销平台上购买了该产品的顾客中随机抽了400人,阅读“购买后的评价”得知:对价格满意的有300人,基本满意的有50人,不满意的有50人.为进一步了解顾客对该产品价格满意度形成的原因,在购买该产品的顾客中随机抽取4人进行电话回访,记抽取的4人中对价格满意的人数为随机变量X ,求随机变量X 的分布列和数学期望.(视频率为相应事件发生的概率)【一隅三反】1.(2022·安徽三模)对某位同学5次体育测试的成绩(单位:分)进行统计得到如下表格:第x 次 1 2 3 4 5 测试成绩y3940484850根据上表,可得关于的线性回归方程为ˆ3ˆy x a =+,下列结论不正确的是( )A .ˆ36a= B .这5次测试成绩的方差为20.8 C .y 与x 的线性相关系数0r < D .预测第6次体育测试的成绩约为542.(2022·安徽模拟)新冠疫情期间,口罩的消耗量日益增加,某药店出于口罩进货量的考虑,连续9天统计了第i (i 1239)x =,,,,天的口罩的销售量i y (百件),得到的数据如下:99i i i=1i=145171x y ==∑∑,,()99922ii i i i=1i=1i=1312528510953x x y y y ==-=∑∑∑,,. 参考公式:相关系数()()()()iii=122iii=1i=1nnnx x y y r x x y y --=--∑∑∑数据()i i ()i 123x y n =,,,,,,其回归直线ˆˆˆy bx a =+的斜率和截距的最小二乘估计分别为()()()iii i1222i i11ˆˆˆnn i inni i x x y y x y nxybay bx x x xnx ===---===---∑∑∑∑, (1)若用线性回归模型ˆˆˆybx a =+拟合y 与x 之间的关系,求该回归直线的方程; (2)统计学家甲认为用(1)中的线性回归模型(下面简称模型1)进行拟合,不够精确,于是尝试使用非线性模型(下面简称模型2)得到i x 与i y 之间的关系,且模型2的相关系数20989r =.,试通过计算说明模型1,2中,哪一个模型的拟合效果更好. 3.(2022·湖南模拟)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴.为助力乡村振兴,某电商平台为某地的农副特色产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:单价x (元/件) 8 8.2 8.4 8.6 8.8 9 销量y (万件)908483807568附:参考公式:回归方程ˆˆˆybx a =+,其中()()()iiiii 1i 1222iii 1i 1ˆnnx x y y x y nxyb x x xnx ====---==--∑∑∑∑,ˆˆay bx =-. 参考数据:614066i ii x y==∑,621434.2i i x ==∑.(1)(i )根据以上数据,求y 关于x 的线性回归方程;(ii )若该产品成本是7元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润.(2)为了解该产品的价格是否合理,在试销平台上购买了该产品的顾客中随机抽了400人,阅读“购买后的评价”得知:对价格满意的有300人,基本满意的有50人,不满意的有50人.为进一步了解顾客对该产品价格满意度形成的原因,在购买该产品的顾客中随机抽取4人进行电话回访,记抽取的4人中对价格满意的人数为随机变量X,求随机变量X的分布列和数学期望.(视频率为相应事件发生的概率)考点三非线性回归方程【例3】(2022·福建·三明一中模拟预测)当前,新一轮科技革命和产业变革蓬勃兴起,以区块链为代表的新一代信息技术迅猛发展,现收集某地近5年区块链企业总数量相关数据,如下表年份20172018201920202021编号x12345企业总数量y(单位:千个) 2.156 3.7278.30524.27936.224(1)根据表中数据判断,y a bx=+与e dxy c=(其中 2.71828e=…为自然对数的底数),哪一个回归方程类型适宜预测未来几年我国区块链企业总数量?(给出结果即可,不必说明理由),并根据你的判断结果求y关于x的回归方程;(2)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛.比赛规则如下:①每场比赛有两个公司参加,并决出胜负;①每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;①在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司获得此次信息化比赛的“优胜公司”.已知在每场比赛中,甲胜乙的概率为12,甲胜丙的概率为13,乙胜丙的概率为35,若首场由甲乙比赛,求甲公司获得“优胜公司”的概率.参考数据:5174.691i i y ==∑,51312.761i i i x y ==∑,5110.980i i z ==∑,5140.457i i i x z ==∑(其中ln z y =). 附:样本(),(1,2,,)i i x y i n =的最小二乘法估计公式为1221ˆni ii nii x y nx ybxnx==-=-∑∑,ˆa y bx=-.【一隅三反】1.(2022·山西二模)数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,下表为2017-2021年中国在线直播用户规模(单位:亿人),其中2017年-2021年对应的代码依次为1-5.年份代码x 1 2 3 4 5 市场规模y3.984.565.045.866.36参考数据: 5.16y =, 1.68v =,145.10i ii v y==∑,其中i i v x =.参考公式:对于一组数据()11v y ,,()22v y ,,…,()n n v y ,,其回归直线ˆˆˆybv a =+的斜率和截距的最小二乘估计公式分别为1221ˆni ii ni i v y nvybv nv ==-=-∑∑,ˆˆay bv =-. (1)由上表数据可知,可用函数模型ˆˆyx a =拟合y 与x 的关系,请建立y 关于x 的回归方程(ˆa ,ˆb 的值精确到0.01);(2)已知中国在线直播购物用户选择在品牌官方直播间购物的概率为p ,现从中国在线直播购物用户中随机抽取4人,记这4人中选择在品牌官方直播间购物的人数为X ,若()()34P X P X ===,求X 的分布列与期望.2.(2022·广东广州·一模)人们用大数据来描述和定义信息时代产生的海量数据,并利用这些数据处理事务和做出决策,某公司通过大数据收集到该公司销售的某电子产品1月至5月的销售量如下表. 月份x1 2 3 4 5 销售量y (万件)4.95.86.88.310.2该公司为了预测未来几个月的销售量,建立了y 关于x 的回归模型:ˆv . (1)根据所给数据与回归模型,求y 关于x 的回归方程(ˆu 的值精确到0.1);(2)已知该公司的月利润z (单位:万元)与x ,y 的关系为z x x=,根据(1)的结果,问该公司哪一个月的月利润预报值最大? 参考公式:对于一组数据()()()1122,,,,,,n n x y x y x y ,其回归直线ˆˆˆy bx a =+的斜率和截距的最小二乘估计公式分别为()()()121ˆniii nii x x y y bx x ==--=-∑∑,ˆˆay bx =-.11 / 113.(2022·广东肇庆·二模)下表是我国从2016年到2020年能源消费总量近似值y (单位:千万吨标准煤)的数据表格: 年份2016 2017 2018 2019 2020 年份代号x1 2 3 4 5 能源消费总量近似值y (单位:千万吨标准煤) 442 456 472 488 498以x 为解释变量,y 为预报变量,若以11为回归方程,则相关指数210.9946R ≈,若以22ˆln ya b x =+为回归方程,则相关指数220.9568R ≈. (1)判断11ˆyb x a =+与22ˆln y a b x =+哪一个更适宜作为能源消费总量近似值y 关于年份代号x 的回归方程,并说明理由;(2)根据(1)的判断结果及表中数据,求出y 关于年份代号x 的回归方程.参考数据:512356i i y ==∑,517212i i i x y ==∑.参考公式:回归方程ˆˆˆybx a =+中斜率和截距的最小二乘估计公式分别为:()()()1122211ˆn ni i i ii i n n ii i i x x y y x y nxy b x x x nx ====---==--∑∑∑∑,ˆˆa y bx =-.。
高中数学:统计与统计案例练习
高中数学:统计与统计案例练习一、选择题1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100 名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1 : 3 : 5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为()领率组距A. 200 C. 400 0.0350.015B. 240D. 48010平均每周上网时间(h)解析:选C 设频率分布直方图中从左到右前3个小矩形的面积分别为A3K5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)X2 = 0.1.由于频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即尸=0.1.所以平均每周上网时间少于4h的学生所占比例为尸+3P=0.4,由此估计学生人数为0.4X1 000 =400.2. AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0〜50),二级良(51〜100),三级轻度污染(101〜150),四级中度污染(151〜200),五级重度污染(201〜300),六级严重污染(大于300).如图是昆明市2021年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2021年4月份空气质量优的天数为 ()A. 3B. 4C. 12D. 2142解析:选c 从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为 1 V.Z 22所以估计昆明市2021年4月份空气质量为优的天数为30X5=12,应选C.3.〔成都模拟〕某城市收集并整理了该市2021年1月份至10月份各月最低气温与最高气 温〔单位:C 〕的数据,绘制了下面的折线图.该城市各月的最低气温与最高气温具有较好的线性关系,那么根据折线图,以下结论错误 的是〔〕A.最低气温与最高气温为正相关B. 10月的最高气温不低于5月的最高气温C.月温差〔最高气温减最低气温〕的最大值出现在1月D.最低气温低于0C 的月份有4个解析:选D 在A 中,最低气温与最高气温为正相关,故A 正确;在B 中,10月的最高气温 不低于5月的最高气温,故B 正确;在C 中,月温差〔最高气温减最低气温〕的最大值出现在1月, 故C 正确:在D 中,最低气温低于0℃的月份有3个,故D 错误.应选D.4 .〔承德模拟〕为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取 了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体 中倾向选择生育二胎与倾向选择不生育二胎的人数比例图〔如下图〕,其中阴影局部表示倾向 选择生育二胎的对应比例,那么以下表达中错误的选项是〔〕A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关♦最高气温 ♦最低气温C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数解析:选C 由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关;倾向选择不 生育二胎的人员中,农村户籍人数少于城镇户籍人数;倾向选择生育二胎的人员中,男性人数为 60X60% =36,女性人数为40X60%=24,不相同.应选C.5 .(石家庄模拟)某学校48两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过 茎叶图比拟两个班兴趣小组成绩的平均值及标准差.3 4 28 8 4 6 8 65152①A 班兴趣小组的平均成绩高于B 班兴趣小组的平均成绩; ②B 班兴趣小组的平均成绩高于A 班兴趣小组的平均成绩; ③A 班兴趣小组成绩的标准差大于B 班兴趣小组成绩的标准差;@B 班兴趣小组成绩的标准差大于A 班兴趣小组成绩的标准差. 其中正确结论的编号为()A.①④C. ®®其方差为白义[(53—78尸+(62—78/ +…+ (95—78)2]=121.6, 那么其标准差为'121.6%11.03;45+48+5H -------- F91B 班兴趣小组的平均成成为'」=66,其方差为表义[(45—66)2+(48 - 66)2 + ... + (91-66)2] =169.2, 那么其标准差为1169.2%13.01.应选A.6 .某商场对某一商品搞活动,该商品每一个的进价为3元,销售价为8元,每天售出的 第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如下图,设M 个)为每天商 品的销量,M 元)为该商场每天箱售这种商品的利润.从日利润不少于96元的几天里任选2天, 那么选出的这2天日利润都是97元的概率为()4 5 5 1 6 2 7 38班8 3 6 4 5 3 4 02B.②③D.①③解析:选A A 班兴趣小组的平均成绩为 53+62+64+…+92+95--------------- ---------------- =785x, x=18, 19, y =<l95+(x-19)(4-3), x=20, 21, J5x, x=18, 19, 即 L176+x, x=20, 21.当日销量不少于20个时,日利泗不少于96元, 当日销量为20个时,日利润为96元, 当日销量为21个时,日利润为97元,日利泗为96元的有3天,记为日利泗为97元的有2天,记为人丛从中任选2天有 (.4),(〃石),(.力),(.1),3/),(48),3«),(c4),(.,8),(48),共 10 种情况.其中选出的这2天日利泗都是97元的有(A,8)1种情况. 故所求概率为关.应选B. 二、填空题7 .某小卖部销售某品牌饮料的零售价与销量间的关系统计如下:单价x/元 3.0 3.2 3.4 3.6 3.8 4.0 销量w 瓶504443403528x,y 的关系符合回归方程£=£+2其中分=-20.假设该品牌饮料的进价为2元,为使利润 最大,零售价应定为 元.解析:依题意得:x =3.5, y =40,A所以.=40—(- 20)X3.5=110,所以回归直线方程为f=-20x+110,利润 L = (A —2)(-20A + 110)= -201+ 150x-220,B 选• •1 - 9 1 - 5 A.C 解BioD.g由题意知频数(天)0 18 19 20 2 俏量〔个〕所以x=* = 3.75元时,利润最大.答案:3.758.某高校调查了200名学生每周的自习时间(单位:小时),制成了如下图的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是.解析:设所求的人数为〃,由频率分布直方图,自习时间不少于22.5小时的频率为(0.04+0.08 +0.16) X 2.5=0.7, n=0.7 X 200=140.答案:1409.为比拟甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:C) 制成如下图的茎叶图,甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,那么甲地该月11时的平均气温的标准差为.甲9 8 2 62 m 03 I解析:甲地该月11时的气温数据(单位:℃)为28,29,30,30+〃?,32;乙地该月11时的气温数据(单位:℃)为26,28,29,31,31,那么乙地该月11时的平均气温为(26+28+29+31+31计5 = 29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m + 32)+5 = 30,解得〃?=1,那么甲地该月11时的平均气温的标准差为嗝义[(28 - 30产+(29 - 30)2+(30 - 30/+(31 - 30/+(32 - 30户]=\(2.答案:^2三、解做题10.某篮球运发动的投篮命中率为50%,他想提升自己的投篮水平,制定了一个夏季练习计划,为了了解练习效果,执行练习前他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为463执行练习后也统计了10场比赛的得分,茎叶图如下图:0 8 91 2 4 4 5 6 82 1 3(1)请计算该篮球运发动执行练习后统计的10场比赛得分的中位数、平均得分与方差;⑵如果仅从执行练习前后统计的各10场比赛得分数据分析,你认为练习方案对该运发动的投篮水平的提升是否有帮助?为什么?解:(1)练习后得分的中位数为上芋=14.5;平均得分为8+9+12+14+14+15+16+18 + 21+23= 15:10方差为击义[(8—15)2 + (9 — 15>+(12 —15>+(14 — 15)2+(14 — 15> + (15 —15>+(16 — 15产+(18-15)2+(21-15)2+(23 —15)2]=20.6.(2)尽管中位数练习后比练习前稍小,但平均得分一样,练习前方差20.6小于练习前方差46.3, 说明练习后得分稳定性提升了(阐述观点合理即可),这是投篮水平提升的表现.故此练习方案对该篮球运发动的投篮水平的提升有帮助.11.(西安八校联考)在2021年俄罗斯世界杯期间,莫斯科的局部餐厅销售了来自中国的小龙虾,这些小龙虾均标有等级代码.为得到小龙虾等级代码数值x与销售单价y(单位:元)之间的关系,经统计得到如下数据:⑴销售单价),与等级代码数值x之间存在线性相关关系,求),关于x的线性回归方程(系数精确到0.1);(2)假设莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?参考公式:对于一组数据(xi1 ),3,光),…其回归直线f=源+2的斜率和截距的最小2Xyi一〃x y八 '। A — A——二乘估计分别为Z? = ----------------- a= y —b x .n _Xxr-n x 26 6参考数据:2>»=8 440, 2e = 25 564.—38+48 + 58 + 68 + 78 + 88解:(1)由题意,得x -■= 63,- 16.8+18.8+20.8 + 22.8 + 24+25.8 _y = 6 =21.5,yA_8 440 - 6X63X21.5〜h = ~~6Z—=25 564—6X63X63「026 A 2A — A 一a= y -bx =21.5-0.2X63 = 8.9.故所求线性回归方程为f=0.2x+8.9.⑵由(1)知,当%=98 时,>=0.2X98+8.9=28.5.・•・估计该等级的中国小龙虾销售单价为28.5元.12.(长沙模拟)某职称晋级评定机构对参加某次专业技术测试的100人的成绩进行了统计, 绘制的频率分布直方图如下图.规定80分以上者晋级成功,否那么晋级失败(总分值为100分).(1)求图中.的值;(2)估计该次测试的平均分不(同一组中的数据用该组的区间中点值代表);(3)根据条件完成下面2X2列联表,并判断能否有85%的把握认为“晋级成功〞与性别有关.P(K?2k)0.40 0.25 0.15 0.1()0.050.025k0.708 1.323 2.072 2.706 3.841 5.024解:(1)由频率分布直方图中各小长方形面积总和为1,得(2.+ 0.020+0.03.+0.040)义10=1,解得〃=0...5.⑵由频率分布直方图知洛小组的中点值依次是55,65,75,85,95, 对应的频率分别为0.05.30,0.40,0.20.05,那么估计该次测试的平均分为 x = 55X0.05 + 65X0.30 + 75X0.40 + 85X0.20 + 95X0.05 = 74(分). ⑶由频率分布直方图知,晋级成功的频率为0.20+0.05=0.25, 故晋级成功的人数为100X0.25 = 25,填写2X2列联表如下:晋级成功 晋级失败合计男 16 34 50 女 9 41 50 合计2575100100X(16X41 ——25X75X50X50^2,613>2.072,所以有85%的把握认为“晋级成功〞与性别有关.1 .为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单 位:小时)如下:248 256 232 243 188 268 278 266 289 312 274296 288 302 295 228 287 217 329 283K 2=n(acl-bc)2(1)完成下面的频率分布表,并作出频率分布直方图;(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时;(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.解:(1)频率分布表及频率分布直方图如下所示:0.0100 ——⑵由题意可得8乂(0.30+0.10+0.05) = 3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x =190X0.05 + 210X0.05 + 230X0.10 + 250X0.15 + 270X0.20 + 290X0.30 + 310X0.10 + 330X0.05 = 269(小时),所以样本的平均无故障连续使用时限为269小时.2 .海水养殖场进行某水产品的新、旧网箱养殖方法的产量比照,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg 〞,估计A 的概率;⑵填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量V50 kg箱产量250 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比拟. 附:P (心2)0.050 0.010 0.001 k3.841 6.635 10.8280.01500.0125频率 仇距0.0075 0.0050 0.0025.厂工丁丁丁丁厂!无故障连续使用时用/小时新养殖法、n(ad-bc)1 _ .K-= . , , ,,其中〃=a+/?+c+d.(a+Z?)(c 十d)(a十c)(Z?+d)解:⑴旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)X5=0.62.因此,事件A的概率估计值为0.62.⑵根据箱产量的频率分布直方图得到联表:K2=---------- -------------------- 15 705100X100 X 96X104由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图说明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.3.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得x =+£即=9.97,5=、*ZG L x )21 /=1 \ / 1O/=1/ 1 16 _ / 16 16 _=、/讳16 X 2比0.212, / L G-8.5)2^ 18.439,Z (x,- x )(L8.5)=—2.78,其中为为抽取的第i个零件的尺寸,i= 1,2, (16)(1)求⑶,i)(i= 12…,16)的相关系数二并答复是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(假设加V0.25,那么可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(刀-35,7 +3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(7 -35,7 +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(H,v)(i = 12…4的相关系数£(X,-7)(57-7)r=I ______/ / ・、/(),008公丫0・09・、/ £ d )2、/ £ 8 - 5 )216 _Z (XL x )(/—8.5)尸1解:(1)由样本数据得8,i)(i= 1,2,…,16)的相关系数为r= --------- /--- 1/16 _ / 16、/ Z (即- X C-8.5)2 -2.78剔除第13个数据,剩下数据的样本方差为aX 〔1 591.134 —9.22?—15X 10.022〕=0.008,A Q 这条生产线当天生产的零件尺寸的标准差的估计值为廊而比0.09.4.〔昆明模拟〕〞工资条里显红利,个税新政入民心〞.随着2021年新年钟声的敲响,我国 自1980年以来,力度最大的一次个人所得税〔简称个税〕改革迎来了全面实施的阶段.某IT 从业 者为了解自己在个税新政下能享受多少税收红利,绘制了他在26〜35岁〔2021〜2021年〕之间各 年的月平均收入〕,〔单位:千元〕的散点图:20・・・・ 16- ・ , 12- ., 8 ■ •4°123456789 io"年龄代码工注:年龄代码1~10分别对应年的26〜35岁⑴由散点图知,可用回归模型y=h\n x+a 拟合〕,与x 的关系,试根据有关数据建立〕,关于x 的回归方程;〔2〕如果该IT 从业者在个税新政下的专项附加扣除为3 000元/月,试利用〔1〕的结果,将月平 均收入视为月收入,根据新旧个税政策,估计他36岁时每个月少缴纳的个人所得税.1010 10 _10_ _ 10附注:参考数据:= 55,2〕〉= 155.5,N 〔即一x 〕2 =82.5,2 — x〕〔F — y 〕 = 94.9,26= i=li=li=lJ =1io _ io _ _15.1,2 缶- 1〕2=4.84,£〔力一 t 〕〔yi- y 〕 =242其中"=ln 为;取 In 11 =24,In 36=361=1 /=1参考公式:回归方程.=筋+味中斜率和截距的最小二乘估计分别为公= n ______ _X 〔出一〃〕〔.- V 〕 曰 A - A — -------------------------- \a= v —b u .Z 〔3一 〃 〕2月平均收入y千元解:(1)令 f=lnx,那么 y=bf+a10__Z & -,)()L y)24.2, b ~ ~__Z _痴_5ze —)2r=l10Zu-_2__155.5-_2_=而=-^-=15.55, t =苗A — A —a= y —b t = 15.55 —5X 1.51=8,所以〕,关于/的回归方程为〕,=5/+8.1015.1 lo"=L51由于/=lnx,所以y关于x的回归方程为y=51nx+8.⑵由⑴得,该IT从业者36岁时月平均收入为y=51n 11+8 = 5X2.4+8 = 20〔千元〕.旧个税政策下每个月应缴纳的个人所得税为1 500X3%+3 000X10%+4 500X20%+〔20 000-3 500-9 000〕X25% = 3 120〔元〕.新个税政策下每个月应缴纳的个人所得税为3 000X3%+〔20 000-5 OOO-3OOO-3 000〕X 10%=990〔元〕.故根据新旧个税政策,该IT从业者36岁时每个月少缴纳的个人所得税为3 120-990=2 130(70).I— 0 180.212X716X18.439 ',由于lrlV0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于7 =9.97,产0.212,由样本数据可以看出抽取的第13个零件的尺寸在(T—3s,7 + 3s)以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为右义(16义9.97—9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.162X?=16X0.212I2+16X9.972^1 591.134,。
厦门市一中选修1-2第一章《统计案例》测试卷(有答案解析)
一、选择题1.某人射击一次命中目标的概率为12,且每次射击相互独立,则此人射击 7次,有4次命中且恰有3次连续命中的概率为( ) A .3761()2CB .2741()2AC .2741()2CD .1741()2C2.为了解某班学生喜爱打篮球是否与性别有关,对该班60名学生进行问卷调查,得到如下图所示的22⨯列联表,则至少有( )的把握认为喜爱打篮球与性别有关.附参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.A .99.9%B .99.5%C .99%D .97.5%3.某市通过随机询问100名不同年级的学生是否能做到“扶跌倒老人”,得到如下列联表:则下列结论正确的是( ) 附参照表:参考公式:22()()()()()n ad bc k a b c d a c b d -=++++,其中n a b c d =+++A .在犯错误的概率不超过90%的前提下,认为“学生能否做到‘扶跌倒老人’与年级高低有关”B .在犯错误的概率不超过1%的前提下,“学生能否做到‘扶跌倒老人’与年级高低无关”C .有90%以上的把握认为“学生能否做到‘扶跌倒老人’与年级高低有关”D .有90%以上的把握认为“学生能否做到‘扶跌倒老人’与年级高低无关”4.甲、乙两名同学参加2018年高考,根据高三年级一年来的各种大、中、小型数学模拟考试总结出来的数据显示,甲、乙两人能考140分以上的概率分别为12和45,甲、乙两人是否考140分以上相互独立,则预估这两个人在2018年高考中恰有一人数学考140 分以上的概率为( ) A .12B .23C .34D .135.已知12P(B|A)=,P(A)=35,则()P AB 等于( ) A .56B .910 C .215D .1156.甲罐中有5个红球,2个白球和3个黑球,乙罐中有6个红球,2个白球和2个黑球,先从甲罐中随机取出一个球放入乙罐,分别以1A ,2A ,3A 表示由甲罐取出的球是红球、白球和黑球的事件,再从乙罐中随机取出一个球,以B 表示由乙罐取出的球是红球的事件,下列结论中不正确...的是( ) A .事件B 与事件1A 不相互独立 B .1A 、2A 、3A 是两两互斥的事件 C .17(|)11P B A =D .3()5P B =7.甲、乙两人抢答竞赛题,甲答对的概率为15,乙答对的概率为14,则两人中恰有一人答对的概率为 A .720B .12 20C .120D .2208.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由22()()()()()n ad bc K a b c d a c b d -=++++并参照附表,得到的正确结论是( )A .在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B .在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C .有99.9%的把握认为“爱好游泳运动与性别有关”D .有99.9%的把握认为“爱好游泳运动与性别无关”9.某研究型学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如右表,则下列说法正确的是( )使用智能手机 不使用智能手机 总计 学习成绩优秀 4 8 12 学习成绩不优秀 16 2 18 总计201030参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:20()P K k ≥0.10 0.05 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828A .有99.9%的把握认为使用智能手机对学习有影响.B .有99.9%的把握认为使用智能手机对学习无影响.C .在犯错误的概率不超过0.005的前提下认为使用智能手机对学习有影响.D .在犯错误的概率不超过0.005的前提下认为使用智能手机对学习无影响. 10.下面是22⨯列联表:则表中a b,的值分别为()A.84,60 B.42,64 C.42, 74 D.74, 4211.下列结论中正确的是()A.若两个变量的线性关系性越强,则相关系数的绝对值越接近于0B.回归直线至少经过样本数据中的一个点C.独立性检验得到的结论一定正确D.利用随机变量2x来判断“两个独立事件,X Y的关系”时,算出的2x值越大,判断“,X Y 有关”的把握越大12.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为()参考公式附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:A.130 B.190 C.240 D.250二、填空题13.有甲、乙两台机床生产某种零件,甲获得正品乙不是正品的概率为14,乙获得正品甲不是正品的概率为16,且每台获得正品的概率均大于12,则甲乙同时生产这种零件,至少一台获得正品的概率是___________.14.从包括甲乙两人的6名学生中选出3人作为代表,记事件A:甲被选为代表,事件B:乙没有被选为代表,则()P B A │等于_________. 15.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.16.在10个形状大小均相同的球中有4个红球和6个白球,不放回地依次摸出2个球,在第1次摸出红球的条件下,第2次也摸出红球的概率为_________. 17.已知甲、乙两球落入盒子的概率分别为12和13.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落入盒子的概率为_________.18.某团队派遣甲、乙、丙、丁四人分别完成一项任务,已知甲完成任务的概率为14,乙完成任务的概率为12,丙、丁完成任务的概率均为23,若四人完成任务与否相互独立,则至少2人完成任务的概率为____.19.现有A ,B 两队参加关于“十九大”知识问答竞赛,每队3人,每人回答一个问题,答对者为本队赢1分,答错得0分;A 队中每人答对的概率均为23,B 队中3人答对的概率分别为23,23,13,且各答题人答题正确与否之间互不影响,若事件M 表示“A 队得2分”,事件N 表示“B 队得1分”,则()P MN =______.20.某校为了解家长对学校食堂的满意情况,分别从高一、高二年级随机抽取了20位家长的满意度评分,其频数分布表如下:假设两个年级家长的评价结果相互独立,根据所给数据,以事件发生的频率作为相应事件发生的概率.现从高一、高二年级各随机抽取1名家长,记事件A:“高一家长的满意度等级高于高二家长的满意度等级”,则事件A发生的概率为__________.三、解答题21.随着生活质量的提升,家庭轿车保有量逐年递增.方便之余却加剧了交通拥堵和环保问题.绿色出行引领时尚,共享单车进驻城市黄泽市有统计数据显示.2020年该市共享单车用户年龄等级分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所示.若将共享单车用户按照年齡分为“年轻人”(20岁~391岁)和“非年轻人”( 19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的经常使用共享单车的称为“单车族”.使用次数为5次或不足5次的称为“非单车族”.已知在“单车族”中有56是“年轻人”.(1)现对该市市民进行“经常使用共享单车与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为400的样本,请你根据图表中的数据,补全下列22列联表,并判断是否有95%的把握认为经常使用共享单车与年龄有关?使用共享单车情况与年龄列联表是“非年轻人”的人数为随机变量,X 求X 的分布列与期望. 参考数据:独立性检验界值表其中,()()()()()2,n ad bc n a b c d K a b c d a c b d -=+++=++++(注:保留三位小数). 22.奶茶是年轻人非常喜欢的饮品.某机构对于奶茶的消费情况在一商圈附近做了一些调查,发现女性喜欢奶茶的人数明显高于男性,每月喝奶茶的次数也比男性高,但单次奶茶消费金额男性似乎明显高于女性.针对每月奶茶消费是否超过百元进行调查,已知在调查的200人中女性人数是男性人数的4倍,统计如下:22⨯关?(2)在月消费超百元的调查者中,同时进行对于品牌喜好的调查.发现喜欢A 品牌的男女均为3人,现从喜欢A 品牌的这6人中抽取2人送纪念品,求这两人恰好都是女性的概率. 附:()()()()()22n ad bc K a b c d a c b d -=++++. 23.某工厂A ,B 两条相互独立的生产线生产同款产品,在产量一样的情况下,通过日常监控得知,A ,B 生产线生产的产品为合格品的概率分别为p 和21(0.51)p p -.(1)从A ,B 生产线上各抽检一件产品,若使得产品至少有一件合格的概率不低于99.5%,求p 的最小值0p ;(2)假设不合格的产品均可进行返工修复为合格品,以(1)中确定的0p 作为p 的值. ①已知A ,B 生产线的不合格品返工后每件产品可分别挽回损失5元和3元,若从两条生产线上各随机抽检1000件产品,以挽回损失的平均数为判断依据,估计哪条生产线的挽回损失较多?②若最终的合格品(包括返工修复后的合格品)按照一、二、三等级分类后,每件可分别获利10元、8元、6元,现从A ,B 生产线的最终合格品中各随机抽取100件进行分级检测,结果统计如图所示,用样本的频率分布估计总体分布,记该工厂生产一件产品的利润为X ,求X 的分布列并估计该厂产量2000件时利润的期望值.24.某小区停车场的收费标准为:每车每次停车时间不超过2小时免费,超过2小时的部分每小时收费1元(不足1小时的部分按1小时计算).现有甲乙两人独立来停车场停车(各停车一次),且两人停车时间均不超过5小时,设甲、乙两人停车时间(小时)与取车概率如表所示: 停车时间 取车概率 停车人员 (0,2](2,3](3,4](4,5]甲12xxx乙1613y(1)求甲、乙两人所付车费相同的概率;(2)设甲、乙两人所付停车费之和为随机变量ξ,求ξ的分布列和数学期望()E ξ. 25.某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量()g y 与尺寸(mm)x 之间近似满足关系式b y c x =⋅(b ,c 为大于0的常数).按照某指标测定,当产品质量与尺寸的比在区间(0.302,0.388)内时为优等品.现随机抽取6件合格产品,测得数据如下:(1)现从抽取的6件合格产品中再任选2件,求选中的2件均为优等品的概率; (2)根据测得数据作了初步处理,得相关统计量的值如下表:根据所给统计量,求y 关于x 的回归方程. 附:对于样本(),(1,2,,6)i i v u i =,其回归直线u b v a =⋅+的斜率和截距的最小二乘法估计公式分别为:()()()1122211ˆnniii i i i nniii i v v u u v u nvubv v vnv ====---==--∑∑∑∑,ˆˆa u bv=-, 2.7183e ≈. 26.贝诺酯为对乙酰氨基酚与阿司匹林的酯化产物,是一种新型的抗炎、抗风湿、解热镇痛药,主要用于类风湿关节炎、急慢性风湿性关节炎、神经痛及术后疼痛.药监部门要利用小白鼠扭体实验,对某厂生产的该药品的镇痛效果进行检测,若用药后的小白鼠扭体次数没有减少,扭体时间间隔没有变长,则认定镇痛效果不明显. (1)若该药品对雌性小白鼠镇痛效果明显的概率为23,对雄性小白鼠镇痛效果明显的概率为45,药监部门要利用两只雌性和两只雄性小白鼠检测该药药效,对4只小白鼠逐一检测.若在检测过程中,一只小白鼠用药后镇痛效果明显,记录积分为1,镇痛效果不明显,则记录积分为1-.用随机变量X 表示检测4只小白鼠后的总积分,求随机变量X 的分布列和数学期望()E X ;(2)若该药品对每只雌性小白鼠镇痛效果明显的概率均为p ,现对6只雌性小白鼠逐一进行检测,当检测到镇痛效果不明显的小白鼠时,停止检测.设至少检测5只雌性小白鼠才能发现镇痛效果不明显的概率为()f p ,求()f p 最大时p 的值.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】由于射击一次命中目标的概率为12,所以关键先求出射击7次有4次命中且恰有3次连续命中的所有可能数,即根据独立事件概率公式得结果. 【详解】因为射击7次有4次命中且恰有3次连续命中有24A 种情况,所以所求概率为7241A 2⎛⎫⋅ ⎪⎝⎭.选B. 【点睛】本题考查排列组合以及独立事件概率公式,考查基本分析求解能力,属中档题.2.C解析:C 【解析】分析:根据列联表中数据,利用公式求得27.333k ≈,对照临界值即可的结果. 详解:根据所给的列联表, 得到()226025151557.333 6.63540203030k ⨯-⨯=≈>⨯⨯⨯,∴至少有0099的把握认为喜爱打篮球与性别有关,故选C.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.3.C解析:C 【解析】分析:根据列联表中数据,利用公式求得2 3.03K ≈,参照临界值表即可得到正确结论. 详解:由公式()()()()()22n d bc k a b c d a c b d -=++++可得2 3.03K ≈,参照临界值表,2.7063.030 3.841<<,∴0090以上的把握认为,“学生能否做到‘扶跌倒老人’与年级高低有关”,故选C.点睛:本题考查了独立性检验的应用,属于基础题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.4.A解析:A 【解析】分析:根据互斥事件概率加法公式以及独立事件概率乘积公式求概率.详解:因为这两个人在2018年高考中恰有一人数学考140 分以上的概率为甲考140 分以上乙未考到140 分以上事件概率与乙考140 分以上甲未考到140 分以上事件概率的和,而 甲考140 分以上乙未考到140 分以上事件概率为14(1)25⨯-,乙考140 分以上甲未考到140 分以上事件概率为14(1)25-⨯,因此,所求概率为14(1)25⨯-1451(1)25102+-⨯==, 选A.点睛:本题考查互斥事件概率加法公式以及独立事件概率乘积公式,考查基本求解能力.5.C解析:C 【解析】分析:根据条件概率的计算公式,即可求解答案. 详解:由题意,根据条件概率的计算公式()()|()P AB P B A P A =, 则()()()122|3515P AB P B A P A =⋅=⨯=,故选C. 点睛:本题主要考查了条件概率的计算公式的应用,其中熟记条件概率的计算公式是解答的关键,着重考查了推理与运算能力.6.D解析:D 【解析】分析:由题意1A ,2A ,3A是两两互斥事件,条件概率公式求出1(|)P B A ,()()()()123P B P A B P A B P A B =++,对照选项即可求出答案.详解:由题意1A ,2A ,3A是两两互斥事件, ()()()12351213,,10210510P A P A P A =====, ()()()111177211|1112P BA P B A P A ⨯===,()23|11P B A =,()33|11P B A =,而()()()()123P B P A B P A B P A B =++()()()()()()112233|||P A P B A P A P B A P A P B A =++1713332115111011=⨯+⨯+⨯ 511=. 所以D 不正确. 故选:D.点睛:本题考查相互独立事件,解题的关键是理解题设中的各个事件,且熟练掌握相互独立事件的概率简洁公式,条件概率的求法,本题较复杂,正确理解事件的内蕴是解题的关键.7.A解析:A 【解析】第一种:甲答对,乙答错,此时概率为11315420⎛⎫⨯-=⎪⎝⎭;第二种:甲答错,乙答对,此时的概率为11415420⎛⎫-⨯= ⎪⎝⎭. 综上,两人中恰有一人答对的概率为347202020+=. 故选A.8.A解析:A 【解析】()()()()()22n ad bc K a b c d a c b d -=++++2110(1200400)7.82 6.63560506050-=≈>⨯⨯⨯所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”,选A.9.C解析:C 【解析】 经计算,()2230421681020101218K ⨯-⨯==⨯⨯⨯,27.87910.828K <<,对照数表知,在犯错误的概率不超过0.005的前提下认为使用智能手机对学习有影响,故选C .点睛:本题考查了独立性检验的应用问题,是基础题;其解题步骤为:(1)认真读题,取出相关数据,作出22⨯列联表;(2)根据22⨯列联表中的数据,计算2K 的观测值k ;(3)通过观测值k 与临界值0k 比较,得出事件有关的可能性大小.10.B解析:B 【解析】因2163a +=,故42a =,又22a b +=,则64b = ,应选答案B 。
{高中试卷}高一数学统计案例测试题
20XX年高中测试高中试题试卷科目:年级:考点:监考老师:日期:统计案例测试题一一、选择题:本大题共道小题,每小题分,共分,在每小题给出的四个选项中,只有一项符合题目要求1、对于散点图下列说法中正确一个是()(A)通过散点图一定可以看出变量之间的变化规律(B)通过散点图一定不可以看出变量之间的变化规律(C)通过散点图可以看出正相关与负相关有明显区别(D)通过散点图看不出正相关与负相关有什么区别2、在画两个变量的散点图时,下面叙述正确的是()(A)预报变量在轴上,解释变量在轴上(B)解释变量在轴上,预报变量在轴上(C)可以选择两个变量中的任意一个变量在轴上(D)可以选择两个变量中的任意一个变量在轴上3、如果根据性别与是否爱好运动的列联表,得到,所以判断性别与运动有关,那么这种判断出错的可能性为()(A)(B)(C)(D)4、下列关于线性回归的说法,不正确的是()(A)变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;(B)在平面直角坐标系中用描点法的方法得到表示具有相关关系的两个变量的一组数据的图形叫散点图;(C)线性回归直线方程最能代表观测值之间的关系;(D)任何一组观测值都能得到具有代表意义的回归直线方程;5、在两个变量与的回归模型中,分别选择了四个不同的模型,它们的相关指数如下,其中拟合效果最好的为()(A)模型①的相关指数为(B)模型②的相关指数为(C)模型③的相关指数为(D)模型④的相关指数为6、关于如何求回归直线的方程,下列说法正确的一项是()(A)先画一条,测出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测出此时的斜率与截距,就可得到回归直线方程(B)在散点图中,选两点,画一条直线,使所画直线两侧的点数一样多或基本相同,求出此直线方程,则该方程即为所求回归方程(C)在散点图中多选几组点,分别求出各直线的斜率与截距,再求它们的平均值,就得到了回归直线的斜率与截距,即可产生回归方程(D)上述三种方法都不可行7、若对于变量与的组统计数据的回归模型中,相关指数,又知残差平方和为,那么的值为()(A)(B)(C)(D)8、右表是对与喜欢足球与否的统计列联表依据表中的数据,得到()(A)(B)(C)(D)9、某医院用光电比色计检验尿汞时,得尿汞含量与消光系数读数的结果如下:如果与之间具有线性相关关系,那么当消光系数的读数为时,()(A)汞含量约为(B)汞含量高于(C)汞含量低于(D)汞含量一定是10、由一组样本数据得到的回归直线方程,那么下面说法正确的是()(A)直线必过点(B)直线必经过一点(C)直线经过中某两个特殊点(D)直线必不过点11、根据下面的列联表得到如下中个判断:①有的把握认为患肝病与嗜酒有关;②有的把握认为患肝病与嗜酒有关;③认为患肝病与嗜酒有关的出错的可能为;④认为患肝病与嗜酒有关的出错的可能为;其中正确命题的个数为()(A)(B)(C)(D)12、对于两个变量之间的相关系数,下列说法中正确的是()(A)越大,相关程度越大(B)越小,相关程度越大(C)越大,相关程度越小;越小,相关程度越大(D)且越接近于,相关程度越大;越接近于,相关程度越小;二、填空题:本大题共小题,每小题分,共分,把答案填在题中的横线上13、下表是关于出生男婴与女婴调查的列联表那么,A=,B=,C=,D=,E=;14、如右表中给出五组数据,从中选出四组使其线性相关最大,且保留第一组,那么,应去掉第组。
高一数学统计精编题
统计重点题型归纳一、选择题(共10小题)1.对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09B.0.20C.0.25D.0.452.某校老年、中年和青年教师的人数见如表,采用分层插样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为()A.90B.100C.180D.3003.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.1674.根据如图给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关5.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588B.480C.450D.1206.某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45B.50C.55D.607.已知某地区中小学学生的近视情况分布如图1和图2所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.200,20B.100,20C.200,10D.100,108.为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.189.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为P1,P2,P3,则()A.P1=P2<P3B.P2=P3<P1C.P1=P3<P2D.P1=P2=P3 10.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08B.07C.02D.01二、填空题(共4小题)11.某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为.12.某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=.(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.13.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示:(Ⅰ)直方图中x的值为;(Ⅱ)在这些用户中,用电量落在区间[100,250)内的户数为.14.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方向,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取名学生.三、解答题(共5小题)15.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?16.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(Ⅰ)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(Ⅱ)求频率分布直方图中的a,b的值;(Ⅲ)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写结论)17.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表B地区用户满意度评分的频数分布表(1)做出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.参考答案一、选择题(共10小题)1.【分析】在频率分布表中,由频率与频数的关系,计算可得各组的频率,根据频率的和等于1可求得二等品的概率.【解答】解:由频率分布直方图知识可知:在区间[15,20)和[25,30)上的概率为0.04×5+[1﹣(0.02+0.04+0.06+0.03)×5]=0.45.故选:D.2.【分析】由题意,老年和青年教师的人数比为900:1600=9:16,即可得出结论.【解答】解:由题意,老年和青年教师的人数比为900:1600=9:16,因为青年教师有320人,所以老年教师有180人,故选:C.3.【分析】利用百分比,可得该校女教师的人数.【解答】解:初中部女教师的人数为110×70%=77;高中部女教师的人数为150×40%=60,∴该校女教师的人数为77+60=137,故选:C.4.【分析】A从图中明显看出2008年二氧化硫排放量比2007年的二氧化硫排放量减少的最多,故A正确;B从2007年开始二氧化硫排放量变少,故B正确;C从图中看出,2006年以来我国二氧化硫年排放量越来越少,故C正确;D 2006年以来我国二氧化硫年排放量越来越少,与年份负相关,故D错误.【解答】解:A从图中明显看出2008年二氧化硫排放量比2007年的二氧化硫排放量明显减少,且减少的最多,故A正确;B2004﹣2006年二氧化硫排放量越来越多,从2007年开始二氧化硫排放量变少,故B正确;C从图中看出,2006年以来我国二氧化硫年排放量越来越少,故C正确;D2006年以来我国二氧化硫年排放量越来越少,而不是与年份正相关,故D错误.故选:D.5.【分析】根据频率分布直方图,成绩不低于60分的频率,然后根据频数=频率×总数可求出所求.【解答】解:根据频率分布直方图,成绩不低于60(分)的频率为1﹣10×(0.005+0.015)=0.8.由于该校高一年级共有学生600人,利用样本估计总体的思想,可估计该校高一年级模块测试成绩不低于60(分)的人数为600×0.8=480人.故选:B.6.【分析】由已知中的频率分布直方图,我们可以求出成绩低于60分的频率,结合已知中的低于60分的人数是15人,结合频数=频率×总体容量,即可得到总体容量.【解答】解:∵成绩低于60分有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20,则成绩低于60分的频率P=(0.005+0.010)×20=0.3,又∵低于60分的人数是15人,则该班的学生人数是=50.故选:B.7.【分析】根据图1可得总体个数,根据抽取比例可得样本容量,计算分层抽样的抽取比例,求得样本中的高中学生数,再利用图2求得样本中抽取的高中学生近视人数.【解答】解:由图1知:总体个数为3500+2000+4500=10000,∴样本容量=10000×2%=200,分层抽样抽取的比例为,∴高中生抽取的学生数为40,∴抽取的高中生近视人数为40×50%=20.故选:A.8.【分析】由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案;【解答】解:由直方图可得分布在区间第一组与第二组共有20人,分布在区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人,第三组的频率为0.36,所以第三组的人数:18人,第三组中没有疗效的有6人,第三组中有疗效的有12人.故选:C.9.【分析】根据简单随机抽样、系统抽样和分层抽样的定义即可得到结论.【解答】解:根据简单随机抽样、系统抽样和分层抽样的定义可知,无论哪种抽样,每个个体被抽中的概率都是相等的,即P1=P2=P3.故选:D.10.【分析】从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字开始向右读,依次为65,72,08,02,63,14,07,02,43,69,97,28,01,98,…,其中08,02,14,07,01符合条件,故可得结论.【解答】解:从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字开始向右读,第一个数为65,不符合条件,第二个数为72,不符合条件,第三个数为08,符合条件,以下符合条件依次为:08,02,14,07,01,故第5个数为01.故选:D.二、填空题(共4小题)11.【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出应抽取的男生人数.【解答】解:根据题意得,用分层抽样在各层中的抽样比为=,则应抽取的男生人数是500×=25人,故答案为:25.12.【分析】(1)频率分布直方图中每一个矩形的面积表示频率,先算出频率,在根据频率和为1,算出a的值;(2)先求出消费金额在区间[0.5,0.9]内的购物者的频率,再求频数.【解答】解:(1)由题意,根据直方图的性质得(1.5+2.5+a+2.0+0.8+0.2)×0.1=1,解得a=3(2)由直方图得(3+2.0+0.8+0.2)×0.1×10000=6000故答案为:(1)3 (2)600013.【分析】(I)根据频率分布直方图中,各组的频率之和为1,我们易得到一个关于x的方程,解方程即可得到答案.(II)由已知中的频率分布直方图,利用[100,250)之间各小组的纵坐标(矩形的高)乘以组距得到[100,250)的频率,利用频率乘以样本容量即可求出频数.【解答】解:(Ⅰ)依题意及频率分布直方图知,0.0024×50+0.0036×50+0.0060×50+x×50+0.0024×50+0.0012×50=1,解得x=0.0044.(II)样本数据落在[100,150)内的频率为0.0036×50=0.18,样本数据落在[150,200)内的频率为0.006×50=0.3.样本数据落在[200,250)内的频率为0.0044×50=0.22,故在这些用户中,用电量落在区间[100,250)内的户数为(0.18+0.30+0.22)×100=70.故答案为:0.0044;70.14.【分析】先求出一年级本科生人数所占总本科生人数的比例,再用样本容量乘以该比列,即为所求.【解答】解:根据分层抽样的定义和方法,一年级本科生人数所占的比例为=,故应从一年级本科生中抽取名学生数为300×=60,故答案为:60.三、解答题(共3小题)15.【分析】(1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1,解方程可得;(2)由直方图中众数为最高矩形上端的中点可得,可得中位数在[220,240)内,设中位数为a,解方程(0.002+0.0095++0.011)×20+0.0125×(a﹣220)=0.5可得;(3)可得各段的用户分别为25,15,10,5,可得抽取比例,可得要抽取的户数.【解答】解:(1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1,解方程可得x=0.0075,∴直方图中x的值为0.0075;(2)月平均用电量的众数是=230,∵(0.002+0.0095+0.011)×20=0.45<0.5,∴月平均用电量的中位数在[220,240)内,设中位数为a,由(0.002+0.0095+0.011)×20+0.0125×(a﹣220)=0.5可得a=224,∴月平均用电量的中位数为224;(3)月平均用电量为[220,240)的用户有0.0125×20×100=25,月平均用电量为[240,260)的用户有0.0075×20×100=15,月平均用电量为[260,280)的用户有0.005×20×100=10,月平均用电量为[280,300)的用户有0.0025×20×100=5,∴抽取比例为=,∴月平均用电量在[220,240)的用户中应抽取25×=5户.16.【分析】(Ⅰ)根据频率分布表求出1周课外阅读时间少于12小时的频数,再根据频率=求频率;(Ⅱ)根据小矩形的高=求a、b的值;(Ⅲ)利用平均数公式求得数据的平均数,可得答案.【解答】解:(Ⅰ)由频率分布表知:1周课外阅读时间少于12小时的频数为6+8+17+22+25+12=90,∴1周课外阅读时间少于12小时的频率为=0.9;(Ⅱ)由频率分布表知:数据在[4,6)的频数为17,∴频率为0.17,∴a=0.085;数据在[8,10)的频数为25,∴频率为0.25,∴b=0.125;(Ⅲ)数据的平均数为1×0.06+3×0.08+5×0.17+7×0.22+9×0.25+11×0.12+13×0.06+15×0.02+17×0.02=7.68(小时),∴样本中的100名学生该周课外阅读时间的平均数在第四组.17.【分析】(I)根据分布表的数据,画出频率直方图,求解即可.(II)计算得出∁A表示事件:“A地区用户的满意度等级为不满意”,∁B表示事件:“B地区用户的满意度等级为不满意”,P(∁A),P(∁B),即可判断不满意的情况.【解答】解:(Ⅰ)通过两个地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值,B地区的用户满意度评分的比较集中,而A地区的用户满意度评分的比较分散.(Ⅱ)A地区用户的满意度等级为不满意的概率大.记∁A表示事件:“A地区用户的满意度等级为不满意”,∁B表示事件:“B地区用户的满意度等级为不满意”,由直方图得P(∁A)=(0.01+0.02+0.03)×10=0.6得P(∁B)=(0.005+0.02)×10=0.25∴A地区用户的满意度等级为不满意的概率大.。
高一数学统计练习题含答案解析(2)
高一数学统计练习题含答案解析(2)高一数学统计练习题(第Ⅲ卷)15. (12分)为了让学生了解环保,增强环保意识,某中学举行了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)进行统计.请你根据下面尚未完成的频率分布表和频率分布直方图,解答下列问题:分组频数频率[50,60) 4 0.08[60,70) 8 0.16[70,80) 10 0.20[80,90) 16 0.32[90,100]合计(1)填充频率分布表中的空格;(2)不具体计算频率/组距,补全频率分布直方图.解:(1)40.08=50,即样本容量为50.第五小组的频数为50-4-8-10-16=12,第五小组的频率为1250=0.24.又各小组频率之和为1,所以频率分布表中的四个空格应分别填12,0.24,50,1.(6分)(2)根据小长方形的高与频数成正比,设第一个小长方形的高为h1,第二个小长方形的高为h2,第五个小长方形的高为h5.由等量关系得h1h2=48,h1h5=412,所以h2=2h1,h5=3h1.这样即可补全频率分布直方图如下:(12分)16.(12分)甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示.(1)填写下表:平均数方差中位数命中9环及以上甲 7 1.2 1乙 5.4 3(2)请从四个不同的角度对这次测试进行分析:①从平均数和方差结合分析偏离程度;②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些;④从折线图上两人射击命中环数及走势分析谁更有潜力.解:(1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10.可知x乙=110(2+4+6+8+7+7+8+9+9+10)=7,所以填7,乙的射靶环数由小到大排列为:2,4,6,7,7,8,8,9,9,10.所以中位数为7+82=7.5;甲10次射靶环数从小到大排列为:5,6,6,7,7 ,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:平均数方差中位数命中9环及以上甲 7 1.2 7 1乙 7 5.4 7.5 3(6分)(2)①甲、乙的平均数相同:均为7,但s2甲②甲、乙平均水平相同,而乙的中位数比甲大,可预见乙射靶环数的优秀次数比甲的多,所以乙的成绩比甲好些.③甲、乙平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,有潜力可挖.(12分)1 7.(12分)(2013•新课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.61.22.7 1.5 2.93.0 3.12.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.51.8 0.62.1 1.1 2.5 1.22.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解:(1)设A药的观测数据的平均数为x,B药的观测数据的平均数为y.由观测结果可得x=120(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3 .0+3.1+3.2+3.5)=2.3,y=120(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7 +1. 8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x>y,因此可看出A药的疗效更好.(6分)(2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有710的叶集中在茎2,3上,而B药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A药的疗效更好.(12分)18.(14分)(2013•重庆卷)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得∑10i=1xi=80,∑10i=1yi=20,∑10i=1xiyi=184,∑10i=1x2i=720.(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y=bx+a中,b=∑ni=1xiyi-nx-y-∑ni=1x2i-nx2,a=y- bx,其中x,y为样本平均值.线性回归方程也可写为y^=b^x+a^.解:(1)由题意知n=10,x=1n∑ni=1xi=8010=8,y=1n∑ni=1yi=2010=2.又lxx=∑ni=1x2i-nx2=720-10×82=80,lxy=∑ni=1xiyi-nx-y-=184-10×8×2=24,由此得b=lxylxx=2480=0.3,a=y-bx=2-0.3×8=-0.4,故所求回归方程为y=0.3x-0.4.(6分)(2)由于变量y的值随x的值增加而增加(b=0.3>0),故x与y之间是正相关.(10分)(3)将x=7代入回归方程可以预测家庭的月储蓄为y=0.3×7-0.4=1.7(千元).(14分)。
(北师大版)南京市高中数学选修2-3第三章《统计案例》测试题(答案解析)
一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.2019年10月18日-27日,第七届世界军人运动会在湖北武汉举办,中国代表团共获得133金64银42铜,共239枚奖牌.为了调查各国参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如下所示,现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为12;②在犯错误的概率不超过1%的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;③没有99.9%的把握认为“是否对主办方表示满意与运动员的性别有关”;则正确命题的个数为( )附:22()()()()()n ad bc K a b c d a c b d -=++++A .0B .1C .2D .33.下列关于回归分析与独立性检验的说法正确的是() A .回归分析和独立性检验没有什么区别;B .回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;C .独立性检验可以100%确定两个变量之间是否具有某种关系.D .回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;4.已知x 与y 之间的几组数据如下表:x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a'D .b<b',a>a'5.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k ,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响6.某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如下表所示: 序号 12345678910 11 12 13 14 15 16 17 18 19 20数学成绩 95 75 80 94 92 65 67 84 987167 93 64 787790 57 83 72 83物理成绩90 63 72 87 917158 82 93 817782 48 85 69 91 61 84 78 86若数学成绩90分(含90分)以上为优秀,物理成绩85(含85分)以上为优秀,则有多少把握认为学生的数学成绩与物理成绩有关系( )A .95%B .97.5%C .99.5%D .99.9%7.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;8.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bc K a c b d a d b c -++++,其中n a b c d =+++.20()P K k ≥0.100.050.01 0.0050k 2.7063.8416.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们( )A .没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B .有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C .有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”9.通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:性别与读营养说明列联表女 男 合计读营养说明 16 28 44 不读营养说明 20 8 28 总计363672请问性别和读营养说明之间在多大程度上有关系 ( ) A .99%的可能性 B .99.75%的可能性 C .99.5%的可能性 D .97.5%的可能性10.下列命题中:①线性回归方程y bx a =+必过点(),x y ;②在回归方程35y x =-中,当变量增加一个单位时,y 平均增加5个单位; ③在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好;④在回归直线0.58ˆyx =-中,变量2x =时,变量y 的值一定是-7. 其中假命题的个数是 ( ) A .1 B .2C .3D .411.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列表:由上表中数据计算得2K =()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,请根据下表,估计有多大把握认为“文化程度与月收入有关系”( )A .1%B .99%C .2.5%D .97.5%12.已知回归方程0.8585.7y x ∧=-,则该方程在样本()165,57 处的残差为( ) A .111.55B .54.5C .3.45D .2.45二、填空题13.如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________. 14.若两个分类变量X 与Y 的列联表为:则“X 与Y 之间有关系”这个结论出错的可能性为________.15.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”. 参考附表:(参考公式:K 2=()()()()()2n ad bc a b c d a c b d -++++,其中n=a+b+c+d)16.如表是降耗技术改造后生产某产品过程中记录产量(吨)与相应的生产能耗(吨标准煤)的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆˆ0.70.3yx =+,那么表中m 的值为__________.17.已知方程ˆ0.8582.71yx =-是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,ˆy的单位是kg ,那么针对某个体(160,53)的残差是______________. 18.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c互不相同,则这个三位数为”有缘数”的概率是__________. 19.给出下列结论:(1)在回归分析中,可用相关指数R 2的值判断模型的拟合效果,R 2越大,模型的拟合效果越好;(2)某工产加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量; (3)随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度,它们越小,则随机变量偏离于均值的平均程度越小;(4)若关于x 的不等式2x x a a -+-≥在R 上恒成立,则a 的最大值是1;(5)甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是相互独立事件.其中结论正确的是 .(把所有正确结论的序号填上)20.在2017年3月15日,某市物价部门对本市的5家商场的某种商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示: 价格x 9 9.5 10 10.5 11 销售量y1110865由散点图可知,销售量y 与价格x 之间有较好的线性相关关系,其线性回归方程是:3.2y x a =-+,则a =__________.三、解答题21.某大型现代化农场在种植某种大棚有机无公害的蔬菜时,为创造更大价值,提高亩产量,积极开展技术创新活动.该农场采用了延长光照时间的方案,该农场选取了20间大棚(每间一亩)进行试点,得到各间大棚产量数据绘制成散点图.光照时长为x (单位:小时),大棚蔬菜产量为y (单位:千斤每亩),记ln w x =.(1)根据散点图判断,y a bx =+与ln y c d x =+⋅,哪一个适宜作为大棚蔬菜产量y 关于光照时长x 的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(结果保留小数点后两位)(3)根据实际种植情况,发现上述回归方程在光照时长位于6~14小时内拟合程度良好,利用(2)中所求方程估计当光照时长为2e 小时(自然对数的底 2.71828e ≈),大棚蔬菜亩产约为多少. 参数数据:参考公式:β关于α的线性回归方程m n βα=⋅+中,1221i ii nii n m n αβαβαα==-⋅=-∑∑,n m βα=-⋅22.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状的这一阶段称为潜伏期.一研究团队统计了某地区200名患者的相关信息,得到如下表格:(1)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,根据上表数据将如下列联表补充完整,并根据列联表判断是否有99%的把握认为该传染病的潜伏期与患者年龄有关.(2)将200名患者的潜伏期超过6天的频率视为该地区每名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该团队随机调查了该地区20名患者,其中潜伏期超过6天的人数为X ,求随机变量X 的期望和方差. 附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. 23.新冠肺炎疫情防控时期,各级各类学校纷纷组织师生开展了“停课不停学”活动,为了解班级线上学习情况,某位班主任老师进行了有关调查研究.(1)从班级随机选出5名同学,对比研究了线上学习前后两次数学考试成绩,如下表:参考公式:在线性回归方程y bx a =+,()()()()1122211n niii ii i nniii i x x y y x y nx yb x x xn x====---==--∑∑∑∑,a y bx =-(2)针对全班45名同学(25名女生,20名男生)的线上学习满意度调查中,女姓满意率为80%,男生满意率为75%,填写下面列联表,判断能否在犯错误概率不超过0.01的前提下,认为线上学习满意度与学生性别有关?参考公式和数据:()()()()()2n ad bc x a b c d a c b d -=++++,()20.0500.0100.0013.8416.63510.828P x k k ≥24.为了了解某校高中生的身体质量情况,某调查机构进行了一次高一学生体重和身高的抽样调查,从中抽取了8名学生(编号为18)的身高(cm)x 和体重(kg)y 数据.如下表,某调查机构分析发现学生的身高和体重之间有较强的线性相关关系,在编号为6的体检数据丢失之前,调查员甲已进行相关的数据分析并计算出该组数据的线性回归方程为ˆˆ0.5ya x =+,且根据回归方程预估一名身高为180cm 的学生体重为71kg ,计算得到的其他数据如下:81170,89920i ii x x y===∑.(1)求a 的值及表格中8名学生体重的平均值y ;(2)在数据处理时,调查员乙发现编号为8的学生体重数据有误,应为63kg ,身高数据无误.请你根据调查员乙更正的数据重新计算线性回归方程,并据此预估一名身高为180cm 的学生的体重.附:回归直线方程ˆˆˆy a bx=+的斜率和截距的最小二乘法估计分别为:1221ˆni ii ni i x ynx ybx nx==-=-∑∑,ˆˆa y bx=-. 25.冠状病毒是一个大型病毒家族,今年出现的新型冠状病毒(nCoV )是以前从未在人体中发现的冠状病毒新毒株.(1)某科研团队为研究潜伏期与新冠肺炎患者年龄的关系,组织专家统计了该地区新冠肺炎患者新冠病毒潜伏期的相关信息,其中被统计的患者中60岁以下的人数与60岁以上的人数相同,60岁以下且潜伏期在7天以下的人数约占15,60岁以上且潜伏期在7天以下的人数约占35,若研究得到在犯错误概率不超过0.010的前提下,认为潜伏期与新冠肺炎患者年龄有关,现设被统计的60岁以上的人员人数为5x ,请完成下面2×2列联表并计算被统计的60岁以上的人员至少多少人?附1:()()()()()22n ad bc X a b c d a c b d -=++++,其中n a b c d =+++()20P X k ≥0.100 0.050 0.010 0.005 0.001 0k 2.7063.8416.6357.87910.828(2)某地区的新冠肺炎治愈人数y (人)与3月份的时间x (日)满足回归直线方程ˆˆˆybx a =+,统计数据如下: 3月日期(日) 2 3 4 5 6治愈人数(人)25304045t已知5=11405i i y y ==∑,52=190i i x =∑,5=1885i i i x y =∑,请利用所给数据求t 和回归直线方程ˆˆˆy bx a =+;附2:()1221ˆni ii ni i x y nx ybx n x ==-⋅=-∑∑,ˆˆa y bx=-. 26.某企业组织应聘该企业的100名应届毕业生参加专业能力测试(满分100分),这100名毕业生的成绩的频率分布直方图如图所示.(Ⅰ)该企业拟以成绩的中位数作为分数线来确定进入面试阶段的毕业生名单,根据频率分布直方图求进入该企业面试的分数线;(Ⅱ)若被测试的毕业生中有40名女生,进入面试的有15名女生,35名男生,填写下面列联表,并根据列联表判断是否有95%的把握认为成绩与性别有关.成绩<分数线成绩≥分数线 总计附:()()()()()22n ad bc K a b c d a c b d -=++++)2k【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B 【分析】依次判断每个选项:计算概率为25得到①错误;计算2 5.952K ≈得到②错,③对得到答案. 【详解】任取1名参赛人员,抽到对主办方表示满意的男性运动员的概率为20025005=,故①错误;22(2003050220)5005.95225025042080K ⨯-⨯⨯=≈⨯⨯⨯,故②错,③对故选:B . 【点睛】本题考查了概率的计算和独立性检验,意在考查学生的综合应用能力.3.D解析:D 【分析】根据题意可知,利用回归分析和独立性检验的定义,排除错误选项,即可求解出答案. 【详解】回归分析是指将具有相关关系的两个变量之间的数量关系进行测定,通过建立数学表达式进行统计估计和预测的统计研究方法.独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.根据以上定义,可知A 、B 、C 均错误,故答案选D . 【点睛】本题主要考查了回归分析与独立性检验的定义的区别.4.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.C解析:C 【解析】分析:根据题意,列出22⨯列联表,求出观测值2K ,根据观测值对应的数值得出结论. 详解:根据题意,列出22⨯列联表,如下;则220(51212)8.80177.879671413K ⨯⨯-⨯==>⨯⨯⨯,因为观测值对应的数值为0.005,所以有99.5%的把握认为学生的数学成绩与物理成绩之间有关系.故选C.点睛:本题考查了独立性检验的应用,属于基础题.考查利用数学知识研究实际问题的能力以及相应的运算能力.7.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.8.B解析:B 【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K 的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人, 又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人, 又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530) 4.762 3.8412109075225K ⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”, 故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.9.C解析:C 【详解】由题意可知16,28,20,8a b c d ====,44,28,36,36a b c d a c c d +=+=+=+=,72n a b c d =+++=,代入公式()()()()()22n ad bc K a b c d a c b d -=++++得()227216828208.4244283636K ⨯⨯-⨯=≈⨯⨯⨯,由于28.427.879K ≈>,我们就有0099.5的把握认为性别和读营养说明之间有关系,即性别和读营养说明之间有0099.5的可能是有关系的,故选C .10.C解析:C 【解析】对于①,线性回归方程 ˆˆˆybx a =+必过点)x y (,,满足回归直线的性质,所以①正确;对于②,在回归方程ˆ35y x =-中,当变量x 增加一个单位时,y 平均减少5个单位,不是增加5个单位;所以②不正确;对于③,在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好,该判断恰好相反;所以③不正确;对于④,在回归直线0.58ˆy x =-中,变量2x =时,变量y 的值一定是-7.不是一定为7,而是可能是7,也可能在7附近,所以④不正确;故选C.11.D解析:D 【解析】 试题由题根据二列联表得出;2K=()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,对应参考值得 2 5.024K >,则有10.0250.975-=,即有97.5%的把握认为文化程度与月收入有关系。
玉林市选修1-2第一章《统计案例》测试卷(答案解析)
一、选择题1.2020年初,新型冠状病毒(19COVID -)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如下表所示: 周数(x ) 1 2 3 4 5 治愈人数(y )2173693142由表格可得y 关于x 的二次回归方程为2ˆ6yx a =+,则此回归模型第4周的残差(实际值与预报值之差)为( ) A .5B .4C .1D .02.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有的把握认为是否喜欢抖音和性别有关,则男生至少有( )参考公式:0.10 0.05 0.025 0.010 0.005 0.001 2.7063.8415.0246.6357.87910.828A .12人B .18人C .24人D .30人3.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取60名高中生做问卷调查,得到以下数据:作文成绩优秀 作文成绩一般 总计 课外阅读量较大 22 10 32 课外阅读量一般 8 20 28 总计303060由以上数据,计算得到2K 的观测值9.643k ≈,根据临界值表,以下说法正确的是( ) P (K 2≥k 0)0.500.400.250.150.100.050.050.0100.005k 0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879A .在样本数据中没有发现足够证据支持结论“作文成绩优秀与课外阅读量大有关”B .在犯错误的概率不超过0.001的前提下,认为作文成绩优秀与课外阅读量大有关C .在犯错误的概率不超过0.05的前提下,认为作文成绩优秀与课外阅读量大有关D .在犯错误的概率不超过0.005的前提下,认为作文成绩优秀与课外阅读量大有关 4.某射手射击一次命中的概率为0.8,连续两次射击均命中的概率是0.6,已知该射击手某次射中,则随后一次射中的概率是( ) A .34B .45C .35D .7105.从装有形状大小相同的3个黑球和2个白球的盒子中依次不放回地任意抽取3次,若第二次抽得黑球,则第三次抽得白球的概率等于( ) A .15B .14C .13 D .126.下列说法中正确的是( )A .设随机变量~(10,0.01)X N ,则1(10)2P X >= B .线性回归直线不一定过样本中心点(,)x yC .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这样的抽样方法是分层抽样 7.已知()112P A =,()136P AB =,()512P B =,则()P B A 为( ) A .12B .13C .115D .158.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-9.工人月工资(元)关于劳动生产率x(千元)的回归方程为,下列说法中正确的个数是()①劳动生产率为1000元时,工资为730元;②劳动生产率提高1000元,则工资提高80元;③劳动生产率提高1000元,则工资提高730元;④当月工资为810元时,劳动生产率约为2000元.A.1 B.2 C.3 D.410.抛掷一枚质地均匀的骰子两次,记事件{两次的点数均为奇数},{两次的点数之和小于},则()A.B.C.D.11.为了研究经常使用手机是否对数学学习成绩有影响,某校高二数学研究性学习小组进行了调查,随机抽取高二年级50名学生的一次数学单元测试成绩,并制成下面的2×2列联表:及格不及格合计很少使用手机20525经常使用手机101525合计302050则有()的把握认为经常使用手机对数学学习成绩有影响.参考公式:()()()()()22=n ad bcKa b c d a c b d-++++,其中n a b c d=+++()2P K k≥0.150.100.050.0250.0100.0050.001 k 2.072 2.706 3.841 5.024 6.6357.87910.828 A.97.5% B.99% C.99.5% D.99.9%12.甲、乙两人独立地破译一份密码,破译的概率分别为11,32,则密码被破译的概率为()A.16B.23C.56D.1二、填空题13.国产杀毒软件进行比赛,每个软件进行四轮考核,每轮考核中能够准确对病毒进行查杀的进入下一轮考核,否则被淘汰.已知某个软件在四轮考核中能够准确杀毒的概率依次是56,35,34,13,且各轮考核能否通过互不影响.则该软件至多进入第三轮考核的概率为______.14.甲、乙两名同学参加一项射击比赛游戏,其中任何一人每射击一次击中目标得2分,未击中目标得0分.若甲、乙两人射击的命中率分别为35和p,且甲、乙两人各射击一次得分之和为2的概率为920.假设甲、乙两人射击互不影响,则p值为______.15.某大学进行自主招生时,需要进行逻辑思维和阅读表达两项能力的测试.学校对参加测试的200名学生的逻辑思维成绩、阅读表达成绩以及这两项的总成绩进行了排名.其中甲、乙、丙三位同学的排名情况如下图所示:得出下面四个结论:①甲同学的阅读表达成绩排名比他的逻辑思维成绩排名更靠前②乙同学的逻辑思维成绩排名比他的阅读表达成绩排名更靠前③甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前④乙同学的总成绩排名比丙同学的总成绩排名更靠前则所有正确结论的序号是_________.16.如图, A, B, C表示3种开关,设在某段时间内它们正常工作的概率是分别是0.9 , 0.8 , 0.7 , 如果系统中至少有1个开关能正常工作,则该系统就能正常工作,那么该系统正常工作的概率是____________17.给出下列结论:(1)在回归分析中,可用相关指数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好;(2)某工产加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量; (3)随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度,它们越小,则随机变量偏离于均值的平均程度越小;(4)若关于x 的不等式2x x a a -+-≥在R 上恒成立,则a 的最大值是1;(5)甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是相互独立事件.其中结论正确的是 .(把所有正确结论的序号填上)18.体育课上定点投篮项目测试规则:每位同学有3次投篮机会,一旦投中,则停止投篮,视为合格,否则一直投3次为止.每次投中与否相互独立,某同学一次投篮投中的概率为p ,若该同学本次测试合格的概率为0.784,则p =_____. 19.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:20.甲罐中有5个红球,2个白球和3个黑球,乙罐中有4个红球,3个白球和3个黑球.先从甲罐中随机取出一球放入乙罐,分别以1A ,2A 和3A 表示由甲罐取出的球是红球,白球和黑球的事件;再从乙罐中随机取出一球,以B 表示由乙罐取出的球是红球的事件,则下列结论中正确的是___________. ①()25P B =;②()1511P B A =;③事件B 与事件1A 相互独立;④1A ,2A ,3A 是两两互斥的事件三、解答题21.在我国,大学生就业压力日益严峻,伴随着政府政策的引导与社会观念的转变,大学生的创业意识与就业方向也悄然发生转变.某大学生在国家提供的税收,担保贷款等多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数i y (单位:万元)与时间i t (单位:年)的数据,列表如下:i t1 2 3 4 5 i y 2.42.74.16.47.9(1)依据表中给出的数据,是否可用线性回归模型拟合y与t的关系,请计算相关系数r 并加以说明(计算结果精确到0.01).(若0.75r>,则线性相关程度很高,可用线性回归模型拟合)(2)该专营店为吸引顾客,特推出两种促销方案.方案一:每满500元可减50元;方案二:每满500元可抽奖一次,每次中奖的概率都为25,中奖就可以获得100元现金奖励,假设顾客每次抽奖的结果相互独立.(ⅰ)某位顾客购买了1050元的产品,该顾客选择参加两次抽奖,求该顾客换得100元现金奖励的概率(ⅱ)某位顾客购买了2000元的产品,作为专营店老板,是希望该顾客直接选择方案一返回200元现金,还是选择方案二参加四次抽奖?说明理由.附:相关系数公式:()()n ni i i it t y y t y nty r---=∑∑,7.547≈,5185.2iiit y==∑,22.某航空公司规定:国内航班(不构成国际运输的国内航段)托运行李每件重量上限为50kg,每件尺寸限制为40cm60cm100cm⨯⨯,其中头等舱乘客免费行李额为40kg,经济舱乘客免费行李额为20kg.某调研小组随机抽取了100位国内航班旅客进行调查,得到如表所示的数据:(1)请完成22⨯列联表,并判断是否在犯错概率不超过0.05的前提下,认为托运超额行李与乘客乘坐座位的等级有关?(2)调研小组为感谢参与调查的旅客,决定从托运行李超出免费行李额且不超出的旅客中(其中女性旅客4人)随机抽取4人,对其中的女性旅客赠送“100元超额行李补贴券”,记赠送的补贴券总金额为X元,求X的分布列与数学期望.参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:23.华中师大附中中科教处为了研究高一学生对物理和数学的学习是否与性别有关,从高一年级抽取60名同学(男同学30名,女同学30名),给所有同学物理题和数学题各一题,让每位同学自由选择一题进行解答.选题情况如下表:(单位:人)(1)在犯错误的概率不超过1%的条件下,能否判断高一学生对物理和数学的学习与性别有关?(2)经过多次测试后发现,甲每次解答一道物理题所用的时间为58-分钟,乙每次解答一道物理题所用的时间为68-分钟,现甲、乙解同一道物理题,求甲比乙先解答完的概率;(3)现从选择做物理题的8名女生中任意选取两人,对她们的解答情况进行全程研究,记甲、乙两女生被抽到的人数为X,求X的分布列和数学期望.附表及公式22()()()()()n ad bc K a b c d a c b d -=++++24.某工厂A ,B 两条相互独立的生产线生产同款产品,在产量一样的情况下,通过日常监控得知,A ,B 生产线生产的产品为合格品的概率分别为p 和21(0.51)p p -.(1)从A ,B 生产线上各抽检一件产品,若使得产品至少有一件合格的概率不低于99.5%,求p 的最小值0p ;(2)假设不合格的产品均可进行返工修复为合格品,以(1)中确定的0p 作为p 的值. ①已知A ,B 生产线的不合格品返工后每件产品可分别挽回损失5元和3元,若从两条生产线上各随机抽检1000件产品,以挽回损失的平均数为判断依据,估计哪条生产线的挽回损失较多?②若最终的合格品(包括返工修复后的合格品)按照一、二、三等级分类后,每件可分别获利10元、8元、6元,现从A ,B 生产线的最终合格品中各随机抽取100件进行分级检测,结果统计如图所示,用样本的频率分布估计总体分布,记该工厂生产一件产品的利润为X ,求X 的分布列并估计该厂产量2000件时利润的期望值.25.小张举办了一次抽奖活动.顾客花费3元钱可获得一次抽奖机会.每次抽奖时,顾客从装有1个黑球,3个红球和6个白球(除颜色外其他都相同)的不透明的袋子中依次不放回地摸出3个球,根据摸出的球的颜色情况进行兑奖.顾客中一等奖,二等奖,三等奖,四等奖时分别可领取的奖金为a 元,10元,5元,1元.若经营者小张将顾客摸出的3个球的颜色分成以下五种情况::1A 个黑球2个红球;:3B 个红球;:c 恰有1个白球;:D 恰有2个白球;:3E 个白球,且小张计划将五种情况按发生的机会从小到大的顺序分别对应中一等奖,中二等奖,中三等奖,中四等奖,不中奖.(1)通过计算写出中一至四等奖分别对应的情况(写出字母即可); (2)已知顾客摸出的第一个球是红球,求他获得二等奖的概率;(3)设顾客抽一次奖小张获利X 元,求变量X 的分布列;若小张不打算在活动中亏本,求a 的最大值.26.微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为子调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,将男性、女性使用微信的时间分成5组:(]0,2,(]2,4,(]4,6,(]6,8,(]8,10分别加以统计,得到如图所示的频率分布直方图.(1)根据女性频率分布直方图估计女性使用微信的平均时间;(2)若每天再微信超过4个小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件完成22⨯的列联表,并判断是否有90%的把握认为“微信控”与“性别有关”?【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】设2t x =,求出t ,y 的值,由最小二乘法得出回归方程,代入4x =,即可得出答案. 【详解】 设2t x =,则()11491625115t =++++=,()12173693142585y =++++= 586118a =-⨯=-,所以2ˆ68yx =-.令4x =,得2444936485ˆe y y =-=-⨯+=. 故选:A 【点睛】本题考查回归分析的应用,属于中档题.2.B解析:B 【解析】 【分析】设男生人数为,女生人数为,完善列联表,计算解不等式得到答案.【详解】设男生人数为,女生人数为喜欢抖音 不喜欢抖音 总计 男生女生总计男女人数为整数 故答案选B 【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.3.D解析:D 【解析】分析:根据临界值表,确定犯错误的概率详解:因为根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为作文成绩优秀与课外阅读量大有关. 选D.点睛:本题考查卡方含义,考查基本求解能力.4.A解析:A 【解析】分析:某次射中,设随后一次射中的概率为p ,利用相互独立事件概率乘法公式能求出p 的值.详解:某次射中,设随后一次射中的概率为p ,∵某射击手射击一次命中的概率为0.8,连续两次均射中的概率是0.5,0.80.6p ,∴= 解得34p =.故选:A .点睛:本题考查概率的求法,涉及到相互独立事件概率乘法公式的合理运用,考查推理论证能力、运算求解能力、数据处理能力,考查化归与转化思想,是基础题.5.D解析:D【解析】分析:这是一个条件概率,可用古典概型概率公式计算,即从5个球中取三个排列,总体事件是第二次是黑球,可在第二次是黑球的条件下抽排第一次和第三次球.详解:111223122412C C C P C A ==. 点睛:此题是一个条件概率,条件是第二次抽取的是黑球,不能误以为是求第二次抽到黑球,第三次抽到白球的概率,如果那样求得错误结论为1132353310C C A ⨯=. 6.A解析:A 【解析】在A 中,设随机变量X 服从正态分布N (10,0.01),则由正态分布性质得1(10)2P X >=,故A 正确; 在B 中,线性回归直线一定过样本中心点(),x y ,故B 错误;在C 中,若两个随机变量的线性相关性越强,则相关系数r 的绝对值越接近于1,故C 错误;在D 中,先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为m+50,m+100,m+150…的学生,这样的抽样方法是系统抽样法,故D 错误. 故选:A7.B解析:B 【解析】根据条件概率公式()()()11361312P AB P B A P A ===,故选B. 8.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值.9.C解析:C 【解析】对于①当劳动生产率为1000元时,工资为65080730y =+=元,故①正确;对于②劳动生产率提高1000元,则工资提高80元正确;故③错误;对于④当月工资为810元时,由81065080x =+得2x =,即劳动生产率约为2000元,故④正确;故选C.10.D解析:D 【解析】 由题意得,两次的点数均为奇数且和小于的情况有,则,故选D.11.C解析:C 【分析】根据2×2列联表,求出k 的观测值2K ,结合题中表格数据即可得出结论. 【详解】 由题意,可得:222()50(2015105)258.3337.879()()()()302025253n ad bc K a b c d a c b d -⨯⨯-⨯===≈>++++⨯⨯⨯,所以有99.5%的把握认为经常使用手机对数学学习成绩有影响. 故选C. 【点睛】本题考查了独立性检验的应用,考查了计算能力,属于基础题.12.B解析:B 【分析】密码被破译分三种情况:甲破译出密码乙未破译,乙破译出密码甲未破译,甲乙都破译出密码,根据相互独立事件的概率和公式可求解出答案. 【详解】设 “甲独立地破译一份密码” 为事件A , “乙独立地破译一份密码” 为事件B , 则()13P A =,()12P B =,()12133P A =-=,()11122P B =-=, 设 “密码被破译” 为事件C ,则()()()()P C P AB P AB P AB =++11211123232323=⨯+⨯+⨯=,故选:B. 【点睛】本题以实际问题为背景考查相互独立事件的概念及其发生的概率的计算,考查分析问题和解决问题的能力,属于中档题.二、填空题13.【分析】将题目分为只进入第一轮第二轮和第三轮三种情况分别计算概率相加得到答案【详解】设事件表示该软件能通过第轮考核由已知得设事件表示该软件至多进入第三轮则故答案为【点睛】本题考查了概率的计算分类利用解析:58【分析】将题目分为只进入第一轮,第二轮和第三轮三种情况,分别计算概率相加得到答案. 【详解】设事件()1,2,3,4i A i =表示“该软件能通过第i 轮考核”, 由已知得()156P A =,()235P A =,()334P A =,()413P A =, 设事件C 表示“该软件至多进入第三轮”,则()()()()()112123112123P C P A A A A A A P A P A A P A A A =++=++15253156656548=+⨯+⨯⨯=. 故答案为58【点睛】本题考查了概率的计算,分类利用独立性是解题的关键.14.【分析】根据甲乙两人各射击一次得分之和为2的概率为列方程解方程求得的值【详解】甲乙两人各射击一次得分之和为2可能是甲击中乙未击中或者乙击中甲未击中故解得故答案为:【点睛】本小题主要考查相互独立事件概解析:34【分析】根据甲、乙两人各射击一次得分之和为2的概率为920列方程,解方程求得p 的值. 【详解】甲、乙两人各射击一次得分之和为2,可能是甲击中乙未击中,或者乙击中甲未击中,故()339115520p p ⎛⎫⋅-+⋅-= ⎪⎝⎭,解得34p =.故答案为:34【点睛】本小题主要考查相互独立事件概率计算,属于基础题.15.③④【解析】根据图示可得甲同学的逻辑思维成绩排名很靠前但总排名靠后说明阅读表达成绩排名靠后;乙同学的逻辑思维成绩排名适中但总排名靠前说明阅读表达成绩排名靠前;丙同学的逻辑思维成绩排名及阅读表达成绩排解析:③④ 【解析】根据图示可得,甲同学的逻辑思维成绩排名很靠前但总排名靠后,说明阅读表达成绩排名靠后;乙同学的逻辑思维成绩排名适中但总排名靠前,说明阅读表达成绩排名靠前;丙同学的逻辑思维成绩排名及阅读表达成绩排名居中,则乙同学的总成绩排名比丙同学的总成绩排名更靠前;甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前,故③④正确.故答案为③④.16.994【解析】由题意知本题是一个相互独立事件同时发生的概率种开关中至少有个开关能正常工作的对立事件是种开关都不能工作分别记开关能正常工作分别为事件故答案为解析:994 【解析】由题意知本题是一个相互独立事件同时发生的概率,,,A B C ,3种开关中至少有1 个开关能正常工作的对立事件是3种开关都不能工作,分别记,,A B C 开关能正常工作分别为事件123,,A A A ,()()1231,,10.10.20.30.994P E P A A A =-=-⨯⨯=, 故答案为0.994. 17.(1)(3)(4)【分析】根据相关指数离散型随机变量随机变量的方差和标准差绝对值不等式和相互独立事件相关的知识对五个结论逐一分析由此得出正确结论的序号【详解】对于(1)R2越大模型的拟合效果越好结论解析:(1),(3),(4) 【分析】根据相关指数、离散型随机变量、随机变量的方差和标准差、绝对值不等式和相互独立事件相关的知识,对五个结论逐一分析,由此得出正确结论的序号. 【详解】对于(1),R 2越大,模型的拟合效果越好,结论正确.对于(2),内径与规定的内径尺寸之差是连续型随机变量,结论错误.对于(3),根据随机变量的方差和标准差的知识可判断出结论正确.对于(4),根据绝对值不等式有22x x a a a -+-≥-≥,所以2a a -≤-或2a a -≥,前者解得1a ≤,后者无解,故a 的最大值为1,结论正确.对于(5),事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是对立事件,不是相互独立事件,结论错误.综上所述,正确结论为(1),(3),(4). 【点睛】本小题主要考查关指数、离散型随机变量、随机变量的方差和标准差、绝对值不等式和相互独立事件相关的知识,考查分析与解决问题的能力,属于基础题.18.【解析】【分析】由题意可得:据此求解关于实数p 的方程确定实数p 的值即可【详解】由题意可得:整理可得:即该方程存在唯一的实数根故答案为04【点睛】本题主要考查独立事件概率公式及其应用属于基础题 解析:0.4【解析】 【分析】由题意可得:()()2110.784p p p p p +-+-=,据此求解关于实数p 的方程确定实数p 的值即可. 【详解】由题意可得:()()2110.784p p p p p +-+-=,整理可得:32330.7840p p p -+-=,即(2(0.4) 2.6 1.96)0p p p --+=,该方程存在唯一的实数根0.4p =. 故答案为 0.4 【点睛】本题主要考查独立事件概率公式及其应用,属于基础题.19.①④【解析】分析:根据性回归方程独立性检验相关关系以及命题的否定等知识选出正确的得到结果详解:线性回归方程必过样本中心点故①正确命题的否定是故②错误③相关系数r 绝对值越小表明两个变量相关性越弱故不正解析:①④ 【解析】分析:根据性回归方程,独立性检验,相关关系,以及命题的否定等知识,选出正确的,得到结果.详解:线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,故①正确.命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃≥+<” 故②错误 ③相关系数r 绝对值越小,表明两个变量相关性越弱,故不正确;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系,正确. 故答案为①④.点睛:本题以命题真假的判断为载体,着重考查了相关系数、命题的否定、独立性检验、回归直线方程等知识点,属于中档题.20.②④【分析】根据每次取一球易得是两两互斥的事件求得然后由条件概率求得再逐项判断【详解】因为每次取一球所以是两两互斥的事件故④正确;因为所以故②正确;同理所以故①③错误故答案为:②④【点睛】本题主要考解析:②④ 【分析】根据每次取一球,易得1A ,2A ,3A 是两两互斥的事件,求得()()()123,,P A P A P A ,然后由条件概率求得1()P B A ,123()()()()P B P BA P BA P BA =++,再逐项判断. 【详解】因为每次取一球,所以1A ,2A ,3A 是两两互斥的事件,故④正确; 因为()()()123523,,101010P A P A P A ===, 所以11155()51011()5()1110P BA P B A P A ⨯===,故②正确; 同理3223232434()()4410111011(),()23()11()111010P BA P BA P B A P B A P A P A ⨯⨯======, 所以1235524349()()()()10111011101122P B P BA P BA P BA =++=⨯+⨯+⨯=, 故①③错误. 故答案为:②④ 【点睛】本题主要考查互斥事件,相互独立事件,条件概率的求法,还考查了运算求解的能力,属于中档题.三、解答题21.(1)0.97r ≈;y 与t 的线性相关程度很高,可以用线性回归模型拟合;(2)(ⅰ)1225;(ⅱ)选择参加四次抽奖;答案见解析. 【分析】(1)由题表计算出t ,y .55i it ytyr -=∑(2)(ⅰ)设其获得100元现金奖励为事件A ,由独立事件的概率乘法公式可得()P A ;(ⅱ)设X 表示该顾客在四次抽奖中中奖的次数.则24,5X B ⎛⎫⎪⎝⎭,计算出()E X 和奖励金额的均值可得答案. 【详解】(1)由题表,()11234535t =⨯++++=,()12.4 2.7 4.1 6.47.9 4.75y =⨯++++=.因为5185.2i i i t y==∑所以5514.70.970.7515.094i it ytyr -=≈≈>∑. 故y 与t 的线性相关程度很高,可以用线性回归模型拟合.(2)(ⅰ)顾客选择参加两次抽奖,设其获得100元现金奖励为事件A ,则()122312C 5525P A =⨯⨯=.(ⅱ)设X 表示该顾客在四次抽奖中中奖的次数. 由于顾客每次抽奖的结果相互独立,则24,5XB ⎛⎫ ⎪⎝⎭, 所以()24 1.65E X =⨯=.由于顾客每中奖一次可获得100元现金奖励,因此顾客在四次抽奖中可获得的奖励金额的均值为1.6100160⨯=(元).由于160200<,故作为专营店老板希望该顾客选择参加四次抽奖. 【点睛】本题考查线性相关系数的求法、独立重复试验与二项分布,解题的关键点是要熟练掌握相关的知识点并能熟练应用,还考查了学生的计算能力. 22.(1)列联表见解析,有关;(2)分布列见解析,16007元. 【分析】(1)根据表格中的数据,得到22⨯列联表,利用公式求得2K 的值,结合附表,即可求解;(2)根据题意得出补贴券总金额X 的所有可能取值100,200,300,400,求得相应的概率,得出分布列,利用期望的公式,即可求解. 【详解】(1)根据表格中的数据,得到22⨯列联表:可得()21005382374900 5.50 3.84190105545891K ⨯⨯-⨯==≈>⨯⨯⨯, 所以在犯错概率不超过0.05的前提下,认为托运超额行李与乘客乘坐座位的等级有关. (2)根据题意可得,托运行李超出免费行李额且不超出10kg 的旅客有7人(其中女性旅客4人),从中随机抽取4人,则其中女性旅客的人数可能为1,2,3,4, 所以补贴券总金额X 的所有可能取值为100元,200元,300元,400元,则()134347C C 4100C 35P X ===,()224347C C 18C 20350P X ===, ()314347C C 12300C 35P X ===,()404347C C 1400C 35P X ===,则X 的分布列为故()100200300400353535357E X =⨯+⨯+⨯+⨯=(元). 【点睛】求随机变量X 的期望与方差的方法及步骤: 1、理解随机变量X 的意义,写出X 可能的全部值; 2、求X 取每个值对应的概率,写出随机变量的分布列; 3、由期望和方差的计算公式,求得数学期望()(),E X D X ;4、若随机变量X 的分布列为特殊分布列(如:两点分布、二项分布、超几何分布),可利用特殊分布列的期望和方差的公式求解.23.(1) 在犯错误的概率不超过1%的前提下,不能判断高一学生对物理题和数学题的学习与性别有关. (2) 2()3P A =. (3)分布列见解析,1()2E X =. 【分析】(1)先根据卡方公式求2K 值,并与参考数据比较作判断,(2)为几何概型概率,测度为面积,先确定甲、乙解答第一道物理题的时间所构造的矩形面积,再求甲比乙先解答完此题所确定的直角梯形面积,最后根据面积比得概率,(3)先确定随机变量取法,再分别根据组合数求对应概率,列表可得分布列,最后根据数学期望公式求期望.。
统计案例分析及典型例题
统计案例分析及典型例题§11.1 抽样方法基础自测1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 .答案 200个零件的长度2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 .答案①②③3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 .答案3,9,184.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= .答案80例1某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案.解抽签法:第一步:将18名志愿者编号,编号为1,2,3, (18)第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签;第三步:将18个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员.随机数表法:第一步:将18名志愿者编号,编号为01,02,03, (18)第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读;第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.第四步:找出以上号码对应的志愿者,就是志愿小组的成员.例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k =100001=100将总体均分为10段,每段含100个工人.(5)从第一段即为0001号到0100号中随机抽取一个号l .(6)按编号将l ,100+l ,200+l ,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.解 应采取分层抽样的方法.3分过程如下:(1)将3万人分为五层,其中一个乡镇为一层.5分(2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300×152=40(人); 300×155=100(人);300×152=40(人); 300×153=60(人),10分因此各乡镇抽取人数分别为60人,40人,100人,40人,60人.12分(3)将300人组到一起即得到一个样本.14分练习:一、填空题1.(安庆模拟)某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现分层抽取容量为45的样本,那么高一、高二、高三年级抽取的人数分别为 .答案15,10,202.某牛奶生产线上每隔30分钟抽取一袋进行检验,则该抽样方法为①;从某中学的30名数学爱好者中抽取3人了解学习负担情况,则该抽样方法为②.那么①,②分别为 .答案系统抽样,简单随机抽样3.下列抽样实验中,最适宜用系统抽样的是(填序号).①某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样②某厂生产的2 000个电子元件中随机抽取5个入样③从某厂生产的2 000个电子元件中随机抽取200个入样④从某厂生产的20个电子元件中随机抽取5个入样答案③4.(2013·重庆文)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是 .答案分层抽样法5.某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则下列判断不正确的是(填序号).①高一学生被抽到的概率最大②高三学生被抽到的概率最大③高三学生被抽到的概率最小④每名学生被抽到的概率相等答案①②③6.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 .答案 67.(天津文,11)一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工人.答案108.将参加数学竞赛的1 000名学生编号如下0001,0002,0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,…,0020,从第一部分随机抽取一个号码为0015,则第40个号码为 . 答案 07959.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取? 解 用分层抽样抽取. (1)∵20∶100=1∶5, ∴510=2,570=14,520=4∴从副处级以上干部中抽取2人,一般干部中抽取14人,从工人中抽取4人.(2)因副处级以上干部与工人人数较少,可用抽签法从中分别抽取2人和4人;对一般干部可用随机数表法抽取14人.(3)将2人、4人、14人编号汇合在一起就得到了容量为20的样本.10.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n 的样本.如果采用系统抽样法和分层抽样法抽取,不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n .解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为n36,分层抽样的比例是36n ,抽取工程师36n ×6=6n (人),抽取技术人员36n ×12=3n (人),抽取技工36n×18=2n (人).所以n 应是6的倍数,36的约数即n =6,12,18,36.当样本容量为(n +1)时,在总体中剔除1人后还剩35人,系统抽样的间隔为135+n ,因为135+n 必须是整数,所以n 只能取6,即样本容量为6.总体分布的估计与总体特征数的估计基础自测1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为 . 答案 52.(2008·山东理)右图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为 . 答案 303.63.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组在频率分布直方图的高为h ,则|a -b |= . 答案 hm4.(2008·山东文,9)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为 .分数 5 4 3 2 1 人数2010303010答案 51025.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg ),得到频率分布直方图如下:根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是 . 答案 40典型例题:例1 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交 作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高? 解 (1)第三组的频率为1464324+++++=51又因为第三组的频数为12,∴参评作品数为5112=60.(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×1464326+++++=18(件).(3)第四组的获奖率是1810=95,第六组上交的作品数量为60×1464321+++++=3(件),∴第六组的获奖率为32=96,显然第六组的获奖率高.例4(14分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min 抽取一包产品,称其重量,分别 记录抽查数据如下: 甲:102, 101, 99, 98, 103, 98,99;乙:110, 115, 90,85,75,115, 110.(1)这种抽样方法是哪一种? (2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定. 解 (1)因为间隔时间相同,故是系统抽样. 2分(2)茎叶图如下:5分(3)甲车间: 平均值:1x =71(102+101+99+98+103+98+99)=100,7分方差:s 12=71[(102-100)2+(101-100)2+…+(99-100)2]≈3.428 6.9分乙车间:平均值:2x =71(110+115+90+85+75+115+110)=100,11分方差:s 22=71[(110-100)2+(115-100)2+…+(110-100)2]≈228.571 4.13分∵1x =2x ,s 12<s 22,∴甲车间产品稳定.14分练习:1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)参加这次测试的学生人数是多少?(3)在这次测试中,学生跳绳次数的中位数落在第几小组内? 解 (1)第四小组的频率=1-(0.1+0.3+0.4)=0.2. (2)设参加这次测试的学生人数是n , 则有n =第一小组频率第一小组频数=5÷0.1=50(人).(3)因为0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10,即第一、第二、第三、第四小组的频数分别为5、15、20、10,所以学生跳绳次数的中位数落在第三小组内. 练习:一、填空题1.下列关于频率分布直方图的说法中不正确的是 .①直方图的高表示取某数的频率②直方图的高表示该组上的个体在样本中出现的频率③直方图的高表示该组上的个体数与组距的比值④直方图的高表示该组上的个体在样本中出现的频率与组距的比值答案①②③2.甲、乙两名新兵在同样条件下进行射击练习,每人打5发子弹,命中环数如下:甲:6,8,9,9,8;乙:10,7,7,7,9.则这两人的射击成绩比稳定.答案甲乙4.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果分成六组:右图是得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为 .答案0.9, 356.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示,若甲、乙两人的平均成绩分别是x甲、x乙,则x甲x乙,比稳定.答案<乙甲7.(上海,9)已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是 .答案10.5、10.5二、解答题10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少? (3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由. 解 (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:391517424+++++=0.08.又因为频率=样本容量第二小组频数, 所以样本容量=第二小组频率第二小组频数=08.012=150. (2)由图可估计该学校高一学生的达标率约为39151742391517++++++++×100%=88%.(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.线性回归方程1.下列关系中,是相关关系的为 (填序号). ①学生的学习态度与学习成绩之间的关系; ②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. 答案 ①②2.为了考察两个变量x 、y 之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l 1和l 2.已知在两人的试验中发现变量x 的观测数据的平均值恰好基础自测相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是(填序号).①直线l1,l2有交点(s,t)②直线l1,l2相交,但是交点未必是(s,t)③直线l1,l2由于斜率相等,所以必定平行④直线l1,l2必定重合答案①3.下列有关线性回归的说法,正确的是(填序号).①相关关系的两个变量不一定是因果关系②散点图能直观地反映数据的相关程度③回归直线最能代表线性相关的两个变量之间的关系④任一组数据都有回归直线方程答案①②③4.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线yˆ=bˆx+aˆ及回归系数bˆ,可以估计和预测变量的取值和变化趋势.其中正确命题的序号是 .答案①②③5.已知回归方程为yˆ=0.50x-0.81,则x=25时,yˆ的估计值为 .答案11.69例1下面是水稻产量与施化肥量的一组观测数据:施化肥量15 20 25 30 35 40 45水稻产量320 330 360 410 460 470 480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解(1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化 肥施用量的增加而增长.例2 (14分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:家庭编号 12345678910x i (收入)千元 0.8 1.1 1.3 1.5 1.5 1.8 2.0 2.2 2.4 2.8y i (支出)千元0.7 1.0 1.2 1.0 1.3 1.5 1.3 1.7 2.0 2.5(1)判断家庭平均收入与月平均生活支出是否相关? (2)若二者线性相关,求回归直线方程. 解 (1)作出散点图:5分观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系. 7分(2)x =101 (0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,y =101(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,9分bˆ=∑∑==-•-ni ini i i x n xyx n y x 1221≈0.813 6,a ˆ=1.42-1.74×0.813 6≈0.004 3,13分∴回归方程y ˆ=0.813 6x +0.004 3. 14分例3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨)标准煤的几组对照数据.x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程yˆ=b ˆx +a ˆ; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解 (1)散点图如下图:(2)x =46543+++=4.5,y =45.4435.2+++=3.5∑=41i ii yx =3×2.5+4×3+4×5+6×4.5=66.5.∑=412i ix=32+42+52+62=86∴bˆ=24124144x x yx yx i i i ii -•-∑∑===25.44865.45.345.66⨯-⨯⨯-=0.7aˆ =y -b ˆx =3.5-0.7×4.5=0.35. ∴所求的线性回归方程为yˆ=0.7x +0.35. (3)现在生产100吨甲产品用煤y =0.7×100+0.35=70.35,∴降低90-70.35=19.65(吨)标准煤.1.科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,℃),并作了统计.年平均气温 12.51 12.84 12.84 13.69 13.33 12.74 13.05 年降雨量748542507813574701432(1)试画出散点图;(2)判断两个变量是否具有相关关系. 解 (1)作出散点图如图所示,(2)由散点图可知,各点并不在一条直线附近,所以两个变量是非线性相关关系.2.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:温度(x ) 0 10 20 50 70 溶解度(y )66.776.085.0112.3128.0由资料看y 与x 呈线性相关,试求回归方程. 解 x =30,y =50.1283.1120.850.767.66++++=93.6.bˆ=25125155x xyx yx i ii ii -•-∑∑==≈0.880 9.aˆ=y -b ˆx =93.6-0.880 9×30=67.173. ∴回归方程为yˆ=0.880 9x +67.173.3.某企业上半年产品产量与单位成本资料如下:月份 产量(千件)单位成本(元)1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6568(1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元? 解 (1)n =6,∑=61i i x =21,∑=61i i y =426,x =3.5,y =71,∑=612i i x =79,∑=61i i i y x =1 481,bˆ=26126166x x yx yx i i i ii -•-∑∑===25.3679715.364811⨯-⨯⨯-=-1.82.aˆ=y -b ˆx =71+1.82×3.5=77.37. 回归方程为yˆ=a ˆ+b ˆx =77.37-1.82x . (2)因为单位成本平均变动bˆ=-1.82<0,且产量x 的计量单位是千件,所以根据回归系数b 的意义有: 产量每增加一个单位即1 000件时,单位成本平均减少1.82元. (3)当产量为6 000件时,即x =6,代入回归方程:yˆ=77.37-1.82×6=66.45(元) 当产量为6 000件时,单位成本为66.45元.一、填空题1.观察下列散点图,则①正相关;②负相关;③不相关.它们的排列顺序与图形对应顺序是 .答案 a ,c ,b2.回归方程yˆ=1.5x -15,则下列说法正确的有 个. ①y =1.5x -15 ②15是回归系数a ③1.5是回归系数a ④x =10时,y =0 答案 13.(2009.湛江模拟)某地区调查了2~9岁儿童的身高,由此建立的身高y (cm)与年龄x (岁)的回归模型为yˆ=8.25x +60.13,下列叙述正确的是 . ①该地区一个10岁儿童的身高为142.63 cm ②该地区2~9岁的儿童每年身高约增加8.25 cm ③该地区9岁儿童的平均身高是134.38 cm④利用这个模型可以准确地预算该地区每个2~9岁儿童的身高 答案 ②4.三点(3,10),(7,20),(11,24)的回归方程是 .答案 yˆ=1.75x +5.75 5.某人对一地区人均工资x (千元)与该地区人均消费y (千元)进行统计调查,y 与x 有相关关系,得到回归直线方程yˆ=0.66x +1.562.若该地区的人均消费水平为7.675千元,估计该地区的人均消费额占人均工资收入的百分比约为 . 答案 83%6.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取8对观测值,计算,得∑=81i i x =52, ∑=81i i y =228, ∑=812i i x =478, ∑=81i i i y x =1 849,则其线性回归方程为 .答案 yˆ=11.47+2.62x 7.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是 .答案①③④8.已知关于某设备的使用年限x与所支出的维修费用y(万元),有如下统计资料:使用年限2 3 4 5 6x维修费用2.23.8 5.5 6.5 7.0y若y对x呈线性相关关系,则回归直线方程yˆ=bˆx+aˆ表示的直线一定过定点 .答案(4,5)二、解答题9.期中考试结束后,记录了5名同学的数学和物理成绩,如下表:学生A B C D E学科数学80 75 70 65 60物理70 66 68 64 62(1)数学成绩和物理成绩具有相关关系吗?(2)请你画出两科成绩的散点图,结合散点图,认识(1)的结论的特点.解(1)数学成绩和物理成绩具有相关关系.(2)以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如下:由散点图可以看出,物理成绩和数学成绩对应的点不分散,大致分布在一条直线附近.10.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积x(m2) 115 110 80 135 105销售价格y(万24.8 21.6 18.4 29.2 22元)(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线. 解 (1)数据对应的散点图如图所示:(2)x =109,y =23.2,∑=512i i x =60 975,∑=51i iiy x=12 952,bˆ=25125155x xyx yx i ii ii -•-∑∑==≈0.196 2aˆ=y -b ˆx ≈1.814 2 ∴所求回归直线方程为yˆ=0.196 2x +1.814 2. 11.某公司利润y 与销售总额x (单位:千万元)之间有如下对应数据:x 10 15 17 20 25 28 32 y11.31.822.62.73.3(1)画出散点图; (2)求回归直线方程;(3)估计销售总额为24千万元时的利润. 解 (1)散点图如图所示:(2)x =71(10+15+17+20+25+28+32)=21,y =71(1+1.3+1.8+2+2.6+2.7+3.3)=2.1,∑=712i i x =102+152+172+202+252+282+322=3 447,∑=71i iiy x=10×1+15×1.3+17×1.8+20×2+25×2.6+28×2.7+32×3.3=346.3,bˆ=27127177x x yx yx i i i ii -•-∑∑===221744731.22173.346⨯-⨯⨯-≈0.104, aˆ=y -b ˆx =2.1-0.104×21=-0.084, ∴yˆ=0.104x -0.084. (3)把x =24(千万元)代入方程得,yˆ=2.412(千万元). ∴估计销售总额为24千万元时,利润为2.412千万元.12.某种产品的广告费支出x 与销售额y (单位:百万元)之间有如下对应数据:x 2 4 5 6 8 y3040605070(1)画出散点图; (2)求回归直线方程;(3)试预测广告费支出为10百万元时,销售额多大? 解 (1)根据表中所列数据可得散点图如下:(2)列出下表,并用科学计算器进行有关计算:i 1 2 3 4 5 x i 2 4 5 6 8 y i3040605070x i y i60 160 300 300 560因此,x =525=5,y =5250 =50,∑=512i i x =145, ∑=512i i y =13 500, ∑=51i i i y x =1 380.于是可得:bˆ=25125155x xyx yx i ii ii -•-∑∑===55514550553801⨯⨯-⨯⨯-=6.5;aˆ=y -b ˆx =50-6.5×5=17.5. 因此,所求回归直线方程为:yˆ=6.5x +17.5. (3)根据上面求得的回归直线方程,当广告费支出为10百万元时,yˆ=6.5×10+17.5=82.5(百万元),即这种产品的销售收入大约为82.5百万元.§11.4 统计案例1.对有线性相关关系的两个变量建立的回归直线方程y ˆ=a ˆ+b ˆx 中,回归系数bˆ与0的大小关系为 .(填序号) ①大于或小于 ②大于 ③小于 ④不小于答案 ①2.如果有90%的把握说事件A 和B 有关系,那么具体计算出的数据χ2 2.706.(用“>”,“<”,“=”填空) 答案 >3.对两个变量y 与x 进行回归分析,分别选择不同的模型,它们的相关系数r 如下,其中拟合效果最好的模型是 .基础自测①模型Ⅰ的相关系数r 为0.98 ②模型Ⅱ的相关系数r 为0.80 ③模型Ⅲ的相关系数r 为0.50 ④模型Ⅳ的相关系数r 为0.25 答案 ①4.下列说法中正确的有:①若r >0,则x 增大时,y 也相应增大;②若r <0,则x 增大时,y 也相应增大;③若r =1或r =-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个点均在一条直线上 . 答案 ①③例1 (14分)调查339名50岁以上人的吸烟习惯与患慢性气管炎的情况,获数据如下:患慢性气管炎未患慢性气管炎 总计 吸烟 43 162 205 不吸烟 13 121 134 合计56283339试问:(1)吸烟习惯与患慢性气管炎是否有关? (2)用假设检验的思想给予证明. (1)解 根据列联表的数据,得到χ2=))()()(()(2c d b d c a b a bc ad n ++++- 2分 =13428356205)1316212143(3392⨯⨯⨯⨯-⨯⨯=7.469>6.6356分 所以有99%的把握认为“吸烟与患慢性气管炎有关”.9分(2)证明 假设“吸烟与患慢性气管炎之间没有关系”,由于事件A ={χ2≥6.635}≈0.01,即A 为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%.14分例2 一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有 缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:(1)对变量y 与x 进行相关性检验;(2)如果y 与x 有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?解 (1)x =12.5,y =8.25,∑=41i iiy x=438,4x y =412.5,∑=412i i x =660,∑=412i i y =291,所以r =)4)(4(42412241241y yx xyx yx i ii ii ii --•-∑∑∑====)25.272291()625660(5.412438-⨯--=25.6565.25≈62.2550.25≈0.995 4.因为r >r 0.05,所以y 与x 有很强的线性相关关系.(2)yˆ=0.728 6x -0.857 1. (3)要使yˆ≤10⇒0.728 6x -0.857 1≤10, 所以x ≤14.901 3.所以机器的转速应控制在14.901 3转/秒以下.例3 下表是某年美国旧轿车价格的调查资料,今以x 表示轿车的使用年数,y 表示相应的年均价格,求y 关于x 的回归 方程.数x年均价格y(美元)2 651 1 943 1 494 1 087 765 538 484 290 226 204解作出散点图如图所示.可以发现,各点并不是基本处于一条直线附近,因此,y与x之间应是非线性相关关系.与已学函数图象比较,用yˆ=e a x bˆˆ 来刻画题中模型更为合理,令zˆ=ln yˆ,则zˆ=bˆx+aˆ,题中数据变成如下表所示:x 1 2 3 4 5 6 7 8 9 10z 7.8837.5727.3096.9916.646.2886.1825.675.4215.318相应的散点图如图所示,从图中可以看出,变换的样本点分布在一条直线附近,因此可以用线性回归方程拟合.由表中数据可得r≈-0.996.|r|>r0.05.认为x与z之间具有线性相关关系,由表中数据得bˆ≈-0.298,aˆ≈8.165,所以zˆ=-0.298x+8.165,最后回代zˆ=ln yˆ,即yˆ=e-0.298x+8.165为所求.1.某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作不太主动参加班级工作合计学习积极性高18 7 25(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?说明理由.解 (1)随机抽查这个班的一名学生,有50种不同的抽查方法,由于积极参加班级工作的学生有18+6=24人,所以有24种不同的抽法,因此由古典概型的计算公式可得抽到积极参加班级工作的学生的概率是P 1=5024=2512,又因为不太主动 参加班级工作且学习积极性一般的学生有19人,所以抽到不太主动参加班级工作且学习积极性一般的学生的概率是P 2=5019.(2)由2χ统计量的计算公式得2χ=25252624)761918(502⨯⨯⨯⨯-⨯⨯≈11.538,由于11.538>10.828,所以可以有99.9%的把握认为“学生的学习积极性与对待班级工作的态度有关系”.2.某个体服装店经营某种服装,一周内获纯利y (元)与该周每天销售这种服装的件数x 之间的一组数据如下:已知∑=712i i x =280, ∑=712i i y =45 309, ∑=71i i i y x =3 487,此时r 0.05=0.754.(1)求x ,y ;(2)判断一周内获纯利润y 与该周每天销售件数x 之间是否线性相关,如果线性相关,求出回归直线方程.解 (1)x =71(3+4+5+6+7+8+9)=6,y =71(66+69+73+81+89+90+91)≈79.86.(2)根据已知∑=712i i x =280, ∑=712i i y =45 309, ∑=71i i i y x =3 487,得相关系数 r =)86.79730945)(67280(86.7967487322⨯-⨯-⨯⨯-≈0.973.。
高中数学统计案例综合检测试题及答案-word文档
高中数学统计案例综合检测试题及答案选修2-3第三章统计案例综合检测时间120分钟,满分150分。
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的) 1.(2019宁夏银川模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4用水量y 4.5 4 3 2.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y^=-0.7x+a,则a等于() A.10.5 B.5.15C.5.2 D.5.25[答案] D[解析] x=2.5,y=3.5,∵回归直线方程过定点(x,y),3.5=-0.72.5+a,a=5.25.故选D.2.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有()A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反[答案] A[解析] 因为b0时,两变量正相关,此时,r0;b0时,两变量负相关,此时r0.3.有下列说法:①随机误差是引起预报值与真实值之间的误差的原因之一;②残差平方和越小,预报精度越高;③在独立性检验中,通过二维条形图和三维柱形图可以粗略判断两个分类变量是否有关系.其中真命题的个数是()A.0 B.1C.2 D.3[答案] D4.有甲、乙两种钢材,从中各取等量样品检验它们的抗拉强度指标如下:甲X 110 120 125 130 135P 0.1 0.2 0.4 0.1 0.2乙X 100 115 125 130 145P 0.1 0.2 0.4 0.1 0.2现要比较两种钢材哪一种抗拉强度较好,应考察哪项指标() A.期望与方差 B.正态分布C.卡方K2 D.概率[答案] A5.为调查中学生近视情况,测得某校男生150名中有80名近视,女生140名中有70名近视.在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.期望与方差 B.排列与组合C.独立性检验 D.概率[答案] C6.(2009海南宁夏理,3)对变量x,y观测数据(x1,y1)(i =1,2,…,10),得散点图1;对变量u,v有观测数据(u1,v1)(i=1,2,…,10),得散点图2.由这两个散点图可以判断.()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关[答案] C[解析] 本题主要考查了变量的相关知识,考查学生分析问题和解决问题的能力.用散点图可以判断变量x与y负相关,u与v正相关.7.某地2019年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:行业名称计算机机械营销物流贸易应聘人数 215830 201950 154676 74570 65280行业名称计算机营销机械建筑化工招聘人数 124620 102935 89115 76516 70436若用同一行业中应聘人数与招聘人数比值的大小来衡量该行业的就业情况,则根据表中数据,就业形势一定是() A.计算机行业好于化工行业B.建筑行业好于物流行业C.机械行业最紧张D.营销行业比贸易行业紧张[答案] B[解析] 建筑行业的比值小于6528076516,物流行业的比值大于7457070436,故建筑好于物流.8.工人月工资y(单位:元)关于劳动生产率x(单位:千元)的回归方程为y^=650+80x,下列说法中正确的个数是()①劳动生产率为1000元时,工资约为730元;②劳动生产率提高1000元时,则工资约提高80元;③劳动生产率提高1000元时,则工资约提高730元;④当月工资为810元时,劳动生产率约为2019元.A.1 B.2C.3 D.4[答案] C[解析] 代入方程计算可判断①②④正确.9.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是()A.由样本数据得到的回归方程为y^=b^x+a^必过样本点的中心(x-,y-)B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好D.若变量y和x之间的相关系数r=-0.9362,则变量y和x之间具有线性相关关系[答案] C[解析] R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C.10.判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是()A.三维柱形图 B.二维条形图C.等高条形图 D.独立性检验[答案] D[解析] 前三种方法只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确.11.在建立两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合得最好的模型为()A.模型1的相关指数R2为0.75B.模型2的相关指数R2为0.90C.模型3的相关指数R2为0.25D.模型4的相关指数R2为0.55[答案] B[解析] 相关指数R2的值越大,意味着残差平方和越小,也就是说模型的拟合效果越好,故选B.12.下面是某市场农产品的调查表.市场供应量表:单价(元/千克) 2 2.4 2.8 3.2 3.6 4供应量(1000千克) 50 60 70 75 80 90市场需求量表:单价(元/千克) 4 3.4 2.9 2.6 2.3 2供应量(1000千克) 50 60 70 75 80 90根据以上信息,市场供需平衡点(即供应量和需求量相等的单价)应在区间()A.(2.3,2.6) B.(2.4,2.6)C.(2.6,2.8) D.(2.8,2.9)[答案] C[解析] 以横轴为单价,纵轴为市场供、需量,在同一坐标系中描点,用近似曲线观察可知选C.二、填空题(本大题共4个小题,每小题4分,共16分,将正确答案填在题中横线上)13.当且仅当r满足________时,数据点(xi,yi)(i=1,2,…,n)在一条直线上.[答案] |r|=1[解析] 当数据点(xi,yi)在一条直线上时,y只受x的影响,即数据点完全线性相关,此时|r|=1.14.已知一个回归直线方程为y^=1.5x+45,x{1,7,5,13,19},则y=__________.[答案] 58.5[解析] 因为x=15(1+7+5+13+19)=9,且y=1.5x+45,所以y=1.59+45=58.5.本题易错之处是根据x的值及y^=1.5x+45求出y的值再求y,由y^=1.5x+45求得的y值不是原始数据,故错误.15.对具有线性相关关系的变量x和y,测得一组数据如下表.若已求得它们的回归直线方程的斜率为6.5,则这条回归直线的方程为________.x 2 4 5 6 8y 30 40 60 50 70[答案] y^=17.5+6.5x[解析] 由数据表得x=5,y=50,所以a^=y-6.5x=17.5,即回归直线方程为y^=17.5+6.5x.16.(2019广东文,12)某市居民2019~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份 2019 2019 2019 2019 2009收入x 11.5 12.1 13 13.3 15支出Y 6.8 8.8 9.8 10 12根据统计资料,居民家庭平均收入的中位数是__________,家庭年平均收入与年平均支出有__________线性相关关系.[答案] 13 正[解析] 中位数的定义的考查,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数.由统计资料可以看出,当平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤)17.(本题满分10分)为了调查胃病是否与生活规律有关,调查某地540名40岁以上的人得结果如下:患胃病未患胃病合计生活不规律 60 260 320生活有规律 20 200 220合计 80 460 540根据以上数据回答40岁以上的人患胃病与生活规律有关吗?[解析] k=540(60200-26020)232022080460=24969602590729.638∵9.638>6.63540岁以上的人患胃病与生活是否有规律有关,有99%的把握认为生活不规律的人易患胃病.18.(本题满分12分)一台机器可以按各种不同的速度运转,其生产的物件有一些会有问题,每小时生产有问题物件的多寡,随机器运转的速度而变化,下面表格中的数据是几次试验的结果.速度(转/秒) 每小时生产有问题物件数8 512 814 916 11(1)求出机器速度影响每小时生产有问题物件数的回归直线方程;(2)若实际生产中所允许的每小时最大问题物件数为10,那么机器的速度不得超过多少转/秒?[解析] (1)用x表示机器速度,y表示每小时生产有问题物件数,那么4个样本数据为:(8,5)、(12,8)、(14,9)、(16,11),则x-=12.5,y-=8.25.于是回归直线的斜率为b^=xiyi -4x-y-x2i-4x-2=25.5350.7286,a^=y--b^x-=-0.8575,所以所求的回归直线方程为y=0.7286x-0.8575.(2)根据公式y^=0.7286x-0.8575,要使y10,则就需要0.7286x-0.857510,x14.9019,即机器的旋转速度不能超过14.9019转/秒.19.(本题满分12分)在从烟台大连的某次航运中,海上出现恶劣气候.随机调查男、女乘客在船上晕船的情况如下表所示:晕船不晕船合计男人 32 51 73女人 8 24 32合计 40 75 115根据此资料你是否认为在恶劣气候航行中,男人比女人更容易晕船?[解析] 男人晕船所占比例为3283100%=0.386,女人晕船所占比例为832100%=0.25,虽然0.386远大于0.25,但我们不能用此判断在恶劣气候中航行,男人比女人更容易晕船,而应根据独立性检验进行分析.由公式得:K2=115(3224-518)2833240751.870.因为1.8702.706,所以我们没有充分的证据说晕船跟男女性别有关.20.(本题满分12分)有两个分类变量X与Y,其一组观测的22列联表如下表.其中a,15-a均为大于5的整数,则a取何值时有90%以上的把握认为“X与Y之间有关系”?y1 y2x1 a 20-ax2 15-a 30+a[解析] 查表可知,要使有90%以上的把握认为X与Y之间有关系,则K22.706,而其观测值k=65[a(30+a)-(20-a)(15-a)]220451550 =13(65a-300)2604550=13(13a-60)26090,解k2.706得a7.19或a2.04.又因为a5且15-a5,aZ,所以a=8,9,故当a取8或9时有90%以上的把握认为“X与Y之间有关系”.[点拨] 首先计算K2值,由题意K22.706,求得a的范围,再结合a5且15-a5,aZ,即可求得a的值.21.(本题满分12分)某超市为了了解热茶销售与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表如下表:气温x(℃) 26 18 13 10 4 -1杯数y 20 24 34 38 50 64画出散点图并计算相关系数r,判断热茶销售量与气温之间是否具有线性相关关系.[解析] 由表中数据画出散点图如图所示.由表中数据得x=16(26+18+13+10+4-1)11.67,y=16(20+24+34+38+50+64)38.33,i=16xiyi=2620+1824+1334+1038+450-164=1910,i =16x2i=262+182+132+102+42+(-1)2=1286,i=16y2i=202+242+342+382+502+642=10172,所以r-0.97,因为|r|0.970.75,所以热茶销售量与气温之间具有很强的线性相关关系.22.(本题满分14分)在一个文娱网络中,点击观看某个节目的累积人次和播放天数如下表:播放天数 1 2 3 4 5点击观看的累积人次 51 134 213 235 262播放天数 6 7 8 9 10点击观看的累积人次 294 330 378 457 533(1)画出散点图;(2)判断两变量之间是否具有线性相关关系,求回归直线方程是否有意义?[解析] (1)散点图如图所示.(2)由散点图知两变量线性相关,故求回归直线方程有意义.或借助科学计算器,完成下表中的有关计算.i 1 2 3 4 5 6 7 8 9 10xi 1 2 3 4 5 6 7 8 9 10yi 51 134 213 235 262 294 330 378 457 533xiyi 51 268 639 940 1310 1764 2310 3024 4113 5330x=5.5,y=288.7,i=110x2i=385,i=110y2i=1020953,i=110xiyi=19749 利用上表的结果,计算累积人次与播放天数之间的相关系数r=19749-105.5288.7(385-105.52)(1020953-10288.72)0.9840.75.这说明累积人次与播放天数之间存在着线性相关关系,自然求回归直线方程有意义.。
高一数学统计案例试题答案及解析
高一数学统计案例试题答案及解析1.用辗转相除法求得459和357的最大公约数是_________ .[【答案】51.【解析】由用辗转相除法知:由于459÷357,余数是102;357÷102,余数是51;102÷51,整除;所以459和357的最大公约数是51; 故应填入:51.【考点】辗转相除法.2.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高儿子身高则,对的线性回归方程为( )A. B. C. D.【答案】C.【解析】∵,,∴,,∴线性回归方程为.【考点】线性回归方程.3.某公司的广告费支出与销售额(单位:万元)之间有下列对应数据:由资料显示对呈线性相关关系。
x24568根据上表提供的数据得到回归方程中的,预测销售额为115万元时约需万元广告费.【答案】15【解析】由题知=(2+4+5+6+8)=5,=(30+40+60+50+70)=50,因为回归直线过样本中心点(,),所以50=6.5×5+,解得=17.5,所以回归直线方程为,令=115,解得=15.考点:回归直线方程4.某单位为了制定节能减排的目标,先调查了用电量y(度)与气温x (0C)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温(0C)181310-1由表中数据,得线性回归方程则a= .【答案】60【解析】先求得,再由线性回归方程必过点得到:.【考点】线性回归.5.用秦九韶算法求多项式f(x)=7x3+3x2-5x+11在x=23时的值,在运算过程中下列数值不会出现的是()A.164B.3 767C.86 652D.85 169【答案】D【解析】,故D正确。
【考点】秦九韶算法6.某单位为了制定节能减排的目标,先调查了用电量(度)与气温(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据,得线性回归方程,则=.【答案】60【解析】根据所给的表格中的数据,求出数据的样本中心点,根据样本中心点在线性回归直线上,代入可得a的值。
高一数学统计试题答案及解析
高一数学统计试题答案及解析1. 2004奥运首金获得者杜丽在决赛中的成绩如下表:下列说法正确的是()A.平均成绩是B.众数是10.8环C.极差是1.2环D.中位数是10.5环,比平均成绩高0.1环【答案】D【解析】解答本题可利用逐个选项考查排除的方法。
如A利用公式计算,平均成绩,其不正确;B众数除10.8还有10.6,10.4等,其不正确;极差=最大值-最小值=10.8-9.4=1.4, C不正确。
故选D。
【考点】本题主要考查统计中平均数、众数、中位数、极差等概念及平均数的计算。
点评:极差反映了一组数据变化范围的大小,求极差的方法是用一组数据中的最大值减去最小值;中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(或最中间两个数的平均数),叫做这组数据的中位数;一组数据中出现次数最多的数据叫做众数;2.某校在一次学生身体素质调查中,在甲、乙两班中随机抽10名男生测验100m短跑,测得成绩如下(单位:):甲15.114.814.114.615.314.814.914.715.214.5问哪个班男生100m短跑平均水平高一些?【答案】甲班男生短跑水平高些【解析】,.,甲班男生短跑水平高些.【考点】本题考查了平均数的概念及计算.点评:运用求平均数公式:,分别计算比较,平均数高者为优秀,数基本题型。
3.一组数据的方差是,将这组数据中的每一个数据都乘以2,所得到的一组数据的方差是()A.;B.;C.;D.【答案】C【解析】设原来数据的平均数为,则将该数据中每一个数据,都乘以2后,则新数据的平均数为2。
∵方差S2=∴每个数据都乘以2后新数据的方差为,故选C.【考点】本题主要考查平均数、方差的意义及其计算公式。
点评:方差反映了一组数据的波动大小,方差小的表示稳定---较集中地稳定在平均数附近。
本题可作为结论应用。
4.两变量之间的相关关系是一种关系.【答案】非确定性【解析】本题根据相关关系的定义填。
高一数学统计试题
高一数学统计试题1.如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:请观察图形,求解下列问题:(1)79.5~89.5这一组的频率、频数分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格)和平均分.【答案】(1)0.25,15; (2)0.75, 70.5【解析】(1)利用频率分布直方图中,纵坐标与组距的乘积是相应的频率,频数=频率×组距,可得结论;(2)纵坐标与组距的乘积是相应的频率,再求和,即可得到结论.试题解析:(1)由频率的意义可知,成绩在79.5~89.5这一组的频率为:0.025×10=0.25,频数:60×0.25=15;(2)利用纵坐标与组距的乘积是相应的频率可得及格率为0.015×10+0.025×10+0.03×10+0.005×10=0.75平均分为: 70.5【考点】用样本的频率分布估计总体分布;频率分布直方图.2.学校从参加高一年级期中考试的学生中抽出50名学生,并统计了他们的数学成绩(成绩均为整数且满分为100分),数学成绩分组及各组频数如下:[40,50),2;[50,60),3;[60,70),14;[70,80),15;[80,90),12;[90,100],4.(1)在给出的样本频率分布表中,求A,B,C,D的值;(2)估计成绩在80分以上(含80分)学生的比例;(3)为了帮助成绩差的学生提高数学成绩,学校决定成立“二帮一”小组,即从成绩在[90,100]的学生中选两位同学,共同帮助成绩在[40,50)中的某一位同学.已知甲同学的成绩为42分,乙同学的成绩为95分,求甲、乙两同学恰好被安排在同一小组的概率.样本频率分布表如下:【答案】(1)A="12" ; B=0.24 ; C="50" ; D="1" ;(2)0.32(3).【解析】(1)根据题意计算可得[90,100]一组的频数,根据题意中的数据,即可作出A、B、C、D;(2)由(1)可得,成绩在[85,100)的学生数,再结合题意,计算可得答案;(3)根据题意,记成绩在[40,50)上的2名学生为a、甲,在[90,100)内的4名学生记为1、2、3、乙,列举“二帮一”的全部情况,可得其情况数目与甲乙两名同学恰好在同一小组的情况数目,由古典概型公式,计算可得答案.解:(1)A="12" ; B=0.24 ; C="50" ; D="1" .(2)估计成绩在80分以上(含80分)的学生比例为0.24+0.08=0.32.(3)成绩在[40,50)内有2人,记为甲、A,成绩在[90,100]内有4人,记为乙、B、C、D.则“二帮一”小组有以下12种分组办法:甲乙B,甲乙C,甲乙D,甲BC,甲BD,甲CD,A乙B,A乙C,A乙D,ABC,ABD,ACD.其中甲、乙两同学被分在同一小组有3种办法:甲乙B,甲乙C,甲乙D.所以甲、乙两同学恰好被安排在同一小组的概率为P==.【考点】1.列举法计算基本事件数及事件发生的概率;2.用样本的频率分布估计总体分布.3.没有信息损失的统计图表是()A.条形统计图B.扇形统计图C.折线统计图D.茎叶图【答案】D【解析】由统计图的知识可知A、B、C都有信息损失.【考点】统计图.4.用秦九韶算法计算多项式在时的值时,的值为【答案】-57【解析】由秦九韶算法知,当时,.【考点】算法案例.5.某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共抽取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1020h,1032 h,则抽取的100件产品的使用寿命的平均值为_______h.【答案】1013【解析】三个分厂各抽25,50,25,这100件产品的使用寿命的平均值为【考点】1.分层抽样;2.平均数.6.某学校高一年级有35个班,每个班的56名同学都是从1到56编的号码,为了交流学习经验,要求每班号码为14的同学留下进行交流,这里运用的是()A.分层抽样B.抽签抽样C.随机抽样D.系统抽样【答案】D【解析】当总体容量N较大时,采用系统抽样,将总体分成均衡的若干部分即将总体分段,分段的间隔要求相等,系统抽样又称等距抽样,故选D。
高一数学三:第二章统计复习+练习
第二章统计一、随机抽样1.简单随机抽样设一个总体的个数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.(1)抽签法制签→抽签→成样抽签法简便易行,当总体的个体数不多时,适宜采用这种方法.(2)随机数表法编号→数数→成样结论:①用简单随机抽样,从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时任一个体被抽到的概率为1;在整个抽N样过程中各个个体被抽到的概率为n;N②基于此,简单随机抽样体现了抽样的客观性与公平性;③简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样.2.系统抽样当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先制定的规则,从每一部分抽取1个个体,得到所需的样本,这种抽样叫做系统抽样(也称为机械抽样).系统抽样的步骤可概括为:编号→分段→确定起始的个体编号→抽取样本按照先确定的规则(常将l加上间隔k)抽取样本:k,2,-⋅⋅⋅+.++,kln,lk(l l)1 3.分层抽样当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层.结论:(1)分层抽样是等概率抽样,它也是公平的.用分层抽样从个体数为N的总体中抽取一个容量为n的样本时,在整个抽样过程中每个个体被抽到的概率相等,都等于n;N(2)分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表性,在实践的应用更为广泛.例1在简单随机抽样中,某一个个体被抽中的可能性( ).A.与第几次抽样无关,第一次抽中的可能性要大些B.与第几次抽样无关,每次抽中的可能性都相等C.与第几次抽样有关,最后一次抽中的可能性要大些D.每个个体被抽中的可能性无法确定答案:B解析:在简单随机抽样中,每一个个体被抽中的可能性都相等,与第几次抽样无关.例2假设要抽查某种品牌的850颗种子的发芽率,抽取60颗进行实验.利用随机数表抽取种子时,先将850颗种子按001,002,…,850进行编号,如果从随机数表第8行第2列的数3开始向右读,请你依次写出最先检测的4颗种子的编号________.(下面摘取了随机数表第7行至第9行)84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54答案:301,637,169,555解析:第8行第2列的数3开始向右读第一个小于850的数字是301,第二个数字是637,也符合题意,第三个数字是859,大于850,舍去,第四个数字是169,符合题意,第五个数字是555,符合题意,故答案为:301,637,169,555.例3某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为().A.11 B.12 C.13 D.14答案:B解析:根据系统抽样的等可能性可知,每人入选的可能性都是错误!,由题设可知区间[481,720]的人数为240,所以编号落入区间[481,720]的人数为错误!×240=12.例4某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.答案:37 20解析:由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第8组抽出的号码为22+(8-5)×5=37.二、用样本估计总体1.频率分布的概念:频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.2.茎叶图制作方法:将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).3.众数、中位数、平均数(1)众数:一组数据中出现次数最多的数称为这组数据的众数.一组数据中的众数可能不止一个,反映了该组数据的集中程度.(2)中位数:一组数据按从小到大的顺序排成一列,处于中间位置的数称为这组数据的中位数.一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.(3)平均数:一组数据的和与这组数据的个数的商.数据x1,x2,…,x n的平均数为x n=x1+x2+…+x nn.4.方差、标准差(1)方差s2= ,描述一组数据围绕平均数波动程度的大小.(2)标准差s=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].若数据组x1,x2,…,x n的平均数为错误!,方差为s2,标准差为s,则数据组ax1+b,ax2+b,…,ax n+b(a,b为常数)的平均数为a错误!+b,方差为a2s2,标准差为as.例1在某电脑杂志的一篇文章中,每个句子的字数如下10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)画出两组数据的茎叶图;(2)比较分析两组数据,能得出什么结论?解:(1)依题意,画出茎叶图如下图所示(2)电脑杂志文章中每个句子的字数集中在10~30之间,中位数为22。
高一数学统计试题
高一数学统计试题1.观察下列四个散点图,两变量具有线性相关关系的是()【答案】A【解析】由线性相关关系的定义可知.2.城市交通拥堵已经成为日益突出的社会问题,为了缓解交通高峰的压力,某市政府采取了错时上下班的措施.下表是某路段在采取措施前后30 min通过的车流量.时间段6∶30~7∶007∶00~7∶307∶30~8∶00在6∶30到9∶30这个时间段内,采取措施后下列说法正确的是()A.采取措施后平均车流量减少B.采取措施后平均车流量增大C.采取措施后车流量的方差大于采取措施前的D.采取措施后车流量的方差小于采取措施前的【答案】D【解析】由于=2100辆,=2100辆,所以采取措施前后的平均车流量没有变化.由于对样本数据和平均值缩小相同比例不影响结果,故可将数据缩小为原数据的1%.所以可得≈24.7,≈6.7.3.某单位有职工人,其中青年职工人,中年职工人,老年职工人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本 . 若样本中的青年职工为人,则样本容量为.【答案】15【解析】设样本容量为,样本容量为15【考点】分层抽样4.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为()A.16B.17C.18D.19【答案】C【解析】第一组用简单随机抽样抽取的号码为,选C.【考点】系统抽样法5.如果5个数x1,x2,x3,x4,x5的平均数是7,那么x1+1,x2+1,x3+1,x4+1,x5+1这5个数的平均数是()A.5B.6C.7D.8【答案】D【解析】利用平均数公式计算即可.x 1,x2,x3,x4,x5的平均数是7,即(x1+x2+x3+x4+x5的)÷5=7,从而x1+1,x2+1,x3+1,x4+1,x 5+1这5个数的平均数等于(x1+1+x2+1+x3+1+x4+1+x5+1)÷5=8故选D点评:本题考查平均数的性质,若在原来数据前乘以同一个数,平均数也乘以同一个数,而方差要乘以这个数的平方,在数据上同加或减同一个数,方差不变.6.下列数字特征一定是数据组中的数是()A.众数B.中位数C.标准差D.平均数【答案】A【解析】众数是一组数据中出现次数最多的数,它一定在这一组数据中;中位数、标准差与平均数都是通过计算得到的,所以他们不一定是数据中的数.解:众数是一组数据中出现次数最多的数,它一定在这一组数据中;如果这组数据有奇数个,则中位数是正中间一下,如果是偶数个,则是中间两个数的平均数,所以中位数则不一定是这一组数据中的数;标准差与平均数都是通过计算得到的,所以他们不一定是数据中的数.故选A.点评:本题考查数字特征的应用,解题时要认真审题,注意熟练掌握基本概念.7.某纺织厂订购一批棉花,其各种长度的纤维所占的比例如下表所示:(1)请估计这批棉花纤维的平均长度与方差;(2)如果规定这批棉花纤维的平均长度为4.90厘米,方差不超过1.200,两者允许误差均不超过0.10视为合格产品.请你估计这批棉花的质量是否合格?【答案】(1)这批棉花纤维的平均长度为4.85(厘米),方差为1.3275(平方厘米).(2)这批产品为不合格.【解析】(1)平均长度等于纤维长度与所占比例成积的和,利用方差公式计算得出方差(2)棉花纤维长度的平均值达到标准,而方差超过标准,可以认为这批产品为不合格.解:(1)由题知,这批棉花纤维长度的样本平均值为:4.85(厘米),棉花纤维长度的方差为:(3﹣4.85)2×0.25+(5﹣4.85)2×0.4+(6﹣4.85)2×0.35=1.3275(平方厘米).由此估计这批棉花纤维的平均长度为4.85(厘米),方差为1.3275(平方厘米).(2)棉花纤维长度的平均值达到标准,而方差超过标准,可以认为这批产品为不合格.点评:本题考查平均数、方差的计算及意义,属于基础题.8.根据三个点(3,10),(7,20),(11,24)的坐标数据,求得的回归直线方程是()A.=﹣5.75x+1.75B.=5.75x﹣1.75C.=1.75x+5.75D.=﹣1.75x+5.75【答案】C【解析】本题可采用排除法和代入法来解答,根据三个点的坐标分析出变量x,y之间为正相关关系,可排除回归系数为两个答案,进而根据样本中心点在回归直线上,代入可判断答案.解:根据点(3,10),(7,20),(11,24)的坐标可得y随x的增大,呈增大的趋势,故x,y之间应该是正相关的关系故回归系数为正值,故可排除A,D两个答案又∵=7,=18,满足=1.75x+5.75故选C点评:本题考查的知识点是线性回归方程,熟练掌握正负相关与回归系数的关系及样本中心点在回归直线上,是解答的关键.9.如图所示,有5组(x,y)数据,去掉组数据后,剩下的4组数据的线性相关性最大.【答案】D【解析】根据线性相关的意义知,当所有的数据在一条直线附近排列时,这些事件具有很强的线性相关关系,在条件中所给的五组数据中只有D不在这条线附近,故去掉D点.解:∵A、B、C、E四点分布在一条直线附近且贴近某一直线,D点离得远.∴去掉D点剩下的4组数据的线性相关性最大故答案为:D.点评:本题考查两个变量的线性相关,考查观察散点图,考查具有线性相关关系的一组数据的特点,是一个基础题.10.长沙市统计局就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在).(1)求居民月收入在的频率;(2)根据频率分布直方图算出样本数据的中位数;(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10000人中用分层抽样方法抽出100人作进一步分析,问月收入在的这段应抽多少人?【答案】【解析】(1)根据频率=小矩形的高×组距来求;(2)根据中位数的左右两边的矩形的面积和相等,所以只需求出从左开始面积和等于0.5的底边横坐标的值即可,运用取中间数乘频率,再求之和,计算可得平均数;(3)求出月收入在[2500,3000)的人数,用分层抽样的抽取比例乘以人数,可得答案试题解析:(Ⅰ)月收入在的频率为(Ⅱ),,,所以,样本数据的中位数(元);(3)居民月收入在的频率为,所以人中月收入在的人数为(人),再从人用分层抽样方法抽出人,则月收入在的这段应抽取人.【考点】频率分布直方图。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本资料来源于《七彩教育网》
练习试题三
一、选择题
1.下列说法正确的有()
①最小二乘法指的是把各个离差加起来作为总离差,并使之达到最小值的方法;
②最小二乘法是指把各离差的平方和作为总离差,并使之达到最小值的方法;
③线性回归就是由样本点去寻找一条直线,贴近这些样本点的数学方法;
④因为由任何一观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验.A.1个B.2个C.3个D.4个
2.设有一个回归直线方程2 1.5
y x,则变量x增加1个单位时()A.y平均增加 1.5个单位
B.y平均增加2个单位
C.y平均减少 1.5个单位
D.y平均减少2个单位
3.线性回归直线方程y a bx必过定点()
A.(00)
x y,
x,C.(0)y,D.()
,B.(0)
4.下列变量关系是相关关系的是()
①学生的学习态度与学习成绩之间的关系;
②教师的执教水平与学生的学习成绩之间的关系;
③学生的身高与学生的学习成绩之间的关系;
④家庭的经济条件与学生的学习成绩之间的关系.
A.①②B.①③C.②③D.②④
5.下列变量关系是函数关系的是()
A.三角形的边长与面积之间的关系
B.等边三角形的边长与面积之间的关系
C.四边形的边长与面积之间的关系
D.菱形的边长与面积之间的关系
答
二、填空题
6.线性回归模型y bx a e中,b,a.
7.我们可用相关指数2
R来刻画回归的效果,其计算公式为.
8.我们常利用随机变量2
K来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验,其思想类似于数学上的.
9.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为
.
10.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表
患慢性气管炎未患慢性气管炎合计
吸烟43 162 205
不吸烟13 121 134
合计56 283 339
根据列联表数据,求得2
K.
三、解答题
11.在7块面积相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg)
施化肥量x15 20 25 30 35 40 45 水稻产量y330 345 365 405 445 450 455 (1)试求y对x的线性回归方程;
(2)当施化肥量28
x kg时,预测水稻产量.
12.某大型企业人力资源部为了研究企业员工工作积极性和对企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:
积极支持企业改革不赞成企业改革合计工作积极54 40 94
工作一般32 63 95
合计86 103 189
对于人力资源部的研究项目,根据上述数据能得出什么结论?
13.某10名同学的数学、物理、语文成绩如下表:
数111
8
111
797
物
1
9
9
7
9
8
8
7
7
7
语
8
1
111111
9
9
试分别研究他们的数学成绩与物理成绩的关系、数学成绩与语文成绩的关系,你能发现什么
规律?
答案
1.答案:B
2.答案:C
3.答案:D
4.答案:A
5.答案:B
6.答案:
1
2
1
()()()
n
i
i i n
i
i x x y y x x ,y
bx
7.答案:2
2
12
1
()1
()
n
i
i i n
i
i y y R
y y 8.答案:反证法9.答案:正相关10.答案:7.469 11. 解:(1) 4.75256.79y
x
;
(2)389.79kg
12.解:根据列联表中的数据,得到
2
2189(54634032)10.76
949586103
K.
因10.767.879,所以有99.5%的把握说:员工“工作积极”与“积极支持企业改革”是有
关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.
13.解:可求出物理成绩与数学成绩的相关系数0.870.75
r,从而认为物理成绩与数学成绩之间具有很强的线性相关关系.而由语文成绩与数学成绩的相关系数0.092
r远小于0.75,说明语文成绩与数学成绩不具有线性相关关系.因此,数学成绩好的同学,一般来
说物理成绩也较好,它们之间的联系较紧密,而数学成绩好的同学,语文成绩也可能好,也
可能差,它们之间的关系不大.。