2019人教版 高中数学 第三章 统计案例章末过关检测卷 选修2-3
2018-2019学年高中数学(人教B版)选修2-3学案:第3章 统计案例 章末检测(A)Word版含答案
第三章 统计案例(A)(时间∶120分钟 满分∶150分)一、选择题(本大题共12小题,每小题5分,共60分)1.下列变量之间:①人的身高与年龄、产品的成本与生产数量;②商品的销售额与广告费;③家庭的支出与收入.其中不是函数关系的有( )A .0个B .1个C .2个D .3个 2.已知回归直线方程y ^=b ^x +a ^,其中a ^=3且样本点中心为(1,2),则回归直线方程为( ) A.y ^=x +3B.y ^=-2x +3C.y ^=-x +3D.y ^=x -33.如果经计算得到事件A 和事件B 无关,那么( )A .χ2≥6.635B .χ2≤6.635C .χ2≤3.841D .χ2≥3.8414.某工厂某产品产量y (千件)与单位成本x (元)满足回归直线方程y ^=75.7-2.13x ,则以下说法中正确的是( )A .产量每增加1000件,单位成本下降2.13元B .产量每减少1000件,单位成本下降2.13元C .产量每增加1000件,单位成本上升2130元D .产量每减少1000件,单位成本上升2130元5.对两个变量y 和x 进行线性相关检验,已知n 是观察值组数,r 是相关系数,且已知: ①n =10,r =0.9533;②n =15,r =0.3012;③n =17,r =0.9991;④n =3,r =0.9950. 则变量y 与x 具有线性相关关系的是( )A .①和②B .①和③C .②和④D .③和④6.根据一位母亲记录儿子3~9岁的身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)的回归直线方程y ^=7.19x +73.93,用此方程预测10岁时的身高,有关叙述正确的是( )A .身高一定为145.83cmB .身高大于145.83cmC .身高小于145.83cmD .身高在145.83cm 左右7.考察棉花种子经过处理跟生病之间的关系得到如下表数据:A .种子经过处理跟是否生病有关B .种子经过处理跟是否生病无关C .种子是否经过处理决定是否生病D .以上都是错误的8.对于线性相关系数r ,叙述正确的是( )A .|r |∈(0,+∞),|r |越大,相关程度越大,反之,相关程度越小B .r ∈(-∞,+∞),r 越大,相关程度越大,反之,相关程度越小C .|r |≤1,|r |越接近于1,相关程度越大,|r |越接近于0,相关程度越小D .以上说法都不对9.已知x 、y 之间的一组数据:y 与x 之间的回归直线方程y =β0+β1x 必定过( )A .(0,0)点B .(x ,0)点C .(0,y )点D .(x ,y )点 10.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的斜率是b ^,纵截距是a ^,那么必有( )A.b ^与r 的符号相同B.a ^与r 的符号相同 C.b ^与r 的符号相反 D.a ^与r 的符号相反11.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)A .90%B .95%C .99%D .100%12.某卫生机构抽查了366人进行健康体检,阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,则认为糖尿病患者与遗传有关系,这种判断犯错误的概率不超过( )A .0.001B .0.005C .0.01D .0.05二、填空题(本大题共4小题,每小题5分,共20分)13.对于回归直线方程y ^=4.75x +257,当x =28时,y 的估计值为________.14.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则χ2=______.15.从某地区老人中随机抽取600人,其生活能否自理的情况如下表所示:16.许多因素都会影响贫穷,教育也许是其中的一个.在研究这两个因素的关系时,收集了某国50个地区的成年人至多受过9年教育的百分比(x )和收入低于官方规定的贫困线的人数占本地区人数的百分比(y )的数据,建立的回归直线方程是y ^=4.6+0.8x .这里,斜率的估计等于0.8说明___________________________________________________________________________________________________________________________________________________________________________________________________________________.三、解答题(本大题共6小题,共70分)17.(10分)调查了90名不同男、女大学生对于外出租房的态度,各种态度人数分布见下表,试判断学生性别与其态度间有无关系?18.(12分)为了了解某地母亲身高x与女儿身高Y的相关关系,随机测得10对母女的身高如表所示:19.(12分)调查在2~3级风的海上航行中男女乘客的晕船情况,结果如下表所示:20.(12分)一机器可以按各种不同的速度运转,其生产的物件有一些会有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数,现观测得到(x,y)的4组观测值为(8,5),(12,8),(14,9),(16,11).(1)假定y与x之间有线性相关关系,求y对x的回归直线方程.(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒.(精确到1转/秒)21.(12分)对某校学生进行心理障碍测试得到如下列联表.22.(12分)在钢中碳含量对于电阻的效应的研究中,得到如下表所示的一组数据:y。
(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试(含答案解析)(4)
一、选择题1.已知x 与y 之间的几组数据如下表:参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()niix x y y r --=∑上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >2.以下四个结论,正确的是( )①质检员从匀速传递的产品生产流水线上,每间隔15分钟抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②在回归直线方程0.1.3ˆ1y x =+中,当变量ˆx 每增加一个单位时,变量ˆy增加0.13个单位;③在频率分布直方图中,所有小矩形的面积之和是1;④对于两个分类变量X 与Y ,求出其统计量2K 的观测值k ,观测值k 越大,我们认为“X 与Y 有关系”的把握程度就越大. A .②④B .②③C .①③D .③④3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 4.为了检验设备M 与设备N 的生产效率,研究人员作出统计,得到如下表所示的结果,则( )附:参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.A.有90%的把握认为生产的产品质量与设备的选择具有相关性B.没有90%的把握认为生产的产品质量与设备的选择具有相关性C.可以在犯错误的概率不超过0.01的前提下认为生产的产品质量与设备的选择具有相关性D.不能在犯错误的概率不超过0.1的前提下认为生产的产品质量与设备的选择具有相关性5.某研究型学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如下表:计算得K2=10,则下列选项正确的是()A.有99.5%的把握认为使用智能手机对学习有影响B.有99.5%的把握认为使用智能手机对学习无影响C.在犯错误的概率不超过0.1%的前提下,认为使用智能手机对学习有影响D.在犯错误的概率不超过1%的前提下,认为使用智能手机对学习无影响6.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是()A.90% B.95% C.97.5% D.99.5%7.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程35y x=-,变量x增加一个单位时,y平均增加5个单位;③线性回归直线y bx a=+必过(),x y;④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K2=13.079.则其两个变量间有关系的可能性是90%.其中错误的个数是( )A.1 B.2C.3 D.48.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④9.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠不冷漠总计多看电视6842110少看电视203858总计8880168则认为多看电视与人冷漠有关系的把握大约为()附:K2=.P(K2≥k0)0.100.050.0250.0100.0050.001k0 2.706 3.841 5.024 6.6357.87910.828A.99% B.97.5%C.95% D.90%10.已知样本789x y、、、、的平均数是82xy值为A.8 B.32 C.60 D.8011.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: )C(件)由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .5812.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的13,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若有95%的把握认为是否喜欢韩剧和性别有关,求男生至少有______人.14.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:男公务员 女公务员 生二胎 80 40 不生二胎4040则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82815.某学校开展研究性学习活动,一组同学获得了下面的一组试验数据: x 1.99 3 4 5.1 8 y0.991.582.012.353.00现有如下5个模拟函数:①y =0.58x -0.16;②y =2x -3.02;③y =x 2-5.5x +8;④y =log 2x ;⑤y =+1.74请从中选择一个模拟函数,使它能近似地反映这些数据的规律,应选________(填序号). 16.某单位为了了解用电量y (度)与气温x (度)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下的对照表由表中数据,得回归直线方程ˆˆˆy bx a =+,若ˆ2b=-,则ˆa =________. 17.给出下列5种说法:①标准差越小,样本数据的波动也越小; ②回归分析研究的是两个相关事件的独立性;③在回归分析中,预报变量是由解释变量和随机误差共同确定的; ④相关指数是用来刻画回归效果的,的值越大,说明回归模型的拟合效果越好.⑤对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越小.其中说法正确的是________(请将正确说法的序号写在横线上).18.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.19.某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表的数据,可以有_____%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.(注:独立性检验临界值表参考第9题,K 2=2()()()()()n ad bc a b c d a c b d -++++.) 20.已知如下四个命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于0,表示回归效果越好;②在回归直线方程ˆ0.812yx =-中,当解释变量x 每增加一个单位时,预报变量ˆy平均增加0.8个单位;③两个变量相关性越强,则相关系数的绝对值就越接近于1;④对分类变量X 与Y ,对它们的随机变量2K 的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越大.其中正确命题的序号是__________.三、解答题21.某共享单车经营企业欲向甲巿投放单车,为制定适宜的经营策略﹐该企业首先在已投放单车的乙市进行单车使用情况调查.调查过程分随机问卷﹑整理分析及开座谈会三个阶段.在随机问卷阶段,A ,B 两个调查小组分赴全市不同区域发放问卷并及时收回﹔在整理分析阶段,两个调查小组从所获取的有效问卷中,针对15岁至45岁的人群,按比例随机抽取了300份,进行了数据统计,具体情况如下表: 组别 年龄A 组统计结果B 组统计结果 经常使用单车 偶尔使用单车 经常使用单车 偶尔使用单车 [)15,2527人13人40人20人参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:样本,再用分层抽样的方法将“年龄达到35岁”的被抽个体数分配到“经常使用单车”和“偶尔使用单车”中去.①求这60人中“年龄达到35岁且偶尔使用单车”的人数﹔②为听取对发展共享单车的建议,调查组专门组织所抽取的"年龄达到35岁且偶尔使用单车的人员召开座谈会,会后共有3份礼品赠送给其中3人,每人1份(其余人员仅赠送骑行优惠券).已知参加座谈会的人员中有且只有4人来自A组,求A组这4人中得到礼品的人数X的分布列和数学期望;(2)从统计数据可直观得出“是否经常使用共享单车与年龄有关”的结论.在用独立性检验的方法说明该结论成立时,为使犯错误的概率尽可能小,当年龄设定为25岁时,根据已有数据,完成下列2×2列联表(单位:人),并判断是否在犯错误的概率不超过1%的前提下有把握认为“经常使用共享单车与年龄有关”?22.2020年是脱贫攻坚的收官之年,国务院扶贫办确定的贫困县全部脱贫摘帽,脱贫攻坚取得重大胜利,为确保我国如期全面建成小康社会,实现第一个百年奋斗目标打下了坚实的基础在产业扶贫政策的大力支持下,西部某县新建了甲、乙两家玩具加工厂,加工同一型号的玩具质监部门随机抽检了两个厂的各100件玩具,在抽取中的200件玩具中,根据检测结果将它们分成“A”、“B”、“C”三个等级,A、B等级都是合格品,C等级是次品,统计结果如下表所示:(表一)在相关政策扶持下,确保每件合格品都有对口销售渠道,但从安全起见,所有的次品必须由原厂家自行销.(1)请根据所提供的数据,完成上面的2×2列联表(表二),并判断是否有95%的把握认为产品的合格率与厂家有关?(2)每件玩具的生产成本为30元,A、B等级产品的出厂单价分别为60元、40元.另外已知每件次品的销毁费用为4元.若甲厂抽检的玩具中有10件为A等级,用样本的频率估计概率,试判断甲、乙两厂能否都能盈利,并说明理由.附:22()()()()()n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.23.目前,新冠病毒引发的肺炎疫情在全球肆虐,为了解新冠肺炎传播途径,采取有效防控措施,某医院组织专家统计了该地区500名患者新冠病毒潜伏期的相关信息,数据经过汇总整理得到如图所示的频率分布直方图(用频率作为概率).潜伏期不高于平均数的患者,称为“短潜伏者”,潜伏期高于平均数的患者,称为“长潜伏者”.(1)求这500名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表),并计算出这500名患者中“长潜伏者”的人数;(2)为研究潜伏期与患者年龄的关系,从上述500名患者中抽取300人,得到如下列联表,根据列联表判断是否有97.5%的把握认为潜伏期长短与患者年龄有关:短潜伏者 长潜伏者 合计60岁及以上 90 70 160 60岁以下 60 80 140 合计 150150300附表及公式:20P K k ≥()0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k2.0722.7063.8415.0246.6357.87910.82822()()()()()n ad bc K a b c d a c b d -=++++24.为调研高中生的作文水平,在某市普通高中的某次联考中,参考的文科生与理科生人数之比为1∶4,且成绩分布在[]0,60的范围内,规定分数在50以上(含50)的作文获奖,按文理科用分层抽样的方法抽取400人的成绩作为样本,得到成绩的频率分布直方图如图所示,其中a ,b ,c 构成以2为公比的等比数列.(1)求a ,b ,c 的值;(2)填写下面22⨯列联表,能否在犯错误的概率不超过0.01的情况下认为“获奖”与“学生的文理科”有关?.附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.25.十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康,经过不懈的努力奋斗拼搏,新农村建设取得了巨大进步,农民年收入也逐年增加.为了实现2020年脱贫的工作计划,该地扶贫办随机收集了以下50位农民的统计数据,以此研究脱贫攻坚的效果是否与农民的受教育的发展状况有关:(1)根据列联表运用独立性检验的思想方法分析:能否有99%的把握认为“脱贫攻坚的效果与农民的受教育的发展状况有关”,并说明理由;(2)现用分层抽样的方法在全部受过教育的农民中随机抽取5位农民作为代表,再从这5位农民代表中任选2位继续调查,求这2位农民代表中至少有1位脱贫攻坚效果明显的概率.参考附表:参考公式:()()()()()22n ad bcKa b a c b d c d+=++++,其中n a b c d=+++.26.为了促进我国人口均衡发展,从2016年1月1日起,全国统一实施全面放开二孩政策,这也是为了重建大国人口观,重新认识人口价值、人口规律、人口问题,某研究机构为了了解人们对全面放开生育二孩政策的态度,随机调查了200人,得到的统计数据如下面的不完整的2×2列联表所示(单位:人):(1)完成2×2列联表,并求是否有90%的把握认为是否“支持生育二孩”与性别有关? (2)该研究机构从样本中筛选出4名男性和3名女性共7人作为代表,这7个代表中有2名男性和2名女性支持生育二孩现从这7名代表中任选3名男性和2名女性参加座谈会,记ξ为参加会议的支持生育二孩的人数,求ξ的分布列及数学期望()E ξ.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=.若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()42222211.50.50.5 1.55i i x x =-=-+-++=∑ ,()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.2.D解析:D 【分析】利用系统抽样和分层抽样的知识判断①的正确性;利用回归直线方程的知识判断②的正确性;利用频率分布直方图的知识判断③的正确性;利用独立性检验的知识判断④的正确性. 【详解】①,是系统抽样,不是分层抽样,所以①错误. ②,y 增加0.1,所以②错误. ③,在频率分布直方图中,所有小矩形的面积之和是1,所以③正确. ④,对于两个分类变量X 与Y ,求出其统计量2K 的观测值k ,观测值k 越大,我们认为“X 与Y 有关系”的把握程度就越大,所以④正确. 综上所述,正确的序号为③④. 故选:D 【点睛】本小题主要考查抽样方法、回归直线方程、频率分布直方图和独立性检验等知识,属于基础题.3.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 4.A解析:A 【解析】将表中的数据代入公式,计算得22100(487243) 3.0535050919K ⨯⨯-⨯=≈⨯⨯⨯,∵3.053 2.706>,∴有90%的把握认为生产的产品质量与设备的选择具有相关性,故选A .5.A解析:A 【解析】因为7.879<K 2<10.828,所以有99.5%的把握认为使用智能手机对学习有影响. 故选A.6.C解析:C 【详解】∵2 6.023 5.024K =>∴可断言市民收入增减与旅游欲望有关的把握为97.5%. 故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bc K a b c d a c b d -=++++,计算出2K 的值;(3)查表比较2K 与临界值的大小关系,作统计判断.7.C解析:C 【解析】对于①,方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,故正确;对于②,一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均减小5个单位,故不正确;对于③,线性回归直线ˆˆˆy bx a =+必过样本中心点(),x y ,故正确;对于④,曲线上的点与该点的坐标之间具有一一对应关系,故不正确;对于⑤,有一个2×2列联表中,由计算得213.079K =,则其两个变量间有关系的可能性是99.9%,故不正确. 故选C.8.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.9.A解析:A 【解析】由公式可计算得K 2≈11.377>6.635.故选A.点睛:(1)独立性检验的关键是正确列出2×2列联表,并计算出K 2的值.(2)独立性检验是对两个变量有关系的可信程度的判断,而不是对它们是否有关系的判断.10.C解析:C 【解析】由22222789821[(78)(88)(98)(8)(8)]25x yx y ++++⎧=⎪⎪⎨⎪-+-+-+-+-=⎪⎩得=60xy ,故选C. 11.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.12.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。
(必考题)高中数学高中数学选修2-3第三章《统计案例》测试卷(答案解析)(1)
一、选择题1.给出下列说法:①回归直线ˆˆˆy bx a =+恒过样本点的中心(,)x y ,且至少过一个样本点;②两个变量相关性越强,则相关系数||r 就越接近1; ③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy 平均减少0.5个单位.其中说法正确的是( ) A .①②④B .②③④C .①③④D .②④2.下列四个命题中,正确的有( )①两个变量间的相关系数r 越小,说明两变量间的线性相关程度越低;②命题“x ∃∈R ,使得210x x ++<”的否定是:“对x ∀∈R ,均有210x x ++>”; ③命题“p g ∧为真”是命题“p q ∨为真”的必要不充分条件;④若函数322()3f x x ax bx a =+++在1x =-有极值0,则2a =,9b =或1a =,3b =.A .0B .1C .2D .33.下列说法错误的是( )A .在回归直线方程0.2 0.8y x =+中,当解释变量x 每增加1个单位时,预报变量y 平均增加0.2个单位.B .对分类变量X 与Y ,随机变量2K 的观测值k 越大,则判断“X 与Y 有关系”的把握程度越小.C .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1.D .回归直线过样本点的中心(),x y . 4.下列命题是假命题...的是( ) A .某企业有职工150人,其中高级职称15人,中级职称45人,一般职员90人,若用分层抽样的方法抽出一个容量为30的样本,则一般职员应抽出18人; B .用独立性检验(列联表法)来考察两个分类变量是否有关系时,算出的随机变量的值越大,说明“与有关系”成立的可能性越大;C .已知向量,,则是的必要条件; D .若,则点的轨迹为抛物线.5.某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表,根据表中数据则可判定秃发与患心脏病有关,那么这种判定出错的可能性为( ) 患心脏病情况患心脏病无心脏病秃发情况 秃发 20 300 不秃发5450A .0.1B .0.05C .0.01D .0.996.对四对变量Y 和x 进行线性相关性检验,已知n 是观测值组数,r 是相关系数,且已知: ①n=7,r=0.953 3;②n=15,r=0.301 2;③n=17,r=0.499 1;④n=3,r=0.995 0,则变量Y 和x 具有线性相关关系的是( ) A .①和② B .①和③ C .②和④D .③和④7.下列说法中,不正确的是A .两个变量的任何一组观测值都能得到线性回归方程B .在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C .线性回归方程反映了两个变量所具备的线性相关关系D .线性相关关系可分为正相关和负相关 8.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距; ②在刻画回归模型的拟合效果时,R 2的值越大,说明拟合的效果越好; ③设随机变量ξ服从正态分布N (4,22),则P (ξ>4)=12; ④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则判断“X 与Y 有关系”的犯错误的概率越小. 其中正确的说法是( ) A .①④B .②③C .①③D .②④9.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: )C(件)由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .5810.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( ) A .25B .25C .35D .321011.由某个22⨯列联表数据计算得随机变量2K 的观测值k 6.879=,则下列说法正确的是 ( )0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.7081.3232.0722.7063.8415.0246.6357.87910.828A .两个分类变量之间有很强的相关关系B .有99%的把握认为两个分类变量没有关系C .在犯错误的概率不超过1.0%的前提下认为这两个变量间有关系D .在犯错误的概率不超过0.5%的前提下认为这两个变量间有关系12.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列表:由上表中数据计算得2K=()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,请根据下表,估计有多大把握认为“文化程度与月收入有关系”( )A .1%B .99%C .2.5%D .97.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R 的值判断模型的拟合效果,2R 越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)男 女 正常 73 117 色弱73你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?15.如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________. 16.若两个分类变量X 与Y 的列联表为:y 1 y 2 x 1 10 15 x 24016则“X 与Y 之间有关系”这个结论出错的可能性为________.17.某学校开展研究性学习活动,一组同学获得了下面的一组试验数据: x 1.99 3 4 5.1 8 y0.991.582.012.353.00现有如下5个模拟函数:①y =0.58x -0.16;②y =2x -3.02;③y =x 2-5.5x +8;④y =log 2x ;⑤y =+1.74请从中选择一个模拟函数,使它能近似地反映这些数据的规律,应选________(填序号). 18.已知方程是根据女大学生的身高预报她的体重的回归方程,其中的单位是,的单位是,那么针对某个体的残差是______.19.给出下列结论:(1)在回归分析中,可用相关指数R 2的值判断模型的拟合效果,R 2越大,模型的拟合效果越好;(2)某工产加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量; (3)随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度,它们越小,则随机变量偏离于均值的平均程度越小;(4)若关于x 的不等式2x x a a -+-≥在R 上恒成立,则a 的最大值是1;(5)甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲,乙都没有击中目标”是相互独立事件.其中结论正确的是.(把所有正确结论的序号填上)20.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下联表:参考公式:()()()()()22n ad bcKa b c d a c b d-=++++参照附表,在犯错误的概率最多不超过__________(填百分比)的前提下,可认为“该种疫苗由预防埃博拉病毒感染的效果”.三、解答题21.随着新冠疫情防控进入常态化,人们的生产生活逐步步入正轨.为拉动消费,某市发行2亿元消费券.为了解该消费券使用人群的年龄结构情况,该市随机抽取了50人,对是否使用过消费券的情况进行调查,结果如下表所示,其中年龄低于45岁的人数占总人数的3 5 .99%的把握认为是否使用消费券与人的年龄有关.合计参考数据:()20P K k 0.150.10 0.05 0.025 0.010 0.005 0.001 0k2.0722.7063.8415.0246.6357.87910.82822()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. (2)从使用消费券且年龄在[15,25)与[25,35)的人中按分层抽样方法抽取6人,再从这6人中选取2名,记抽取的两人中年龄在[15,25)的人数为X ,求X 的分布列与数学期望. 22.近年来,“家长辅导孩子作业”已成为家长朋友圈里的一个热门话题.某研究机构随机调查了该区有孩子正在就读小学的140名家长,以研究辅导孩子作业与家长性别的关系,得到下面的数据表:(1)请将下列列联表填写完整,并判断能否在犯错误的概率不超过0.05的前提下,认为是否辅导孩子作业与家长性别有关?是否辅导家长性别辅导不辅导 合计男50女 40 合计70(2)若从被调查的50名爸爸中任选2名爸爸,并用A 表示事件“至少1名爸爸辅导”,用B 表示事件“2名爸爸都辅导”,求()|P B A .参考公式:22(),()()()()n ad bc K a b c d a c b d -=++++其中n a b c d =+++. 参考数据:()P K k ︒≥0.15 0.10 0.05 0.025 0k 2.0722.7063.8415.02423.十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康,经过不懈的努力奋斗拼搏,新农村建设取得了巨大进步,农民年收入也逐年增加.为了实现2020年脱贫的工作计划,该地扶贫办随机收集了以下50位农民的统计数据,以此研究脱贫攻坚的效果是否与农民的受教育的发展状况有关:(1)根据列联表运用独立性检验的思想方法分析:能否有99%的把握认为“脱贫攻坚的效果与农民的受教育的发展状况有关”,并说明理由;(2)如果从全部受过教育的农民中随机地抽取3名,求抽到脱贫攻坚效果不明显的人数X 的分布列和数学期望(将频率当作概率计算).参考附表:参考公式:()()()()()22n ad bcKa b a c b d c d+=++++,其中n a b c d=+++.24.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bcK n a b c da b c d a c b d-==+++ ++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.25.为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM 2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM 2.5浓度不超过,且2浓度不超过”的概率; (2)根据所给数据,完成下面的22⨯列联表:PM 2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,26.2016年欧洲杯将于2016年6月10日到7月10日在法国举行.为了使得赛会有序进行,欧足联在全球范围内选聘了30名志愿者(其中男性16名,女性14名).调查发现,男性中有10人会英语,女性中有6人会英语. (1)根据以上数据完成以下2×2列联表:并回答能否在犯错的概率不超过0.10的前提下认为性别与会英语有关?参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++参考数据:(2)会英语的6名女性志愿者中曾有4人在法国工作过,若从会英语的6名女性志愿者中随机抽取2人做导游,则抽出的2人都在法国工作过的概率是多少?【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】①中,根据回归直线方程的特征,可判定是不正确;②中,根据相关系数的意义,可判定是是正确的;③中,根据方差的计算公式,可判定是正确的;④中,根据回归系数的含义,可判定是正确的. 【详解】对于①中,回归直线ˆˆˆy bx a =+恒过样本点的中心(,)x y ,但不一定过一个样本点,所以不正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数||r 就越接近1,所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,可得在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy平均减少0.5个单位,所以是正确的. 故选:B. 【点睛】本题主要考查了统计知识的相关概念及判定,其中解答中熟记回归直线方程的特征,回归系数的含义,相关系数的意义,以及方程的计算方法是解答的关键,属于基础题.2.A解析:A 【分析】根据相关系数的定义可知①错误;根据特称命题(又叫存在性命题)的否定可知②错误;根据真值表即可判断“p q ∧为真”是命题“p q ∨为真”的充分不必要条件,故③错误;由条件可得,(1)0,(1)0,f f '-=-= 解得a=2,b=9或a=1,b=3,经检验,当a=1,b=3时,22()3633(1)0f x x x x '=++=+≥恒成立,此时()f x 没有极值点,故④错误。
人教版高中数学(选修2-3)第三章统计案例单元测试题
A.52 54
B.54 52
C.94 146
D.146 94
答案 A
解析 由 a+21= 73,得 a= 52, a+ 2=b,得 b=54. 故选 A.
∧
7.设有一个回归方程为 y= 3- 5x,则变量 x 增加一个单位时 ( )
A.y 平均增加 3 个单位
B.y 平均减少 5 个单位
C.y 平均增加 5 个单位
B.v= log 1 t 2
D.v= 2t - 2
答案 C
解析 先画出散点图,利用散点图直观认ຫໍສະໝຸດ 变量间的关系,可选出较合适的模型为
C,或
将数据代入所给选项进行验证.
5.对于一组具有线性相关关系的数据 ( x1, y1) , ( x2, y2) ,…, ( xn, yn) ,其回归方程中
的截距为 (
)
C.(0 , y )
D.( x , y )
答案 D
解析 回归直线方程一定过样本点的中心 ( x , y ) .故选 D.
11.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是
A.总偏差平方和 C.回归平方和
B.残差平方和 D .相关指数 R2
答案 B
()
∧∧
n∧
2
解析 yi - y= ei , e i 为残差平方和.故选 B.
答案 A
解析 求出样本中心 ( x , y ) 代入选项检验知选 A.
4.今有一组实验数据如下:
t 1.99 3.0
4.0 5.1 6.12
v 1.5
4.04 7.5 12 18.01
现准备用下列函数中的一个近似地表示这些数据满足的规律,其中最接近的一个是
()
2019版高中数学 第3章 统计案例学业水平达标检测 新人教B版选修2-3
C.②④③①⑤ D.②⑤④③①
解析:由对两个变量进行回归分析的步骤,知选D.
答案:D
3.设有一个回归方程为 =3-5x,当变量x增加一个单位时()
A.y平均增加3个单位
B.y平均减少5个单位
C.y平均增加5个单位
D.y平均减少3个单位
解析:-5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位.
答案:D
7.2011年3月,日本发生了9.0级地震,地震引发了海啸及核泄漏.核专家为了检测当地动物受核辐射后对身体健康的影响,随机选取了110只羊进行了检测,并将有关数据整理为2×2列联表.
高度辐射
轻微辐射
合计
身体健康
30
A
50
身体不健康
B
10
60
合计
C
D
E
则A,B,C,D的值依次为()
A.20,80,30,50
解析:从散点图看,散点图的分布成团状,无任何规律,所以两个变量不具有线性相关关系.
B.直线l1和l2相交,但是交点未必是点(s,t)
C.直线l1和l2由于斜率相等,所以必定平行
D.直线l1和l2必定重合
答案:A
10.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:
学位
性别
硕士
博士
合计
男
162
27
189
女
143
8
151
合计
305
35
340
根据以上数据,则()
年龄/岁
3
4
5
6
7
8
9
身高/cm
(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)(1)
一、选择题1.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==2.已知x 与y 之间的几组数据如下表: x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a' D .b<b',a>a'3.经过对K 2的统计量的研究,得到了若干个观测值,当K 2≈6.706时,我们认为两分类变量A 、B ( )A .有67.06%的把握认为A 与B 有关系 B .有99%的把握认为A 与B 有关系C .有0.010的把握认为A 与B 有关系D .没有充分理由说明A 与B 有关系 4.有如下几个结论: ①相关指数R 2越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程:y bx a =+,一定过样本点的中心:(,)x y ③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; ④在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数有( )个. A .1B .2C .3D .45.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;6.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:x 2 4 5 6 8 y3040506070根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元D .105万元7.下列说法中,不正确的是A .两个变量的任何一组观测值都能得到线性回归方程B .在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C .线性回归方程反映了两个变量所具备的线性相关关系D .线性相关关系可分为正相关和负相关8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:数学85~100分 数学85分以下 总计 物理85~100分 37 85 122 物理85分以下 35 143 178 总计72228300现判断数学成绩与物理成绩有关系,则犯错误的概率不超过 ( ) A .0.005 B .0.01C .0.02D .0.059.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关10.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.已知变量x ,y 的一组观测数据如表所示: x 3 4 5 6 7 y4.02.5-0.50.5-2.0据此得到的回归方程为y bx a =+,若a =7.9,则x 每增加1个单位,y 的预测值就( ) A .增加1.4个单位 B .减少1.2个单位C .增加1.2个单位D .减少1.4个单位12.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.x ,y 的取值如下表: x-2-1.5-1-0.50.51y 0.26 0.35 0.51 0.71 1.1 1.41 2.05则x ,y 之间的关系可选用函数___进行拟合.14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程=x +必过(,);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是90%.其中错误的个数是________. 15.教材上一例问题如下:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据如下表,试建立y 与x 之间的回归方程. 温度 x /℃ 21 23 25 27 29 32 35 产卵数y /个711212466115325某同学利用图形计算器研究它时,先作出散点图(如图所示),发现两个变量不呈线性相关关系. 根据已有的函数知识,发现样本点分布在某一条指数型曲线21c xy c e =的附近(1c 和2c 是待定的参数),于是进行了如下的计算:根据以上计算结果,可以得到红铃虫的产卵数y 对温度x 的回归方程为__________.(精确到0.0001) (提示:21c xy c e =利用代换可转化为线性关系) 16.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1; ③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.在吸烟与患肺病这两个分类变量的计算中,“若2x 的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系”这句话的意思: ①是指“在100个吸烟的人中,必有99个人患肺病 ②是指“有1%的可能性认为推理出现错误”; ③是指“某人吸烟,那么他有99%的可能性患有肺病”; ④是指“某人吸烟,如果他患有肺病,那么99%是因为吸烟”. 其中正确的解释是______.19.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c 互不相同,则这个三位数为”有缘数”的概率是__________. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.今年疫情期间,许多老师进行抖音直播上课某校团委为了解学生喜欢抖音上课是否与性别有关,从高三年级中随机抽取30名学生进行了问卷调查,得到如下列联表:男生 女生 合计 喜欢抖音上课 10不喜欢抖音上课8合计 30已知在这30人中随机抽取1人抽到喜欢抖音上课的学生的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有95%的把握认为喜欢抖音上课与性别有关?(2)若从这30人中的女生中随机抽取2人,记喜欢抖音上课的人数为X ,求X 的分布列、数学期望. 附临界值表:()20P K k ≥0.10 0.05 0.010 0.005 0k2.7063.8416.637.879参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.22.某校从高三年级的男女生中各随机抽取了100人的体育测试成绩(以下称体测成绩,单位:分),数据都落在[)60100,内,其统计数据如表所示(其中不低于80分的学生为优秀).(1)请根据如表数据完成22⨯列联表,并通过计算判断,是否有95%的把握认为体测成绩与性别有关?(2)视频率为概率,在全校的高三学生中任取3人,记取出的3人中优秀的人数为X ,求X 的分布列和数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++23.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A表示事件“微信支付人数低于50千人”,估计A的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;支付人数<50千支付人数≥50千人总计人微信支付 支付宝支付 总计附:2()P K k ≥0.050 0.010 0.001 k3.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++.24.2020突如其来的疫情让我们经历了最漫长、最特殊的一个假期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后某校进行了摸底考试,某数学教师为了调查高二学生这次摸底考试的数学成绩与每天在线学习数学的时长之间的相关关系,对在校高二学生随机抽取45名进行调查,了解到其中有25人每天在线学习数学的时长不超过1小时,并得到如下的等高条形图:(1)根据等高条形图填写下面22⨯列联表,并根据列联表判断能否在犯错误的概率不超过0.05的前提下认为“高二学生的这次摸底考试数学成绩与其每天在线学习数学的时长有关”;数学成绩不超过120分 数学成绩超过120分 总计 每天在线学习数学不超过1小时 25每天在线学习数学超过1小时总计45(2)从被抽查的,且这次数学成绩超过120分的学生中,再随机抽取3人,求抽取的3人中每天在线学习数学的时长超过1小时的人数ξ的分布列与数学期望. 附临界值表()20P K k ≥0.050 0.010 0.001 0k3.8416.63510.828参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.25.某单位组织开展“学习强国”的学习活动,活动第一周甲、乙两个部门员工的学习情况统计如下:学习活跃的员工人数 学习不活跃的员工人数甲 18 12 乙328(1)根据表中数据判断能否有95%的把握认为员工学习是否活跃与部门有关; (2)活动第二周,单位为检查学习情况,从乙部门随机抽取2人,发现这两人学习都不活跃,能否认为乙部门第二周学习的活跃率比第一周降低了?说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:2(0.1) 2.706P K ≥=,2(0.05) 3.841P K ≥=,2(0.01) 6.635P K ≥=. 26.根据国家统计局数据,1999年至2019年我国进出口贸易总额从3万亿元跃升至31.6万亿元,中国在国际市场上的贸易份额越来越大对外贸易在国民经济中的作用日益突出.将年份1999,2004,2009,2014,2019分别用1,2,3,4,5代替,并表示为t ,y 表示全国进出口贸易总额.(1)根据以上统计数据及图表,给出了下列两个方案,请解决方案1中的问题. 方案1:用y bt a =+作为全国进出口贸易总额y 关于t 的回归方程,根据以下参考数据,求出y 关于t 的回归方程,并求相关指数21R .方案2:用dt y ce =作为全国进出口贸易总额y 关于t 的回归方程,求得回归方程0.57212.3259x y e =,相关指数22R .(2)通过对比(1)中两个方案的相关指数,你认为哪个方案中的回归方程更合适,并利用此回归方程预测2020年全国进出口贸易总额. 参考数据:①0.140.340.66 1.86 2.048.192++++=②222220.140.34 1.86 2.04 2.1412.336++++=③8.1920.0147555.792≈④12.3360.0222555.792≈参考公式:线性回归方程中的斜率和截距的最小二乘法估计公式分别为:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】 【分析】 根据公式()()()()()22n ad bc K a b c d a c b d -=++++,分别利用4个选项中所给数据求出2K 的值,比较所求值的大小即可得结果. 【详解】选项A :22160(535155)3204010502K ⨯⨯-⨯==⨯⨯⨯,选项B :22260(5251515)152040204016K ⨯⨯-⨯==⨯⨯⨯,选项C :22360(5201520)24204025357K ⨯⨯-⨯==⨯⨯⨯,选项D :22460(5101530)96204035257K ⨯⨯-⨯==⨯⨯⨯,可得222431K K K >>22K >,所以由选项D 中的数据得到的2K 值最大,说明X 与Y 有关系的可能性最大,故选D . 【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2 K 越大两个变量有关的可能性越大这一性质.2.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.3.B解析:B 【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据P (K 2>3.841)=0.05,得到我们有1-0.05=95%的把握认为A 与B 有关系. 【详解】 依据下表:2 6.635K > , 2 6.6350.01P K =(>)∴我们在错误的概率不超过0.01的前提下有99%的把握认为A 与B 有关系, 故选B . 【点睛】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可.4.D解析:D 【分析】根据相关指数定义、残差平方和含义可得①为真,根据回归直线方程特征可得②为真,根据残差点含义可得③为真,根据卡方含义可得④为真. 【详解】相关指数R 2越大,则残差平方和越小,模型的拟合效果越好;回归直线方程:ˆy bx a =+,一定过点() ,x y ;若残差点比较均匀地落在水平的带状区域中,则选用的模型比较合适; 在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,则2K 越大, “两个分类变量有关系”的可能性越强.选D. 【点睛】相关指数R 2越大,残差平方和越小,残差点比较均匀地落在水平的带状区域,则模型的拟合效果越好;在独立性检验中,若2 K 越大,则两个变量有关系越强;回归直线方程:ˆy bx a =+,一定过点() ,x y .5.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.6.B解析:B 【解析】分析:根据表中数据求得样本中心(,)x y ,代入回归方程ˆ7ˆyx a =+后求得ˆa ,然后再求当10x =的函数值即可. 详解:由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50), ∴ˆ5075a=⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+. 当10x =时,710158ˆ5y=⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元. 故选B .点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.7.A解析:A 【解析】要得到线性回归方程应至少有两个变量的两组观测值,因此A 不正确.根据散点图、线性回归方程、线性相关关系的概念可得B ,C ,D 都正确.故选A .8.D解析:D 【解析】因为K 2的观测值k=2300(371433585)12217872228⨯-⨯⨯⨯⨯≈4.514>3.841, 所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D.9.C解析:C 【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.12.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。
2018-2019学年高中数学 第三章 统计案例章末综合检测 新人教A版选修2-3
第三章 统计案例章末综合检测(三)(时间:120分钟,满分:150分)一、选择题:本题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的.1.在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是( ) A .吸烟,不吸烟 B .患病,不患病 C .是否吸烟,是否患病D .以上都不对解析:选C.“是否吸烟”是分类变量,它的两个不同取值:吸烟和不吸烟;“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知A ,B 都是一个分类变量所取的两个不同值.故选C.2.某商品销售量y (单位:件)与销售价值x (单位:元/件)负相关,则其回归方程可能是( ) A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200D.y ^=10x -200解析:选A.由x 与y 负相关,可排除B ,D 两项,而C 项中的y ^=-10x -200<0不符合题意,故选A.3.两个相关变量满足如下关系:根据表格已得回归方程为y =9.5x +8.8,表中有一数据模糊不清,推算该数据是( ) A .37 B .38.5 C .39D .40.5解析:选C.因为x =2+3+4+5+65=4,所以y =9.5×4+8.8=46.8.设模糊不清的数据为a ,则25+a +50+56+64=5y =234,解得a =39.故选C.4.在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( ) A.a a +b 与d c +d B.c a +b 与a c +d C.aa +b 与cc +dD.aa +b 与cb +c解析:选C.由等高条形图的解可知aa +b 与cc +d的值相差越大,|ad -bc |就越大,相关性就越强.5.在一次独立性检验中,得出列联表如下:( ) A .200 B .720 C .100D .180解析:选B.由表得K 2的观测值k =(1 180+a )×(200a -180×800)2380×(800+a )×(180+a )×1 000, 当a =200时,k =(1 180+200)×(200×200-180×800)2380×(800+200)×(180+200)×1 000≈103.37>2.706,此时两个变量A 和B 有关联; 当a =720时,k =(1 180+720)×(200×720-180×800)2380×(800+720)×(180+720)×1 000=0,由k ≤2.706知此时没有充分证据显示两个变量A 和B 有关联,则a 的可能值是720. 6.下列关于K 2的说法正确的是( )A .K 2在任何相互独立问题中都可以用来检验有关还是无关 B .K 2的值越大,两个事件的相关性就越大C .K 2是用来判断两个分类变量是否有关系的,只对于两个分类变量适合D .K 2的观测值k 的计算公式为k =n (ad -bc )(a +b )(c +d )(a +c )(b +d )解析:选C.K 2是用来判断两个分类变量是否有关的,故A 错;K 2的值越大,只能说明有更大地把握认为二者有关系,却不能判断相关性的大小,B 错;D 中(ad -bc )应为(ad -bc )2. 7.以下关于线性回归的判断,正确的个数是( )①若散点图中所有点都在一条直线附近,则这条直线为回归直线;②散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的A ,B ,C 三点; ③已知回归直线方程为y ^=0.50x -0.81,则x =25时,y 的估计值为11.69;④回归直线方程的意义是它反映了样本整体的变化趋势. A .0 B .1 C .2D .3解析:选D.能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知只有按最小二乘法求得回归系数a ^,b ^得到的直线y ^=b ^x +a ^才是回归直线,所以①不对;②正确;将x =25代入y ^=0.50x -0.81,得y ^=11.69,所以③正确;④正确.故选D.8.假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表如下:( ) A .a =5,b =4,c =3,d =2 B .a =5,b =3,c =4,d =2 C .a =2,b =3,c =4,d =5 D .a =2,b =3,c =5,d =4解析:选D.对于A ,|ad -bc |=|10-12|=2; 对于B ,|ad -bc |=|10-12|=2; 对于C ,|ad -bc |=|10-12|=2; 对于D ,|ad -bc |=|8-15|=7.9.在第29届北京奥运会上,中国健儿取得了51金、21银、28铜的好成绩,稳居金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见,有网友为此进行了调查,在参加调查的2 548名男性中有1 560名持反对意见,2 452名女性中有1 200名持反对意见,在运用这些数据说明性别对判断“中国进入了世界体育强国之列”是否有关系时,用什么方法最有说服力( ) A .平均数与方差 B .回归直线方程 C .独立性检验 D .概率解析:选C.根据所学内容以及此题所提供的数据可知,要想回答性别对判断“中国进入了世界体育强国之列”是否有关系时,用独立性检验最有说服力.10.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ) 表1表3表4A .成绩 C .智商D .阅读量解析:选D.结合各列联表中数据,得K 2的观测值分别为k 1,k 2,k 3,k 4. 因为k 1=52×(6×22-14×10)216×36×32×20=52×8216×36×32×20,k 2=52×(4×20-16×12)216×36×32×20=52×112216×36×32×20,k 3=52×(8×24-12×8)216×36×32×20=52×96216×36×32×20,k 4=52×(14×30-6×2)216×36×32×20=52×408216×36×32×20,则k 4>k 2>k 3>k 1,所以阅读量与性别有关联的可能性最大.11.某学校开展研究性学习活动,某同学获得一组实验数据如下:(1.99,1.5),(3,4.04),(4,7.5),(5.1,12),(6.12,18.01).对于这组数据,现在给出以下拟合曲线,其中拟合程度最好的是( ) A .y =2x -2 B .y =(12)xC .y =log 2xD .y =12(x 2-1)解析:选D.本题若求R 2或残差来分析拟合效果,运算将很烦琐,计算量太大,可以将各组数据代入检验,发现D 最接近.故选D. 12.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归方程y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( ) A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:选C.法一:b ′=2,a ′=-2,由公式b ^=∑6i =1(x i -x )(y i -y )∑6i =1 (x i -x )2求得, b ^=57,a ^=y --b ^x -=136-57×72=-13, 所以b ^<b ′,a ^>a ′.法二:过(1,0)和(2,2)的直线方程为y =2x -2, 画出六点的散点图,回归直线的大概位置如图所示,显然b ′>b ^,a ^>a ′.二、填空题:本题共4小题,每小题5分.13.下表是关于新生婴儿的性别与出生时间段调查的列联表,那么,A =________,B =________,C =________,D =________.解析:由题意可知,A =9245=53,C =180-92=88. 答案:47 53 88 8214.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的线性回归方程为y ^=0.254x +0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:由题意知[0.254(x +1)+0.321]-(0.254x +0.321)=0.254. 答案:0.25415.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为________. 解析:当y ^=7.675时,x =7.675-1.5620.66≈9.262,所以7.6759.262≈0.829≈83%.答案:83%16.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”.利用2×2列联表计算得k ≈3.918,经查阅临界值表知P (K 2≥3.841)≈0.05. 对此,四名同学做出了以下判断:p :有95%的把握认为“这种血清能起到预防感冒的作用”.q:若某人未使用该血清,那么他在一年中有95%的可能性得感冒.r:这种血清预防感冒的有效率为95%.s:这种血清预防感冒的有效率为5%.则下列复合命题中正确的是________.(填序号)①p∧(綈q); ②(綈p)∧q;③(綈p∧綈q)∧(r∨s); ④(p∨綈r)∧(綈q∨s).解析:查阅临界值表,知P(K2≥3.841)≈0.05,故有95%的把握认为“这种血清能起到预防感冒的作用”.95%仅是指“血清能起到预防感冒的作用”的可信程度,但也有“在100个使用血清的人中一个患感冒的人也没有”的可能,故p真,其余命题都为假.结合复合命题的真值可知,选①④.答案:①④三、解答题:解答应写出文字说明、证明过程或演算步骤.17.(本小题满分10分)冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如表所示.解:由已知数据得到如下2×2列联表:K2的观测值k=≈13.11,由于13.11>10.828,故有99.9%的把158×224×59×323握认为含杂质的高低与设备改造是有关的.18.(本小题满分12分)2017年某市开展了“寻找身边的好老师”活动,市六中积极行动,认真落实,通过微信关注评选“身边的好老师”,并对选出的五位“好老师”的班主任的工作年限和被关注数量进行了统计,得到如下数据:(1)程y ^=b ^x +a ^,并就此分析:“好老师”的班主任工作年限为15年时被关注的数量; (2)若用y i x i(i =1,2,3,4,5)表示统计数据时被关注数量的“即时均值”(四舍五入到整数),从“即时均值”中任选2组,求这2组数据之和小于8的概率. 解:(1)x =8,y =36,b ^=40+120+320+600+600-5×8×3616+36+64+100+144-5×64=6,a ^=36-48=-12,所以y ^=6x -12,当x =15时,y ^=6×15-12=78百人.(2)这5次统计数据,被关注数量的“即时均值”分别为3,3,5,6,4.从5组“即时均值”任选2组,共有C 25=10种情况,其中2组数据之和小于8为(3,3),(3,4),(3,4)共3种情况,所以这2组数据之和小于8的概率为310.19.(本小题满分12分)某市规定中学生百米成绩达标标准为不超过16秒.现从该市中学生中按照男、女生比例随机抽取了50人,其中有30人达标.将此样本的频率估计为总体的概率.(1)随机调查45名学生,设ξ为达标人数,求ξ的数学期望与方差; (2)如果男、女生采用相同的达标标准,男、女生达标情况如表:根据表中所给的数据,完成0.01的前提下能否认为“体育达标与性别有关”?若有,你能否给出一个更合理的达标方案? 解:由题意可知,随机抽取1人,则此人百米成绩达标的概率为3050=35.(1)由题设可知,ξ~B ⎝⎛⎭⎪⎫45,35,故E (ξ)=45×35=27,D (ξ)=45×35×25=10.8.(2)K 2的观测值k =32×18×30×20≈8.333>6.635,所以在犯错误的概率不超过0.01的前提下认为“体育达标与性别有关”.男、女生要使用不同的达标标准.20.(本小题满分12分)中石化集团通过与安哥拉国家石油公司合作,获得了安哥拉深海油田区块的开采权,集团在某些区块随机初步勘探了部分旧井,取得了地质资料.进入全面勘探时期后,集团按网络点来布置井位进行全面勘探.由于勘探一口井的费用很高,如果新设计的井位与原有井位重合或接近,便利用旧井的地质资料,不必打这口新井,以节约勘探费用.勘探初期部分旧井的数据资料见下表:(1)1~6号旧井位置线性分布,借助前5组数据求得回归方程为y =b x +a ,其中b =6.5,求a ^,并估计6号旧井中y 的预报值;(2)现准备勘探新井7(1,25),若通过1,3,5,7号井计算出的b ^′,a ^′的值与(1)中b ^,a ^的值的差均不超过10%,则使用位置最接近的已有旧井6(1,y ),否则在新位置打井,请判断可否使用旧井.(注:其中b ^的计算结果用四6.8即b ^′=6.8,a ^′=19.05, 由(1)知b ^=6.5,a ^=17.5.因为b ^′-b ^b ^≈5%,a ^′-a ^a^≈9%,均不超过10%,因此使用位置最接近的已有旧井6(1,24).21.(本小题满分12分)某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4小时的概率;(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”.解:(1)300×4 50015 000=90,所以应收集90位女生的样本数据.(2)由频率分布直方图得1-2×(0.025+0.100)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由第二问知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表结合列联表可算得K2的观测值k=75×225×210×90=21≈4.762>3.841.所以,在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”.22.(本小题满分12分)在关于人的脂肪含量(百分比)和年龄(岁)的关系的研究中,研究人员获得了一组数据如下表:(1)(2)建立年龄为解释变量,脂肪含量为预报变量的回归模型,并分析该模型能否较好地刻画两者的关系;(3)求相关指数R2,并说明其含义.解:(1)画出散点图如图所示.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系. (2)计算得线性回归方程为y ^=0.576x -0.448. 残差e ^i =y i -y ^i ,数据如下 e ^1=-3.3,e ^2=2.696,e ^3=-0.816,e ^4=2.732,e ^5=2.028,e ^6=-1.476,e ^7=-0.152,e ^8=-0.48,e ^9=-0.456,e ^10=-0.408,e ^11=-1.584,e ^12=0.54, e ^13=1.088,e ^14=-0.088.以年龄为x 轴,残差为y 轴画残差图(图略),可知残差点比较均匀地落在水平的带状区域中,说明用上述回归模型拟合数据效果很好.。
2019高中数学人教A版选修23第三章统计案例综合检测
【课堂新坐标】(教师用书)2013-2014学年高中数学 第三章 统计案例综合检测 新人教A 版选修2-3(时间:90分钟,满分:120分)一、选择题(本大题共10小题,每小题5分共50分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列说法中错误的是( )A .如果变量x 与y 之间存在着线性相关关系,则我们根据试验数据得到的点(x i ,y i )(i =1,2,…,n )将散布在某一条直线的附近B .如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据(x i ,y i )(i =1,2,…,n )不能写出一个线性方程C .设x ,y 是具有相关关系的两个变量,且y 关于x 的线性回归方程为y ∧=b ∧x +a ∧,b ∧叫做回归系数D .为使求出的线性回归方程有意义,可用统计检验的方法来判断变量y 与x 之间是否存在线性相关关系【解析】 任何一组(x i ,y i )(i =1,2,…,n )都能写出一个线性方程,只是有的无意义. 【答案】 B图12.如图1所示,图中有5组数据,去掉________组数据后(填字母代号),剩下的4组数据的线性相关性最大.( )A .EB .C C .DD .A【解析】 由图易知A 、B 、C 、D 四点大致在一条直线上,而E 点偏离最远,故去掉E点后数据的相关性最大.【答案】 A3.每一吨铸铁成本y c (元)与铸件废品率x %建立的回归方程y c ∧=56+8x ,下列说法正确的是( )A .废品率每增加1%,成本每吨增加64元B .废品率每增加1%,成本每吨增加8%C .废品率每增加1%,成本每吨增加8元D .如果废品率增加1%,则每吨成本为56元【解析】 根据回归方程知y 是关于x 的单调增函数,并且由系数知x 每增加一个单位,y 平均增加8个单位.【答案】 C4.用等高条形图粗估计两个分类变量是否相关.观察下列各图,其中两个分类变量关系最强的是( )【解析】 根据上述等高条形图可知,D 中差距较大,所以分类变量关系最强. 【答案】 D5.(2012·沈阳高二检测)经过对K 2的统计量的研究,得到了若干个临界值,当K 2≤时,我们认为事件A 与B ( )A .在犯错误的概率不超过的前提下有关系B .在犯错误的概率不超过的前提下有关系C .没有充分理由认为A 与B 有关系D .不能确定【解析】 因为K 2≤,而犯错误的概率约为15%,所以没有充分理由认为A 与B 有关系. 【答案】 C6.若两个变量的残差平方和是325, (y i -y )2=923,则随机误差对预报变量的贡献率约为( )A .%B .60%C .%D .40%【解析】 由题意可知随机误差对预报变量的贡献率约为325923≈.【答案】 C7.独立检验中,假设H 0:变量X 与变量Y 没有关系,则在H 0成立的情况下,P (K 2≥=表示的意义是( )A .变量X 与变量Y 有关系的概率为1%B .变量X 与变量Y 没有关系的概率为%C .变量X 与变量Y 没有关系的概率为99%D .变量X 与变量Y 有关系的概率为99%【解析】 由题意知变量X 与Y 没有关系的概率为,即认为变量X 与Y 有关系的概率为99%.【答案】 D8.(2012·郑州高二检测)收集一只棉铃虫的产卵数y 与温度x 的几组数据后发现两个变量有相关关系,并按不同的曲线来拟合y 与x 之间的回归方程,并算出了对应相关指数R 2如下表:拟合曲线直线指数曲线抛物线二次曲线y 与x 回归方程y ∧=- y ∧=-y ∧=-202y ∧=x -2-1相关指数R 2=- =-=-202=x -2-1【解析】 用相关指数R 2来刻画回归效果,R 2的值越大,说明模型的拟合效果越好. 【答案】 B9.某地财政收入x 与支出y 满足线性回归方程y ∧=bx +a +e (单位:亿元),其中b =,a =2,|e |<,如果今年该地区财政收入10亿元,年支出预计不会超过( )A .10亿B .9亿C .亿D .亿【解析】 代入数据得y =10+e ,∵|e |<,∴|y |<,故不会超过亿. 【答案】 C10.某化工厂为预测某产品的回收率y ,需要研究它和原料的有效成分含量x 之间的相关关系.现取了8对观测值,经计算得:∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1 849,则y 与x 的回归方程为( ),))=+ ,))=- ,))=+ ,))=-+【解析】 x =18×52=,y =,∵回归直线过(x ,y ),经验证可知答案应为A.【答案】 A二、填空题(本大题共4小题,每小题5分,共20分,将答案填在题中的横线上) 11.已知回归直线斜率的估计值是,样本点的中心为(4,5),则回归直线方程为________.【解析】 设回归直线方程为y ∧=+a ∧,又方程过样本中心,∴5=×4+a ∧,∴a ∧=.【答案】 y ∧=+12.若一组观测值(x 1,y 1),(x 2,y 2)…(x n ,y n )之间满足y i =bx i +a +e i (i =1,2,…,n ),若e i 恒为0,则R 2为________.【解析】 e i 恒为0,说明随机误差总为0,于是y i =y ∧,故R 2=1. 【答案】 113.下列是关于出生男婴与女婴调查的列联表那么A =________,B ,E =________. 【解析】 ∵45+E =98,∴E =53, ∵E +35=C ,∴C =88, ∵98+D =180,∴D =82, ∵A +35=D ,∴A =47, ∵45+A =B ,∴B =92.【答案】 47 92 88 82 5314.根据下表,计算K 2的观测值k ≈________.(保留两位小数)又发病 未发病 作移植手术 39 157 未作移植手术29167【解析】 k =2196×196×68×324≈.【答案】三、解答题(本大题共4小题,共50分.解答应写出文字说明,证明过程或演算步骤) 15.(本小题满分12分)某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ∧ =b ∧ x +a ∧ ,其中b ∧=-2.现预测当气温为-4℃时,用电量的度数约为多少? 用电量y (度) 24 34 38 64 气温x (℃)181310-1【解】 x =14(18+13+10-1)=10, y =14(24+34+38+64)=40,b ∧=-2. 又回归方程y ∧ =-2x +a ∧过点(10,40),故a ∧=60. 所以当x =-4时,y ∧=-2×(-4)+60=68.故当气温为-4 ℃时,用电量的度数约为68度.16.(本小题满分12分)已知10只狗的血球体积x (单位:mm 3)及红血球数y (单位:百万)的测量值如下:x 45 42 46 48 42 35 58 40 39 50 y(2)求出y 对x 的回归线性方程;(3)若血球体积为49 mm 3,预测红血球数大约是多少?【解】 (1)散点图如图(2)设线性回归方程为y ∧ =b ∧ x +a ∧,由表中数据代入公式,得b ∧=∑i =110x i y i -10x y∑i =110x 2i -10x2≈,a ∧ =y -b ∧x ≈. 所以所求线性回归方程为y ∧=+.(3)把x =49代入线性回归方程得:y ∧=×49+≈(百万),计算结果表明,当血球体积为49 mm 3时,红血球数大约为百万. 17.(本小题满分12分)对某校小学生进行心理障碍测试得如下列联表:(其中焦虑、说谎、懒惰都是心理障碍)焦虑 说谎 懒惰 总计 女生 5 10 15 30 男生 20 10 50 80 总计252065110【解】 利用已知条件来判断两个分类变量是否具有关系,可以先假设两个变量之间有关系,再计算K 2的值,如果K 2的值越大说明两个变量之间有关系的可能性也就越大,再参考临界值,从而判断两个变量有关系的可信程度.对于上述三种心理障碍分别构造三个随机变量K 21,K 22,K 23,由表中数据可得 K 21=110×5×60-25×20230×80×25×85≈,K 22=110×10×70-20×10230×80×20×90≈,K 23=110×15×30-15×50230×80×65×45≈.因为K 22的值最大,所以说谎与性别关系最大.18.(本小题满分14分)(2013·福建高考)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60)、[60,70)、[70,80)、[80,90)、[90,100]分别加以统计,得到如图2所示的频率分布直方图.25周岁以上组25周岁以下组图2(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2P (χ2≥k )k(K 2=n ad -bc 2a +bc +d a +cb +d)【解】 (1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名,所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×=3(人),记为A 1,A 2,A 3;25周岁以下组工人有40×=2(人),记为B 1,B 2. 从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A 1,A 2),(A 1,A 3),(A 2,A 3),(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是:(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).故所求的概率P =710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×=15(人),“25周岁以下组”中的生产能手40×=15(人),据此可得2×2列联表如下:生产能手非生产能手合计25 周岁以上组154560 25周岁以下组152540 合计3070100所以得K2=n ad-bc2a+b c+d a+c b+d=100×15×25-15×45260×40×30×70=2514≈.因为<,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.。
高中数学选修2-3 第3章 统计案例章末检测题A
答案:C
10.解析:l1 与 l2 都过样本中心点(s,t). 答案:A
二、11.解析:②⑤中两个变量之间的关系是确定性关系,不是相关关系. ①③④中两个变量之间具有相关关系. 答案:①③④
12.解析:由表中数据可知,
2+3+4+5+6=4,
5
2.2+3.8+5.5+6.5+7.0=5.
5
∵回归直线一定经过样本点的中心( , ), ∴5= ^ +1.23×4,
答案:265.7 kg
三、16.解:分析:(1)运用古典概型概率公式求值.(2)求出随机变量,说明关系.
(1)积极参加班级工作的学生有 24 人,不太主动参加班级工作且学习积极性一般的学生有 19 人,
总人数为 50 人,
∴抽到积极参加班级工作的学生的概率为24 12;
50 25
抽到不太主动参加班级工作且学习积极性一般的学生的概率为19.
180
那么 a=
,b=
,c=
,d=
,e=
.
14.为了了解某班学生喜爱打篮球是否与性别有关,对该班 50 名学生进行了问卷调查,得到了如下的
2×2 列联表:
喜爱打篮球 不喜爱打篮球 合计
男生
20
女生
10
5
25
15
25
合计
30
20
50
则在犯错误的概率不超过
的前提下认为喜爱打篮球与性别有关.(请用百分数表示)
数学选修 2-3
第三章 统计案例章末检测(A)
(时间:90 分钟 满分:120 分)
一、选择题(本大题共 10 小题,每小题 5 分,共 50 分.在每小题给出的四个选项中,只有一
高中数学选修2-3 第三章 统计案例 章末检测题
高中数学选修2-3第三章 统计案例 章末检测题(满分150分,时间120分钟)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.分析人的身高与体重的关系,可以用( ) A .残差分析 B .回归分析 C .等高条形图D .独立性检验【解析】因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决. 【答案】B2.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K 2≈0.99,根据这一数据分析,下列说法正确的是( )A .有99%的人认为栏目优秀B .有99%的人认为栏目是否优秀与改革有关系C .有99%的把握认为电视栏目是否优秀与改革有关系D .没有理由认为电视栏目是否优秀与改革有关系【解析】由于K 2=0.99<3.841,所以没有理由认为电视栏目是否优秀与改革有关系,故选D.【答案】D3.已知一个线性回归方程为y ∧=1.5x +45,其中x 的取值依次为1,7,5,13,19,则y =( ) A .58.5 B .46.5 C .60 D .75【解析】x =1+7+5+13+195=9,因为回归直线方程过点(x ,y ),所以y =1.5×x +45=1.5×9+45=58.5【答案】A4.设有一个回归方程为y ∧=3-5x ,当变量x 增加一个单位时( ) A .y 平均增加3个单位 B .y 平均减少5个单位 C .y 平均增加5个单位D .y 平均减少3个单位【解析】-5是斜率的估计值,说明x 每增加一个单位,y 平均减少5个单位. 【答案】B5.若由一个2×2列联表中的数据计算得K 2=6.630,则判断“这两个分类变量有关系”时,犯错误的最大概率是( )A .0.025B .0.01C .0.005D .0.001【解析】∵P (K 2>5.024)=0.025.又K 2=6.630>5.024,∴犯错误的最大概率为0.025. 【答案】A6.如图5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变小C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强【解析】由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.【答案】B7.假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:以下数据中,对于同一样本能说明X 与Y 有关的可能性最大的一组为( ) A .A =5,b =4,c =3,d =2 B .A =5,b =3,c =4,d =2 C .A =2,b =3,c =4,d =5 D .A =2,b =3,c =5,d =4【解析】可计算|ad -bc|的值,值越大说明X 与Y 有关的可能性越大. 【答案】D8.变量x 、y 具有线性相关关系,当x 取值为16,14,12,8时,通过观测得到y 的值分别为11,9,8,5.若在实际问题中,y 最大取值是10,则x 的最大取值不能超过( )A .14B .15C .16D .17【解析】根据题意y 与x 呈正相关关系,由最小二乘法或计算器求得回归系数a ∧≈-0.857,b ∧≈0.729,所以线性回归方程为y ∧=0.729x -0.857.当y ∧=10时,得x ≈15.【答案】B9.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:根据以上数据,则( )A .性别与获取学位类别有关B .性别与获取学位类别无关C .性别决定获取学位的类别D .以上都是错误的【解析】由列联表可得:博士:男性占2735≈77%,女性占835≈23%,相差很大,所以性别与获取学位的类别有关,故选A.【答案】A10.在两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的R 2如下,其中拟合效果最好的模型是( )A .模型1的R 2为0.30B .模型2的R 2为0.50C .模型3的R 2为0.75D .模型4的R 2为0.98 【解析】R 2越大,拟合效果越好. 【答案】D11.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x A .y =x -1 B .y =x +1 C .y =88+12x D .y =176【解析】将表中的五组数据分别代入选项验证,可知y =88+12x 最适合.【答案】C12.若对于变量y 与x 的10组统计数据的回归模型中,相关指数R 2=0.95,又知残差平方和为120.53,那么()1021i i y y=-∑的值为( )A .241.06B .2 410.6C .253.08D .2 530.8【解析】R 2=1-∑i =110(y i -y ∧i )2∑i =110(y i -y )2,得0.95=1-120.53∑i =110 (y i -y )2,得()1021i i y y=-∑=120.531-0.95=2 410.6.【答案】B二、填空题(本大题共4小题,每小题4分,共16分.请把正确的答案填在题中的横线上)13.在两个变量的回归分析中,R 2=________,R 2的值越________________________________________________________________________,说明残差平方和越________,也就是说模型的拟合效果越________.【答案】1-∑i =1n(y i -y ∧i )2∑i =1n(y i -y )2大 小 好14.已知样本数为11,计算得∑i =111x i =510,∑i =111y i =214,回归方程为y ∧=0.3x +a ∧,则x ≈________,a ∧≈________.(精确到0.01)【解析】由题意,x =111∑i =111x i =51011≈46.36,y =111∑i =111y i =21411,因为y =0.3x +a ∧,所以21411=0.3×51011+a ∧,可求得a ∧≈5.55. 【答案】46.36 5.5515.某单位为了了解用电量y (度)与气温x (°C )之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ∧=b ∧x +a ∧,其中b ∧=-2.现预测当气温为-4°C 时,用电量的度数约为________.【解析】x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,b ∧=-2.又回归方程y ∧=-2x +a ∧过点(10,40),故a ∧=60,所以当x =-4时,y ∧=-2×(-4)+60=68. 【答案】6816.若两个分类变量X 与Y 的列联表为:则“X 与Y 【解析】由列联表数据,可求得随机变量K 2的观测值k =81×(10×16-40×15)225×56×50×31≈7.227>6.635.因为P(K 2≥6.635)≈0.01.所以“x 与y 之间有关系”出错的概率仅为0.01.【答案】0.01三、解答题(本大题共6个小题,共74分.解答时应写出必要的文字说明、证明过程或演算步骤)17.(本小题满分12分)某研究者欲考察某一高考试题的得分情况是否与性别有关系,统计结果如下:及格的人中男生有290人,女生有100人;不及格的人中男生有160人,女生有350人.试根据这些数据判断这一高考试题的得分情况与性别是否有关系.【解析】根据题中数据得如下列联表:由列联表中的数据得k =900×(290×350-100×160)2450×450×390×510≈163.348>10.828,所以在犯错误的概率不超过0.001的前提下认为“这一高考试题的得分情况与性别有关系.”18.(本小题满分12分)有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度而变化.下面是试验的结果:(1)(2)求出机床运转的速度x 与每小时生产二级品数量y 的回归直线方程;(3)若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/秒?【解析】(1)散点图如下图所示:(2)易求得x =12.5,y =8.25,∴b ∧=∑i =14x i y i -4x y∑i =14x 2i -4x2≈0.728 6,a ∧=y -b ∧x =-0.857 5, 即所求回归直线的方程为:y ∧=0.728 6x -0.857 5.(3)根据公式,要使y ∧≤10, 只要0.728 6x -0.857 5≤10, 解得x ≤14.901 9,即机床的运转速度不能超过14.901 9转/秒.19.(本小题满分12分)有两个分类变量X 与Y ,其一组观测值如下面的2×2列联表所示:其中,a ,15-a 均为大于50.10的前提下认为“X 与Y 之间有关系”?【解析】要使在犯错误的概率不超过0.10的前提下认为“X 与Y 之间有关系”,需要随机变量K 2的观测值大于2.706.∵a +(20-a )=20, (15-a )+(30+a )=45,a +(15-a )=15,(20-a )+(30+a )=50, a +(20-a )+(15-a )+(30+a )=65,则 K 2=65×[a (30+a )-(20-a )(15-a )]220×45×15×50=13(13a -60)25 400>2.706,解之可得,a >7.19或a <2.04,而由原题知a >5且15-a >5,a ∈Z ,即a =6,7,8,9.故当a =8或9时,可在犯错误的概率不超过0.10的前提下认为X 和Y 之间有关系. 20.(本小题满分12分)下表提供了某厂生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ∧=b ∧x +a ∧; (2)请求出R 2,并说明残差变量对预报变量的影响约占百分之几.(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)【解析】(1)∑i =14x i y i =66.5,∑i =14x 2i =32+42+52+62=86,x =4.5,y =3.5b ∧=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7a ∧=y -b ∧x =3.5-0.7×4.5=0.35所求的线性回归方程为y ∧=0.7x +0.35 (2)计算得残差及偏差的数据如下表:从而得∑i =14(y i -y ∧i )2=0.05,∑i =14(y i -y )2=2.5所以R 2=1-∑i =14(y i -y ∧i )2∑i =14(y i -y )2=1-0.052.5=0.98.所以残差变量对预报变量的贡献率约为2%.21.(本小题满分13分)针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”做了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.(1)若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?(2)若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人? 【解析】设男生人数为x ,依题意可得列联表如下:(1)则K 2>3.841, 由K 2=3x 2⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ·x 2·x 2·x =38x >3.841,解得x >10.24, ∵x 2,x6为整数, ∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人;(2)若没有充分的证据显示是否喜欢韩剧和性别有关, 则K 2≤2.706,由K 2=3x 2⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ·x2·x 2·x =38x ≤2.706,解得x ≤7.216, ∵x 2,x6为整数, ∴若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有6人.22.(本小题满分13分)某种生物的产卵数与温度有一定的关系,现在收集了7组数据,如下表:【解析】将上表中的数据作成散点图(如图1),可以发现这些点并不是分布在一条直线的附近,而是近似地分布在一个二次函数的图象的附近,因此可用非线性回归模型进行分析,令t =x 2,得到下表:再做出y 和t 的散点图(如图2),发现这些点分布在一条直线的附近,所以y 与t 线性相关,由公式可计算求得:b ∧=∑t i y i -7t y ∑t 2i -7t2≈0.37,a ∧=y -b ∧t =-204.90,于是y ∧=0.37t -204.90,故y 与x 之间的回归方程是y ∧=0.37x 2-204.90,当x =50时,代入可得y ∧=720.1,故由此可以估计温度在50°C 时的产卵数量大约为720个.。
人教新课标版数学高二-选修2-3第三章《统计案例》过关检测卷
数学·选修2-3(人教A版)章末过关检测卷(三)第三章统计案例(测试时间:120分钟评价分值:150分)一、选择题(本大题共8小题,每小题5分,共40分;在每小题给出的四个选项中,只有一项是符合题目要求的)1.在画两个变量的散点图时,下面哪个叙述是正确的()A.预报变量在x轴上,解释变量在y轴上B.解释变量在x 轴上,预报变量在y轴上C.可以选择两个变量中任意一个变量在x轴上D.可以选择两个变量中任意一个变量在y轴上答案:B2.下列说法正确的是()①从匀速传递的产品生产流水线上,质检员每10分钟从某处抽取一件产品进行某项指标检测,这样的抽样是分层抽样②某地气象局预报:5月9日本地降水概率为90%,结果这天没下雨,这表明天气预报并不科学③吸烟与健康具有相关关系④在回归直线方程y^=0.1x+10中,当解释变量x每增加一个单位时,预报变量y增加0.1个单位.A.①②B.③④C.①③D.②④解析:①从匀速传递的产品生产流水线上,质检员每10分钟从某处抽取一件产品进行某项指标检测,由于间隔相同,这样的抽样是系统抽样,故①不正确;②降水概率为90%的含义是指降水的可能性为90%,但不一定降水,故②不正确;③吸烟与健康具有相关关系,正确;④在回归直线方程y^=0.1x+10中,回归系数为0.1,当解释变量x每增加一个单位时,预报变量y^增加0.1个单位,故④正确.故选B.答案:B3. 根据一组样本数据(x1,y1),(x2,y2),…,(x n,y n)的散点图分析存在线性相关关系,求得其回归方程y^=0.85x-85.7,则在样本点(165,57)处的残差为()A.54.55 B.2.45 C.3.45 D.111.55解析:把x=165代入y^=0.85x-85.7,得y=0.85×165-85.7=140.25-85.7=54.55,由57-54.55=2.45,故选B.答案:B4.为了研究色盲与性别的关系,调查了1 000人,得到了如下数据,则()A.99.9%的把握认为色盲与性别有关C .95%的把握认为色盲与性别有关D .90%的把握认为色盲与性别有关解析:K 2=1 000×(442×6-38×514)2956×44×480×520≈27.139>10.828.答案:A5.若已知相关指数R 2=0.83,则随机误差对总效应贡献率为( )A .17%B .83%C .27%D .38%答案:A6.已知x 与y 之间的一组数据:则y 与x 的线性回归方程y =b x +a 必过点( ) A .(2,2) B .(1.5,0) C .(1,2) D .(1.5,4) 答案:D7. 有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是 ( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”解析:由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A 、B 错误.根据列联表中的数据,得到K 2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C 正确.答案:C8.(2013·福建卷)已知x与y之间的几组数据如下表:x 12345 6y 02133 4假设根据上表数据所得线性回归直线方程为y^=b^x+a^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x +a′,则以下结论正确的是()A.b^>b′,a^>a′B.b^>b′,a^<a′C.b^< b′,a^>a′D.b^ <b′,a^<a′解析:过(1,0)和(2,2)的直线方程为y=2x-2,画出六点的散点图,回归直线的大概位置如图所示,显然b^<b′,a^>a′. 故选C.答案:C二、填空题(本大题共6小题,每小题5分,共30分;将正确答案填在题中的横线上)9.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与他(她)的学号之间的关系.其中有相关关系的是________(填序号).答案:①③④10.若由一个2×2列联表中的数据计算得K2=4.013,那么有________把握认为两个变量有关系.答案:95%11. 某炼钢厂废品率x(%)与成本y(元/t)的线性回归方程为y^=105.492+42.569x.当成本控制在176.5元/t时,可以预计生产的1 000 t钢中,约有__________t钢是废品.解析:因为176.5=105.492+42.569x,所以x=1.668,即成本控制在176.5元/t时,废品率为1.668%. 所以生产的1 000 t钢台,约有1 000×1.668%=16.68(t)钢是废品.答案:16.6812.对具有线性相关关系的变量x与y,测得一组数据如下表所示,若已求得它们的回归直线方程的斜率为6.5,则这条回归直线的方程为__________________.答案:y^=17.5+6.5x13.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9,现发现表中有一个数据模糊看不清,请你推断出该数据的值为________.零件数x (个) 10 2030 40 50 加工时间y (min)6275 81 89解析:零件个数的平均值x -=30,设零件为20个的对应加工时间为t min ,加工时间的平均值y -=307+t 5,因为回归直线必经过点(x -,y -),代入回归方程y ^=0.67x +54.9,计算得t =68.答案:6814.(2013·揭阳一模)一般来说,一个人脚掌越长,他的身高就越高,现对10名成年人的脚掌长x 与身高y 进行测量,得到数据(单位:cm)如下表,作出散点图后,发现散点在一条直线附近,经计算得到数据:∑i =110(x i -x -)(y i -y -)=577.5,∑i =110(x i -x -)2=82.5;某刑侦人员在某案发现场发现一对裸脚印,量得每个脚印长为26.5 cm ,则估计案发嫌疑人的身高为__________________cm.x20212223242526272829解析:依题意∑i =110(x i -x -)(y i -y -)=577.5,∑i =110(x i -x -)2=82.5;所以回归方程的斜率b =∑i =110(x i -x -)(y i -y -)∑i =110(x i -x -)2=577.582.5=7,又x -=24.5,y -=171.5,所以截距a =y --b x -=0,即回归方程为y ^=7x ,当x =26.5时,y ^=7×26.5=185.5,则估计案发嫌疑人的身高为 185.5 cm.答案:185.5三、解答题(本大题共6小题,共80分;解答时应写出必要的文字说明、证明过程及演算步骤)15.(本小题满分12分)冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示.解析:由已知数据得到如下2×2列联表由公式K 2=382×(37×202-121×22)2158×224×59×323≈13.11,由于13.11>6.635,故有99%的把握认为含杂质的高低与设备改造是有关的.16.(本小题满分12分)某医院用光电比色计检验尿汞时,得尿汞含量x (mg/L)与消光系数y 的结果如下:x消光系数y64138205285360(1)(2)求相关指数R2.解析:(1)列出散点图,如下图所示.由图可知y与x的散点图大体分布在一条直线周围,因此可以用线性回归的方程来拟合它.设y^=b^x+a^.由b^=∑i=1n(x i-x)(y i-y)∑i=1nx2i-n x2=36.95,a^=y-b^x=-11.3,故所求的回归方程为y^=36.95x-11.3.(2)把相应数值代入R2=1-∑i=1n(y i-y^i)2∑i=1n(y i-y)2,得R2≈0.999.17.(本小题满分14分)为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.(1)根据以上数据列出2×2列联表.(2)40岁以上的人患胃病与否和生活规律有关系吗?为什么?解析:(1)由已知可得2×2列联表:(2)根据列联表中的数据,由计算公式得K 2的观测值为: k =540×(20×260-200×60)280×460×220×320≈9.638,因为9.638>6.635,因此,在犯错误的概率不超过0.01的前提下,认为40岁以上的人患胃病与否和生活规律有关.18.(本小题满分14分)有人统计一个省的6个城市某一年的人均国内生产总值(人均GDP)x 和这一年各城市患白血病的儿童数量y ,其数据如下表所示:人均GDP x /万元 1086431患白血病的儿童数量y /人351 312 207 175 132 180 (2)求y 与x 之间的回归方程.解析:(1)作散点图(如下图所示).由散点图可知y 与x 具有线性相关关系. (2)将数据代入公式,可得b ^≈23.253,a ^≈102.151. 故y 与x 之间的线性回归方程是 y ^=23.253x +102.151.19.(本小题满分14分)关于x 与y 有如下数据:y =7x +17.试比较哪一个模型拟合的效果更好.解析:由①可得y i -y ^i 与y i -y -的关系如下表:所以 ∑i =15(y i -y ^i )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,∑i =15(y i -y -)2=(-20)2+(-10)2+102+02+202=1 000.所以R 21=1-∑i =15(y i -y ^i )2∑i =15(y i -y -)2 =1-1551 000=0.845.由②可得y i -y ^i 与y i -y -的关系如下表:所以 ∑i =15(y i -y ^i )2=(-1)2+(-5)2+82+(-9)2+(-3)2=180,∑i =15(y i -y -)2=(-20)2+(-10)2+102+02+202=1 000. 所以R 22=1-∑i =15(y i -y ^i )2∑i =15(y i -y -)2 =1-1801000=0.82.由于R 21=0.845,R 22=0.82,0.845>0.82, 所以R 21>R 22.故①的拟合效果好于②的拟合效果.20.(本小题满分14分)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y =bx +a ⎝⎛⎭⎪⎫其中b =187; (3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?解析:(1)设抽到相邻两个月的数据为事件A .因为从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的,其中,抽到相邻两个月的数据的情况有5种,所以P (A )=515=13.(2)由数据求得x -=11,y -=24, 由a =y --b x -=-307,所以关于的线性回归方程为y =187x -307.(3)当x =10时,y ^=1507,⎪⎪⎪⎪⎪⎪1507-22<2;同样, 当x =6时,y ^=787 ,⎪⎪⎪⎪⎪⎪787-12<2.所以,该小组所得线性回归方程是理想的.。
2019秋高中数学 第三章 统计案例章末复习课练习(含解析)新人教A版选修2-3.doc
章末复习课[整合·网络构建][警示·易错提醒]1.线性回归方程中的系数及相关指数R2,独立性检验统计量K2公式复杂,莫记混用错.2.相关系数r是判断两随机变量相关强度的统计量,相关指数R2是判断线性回归模型拟合效果好坏的统计量,而K2是判断两分类变量相关程度的量,应注意区分.3.在独立性检验中,当K2≥6.635时,我们有99.9%的把握认为两分类变量有关,是指“两分类变量有关”这一结论的可信度为99%而不是两分类变量有关系的概率为99%.专题一回归分析思想的应用回归分析是对抽取的样本进行分析,确定两个变量的相关关系,并用一个变量的变化去推测另一个变量的变化.如果两个变量非线性相关,我们可以通过对变量进行变换,转化为线性相关问题.[例1] 下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2008—2014.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2018年我国生活垃圾无害化处理量.附注:参考数据:∑7i =1 y i =9.32,∑7i =1 t i y i =40.17,∑7i =1 (y i -y )2=0.55,7≈2.646.参考公式:相关系数r =∑ni =1 (t i -t )(y i -y )∑ni =1 (t i -t )2∑ni =1 (y i -y )2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:b ^=∑ni =1 (t i -t )(y i -y )∑ni =1 (t i -t )2,a ^=y -b ^t . 解:(1)由折线图中数据和附注中参考数据得t =4,∑7i =1 (t i -t )2=28,∑7i =1 (y i -y )2=0.55,∑7i =1 (t i -t )(y i -y )=∑7i =1 t i y i -t ∑7i =1 y i =40.17-4×9.32=2.89,r ≈2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=∑7i =1 (t i -t )(y i -y )∑7i =1 (t i -t )2=2.8928≈0.10, a ^=y ^-b ^t =1.331-0.10×4≈0.93.所以y 关于t 的回归方程为y ^=0.93+0.10t .将2018年对应的t =11代入回归方程得y ^=0.93+0.10×11=2.03. 所以预测2018年我国生活垃圾无害化处理量约为2.03亿吨. 归纳升华解决回归分析问题的一般步骤1.画散点图.根据已知数据画出散点图.2.判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变量是否具有相关关系.在此基础上,利用最小二乘法求回归系数,然后写出回归方程.3.实际应用.依据求得的回归方程解决问题.[变式训练] 某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测该数学老师孙子的身高为________cm.解析:儿子和父亲的身高可列表如下:父亲身高(x ) 173 170 176 儿子身高(y )170176182设回归直线方程y ^=a +b x ,由表中的三组数据可求得b =1,故a =y --b ^x -=176-173=3,故回归直线方程为y ^=3+x ,将x =182代入得孙子的身高为185 cm.答案:185专题二 独立性检验的应用独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法.常用等高条形图来直观反映两个分类变量之间差异的大小;利用假设检验求随机变量K 2的值能更精确地判断两个分类变量间的相关关系.[例2] 电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图,将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,并据此资料判断是否在犯错误的概率不超过0.10的前提下认为“体育迷”与性别有关.性别 非体育迷体育迷 总计 男女10 55 总计(2)方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X ,若每次抽取的结果是相互独立的,求X 的分布列、期望E (X )和方差D (X ).解:(1)由频率分布直方图可知,在抽取的100人中“体育迷”有(0.020+0.005)×10×100=25(人).由独立性检验的知识得2×2列联表如下:性别 非体育迷 体育迷 总计 男 30 15 45 女 45 10 55 总计7525100将2×2得K 2的观测值=100×(30×10-45×15)275×25×45×55=10033≈3.030>2.706.所以在犯错误的概率不超过0.10的前提下认为“体育迷”与性别有关. (2)由频率分布直方图知抽到“体育迷”的频率为(0.020+0.005)×10=0.25, 将频率视为概率,即从观众中抽取一名“体育迷”的概率为14.由题意知X ~B ⎝ ⎛⎭⎪⎫3,14, 从而X 的分布列为:X 0 1 2 3 P27642764964164E (X )=np =3×14=34,D (X )=np (1-p )=3×14×34=916.归纳升华独立性检验问题的求解方法1.等高条形图法:依据题目信息画出等高条形图,依据频率差异来粗略地判断两个变量的相关性.2.K 2统计量法:通过公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),先计算观测值k ,再与临界值表进行比较,最后得出结论.[变式训练] 学生会为了调查学生对2018年俄罗斯世界杯的关注是否与性别有关,抽样调查100人,得到如下数据:n (ad -bc )2(a +b )(c +d )(a +c )(b +d )并参考以下临界数据:超过________.解析:由题意可得K 2=100×(30×10-15×45)275×25×45×55≈3.030>2.706,所以P (K 2≥2.706)=0.10,由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过0.10.答案:0.10专题三 数形结合思想数形结合思想在统计中的应用主要是将收集到的数据利用图表的形式表示出来,直观地反映变量间的关系.[例3] 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下,问铅中毒病人和对照组的尿棕色素阳性数有无差别?解: ,而对照组仅占24.32%.说明他们之间有较大差别.根据列联表作出等高条形图由图可知,铅中毒病人中与对照组相比较,尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性存在关联关系.归纳升华收集数据、整理数据是统计知识处理问题的两个基本步骤,将收集到的数据利用图表的形式整理出来,能够直观地反映变量之间的关系.在精确度要求不高的情况下,可以利用散点图、等高条形图等对两个变量之间的关系做出判断.[变式训练] 根据如下样本数据:x 345678y 4.0 2.5-0.50.5-2.0-3.0得到的回归方程为y=bx+a,则( )A.a>0,b>0 B.a>0,b<0C.a<0,b>0 D.a<0,b<0解析:根据题中表内数据画出散点图如图所示,由散点图可知b<0,a>0.答案:B。
2019-2020年高中数学 第三章 统计案例单元综合检测 新人教A版选修2-3
2019-2020年高中数学 第三章 统计案例单元综合检测 新人教A 版选修2-3一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中只有一个是符合题目要求的)1.(xx·唐山一中高二期中)已知具有线性相关关系的两个变量x ,y 之间的一组数据如下:A .2.5 C .4.5 D .5.5[答案] C[解析] ∵x =15(0+1+2+3+4)=2,∴y =0.95×2+2.6=4.5,又y =15(2.2+4.3+t +4.8+6.7),∴t =4.5,故选C .2.(xx·湖南益阳市箴言中学模拟)四名同学根据各自的样本数据研究变量x 、y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ② y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④ D .①④[答案] D[解析] y 与x 正(或负)相关时,线性回归直线方程y =b ^x +a ^中,x 的系数b ^>0(或b ^<0),故①④错.3.有甲、乙两种钢材,从中各取等量样品检验它们的抗拉强度指标如下: 甲乙A .期望与方差B .正态分布C .K 2D .概率[答案] A4.(xx·安徽示范高中联考)给出下列五个命题: ①将A 、B 、C 三种个体按的比例分层抽样调查,如果抽取的A 个体为9个,则样本容量为30;②一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;③甲组数据的方差为5,乙组数据为5,6,9,10,5,那么这两组数据中比较稳定的是甲; ④已知具有相关关系的两个变量满足的回归直线方程为y =1-2x ,则x 每增加1个单位,y 平均减少2个单位;⑤统计的10个样本数据为125、120、122、105、130、114、116、95、120、134,则样本数据落在[114.5,124.5)内的频率为0.4.其中真命题为( ) A .①②④ B .②④⑤ C .②③④ D .③④⑤[答案] B[解析] ①样本容量为9÷36=18,①是假命题;②数据1,2,3,3,4,5的平均数为16(1+2+3+3+4+5)=3,中位数为3,众数为3,都相同,②是真命题;③x -乙=5+6+9+10+55=7,s 2乙=15[(5-7)2+(6-7)2+(9-7)2+(10-7)2+(5-7)2]=15×(4+1+4+9+4)=4.4,∵s 2甲>s 2乙,∴乙稳定,③是假命题;④是真命题;⑤数据落在[114.5,124.5)内的有:120,122,116,120共4个,故所求概率为410=0.4,⑤是真命题.5.对变量x 、y 观测数据(x 1,y 1)(i =1,2,…,10),得散点图1;对变量u 、v 有观测数据(u 1,v 1)(i =1,2,…,10),得散点图2.由这两个散点图可以判断.( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关 [答案] C[解析] 本题主要考查了变量的相关知识,考查学生分析问题和解决问题的能力. 用散点图可以判断变量x 与y 负相关,u 与v 正相关.6.(xx·济南市模拟)为了解疾病A 是否与性别有关,在一医院随机地对入院50人进行了问卷调查得到了如下的列联表:下面的临界值表供参考:C .99.5%D .99.9%[答案] C[解析] 由公式得K 2=-225×25×30×20≈8.333>7.879,故有1-0.005=99.5%的把握认为疾病A 与性别有关.7.(xx·洛阳市高二期中)已知回归直线的斜率的估计值是2,样本点的中心为(4,12),则回归直线的方程是( )A .y ^=2x +4B .y ^=52x +2C .y ^=2x -20 D .y ^=16x +2[答案] A[解析] 由回归直线方程y ^=b ^x +a ^的定义知,b ^=2, ∵回归直线过样本点的中心,∴12=2×4+a ^, ∴a ^=4,∴回归直线方程为y ^=2x +4.8.以下关于线性回归的判断,正确的个数是( )①若散点图中所有点都在一条直线附近,则这条直线为回归直线;②散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A ,B ,C 点;③已知回归直线方程为y ^=0.50x -0.81,则x =25时,y 的估计值为11.69; ④回归直线方程的意义是它反映了样本整体的变化趋势.A .0B .1C .2D .3[答案] D[解析] 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数a ^,b ^得到的直线y ^=bx +a ^才是回归直线,∴①不对;②正确;将x =25代入y ^=0.50x -0.81,得y ^=11.69, ∴③正确;④正确,故选D .9.(xx·辽宁省协作体联考)甲、乙两位歌手在“中国好声音”选拔赛中,5次得分情况如茎叶图所示,记甲、乙两人的平均得分分别为x 甲、x 乙,则下列判断正确的是( )A .x 甲<x 乙,乙比甲成绩稳定B .x 甲<x 乙,甲比乙成绩稳定C .x 甲>x 乙,甲比乙成绩稳定D .x 甲>x 乙,乙比甲成绩稳定 [答案] A[解析] x 甲=15(77+76+88+90+94)=85x 乙=15(75+88+86+88+93)=86∴x 甲<x 乙且乙的成绩分布比甲的成绩分布集中稳定,故选A .10.(xx·潍坊市五县高二期中)某学校要从5名男生和2名女生中选出2人作为志愿者,若用随机变量ξ表示选出的志愿者中女生的人数,则数学期望E (ξ)等于( ) A .47 B .57 C .67 D .1[答案] A[解析] ∵随机变量ξ表示选出的志愿者中女生的人数,∴ξ可取0,1,2, 当ξ=0时,表示没有选到女生;当ξ=1时,表示选到一个女生;当ξ=2时,表示选到2个女生,∴P (ξ=0)=C 25C 27=1021,P (ξ=1)=C 15C 12C 27=1021,P (ξ=2)=C 22C 27=121,∴E (ξ)=0×1021+1×1021+2×121=47.11.(xx·宝鸡市金台区高二期末)两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关系数r 如下,其中拟合效果最好的模型是( )A .模型C .模型3D .模型4[答案] A[解析] 线性回归分析中,相关系数为r , |r |越接近于1,相关程度越大; |r |越小,相关程度越小,∵模型1的相关系数r 最大,∴模拟效果最好, 故选A .12.下面是某市场农产品的调查表. 市场供应量表:) A .(2.3,2.6) B .(2.4,2.6) C .(2.6,2.8) D .(2.8,2.9)[答案] C[解析] 以横轴为单价,纵轴为市场供、需量,在同一坐标系中描点,用近似曲线观察可知选C .二、填空题(本大题共4个小题,每小题4分,共16分,把正确答案填在题中横线上) 13.已知一个回归直线方程为y ^=1.5x +45,x ∈{1,7,5,13,19},则y =__________. [答案] 58.5[解析] 因为x =15(1+7+5+13+19)=9,且y =1.5x +45,所以y =1.5×9+45=58.5.本题易错之处是根据x 的值及y ^=1.5x +45求出y 的值再求y ,由y ^=1.5x +45求得的y 值不是原始数据,故错误.14.给出下列命题:①样本方差反映了所有样本数据与样本平均值的偏离程度;②若随机变量X ~N (0.43,0.182),则此正态曲线在x =0.43处达到峰值; ③在回归分析模型中,残差平方和越小,说明模型的拟合效果越差;④市政府调查江北水城市民收入与市民旅游欲望的关系时,抽查了3000人.经过计算得K 2=6.023,根据这一数据查阅下表,则市政府有97.5%以上的把握认为市民收入与旅游欲望有关系.[答案] ①②④[解析] 根据样本方差的概念、正态分布的概念可知①②均正确;在回归分布中,残差的平方和越小,说明模型的拟合效果越好,即X 与Y 有很强的关系,所以③不正确;通过表中的数据和K 2=6.023>5.024可知,可以认为有97.5%以上的把握认为市民收入与旅游欲望有关系,因此④正确.15.在xx 年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一组数据如下表所示:通过分析,y 对商品的价格x 的回归直线方程为________.[答案] y ^=-3.2x +40[解析] ∑i =15x i y i =392,x -=10,y -=8,∑i =15(x i -x -)2=2.5,代入公式,得b ^=-3.2,所以,a ^=y --b ^x -=40,故回归直线方程为y ^=-3.2x +40.16.某市居民xx ~xx 年家庭年平均收入x(单位:万元)与年平均支出Y (单位:万元)的统计资料如下表所示:根据统计资料,居民家庭平均收入的中位数是__________,家庭年平均收入与年平均支出有__________线性相关关系.[答案] 13 正[解析] 中位数的定义的考查,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数.由统计资料可以看出,当平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.三、解答题(本大题共6个大题,共74分,解答应写出文字说明,证明过程或演算步骤)17.(本题满分12分)(xx·安徽程集中学期中)电视传媒公司为了解某地区观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?(2)已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:K2=n ad-bc2a +b c+d a+c b+d[解析](1)25人,从而完成2×2列联表如下:将2×2K2=n ad-bc2a +b c+d a+c b+d=-275×25×45×55=10033≈3.030. 因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关.(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的集合为Ω={(a 1,a 2),(a 1,a 3),(a 2,a 3),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)}其中a i 表示男性,i =1,2,3,b j 表示女性,j =1,2.Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.用A 表示“任选2人中,至少有1人是女性”这一事件,则A ={(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)},事件A 由7个基本事件组成,因而P (A )=710.[点评] 本题考查了频率分布直方图,独立性检验,古典概型,解决这类题目的关键是对题意准确理解.18.(本题满分12分)某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从该部门内随机抽选了10个企业为样本,有如下资料:(1)计算x 与y (2)对这两个变量之间是否线性相关进行检验; (3)设回归方程为y ^=b ^x +a ^,求回归系数. [解析] (1)根据数据可得:x =77.7,y =165.7,∑10i =1x 2i=70903,∑10i =1y 2i =277119,∑10i =1x i y i =132938,所以r =0.808, 即x 与y 之间的相关系数r ≈0.808;(2)因为r >0.75,所以可认为x 与y 之间具有线性相关关系; (3)b ^=0.398,a ^=134.8.19.(本题满分12分)为考查某种药物预防疾病的效果,进行动物试验,得到如下丢失数据的列联表:2只,未患病数为η,工作人员曾计算过P (ξ=0)=389P (η=0).(1)求出列联表中数据x 、y 、M 、N 的值;(2)求ξ与η的均值(期望)并比较大小,请解释所得结论的实际含义; (3)能够以99%的把握认为药物有效吗? 参考公式:K 2=n ad -bc 2a +bc +d a +cb +d.①当K 2≥3.841时有95%的把握认为ξ、η有关联; ②当K 2≥6.635时有99%的把握认为ξ、η有关联.[分析] (1)从已知P (ξ=0)=389P (η=0)出发,结合2×2列联表可求.(2)求出ξ、η的分布列,再利用期望定义式求E (ξ)和E (η)即可. (3)利用公式算出K 2,结合参考数据可以判断. [解析] (1)∵P (ξ=0)=C 220C 250,P (η=0)=C 2xC 250,∴C 220C 250=389×C 2xC 250,∴x =10. ∴y =40,∴M =30,N =70. (2)ξ取值为0、1、2.P (ξ=0)=C 220C 250=38245,P (ξ=1)=C 120C 130C 250=120245,P (ξ=2)=C 230C 250=87245.∴E (ξ)=294245.P (η=0)=C 210C 250=9245.P (η=1)=C 110C 140C 250=80245.P (η=2)=C 240C 250=156245.∴E (η)=392245.∴E (ξ)<E (η),即说明药物有效. (3)∵K 2=-230×70×50×50≈4.76.∵4.76<6.635,∴不能够有99%的把握认为药物有效.20.(本题满分12分)(xx·洛阳市高二期中)以下资料是一位销售经理收集来的每年销售额和销售经验年数的关系的一组样本数据:(1)(2)试预测销售经验为8年时的年销售额约为多少万元(精确到十分位)?[解析] (1)由散点图(图略)知y 与x 呈线性相关关系,由表中数据计算得,x -=6,y -=10,b ^=59180,a ^=24130,回归直线方程:y ^=59180x +24130.(2)x =8时,预测年销售额为59180×8+24130≈10.7万元.21.(本题满分12分)某班50位学生期中考试数学成绩的频率分布直方图如下图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中x 的值;(2)从成绩不低于80分的学生中随机选取2人,该2人中成绩在90分以上(含90分)的人数记为ξ,求ξ的数学期望.[分析] (1)利用频率和为1,可求x 值;(2)先确定各部分人数,再确定ξ取值,利用组合知识,用古典概型求ξ的分布列,再求数学期望.[解析] (1)图中x 所在组为[80,90]即第五组,∵由频率分布直方图的性质知,10×(0.054+x +0.01+3×0.006)=1, ∴x =0.018.(2)成绩不低于80分的学生所占的频率为f =10×(0.018+0.006)=0.24, 所以成绩不低于80分的学生有:50f =50×0.24=12人. 成绩不低于90分的学生人数为:50×10×0.006=3 所以为ξ的取值为0、1、2 P (ξ=0)=C 29C 212=611,P (ξ=1)=C 19×C 13C 212=922,P (ξ=2)=C 23C 212=122所以ξ的分布列为:所以为ξ的数学期望E (ξ)=0×11+1×22+2×22=2.[点评] 1.本题考查频率分布直方图与随机变量的分布列,数学期望等知识,考查抽象概括能力与应用意识.2.应用古典概型求事件的概率是分布列的常见命题方式.22.(本题满分14分)(xx·辽宁葫芦岛市一模)为了调查学生星期天晚上学习时间利用问题,某校从高二年级1 000名学生(其中走读生450名,住宿生550名)中,采用分层抽样的方法抽取n 名学生进行问卷调查.根据问卷取得了这n 名同学每天晚上学习时间(单位:分钟)的数据,按照以下区间分为八组①[0,30),②[30,60),③[60,90),④[90,120),⑤[120,150),⑥[150,180),⑦[180,210),⑧[210,240],得到频率分布直方图如图.已知抽取的学生中星期天晚上学习时间少于60分钟的人数为5人.(1)求n 的值并补全频率分布直方图;(2)如果把“学生晚上学习时间达到两小时”作为是否充分利用时间的标准,对抽取的n 名学生,完成下列2×2列联表:(3)若在第①组、第②组、第⑧组中共抽出3人调查影响有效利用时间的原因,记抽到“学习时间少于60分钟”的学生人数为X ,求X 的分布列及期望.参考公式:K 2=n ad -bc 2a +bc +d a +cb +d[解析] (1)设第i 组的频率为P i (i =1,2,…,8),由图可知:P 1=11500×30=2100, P 2=11000×30=3100∴学习时间少于60分钟的频率为P 1+P 2=120由题意:n ×120=5,∴n =100.又P 3=1375×30=8100, P 5=1100×30=30100,P 6=1120×30=25100,P 7=1200×30=15100, P 8=1600×30=5100, ∴P 4=1-(P 1+P 2+P 3+P 5+P 6+P 7+P 8)=325.∴第④组的高度为:h =325×130=1250频率分布直方图如图:(注:未标明高度1/250扣1分)(2)由频率分布直方图可知,在抽取的100人中,“走读生”有45人,“住宿生”有55人,其中“住宿生”中利用时间不充分的有10人,从而走读生中利用时间不充分的有25-10=15人,利用时间充分的有45-15=30人,由此可得2×2列联表如下:将2×2K 2=n ad -bc 2a +bc +d a +cb +d=×10-275×25×45×55=10033≈3.030 因为3.030<3.841,所以没有理由认为学生“利用时间是否充分”与走读、住宿有关 (3)由(1)知:第①组2人,第②组3人,第⑧组5人,总计10人,则X 的所有可能取值为0,1,2,3P (X =i )=C i 5C 3-i5C 310(i =0,1,2,3)∴P (X =0)=C 05C 35C 310=10120=112,P (X =1)=C 15C 25C 310=50120=512,P (X =2)=C 25C 15C 310=50120=512,P (X =3)=C 35C 05C 310=10120=112∴X 的分布列为:∴E (X )=0×112+1×12+2×12+3×12=12=2(或由超几何分布的期望计算公式E (X )=n ×M N =3×510=32)2019-2020年高中数学 第三章 统计案例单元综合测试 北师大版选修2-3一、选择题(本大题共10个小题,每小题5分,共50分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.(xx·哈师大附中高二期中)下列说法正确的有几个( ) (1)回归直线过样本点的中心(x -,y -);(2)线性回归方程对应的直线y ^=b ^x +a ^至少经过其样本数据点(x 1,y 1)、(x 2,y 2)、…、(x n ,y n )中的一个点;(3)在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高; (4)在回归分析中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好. A .1 B .2 C .3 D .4[答案] B[解析] 由回归分析的概念知①④正确,②③错误.2.变量y 对x 的回归方程的意义是( ) A .表示y 与x 之间的函数关系 B .表示y 与x 之间的线性关系 C .反映y 与x 之间的真实关系D .反映y 与x 之间的真实关系达到最大限度的吻合 [答案] D[解析] 用回归方程预测变量y 对x 的不确定关系,反映的不是真实关系,而是真实关系达到最大限度的吻合.3.变量x 与y 具有线性相关关系,当x 取值16,14,12,8时,通过观测得到y 的值分别为11,9,8,5,若在实际问题中,y 的估计最大取值是10,则x 的最大取值不能超过( )A .16B .17C .15D .12[答案] C[解析] 由题目中的数值计算出回归方程,然后解方程求得x 的值.b =∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2=0.7,∴a =-0.5,∴回归直线方程为y =-0.5+0.7x . 将y =10代入,得x =15.4.对变量x 、y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图①;对变量u 、v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图②.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关 [答案] C[解析] 由题图①可知,各点整体呈递减趋势,x 与y 负相关.由题图②可知,各点整体呈递增趋势,u 与v 正相关.5.工人月工资(元)依销售总额(千元)变化的回归直线方程为y =60+90x ,下列判断正确的是( )A .销售总额为1 000元时,工资为50元B .销售总额提高1 000元时,工资提高150元C .销售总额提高1 000元时,工资提高90元D .销售总额为1 000元时,工资为90元 [答案] C[解析] 由回归方程的意义来解,同时要注意它们各自的单位符号.销售总额提高1 000元时,工资提高90元.6.若回归直线方程中的回归系数b =0时,则相关系数r 的值为( ) A .1 B .-1 C .0 D .无法确定[答案] C[解析] 若b =0,则 i =1nx i y i -n x y =0,∴r =0.7.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:A .99%B .95%C .90%D .无充分依据[答案] B[解析] 由表中数据得χ2=-226×24×27×23≈5.059>3.841,所以约有95%的把握认为两变量之间有关系.8.(xx·淄博市、临淄区学分认定考试)观测两个相关变量,得到如下数据:A.y ^=0.5x -1 B .y ^=x C.y ^=2x +0.3 D .y ^=x +1[答案] B[解析] 因为x -=0,y -=-0.9-2-3.1-3.9-5.1+5+4.1+2.9+2.1+0.910=0,根据回归直线方程必经过样本中心点(x -,y -)可知,回归直线方程过点(0,0),所以选B.9.(xx·枣阳一中、襄州一中、宣城一中、曾都一中高三期中联考)由变量x 与y 相对应的一组数据(1,y 1)、(5,y 2)、(7,y 3)、(13,y 4)、(19,y 5)得到的线性回归方程为y ^=2x +45,则y -=( )A .135B .90C .67D .63[答案] D[解析] ∵x -=15(1+5+7+13+19)=9,y -=2x -+45,∴y -=2×9+45=63,故选D.10.下表是甲、乙两个班级进行数学考试,按学生考试及格与不及格统计成绩后的2×2列联表:则χ2的值为( ) A .0.559 B .0.456 C .0.443 D .0.4[答案] A [解析] χ2=-245×45×21×69≈0.559.二、填空题(本大题共5小题,每小题5分,共25分)11.有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系;(2)曲线上的点与该点的坐标之间的关系;(3)苹果的产量与气候之间的关系;(4)森林中的同一种树木,其断面直径与高度之间的关系;(5)学生与他(她)的学号之间的关系,其中有相关关系的是______.[答案] (3)(4)12.如果χ2的值为8.654,可以认为“A 与B 无关”的可信度是____________. [答案] 1%[解析] ∵8.654>6.635,∴我们认为A 与B 有关的把握为99%,故“A 与B 无关”的可信度为1%. 13.根据下表计算χ2=________.[答案] 1.779 [解析] χ2=-2196×196×68×324≈1.779.14.已知在某种实践运动中获得一组数据:其中不慎将数据y 2y =0.5x +a ,则y 2与a 的近似值为________.[答案] 8,-0.7[解析] 由题意,得x =19.5,y =28.2+y 24. 代入∑i =14x i -xy i -y∑i =14x i -x2=0.5中,得y 2≈8.所以y =9.05,a =y -b x ≈9.05-0.5×19.5=-0.7.15.某种产品的业务费支出x(单位:万元)与销售额y (单位:万元)之间有如下对应数据:则变量y 与x [答案] 0.92 [解析] 列表如下:由表中数据计算得x =5,y =50,则相关系数r =-5×5×50145-5×52×13500-5×502≈0.92.三、解答题(本大题共6小题,共75分,前4题每题12分,20题13分,21题14分) 16.男性更容易患色盲吗?某机构随机调查了1000人,调查结果如下表(单位:人):[解析] 问题是判断患色盲是否与性别有关,由题目所给数据得到如下列联表(单位:人):由公式计算得χ2=956×44×480×520≈27.139.由于27.139>6.635,所以有99%以上的把握认为患色盲与性别有关.故男性更有可能患色盲.17.为考查某种药物预防疾病的效果,进行动物试验,得到如下丢失数据的列联表:2只,未患病数为η,工作人员曾计算过P (ξ=0)=389P (η=0).(1)求出列联表中数据x 、y 、M 、N 的值;(2)求ξ与η的均值(期望)并比较大小,请解释所得结论的实际含义; (3)能够以99%的把握认为药物有效吗? 参考公式:χ2=n ad -bc 2a +bc +d a +cb +d.①当χ2≥3.841时有95%的把握认为ξ、η有关联; ②当χ2≥6.635时有99%的把握认为ξ、η有关联.[分析] (1)从已知P (ξ=0)=389P (η=0)出发,结合2×2列联表可求.(2)求出ξ、η的分布列,再利用均值定义式求E (ξ)和E (η)即可. (3)利用公式算出K 2,结合参考数据可以判断. [解析] (1)∵P (ξ=0)=C 220C 250,P (η=0)=C 2xC 250,∴C 220C 250=389×C 2xC 250,∴x =10. ∴y =40,∴M =30,N =70. (2)ξ取值为0、1、2.P (ξ=0)=C 220C 250=38245,P (ξ=1)=C 120C 130C 250=120245,P (ξ=2)=C 230C 250=87245.∴E (ξ)=294245.P (η=0)=C 210C 250=9245.P (η=1)=C 110C 140C 250=80245.P (η=2)=C 240C 250=156245.∴E (η)=392245.∴E (ξ)<E (η),即说明药物有效. (3)∵χ2=-230×70×50×50≈4.76.∵4.76<6.635,∴不能够有99%的把握认为药物有效.18.已知10只狗的血球体积及红血球的测量值如下:(1)画出上表的散点图; (2)求出回归直线方程. [解析] (1)如图.(2)x -=110(45+42+46+48+42+35+58+40+39+50)=44.5,y -=110(6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+3.55+8.72)=7.37,设回归直线方程为y =bx +a ,则b =∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2≈0.17,a =y --b x -=-0.195,所以所求回归直线的方程为y =0.17x -0.195.19.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表; (2)判断性别与休闲方式是否有关系. [解析] (1)2×2的列联表(2)由公式得, χ2=-270×54×64×60≈6.201.因为χ2≥3.841,所以有95%的把握认为“休闲方式与性别有关”.20.某商场经营一批进价为30元/台的小商品,在市场试验中发现,此商品的销售单价x (x 取整数)元与日销售量y 台之间有如下关系:(1)画出散点图,并判断(2)求日销售量y 对销售单价x 的线性回归方程;(3)设经营此商品的日销售利润为P 元,根据(2)写出P 关于x 的函数关系式,并预测当销售单位价x 为多少元时,才能获得最大日销售利润.[解析] (1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.(2)∵x =14×(35+40+45+50)=42.5,y =14×(56+41+28+11)=34,∑i =14x i y i =35×56+40×41+45×28+50×11=5 410,∑i =14x 2i =352+402+452+502=7 350, ∴b =∑i =14x i y i -4x·y∑i =14x 2i -4x 2=5 410-4×42.5×347 350-4×42.52=-370125=-2.96.∴a =y -b x =34-(-2.96)×42.5=159.8. ∴y =-2.96x +159.8.(3)依题意有P =(-2.96x +159.8)(x -30) =-2.96x 2+248.6x -4 794,∴当x =248.62×2.96≈42时,P 有最大值,约为426,即预测销售单价为42元时,能获得最大日销售利润.[反思总结] 该类题属于线性回归线问题,解答本类题目的关键是首先通过散点图(或相关性检验求相关系数r)来分析两变量间的关系是否相关,然后再利用求回归方程的公式求解回归方程,在此基础上,借助回归方程对实际问题进行分析.21.(xx·安徽程集中学期中)电视传媒公司为了解某地区观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?(2)已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:χ2=n ad-bc2a +b c+d a+c b+d[解析](1)25人,从而完成2×2列联表如下:将2×2列联表中的数据代入公式计算,得χ2=n ad-bc2a +b c+d a+c b+d=-275×25×45×55=10033≈3.030.因为3.030>2.706,所以我们有90%的把握认为“体育迷”与性别有关.(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的集合为Ω={(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)}其中a i表示男性,i=1,2,3,b j表示女性,j=1,2.Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.用A表示“任选2人中,至少有1人是女性”这一事件,则A={(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)},事件A由7个基本事件组成,因而P(A)=710.。
(必考题)高中数学高中数学选修2-3第三章《统计案例》测试(有答案解析)(3)
一、选择题1.某商场为了了解不同厂家生产的散装面包的月销售量y (千克)与售价x (元/千克)之间的关系,随机统计了某几个月的月销售量与当月各散装面包的售价,相关数据如下表:由表中数据算出线性回归方程为 3.1ˆˆyx a =-+,则样本在()18180,处的残差为( ) A .0B .1.4C .2D .2.12.下列说法中错误的是( )A .先把高二年级的2000名学生编号:1到2000,再从编号为1到50的学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这种抽样方法是系统抽样法.B .一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x .C .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1.D .若一组数据1,a ,3的平均数是2,则该组数据的方差是23. 3.某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如下表所示:若数学成绩90分(含90分)以上为优秀,物理成绩85(含85分)以上为优秀,则有多少把握认为学生的数学成绩与物理成绩有关系( ) A .95%B .97.5%C .99.5%D .99.9%4.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%5.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元D .105万元6.某种产品的广告费支出x 与销售额y (单位:万元)之间有下表关系:y 与x 的线性回归方程为 6.5175ˆ.y x =+,当广告支出5万元时,随机误差的效应(残差)为( ) A .40 B .20 C .30D .107.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k 2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是( ) P (K 2≥k ) … 0.250.150.100.025 0.010 0.005 …k…1.323 2.072 2.706 5.024 6.635 7.879 …A .90%B .95%C .97.5%D .99.5%9.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温()xC17 1382月销售量y (件)2433 40 55由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .5810.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( ) A .25B .25C .35D .321011.已知,x y 的取值如下表:( )x1, 234若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-12.对两个变量x 和y 进行回归分析,得到一组样本数据: ()()1122,,,x y x y ,…(),n n x y ,则下列说法中不正确的是( )A .由样本数据得到的回归方程ˆˆˆy bx a =+必过样本中心(),x yB .残差平方和越小的模型,拟合的效果越好C .若变量y 和x 之间的相关系数为0.9362r =-,则变量y 和x 之间具有线性相关关系D .用相关指数2R 来刻画回归效果, 2R 越小,说明模型的拟合效果越好二、填空题13.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的13,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若有95%的把握认为是否喜欢韩剧和性别有关,求男生至少有______人.14.x ,y 的取值如下表:则x ,y 之间的关系可选用函数___进行拟合.15.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:男生1310女生720为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K 2的观测值为.因为k >3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.16.某班主任对全班50名学生作了一次调查,所得数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总计262450由表中数据计算得到K 2的观测值k≈5.059,于是________(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关. 17.以下四个命题,其中正确的序号是____________________.①从匀速传递的产品生产流水线上,每20分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程0.212ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.2个单位;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系”的把握程度越大.18.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K 来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法; ②将参数方程cos sin x y θθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y +=;③极坐标系中,22,3A π⎛⎫⎪⎝⎭与()3,0B ④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误.19.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下联表:参考公式: ()()()()()22n ad bc K a b c d a c b d -=++++参照附表,在犯错误的概率最多不超过__________(填百分比)的前提下,可认为“该种疫苗由预防埃博拉病毒感染的效果”. 20.已知x 、y 之间的一组数据如下:则线性回归方程ˆya bx =+所表示的直线必经过点________. 三、解答题21.共享单车进驻城市,绿色出行引领时尚.某市2017年对共享单车的使用情况进行了调查,数据显示,该市共享单车用户年龄分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所示.若将共享单车用户按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用共享单车用户”,使用次数为5次或不足5次的称为“不常使用共享单车用户”.已知在“经常使用共享单车用户”中有56是“年轻人”.(1)现对该市市民进行“经常使用共享单车与年龄关系”的分析,采用随机抽样的方法,抽取了一个容量为200的样本.请你根据题目中的数据,补全下列2×2列联表:年轻人非年轻人 合计 经常使用共享单车用户 120 不常使用共享单车用户80 合计16040200根据列联表独立性检验,判断有多大把握认为经常使用共享单车与年龄有关? 参考数据:20()P K k ≥ 0.150 0.100 0.050 0.025 0.0100k2.072 2.7063.841 5.024 6.635其中,22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++.(2)以频率为概率,用分层抽样的方法在(1)的200户用户中抽取一个容量为5的样本,从中任选3户,记经常使用共享单车的用户数为随机变量X ,求X 的分布列和数学期望.22.十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康,经过不懈的努力奋斗拼搏,新农村建设取得了巨大进步,农民年收入也逐年增加.为了实现2020年脱贫的工作计划,该地扶贫办随机收集了以下50位农民的统计数据,以此研究脱贫攻坚的效果是否与农民的受教育的发展状况有关:(1)根据列联表运用独立性检验的思想方法分析:能否有99%的把握认为“脱贫攻坚的效果与农民的受教育的发展状况有关”,并说明理由;(2)现用分层抽样的方法在全部受过教育的农民中随机抽取5位农民作为代表,再从这5位农民代表中任选2位继续调查,求这2位农民代表中至少有1位脱贫攻坚效果明显的概率.参考附表:参考公式:()()()()()22n ad bcKa b a c b d c d+=++++,其中n a b c d=+++.23.根据教育部《中小学生艺术素质测评办法》,为提高学生审美素养,提升学生的综合素质,江苏省中考将增加艺术素质测评的评价制度,将初中学生的艺术素养列入学业水平测试范围.为初步了解学生家长对艺术素质测评的了解程度,某校随机抽取100名学生家长参与问卷测试,并将问卷得分绘制频数分布表如下:了解”(得分低于60分)两类,完成22⨯列联表,并判断是否有99%的把握认为“学生家长对艺术素质评价的了解程度”与“性别”有关?(2)以这100名学生家长中“比较了解”的频率代替该校学生家长“比较了解”的概率.现在再随机抽取3名学生家长,设这3名家长中“比较了解”的人数为X ,求X 的概率分布列和数学期望.不太了解 比较了解 合计男性 女性 合计附:()()()()()22n ad bc a b c d a c b d χ-=++++,()n a b c d =+++.临界值表:()20P x χ≥0.15 0.100.050.025 0.010 0.005 0.001 0x2.0722.7063.8415.0246.6357.87910.82824.某私营业主为确定下一年度投入某种产品的宣传费,需了解月宣传费x (单位:百元)对月销售量y (单位:t )和月利润z (单位:百元)的影响,对8个月的宣传费i x 和销售量i y (i =1,2,...,8)数据作了初步处理,得到如图的散点图及一些统计量的值.x y w()821i i x x =-∑()821ii w w =-∑()()81iii x x y y =--∑ ()()81iii w w yy =--∑5.4 563 2.2 63.88 3.7 645.188 151.7(1)根据散点图判断出y =c +y 关于月宣传费x 的回归方程类型,求y 关于x的回归方程;(表中i w =(2)已知这种产品的每月利润z 与x 、y 的关系为2z y x =-,根据(1)的结果,当月宣传费用x =16时,求月利润的预报值.参考公式:1122211()()()()n ni iiii i nniii i x y nx y x x y y b xn x x x ====-⋅--==--∑∑∑∑, ˆˆa y bx=- 25.某企业是否支持进军新的区域市场,在全体员工中进行了抽样调查,调查结果如下表所示:(1)根据表中数据,问是否有99%的把握认为“新员工和老员工是否支持进军新的区域市场有差异”;(2)已知在被调查的新员工中有6名来自市场部,其中2名支持进军新的区域市场,现在从这6人中随机抽取3人,设其中支持进军新的区域市场人数为随机变量X ,求X 的分布列和数学期望.附:()22()()()()n ac bd K a b a c b d c d -=++++26.2016年欧洲杯将于2016年6月10日到7月10日在法国举行.为了使得赛会有序进行,欧足联在全球范围内选聘了30名志愿者(其中男性16名,女性14名).调查发现,男性中有10人会英语,女性中有6人会英语.(1)根据以上数据完成以下2×2列联表:并回答能否在犯错的概率不超过0.10的前提下认为性别与会英语有关?参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++参考数据:(2)会英语的6名女性志愿者中曾有4人在法国工作过,若从会英语的6名女性志愿者中随机抽取2人做导游,则抽出的2人都在法国工作过的概率是多少?【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据表中的数据求出(),x y ,利用回归直线方程经过样本中心点(),x y 求出ˆa ,把18x = 代入回归直线方程求出ˆy,利用残差的定义ˆy y -即可求解. 【详解】由表格得(),x y 为()24,160 ,又回归直线方程 3.1ˆˆyx a =-+经过样本中心点(),x y , 所以160 3.124ˆa=-⨯+,解得ˆ234.4a =, 所以回归直线方程为 3.123.4ˆ4yx =-+, 把18x = 代入回归直线方程可得,ˆ178.6y=, 故样本在()18180, 处的残差为180178.6 1.4-=.故选:B 【点睛】本题考查回归直线方程经过样本中心点和利用回归直线方程求某点处的残差;考查运算求解能力;熟练掌握回归直线方程经过样本中心点和残差的定义是求解本题的关键;属于中档题.2.C解析:C 【分析】根据题意,对选项中的命题进行分析,判断真假性即可. 【详解】对于A ,根据抽样方法特征是数据多,抽样间隔相等,是系统抽样,所以A 正确; 对于B ,一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x ,所以B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数||r 的值越接近于1,所以C 错误;对于D ,一组数据1、a 、3的平均数是2,所以2a =;所以该组数据的方差是222212[(12)(22)(32)]33s =⨯-+-+-=,所以D 正确.故选:C . 【点睛】本题主要考查抽样和统计,考查方差和平均数的计算,考查两个随机变量的相关性,意在考查学生对这些知识的理解掌握水平3.C解析:C 【解析】分析:根据题意,列出22⨯列联表,求出观测值2K ,根据观测值对应的数值得出结论. 详解:根据题意,列出22⨯列联表,如下;则220(51212)8.80177.879671413K ⨯⨯-⨯==>⨯⨯⨯,因为观测值对应的数值为0.005,所以有99.5%的把握认为学生的数学成绩与物理成绩之间有关系.故选C.点睛:本题考查了独立性检验的应用,属于基础题.考查利用数学知识研究实际问题的能力以及相应的运算能力.4.A解析:A 【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)5.B解析:B 【解析】分析:根据表中数据求得样本中心(,)x y ,代入回归方程ˆ7ˆyx a =+后求得ˆa ,然后再求当10x =的函数值即可. 详解:由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50), ∴ˆ5075a=⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+. 当10x =时,710158ˆ5y=⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元. 故选B .点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.6.D解析:D 【解析】∵y 与x 的线性回归方程为 6.5175ˆ.y x =+ 当5x =时,ˆ50y=. 当广告支出5万元时,由表格得:60y =故随机误差的效应(残差)为605010.-= 故选D .7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.C解析:C 【详解】∵2 6.023 5.024K =>∴可断言市民收入增减与旅游欲望有关的把握为97.5%. 故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bc K a b c d a c b d -=++++,计算出2K 的值;(3)查表比较2K 与临界值的大小关系,作统计判断.9.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.10.B解析:B 【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.11.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 12.D解析:D 【解析】逐一分析所给的各个选项:A. 由样本数据得到的回归方程ˆˆˆy bx a =+必过样本中心(),x yB. 残差平方和越小的模型,拟合的效果越好C. 若变量y 和x 之间的相关系数为0.9362r =-,则变量y 和x 之间具有线性相关关系D. 用相关指数2R 来刻画回归效果,2R 越大,说明模型的拟合效果越好,该说法错误. 本题选择D 选项.二、填空题13.【分析】设男生人数为依题意填写列联表计算观测值列出不等式求出的取值范围再根据题意求出男生的人数【详解】设男生人数为由题意可得列联表如下: 喜欢韩剧 不喜欢韩剧 总计 男生 女生 总 解析:18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列出不等式求出x 的取值范围,再根据题意求出男生的人数. 【详解】设男生人数为x ,由题意可得列联表如下:则 3.841k >,即2452()3636969 3.84171711931818x x x x x x k x x x x ⋅-⋅==>⋅⋅⋅, 解得12.697x >.因为各部分人数均为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有18人. 故答案为:18. 【点睛】本题考查独立性检验的应用,解题关键是列出列联表,然后进行计算,属于常考题.14.【分析】根据表格中的数据即可估测之间的关系可选用函数进行拟合得到答案【详解】根据表格中的数据可知当时;当时;当时;当时;当时可估测之间的关系可选用函数进行拟合【点睛】本题主要考查了函数的表示方法和指 解析:2x y =【分析】根据表格中的数据,即可估测,x y 之间的关系可选用函数2x y =进行拟合,得到答案. 【详解】根据表格中的数据,可知当2x =-时,0.260.25y =→;当1x =-时,0.510.5y =→;当0x =时, 1.11y =→;当0.5x =时, 1.41y =1x =时, 2.052y =→, 可估测,x y 之间的关系可选用函数2x y =进行拟合. 【点睛】本题主要考查了函数的表示方法和指数函数的性质的应用,其中熟记函数的表示方法和指数函数的性质,合理应用是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.15.5【解析】因为随机变量K2的观测值k >3841所以在犯错误的概率不超过005的前提下认为主修统计专业与性别有关系故这种判断出现错误的可能性为5考点:独立性检验思想【解析】因为随机变量K2的观测值k>3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%.考点:独立性检验思想.16.不能【解析】查表知若要在犯错误的概率不超过001的前提下认为喜欢玩电脑游戏与认为作业多有关则临界值k0=6635本题中k≈5059<6635所以不能在犯错误的概率不超过001的前提下认为喜欢玩电脑游解析:不能【解析】查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k0=6.635.本题中,k≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.考点:独立性检验.17.②③【分析】利用系统抽样的定义判断①利用独立性检验判断④;利用相关系数的性质判断②;由回归方程的性质判断③【详解】①为系统抽样①不正确;④分类变量与它们的随机变量的观测值为当越小与有关系的把握程度越解析:②③【分析】利用系统抽样的定义判断①利用独立性检验判断④;利用相关系数的性质判断②;由回归方程的性质判断③.【详解】①为系统抽样, ①不正确;④分类变量X与Y,它们的随机变量2K的观测值为k,当k 越小,“X与Y有关系”的把握程度越小,④不正确;根据相关系数的性质可知②正确;由回归方程的性质可知③正确.故答案为②③.【点睛】本题通过对多个命题真假的判断,综合考查系统抽样、相关系数、回归方程、独立性检验,属于中档题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.18.①③④【解析】①是独立性检验的应用①对②中由于所以显然是半个圆②错③中由极坐标中两点距离公式=③对④中所有边长相等的凸多边形都是正多边形为大前提是错误的因为只需要正多边形挤压变形使之仍为凸多边形即可解析:①③④①是独立性检验的应用,①对.②中由于[]0,θπ∈,所以01y ≤≤,显然是半个圆,②错.③中,由极坐标中两点距离公式2221212212cos()AB ρρρρθθ=+--=14912()19,2+-⨯-=AB ③对.④中“所有边长相等的凸多边形都是正多边形”为大前提,是错误的,因为只需要正多边形挤压变形,使之仍为凸多边形即可.④对.所以填①③④.19.【详解】由题意可得参照附表可得:在犯错误的概率不超过的前提下认为小动物是否被感染与有没有服用疫苗有关故答案为【方法点睛】本题主要考查独立性检验的应用属于中档题独立性检验的一般步骤:(1)根据样本数据 解析:5%【详解】 由题意可得,()2210010302040 4.762 3.84150503070K ⨯⨯-⨯=≈>⨯⨯⨯,参照附表,可得:在犯错误的概率不超过005的前提下,认为“小动物是否被感染与有没有服用疫苗有关”,故答案为005. 【方法点睛】本题主要考查独立性检验的应用,属于中档题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3)查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)20.(155)【解析】由题意可得:线性回归方程过样本中心点即线性回归方程所表示的直线必经过点(155)点睛:(1)正确理解计算的公式和准确的计算是求线性回归方程的关键(2)回归直线方程必过样本点中心解析:(1.5,5) 【解析】由题意可得:0123 1.54x +++==,826454y +++==, 线性回归方程过样本中心点,即线性回归方程ˆya bx =+所表示的直线必经过点(1.5,5) 点睛:(1)正确理解计算,b a 的公式和准确的计算是求线性回归方程的关键. (2)回归直线方程y bx a =+必过样本点中心(),x y .三、解答题21.(1)列联表答案见解析,有85%以上的把握认为经常使用共享单车与年龄有关;(2)分布列答案见解析,数学期望:95. 【分析】(1)由由图2计算出经常使用共享单车的用户数占百分比为60%,据此计算可得列联表;(2)计算容量为5的样本中,经常使用共享单车的用户数为3,可得X 的可能取值为1,2,3,再根据古典概型的概率公式计算概率,可得分布列和数学期望. 【详解】(1)由图2可知经常使用共享单车的用户数占30.1%19.2%10.7%60%++=,所以经常使用共享单车的人数为20060%120⨯=人,经常使用共享单车的年轻人人数为520060%1006⨯⨯=人,所以经常使用共享单车的非年轻人人数为12010020-=人, 补全的列联表如下:∴()22200100202060 2.083 2.0721604012080K ⨯-⨯=≈>⨯⨯⨯,故有85%以上的把握认为经常使用共享单车与年龄有关.(2)由题意知,容量为5的样本中,经常使用共享单车的用户数为560%3⨯=人,不经常使用共享单车的用户数为532-=人,所以X 的可能取值为1,2,3.则()2123353110C C P X C ===,()1223356210C C P X C ===,()0323351310C C P X C === ∴X 的分布列为: 数学期望()1189123101010105E X =⨯+⨯+⨯==. 【点睛】关键点点睛:正确识别条形图和饼图,并利用两个图形计算频数是解题关键,属于中档题. 22.(1)有99%的把握认为“脱贫攻坚效果与农民的受教育的发展状况有关”;(2)910【分析】(1)根据列联表计算2K ,与附表数据6.635比较即得结论;(2)先分层抽样确定5位农民代表中有3位农民效果明显,2位农民效果不明显,再用列举法,计算从5位代表中任选2位,至少有1位脱贫攻坚效果明显的概率即可. 【详解】解:(1)根据题中列联表得:()2250151910613506.65021292525203K ⨯⨯-⨯==≈⨯⨯⨯由于6.650 6.635>,故有99%的把握认为“脱贫攻坚的效果与农民的受教育的发展状况有关”; (2)受教育的农民中,效果明显与效果不明显的比例为15:103:2=,所以用分层抽样的方法抽取的5位农民代表中,3位效果明显,2位效果不明显.设这5位农民代表为,,,,A B C d e ,其中,,A B C 效果明显,,d e 效果不明显,从中任选2位调查,结果为:(),A B ,(),A C ,(),A d ,(),A e ,(),B C ,(),B d ,(),B e ,(),C d ,(),C e ,(),d e ,共10种情况,其中(),A B ,(),A C ,(),A d ,(),A e ,(),B C ,(),B d ,(),B e ,(),C d ,(),C e 满足至少有1位脱贫攻坚效果明显,共9种情况,所以从5位代表中任选2位,至少有1位脱贫攻坚效果明显的概率910P =. 【点睛】本题考查了独立性检验、分层抽样和古典概型的概率计算问题,属于中档题. 23.(1)列联表见解析,有把握;(2)分布列见解析,()2110E X =. 【分析】(1)根据题中已知条件完善22⨯列联表,并计算出2χ的观测值,结合临界值表可得出结论;(2)由题意可知7~3,10X B ⎛⎫⎪⎝⎭,利用二项分布可得出随机变量X 的分布列,并由此可计算出随机变量X 的数学期望. 【详解】(1)由题意得列联表如下:。
2019届高中数学选修2-3同步测试第三章统计案例综合检测Word版含答案
第三章综合检测一、选择题1.下列说法中错误的是( ).A .若变量x 与y 之间存在着线性相关关系,则我们根据试验数据得到的点(x i ,y i )(i=1,2,…,n )将散布在某一条直线的附近B .若两个变量x 与y 之间不存在线性关系,则根据它们的一组数据(x i ,y i )(i=1,2,…,n )不能写出一个线性方程C .设x ,y 是具有相关关系的两个变量,且y 关于x 的线性回归方程为y ^=b ^x+a ^,b ^叫作回归系数D .为使求出的线性回归方程有意义,可用统计检验的方法来判断变量y 与x 之间是否存在线性相关关系 【解析】任何一组(x i ,y i )(i=1,2,…,n )都能写出一个线性方程,只是有的不存在线性关系. 【答案】B2.在独立性检验中,假设H 0:变量X 与变量Y 没有关系,则在H 0成立的情况下,P (K 2≥6.635)≈0.010表示的意义是( ).A.变量X 与变量Y 有关系的概率为1%B.变量X 与变量Y 没有关系的概率为99.9%C.变量X 与变量Y 没有关系的概率为99%D.变量X 与变量Y 有关系的概率为99%【解析】由题意得变量X 与变量Y 没有关系的概率约为1%,即可认为变量X 与变量Y 有关系的概率为99%.【答案】D3.变量y 对x 的回归方程的意义是( ).A .表示y 与x 之间的函数关系B .表示y 与x 之间的线性关系C .反映y 与x 之间的真实关系D .反映y 与x 之间的真实关系达到最大限度的吻合【解析】用回归方程预测变量y 对x 的不确定关系,反映的不是真实关系,而是真实关系达到最大限度的吻合.【答案】D4.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a=10,b=21,c+d=35.若X 和Y 有关系的可信程度为95%,则c 等于( ).A.4B.5C.6D.7【解析】当c=4时,K 2的观测值k=66×(10×31-21×4)231×35×14×52≈4.27>3.841.即有95%的把握说明X 和Y 有关,故选A . 【答案】A5.为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系.设其回归直线方程为y ^=b ^x+a ^.已知∑i =110x i =225,∑i=110y i =1600,b ^=4.该班某学生的脚长为24,据此估计其身高为( ).A.160 B .163C.166D.170【解析】∵∑i =110x i =225,∴x −=110∑i=110x i =22.5.∵∑i =110y i =1600,∴y −=110∑i =110y i =160. 又b ^=4,∴a ^=y −-b ^x −=160-4×22.5=70.∴回归直线方程为y ^=4x+70.将x=24代入上式得y ^=4×24+70=166. 故选C . 【答案】C6.在列联表中,两个比值( )相差越大,两个分类变量之间的关系越强.A .a a +b 与c c +d B .a c +d 与ca +b C .a 与c D .a 与c【解析】a a +b 与cc +d相差越大,说明ad 与bc 相差越大,两个分类变量之间的关系越强.【答案】A7.有人收集了春节期间平均气温:根据以上数据,用线性回归的方法,求得销售额y 与平均气温x 之间线性回归方程y ^=b ^x+a ^的系数b ^=-2.4.则预测平均气温为-8 ℃时该商品销售额为( ).A .34.6万元B .35.6万元C .36.6万元D .37.6万元【解析】x -=-16=-4,y −=100=25,由题意知,y ^=-2.4x+a ^过样本点的中心(-4,25),得a ^=25-9.6=15.4,所以y ^=-2.4x+15.4.当x=-8时,y ^=19.2+15.4=34.6,故选A . 【答案】A8.已知x 与y假设根据上表数据所得线性回归方程为y ^=b ^x+a ^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是( ).A .b ^>b',a ^>a' B .b ^>b',a ^<a'C .b ^<b',a ^>a' D .b ^<b',a ^<a'【解析】由两组数据(1,0)和(2,2)可求得直线方程为y=2x-2,b'=2,a'=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b ^=∑i =16x i y i -6x -y −∑i =16x i 2-6x-2=58-6×72×13691-6× 722=57,a ^=y −-b ^x -=136-57×72=-13,所以b ^<b',a ^>a'. 【答案】C9.某班主任对全班50则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约是( ).A .99%B .95%C .90%D .无充分依据【解析】由表中数据,得K 2的观测值k=50×(18×15-9×8)2≈5.059>3.841,所以有95%以上的把握认为两变量之间有关系.【答案】B10.在线性回归方程y ^=a ^+b ^x 中,b ^为回归系数,下列关于b ^的说法中不正确的是( ).A .b ^为回归直线的斜率B .b ^>0,表示随x 增加,y 值增加;b ^<0,表示随x 增加,y 值减少 C .b ^是唯一确定的值D .回归系数b ^的统计意义是当x 每增加(或减少)一个单位,y 平均改变b ^个单位【解析】b ^是由总体的一个样本利用一定的方法得到的,选择不同的样本或不同的计算方法得到的b ^是不同的.【答案】C11.:根据以上数据,则( ).A .性别与获取学位类别有关B .性别与获取学位类别无关C .性别决定获取学位的类别D .以上都是错误的 【解析】K 2的观测值k=340×(162×8-143×27)2≈7.343>6.635,因此,有99%的把握认为性别与获取学位类别有关. 【答案】A12.指数曲线y=a e bx 进行线性变换后得到的回归方程为u=1-0.6x ,则函数y=x 2+bx+a 的单调递增区间为( ).A.(0,+∞)B.310,+∞ C. 12,+∞ D.(1,+∞)【解析】将y=a e bx 进行线性变换,得u=c+bx ,其中c=ln a ,则有b=-0.6,a=e,所以函数y=x 2-0.6x+e 的单调递增区间为310,+∞ . 【答案】B 二、填空题13.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),用最小二乘法求得回归方程为y ^=0.84x+52.8.20现发现表中有一个数据模糊看不清,则该数据的值为 .【解析】由表知x -=30,设模糊不清的数据为m ,则y −=15×(60+m+78+84+96)=318+m 5,y −=0.84x -+52.8, 即318+m5=0.84×30+52.8, 解得m=72. 【答案】7214.在一次飞机航程中调查男女乘客的晕机情况,其2×2列联表如下,则判断晕机与性别 .(填“有关”或“无关”)【解析】K 2的观测值k=110×(10×20-70×10)280×30×20×90≈6.366>5.024,故有97.5%的把握认为“晕机与性别有关”.【答案】有关15.幂函数曲线y=ax b ,做变换u=ln y ,v=ln x ,c=ln a ,得线性函数 .【解析】将u=ln y ,v=ln x ,c=ln a 代入y=ax b ,消去x ,y ,得u=c+bv. 【答案】u=c+bv。
人教A版高中数学选修2-3:第三章 统计案例测试卷 章末测试
第三章 统计案例测试卷(时间:90分钟 满分:150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.对于回归直线方程y ^=b ^x +a ^,下列说法不正确的是( )A .直线必经过点(x -,y -)B .x 增加1个单位时,y 平均增加b ^个单位C .样本数据中x =0时,可能有y =a ^D .样本数据中x =0时,一定有y =a ^解析:回归直线方程是根据样本数据得到的一个近似曲线,故由它得到的值也是一个近似值.答案:D2.根据如下样本数据:x 3 4 5 6 7 8y 4 2.5 -0.5 0.5 -2 -3得到的回归直线方程为y =b x +a ,则( )A.a ^>0,b ^<0B.a ^>0,b ^>0C.a ^<0,b ^>0D.a ^<0,b ^<0解析:根据题意,画出散点图.根据散点图,知两个变量为负相关,且回归直线与y 轴的交点在y 轴正半轴,所以a ^>0,b ^<0.答案:A3.独立检验中,假设H 0:变量X 与变量Y 没有关系,则在H 0成立的情况下,P (K 2≥6.635)=0.010表示的意义是( )A .变量X 与变量Y 有关系的概率为1%B .变量X 与变量Y 没有关系的概率为99.9%C .变量X 与变量Y 没有关系的概率为99%D .变量X 与变量Y 有关系的概率为99%解析:由题意知变量X 与Y 没有关系的概率为0.01,即认为变量X 与Y 有关系的概率为99%.答案:D4.下面是一个2×2列联表y 1 y 2 总计x 1 a 21 73x 2 2 25 27总计 b 46 100其中a ,b A .52,54 B .54,52C .94,146D .146,94解析:由a +21=73,得a =52,a +2=b ,得b =54.答案:A5.在2×2列联表中,下列哪两个比值相差越大,两个分类变量有关系的可能性就越大( )A.a a +b 与c c +dB.a c +d 与c a +bC.a a +d 与c b +cD.a b +d 与c a +c解析:当ad 与bc 相差越大,两个分类变量有关系的可能性越大,此时a a +b 与c c +d相差越大.答案:A6.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)的统计调查,已知y 与x 之间具有线性相关关系,且回归方程为y ^=0.66x +1.562.若某城市的居民人均消费水平为7.675千元,试估计该城市的人均消费额占人均工资收入的百分比约为( )A .83%B .72%C .67%D .66%解析:将y ^=7.675代入回归方程,可计算得x ≈9.26,所以该城市的人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.答案:A7.根据下面的2×2列联表得到如下4个判断:①至少有99.9%的把握认为“患肝病与嗜酒有关”;②至少有99%的把握认为“患肝病与嗜酒有关”;③在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒有关”;④在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒无关”.A .0B .1C .2D .3解析:由2×2列联表中数据可求得K 2的观测值k =992×(700×32-60×200)2760×232×900×92≈7.349>6.635,所以在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关”,即至少有99%的把握认为“患肝病与嗜酒有关”.因此②③正确,故选C 项.答案:C8.某高校《统计》课程的教师随机给出了选修该课程的一些情况,具体数据如下:因为k >3.841,所以可以判断选修该课程与性别有关.那么这种判断出错的可能性不超过( )A .5%B .95%C .1%D .99%解析:若k >3.841,说明在犯错误的概率不超过0.05的前提下认为选修该课程与性别有关,也就是选修该课程与性别有关出错的可能性不超过5%.答案:A9.根据一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的散点图分析存在线性相关关系,求得其回归方程y ^=0.85x -85.7,则在样本点(165,57)处的残差为( )A .54.55B .2.45C .3.45D .111.55解析:把x =165代入y ^=0.85x -85.7,得y =0.85×165-85.7=54.55,故残差为57-54.55=2.45.答案:B10.甲、乙两个班级进行一门课程考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表( )A .0.3~0.4B .0.4~0.5C .0.5~0.6D .0.6~0.7解析:因为K 2=90×(10×38-7×35)245×45×17×73=90×13522 513 025≈0.652 7>0.455,P (K 2≥0.455)=0.5,故选B.答案:B11.某学校开展研究性学习活动,某同学获得一组实验数据如下表所示:)A .y =2x -2B .y =⎝⎛⎭⎫12xC .y =log 2xD .y =12(x 2-1) 解析:本题若用R 2或残差来分析拟合效果,运算将很繁琐,计算量太大,可以将各组数据代入检验,发现D 项最接近.故选D 项.答案:D12.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35.若X 与Y 有关系的可信程度不小于97.5%,则c 等于( )A .3B .4C .5D .6解析:列2×2列联表如下:故K 2的观测值k =66×[10(35-c )-21c ]31×35×(10+c )(56-c )≥5.024. 把选项A ,B ,C ,D 代入验证可知选A 项.答案:A二、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中横线上)13.已知高三某学生的高考成绩y (分)与高三期间有效复习时间x (天)正相关,且回归方程是y ^=3x +50,若期望他高考达到500分,则他的有效复习时间应不低于________天. 解析:本题主要考查运用线性回归方程来预测变量的取值.当y ^=500时,易得x =500-503=150. 答案:15014.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本(单位:元)的资料进行线性回归分析,结果如下:x -=72,y -=71,∑i =16x 2i =79,∑i =16x i y i =1 481. 则销量每增加1 000箱,单位成本约下降________元.解析:由题意知,b ^=1 481-6×72×7179-6×⎝⎛⎭⎫722≈-1.818 2, a ^=71-(-1.818 2)×72≈77.36,所以y ^=-1.81 82x +77.36, 所以销量每增加1 000箱,单位成本约下降1.818 2元.答案:1.818 215.欲知作者的性别是否与读者的性别有关,某出版公司派工作人员到各书店随机调查了500位买书的顾客,结果如下表所示..(填“有关”或“无关”)解析:由公式得k =500×(142×133-122×103)2264×236×245×255≈5.131>5.024,所以在犯错误的概率不超过0.025的前提下作者的性别与读者的性别有关.答案:有关16.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H 0;“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得k ≈3.918,经查对临界值表P (K 2≥3.841)≈0.05.对此,四名同学做出了以下判断:p :在犯错误的概率不超过0.05的前提下认为“能起到预防感冒的作用”;q :若某人未使用该血清,则他在一年中有95%的可能性得感冒;r :这种血清预防感冒的有效率为95%;s :这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是________.(把你认为正确的都填上)(1)p ∧(綈q );(2)(綈p )∧q ;(3)[(綈p )∧(綈q )]∧(r ∨s );(4)[p ∨(綈r )]∧[(綈q )∨s ]. 解析:查对临界值表知P (K 2≥3.841)=0.05,故有95%的把握认为“这种血清能起到预防感冒的作用”;95%仅是指“血清能起到预防感冒的作用”的可信程度,但也有“在100个使用血清的人中一个患感冒的人也没有”的可能,故p 真,其余都假.结合复合命题的真值可知,选(1)(4).答案:(1)(4)三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)17.(10分)某运动队研制了一种有助于运动员在大运动量的训练后快速恢复体力的口服制剂,为了实验新药的效果而抽取若干名运动员来实验,所得资料如下:总计 105 165 105435解析:对男运动员K 2=270×(60×45-45×120)2105×165×180×90≈7.013>6.635, 所以有99%的把握认为药剂对男运动员有效.对女运动员K 2=540×(45×255-60×180)2105×435×225×315≈0.076≤2.706, 所以没有充足的证据显示药剂与女运动员体力恢复有关系.因此该药对男运动员药效较好.18.(12分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了4次试验,得到数据如下:零件的个数x (个) 2 3 4 5加工的时间y (小时) 2.5 3 4 4.5(1)(2)求y 关于x 的线性回归方程y ^=b ^x +a ^;(3)试预测加工10个零件需要的时间.解析:(1)散点图如图所示:(2)由表中数据得x -=3.5,y -=3.5,∑i =14 (x i -x -)(y i -y -)=3.5,∑i =14 (x i -x -)2=5,由公式计算得b ^=0.7,a ^=y --b ^x -=1.05,所以所求线性回归方程为y ^=0.7x +1.05.(3)当x =10时,y ^=0.7×10+1.05=8.05,所以预测加工10个零件需要8.05小时.19.(12分)某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加 班级工作 不太主动参 加班级工作合计 学习积极性高 18 7 25学习积极性一般 6 19 25合计 24 26 50抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?并说明理由.解析:(1)积极参加班级工作的学生有24人,不太主动参加班级工作且学习积极性一般的学生有19人,总人数为50人,∴抽到积极参加班级工作的学生的概率为2450=1225; 抽到不太主动参加班级工作且学习积极性一般的学生的概率为1950. (2)k =50×(18×19-6×7)225×25×24×26=15013≈11.5, ∵k >10.828,∴在犯错误的概率不超过0.001的前提下认为学习积极性与对待班级工作的态度有关系.20.(12分)在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了一组数据如下表:年龄23 27 39 41 45 49 50 53 54 56 57 58 60 61 脂肪 含量y9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6 30.2 31.4 30.8 33.5 35.2 34.6 (2)求相关指数R 2,并说明其含义;(3)给出37岁时人的脂肪含量的预测值.解析:(1)散点图如图所示.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系.设线性回归方程为y ^=b ^x +a ^,则由计算器算得b ^≈0.576,a ^=-0.448,所以线性回归方程为y ^=0.576x -0.448.(2)∑i =114 e ^2i =∑i =114 (y i -y ^i )2≈37.78.∑i =114 (y i -y -)2≈644.99.R 2=1-37.78644.99≈0.941. R 2≈0.941,表明年龄解释了94.1%的脂肪含量变化.(3)当x =37时,y ^=0.576×37-0.448≈20.9,故37岁时人的脂肪含量约为20.9%.21.(12分)为了了解心肺疾病是否与年龄相关,现随机抽取了40名市民,得到数据如下表:患心肺疾病 不患心肺疾病 总计大于40岁 16 小于等于40岁12 总计 40已知在40人中随机抽取1人,抽到不患心肺疾病的市民的概率为25. (1)请将2×2列联表补充完整;(2)已知在大于40岁且患心肺疾病的市民中,有4名重症患者,专家建议重症患者住院治疗,现从这16名患者中选出2人,记需住院治疗的人数为ξ,求ξ的分布列和数学期望;(3)能否在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关?解析:(1)将2×2列联表补充完整如下:患心肺疾病 不患心肺疾病 总计大于40岁 16 4 20小于等于40岁 8 12 20总计 24 16 40(2)ξP (ξ=0)=C 212C 04C 216=1120,P (ξ=1)=C 112C 14C 216=25,P (ξ=2)=C 012C 24C 216=120, 所以随机变量ξ的分布列为ξ 0 1 2P 1120 25 120故ξ的数学期望E (ξ)=0×1120+1×25+2×120=12. (3)K 2=40×(16×12-4×8)224×16×20×20=203>6.635, 所以能在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关.22.(12分)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在[21.7,22.3](单位:cm)之间,把零件尺寸在[21.9,22.1)的记为一等品,尺寸在[21.8,21.9)∪[22.1,22.2)的记为二等品,尺寸在[21.7,21.8)∪[22.2,22.3]的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:(1)根据上述数据完成下列2×2列联表,根据此数据你认为选择不同的工艺与生产出一等品是否有关?甲工艺 乙工艺 总计一等品非一等品总计附:P (K 2≥k 0) 0.10 0.05 0.01k 0 2.706 3.841 6.635K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )(2)以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单件利润分别为30元、20元、15元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由.解析:(1)2×2列联表如下:K 2=200×(50×40-60×50)110×90×100×100≈2.02<2.706, 所以没有理由认为选择不同的工艺与生产出一等品有关.(2)由题知运用甲工艺生产单件产品的利润X 的分布列为X 的数学期望为E (X )=30×X 的方差为D (X )=(30-24)2×0.5+(20-24)2×0.3+(15-24)2×0.2=39.乙工艺生产单件产品的利润Y 的分布列为Y 的数学期望为E (Y )=30×Y 的方差为D (Y )=(30-24.5)2×0.6+(20-24.5)2×0.1+(15-24.5)2×0.3=47.25.由上述结果可以看出D (X )<D (Y ),即甲工艺波动小,虽然E (X )<E (Y ),但相差不大,所以以后应选择甲工艺.。
人教版高中数学高二选修2-3课下检测第三章《统计案例》检测题
第三章检测题本检测题分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分,满分150分,时间120分钟.第Ⅰ卷(选择题 共60分)一、选择题:本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.下列说法正确的个数是( )①事件A 与B 的检验无关时,则两个事件互不影响; ②事件A 与B 关系越密切,则K 2就越大;③K 2的大小是判定事件A 与B 是否相关的唯一根据; ④若判定两个事件A 与B 有关,则A 发生B 一定发生. A .1 B .2 C .3D .4由题意知,只有②正确. 故应选A. A2.在一个2×2列联表中,由数据计算得K 2=13.097,则两个变量间有关系的可能性为( )A .99%B .95%C .90%D .无关系∵如果K 2的估计值K 2>6.635时,就有99.9%的把握认为“x 与y 有关系”. 故应选A. A3.对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程中的截距为( )A .a =y -bxB .a =y -b ^x C.a ^=y -bxD.a ^=y -b ^x∵y ^=a ^+b ^,∴a ^=y -b ^x .故应选D. D4.有下列说法:①随机误差是引起预报值与真实之间的误差的原因之一;②残差平方和越小,预报精度越高;③在独立检验中,通过二维条形图和三维柱形图可以粗略判断两个分类变量是否有关系.其中真命题的个数是( ) A .0 B .1 C .2D .3由统计知识知①②③全对. 故应选D. D5.对于线性相关系数r ,下列叙述正确的是( )A .|r |∈(0,+∞),|r |越大,相关程度越大;反之,相关程度越小B .|r |∈(-∞,+∞),|r |越大,相关程度越大;反之,相关程度越小C .|r |≤1,|r |越接近于1,相关程度越大;|r |越接近于0,相关程度越小D .以上说法都不对∵|r |≤1且|r |越接近于1,相关程度越大,|r |越接近于0,相关程度越小. 故应选C. C6.为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调查统计,结果如下:( ) A .1.255 B .38.214 C .0.0037D .2.058K 2=337×(57×43-221×16)2278×59×73×264=1.255.故选A. A7.在一个2×2列联表中,由其数据计算得K 2统计量为6.635,则在犯错误的概率不超过________的情况下两个变量间有关系( )A .0.001B .0.05C .0.01D .无关系由K 2=6.635知两个变量有关的可能性为99%,故犯错误的概率不超过0.01. 故应选C. C8.工人月工资y (元)依劳动生产率x (千元)变化的回归方程为y ^=100+90x ,下列判断正确的是( )A .劳动生产率为1 000元时,则工资为190元B .劳动生产率提高1 000元时,则工资平均提高90元C .劳动生产率提高1 000元时,则工资平均提高190元D .当月工资为118元时,劳动生产率为200元∵回归直线斜率为90,∴x 每增加1千元,y ^增加90,即劳动生产率提高1 000元时,工资提高90元.故应选B. B9.已知随机变量ξ只能取三个值:x 1,x 2,x 3,其概率依次成等差数列,则这个等差数列的公差的取值范围为( )A.⎣⎡⎦⎤-14,14B.⎣⎡⎦⎤-15,15 C.⎣⎡⎦⎤-13,13D.⎣⎡⎦⎤-12,12 由题设知P 1+P 2+P 3=1,2P 2=P 1+P 3, ∴P 2=13,P 1+P 3=23,且P 1>0,P 3>0,d =13-P 1=P 3-13,P 1=13-d ≥0, P 3=13+d ≥0⇒-13≤d ≤13.故应选C. C10.为了对新产品进行合理定价,对这类产品进行了试销试验,用以观察需求量y (单位:千克)对于价格x (单位:千元)的变化关系,得出数据如下:A.-0.993 1 B.0.993 1C.0.632 D.-0.632代入相关系数公式可得r≈-0.632.故应选D.D11.对四对变量y和x进行线性相关检验,已知n是观测值组数,r是相关系数,且已知:①n=7,r=0.953 3; ②n=15,r=0.301 2;③n=17,r=0.499 1; ④n=3,r=0.995 0.则变量y和x具有线性相关关系的是()A.①和②B.①和③C.②和④D.③和④相关系数r越大,数量x,y的线性相关关系越强.故应选B.B12.已知两组数据x1,x2,…,x n与y1,y2,…,y n,它们的平均数分别是x和y,则新的一组数据2x1-3y1+1,2x2-3y2+1,…,2x n-3y n+1的平均数是() A.2x-3y B.2x-3y+1C.4x-9y D.4x-9y+12x1-3y1+1+2x2-3y2+1+…+2x n-3y n+1)/n=2(x1+x2+…+x n)/n-3(y1+y2+…+y n)/n+1=2x-3y+1.故应选B.B第Ⅱ卷(非选择题共90分)二、填空题:本大题共4小题,每小题5分,共20分.把答案填在题中横线上.13.用身高(cm)预报体重(kg)满足y=0.849x-85.712,若要找到41.638 kg的人,________是在150 cm中.(填“一定”或“不一定”).∵统计的方法是可能犯错误的.利用线性回归方程预报变量的值不是精确值.但一般认为实际测量值应在预报值左右.不一定14.有下列关系:①人的年龄与其拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一树木,其横截面直径与高度之间的关系;⑤学生与其学号之间的关系,其中有相关关系的是________.其中②,⑤为确定性关系,不是相关关系. ∴有相关关系的是①③④. ①③④15.调查在2~3级风的海上航行中男女乘客的晕船情况,结果如下表所示:根据此资料,在2~________________________________________________________________________. K 2=71×(12×24-25×10)222×49×37×34≈0.076,由于K 2=0.076<2.706,所以我们没有充分的把握认为晕船与否和性别有关系. 不对16.若由一个2×2的列联表中的数据计算得K 2≈4.013,那么有________的把握认为两个变量间有关系.由题意知K 2≈4.013>3.843,所以有95%的把握认为两个变量有关. 95%三、解答题:本大题共6小题,共70分.解答应写出必要的文字说明、证明过程或演算步骤.17.(本小题满分10分)通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:性别与读营养说明列联表由题意可知a=16,b=28,c=20,d=8,a+b=44,c+d=28,a+c=36,b+d=36,n=a+b+c+d=72,代入公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)得K2=72×(16×8-28×20)244×28×36×36≈8.42,由于K2≈8.42>7.879,我们就有99.5%的把握认为性别和读营养说明之间有关系,即我们就说性别和读营养说明之间有99.5%的可能是有关系的.18.(本小题满分12分)要分析学生初中升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生分析他们入学的数学成绩和高一年级期末数学考试成绩,如表所示:x 63674588817152995876Y 65785282928973985675(1)画出散点图;(2)求线性回归方程;(3)若学生王明亮的入学成绩为80分,试预测他在高一年级期末考试中的数学成绩为多少?(1)作出散点图如图所示,从散点图可以看出,这两个变量具有线性相关关系.(2)i x i y i x2i x i y i16365 3 969 4 09526778 4 489 5 22634552 2 025 2 340488827 7447 21658192 6 5617 45267189 5 041 6 31975273 2 704 3 796899989 8019 70295856 3 364 3 248107675 5 776 5 700可求得x =110(63+67+…+76)=70,y =110(65+78+…+75)=76. b ^=55 094-10×70×7651 474-10×702≈0.765 56,a ^=76-0.765 56×70≈22.41.所求线性回归方程为y ^=22.41+0.765 56x .(3)若学生王明亮入学成绩为80分,代入上面线性回归方程y =22.41+0.765 56x ,可求得y ≈84.即王明亮同学高一期末数学成绩预测值为84分. 19.(本小题满分12分)下表表示的是关于11岁儿童患花粉热与湿疹情况的调查数据,对11岁儿童能否作出患花粉热与湿疹有关的结论?K 2=15 014×(141×13 525-928×420)21 069×13 945×561×14 453≈285.96>6.635.所以我们有99%的把握认为对于11岁儿童患花粉热与湿疹有关. 20.(本小题满分12分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=bx +a ;(3)若由线性回归方程得到的估计数据与所选出的检验数据是误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(1)设事件A 表示“选取的2组数据恰好是不相邻2天的数据”,则A 表示“选取的数据恰好是相邻2天的数据”.基本事件总数为10,事件A 包含的基本事件数为4. ∴P (A )=410=25, ∴P (A )=1-P (A )=35.a ^=y -b x =27-2.5×12=-3, ∴y ^=2.5x -3.(3)由(2)知:当x =10时,y ^=22,误差不超过2颗; 当x =8时,y ^=17,误差不超过2颗. 故所求得的线性回归方程是可靠的. 21.(本小题满分12分)某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,则数学成绩优秀与物理、化学、总分也优秀哪个关系较大?(注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人.)物理 化学 总分 数学优秀 228 225 267 数学非优秀14315699(1)列出数学与物理优秀的2×2列联表如下:将表中数据代入22(2)列出数学与化学优秀的2×2列联表如下:将表中数据代入22(3)列出数学与总分优秀的2×2列联表如下:将表中数据代入22由上面的分析可知,数学成绩优秀与物理、化学、总分优秀都有关系.由于计算的K2值都大于10.28,这说明有99.9%的把握认为数学优秀与物理、化学、总分优秀有关系,但与总分关系最大,与物理其次.22.(本小题满分12分)从某大学中随机选取9名女大学生,其身高和体重数据如下表所示:大学生的体重.(1)由于问题中要求根据身高预报体重,因此选取身高为自变量x,真实体重为因变量y,作出散点图,如图所示.从散点图上可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系.(2)列表计算:身高x i 体重y i x 2i y 2i x i y i 165 48 27 225 2 304 7 920 165 57 27 225 3 249 9 405 157 50 24 649 2 500 7 850 170 54 28 900 2 916 9 180 175 64 30 625 4 096 11 200 165 61 27 225 3 721 10 065 155 43 24 025 1 849 6 665 170 59 28 900 3 481 10 030 1716129 2413 72110 431∴回归直线方程为y ^=0.872 651x -89.540 8. (3)计算相关系数(4)作出预报对于身高为172 cm 的女大学生,由回归直线方程可以预报其体重为y ^=0.872 651×172打印版本-89.540 8=60.555 kg.高中数学。
(典型题)高中数学高中数学选修2-3第三章《统计案例》测试卷(含答案解析)(1)
一、选择题1.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 2.下列命题中正确命题的个数是(1)对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大;(2)若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变; (3)在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; (4)设随机变量ξ服从正态分布()0,1N ; 若()1P p ξ>=,则()1102P p ξ-<<=-( ) A .4B .3C .2D .13.对四对变量Y 和x 进行线性相关性检验,已知n 是观测值组数,r 是相关系数,且已知: ①n=7,r=0.953 3;②n=15,r=0.301 2;③n=17,r=0.499 1;④n=3,r=0.995 0,则变量Y 和x 具有线性相关关系的是( ) A .①和② B .①和③ C .②和④D .③和④4.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bc K a c b d a d b c -++++,其中n a b c d =+++.20()P K k ≥0.100.050.01 0.0050k 2.7063.8416.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D.有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”5.某班主任对全班50名学生进行了作业量的调查,数据如下表:认为作业量大认为作业量不大合计男生18927女生81523合计262450()附:()()()()()22n ad bcKa b c d a c b d-=++++P(K2>k0)0.150.100.050.0250.010.001k0 2.072 2.706 3.841 5.024 6.63510.828A.0.01 B.0.025 C.0.10 D.0.056.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠不冷漠总计多看电视6842110少看电视203858总计8880168则认为多看电视与人冷漠有关系的把握大约为()附:K2=.P(K2≥k0)0.100.050.0250.0100.0050.001k0 2.706 3.841 5.024 6.6357.87910.828A.99% B.97.5%C.95% D.90%7.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温()xC17 1382月销售量y (件)24 33 40 55由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .588.有下列数据: x123y35.9912.01下列四个函数中,模拟效果最好的为( ) A .B .C .D .9.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( ) A 2B .25C .35D 3210.已知样本789x y 、、、、的平均数是82xy 值为 A .8B .32C .60D .8011.下列说法中正确的是①相关系数r 用来衡量两个变量之间线性关系的强弱, r 越接近于1,相关性越弱; ②回归直线y bx a =+一定经过样本点的中心(),x y ; ③随机误差e 的方差()D e 的大小是用来衡量预报的精确度;④相关指数2R 用来刻画回归的效果, 2R 越小,说明模型的拟合效果越好.( ) A .①②B .③④C .①④D .②③12.已知回归方程0.8585.7y x ∧=-,则该方程在样本()165,57 处的残差为( ) A .111.55B .54.5C .3.45D .2.45二、填空题13.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如表根据列联表数据,求得K 2≈__________. 14.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1; ③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________.15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案. 方案类别基本费用超时费用甲包月制70元乙有限包月制(限60小时)50元0.05元/分钟(无上限)丙有限包月制(限30小时)30元0.05元/分钟(无上限)若某用户每月上网时间为66小时,应选择__________方案最合算.16.已知方程ˆ0.8582.71yx =-是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,ˆy的单位是kg ,那么针对某个体(160,53)的残差是______________. 17.用线性回归模型求得甲、乙、丙3组不同的数据对应的2R 的值分别为0.81,0.98,0.63,其中__________(填甲、乙、丙中的一个)组数据的线性回归的效果最好.18.某大学进行自主招生时,需要进行逻辑思维和阅读表达两项能力的测试.学校对参加测试的200名学生的逻辑思维成绩、阅读表达成绩以及这两项的总成绩进行了排名.其中甲、乙、丙三位同学的排名情况如下图所示:得出下面四个结论:①甲同学的阅读表达成绩排名比他的逻辑思维成绩排名更靠前 ②乙同学的逻辑思维成绩排名比他的阅读表达成绩排名更靠前 ③甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前 ④乙同学的总成绩排名比丙同学的总成绩排名更靠前 则所有正确结论的序号是_________.19.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:感染 未感染 总计 注射 10 40 50 未注射 20 30 50 总计3070100关系.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++.) 20()P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.82820.某班主任对全班50名学生的积极性和对待班级工作的态度进行了调查,统计数据如下表所示:则至少有________的把握认为学生的学习积极性与对待班级工作的态度有关.(请用百分数表示).注:独立性检验界值表三、解答题+模式,其中语21.国家逐步推行全新的高考制度.未来新高考不再分文、理科,采用33文、数学、外语三科为必考科目,满分各150分,另外考生还要依据想考取的高校及专业的要求,结合自己的兴趣爱好等因素,在思想政治、历史、地理、物理、化学、生物6门科目中自选3门参加考试(6选3),每科目满分100分.为了应对新高考,某高中从高一年级1000名学生(其中男生550人,女生450人)中,采用分层随机抽样的方法从中抽取n名学生进行调查.(1)已知抽取的n名学生中女生有45人,求n的值;(2)学校计划在高一上学期开设选修中的物理和地理两个科目,为了了解学生对这两个科目的选课情况,对在(1)的条件下抽取到的n名学生进行问卷调查(假设每名学生在这两个科目中必须选择一个科目且只能选择一个科目),下表是根据调查结果得到的22⨯列联表.请将列联表补充完整,并判断是否有99%的把握认为选择科目与性别有关,说明理由;(3)在抽取的选择地理的学生中用分层抽样的方法再抽取6名学生,然后从这6名学生中抽取2名学生了解学生对地理的选课意向情况,求这2名学生中至少有1名男生的概率.()()()()()2n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. 22.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状的这一阶段称为潜伏期.一研究团队统计了某地区200名患者的相关信息,得到如下表格:(1)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,根据上表数据将如下列联表补充完整,并根据列联表判断是否有99%的把握认为该传染病的潜伏期与患者年龄有关.(2)将200名患者的潜伏期超过6天的频率视为该地区每名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该团队随机调查了该地区20名患者,其中潜伏期超过6天的人数为X ,求随机变量X 的期望和方差. 附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. 23.新型冠状病毒属于β属的冠状病毒,人群普遍易感,病毒感染者一般有发热咳嗽等临床表现.基于目前的流行病学调查和研究结果,病毒潜伏期一般为1-14天,大多数为3-7天.为及时有效遏制病毒扩散和蔓延,减少新型冠状病毒感染对公众健康造成的危害,需要对与确诊新冠肺炎病人接触过的人员进行检查.某地区对与确诊患者有接触史的1000名人员进行检查,结果统计如下表:(Ⅰ)填写下面列联表,并通过计算判断能否在犯错误的概率不超过0.001的前提下,以为新冠肺炎密切接触者有发热症状与最终确诊患病有关?(Ⅱ)在全国人民的共同努力下,尤其是全体医护人员的辛勤付出下,我国的疫情得到较好控制,现阶段防控重难点主要在境外输入病例和无症状感染者(即无相关临床表现但核酸检测或血清特异性免疫球蛋白M 抗体检测阳性者).根据防控要求,无症状感染者虽然还没有最终确诊患新冠肺炎,但与其密切接触者仍然应当采取居家隔离医学观察14天.已知某人曾与无症状感染者密切接触,而且在家已经居家隔离11天未有临床症状,若该人员居家隔离第k 天出现临床症状的概率为()11112,13,142k k -⎛⎫= ⎪⎝⎭,两天之间是否出现临床症状互不影响,而且一旦出现临床症状立刻送往医院核酸检查并采取必要治疗,若14天内未出现临床症状则可以解除居家隔离,求该人员在家隔离的天数(含有临床症状表现的当天)ξ的分布列以及数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.24.为了解某班学生喜爱玩游戏是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:已知在全部50人中随机抽取1人抽到喜爱玩游戏的学生的概率为3 5 .(1)请将上面的列联表补充完整(不用写计算过程);(2)能否在犯错误的概率不超过0.005的前提下认为喜爱玩游戏与性别有关?说明你的理由;(3)以该班学生的情况来估计全校女生喜爱玩游戏的情况,用频率代替概率.现从全校女生中抽取3人进一步调查,设抽到喜爱玩游戏的女生人数为ξ,求ξ的期望.下面的临界值表供参考:(参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)25.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.经常阅读 100 24 不经常阅读合计200(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关? (2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X ,若用样本的频率作为概率,求随机变量X 的分布列和期望.附:K 2=2()()()()()n ad bc a b c d a c b d -++++,其中n =a +b +c +d .P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82826.某地为响应国家“脱贫攻坚战”的号召,帮助贫困户脱贫,安排贫困人员参与工厂生产.现用A ,B 两条生产线生产某产品.为了检测该产品的某项质量指标值(记为Z ),现随机抽取这两种这两条生产线的产品各100件,由检测结果得到如下频率分布直方图.(Ⅰ)分别估计A ,B 两条生产线的产品质量指标值的平均数(同一组数据中的数据用该组区间的中点值作代表),从平均数结果看,哪条生产线的质量指标值更好?(Ⅱ)计算A 生产线的产品质量指标值的众数和中位数(中位数计算结果精确到小数点后两位).(Ⅲ)该公司规定当92Z ≥时,产品为超优品.根据所检测的结果填写22⨯列联表,并判断是否有95%的把握认为“生产超优品是否与生产线有关”.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++22⨯列联表【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 2.B解析:B 【解析】 【分析】根据独立性检验的定义可判断(1);根据方差的性质可判断(2);根据残差的性质可判断(3);根据正态分布的对称性可判断(4). 【详解】(1)对分类变量X 与Y 的随机变量2K 的观测值K 来说,K 越大,判断“X 与Y 有关系”的把握越大,故(1)错误;(2)若将一组样本数据中的每个数据都加上同一个常数后,数据的离散程度不变,则样本的方差不变,故(2)正确;(3)根据残差的定义可知,在残差图,残差点分布的带状区域的宽度越狭窄,预测值与实际值越接近,其模型拟合的精度越高,(3)正确;(4)设随机变量ξ服从正态分布()0,1N ,若()1P p ζ>=,则()1P p ζ<-=,则()1112P p ζ-<<=-,则()1102P p ζ-<<=-,故(4)正确, 故正确的命题的个数为3个,故选B. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查独立性检验的定义、方差的性质、残差的性质以及正态分布的对称性,属于中档题. 这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.3.B解析:B 【解析】分析:先查相关系数检验的临界值表,再判断变量Y 和x 具有线性相关关系的选项. 详解: 查相关系数检验的临界值表 ①r 0.05=0.754,r >r 0.05; ②r 0.05=0.514,r <r 0.05; ③r 0.05=0.482,r >r 0.05; ④r 0.05=0.997,r 0.05>r.∴y 和x 具有线性相关关系的是①③.故答案为B.点睛:本题主要考查相关系数,意在考查学生对这些知识的掌握水平.4.B解析:B 【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K 的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人, 又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人, 又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530) 4.762 3.8412109075225K ⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”, 故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.5.B解析:B 【解析】 K 2=≈5.059>5.024,因为P(K 2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.选B6.A解析:A 【解析】由公式可计算得K 2≈11.377>6.635.故选A.点睛:(1)独立性检验的关键是正确列出2×2列联表,并计算出K 2的值.(2)独立性检验是对两个变量有关系的可信程度的判断,而不是对它们是否有关系的判断.7.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.8.A解析:A 【解析】当x =1,2,3时,分别代入求y 值,离y 最近的值模拟效果最好,可知A 模拟效果最好.故选A.考点:非线性回归方程的选择.9.B解析:B 【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.10.C解析:C 【解析】由78982x y++++⎧=⎪⎪=得=60xy ,故选C. 11.D解析:D 【解析】①相关系数r 用来衡量两个变量之间线性关系的强弱,r 越接近于1,则相关性越强,所以错误;②回归直线y bx a =+一定经过样本点的中心(),x y ,正确; ③随机误差e 的方差()D e 的大小是用来衡量预报的精确度,正确;④相关指数2R 用来刻画回归的效果,2R 越小,说明模型的拟合效果越不好,所以错误. 所以正确的有②③.故选D .12.D解析:D 【解析】57(0.85165ˆ85.7) 2.45Y Y σ=-=-⨯-= 二、填空题13.469【解析】由计算公式K2=得K2≈7469解析:469【解析】 由计算公式K 2=,得K 2≈7.469.14.2【解析】试题分析:从匀速传递的产品生产流水线上质检员每10分钟从中抽取一件产品进行某项指标检测这样的抽样是系统抽样①错;两个随机变量的线性相关性越强相关系数的绝对值越接近于1②正确;某项测量结果服解析:2 【解析】试题分析:从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是系统抽样,①错;两个随机变量的线性相关性越强,相关系数的绝对值越接近于1,②正确;某项测量结果服从正太态布,则,③正确;对于两个分类变量和的随机变量的观测值来说,越大,判断“与有关系”的把握程度越大,④错.故只有2个正确.考点:抽样方法(系统抽样),线性相关关系,正态分布,独立性检验.15.乙【解析】试题分析:选用方案甲时为70元当选用议案乙时用户消费为元;当用方案丙时用户消费为元所以用方案乙最合算考点:实际应用问题比较大小解析:乙 【解析】试题分析:选用方案甲时为70元,当选用议案乙时,用户消费为506600.0568+⨯⨯=元;当用方案丙时,用户消费为3036600.05138+⨯⨯=元,所以用方案乙最合算. 考点:实际应用问题,比较大小.16.【解析】将代入得所以残差 解析:0.29-【解析】将160x =代入0.85 2.1ˆ87yx =-,得0.8516082.71ˆ53.29y =⨯-=,所以残差5353.ˆ290ˆ.29ey y =-=-=-. 17.乙【解析】线性回归模型中越接近1效果越好故乙效果最好解析:乙 【解析】线性回归模型中2R 越接近1,效果越好,故乙效果最好.18.③④【解析】根据图示可得甲同学的逻辑思维成绩排名很靠前但总排名靠后说明阅读表达成绩排名靠后;乙同学的逻辑思维成绩排名适中但总排名靠前说明阅读表达成绩排名靠前;丙同学的逻辑思维成绩排名及阅读表达成绩排解析:③④ 【解析】根据图示可得,甲同学的逻辑思维成绩排名很靠前但总排名靠后,说明阅读表达成绩排名靠后;乙同学的逻辑思维成绩排名适中但总排名靠前,说明阅读表达成绩排名靠前;丙同学的逻辑思维成绩排名及阅读表达成绩排名居中,则乙同学的总成绩排名比丙同学的总成绩排名更靠前;甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前,故③④正确.故答案为③④.19.05【详解】分析:直接利用独立性检验公式计算即得解详解:由题得所以犯错误的概率最多不超过005的前提下可认为注射疫苗与感染流感有关系故答案为005点睛:本题主要考查独立性检验和的计算意在考查学生对这解析:05 【详解】分析:直接利用独立性检验2K 公式计算即得解.详解:由题得22100(10302040)1004.762 3.8413070505021K ⨯-⨯==≈>⨯⨯⨯,所以犯错误的概率最多不超过0.05的前提下,可认为“注射疫苗”与“感染流感”有关系. 故答案为0.05.点睛:本题主要考查独立性检验和2K 的计算,意在考查学生对这些知识的掌握水平和解决实际问题的能力.20.【分析】根据列联表计算可得由可得结果【详解】由题意得:至少有的把握认为学生的学习积极性与对待班级工作的态度有关故答案为:【点睛】本题考查独立性检验问题的求解考查基础公式的应用 解析:99.9%【分析】根据22⨯列联表计算可得2K ,由210.828K >可得结果. 【详解】由题意得:()225018197611.53810.82825252426K ⨯⨯-⨯=≈>⨯⨯⨯, ∴至少有10.1%99.9%-=的把握认为学生的学习积极性与对待班级工作的态度有关.故答案为:99.9%. 【点睛】本题考查独立性检验问题的求解,考查基础公式的应用.三、解答题21.(1)100n =;(2)列联表见解析;有99%的把握认为选择科目与性别有关;理由见解析;(3)35. 【分析】(1)根据抽样比例相同例等式化简即可;(2)根据题意完成22⨯列联表,代入公式计算,根据结果判定即可;(3)根据古典概型的概率求解步骤,列出全部基本事件,找出满足条件的基本事件,代入公式计算即可. 【详解】 (1)由题意得451000450n =,解得100n =; (2)列联表如下:22100(45202510)8.1289 6.63555457030K ⨯⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为选择科目与性别有关;(3)从30名选择地理的学生中用分层随机抽样的方法抽取6名学生, 则这6名学生中有2名男生,4名女生,设男生编号为1、2,女生编号为a 、b 、c 、d ,从6名学生中抽取2名学生, 所有可能的结果为{},,,1,2,,,1,2,,1,2,1,2,12ab ac ad a a bc bd b b cd c c d d Ω=,共15种可能的结果,至少有一名男生的结果为{}1,2,1,2,1,2,1,2,12a a b b c c d d ,共9种可能的结果, 所以2名学生中至少有1名男生的概率93155P ==. 【点睛】1.古典概型的概率求解步骤: (1)求出所有基本事件的个数n ;(2)求出事件A 包含的所有基本事件的个数m ; (3)代入公式()mP A n=求解. 2.基本事件个数的确定方法(1)列举法:此法适合于基本事件个数较少的古典概型;(2)列表法:此法适合于从多个元素中选定两个元素的试验,也可看成坐标法; (3)树状图法:树状图是进行列举的一种常用方法,适用于有顺序的问题及较复杂问题中基本事件数的探求; (4)运用排列组合知识计算.22.(1)列联表见解析,有99%的把握认为该传染病的潜伏期与患者年龄有关;(2),E X D X【分析】(1)根据题中数据可完成联表,再根据公式计算出卡方值即可判断; (2)可知随机变量服从2~20,5X B ⎛⎫ ⎪⎝⎭,根据期望方差公式即可计算. 【详解】(1)由题意得列联表:由上表可得222007555254518.75 6.63512080100100K ,所以有99%的把握认为该传染病的潜伏期与患者年龄有关; (2)由题意可知,一名患者潜伏期超过6天的概率为8022005P ==, 随机变量服从2~20,5X B ⎛⎫ ⎪⎝⎭,22085E X,2224201555D X . 【点睛】本题考查独立性检验,考查二项分布的期望方差计算,属于基础题.23.(Ⅰ)列联表见解析,能在犯错误的概率不超过0.001的前提下,认为新冠肺炎密切接触者有发热症状与最终确诊患病有关.(Ⅱ)分布列见解析,()1038E ξ=. 【分析】(Ⅰ)填写22⨯列联表,计算2K 值,再与临界值表进行比较,即可得出结论; (Ⅱ)确定随机变量ξ的所有取值,通过人员居家隔离第k 天出现临床症状的概率为1112k -⎛⎫ ⎪⎝⎭,()12,13,14k =,计算概率得到分布列,利用数学期望的计算公式,即可得解.【详解】(Ⅰ)完成的列联表如下:()22100035024030011046.0310.828460540650350K ⨯-⨯=≈>⨯⨯⨯,故能在犯错误的概率不超过0.001的前提下,认为新冠肺炎密切接触者有发热症状与最终确诊患病有关; (Ⅱ)由题可知,随机变量ξ的可能取值为12,13,14,()1211111222P ξ-⎛⎫=== ⎪⎝⎭, ()121113111111113122248P ξ--⎡⎤⎛⎫⎛⎫==-⋅=⨯=⎢⎥ ⎪ ⎪⎝⎭⎝⎭⎢⎥⎣⎦, ()113141288P ξ==--=,ξ∴的分布列为:数学期望1213142888E ξ=⨯+⨯+⨯=. 【点睛】本题考查了独立性检验、离散型随机变量的分布列及数学期望的求解,属于中档题.对于求离散型随机变量的分布列问题,首先要清楚离散型随机变量的可能取值,计算得出概率,列出离散型随机变量概率分布列,最后按照数学期望公式计算出数学期望.24.(1)列联表见解析;(2)在犯错误的概率不超过0.005的前提下,认为喜爱玩游戏与性别有关,理由见解析;(3)65. 【分析】(1)由喜爱游戏学生的概率计算后可填充列联表; (2)根据列联表计算2K 后可得;(3)由题意ξ的可能取值为0,1,2,3,且23,5B ξ⎛⎫⎪⎝⎭,计算出概率得概率分布列,然后由期望公式计算出期望. 【详解】(1)列联表补充如下:(2)∵()25020151058.3337.87930202525K ⨯⨯-⨯=≈>⨯⨯⨯∴在犯错误的概率不超过0.005的前提下,认为喜爱玩游戏与性别有关. (3)从全校女生中随机抽取1人,抽到喜爱游戏的女生的概率为25. 抽到喜爱游戏的女生人数ξ的可能取值为0,1,2,3,23,5B ξ⎛⎫ ⎪⎝⎭其概率为332355kkk P C -⎛⎫⎛⎫=⋅⎪ ⎪⎝⎭⎝⎭,0k =,1,2,3故ξ的分布列ξ的期望值()355E ξ=⨯=.【点睛】本题考查独立性检验,考查列联表及卡方的计算,考查随机变量的分布列和数学期望,考查学生的数据处理能力,运算求解能力,属于中档题. 25.(1)见解析;(2)分布列见解析,期望是103. 【分析】(1)先根据题中数据完成列联表,再进行计算,判断; (2)根据题意得X 服从二项分布,进而求解. 【详解】 (1)由题意得,。
(典型题)高中数学高中数学选修2-3第三章《统计案例》测试(含答案解析)(1)
一、选择题1.给出下列说法:①回归直线ˆˆˆy bx a =+恒过样本点的中心(,)x y ,且至少过一个样本点;②两个变量相关性越强,则相关系数||r 就越接近1; ③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy 平均减少0.5个单位.其中说法正确的是( ) A .①②④ B .②③④C .①③④D .②④2.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是( )A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分证据显示说谎与性别有关 3.下列关于回归分析与独立性检验的说法正确的是() A .回归分析和独立性检验没有什么区别;B .回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;C .独立性检验可以100%确定两个变量之间是否具有某种关系.D .回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;4.下列命题正确的个数是:( )①对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大;②在相关关系中,若用211c x y c e =拟合时的相关指数为21R ,用2y bx a =+拟合时的相关指数为22R ,且2212R R >,则1y 的拟合效果好;③利用计算机产生0~1之间的均匀随机数a ,则事件“310a ->”发生的概率为23; ④“0,0a b >>”是“2b aa b+≥”的充分不必要条件 A .1B .2C .3D .45.某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如下表所示:若数学成绩90分(含90分)以上为优秀,物理成绩85(含85分)以上为优秀,则有多少把握认为学生的数学成绩与物理成绩有关系( ) A .95% B .97.5%C .99.5%D .99.9%6.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0017.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距; ②在刻画回归模型的拟合效果时,R 2的值越大,说明拟合的效果越好; ③设随机变量ξ服从正态分布N (4,22),则P (ξ>4)=12;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则判断“X 与Y 有关系”的犯错误的概率越小. 其中正确的说法是( ) A .①④B .②③C .①③D .②④8.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅临界值表来确定推断“X 与Y 有关系”的可信度,如果k >5.024,那么就推断“X 和Y 有关系”,这种推断犯错误的概率不超过( ) A .0.25 B .0.75 C .0.025 D .0.975 9.有下列数据: x123y35.9912.01下列四个函数中,模拟效果最好的为( ) A .B .C .D .10.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K =,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是( )2()P K k ≥ … 0.25 0.15 0.10 0.025 0.010 0.005 … k …1.3232.0722.7065.0246.6357.879…A .90%B .95%C .97.5%D .99.5%11.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大 其中正确的个数是A .1B .2C .3D .412.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.以下结论正确..的序号有_________ (1)根据22⨯列联表中的数据计算得出2K ≥6.635, 而P (2K ≥6.635)≈0.01,则有99% 的把握认为两个分类变量有关系.(2)在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.(3)在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小.(4)在回归直线0.585y x =-中,变量200x =时,变量y 的值一定是15.14.甲、乙两人在5次综合测评中成绩的茎叶图如图所示,其中一个数字被污损,记甲、乙的平均成绩分别为x -甲,x -乙,则x -甲>x -乙的概率是________.15.如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________.16.某单位为了了解用电量y (度)与气温x (度)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下的对照表由表中数据,得回归直线方程ˆˆˆy bx a =+,若ˆ2b=-,则ˆa =________. 17.某单位为了了解用电量y (度)与气温x (度)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下的对照表. 气温x (度) 18 13 10 -1 用电量y (度)24343864由表中数据,得回归直线方程ˆˆˆybx a =+,若ˆ2b =-,则ˆa =________. 18.在2017年3月15日,某市物价部门对本市的5家商场的某种商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:由散点图可知,销售量y 与价格x 之间有较好的线性相关关系,其线性回归方程是:3.2y x a =-+,则a =__________.19.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”__________.(填有或没有)附:()()()()()22n ad bc K a b c d a c b d -=++++20.下列说法正确的个数有_________(1)已知变量x 和y 满足关系23y x =-+,则x 与y 正相关;(2)线性回归直线必过点(),x y ;(3)对于分类变量A 与B 的随机变量2k ,2k 越大说明“A 与B 有关系”的可信度越大 (4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数2R 的值越大,说明拟合的效果越好.三、解答题21.我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2020年2月至3月两个月网络购物消费情况,在网上随机对1000人做了问卷调查,得如表频数分布表:(1)作出这些数据的频率分布直方图,并估计本市居民此期间网络购物的消费平均值;(2)在调查问卷中有一项是填写本人年龄,为研究网购金额和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层抽样,从上述1000人中抽取200人,得到如表列联表,请将表补充完整并根据列联表判断,在此期间是否有95%的把握认为网购金额与网购人年龄有关.参考公式和数据:()()()()()22n ad bcKa b c d a c b d-=++++.(其中n a b c d=+++为样本容量)22.为考察某种药物预防禽流感的效果,进行动物家禽试验,调查了100个样本,统计结果为:服用药的共有60个样本,服用药但患病的仍有20个样本,没有服用药且未患病的有20个样本.(1)根据所给样本数据画出22⨯列联表;不得禽流感得禽流感总计服药a=b=60不服药c=d=40总计100(2)请问能有多大把握认为药物有效?附公式:()()()()()22=n ad bc K a b c d a c b d -++++.23.司机在开机动车时使用手机是违法行为,会存在严重的安全隐患,危及自己和他人的生命. 为了研究司机开车时使用手机的情况,交警部门调查了100名机动车司机,得到以下统计:在55名男性司机中,开车时使用手机的有40人,开车时不使用手机的有15人;在45名女性司机中,开车时使用手机的有20人,开车时不使用手机的有25人.(1)完成下面的22⨯列联表,并判断是否有99.5%的把握认为开车时使用手机与司机的性别有关;(2)以上述的样本数据来估计总体,现交警部门从道路上行驶的大量机动车中随机抽检3辆,记这3辆车中司机为男性且开车时使用手机的车辆数为X ,若每次抽检的结果都相互独立,求X 的分布列和数学期望()E X . 参考公式与数据: 参考数据:参考公式()()()()()22n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.24.十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康,经过不懈的努力奋斗拼搏,新农村建设取得了巨大进步,农民年收入也逐年增加.为了实现2020年脱贫的工作计划,该地扶贫办随机收集了以下50位农民的统计数据,以此研究脱贫攻坚的效果是否与农民的受教育的发展状况有关:(1)根据列联表运用独立性检验的思想方法分析:能否有99%的把握认为“脱贫攻坚的效果与农民的受教育的发展状况有关”,并说明理由;(2)现用分层抽样的方法在全部受过教育的农民中随机抽取5位农民作为代表,再从这5位农民代表中任选2位继续调查,求这2位农民代表中至少有1位脱贫攻坚效果明显的概率. 参考附表:参考公式:()()()()()22n ad bc K a b a c b d c d +=++++,其中n a b c d =+++.25.为提高全民身体素质,加强体育运动意识,某校体育部从全校随机抽取了男生、女生各100人进行问卷调查,以了解学生参加体育运动的积极性是否与性别有关,得到如下列联表(单位:人):(1)根据以上数据,判断能否在犯错误的概率不超过10%的情况下认为该校参加体育运动的积极性与性别有关;(2)用频率估计概率,现从该校所有女生中随机抽取3人.记被抽取的3人中“偶尔运动或不运动”的人数为X ,求X 的分布列、期望()E X 和方差()D X .附:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.2.07226.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始现该疾病对应的相关症状时止的这一阶段称为潜伏期.一研究团队统计了某地区1000名患有某种传染病的患者的相关信息,得到如表:该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,以潜伏期是否超过6天为标准进行分层抽样,从上述1000名患者中抽取200人,得到如下列联表.(Ⅰ)请将列联表补充完整;(Ⅱ)根据列联表判断是否有95%的把握认为潜伏期与患者年龄有关?附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】①中,根据回归直线方程的特征,可判定是不正确;②中,根据相关系数的意义,可判定是是正确的;③中,根据方差的计算公式,可判定是正确的;④中,根据回归系数的含义,可判定是正确的. 【详解】对于①中,回归直线ˆˆˆy bx a =+恒过样本点的中心(,)x y ,但不一定过一个样本点,所以不正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数||r 就越接近1,所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,可得在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy平均减少0.5个单位,所以是正确的. 故选:B. 【点睛】本题主要考查了统计知识的相关概念及判定,其中解答中熟记回归直线方程的特征,回归系数的含义,相关系数的意义,以及方程的计算方法是解答的关键,属于基础题.2.D解析:D 【解析】根据上表数据可求得20.027 1.323k ≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D3.D解析:D 【分析】根据题意可知,利用回归分析和独立性检验的定义,排除错误选项,即可求解出答案. 【详解】回归分析是指将具有相关关系的两个变量之间的数量关系进行测定,通过建立数学表达式进行统计估计和预测的统计研究方法.独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.根据以上定义,可知A 、B 、C 均错误,故答案选D .【点睛】本题主要考查了回归分析与独立性检验的定义的区别.4.C解析:C 【解析】分析:根据独立性检验的性质可判断①;根据回归分析的基本原理可判断②;根据几何概型概率公式可判断③; 根据不等式的性质可判断④.详解:①对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越小,①错误;②在相关关系中,若用211c x y c e =拟合时的相关指数为21R ,用2y bx a =+拟合时的相关指数为22R ,且2212R R >,则1y 的拟合效果好,②正确;③利用计算机产生0~1之间的均匀随机数a ,则事件“310a ->”发生的概率为1123103-=-,正确; ④“0,0a b >>”可得到“2b a a b +≥”, “2b aa b+≥”时“0,0a b >>”不一定成立,所以“0,0a b >>”是“2b aa b+≥”的充分不必要条件,正确,即正确命题的个数是3,故选C. 点睛:本题主要通过对多个命题真假的判断,主要综合独立性检验、回归分析、几何概型概率公式、不等式的性质,属于中档题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.5.C解析:C 【解析】分析:根据题意,列出22⨯列联表,求出观测值2K ,根据观测值对应的数值得出结论. 详解:根据题意,列出22⨯列联表,如下;则220(51212)8.80177.879671413K ⨯⨯-⨯==>⨯⨯⨯,因为观测值对应的数值为0.005,所以有99.5%的把握认为学生的数学成绩与物理成绩之间有关系. 故选C.点睛:本题考查了独立性检验的应用,属于基础题.考查利用数学知识研究实际问题的能力以及相应的运算能力.6.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.8.C解析:C【解析】∵P (k >5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X 和Y 有关系”. 考点:独立性检验.9.A解析:A 【解析】当x =1,2,3时,分别代入求y 值,离y 最近的值模拟效果最好,可知A 模拟效果最好.故选A.考点:非线性回归方程的选择.10.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2019人教版精品教学资料·高中选修数学高中数学 第三章 统计案例章末过关检测卷新人教A 版选修2-3一、选择题(本大题共12小题,每小题5分,共60分;在每小题给出的四个选项中,只有一项是符合题目要求的)1.在画两个变量的散点图时,下面叙述正确的是(B )A .预报变量在x 轴上,解释变量在y 轴上B .解释变量在x 轴上,预报变量在y 轴上C .可以选择两个变量中任意一个变量在x 轴上D .可以选择两个变量中任意一个变量在y 轴上2.(2015·新课标Ⅱ卷)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是(D )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解析:由图知,2006年以来我国二氧化硫年排放量与年份负相关,故选D. 3.下列说法正确的是(B )①从匀速传递的产品生产流水线上,质检员每10分钟从某处抽取一件产品进行某项指标检测,这样的抽样是分层抽样 ②某地气象局预报:5月9日本地降水概率为90%,结果这天没下雨,这表明天气预报并不科学 ③吸烟与健康具有相关关系 ④在回归直线方程y ^=0.1x +10中,当解释变量x 每增加一个单位时,预报变量y 增加0.1个单位.A .①②B .③④C .①③D .②④解析:①从匀速传递的产品生产流水线上,质检员每10分钟从某处抽取一件产品进行某项指标检测,由于间隔相同,这样的抽样是系统抽样,故①不正确;②降水概率为90%的含义是指降水的可能性为90%,但不一定降水,故②不正确;③吸烟与健康具有相关关系,正确;④在回归直线方程y ^=0.1x +10中,回归系数为0.1,当解释变量x 每增加一个单位时,预报变量y ^增加0.1个单位,故④正确.故选B.4.(2014·湖北卷)已知如下样本数据:x 3 4 5 6 7 8 y4.02.5-0.50.5-2.0-3.0得到的回归方程为y ^=b ^x +a ^,则(B)A.a ^>0,b ^>0B.a ^>0,b ^<0C.a ^<0,b ^>0D.a ^<0,b ^<0解析:作出散点图可知(图略)回归直线y ^=bx +a 的斜率b <0,截距a >0.故a >0,b <0.故选B.5.(2015·湖北省稳派教育一轮复习质量检测)某研究机构对儿童记忆能力x 和识图能力y 进行统计分析,得到如下数据:记忆能力x 4 6 8 10 识图能力y3568由表中数据,求得线性回归方程为,若某儿童的记忆能力为时,则他的识图能力为(B )A .9.2B .9.5C .9.8D .10解析:由表中数据得=7,=5.5,由(,)在直线y ^=45x +a ^,得a ^=-110,即线性回归方程为y ^=45x -110.∴当=12时,y ^=45×12-110=9.5,即他的识图能力为9.5.故选B.6. 根据一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的散点图分析x 与y 之间是否存在线性相关关系,求得其回归方程y ^=0.85x -85.7,则在样本点(165,57)处的残差为 (B)A .54.55B .2.45C .3.45D .111.55解析:把x =165代入y ^=0.85x -85.7,得y =0.85×165-85.7=140.25-85.7=54.55,由57-54.55=2.45,故选B.7.统计中有一个非常有用的统计量k 2,用它的大小可以确定在多大程度上可以认为“两个分类变量有关系”,下表是反映甲、乙两个平行班(甲班A 老师教, 乙班B 老师教)进行某次数学考试,按学生考试及格与不及格统计成绩后的2×2列联表.不及格 及格 总计 甲班(A 教) 4 36 40 乙班(B 教) 16 24 40 总计206080根据k 2的值,你认为不及格人数的多少与不同老师执教有关系的把握大约为(A) A .99.5% B .99.9% C .95% D .无充分依据解析:k 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=80(4×24-16×36)220×60×40×40=9.6>7.879.∴不及格人数的多少与不同老师执教有关系的把握大约为99.5%.故选A.8.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验(D) A .男性喜欢参加体育活动 B .女性不喜欢参加体育活动 C .喜欢参加体育活动与性别有关 D .喜欢参加体育活动与性别无关 解析:依据反证法原理可知D 正确.9.变量x 、y 具有线性相关关系,当x 的取值为8,12,14和16时,通过观测知y 的值分别为5,8,9,11,若在实际问题中,y 的预报值最大是10,则x 的最大取值不能超过(B)A .16B .15C .17D .12解析:因为x =16时,y =11;当x =14时,y =9,所以当y 的最大值为10时,x 的最大值应介于区间(14,16)内,所以选B.10.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9,现发现表中有一个数据模糊看不清,请你推断出该数据的值为(B )零件数x (个) 10 20 30 40 50 加工时间y (min)62758189A.67 B .68 C .69 D .70解析:零件个数的平均值x -=30,设零件为20个的对应加工时间为t min ,加工时间的平均值y -=307+t 5,因为回归直线必经过点(x -,y -),代入回归方程y ^=0.67x +54.9,计算得t =68.11.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀 非优秀 总计 甲班 10b 乙班c 30 总计105已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是 (C )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 解析:由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A 、B 错误.根据列联表中的数据,得到K 2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C 正确.12.(2013·福建卷)已知x 与y 之间的几组数据如下表:x 1 2 3 4 5 6 y21334假设根据上表数据所得线性回归直线方程为y ^=b ^x +a ^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y ′=b ′x +a ′,则以下结论正确的是(C )A.b ^>b ′,a ^>a ′B.b ^ >b ′,a ^<a ′C.b ^< b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:过(1,0)和(2,2)的直线方程为y =2x -2,画出六点的散点图,回归直线的大概位置如图所示,显然b ^<b ′,a ^>a ′. 故选C.二、填空题(本大题共4小题,每小题5分,共20分;将正确答案填在题中的横线上) 13.对有关数据的分析可知,每一立方米混凝土的水泥用量x (单位:kg)与28天后混凝土的抗压度y (单位:kg/cm 2)之间具有线性相关关系,其线性回归方程为y ^=0.30x +9.99.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7 kg/cm 2,每立方米混凝土的水泥用量最少应为________kg(精确到0.1 kg).解析:由题意得89.7=0.30x +9.99,解之得x =265.7. 答案:265.714.有甲、乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计后,得到如下的列联表:优秀 不优秀 总计 甲班 10 35 45 乙班 7 38 45 总计177390利用列联表的独立性检验估计,则成绩与班级________.(填有关或无关) 解析:成绩与班级有无关系,就是看随机变量的值与临界值2.706的大小关系. 由公式得K 2=90×(10×38-7×35)217×73×45×45=0.653<2.706,∴成绩与班级无关系.答案:无关15. 某炼钢厂废品率x (%)与成本y (元/t )的线性回归方程为y ^=105.492+42.569x .当成本控制在176.5元/t 时,可以预计生产的1 000 t 钢中,约有__________t 钢是废品.解析:因为176.5=105.492+42.569x ,所以x =1.668,即成本控制在176.5元/t 时,废品率为1.668%. 所以生产的1 000 t 钢台,约有1 000×1.668%=16.68(t )钢是废品.答案:16.6816.(2013·揭阳一模)一般来说,一个人脚掌越长,他的身高就越高,现对10名成年人的脚掌长x 与身高y 进行测量,得到数据(单位:cm)如下表,作出散点图后,发现散点在一条直线附近,经计算得到数据:(x i -x -)2=82.5;所以回归方程的斜率b ==577.582.5=7,又x -=24.5,y -=171.5,所以截距a =y --b x -=0,即回归方程为y ^=7x ,当x =26.5时,y ^=7×26.5=185.5,则估计案发嫌疑人的身高为 185.5 cm.答案:185.5三、解答题(本大题共6小题,共70分;解答时应写出必要的文字说明、证明过程及演算步骤)17.(本小题满分11分)冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示.杂质高 杂质低 旧设备37121新设备 22 202根据以上数据试判断含杂质的高低与设备改造有无关系. 解析:由已知数据得到如下2×2列联表:杂质高 杂质低 合计 旧设备 37 121 158 新设备 22 202 224 合计59323382由公式K 2=382×(37×202-121×22)2158×224×59×323≈13.11,由于13.11>6.635,故有99%的把握认为含杂质的高低与设备改造是有关的.18.(本小题满分11分)某医院用光电比色计检验尿汞时,得尿汞含量x (mg/L)与消光系数y 的结果如下:(1)求回归方程; (2)求相关指数R 2.尿汞含量x 2 4 6 8 10 消光系数y64138205285360解析:(1)列出散点图,如下图所示.由图可知y 与x 的散点图大体分布在一条直线周围,因此可以用线性回归的方程来拟合它.设y ^=b ^x +a ^.由b ^==36.95,a ^=y -b ^x =-11.3,故所求的回归方程为y ^=36.95x -11.3.(2)把相应数值代入R 2=1-,得R 2≈0.999.19.(本小题满分12分)打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?患心脏病 未患心脏病合计 每一晚都打鼾 30 224 254 不打鼾 24 1355 1379合计5415791633解析:假设每一晚都打鼾与患心脏病无关系,则有a =30,b =224,c =24,d =1355, a +b =254,c +d =1379,a +c =54,b +d =1579,n =1633.∴K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=1633×(30×1355-224×24)2254×1379×54×1579=68.033.∵68.033>10.828.∴有99%的把握说每一晚都打鼾与患心脏病有关. 20.(本小题满分12分)已知x ,y 之间的一组数据如下表:x1 3 6 7 8 y12345(1)从x ,y 中各取一个数,求x +y ≥10的概率;(2)对于表中数据,甲、乙两同学给出的拟合直线分别为y =13x +1与y =12x +12,试判断哪条直线拟合程度更好.解析:(1)从x ,y 中各取一个数组成数对(x ,y ),共有5×5=25(对),其中满足x +y ≥10的数对有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5)共9对.故所求的概率为925. (2)用y =13x +1作为拟合直线时,所得y 值与y 的实际值的差的平方和为:S 1=⎝⎛⎭⎫43-12+(2-2)2+(3-3)2+⎝⎛⎭⎫103-42+⎝⎛⎭⎫113-52=73;用y =12x +12作为拟合直线时,所得y 值与y 的实际值的差的平方和为:S 2=(1-1)2+(2-2)2+⎝⎛⎭⎫72-32+(4-4)2+⎝⎛⎭⎫92-52=12.∵S 1>S 2,∴用y =12x +12作为拟合直线时,拟合程度更好.21.(本小题满分12分)研究“刹车距离” 对于安全行车及分析交通事故责任都有一定的作用,所谓“刹车距离” 就是指行驶中的汽车,从刹车开始到停止,由于惯性的作用而又继续向前滑行的一段距离.为了测定某种型号汽车的刹车性能(车速不超过140 km/h),对这种汽车进行测试,测得的数据如表:刹车时的车速(km/h) 0 10 20 30 40 50 60刹车距离(m) 0 0.3 1.0 2.1 3.6 5.5 7.8(1) 以车速为x 轴,以刹车距离为y 轴,在给定坐标系中画出这些数据的散点图.(2)观察散点图,估计函数的类型,并确定一个满足这些数据的函数表达式.(3)该型号汽车在国道上发生了一次交通事故,现场测得刹车距离为46.5 m ,请推测刹车时的速度为多少?请问在事故发生时,汽车是超速行驶还是正常行驶?解析:(1)散点图如图所示:(2)由图象,设函数的表达式为y =ax 2+bx +c (a ≠0),将(0,0),(10,0.3)(20,1.0)代入,得⎩⎪⎨⎪⎧c =0,100a +10b +c =0.3,400a +20b +c =1.0,解得a =0.002,b =0.01,c =0. 所以,函数的表达式为y =0.002x 2+0.01x (0≤x ≤140). 经检验,表中其他各值也符合此表达式.(3)当y =46.5时,即0.002x 2+0.01x =46.5,所以,x 2+5x -23 250=0. 解得x 1=150,x 2=-155(舍去).故可推测刹车时的速度为150 km/h ,而150>140,因此发生事故时,汽车属于超速行驶. 22.(2014·新课标全国卷Ⅱ)(本小题满分12分)某地区2007年至2013年农村居民家庭人均纯收入y (单位:千元)的数据如下表:年份 2007 2008 2009 2010 2011 2012 2013 年份代号t 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9(1)求y 关于t 的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=,a ^=-b ^t .解析:(1)由所给数据计算得t =17(1+2+3+4+5+6+7)=4,y =17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3, (t i -t )(y i -y )=(-3)× (-1.4)+(-2)× (-1)+(-1)× (-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^==0.5,a ^=y -b ^t =4.3-0.5×4=2.3,所求回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t =9,代入(1)中的回归方程,得y ^=0.5×9+2.3=6.8, 故预测该地区2015年农村居民家庭人均纯收入为6.8千元.一、选择题(本大题共12小题,每小题5分,共60分;在每小题给出的四个选项中,只有一项是符合题目要求的)1. 变量x ,y 的散点图如图所示,那么x ,y 之间的样本相关系数最接近的值是(C )A .1B .-0.5C .0D .0.5解析:因为r 的绝对值越接近于1,表明两个变量的线性相关性越大;r 的绝对值越接近于0,表明两个变量的线性相关性越小.由图知x 、y 之间没有相关关系,所以r 的绝对值最接近于0.故选C.2.从集合{1,2,3,… ,10}中任意选出三个不同的数,使这三个数成等比数列,这样的等比数列的个数为(D )A .3个B .4个C .6个D .8个解析:按从小到大顺序有 124,139,248,469共4个, 同理按从大到小顺序也有 4个,故这样的等比数列的个数为 8个.3.从10种不同的作物种子中选出6种放入6个不同的瓶子中展出,如果甲、乙两种种子不能放入第1号瓶内,那么不同的放法种数为(C )A .C 210A 48 B .C 19A 59 C .C 18A 59 D .C 18A 58解析:先排第1号瓶,从甲、乙以外的8种不同作物种子中选出1种有C 18种方法,再排其余各瓶,有A 59种方法,故不同的放法共C 18A 59有种.故选C.4.(2015·山东卷)已知某批零件的长度误差(单位:毫米)服从正态分布N (0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为(B)(附:若随机变量ζ服从正态分布N (μ,σ2),则P (μ-σ<ζ<μ+σ)=68.26%,P (μ-2σ<ζ<μ+2σ)=95.44%.)A .4.56%B .13.59%C .27.18%D .31.74% 解析:P (3<ζ<6)=12(95.44%-68.26%)=13.59%,故选B.5.甲、乙两人进行围棋比赛,比赛采取五局三胜制,无论哪一方先胜三局则比赛结束,假定甲每局比赛获胜的概率均为23,则甲以3∶ 1的比分获胜的概率为(A )A.827B.6481C.49D.89解析:设甲胜为事件A ,则P (A )=23,P (A )=13,∵甲以3∶ 1的比分获胜,∴甲前三局比赛中胜2局,第四局胜,故所求概率为P =C 23·⎝⎛⎭⎫232·13·23=827.6.(2015·陕西卷)二项式(x +1)n (n ∈N +)的展开式中x 2的系数为15,则n =(C ) A .4 B .5 C .6 D .7解析:二项式(x +1)n 的展开式的通项是T r +1=C r n x r ,令r =2得x 2的系数是C 2n ,因为x 2的系数为15,所以C 2n =15,即n 2-n -30=0,解得:n =6或n =-5,因为n ∈N +,所以n =6,故选C.7.(2013·陕西卷)设函数f (x )=⎩⎨⎧⎝⎛⎭⎫x -1x 6,x <0,-x ,x ≥0,则当x >0时,f [f (x )]表达式的展开式中常数项为(A )A .-20B .20C .-15D .15解析:当x >0时,f [f (x )]=⎝ ⎛⎭⎪⎫-x +1x 6=⎝ ⎛⎭⎪⎫1x -x 6的展开式中,常数项为C 36⎝ ⎛⎭⎪⎫1x 3(-x )3=-20.故选A.8.(2014·辽宁卷)6把椅子摆成一排,3人随机就座,任何两人不相邻的坐法种数为(D ) A .144种 B .120种 C .72种 D .24种解析:这是一个元素不相邻问题,采用插空法,有A 33C 34=24.9.(2015·山东青岛下学期自主练习)将1,2,3,4四个数字随机填入右边2×2的方格中﹐每个方格中恰填一个数字﹐且数字可重复使用. 则事件“A 方格的数字大于B 方格的数字,且C 方格的数字大于D 方格的数字”的概率为(C)A.9256B.116C.964D.2564解析:根据题意,四个方格中填入数字共有44=256种,如果对于A 、B 两个方格可在1、2、3、4中的任选2个,且较大的放入A 方格,较小的放入B 方格,共有C 24=6种情况;对于另外两个方格,每个方格有4种情况,则有4×4=16种,则A 方格的数字大于B 方格的数字共有6×16=96种,所以A 方格的数字大于B 方格的数字的概率为96256=38.同理C 方格的数字大于D 方格的数字的概率亦为38,所以则事件“A 方格的数字大于B 方格的数字,且C 方格的数字大于D 方格的数字”的概率为38×38=964,故选C.10.(2014·安徽卷)从正方体六个面的对角线中任取两条作为一对,其中所成的角为60°的共有(C )A .24对B .30对C .48对D .60对解析:间接法.正方体的面对角线共有12条,从中任取2条有C 212种取法,其中相互平行的有6对,相互垂直的有12对,∴共有C 212-6-12=48对.11.若随机变量ξ~N (-2,4),则ξ在区间(-4,-2]上取值的概率等于ξ在下列哪个区间上取值的概率(C )A .(2,4]B .(0,2]C .[-2,0)D .(-4,4]解析:此正态曲线关于直线x =-2对称,∴ξ在区间(-4,-2]上取值的概率等于ξ在[-2,0)上取值的概率.12.(2014·江西卷)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是(D )表1A.成绩 B .视力 C .智商 D .阅读量解析:A 中,K 2=52×(6×22-10×14)220×32×16×36=131440;B 中,K 2=52×(4×20-12×16)220×32×16×36=637360;C 中,K 2=52×(8×24-8×12)220×32×16×36=1310;D 中,K 2=52×(14×30-2×6)220×32×16×36=3757160.因此阅读量与性别相关的可能性最大,所以选D.二、填空题(本大题共4小题,每小题5分,共20分;把答案填在题中横线上)13. (2013·江门二模)(1+2x )n的展开式中x 3的系数等于x 2的系数的4倍,则n =____________.解析:设(1+2x )n 的展开式的通项公式为T r +1,则T r +1=C r n (2x )r =2r ·C r n ·x r,令r =3,得展开式中x 3的系数为:8C 3n ,令r =2得展开式中x 2的系数为4C 2n .依题意,8C 3n =4×4C 2n ,即n (n -1)(n -2)3×2×1=2×n (n -1)2,解得n =8.答案:814.随机变量X 的分布列如下表,且E (X )=1.1,则D (X )=________.X 0 1 xP15p310解析:p =1-⎝⎛⎭⎫15+310=12,E (X )=1.1=0×15+1×12+310x ,解得x =2,所以D (X )=15×(0-1.1)2+12×(1-1.1)2+310×(2-1.1)2=0.49.答案:0.4915.将红、黄、蓝、白、黑5个小球分别放入红、黄、蓝、白、黑5个盒子里,每个盒子里放且只放1个小球,则红球不在红盒内且黄球不在黄盒内的概率是0.65.16.8名世界网球顶级选手在上海大师赛上分成两组,每组4人,分别进行单循环赛,每组决定前两名,再由每一组的第一名与另一组的第二名进行淘汰赛,获胜者角逐冠、亚军,败者角逐第三、四名,大师赛共有________场比赛.解析:分四类:第一类,进行单循环赛需要2C 24=2×4×32=12场;第二类,进行淘汰赛,需要2场;第三类,角逐冠、亚军,需要比赛1场;第四类,角逐第三、四名,需要比赛1场.所以大师赛共有2C 24+2+1+1=16场比赛.答案:16三、解答题(本大题共6小题,共70分;解答应写出文字说明、证明过程或演算步骤) 17.(本小题满分11分)已知⎝ ⎛⎭⎪⎫x -12x n的展开式中,前三项系数的绝对值依次成等差数列.(1)求展开式中的常数项; (2)求展开式中所有整式项. 解析:(1)T r +1=C rn·()x n -r·⎝ ⎛⎭⎪⎫12x r·(-1)r ,∴前三项系数的绝对值分别为C 0n ,12C 1n ,14C 2n , 由题意知C 1n =C 0n +14C 2n ,∴n =1+18n (n -1),n ∈N *,解得n =8或n =1(舍去),∴T k +1=C k8·(x )8-k·⎝ ⎛⎭⎪⎫-12x k =C k 8·⎝⎛⎭⎫-12k·x 4-k ,0≤k ≤8,令4-k =0得k =4,∴展开式中的常数项为T 5=C 48⎝⎛⎭⎫-124=358.(2)要使T k +1为整式项,需4-k 为非负数,且0≤k ≤8,∴k =0,1,2,3,4.∴展开式中的整式项为:x 4,-4x 3,7x 2,-7x ,358.18.(本小题满分11分)为了对新产品进行合理定价,对该产品进行了试销试验,以观察需求量y (单位:千件)对于价格x (单位:千元)的反应,得数据如下:x 50 70 80 40 30 90 95 97 y1008060120135555048(1)若y 与x 之间具有线性相关关系,求线性回归方程. (2)若成本x =y +500,试求:①在盈亏平衡条件下(利润为零)的价格; ②在利润为最大的条件下的定价.解析:(1)b ^=≈-1.286 6,a ^=y -b ^x ≈169.772 4,∴线性回归方程为y ^=-1.286 6x +169.772 4.(2)①在盈亏平衡条件下,y ^x =y ^+500,即-1.286 6x 2+169.772 4x =-1.286 6x +169.772 4+500,1.286 6x 2-171.059x +669.772 4=0,解得x 1=128.916 2,x 2=4.038 1(舍去),∴此时新产品的价格为128.916 2千元. ②在利润最大的条件下,Q =y ^x -x=-1.286 6x 2+169.772 4x +1.286 6x -169.772 4-500 =-1.286 6x 2+171.059x -669.772 4.要使Q 取得最大值,x =66.477 1,即此时新产品应定价为66.477 1千元.19.(2014·天津卷)(本小题满分12分)某大学志愿者协会有6名男同学,4名女同学.在这10名同学中,3名同学来自数学学院,其余7名同学来自物理、化学等其他互不相同的七个学院.现从这10名同学中随机选取3名同学,到希望小学进行支教活动(每位同学被选到的可能性相同).(1)求选出的3名同学是来自互不相同学院的概率;(2)设X 为选出的3名同学中女同学的人数,求随机变量X 的分布列和数学期望. 解析:(1)设“选出的3名同学是来自互不相同的学院”为事件A ,则P (A )=C 13·C 27+C 03·C 37C 310=4960,所以选出的3名同学是来自互不相同学院的概率为4960. (2)随机变量X 的所有可能值为0,1,2,3. P (X =k )=C k4·C 3-k6C 310(k =0,1,2,3), 所以随机变量X 的分布列为:X 0 1 2 3P16 12 310 130随机变量X 的数学期望E (X )=0×16+1×12+2×310+3×130=65.20.(本小题满分12分)为备战2016年奥运会,甲、乙两位射击选手进行了强化训练.现分别从他们的强化训练期间的若干次平均成绩中随机抽取8次,记录如下:甲:8.3,9.0,7.9,7.8,9.4,8.9,8.4,8.3 乙:9.2,9.5,8.0,7.5,8.2,8.1,9.0,8.5(1)现要从中选派一人参加奥运会封闭集训,从统计学角度,你认为派哪位选手参加合理?简单说明理由.(2)若将频率视为概率,对选手乙在今后的三次比赛成绩进行预测,记这三次成绩中不低于8.5分的次数为ξ,求ξ的分布列及均值E (ξ).解析:(1)因为x -甲=x -乙=8.5,又s 2甲=0.27,s 2乙=0.405,得s 2甲<s 2乙,相对来讲,甲的成绩更加稳定,所以选派甲合适.(2)依题意得,乙不低于8.5分的频率为12,ξ的可能取值为0,1,2,3,则ξ~B ⎝⎛⎭⎫3,12.所以,P (ξ=k )=C k3⎝⎛⎭⎫123-k⎝⎛⎭⎫1-12k =C k 3⎝⎛⎭⎫123,k =0,1,2,3.所以ξ的分布列为:ξ0 1 2 3 P18383818所以E (ξ)=0×18+1×38+2×38+3×18=32.21.(本小题满分12分)某项选拔共有四轮考核,每轮设有一个问题,能正确回答者进入下一轮考核,否则即被淘汰.已知某选手能正确回答第一、二、三、四轮的问题的概率分别为0.6,0.4,0.5,0.2 . 已知各轮问题能否正确回答互不影响.(1)求该选手被淘汰的概率;(2)求该选手在选拔中至少回答了2个问题被淘汰的概率.解析:(1)记“该选手能正确回答第i 轮的问题”为事件A i (i =1,2,3,4),则P (A 1)=0.6,P (A 2)=0.4,P (A 3)=0.5,P (A 4)=0.2.法一 该选手被淘汰的概率:P =P (A 1+A 1A 2+A 1 A 2A 3 +A 1 A 2 A 3A 4 )=P (A 1)+P (A 1)P (A 2)+P (A 1)P (A 2)·P (A 3 )+P (A 1)P (A 2)P (A 3)P (A 4 )=0.4+0.6×0.6+0.6×0.4×0.5+0.6×0.4×0.5×0.8=0.976.法二 P =1-P (A 1 A 2 A 3A 4 )=1-P (A 1)P (A 2) P (A 3)P (A 4 )=1-0.6×0.4×0.5×0.2=1-0.024=0.976.(2)法一 P =P (A 1A 2+A 1 A 2A 3 +A 1 A 2 A 3A 4 )=P (A 1)P (A 2)+P (A 1)P (A 2)P (A 3 )+P (A 1)·P (A 2)P (A 3)P (A 4 ) =0.6×0.6+0.6×0.4×0.5+0.6×0.4×0.5×0.8=0.576.法二 P =1-P (A 1)-P (A 1 A 2 A 3A 4 )=1-(1-0.6)-0.6×0.4×0.5×0.2=0.576. 22.(2014·山东卷)(本小题满分12分)乒乓球台面被网分隔成甲、乙两部分,如图所示,甲上有两个不相交的区域A ,B ,乙被划分为两个不相交的区域C ,D .某次测试要求队员接到落点在甲上的来球后向乙回球.规定:回球一次,落点在C 上记3分,在D 上记1分,其他情况记0分.对落点在A 上的来球,队员小明回球的落点在C 上的概率为12,在D 上的概率为13;对落点在B 上的来球,小明回球的落点在C 上的概率为15,在D 上的概率为35.假设共有两次来球且落在A ,B 上各一次,小明的两次回球互不影响.求:(1)小明两次回球的落点中恰有一次的落点在乙上的概率; (2)两次回球结束后,小明得分之和ξ的分布列与数学期望.解析:(1)记A i 为事件“小明对落点在A 上的来球回球的得分为i 分”(i =0,1,3),则P (A 3)=12,P (A 1)=13,P (A 0)=1-12-13=16; 记B i 为事件“小明对落点在B 上的来球回球的得分为i 分” (i =0,1,3),则P (B 3)=15,P (B 1)=35,P (B 0)=1-15-35=15.记D 为事件“小明两次回球的落点中恰有1次的落点在乙上”. 由题意,D =A 3B 0+A 1B 0+A 0B 1+A 0B 3, 由事件的独立性和互斥性,P (D )=P (A 3B 0+A 1B 0+A 0B 1+A 0B 3)=P (A 3B 0)+P (A 1B 0)+P (A 0B 1)+P (A 0B 3)=P (A 3)P (B 0)+P (A 1)P (B 0)+P (A 0)·P (B 1)+P (A 0)P (B 3)=12×15+13×15+16×35+16×15=310, 所以小明两次回球的落点中恰有1次的落点在乙上的概率为310. (2)由题意,随机变量ξ可能的取值为0,1,2,3,4,6. 由事件的独立性和互斥性,得P (ξ=0)=P (A 0B 0)=16×15=130,P (ξ=1)=P (A 1B 0+A 0B 1)=P (A 1B 0)+P (A 0B 1)=13×15+16×35=16, P (ξ=2)=P (A 1B 1)=13×35=15,P (ξ=3)=P (A 3B 0+A 0B 3)=P (A 3B 0)+P (A 0B 3)=12×15+16×15=215, P (ξ=4)=P (A 3B 1+A 1B 3)=P (A 3B 1)+P (A 1B 3)=12×35+13×15=1130, P (ξ=6)=P (A 3B 3)=12×15=110.可得随机变量ξ的分布列为:ξ01234 6P13016152151130110所以数学期望E(ξ)=0×130+1×16+2×15+3×215+4×1130+6×110=.。