最新高三数学二轮 变量间的相关关系及统计案例 专题卷(全国通用) (4)

合集下载

高中数学:必修第二册第九章-统计教学教案:变量间的相关关系(习题含答案)

高中数学:必修第二册第九章-统计教学教案:变量间的相关关系(习题含答案)

高中数学:第二册第九章:变量间的相关关系一、基础知识梳理1.变量之间的相关关系当自变量取值一定时,因变量的取值带有一定的_________,则这两个变量之间的关系叫相关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断. 注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系. 2.散点图将样本中的n 个数据点(,)(1,2,,)i i x y i n =⋅⋅⋅描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点的分布可以直观地判断两个变量之间的关系.(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为_________,如图(1)所示;(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为_________,如图(2)所示.3.两个变量的线性相关(1)如果散点图中点的分布从整体上看大致在_________附近,我们就称这两个变量之间具有_________,这条直线叫做回归直线.回归直线对应的方程叫做回归直线方程(简称回归方程).(2)设已经得到两个具有线性相关关系的变量的一组数据1122(,),(,),,(,)n n x y x y x y ⋅⋅⋅,直线方程y bx a =+,其中,a b 是待定参数.经数学上的推导,,a b 的值由下列公式给出:1122211()()()nni i i ii i nni i i i x x y y x y nx yb x x x nxa y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑.其中,回归直线的斜率为b ,截距为a ,即回归方程为y bx a =+.上述求回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做_________. (3)利用回归方程,我们可以进行预测并对总体进行估计. 4.相关关系的强与弱若相应于变量x 的取值i x ,变量y 的观测值为(1)i y i n ≤≤,则变量x与y 的相关系数()()niix x y y r --=∑,即ni ix y nx yr -=∑,通常用r 来衡量x 与y 之间的线性关系的强弱.r 的范围为11r -≤≤,r 为正时,x 与y 正相关;r 为负时,x 与y 负相关.||r 越接近于1,x 与y 的相关程度越大;||r 越接近于0,二者的相关程度越小.当||1r =时,所以数据点都在一条直线上.习题参考答案: 1.随机性2.(1)正相关 (2)负相关3.(1)一条直线 线性相关关系 (2)最小二乘法二、重点知识梳理b 的公式或混淆b 的位置1.回归方程的求解(1)求回归方程的步骤:列表→计算相关量的值→代入公式计算a ,b 的值→写出回归方程. (2)回归直线一定经过样本点的中心.【例1】假设关于某设备的使用年限x (年)和所支出的年平均维修费用y (万元)(即维修费用之和除以使用年限),有如下的统计资料:使用年限x 2 3 4 5 6 维修费用y2.23.85.56.57.0(1)画出散点图;(2)从散点图中发现使用年限与所支出的年平均维修费用之间关系的一般规律; (3)求回归方程;(4)估计使用年限为10年时所支出的年平均维修费用是多少? 【答案】答案详见解析.【解析】(1)画出散点图如图所示:(2)由上图可知,各点散布在从左下角到右上角的区域里,因此,使用年限与所支出的年平均维修费用之间成正相关,即使用年限越长,所支出的年平均维修费用越多.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,两变量呈线性相关关系. 由题表数据可得552114,5,112.3,90i ii i i x y x yx ======∑∑,由公式可得2112.3545 1.23,5 1.ˆ2340.089054ˆba y bx -⨯⨯===-=-⨯=-⨯, 即回归方程是 1.230.08y x =+.(4)由(3)知,当10x =时, 1.23100.0812.38y =⨯+=. 故估计使用年限为10年时所支出的年平均维修费用是12.38万元.2.回归直线的理解及其应用在回归方程y bx a =+中,b 是回归直线的斜率,它代表x 每增加一个单位,y 的平均增加单位数,而不是增加单位数.对于具有线性相关关系的两个变量,在求出回归方程后,就可以对总体的数据进行估计或者由已知数据的趋势去预测未知数据的值.【例2】根据如下样本数据得到的回归方程为y bx a =+,若 5.4a =,则x 每增加1个单位,y 就A .增加0.9个单位B .减少0.9个单位C .增加1个单位D .减少1个单位【答案】B【解析】(5,0.9)在回归直线上,∴0.95 5.4b =+,解得0.9b =-,故回归方程为0.9 5.4y x =-+,则x 每增加1个单位,y 就减少0.9个单位,故选B .【例3】中国柳州从2011年起每年国庆期间都举办一届国际水上狂欢节,到2016年已举办了六届,旅游部门统计在每届水上狂欢节期间,吸引了不少外地游客到柳州,这将极大地推进柳州的旅游业的发展,现将前五届水上狂欢节期间外地游客到柳州的人数统计如下表:(1)求y 关于x 的线性回归方程y bx a =+;(2)旅游部门统计在每届水上狂欢节期间,每位外地游客可为本市增加100元左右的旅游收入,利用(1)中的线性回归方程,预测2017年第7届柳州国际水上狂欢节期间外地游客可为本市增加的旅游收入达多少?参考公式:121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.3.弄错回归方程中a ,b 的位置【例4】某班5名学生的数学和物理成绩如下表:(1)画出散点图.(2)求物理成绩y 对数学成绩x 的线性回归方程. 【答案】答案详见解析. 【错解】(1)散点图如图所示:(2)计算得1(8876736663)73.25x =⨯++++=,1(7865716461)67.85y =⨯++++=, 518878766573716664636125054i ii x y=⨯+⨯+⨯+⨯+⨯==∑,52222221887673666327174ii x==++++=∑,所以5152221525054573.267.80.6ˆ2527174573.25i ii i i x y x ybx x==--⨯⨯==≈-⨯-∑∑,67.80.625ˆˆ73.222.05a y bx =-=-⨯=. 所以y 对x 的线性回归方程是22.0502ˆ.65yx =+. 【错因分析】错解中回归方程记忆错误,应为y bx a =+. 【正解】(1)散点图如图所示:(2)计算得1(8876736663)73.25x =⨯++++=, 1(7865716461)67.85y =⨯++++=,518878766573716664636125054i ii x y=⨯+⨯+⨯+⨯+⨯==∑,52222221887673666327174i i x ==++++=∑, 所以5152221525054573.267.80.6ˆ2527174573.25i ii i i x yxybx x==--⨯⨯==≈-⨯-∑∑,67.80.625ˆˆ73.222.05a y bx =-=-⨯=. 所以y 对x 的线性回归方程是0.62520ˆ 2.5yx =+.三、习题强化训练1.下列两个变量之间的关系不具有线性关系的是 A .小麦产量与施肥值 B .球的体积与表面积 C .蛋鸭产蛋个数与饲养天数D .甘蔗的含糖量与生长期的日照天数 2.下列命题正确的是①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究. A .①③④ B .②③④C .③④⑤D .②④⑤3.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图图2.由这两个散点图可以判断A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关4.下列变量是线性相关的是 A .人的体重与视力 B .圆心角的大小与所对的圆弧长 C .收入水平与购买能力D .人的年龄与体重5.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为A .y ^=1.5x +2 B .y ^=-1.5x +2 C .y ^=1.5x -2D .y ^=-1.5x -26.下列关系中,属于相关关系的是________ ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.7.若施肥量x (kg )与水稻产量y (kg )的线性回归方程为y ^=5x +250,当施肥量为80 kg 时,预计水稻产量约为________kg.8.正常情况下,年龄在18岁到38岁的人,体重y (kg )对身高x (cm )的回归方程为y ^=0.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右.9.下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据:x 3 4 5 6 y2.5t44.5根据上表提供的数据,求出y 关于x 的线性回归方程y ^=0.7x +0.35,那么表中t 的值为________. 10.下列两个变量之间的关系是相关关系的是____________.①正方体的棱长和体积;②单位圆中圆心角的度数和所对弧长; ③单产为常数时,土地面积和总产量;④日照时间与水稻的亩产量.11.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是A .直线l 过点(x ,y )B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同12.设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是 A .y 与x 具有正的线性相关关系 B .回归直线过样本的中心点(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 13.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^A .不能小于0B .不能大于0C .不能等于0D .只能小于014.某考察团对全国10大城市职工人均工资x 与居民人均消费y 进行统计调查,y 与x 具有线性相关关系,线性回归方程ˆy=0.66x +1.562(单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比约为____________.15.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的人数5~32人,船员人数y 关于吨位x 的回归方程为y ^=9.5+0.006 2x , (1)若两艘船的吨位相差1 000,求船员平均相差的人数. (2)估计吨位最大的船和最小的船的船员人数.16.某工厂对某种产品的产量与成本的资料分析后有如下数据:(1)画出散点图;(2)求成本y 与产量x 之间的线性回归方程; (3)预计产量为8千件时的成本.17.某城市理论预测2014年到2018年人口总数y (单位:十万)与年份(用2014+x 表示)的关系如表所示:年份中的x 0 1 2 3 4 人口总数y5781119(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归方程y ∧=bx +a ; (3)据此估计2019年该城市人口总数.(参考数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30)参考公式:线性回归方程为y bx a =+,其中()()()1122211n ni i i i i i n n i i i i x x y y x y nxy b x x x nx====---==--∑∑∑∑.习题参考答案:6.【答案】②④ 7.【答案】650 8.【答案】69.96 9.【答案】310.【答案】④14.【答案】83%15.【答案】(1)船员平均相差6人;(2)吨位最大和最小的船的船员数分别为29人和10人. 16.【答案】(1)详见解析;(2)y ^=1.1x +4.6;(3)产量为8千件时,成本约为13.4万元. 17.【答案】(1)详见解析;(2)y =3.2x +3.6;(3)估计2019年该城市人口总数约为196万.。

高中数学 变量间的相关关系 练习题(含答案)

高中数学  变量间的相关关系 练习题(含答案)

型号二手车时车辆的使用年数不得超过多少年?
参考公式:回归方程
中斜率和截距的最小二乘估计公式分别为:
,
,
. 【答案】(1) 万元;(2)11. 【解析】
(1)由题意,计算

, 12.某地级市共有 200000 中小学生,其中有 7%学生在 2017 年享受了“国家精准扶贫”政策,在享受“国家精 准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为 5:3:2,为进一
,后因某未知原因使第 5 组数据的 值模糊不清,此位置数据记为 (如下表所示),则利用回 归方程可求得实数 的值为( )
196
197
200
203
204
1
3
6
7
A. 8.3 B. 8.2 【答案】D 【解析】 由题意可得:
C. 8.1
D. 8


回归方程过样本中心点,则:
,解得: . 本题选择 D 选项. 学.科.网
(Ⅱ)(1)
(2)
(2)由(1)得:


时 取最大
时,收益 预报值最大.
16.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,
每小时生产有缺点零件的多少,随机器运转速度而变化,下表为抽样试验的结果:
转速 x(转/秒)
16
14
12
8
每小时生产有缺点的零件数 y(件)
严重污染(六级),指数大于 300 .某气象站观测点记录了某市五月 1 号—4 号连续 4 天里,AQI 指数 M 与
当天的空气水平可见度 (单位 cm)的情况如下表 1:
M
900
700

高考数学二轮复习专题突破—统计与统计案例(含解析)

高考数学二轮复习专题突破—统计与统计案例(含解析)

高考数学二轮复习专题突破—统计与统计案例1.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 附:√74≈8.602.2.(2021·江西赣州二模改编)遵守交通规则,人人有责.“礼让行人”是我国《道路交通安全法》的明文规定,也是全国文明城市测评中的重要内容.《道路交通安全法》第47条明确规定:“机动车行经人行横道时,应当减速行驶;遇行人正在通过人行横道,应当停车让行.机动车行经没有交通信号的道路时,遇行人横过道路,应当避让.否则扣3分罚200元”.下表是2021年1至4月份我市某主干路口监控设备抓拍到的驾驶员不“礼让行人”行为统计数据:(1)请利用所给数据求不“礼让行人”驾驶员人数y 与月份x 之间的经验回归方程y ^=b ^x+a ^,并预测该路口2021年10月不“礼让行人”驾驶员的大约人数(四舍五入);(2)交警从这4个月内通过该路口的驾驶员中随机抽查50人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:依据小概率值α=0.10的独立性检验,分析“礼让行人”行为是否与驾龄有关.参考公式:b ^=∑i=1nx i y i -nx y ∑i=1nx i 2-nx2=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2.χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.3.(2021·河北石家庄二模改编)某地区在2020年底全面建成小康社会,随着实施乡村振兴战略规划,该地区农村居民的收入逐渐增加,可支配消费支出也逐年增加.该地区统计了2016~2020年农村居民人均消费支出情况,对有关数据处理后,制作如图1的折线图[其中变量y (单位:万元)表示该地区农村居民人均年消费支出,年份用变量t 表示,其取值依次为1,2,3,…].(1)由图1可知,变量y与t具有很强的线性相关关系,求y关于t的经验回归方程,并预测2021年该地区农村居民人均消费支出;2016~2020年该地区农村居民人均消费支出图1(2)在国际上,常用恩格尔系数(其含义是指食品类支出总额占个人消费支出总额的比重)来衡量一个国家和地区人民生活水平的状况.根据联合国粮农组织的标准:恩格尔系数在40%~50%为小康,30%~40%为富裕.已知2020年该地区农村居民平均消费支出构成如图2所示,预测2021年该地区农村居民食品类支出比2020年增长3%,从恩格尔系数判断2021年底该地区农村居民生活水平能否达到富裕生活标准.2020年该地区农村居民人均消费支出构成图2参考公式:经验回归方程y ^=b ^x+a ^中斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2=∑i=1nx i y i -nx y∑i=1nx i 2-nx 2,a ^=y −b ^x .4.(2021·山东潍坊一模)在对人体的脂肪含量和年龄之间的关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据(x i ,y i )(i=1,2,…,20,25<x i <65),其中x i 表示年龄,y i 表示脂肪含量,并计算得到∑i=120x i 2=48 280,∑i=120y i 2=15 480,∑i=120x i y i =27 220,x =48,y =27,√22≈4.7.(1)请用样本相关系数说明该组数据中y 与x 之间的关系可用线性回归模型进行拟合,并求y 关于x的经验回归方程y ^=a ^+b ^x (a ^,b ^的计算结果保留两位小数);(2)科学健身能降低人体脂肪含量,下表是甲、乙两款健身器材的使用年限(整年)统计表:某健身机构准备购进其中一款健身器材,以使用年限的频率估计概率,请根据以上数据估计,该机构选择购买哪一款健身器材,才能使用更长久?参考公式:样本相关系数r=∑i=1n(x i -x)(y i -y)√∑i=1n (x i -x)2√∑i=1n(y i -y)2=∑i=1nx i y i -nx y√∑i=1nx i 2-nx 2√∑i=1ny i 2-ny 2;对于一组具有线性相关关系的数据(x i ,y i )(i=1,2,…,n ),其经验回归直线y ^=b ^x+a ^的斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2,a ^=y −b ^x .答案及解析1.解 (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6, s=√0.029 6=0.02×√74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17. 2.解 (1)由表中数据易知:x =1+2+3+44=52,y =125+105+100+904=105,则b ^=∑i=14x i y i -4x y∑i=14x i 2-4x2=995−1 05030−25=-11,a ^=y −b ^ x =105-(-11)×52=132.5,故所求经验回归方程为y ^=-11x+132.5.令x=10,则y ^=-11×10+132.5=22.5≈23(人),预测该路口10月份不“礼让行人”的驾驶员大约人数为23. (2)零假设为H 0:“礼让行人”行为与驾龄无关.由表中数据可得χ2=50×(10×12−20×8)218×32×30×20≈0.23<2.706=x 0.10,依据小概率值α=0.10的独立性检验,没有充分证据推断H 0不成立,可以认为H 0成立,即认为“礼让行人”行为与驾龄无关.3.解 (1)由已知数据可求t =1+2+3+4+55=3, y =1.01+1.10+1.21+1.33+1.405=1.21,∑i=15t i 2=12+22+32+42+52=55,∑i=15t i y i =1×1.01+2×1.10+3×1.21+4×1.33+5×1.40=19.16,b ^=19.16−5×3×1.2155−5×32=1.0110=0.101,a ^=1.21-0.101×3=0.907,所求经验回归方程为y ^=0.101t+0.907. 当t=6时,y ^=0.101×6+0.907=1.513(万元),故2021年该地区农村居民人均消费支出约为1.513万元.(2)已知2021年该地区农村居民平均消费支出1.513万元,由图2可知,2020年该地区农村居民食品类支出为4 451元,则预测2021年该地区食品类支出为4 451×(1+3%)=4 584.53元,恩格尔系数=4 584.5315 130×100%≈30.3%∈(30%,40%),所以,2021年底该地区农村居民生活水平能达到富裕生活标准.4.解 (1)x 2=2 304,y2=729,∑i=120x i y i -20x y =1 300,∑i=120x i 2-20x 2=2 200,∑i=1ny i 2-20y 2=900,r=∑i=120x i y i -20x y√∑i=120x i 2-20x 2√∑i=1ny i 2-20y2≈0.92,因为y 与x 的样本相关系数接近1,所以y 与x 之间具有较强的线性相关关系,可用线性回归模型进行拟合.由题可得,b ^=∑i=120(x i -x)(y i -y)∑i=120(x i -x)2=∑i=120x i y i -20x y∑i=120x i 2-20x2=1322≈0.591,a ^=y −b ^ x =27-0.591×48≈-1.37,所以y ^=0.59x-1.37.(2)以频率估计概率,设甲款健身器材使用年限为X (单位:年).E (X )=5×0.1+6×0.4+7×0.3+8×0.2=6.6. 设乙款健身器材使用年限为Y (单位:年).E (Y )=5×0.3+6×0.4+7×0.2+8×0.1=6.1.因为E (X )>E (Y ),所以该健身机构购买甲款健身器材更划算.。

MS03变量间的相关关系统计案例训练题(含答案)

MS03变量间的相关关系统计案例训练题(含答案)

x0 12
3
y m 3 5.5 7
A.1 B.0.85 C.0.7 D.0.5
10.一名小学生的年龄和身高(单位:cm)的数据如下表:
年龄 x 6
7
8
9
身高 y 118
126
136
144
由散点图可知,身高 y 与年龄 x 之间的线性回归方程为 =8.8x+ ,预测该学生 10 岁时的身高为( )
A.154 B.153 C.152 D.151 11.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 5 次试验,收集数据如下: 加工零件 x(个)10 20 30 40 50 加工时间 y(分64 69 75 82 90 钟)
C.月收入的中位数是 16,x 与 y 有正线性相关关系 D.月收入的中位数是 16,x 与 y 有负线性相关关系
8.已知 x,y 的取值如下表所示:
x
2
3
4
y
6
4
5
如果 y 与 x 呈线性相关,且线性回归方程为
,则 b=( )
A. B. C.
D.
第1页共8页
9.已知 x 与 y 之间的一组数据:已求得关于 y 与 x 的线性回归方程为 =2.1x+0.85,则 m 的值为( )
变量间的相关关系统计案例训练题
一.选择题(共 15 小题)
1.(2015•湖北)已知变量 x 和 y 满足关系 y=﹣0.1x+1,变量 y 与 z 正相关,下列结论中正确的是( )
A.x 与 y 负相关,x 与 z 负相关 B.x 与 y 正相关,x 与 z 正相关
C.x 与 y 正相关,x 与 z 负相关 D.x 与 y 负相关,x 与 z 正相关

限时集训(五十八) 变量间的相关关系与统计案例

限时集训(五十八) 变量间的相关关系与统计案例

限时集训(五十八) 变量间的相关关系与统计案例(限时:45分钟 满分:81分)一、选择题(本大题共6小题,每小题5分,共30分) 1.下列关系中,是相关关系的为( ) ①学生的学习态度与学习成绩之间的关系; ②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. A .①② B .①③ C .②③D .②④2.(2012·新课标全国卷)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .13.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为( ) A.y ^=1.23x +4 B.y ^=1.23x +5 C.y ^=1.23x +0.08D.y ^=0.08x +1.234.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的线性回归方程为( ) A .y =x -1 B .y =x +1 C .y =88+12xD .y =1765.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:则大约有多大的把握认为多看电视与人变冷漠有关系( ) A .99% B .97.5% C .95%D .90%6.通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:由K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),算得K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A .有99%以上的把握认为“选择过马路的方式与性别有关”B .有99%以上的把握认为“选择过马路的方式与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关” 二、填空题(本大题共3小题,每小题5分,共15分)7.经调查某地若干户家庭的年收入x (万元)和年饮食支出y (万元)具有线性相关关系,并得到y 关于x 的线性回归直线方程:y ^=0.245x +0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.8.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.9.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:已知P (K 2≥3.841)≈0.05,P 根据表中数据,得到K 2=50×(13×20-10×7)223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为________.三、解答题(本大题共3小题,每小题12分,共36分) 10.已知x ,y 的一组数据如下表:(1)从x ,y (2)对于表中数据,甲、乙两同学给出的拟合直线分别为y =13x +1与y =12x +12,试利用“最小平方法(也称最小二乘法)”判断哪条直线拟合程度更好.11.为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x 、物理成绩y 进行分析.下面是该生7次考试的成绩.(1)(2)已知该生的物理成绩y 与数学成绩x 是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.(其中,数据(x i ,y i )(i =1,2,…,n )的线性回归方程为y ^=b ^x+a ^,b ^=∑i =1n(x i -x -)(y i -y -)∑i =1n(x i -x -)2,a ^=y --b ^x -)12.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表.已知从全部105人中随机抽取1人为优秀的概率为27.(1)请完成上面的列联表;(2)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”; (3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到6号或10号的概率.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),限时集训(五十八) 变量间的相关关系与统计案例答 案1.A 2.D 3.C 4.C 5.A 6.A 7.0.245 8.0.5 0.53 9.5%10.解:(1)从x ,y 中各取一个数组成数对(x ,y ),共有25对,其中满足x +y ≥10的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共9对.故所求概率P =925.(2)用y =13x +1作为拟合直线时,所得y 值与y 的实际值的差的平方和为S 1=⎝⎛⎭⎫43-12+(2-2)2+(3-3)2+⎝⎛⎭⎫103-42+⎝⎛⎭⎫113-52=73.用y =12x +12作为拟合直线时,所得y 值与y 的实际值的差的平方和为S 2=(1-1)2+(2-2)2+⎝⎛⎭⎫72-32+(4-4)2+⎝⎛⎭⎫92-52=12. ∵S 2<S 1,∴直线y =12x +12的拟合程度更好.11.解:(1)∵x -=100+-12-17+17-8+8+127=100,y -=100+-6-9+8-4+4+1+67=100,∴s 2数学=9947=142.∴s 2物理=2507, ∵s 2数学>s 2物理,∴该生的物理成绩更稳定.(2)由于x 与y 之间具有线性相关关系,∴b ^=71722177i ii i i x y x yx x==--∑∑=497994=0.5, a ^=y --b ^x -=100-0.5×100=50. ∴线性回归方程为y ^=0.5x +50. 当y =115时,x =130. 建议:进一步加强对数学的学习,提高数学成绩的稳定性,这将有助于物理成绩的进一步提高. 12.解:(1)(2)K 2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”.(3)设“抽到6号或10号”为事件A ,先后两次抛掷一枚均匀的骰子,出现的点数为(x ,y ),则所有的基本事件有(1,1)、(1,2)、(1,3)、…、(6,6),共36个.事件A 包含的基本事件有(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个,∴P (A )=836=29.。

习题-变量间的相关关系、统计案例

习题-变量间的相关关系、统计案例

10.3 变量间的相关关系、统计案例基础篇 固本夯基考点一 变量间的相关关系1.(2022届陕西宝鸡期末,4)下列两个变量具有相关关系的是( ) A.正方体的体积与棱长 B.汽车匀速行驶时的路程与时间 C.人的体重与饭量 D.人的身高与视力 答案 C2.(2021西南名校联盟联考,3)已知甲、乙、丙、丁四组数据变量间对应的线性相关系数分别为0.46,0.79, -0.92,0.85,则( )A.甲组数据变量间的线性相关程度最强B.乙组数据变量间的线性相关程度最弱C.丙组数据变量间的线性相关程度最强D.丁组数据变量间的线性相关程度最强 答案 C3.(2020陕西铜川二模,5)四名同学根据各自的样本数据研究变量x,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x-6.423; ②y 与x 负相关且y ^=-3.476x+5.648; ③y 与x 正相关且y ^=5.437x+8.493; ④y 与x 正相关且y ^=-4.326x-4.578. 其中不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④ 答案 D4.(2020陕西榆林三模,3)如图所示,给出了样本容量均为7的A,B 两组样本数据的散点图,已知A 组样本数据的相关系数为r 1,B 组样本数据的相关系数为r 2,则( )A.r 1=r 2B.r 1<r 2C.r 1>r 2D.无法判定 答案 C5.(2022届四川资阳一诊,4)我国在2020年如期完成了新时代脱贫攻坚目标任务,脱贫攻坚战取得全面胜利,历史性地解决了绝对贫困问题,并全面建成了小康社会.现就2013—2019 年年末全国农村贫困人口数进行了统计,制成如下散点图:据此散点图,下面 4个回归方程类型中最适宜作为年末贫困人口数y 和年份代码x 的回归方程类型的是( )A.y=a+bxB.y=a+bx C.y=a+be x D.y=a+bln x 答案 A6.(2022届四川绵阳阶段测试,3)某市物价部门对5家商场的某商品一天的销售量及其价格进行了调查,5家商场的价格x(元)和销售量y(件)之间的一组数据如表所示:价格x(元) 9 9.5 10 10.5 11 销售量y(件)1110865按公式计算,y 与x 的回归直线方程是y ^=-3.2x+a ^,相关系数|r|=0.992,则下列说法错误的是( ) A.变量x,y 线性负相关且相关性较强 B.a ^=40C.当x=8.5时,y 的估计值为12.8D.相应于点(10.5,6)的残差为0.4 答案 D7.(2020兰州一诊,7)近五年来某草场羊只数与草场植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示.年份 1 2 3 4 5 羊只数(万只) 1.4 0.9 0.750.60.3 草场植被指数1.14.315.6 31.349.7根据表及图得到以下判断:①羊只数与草场植被指数成减函数关系;②若利用这五组数据得到的两变量间的相关系数为r 1,去掉第一年数据后得到的相关系数为r 2,则|r 1|<|r 2|; ③可以利用回归直线方程,准确地得到当羊只数为2万只时的草场植被指数. 以上判断中正确的个数是( )A.0B.1C.2D.3 答案 B8.(2020课标Ⅱ,18,12分)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i=1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑i=120x i =60,∑i=120y i =1 200,∑i=120(x i -x )2=80,∑i=120(y i -y )2=9 000,∑i=120(x i -x)(y i -y)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘地块数);(2)求样本(x i ,y i )(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由. 附:相关系数 r=∑i=1n(x i -x)(y -y)√∑i=1(x i -x)2∑i=1(y i -y)2,√2≈1.414.解析(1)由已知得样本平均数y =120∑i=120y i =60,从而该地区这种野生动物数量的估计值为60×200=12 000.(2)样本(x i ,y i )(i=1,2,…,20)的相关系数 r=∑i=120(x i -x)(y -y)√∑i=1(x i -x)2∑i=1(y i-y)2=√80×9 000=2√23≈0.94.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.考点二 独立性检验1.(2022届黑龙江月考,8)某学校食堂对高三学生偏爱蔬菜还是肉类与性别的关系进行了一次调查,根据独立性检验原理,处理所得数据之后发现,有99%的把握但没有99.9%的把握认为偏爱蔬菜还是肉类与性别有关,则K 2的观测值可能为( )P(K 2≥k 0) 0.10 0.05 0.025 0.010 0.0050.001k0 2.706 3.841 5.024 6.6357.87910.828A.K2=3.206B.K2=6.625C.K2=7.869D.K2=11.208答案C2.(2022届山西运城期中,7)为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验.根据四个实验室得到的列联表画出如下四个等高堆积条形图,最能体现该药物对预防禽流感有显著效果的图形是()答案D3.(2020宁夏石嘴山二模,4)通过随机询问200名性别不同的大学生是否爱好踢毽子运动,计算得到K2的观测值k≈4.892,参照下表,得到的正确结论是()P(K2≥k0)0.100.050.025k0 2.706 3.841 5.024A.有97.5%以上的把握认为“爱好该项运动与性别有关”B.有97.5%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别无关”答案C4.(2021四川南充阆中中学4月质检,6)若由一个2×2列联表中的数据计算得K2=4.013,那么有的把握认为两个变量有关系.()P(K2≥k0)0.150.100.050.0250.0100.0050.001k0 2.0722.7063.8415.0246.6357.87910.828A.95%B.97.5%C.99%D.99.9%答案A5.(2021安徽黄山二模,7)给出下列命题:①在线性回归模型中,相关指数R2表示解释变量x对于预报变量y的贡献率,R2越接近于0,表示回归效果越好;②两个变量相关性越强,则相关系数的绝对值就越接近于1; ③两个模型中残差平方和越小的模型拟合的效果越好;④对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大. 其中正确命题的个数是( )A.1B.2C.3D.4 答案 C6.(2022届河南焦作模拟,17)第32届夏季奥运会于2021年7月23日至8月8日在日本举行,为了解某校学生对奥运会是否关注,随机调查了该校200名学生,统计结果如表:关注 不关注 合计 女生 34 51 85 男生 66 49 115 合计100100200(1)分别估计该校女生和男生关注奥运会的概率;(2)能否有99%的把握认为该校女生和男生对奥运会的关注度有差异? 参考公式及数据: K2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P(K 2≥k) 0.050 0.010 0.001k3.8416.635 10.828解析 (1)估计该校女生关注奥运会的概率约为3485=25;男生关注奥运会的概率约为66115. (2)由题表中数据可知K2=200×(34×49-66×51)2100×100×85×115=13623≈5.913. 因为5.913<6.635,故没有99%的把握认为该校女生和男生对奥运会的关注度有差异.7.(2022届昆明质检,17)“微信运动”是手机APP 推出的多款健康运动软件中的一款,某学校140名教师均在微信好友群中参与了“微信运动”,对运动10 000步或以上的教师授予“运动达人”称号,低于10 000步称为“参与者”.为了解教师们的运动情况,选取了教师们在某日的运动数据进行分析,统计结果如下:运动达人 参与者 合计 男教师 60 20 80 女教师 40 20 60 合计10040140(1)根据上表说明,能否在犯错误概率不超过0.05的前提下认为获得“运动达人”称号与性别有关; (2)从获得“运动达人”称号的教师中采用按性别分层抽样的方法选取5人参加全国第四届“万步有约”全国健走激励大赛某赛区的活动,若从选取的5人中随机抽取2人作为代表参加开幕式,求抽取的2人都为女教师的概率. 参考公式:K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.参考数据:P(K 2≥k 0) 0.050 0.0100.001k 03.8416.635 10.828解析 (1)∵K2=140×(60×20-40×20)280×60×100×40≈1.167<3.841,∴不能在犯错误的概率不超过0.05的前提下认为获得“运动达人”称号与性别有关.(2)根据分层抽样方法得:参赛的男教师有60100×5=3人,参赛的女教师有40100×5=2人,抽取的男教师记为A,B,C;女教师记为a,b.从抽取的这五名教师中随机选取2名,有AB,AC,Aa,Ab,BC,Ba,Bb,Ca,Cb,ab 共10种选法,其中2人都是女教师的选法有ab 一种,故抽取的2人都为女教师的概率P=110.8.(2019课标Ⅰ,17,12分)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到列联表:满意 不满意 男顾客 40 10 女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d).P(K 2≥k)0.050 0.010 0.001 k3.8416.63510.828.解析 (1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6. (2)K2=100×(40×20-10×30)250×50×70×30≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.综合篇 知能转换考法一 线性回归方程的求解与应用1.(2022届四川模拟,8)已知回归直线的斜率的估计值为1.23,样本点的中心为(5,6),则回归直线方程为( ) A.y ^=-0.15x+1.23 B.y ^=-2.38x+1.23C.y ^=1.23x-2.38 D.y ^=1.23x-0.15 答案 D2.(2022届哈尔滨模拟,10)已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间具有线性相关关系,利用下表中的五组数据求得回归直线方程为y ^=b ^x+a ^,根据该回归方程,预测当x=8时,y ^=84.8,则b ^=( )x23456y 25 37 50 56 64A.9.4B.9.5C.9.6D.9.8 答案 C3.(2021甘肃二模,7)某地以“绿水青山就是金山银山”理念为引导,推进绿色发展,现要订购一批苗木,苗木长度与售价如下表:苗木长度x(厘米) 38 485868 7888 售价y(元)16.8 18.8 20.8 22.8 2425.8由表可知,苗木长度x(厘米)与售价y(元)之间存在线性相关关系,回归方程为y ^=0.2x+a ^,则当苗木长度为150厘米时,售价大约为( ) A.33.3元 B.35.5元 C.38.9元 D.41.5元 答案 C4.(2021西安中学二模,4)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i=1,2,…,n),用最小二乘法建立的回归方程为y ^=0.85x-85.71. ①y 与x 具有正的线性相关关系; ②回归直线过样本点的中心(x ,y );③若该大学某女生身高增加1 cm,则其体重约增加0.85 kg; ④若该大学某女生身高为170 cm,则其体重必为58.79 kg. 则上述判断不正确的个数是( ) A.1 B.2 C.3 D.4 答案 A5.(2020中原名校质量考评,7)根据最小二乘法,由一组样本数据(x i ,y i )(其中i=1,2,…,300)求得的回归方程是y ^=b ^x+a ^,则下列说法正确的是( )A.至少有一个样本点落在回归直线y ^=b ^x+a ^上B.若所有样本点都在回归直线y ^=b ^x+a ^上,则变量间的相关系数为1 C.对所有的解释变量x i (i=1,2,…,300),b ^x i +a ^的值一定与y i 有误差 D.若回归直线y ^=b ^x+a ^的斜率b ^>0,则变量x 与y 正相关 答案 D6.(2021江西八校4月联考,14)如图,根据已知的散点图得到y 关于x 的线性回归方程为y ^=b ^x+0.2,则b ^= .答案 1.67.(2022届江西顶级名校调研,18)根据国际疫情形势以及传染病防控的经验,加快新冠病毒疫苗接种是当前有力的防控手段,我国正在安全、有序加快推进疫苗接种工作.某乡村采取通知公告、微信推送、广播播放、条幅宣传等形式,积极开展疫苗接种社会宣传工作,消除群众疑虑,提高新冠疫苗接种率,让群众充分地认识到了疫苗接种的重要作用.自宣传开始后村干部统计了本村200名居民(未接种)5天内每天新接种新冠疫苗的情况如下表:第x 天 1 2 3 4 5 新接种人数y1015192328(1)建立y 关于x 的线性回归方程;(2)假设全村共计2 000名居民(均未接种过新冠疫苗),用样本估计总体来预测该村80%居民接种新冠疫苗需要几天.参考公式:回归方程y ^=b ^x+a ^中斜率和截距的最小二乘估计公式分别为b ^=∑i=1nx i y i -nxy ∑i=1nx i 2-nx2,a ^=y -b ^x .解析 (1)x =1+2+3+4+55=3,y =10+15+19+23+285=19,则b ^=10+30+57+92+140-5×3×1912+22+32+42+52-5×32=225,a ^=19-225×3=295,故y 关于x 的线性回归方程为y ^=225x+295.(2)设a n =225n+295,数列{a n }的前n 项和为S n ,易知数列{a n }是等差数列, 则S n =n(a 1+a n )2=n (225+295+225n+295)2=115n 2+8n,因为S 6=127.2,S 7=163.8,所以10S 6=1 272,10S 7=1 638,又2 000×80%=1 600(人),所以预测该村80%居民接种新冠疫苗需要7天.8.(2021广西贵港港北模拟,17)某个体服装店经营各种服装,在某周内获纯利润y(元)与该周每天销售这种服装件数x 之间的一组数据关系如下表:x 3456789y66 69 73 81 89 90 91(1)求x ,y ;(2)若y 与x 线性相关,请求纯利润y(元)与每天销售件数x 的回归直线方程. 参考数据及公式:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2=∑i=1nx i y i -nx y ∑i=1nx i2-nx 2,a ^=y -b ^x ,∑i=17x i 2=280,∑i=17x i y i =3 487. 解析 (1)x =17×(3+4+5+6+7+8+9)=6,y =17×(66+69+73+81+89+90+91)=5597. (2)设回归直线方程为y ^=b ^x+a ^.∵∑i=17x i 2=280,∑i=17x i y i =3 487,∴b ^=3 487-7×6×5597280-7×36=13328=4.75,a ^=5597-6×4.75≈51.36.∴回归直线方程为y ^=4.75x+51.36.9.(2021成都郫都模拟,18)某人统计了近5年某网站“双11”当天的交易额,统计结果如下表:年份 2015 2016 2017 2018 2019 年份代码x 1 2 3 4 5 交易额y/百亿元912172126(1)请根据上表提供的数据,用相关系数r 说明y 与x 的线性关系的强弱(线性相关系数保留三位小数);(统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值x i ,变量y 的观测值为y i (1≤i ≤n),则两个变量的相关系数的计算公式为r=∑i=1n(x i -x)(y -y)√∑i=1(x i -x)2∑i=1(y i -y)2.统计学认为,对于变量x,y,如果r ∈[-1,-0.75],那么负相关很强;如果r ∈[0.75,1],那么正相关很强;如果r ∈(-0.75,-0.30]或r ∈[0.30,0.75),那么相关性一般;如果r ∈[-0.25,0.25],那么相关性较弱)(2)求出y 关于x 的线性回归方程,并预测2020年该网站“双11”当天的交易额. 参考公式:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2,a ^=y -b ^x ,参考数据:√1 860≈43.1.解析 (1)根据题表中的数据,可得x =15×(1+2+3+4+5)=3,y =15×(9+12+17+21+26)=17, 则∑i=15(x i -x )(y i -y )=(1-3)×(9-17)+…+(5-3)×(26-17)=43;√∑i=15(x i -x)2∑i=15(y i -y)2=√10×186≈43.1,所以r=∑i=15(x i -x)(y -y)√∑i=15(x i -x)2∑i=15(y i-y)2=4343.1≈0.998,所以变量y 与x 的线性相关性很强. (2)由(1)可得x =3,y =17,∑i=15(x i -x )(y i -y )=43,∑i=15(x i -x )2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10,所以b ^=∑i=15(x i -x)(y i -y)∑i=15(x i -x)2=4310=4.3,则a ^=y -b ^x =17-4.3×3=4.1.所以y 关于x 的线性回归方程为y ^=4.3x+4.1.令x=6,可得y ^=4.3×6+4.1=29.9,故预测2020年该网站“双11”当天的交易额为29.9百亿元.思路分析 (1)利用已知条件求解相关系数,判断即可;(2)根据公式求出回归直线方程的系数,得回归直线方程,然后把x=6代入,求出结果进行预测即可.考法二 独立性检验的应用1.(2022届河南月考,9)某外语学校要学生从德语和日语中选择一种作为“第二外语”进行学习,为了解选择第二外语的倾向与性别的关系,随机抽取100名学生,得到下面的数据表:选择德语 选择日语 男生 15 35 女生3020根据表中提供的数据可知( ) 附:K2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P(K 2≥k) 0.100 0.050 0.010 0.005 0.001 k2.7063.841 6.635 7.87910.828A.在犯错误的概率不超过0.1%的前提下,认为选择第二外语的倾向与性别无关B.在犯错误的概率不超过0.1%的前提下,认为选择第二外语的倾向与性别有关C.有99.5%的把握认为选择第二外语的倾向与性别无关D.有99.5%的把握认为选择第二外语的倾向与性别有关答案D2.(2020江西吉安、抚州、赣州一模,5)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A 的100天日落和夜晚天气,得到如下2×2列联表:夜晚天气下雨未下雨日落云里走出现255未出现2545临界值表P(K2≥k0)0.100.050.0100.001k0 2.706 3.841 6.63510.828并计算得到K2≈19.05,下列小波对地区A天气的判断不正确的是()A.夜晚下雨的概率约为12B.未出现“日落云里走”,夜晚下雨的概率约为514C.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨答案D3.(2020湖南衡阳八中月考,5)某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:喜欢应用统计课程不喜欢应用统计课程男生205女生1020附表:P(K2≥k)0.100.050.0250.0100.0050.001k 2.706 3.841 5.024 6.6357.87910.828参考公式:K2=n(ad-bc)2,其中n=a+b+c+d.(a+b)(c+d)(a+c)(b+d)参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为喜欢“应用统计”课程与性别有关B.在犯错误的概率不超过0.1%的前提下,认为喜欢“应用统计”课程与性别无关C.有99.99%以上的把握认为喜欢“应用统计”课程与性别有关D.有99.99%以上的把握认为喜欢“应用统计”课程与性别无关答案A4.(2020安徽蚌埠三模,15)某企业为了调查其产品在国内和国际市场的发展情况,随机抽取国内、国外各100名客户代表,了解他们对该企业产品的发展前景所持的态度,得到如图所示的等高条形图,则有99%以上的把握认为是否持乐观态度与国内外差异有关(填“能”或“不能”).P(K2≥k)0.0500.0100.0050.001k 3.841 6.6357.87910.828附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).答案能5.(2021山东青岛一模,15)某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为接受大密度集中培训的55名学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(K2≥k)0.050.0250.0100.001k 3.841 5.024 6.63510.828答案0.0256.(2022届吉林重点高中月考,19)新能源汽车是指除汽油、柴油发动机之外所有的其他能源汽车,被认为能减少空气污染和缓解能源短缺.在当今提倡全球环保的前提下,新能源汽车产业必将成为未来汽车产业发展的导向与目标.新能源汽车也越来越受到消费者的青睐.某机构调查了某地区近期购车的200位车主的性别与购车种类情况,得到数据如下:购置新能源汽车购置传统燃油汽车合计男性10020120女性503080合计15050200 (1)根据表中数据,判断是否有99.9%的把握认为购置新能源汽车与性别有关;(2)用分层抽样的方法按性别从被调查的购置新能源汽车的车主中选出6位,参加关于“新能源汽车驾驶体验”的问卷调查,并从这6位车主中随机抽取2位车主赠送一份小礼物,求这2位获赠礼品的车主中至少有1位女性车主的概率. 参考公式:K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.参考数据:P(K 2≥k 0) 0.10 0.05 0.010 0.001 k 02.7063.8416.63510.828解析 (1)由题表得K2=200×(100×30-20×50)2120×80×150×50=1009≈11.111>10.828.所以有99.9%的把握认为购置新能源汽车与性别有关.(2)用分层抽样的方法按性别从被调查的购置新能源汽车的车主中选出6位,其中男性车主有100150×6=4人,记为a,b,c,d;女性车主有50150×6=2人,记为E,F.从这6位车主中随机抽取2位车主包含的基本事件有:ab,ac,ad,aE,aF,bc,bd,bE,bF,cd,cE,cF,dE,dF,EF,共15种. 至少有1位女性车主包含的基本事件有:aE,aF,bE,bF,cE,cF,dE,dF,EF,共9种.故所求概率P=915=35. 7.(2022届山西长治质检,17)为了了解某种新型药物对治疗某种疾病的疗效,某机构日前联合医院进行了小规模的调查.结果显示,相当多的受访者担心使用新药后会有副作用.为了了解使用该种新型药品后是否会引起疲乏症状,该机构随机抽取了某地患有这种疾病的275人进行调查,得到统计数据如下表:无疲乏症状有疲乏症状总计 未使用新药 150 25 t 使用新药 x y 100 总计225m275(1)求2×2列联表中的数据x,y,m,t 的值,并确定能否有95%的把握认为有疲乏症状与使用该新药有关; (2)从使用该新药的100人中按是否有疲乏症状,采用分层抽样的方法抽出4人,再从这4人中随机抽取2人作进一步调查,求这2人中恰有1人有疲乏症状的概率. 附:K2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P(K 2≥k) 0.150 0.100 0.050 0.025 0.010 k2.072 2.7063.841 5.0246.635解析 (1)t=150+25=175,x=225-150=75,y=100-75=25,m=25+25=50,所以K 2的观测值k=275×(150×25-75×25)2225×50×100×175≈4.910 7>3.841,故有95%的把握认为有疲乏症状与使用新药有关.(2)从使用该新药的100人中按是否有疲乏症状,采用分层抽样的方法抽出4人,其中无疲乏症状的有75100×4=3人,记为a,b,c;有疲乏症状的有25100×4=1人,记为D,则从这4人中随机抽取2人的情况有ab,ac,aD,bc,bD,cD,共6种,这2人中恰有1人有疲乏症状的情况有aD,bD,cD,共3种.故所求概率P=36=12. 8.(2021安徽五校联盟联考(二),18)网购是当前人们购物的新方式,某公司为了改进营销方式,随机调查了100名市民,统计了不同年龄的人群网购的人数如下表:年龄段(岁) (0,20) [20,40) [40,60) [60,100) 网购人数 26 32 34 8 男性人数1510105(1)若把年龄在[20,60)的人称为“网购迷”,否则称为“非网购迷”,请完成下面的2×2列联表,并判断能否有99%的把握认为网购与性别有关;网购迷非网购迷总计男性 女性 总计(2)若从年龄小于40岁的网购男性中用分层抽样的方法抽取5人,再从中抽取两人,求两人年龄都小于20岁的概率. 附:K2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P(K 2≥k) 0.10 0.05 0.01 0.001k2.7063.841 6.635 10.828解析 (1)由题中信息完善2×2列联表如下表所示:网购迷 非网购迷 总计 男性 20 20 40 女性 46 14 60 总计6634100∴K2=100×(20×14-46×20)266×34×40×60≈7.605>6.635,故有99%的把握认为网购与性别有关.(2)年龄在(0,20)、[20,40)的网购男性分别有15人、10人.按分层抽样的方法随机抽取5人,从年龄段(0,20)内抽取3人,分别记为1、2、3;从年龄段[20,40)内抽取2人,分别记为a 、b,从中随机抽取2人的可能结果有(1,2)、(1,3)、(1,a)、(1,b)、(2,3)、(2,a)、(2,b)、(3,a)、(3,b)、(a,b),共10个.用A表示“两人年龄都小于20岁”这一事件,则事件A包含的结果为(1,2)、(1,3)、(2,3),共3个.故事件A发生的概率P(A)=310.9.(2021安徽黄山二模,17)2021年3月5日,人社部和全国两会政府工作报告中针对延迟退休给出了最新消息,人社部表示正在研究延迟退休改革方案,两会上指出十四五期间要逐步延迟法定退休年龄.现对某市工薪阶层关于延迟退休政策的态度进行调查,随机调查了50人,他们月收入的频数分布及对延迟退休政策赞成的人数如下表.月收入(单位:百元)[15,25)[25,35)[35,45)[45,55)[55,65)[65,75]频数510151055赞成人数123534(1)根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有99%的把握认为“月收入以55百元为分界点”对延迟退休政策的态度有差异;月收入不低于55百元月收入低于55百元合计赞成不赞成合计(2)若采用分层抽样法从月收入在[25,35)和[65,75]的被调查人中选取6人进行跟踪调查,并随机给其中3人发放奖励,求获得奖励的3人中至少有1人月收入在[65,75]的概率.参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K2≥k)0.0500.0100.001k 3.841 6.63510.828解析(1)2×2列联表如下:月收入不低于55百元月收入低于55百元合计赞成71118不赞成32932合计104050则K2=50×(7×29-3×11)210×40×32×18≈6.27<6.635,所以没有99%的把握认为“月收入以55百元为分界点”对延迟退休政策的态度有差异.(2)按照分层抽样的方法可知,月收入在[25,35)的抽取4人,记为a,b,c,d,月收入在[65,75]的抽取2人,记为A,B,则从6人中任取3人的所有情况为{A,B,a}、{A,B,b}、{A,B,c}、{A,B,d}、{A,a,b}、{A,a,c}、{A,a,d}、{A,b,c}、{A,b,d}、{A,c,d}、{B,a,b}、{B,a,c}、{B,a,d}、{B,b,c}、{B,b,d}、{B,c,d}、{a,b,c}、{a,b,d}、{a,c,d}、{b,c,d},共20种, 其中至少有1人月收入在[65,75]的情况有16种, 所以3人中至少有1人月收入在[65,75]的概率为1620=45.应用篇 知行合一应用 回归模型的应用1.(2020课标Ⅰ,5,5分探索创新情境)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i ,y i )(i=1,2,…,20)得到下面的散点图:由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( )A.y=a+bxB.y=a+bx 2C.y=a+be xD.y=a+bln x 答案 D2.(2022届宁夏顶级名校月考,20实际生活)“金山银山不如绿水青山;绿水青山就是金山银山.”复兴村借力“乡村振兴”国策,依托得天独厚的自然资源开展乡村旅游,乡村旅游事业蓬勃发展.复兴村旅游协会记录了近八年的游客人数,见下表.年份2013 年 2014 年 2015 年 2016 年 2017 年 2018 年 2019 年2020 年 年份代码x 1 2 345678 游客人数y (百人)4816 32 51 71 97122为了分析复兴村未来的游客人数变化趋势,公司总监分别用两种模型对变量y 和x 进行拟合,得到了相应的回归方程,绘制了残差图.残差图如下(注:残差e ^i =y i -y ^i ):模型①y ^=bx 2+a;模型②y ^=dx+c.(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由; (2)根据(1)中选定的模型求出相应的回归方程(系数均保留两位小数); (3)根据(2)中求出的回归方程来预测2021年的游客人数(结果保留整数). 其中,z=x2,z =18∑i=18z i .参考数据:∑i=18(x i -x )·(y i -y )=728∑i=18(x i -x )2=42∑i=18(z i -z )·(y i -y )=6 868∑i=18(z i -z )2=3 570∑i=18z i =204∑i=18y i =400附:回归直线的斜率和截距的最小二乘估计公式分别为b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2,a ^=y -b ^x .解析 (1)选择模型①.理由:根据残差图可以看出, 模型①的估计值和真实值相对比较接近;模型②的残差相对比较大,所以模型①的拟合效果相对较好.(2)由(1)可知y 关于x 的回归方程为y ^=bx 2+a.令z=x 2,则y ^=bz+a,由题中所给数据得b ^=6 8683 570≈1.92,又z =18∑i=18z i =2048=25.5,y =4008=50,所以a ^=50-1.92×25.5=1.04,所以y 关于x 的回归方程为y ^=1.92x 2+1.04. (3)将x=9代入回归方程,可得y ^=1.92×92+1.04≈157, 则2021年游客人数大约为157百人. 3.(2021哈尔滨三中一模,19实际生活)宁夏西海固地区,在1972年被联合国粮食开发署确定为最不适宜人类生存的地区之一.为改善这一地区人民生活的贫困状态,20世纪90年代,党中央和自治区政府决定开始吊庄移民,将西海固地区的人口成批地迁移到更加适合生活的地区.为了帮助移民人口尽快脱贫,党中央作出推进东西部对口协作的战略部署,其中确定福建对口帮扶宁夏,在福建人民的帮助下,原西海固人民实现了快速脱贫,下表是对2016年以来近5年某移民村庄100位移民的年人均收入的统计:年份 2016 2017 2018 2019 2020 年份代码x12 3 4 5 人均年收入y(千元) 1.32.85.78.913.8现要建立y 关于x 的回归方程,有两个不同回归模型可供选择,模型一y^(1)=b ^x+a ^;模型二y ^(2)=c ^x 2+d ^,即使画出y 关于x 的散点图,也无法确定哪个模型拟合效果更好,现用最小二乘法原理,已经求得模型一的方程为y ^=3.1x-2.8.(1)请你用最小二乘法原理,结合下面的参考数据及参考公式求出模型二的方程(计算结果保留到小数点后一位);(2)用计算残差平方和的方法比较哪个模型拟合效果更好(已经计算出模型一的残差平方和为∑i=15(y i -y ^i )2=3.7).参考数据:∑i=15t i y i -5ty ∑i=15t i2-5t 2≈0.52,其中t i =x i 2,i=1,2,3,4,5.参考公式:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u 的斜率和截距的最小二乘估计公式分别为β^=∑i=1nu i v i -nuv ∑i=1nu i 2-nu 2,α^=v -β^u .解析 (1)令t=x 2,则模型二可化为y 关于t 的线性回归问题, t =1+4+9+16+255=11,y =1.3+2.8+5.7+8.9+13.85=6.5, 则由参考数据可得c ^=∑i=15t i y i -5ty ∑i=15t i2-5t 2≈0.52≈0.5,d ^=y -c ^t =6.5-0.52×11≈0.8, 则模型二的方程为y ^(2)=0.5x 2+0.8. (2)由模型二的回归方程可得,y ^1(2)=0.5×1+0.8=1.3,y ^2(2)=0.5×4+0.8=2.8,y ^3(2)=0.5×9+0.8=5.3,y ^4(2)=0.5×16+0.8=8.8,y ^5(2)=0.5×25+0.8=13.3,∴∑i=15(y i -y ^i (2))2=02+02+0.42+0.12+0.52=0.42<3.7,故模型二的拟合效果更好.创新篇 守正出奇创新 统计与统计案例的综合应用。

高考数学专题复习十一-11.5变量间的相关关系、统计案例-高考真题练习(附答案)

高考数学专题复习十一-11.5变量间的相关关系、统计案例-高考真题练习(附答案)

11.5变量间的相关关系、统计案例考点一变量间的相关关系1.(2015湖北文,4,5分)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关答案C由y=-0.1x+1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而增大,减小而减小,所以z随x的增大而减小,x与z负相关,故选C.2.(2015课标Ⅰ,理19,文19,12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i和年销售量(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.yi表中==18∑J18.(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:(i)年宣传费x=49时,年销售量及年利润的预报值是多少?(ii)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为^=∑J1(-p(-p∑J1(-p 2,^=-^.解析(1)由散点图可以判断,y=c+d 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2分)(2)令w=,先建立y 关于w 的线性回归方程.由于^=∑J18(-p(-p ∑J18(-p2=108.81.6=68,^=-^=563-68×6.8=100.6,所以y 关于w 的线性回归方程为^=100.6+68w,因此y 关于x 的回归方程为^=100.6+68.(6分)(3)(i)由(2)知,当x=49时,年销售量y 的预报值^=100.6+6849=576.6,年利润z 的预报值^=576.6×0.2-49=66.32.(9分)(ii)根据(2)的结果知,年利润z 的预报值^=0.2(100.6+68)-x=-x+13.6+20.12.所以当=13.62=6.8,即x=46.24时,^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.(12分)3.(2015重庆文,17,13分)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20102011201220132014时间代号t 12345储蓄存款y(千亿元)567810(1)求y 关于t 的回归方程^=^t+^;(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.附:回归方程^=^t+^中,^=∑J1-nB∑J12-n2,^=-^.解析(1)列表计算如下:i t i y i t i2t i y i 11515226412337921448163255102550∑153655120这里n=5,=1∑J1t i =155=3,=1∑J1y i =365=7.2.又l tt =∑J12-n 2=55-5×32=10,l ty =∑J1t i y i -n=120-5×3×7.2=12,从而^=B B=1210=1.2,^=-^=7.2-1.2×3=3.6,故所求回归方程为^=1.2t+3.6.(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为^=1.2×6+3.6=10.8(千亿元).4.(2014课标Ⅱ理,19,12分)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2007200820092010201120122013年份代号t 1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y 关于t 的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:^=∑J1(-p(-p∑J1(-p 2,^=-^.解析(1)由所给数据计算得=17×(1+2+3+4+5+6+7)=4,=17×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑J17(t i -)2=9+4+1+0+1+4+9=28,∑J17(t i -)(y i -)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,^=∑J17(-p(-p ∑J17(-p2=1428=0.5,^=-^=4.3-0.5×4=2.3,所求回归方程为^=0.5t+2.3.(2)由(1)知,^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t=9代入(1)中的回归方程,得^=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.评析本题考查了回归直线方程的求解,注意回归直线恒过点(,)是关键,考查了回归系数^的几何意义.考查了学生的计算求解能力.5.(2016课标Ⅲ,18,12分)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附:参考数据:∑J17y i =9.32,∑J17t i y i J1=0.55,7≈2.646.参考公式:相关系数∑-p(-p回归方程^=^+^t 中斜率和截距的最小二乘估计公式分别为^=∑J1(-p(-p∑J1(-p 2,^=-^.解析(1)由折线图中数据和附注中参考数据得=4,∑J17(t i -)2(∑J17(t i -)(y i -)=∑J17t i y i -∑J17y i =40.17-4×9.32=2.89,r≈ 2.890.55×2×2.646≈0.99.(4分)因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(6分)(2)由=9.327≈1.331及(1)得^=∑J17(-p(-p ∑J17(-p2=2.8928≈0.10,^=-^=1.331-0.10×4≈0.93.所以,y 关于t 的回归方程为^=0.93+0.10t.(10分)将2016年对应的t=9代入回归方程得^=0.93+0.10×9=1.83.所以预测2016年我国生活垃圾无害化处理量约为1.83亿吨.(12分)6.(2017课标Ⅰ文,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得=116∑J116x i≈0.212,∑J116(t8.5)2≈18.439,∑J116(x i -)(i-8.5)=-2.78,其中x i 为抽取的第i 个零件的尺寸,i=1,2, (16)(1)求(x i ,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(-3s,+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ii)在(-3s,+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(x i ,y i )(i=1,2,…,n)的相关系数∑-p(-pJ1(0.008≈0.09.解析本题考查统计问题中的相关系数及样本数据的均值与方差.(1)由样本数据得(x i ,i)(i=1,2,…,16)的相关系数为∑-p(i-8.5)由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(i)由于=9.97,s≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(-3s,+3s)以外,因此需对当天的生产过程进行检查.(ii)剔除离群值,即第13个数据,剩下数据的平均数为115×(16×9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.∑J1162=16×0.2122+16×9.972≈1591.134,剔除第13个数据,剩下数据的样本方差为115×(1591.134-9.222-15×10.022)≈0.008,这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.方法总结样本的数字特征.(1)样本数据的相关系数r,∑-p(-p反映样本数据的相关程度,|r|越大,则相关性越强.(2)样本数据的均值反映样本数据的平均水平;样本数据的方差反映样本数据的稳定性,方差越小,数据越稳定;样本数据的标准差为方差的算术平方根.7.(2020课标Ⅱ理,18,12分)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑=201i x i =60,∑=201i y i =1200,∑=201i (x i -)2=80,∑=201i (y i -)2=9000,∑=201i (x i -)(y i -)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数=∑n−p(−p,2≈1.414.解析(1)由已知得样本平均数=120∑=201i y i =60,从而该地区这种野生动物数量的估计值为60×200=12000.(2)样本(x i ,y i )(i =1,2,…,20)的相关系数∑20−p(−p=.94.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.考点二独立性检验1.(2017课标Ⅱ文,19,12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50kg箱产量≥50kg 旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:P(K2≥k)0.0500.0100.001k 3.841 6.63510.828,K2=oB-B)2(rp(rp(rp(rp.解析本题考查了频率分布直方图及独立性检验.(1)旧养殖法的箱产量低于50kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表:箱产量<50kg箱产量≥50kg旧养殖法6238新养殖法3466K2=200×(62×66−34×38)2100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50kg到55kg之间,旧养殖法的箱产量平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.解后反思解独立性检验问题的关注点:(1)两个明确:①明确两类主体;②明确研究的两个问题.(2)两个关键:①准确画出2×2列联表;②准确求解K2.2.(2021全国甲理,17,12分)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:K 2=oB−B)2(rp(rp(rp(rp ,P (K 2≥k )0.0500.0100.001k3.8416.63510.828.解题指导:(1)根据表中数据分别计算甲、乙两台机床所生产的产品中一级品的数量,进而得出结论;(2)根据2×2列联表中的数据计算K 2,然后对照临界值表作出判断.解析(1)因为甲机床生产的200件产品中有150件一级品,所以甲机床生产的产品中一级品的频率为150200=34,因为乙机床生产的200件产品中有120件一级品,所以乙机床生产的产品中一级品的频率为120200=35.(2)根据2×2列联表中的数据,得K 2=oB−B)2(rp(rp(rp(rp =400×(150×80−120×50)2270×130×200×200=40039≈10.256,因为10.256>6.635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.方法总结解决独立性检验问题的一般步骤:3.(2020新高考Ⅰ,19,12分)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO 2浓度(单位:μg/m 3),得下表:SO 2PM2.5[0,50](50,150](150,475][0,35]32184(35,75]6812(75,115]3710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:SO2PM2.5[0,150](150,475][0,75](75,115](3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.附:K2=oB−B)2(rp(rp(rp(rp,P(K2≥k)0.0500.0100.001k3.8416.63510.828.答案解题思路:(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为64100=0.64.(4分) (2)根据抽查数据,可得2×2列联表:SO2PM2.5[0,150](150,475][0,75]6416(75,115]1010(8分) (3)根据(2)的列联表得K2=100×(64×10−16×10)280×20×74×26≈7.484.由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.(12分) 17.(2022全国甲文,17,12分,应用性)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A24020B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:K2=oB−B)2(rp(rp(rp(rp,P(K2≥k)0.1000.0500.010k2.7063.8416.635解析(1)由题意可得A公司长途客车准点的概率P1=240260=1213,B公司长途客车准点的概率P2=210240=78.(2)因为K2=500×(240×30−20×210)2450×50×240×260≈3.205>2.706,所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.。

高三数学第73练变量间的相关关系及统计案例练习

高三数学第73练变量间的相关关系及统计案例练习

高三数学第73练变量间的相关关系及统计案例练习
1.(2016·山西四校联考)已知x、y的取值如下表所示,从散点图分析,y与x线性相关,
且=0.8x+,则等于()
A.0.8
C.1.2 D.1.5
2.通过随机询问110名大学生是否爱好某项运动,得到列联表:
由K2=,得K2=≈
附表:
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
3.已知数组(x1,y1),(x1,y2),…,(x10,y10)满足线性回归方程=x+,则“(x0,y0)满足线性回归方程=x+”是“x0=,y0=”的()
A.充分不必要条件B.必要不充分条件
C.充要条件D.既不充分也不必要条件4.(2016·辽宁五校联考)某车间加工零件的数量x与加工时间y的统计数据如表:
,则据此回归模型可以预测,加工100个零件所需要的加工时间约为()
A.84分钟B.94分钟
C.102分钟D.112分钟
5.以下四个命题中:
①在回归分析中,可用相关指数R2的值判断拟合的效果,R2越大,模型的拟合效果越好;
②两个随机变量的线性相关性越强,相关系数的绝对值越接近1;
③若数据x1,x2,x3,...,xn的方差为1,则2x1,2x2,2x3, (2x)
的方差为2;
④对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y有关系”的把握程度越大.其中真命题的个数为()
A.1 B.2。

高考数学变量间的相关关系与统计案例专题卷

高考数学变量间的相关关系与统计案例专题卷

高考数学变量间的相关关系与统计案例专题卷一、单选题(共12题;共24分)1.已知变量 之间满足线性相关关系,且之间的相关数据如下表所示:则( )A.B.C.D.2.为了表示n 个点与相应直线在整体上的接近程度,我们常用( )表示 A.B.C.D.3.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为 =7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A. 身高一定是145.83 cm B. 身高在145.83 cm 以上 C. 身高在145.83 cm 以下 D. 身高在145.83 cm 左右4.某单位为了了解用电量y 度与气温x°C 之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程近似为,预测当气温为﹣4°C 时,用电量度数为( )A. 68B. 67C. 65D. 64 5.回归直线方程, 其中a=3,样本中心点为(1,2 )则回归直线方程为( )A. y=x+3B. y=-x+3C. y=-2x+3D. y=x-3 6.小明同学在做市场调查时得到如下样本数据1 3 6 10 8 4 2他由此得到回归直线的方程为 ,则下列说法正确的是( )①变量 与 线性负相关②当时可以估计③④变量 与 之间是函数关系A. ①B. ①②C. ①②③D. ①②③④ 7.某个商店为了研究气温对饮料销售的影响,得到了一个卖出饮料数与当天气温的统计表,根据下表可得回归直线方程中的 为6,则预测气温为时,销售饮料瓶数为( )A. 180B. 190C. 195D. 2008.研究变量,得到一组样本数据,进行回归分析,有以下结论①残差平方和越小的模型,拟合的效果越好;②用相关指数来刻画回归效果,越小说明拟合效果越好;③线性回归方程对应的直线至少经过其样本数据点中的一个点;④若变量和之间的相关系数为,则变量和之间的负相关很强.以上正确说法的个数是()A. B. C. D.9.利用独立性检验来考查两个分类变量和是否有关系时,通过查阅下表来确定断言“ 和有关系”的可信度.如果,那么就有把握认为“ 和有关系”的百分比为( )A. B. C. D.10.下列说法中错误的是()A. 先把高二年级的2000名学生编号为1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为,然后抽取编号为,,的学生,这样的抽样方法是系统抽样法;B. 独立性检验中,越大,则越有把握说两个变量有关;C. 若两个随机变量的线性相关性越强,则相关系数的值越接近于1;D. 若一组数据1、a、3的平均数是2,则该组数据的方差是.11.已知,的取值如下表所示:若与呈线性相关,且线性回归方程为,则()A. B. C. D.12.如图是一个列联表,则表中,的值分别为()总计35 457总计 73A. 10,38B. 17,45C. 10,45D. 17,38二、填空题(共5题;共5分)13.某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程= x+ ,其中=0.76,= - .据此估计,该社区一户年收入为15万元家庭的年支出为________.14.期末考试结束后,某老师随机抽取了本班五位同学的数学成绩进行统计,五位同学平均每天学习数学的时间(分钟)与数学成绩之间的一组数据如下表所示:时间(分钟) 30 40 70数学成绩35 48 82 92通过分析,发现数学成绩与学习数学的时间具有线性相关关系,其回归方程为,则表格中的的值是________.15.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归方程,现发现表中有一个数据看不清,请你推断出该数据的值为________.零件数(个)10 20加工时间 62 75 81 8916.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)你能在犯错误的概率不超过________的前提下认为“是否色弱与性别有关”?17.某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用列联表进行独立性检验,经计算,则至少有________的把握认为“学生性别与是否支持该活动有关系”.0.102.7063.841 6.635 7.879 10.828三、解答题(共5题;共35分)18.某大学高等数学这学期分别用两种不同的数学方式试验甲、乙两个大一新班(人数均为60人,入学数学平均分和优秀率都相同;勤奋程度和自觉性都一样).现随机抽取甲、乙两班各20名的高等数学期末考试成绩,得到茎叶图。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、选择题
1.(2016·遵义联考一)已知数列{a n }是公差为d 的等差数列,a 2=2,a 1·a 2·a 3=6,则d 等于( )
A .1
B .-1
C .±1
D .2
2.(2016·辽宁师大附中期中)在等差数列{a n }中,若a 4+a 6+a 8+a 10+a 12=120,则2a 10-a 12的值为( )
A .20
B .22
C .24
D .28
3.(2016·辽宁沈阳二中期中)已知S n 是等差数列{a n }的前n 项和,若a 7=9a 3,
则S 9
S 5
等于( ) A .9 B .5 C.
185 D.925
4.已知{a n }满足a 1=a 2=1,a n +2a n +1-a n +1
a n
=1,则a 6-a 5的值为( )
A .48
B .96
C .120
D .130
5.(2016·东营期中)设等差数列{a n }的前n 项和为S n ,若a 1=-11,
a 4+a 6=-6,则当S n 取最小值时,n 等于( ) A .6 B .7 C .8 D .9
6.(2017·邯郸月考)等差数列{a n }的前n 项和记为S n ,三个不同的点A ,B ,C 在直线l 上,点O 在直线l 外,且满足OA →=a 2OB →+(a 7+a 12)OC →,那么S 13
的值为
A.283
B.263
C.143
D.133
7.(2016·四川眉山中学期中改编)在等差数列{a n }中,a 1=-2 015,其前n 项和为S n ,若
S 1212-S 1010
=2,则S 2 017的值等于( )
A .2 016
B .-2 016
C .2 017
D .-2 017
8.(2016·云南玉溪一中月考)已知函数f (x )=⎩⎨

2x -1(x ≤0),f (x -1)+1(x >0),
把函数
g (x )=f (x )-x +1的零点按从小到大的顺序排列成一个数列,该数列的前n 项的和为S n ,则S 10等于( )
A .45
B .55
C .210-1
D .29-1
二、填空题
9.(2016·铁岭模拟)已知数列{a n }的前n 项和S n =n 2
-6n ,则{|a n |}的前n 项和
T n =________________.
10.(2016·安庆一模)设S n 是等差数列{a n }的前n 项和,若S 3S 6=13,则S 6
S 12=
________.
11.(2016·山东临沂一中期中)设f (x )=1
2x +2
,利用课本中推导等差数列前
n 项和公式的方法,可求得f (-5)+f (-4)+…+f (0)+…+f (5)+f (6)的值是________.
12.在圆x 2
+y 2
=5x 内,过点⎝ ⎛⎭
⎪⎫
52,32有n 条弦的长度成等差数列,最短弦长为数
列的首项a 1,最长弦长为a n ,若公差d ∈⎝ ⎛⎦
⎥⎤
16,13,那么n 的取值集合为________.
答案精析
1. C [因为{a n }是公差为d 的等差数列,由a 1·a 2·a 3=6,得(a 2-d )·a 2·(a 2
+d )=6,
则2(2-d )(2+d )=6,解得d =±1,故选C.]
2. C [由a 4+a 6+a 8+a 10+a 12=(a 4+a 12)+(a 6+a 10)+a 8=5a 8=120, 解得a 8=24,且a 8+a 12=2a 10,则2a 10-a 12=a 8=24.故选C.] 3.A [∵等差数列{a n }中,a 7=9a 3. ∴a 1+6d =9(a 1+2d ),∴a 1=-3
2d ,
∴S 9S 5=
9a 1+36d
5a 1+10d
=9,故选A.]
4.B [由a n +2a n +1-a n +1a n =1可知⎩⎪⎨⎪⎧⎭
⎪⎬⎪⎫a n +1a n 是等差数列,公差为1,首项为a 2a 1=1,∴a n +1
a n =n ,累乘得a n =(n -1)(n -2)×…×3×2×1(n ≥2),∴a 6-a 5=120-24=96.] 5.A [设该数列的公差为d ,则a 4+a 6=2a 1+8d =2×(-11)+8d =-6,解得
d =2,所以S n =-11n +n ?n -1?2
×2=n 2-12n =(n -6)2-36,所以当n =6时,
S n 取最小值.故选A.]
6.D [由三个不同的点A ,B ,C 在直线l 上,点O 在直线l 外,且满足OA →=a 2OB →+(a 7+a 12)OC →,得a 2+a 7+a 12=1.因为{a n }为等差数列,所以由等差中项公式,得3a 7=1,a 7=13,所以S 13=13a 7=13
3
.故选D.]
7.C [设等差数列前n 项和为S n =An 2
+Bn ,则S n
n =An +B ,∴⎩⎪⎨⎪⎧⎭
⎪⎬⎪⎫S n n 成等差数列.
∵S 11=a 1
1
=-2 015,
∴⎩⎪⎨⎪⎧⎭
⎪⎬⎪⎫S n n 是以-2 015为首项,以1为公差的等差数列.
∴S 2 017
2 017
=-2 015+2 016×1=1,
∴S 2 017=2 017.故选C.]
8.A [当x ≤0时,g (x )=f (x )-x +1=x ,故a 1=0; 当0<x ≤1时,有-1<x -1≤0,
则f (x )=f (x -1)+1=2(x -1)-1+1=2x -2,
g (x )=f (x )-x +1=x -1,故a 2=1; 当1<x ≤2时,有0<x -1≤1,
则f (x )=f (x -1)+1=2(x -1)-2+1=2x -3,
g (x )=f (x )-x +1=x -2,故a 3=2; 当2<x ≤3时,有1<x -1≤2,
则f (x )=f (x -1)+1=2(x -1)-3+1=2x -4,
g (x )=f (x )-x +1=x -3,故a 4=3,…,以此类推, 当n <x ≤n +1(其中n ∈N)时,则f (x )=2x -(n +2),
故数列的前n 项构成一个以0为首项,以1为公差的等差数列. 故S 10=10×(10-1)
2
=45,故选A.]
9.⎩⎨⎧
6n -n 2
,1≤n ≤3,n 2
-6n +18,n ≥4
解析 由S n =n 2-6n ,得{a n }是等差数列,且首项为-5,公差为2, ∴a n =-5+(n -1)×2=2n -7, ∴当n ≤3时,a n <0; 当n ≥4时,a n >0,
∴T n =⎩⎨⎧
6n -n 2
,1≤n ≤3,n 2
-6n +18,n ≥4.
10.310
解析 设S 3=m ,∵S 3S 6=1
3,
∴S 6=3m ,∴S 6-S 3=2m ,
由等差数列依次每k 项之和仍为等差数列,得S 3=m ,S 6-S 3=2m ,S 9-S 6=3m ,
S 12-S 9=4m ,∴S 6=3m ,S 12=10m ,∴S 6S 12=3
10
.
11.3 2 解析 ∵f (x )=
12x +2,∴f (x )+f (1-x )=12x +2+121-x
+2
=2
2, ∴由倒序相加求和法可知f (-5)+f (-4)+…+f (0)+…+f (5)+f (6)=3 2. 12.{4,5,6}
解析 由已知⎝
⎛⎭⎪⎫x -522+y 2
=254, 圆心为⎝ ⎛⎭
⎪⎫
52,0,半径为52,得
a 1=2×
⎝ ⎛⎭⎪⎫522-⎝ ⎛⎭
⎪⎫322
=2×2=4, a n =2×5
2
=5,
由a n =a 1+(n -1)d ⇔n =a n -a 1d +1=5-4d +1=1
d
+1, 又16<d ≤13, 所以4≤n <7,
则n 的取值集合为{4,5,6}.。

相关文档
最新文档