2013届高三人教A版理科数学一轮复习课时作业(55)变量的相关性与统计案例)
高三数学人教版A版数学(理)高考一轮复习教案变量间的相关关系、统计案例1
第四节 变量间的相关关系、统计案例变量间的相关关系、统计案例 1.变量间的相关关系(1)会作两个有关联变量的数据的散点图,会利用数点图认识变量间的相关关系. (2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 2.统计案例了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. (1)独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. (2)回归分析了解回归分析的基本思想、方法及其简单应用. 知识点一 回归分析 1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)回归方程为y ^=b ^x +a ^,其中b ^=∑ni =1x i y i -n x y∑ni =1x 2i -n x 2,a ^=y -b ^x . (3)通过求Q =∑ni =1(y i -bx i -a )2的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫作最小二乘法.(4)相关系数:当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.易误提醒1.易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(x ,y )点,可能所有的样本数据点都不在直线上 .3.利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值).[自测练习]1.已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ^,则a ^=( )x 0 1 3 4 y2.24.3 4.86.7A.3.25 B .2.6 C .2.2D .0解析:∵回归直线必过样本点的中心(x ,y ),又x =2,y =4.5,代入回归方程,得a ^=2.6.答案:B2.(2016·镇江模拟)如图所示,有A ,B ,C ,D ,E 5组(x ,y )数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.解析:由散点图知呈带状区域时有较强的线性相关关系,故去掉D . 答案:D知识点二 独立性检验 独立性检验假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+dK2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d)(其中n=a+b+c+d为样本容量).易误提醒(1)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释.[自测练习]3.下面是2×2列联表:y1y2总计x1 a 2173x2222547总计 b 46120则表中a,b的值分别为()A.94,72B.52,50C.52,74 D.74,52解析:∵a+21=73,∴a=52,又a+22=b,∴b=74.答案:C考点一相关关系的判断|1.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3解析:易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则r2<r4<0<r3<r1.答案:A2.(2015·高考湖北卷)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关解析:因为y=-0.1x+1,x的系数为负,故x与y负相关;而y与z正相关,故x与z 负相关.答案:C相关关系的判断的两种方法(1)散点图法.(2)相关系数法:利用相关系数判定,当|r|越趋近于1相关性越强.考点二回归分析|(2015·高考全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i和年销售量y i(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xyw∑8i =1(x i -x)2∑8i =1(w i -w)2∑8i =1(x i -x )(y i-y )∑8i =1(w i -w )(y i -y ) 46.6 563 6.8 289.8 1.6 1 469108.8表中w i =x i ,w =18∑i =1w i.(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑ni =1 (u i -u )(v i -v )∑ni =1(u i -u )2,α^=v -β^ u . [解] (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于 d ^=∑8i =1(w i -w )(y i -y )∑8i =1 (w i -w )2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值 y ^=100.6+6849=576.6, 年利润z 的预报值 z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12. 所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.回归直线方程的求法(1)利用公式,求出回归系数b ^,a ^.(2)待定系数法:利用回归直线过样本点中心求系数.1.(2016·银川一中模拟)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.x 3 4 5 6 y2.5344.5(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^. (2)已知该厂技改前,100吨甲产品的生产能耗为90吨标准煤,试根据(1)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)解:(1)由对照数据,计算得∑4i =1x 1y 1=66.5,∑4i =1x 21=32+42+52+62=86,x =4.5,y =3.5,b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35,所求的回归方程为y ^=0.7x +0.35.(2)x =100,y ^=100×0.7+0.35=70.35,预测生产100吨甲产品的生产能耗比技改前降低90-70.35=19.65(吨标准煤).考点三 独立性检验|(2016·邯郸模拟)为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表.平均每天喝500 mL 以上为常喝,体重超过50 kg 为肥胖.常喝 不常喝 合计 肥胖 2 不肥胖 18 合计30已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为415.(1)请将上面的列联表补充完整.(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由.(3)设常喝碳酸饮料且肥胖的学生中有2名女生,现从常喝碳酸饮料且肥胖的学生中抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:K 2≥k 0 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828参考公式:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .[解] (1)设常喝碳酸饮料肥胖的学生有x 人,x +230=415,解得x =6.常喝 不常喝 合计 肥胖 6 2 8 不肥胖 4 18 22 合计102030(2)由已知数据可求得K 2=30×(6×18-2×4)210×20×8×22≈8.523>7.879.因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.(3)设常喝碳酸饮料的肥胖男生为A ,B ,C ,D ,女生为E ,F ,任取两人的取法有AB ,AC ,AD ,AE ,AF ,BC ,BD ,BE ,BF ,CD ,CE ,CF ,DE ,DF ,EF ,共15种.其中一男一女的取法有AE ,AF ,BE ,BF ,CE ,CF ,DE ,DF ,共8种.故抽出一男一女的概率是P =815.解独立性检验的应用问题的关注点(1)两个明确: ①明确两类主体; ②明确研究的两个问题. (2)两个关键:①准确画出2×2列联表; ②准确理解K 2.提醒:准确计算K 2的值是正确判断的前提.2.通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:男 女 总计 走天桥 40 20 60 走斑马线 20 30 50 总计6050110K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .附表:P (K 2≥k 0)0.050 0.010 0.001 k 03.8416.63510.828A .有99%以上的把握认为“选择过马路的方式与性别有关”B .有99%以上的把握认为“选择过马路的方式与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关” 解析:K 2=110×(40×30-20×20)260×50×60×50≈7.8.P (K 2≥6.635)=0.01=1-99%,∴有99%以上的把握认为“选择过马路的方式与性别有关”,故选A.答案:A12.独立性检验与概率交汇综合问题的答题模板【典例】(12分)(2016·保定调研)某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:(1)判断是否有(2)用分层抽样的方法从喜欢统计课程的学生中抽取6名学生做进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率.下面的临界值表供参考:(参考公式:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d)[规范解答](1)由公式K2=55×(20×20-10×5)230×25×25×30≈11.978>7.879,(3分) 所以有99.5%的把握认为喜欢“应用统计”课程与性别有关.(6分)(2)设所抽样本中有m个男生,则630=m20,得m=4,所以样本中有4个男生,2个女生,分别记作B1,B2,B3,B4,G1,G2.从中任选2人的基本事件有(B1,B2),(B1,B3),(B1,B4),(B1,G1),(B1,G2),(B2,B3),(B2,B4),(B2,G1),(B2,G2),(B3,B4),(B3,G1),(B3,G2),(B4,G1),(B4,G2),(G1,G2),共15个,(9分)其中恰有1个男生和1个女生的事件有(B1,G1),(B1,G2),(B2,G1),(B2,G2),(B3,G1),(B3,G2),(B4,G1),(B4,G2),共8个.(11分)所以恰有1个男生和1个女生的概率为815.(12分)[模板形成]分析2×2列联表数据↓利用K 2公式计算K 2值↓对分类变量的相关性作出判断↓求相应事件的概率↓反思解题过程,注意规范化[跟踪练习] 某班主任对全班50名学生学习积极性和参加社团活动情况进行调查,统计数据见下表所示:(1)加社团活动且学习积极性一般的学生的概率是多少?(2)运用独立性检验的思想方法分析:学生的学习积极性与参加社团活动情况是否有关系?并说明理由.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d );其中n =a +b +c +d .解:(1)随机从该班抽查一名学生,抽到参加社团活动的学生的概率是2250=1125;抽到不参加社团活动且学习积极性一般的学生的概率是2050=25.(2)因为K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=50×(17×20-5×8)225×25×22×28≈11.688>10.828,所以大约有99.9%的把握认为学生的学习积极性与参加社团活动情况有关系.A 组 考点能力演练1.根据如下样本数据得到的回归方程为y ^=b ^x +a ^,则( )A.a ^>0,b ^>0 B.a >0,b <0 C.a ^<0,b ^>0D.a ^<0,b ^<0解析:把样本数据中的x ,y 分别当作点的横、纵坐标,在平面直角坐标系xOy 中作出散点图(图略),由图可知b ^<0,a ^>0.故选B.答案:B2.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5D.y^=-0.3x +4.4解析:依题意知,相应的回归直线的斜率应为正,排除C ,D.且直线必过点(3,3.5),代入A ,B 得A 正确.答案:A3.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附表及公式K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .则下面的正确结论是( )A .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”解析:由2×2列联表得到a =45,b =10,c =30,d =15,则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100,计算得K 2的观测值k 0=100×(675-300)255×45×75×25≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选A.答案:A4.根据如下样本数据:得到的回归方程为y =b x +a .若样本点的中心为(5,0.9),则当x 每增加1个单位时,y 就( )A .增加1.4个单位B .减少1.4个单位C .增加7.9个单位D .减少7.9个单位解析:依题意得,a +b -25=0.9,故a ^+b ^=6.5①;又样本点的中心为(5,0.9),故0.9=5b ^+a ^②,联立①②,解得b ^=-1.4,a ^=7.9,则y ^=-1.4x +7.9,可知当x 每增加1个单位时,y 就减少1.4个单位,故选B.答案:B5.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b ^=∑6i =1x i y i -6x ·y ∑6i =1x 2i -6x2=58-6×72×13691-6×⎝⎛⎭⎫722=57,a ^=y -b ^x =136-57×72=-13,所以b ^<b ′,a ^>a ′.答案:C6.(2016·忻州联考)已知x ,y 的取值如下表:从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a ^的值为________. 解析:x =2+3+4+54=3.5,y =2.2+3.8+5.5+6.54=4.5,回归方程必过样本的中心点(x ,y ).把(3.5,4.5)代入回归方程,计算得a ^=-0.61.答案:-0.617.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:(请用百分数表示).解析:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=50×(20×15-5×10)225×25×30×20≈8.333>7.879.答案:0.5%8.已知下表所示数据的回归直线方程为y ^=4x +242,则实数a =________.解析:回归直线y ^=4x +242必过样本点的中心点(x ,y ),而x =2+3+4+5+65=4,y =251+254+257+a +2665=1 028+a 5,∴1 028+a 5=4×4+242,解得a =262.答案:2629.(2015·东北三校联考)某学生对其亲属30人的饮食习惯进行了一次调查,并用下图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据以上数据完成下列2×2列联表:主食蔬菜主食肉类合计 50岁以下 50岁以上 合计(2)能否有99% 解:(1)2×2列联表如下:主食蔬菜主食肉类合计 50岁以下 4 8 12 50岁以上 16 2 18 合计201030(2)因为K 2=30×(8-128)212×18×20×10=10>6.635,所以有99%的把握认为其亲属的饮食习惯与年龄有关.10.(2015·高考重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t12345(1)求y 关于t 的回归方程y =b t +a ;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 附:回归方程y ^=b ^t +a ^中, b ^=∑ni =1t i y i -n t y ∑ni =1t 2i -n t2,a ^=y -b ^t .解:(1)列表计算如下这里n =5,t =1n ∑n i =1t i =155=3,y =1n ∑n i =1y i =365=7.2. 又l tt =∑ni =1t 2i -n t2=55-5×32=10,l ty =∑ni =1t i y i-n t y =120-5×3×7.2=12,从而b ^=l ty l tt =1210=1.2,a ^=y -b ^t =7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).B 组 高考题型专练1.(2015·高考福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C.12.0万元D.12.2万元^=0.76,∴a^=8-0.76×10=0.4,∴回归方程为y^=0.76x 解析:∵x=10.0,y=8.0,b+0.4,把x=15代入上式得,y^=0.76×15+0.4=11.8(万元),故选B.答案:B2.(2015·高考北京卷)高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.解析:(1)由题图分析乙的语文成绩名次略比甲的语文成绩名次靠前,但总成绩名次靠后,所以甲、乙两人中语文成绩名次比总成绩靠前的是乙;(2)丙同学的数学成绩名次位于中间稍微靠后,而总成绩名次相对靠后,所以丙同学的语文成绩名次比较靠后,所以丙同学的成绩名次靠前的科目是数学.答案:乙数学。
2024年高考指导数学(人教A版理科第一轮复习)目录
课时规范练(A)课时规范练1集合的概念与运算课时规范练3命题及其关系、充要条件课时规范练5函数及其表示课时规范练7函数的奇偶性与周期性课时规范练9指数与指数函数课时规范练11函数的图象课时规范练13函数模型及其应用课时规范练15利用导数研究函数的单调性课时规范练17定积分与微积分基本定理课时规范练19同角三角函数基本关系式及诱导公式课时规范练21简单的三角恒等变换课时规范练23函数y=A sin(ωx+φ)的图象及三角函数的应用课时规范练25平面向量的概念及线性运算课时规范练27平面向量的数量积及其应用课时规范练29数列的概念课时规范练31等比数列课时规范练33二元一次不等式(组)与简单的线性规划问题课时规范练35合情推理与演绎推理课时规范练37数学归纳法课时规范练39空间几何体的表面积与体积课时规范练41空间直线、平面的平行关系课时规范练43空间向量及其运算课时规范练45直线的倾斜角、斜率与直线的方程课时规范练47圆的方程课时规范练49椭圆课时规范练51抛物线课时规范练53算法初步课时规范练55用样本估计总体课时规范练57分类加法计数原理与分步乘法计数原理课时规范练59二项式定理课时规范练61古典概型与几何概型课时规范练63二项分布与正态分布课时规范练65极坐标方程与参数方程课时规范练67绝对值不等式课时规范练(B)课时规范练2简单不等式的解法课时规范练4简单的逻辑联结词、全称量词与存在量词课时规范练6函数的单调性与最大(小)值课时规范练8幂函数与二次函数课时规范练10对数与对数函数课时规范练12函数与方程课时规范练14导数的概念及运算课时规范练16利用导数研究函数的极值、最大(小)值课时规范练18任意角、弧度制及任意角的三角函数课时规范练20两角和与差的正弦、余弦与正切公式及二倍角公式课时规范练22三角函数的图象与性质课时规范练24余弦定理、正弦定理及应用举例课时规范练26平面向量基本定理及向量坐标运算课时规范练28复数课时规范练30等差数列课时规范练32数列求和课时规范练34基本不等式及其应用课时规范练36直接证明与间接证明课时规范练38空间几何体的结构及其三视图、直观图课时规范练40空间点、直线、平面之间的位置关系课时规范练42空间直线、平面的垂直关系课时规范练44空间几何中的向量方法课时规范练46点与直线、两条直线的位置关系课时规范练48直线与圆、圆与圆的位置关系课时规范练50双曲线课时规范练52直线与圆锥曲线的位置关系课时规范练54随机抽样课时规范练56变量间的相关关系、统计案例课时规范练58排列与组合课时规范练60随机事件的概率课时规范练62离散型随机变量及其分布列课时规范练64离散型随机变量的均值与方差课时规范练66极坐标方程与参数方程的应用课时规范练68不等式的证明解答题专项解答题专项一函数与导数的综合问题第1课时利用导数证明不等式第2课时利用导数研究不等式恒(能)成立问题第3课时利用导数研究函数的零点解答题专项二三角函数与解三角形解答题专项三数列解答题专项四立体几何中的综合问题解答题专项五直线与圆锥曲线第1课时圆锥曲线中的最值(或范围)问题第2课时圆锥曲线中的定点(或定值)问题第3课时圆锥曲线中的存在性(或证明)问题解答题专项六概率与统计单元质检卷单元质检卷一集合与常用逻辑用语单元质检卷二函数单元质检卷三导数及其应用单元质检卷四三角函数、解三角形单元质检卷五平面向量、数系的扩充与复数的引入单元质检卷六数列单元质检卷七不等式、推理与证明单元质检卷八立体几何单元质检卷九解析几何单元质检卷十算法初步、统计与统计案例单元质检卷十一计数原理单元质检卷十二概率。
高考一轮复习课时作业(人教版):10-3变量间的相关关系与统计案例word版含答案
10-3变量间的相关关系与统计案例A级基础达标演练(时间:40分钟满分:60分)一、选择题(每小题5分,共25分)1.下列两个变量之间的关系是相关关系的是().A.正方体的棱长与体积B.单位面积的产量为常数时,土地面积与总产量C.日照时间与水稻的亩产量D.电压一定时,电流与电阻解析A、B、D中两个变量间的关系都是确定的,所以是函数关系;C中的两个变量间是相关关系,对于日照时间一定的水稻,仍可以有不同的亩产量,故选C.答案 C2.(2012·石家庄调研)下列结论正确的是().①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①②B.①②③C.①②④D.①②③④解析由回归分析的方法及概念判断.答案 C3.(2011·莱芜二模)在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是().A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有解析统计的结果只是说明事件发生可能性的大小,具体到一个个体不一定发生.答案 D4.(2011·陕西)设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是().A.直线l过点(x,y)B.x和y的相关系数为直线l的斜率C.x和y的相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同解析由样本的中心(x,y)落在回归直线上可知A正确;x和y的相关系数表示为x与y之间的线性相关程度,不表示直线l的斜率,故B错;x和y的相关系数应在-1到1之间,故C错;分布在回归直线两侧的样本点的个数并不绝对平均,即无论样本点个数是奇数还是偶数,故D错.答案 A5.(2011·山东)某产品的广告费用x与销售额y的统计数据如下表:根据上表可得回归方程y=b x+a中的b为9.4,据此模型预报广告费用为6万元时销售额为().A.63.6万元 B.65.5万元C.67.7万元 D.72.0万元解析x=4+2+3+54=3.5(万元),y=49+26+39+544=42(万元),∴a^=y -b ^x =42-9.4×3.5=9.1, ∴回归方程为y ^=9.4x +9.1,∴当x =6(万元)时,y ^=9.4×6+9.1=65.5(万元). 答案 B二、填空题(每小题4分,共12分) 6.已知x 、y 的取值如下表:从所得的散点图分析,y 与x 线性相关,且y =0.95x +a ,则a =________. 解析 因为回归方程必过样本点的中心(x ,y ),解得x =2,y =4.5,将(2,4.5)代入y ^=0.95x +a 可得a =2.6. 答案 2.67.某高校“初步统计”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:K 2=50×(13×20-10×7)223×27×20×30≈4.844,因为K 2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________. 答案 5%8.(2011·辽宁)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析 由题意,知其回归系数为0.254,故家庭年收入每增加1万元,年饮食支出平均增加0.254万元.答案0.254三、解答题(共23分)9.(11分)(2012·天津模拟)在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:解以x轴表示身高,y轴表示体重,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为正相关.10.(12分)某种产品的广告费支出x与消费额y(单位:百万元)之间有如下对应数据:(1)画出散点图;(2)求线性回归方程;(3)预测当广告费支出为700万元时的销售额.解(1)散点图如图所示.(3)当x =7(百万元)时,y =6.5×7+17.5=63(百万元). ∴当广告费支出7百万元时,销售额约为63百万元.B 级(时间:30分钟 满分:40分)一、选择题(每小题5分,共10分)1.(2011·合肥二检)已知数组(x 1,y 1),(x 2,y 2),…,(x 10,y 10)满足线性回归方程y ^=bx +a ,则“(x 0,y 0)满足线性回归方程y ^=bx +a ”是“x 0=x 1+x 2+…+x 1010,y 0=y 1+y 2+…+y 1010”的( ).A .充分不必要条件B .必要不充分条件C .充要条件D .既不充分也不必要条件解析 x 0,y 0为这10组数据的平均值,又因为线性回归方程y ^=bx +a 必过样本中心(x ,y ),因此(x ,y )一定满足线性回归方程,但满足线性回归方程的除了(x ,y )外,可能还有其他样本点. 答案 B2.在第29届奥运会上,中国健儿取得了51金、21银、28铜的好成绩,稳居世界金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见.有网友为此进行了调查,在参加调查的2 548名男性公民中有1 560名持反对意见,2 452名女性公民中有1 200人持反对意见,在运用这些数据说明中国的奖牌数是否与中国进入体育强国有无关系时,用什么方法最有说服力( ).A .平均数与方差B .回归直线方程C .独立性检验D .概率解析 由于参加讨论的公民按性别被分成了两组,而且每一组又被分成了两种情况:认为有关与无关,故该资料取自完全随机统计,符合2×2列联表的要求,故用独立性检验最有说服力. 答案 C二、填空题(每小题4分,共8分)3.(2011·东北四校联考(二))某小卖部为了了解热茶销售量y (杯)与气温x (℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:由表中数据算得线性回归方程y =bx +a 中的b ≈-2,预测当气温为-5 ℃时,热茶销售量为________杯(已知回归系数解析 根据表格中的数据可求得x =14×(18+13+10-1)=10,y =14×(24+34+38+64)=40(杯).∴a =y -b x =40-(-2)×10=60, ∴y ^=-2x +60,当x =-5时, y ^=-2×(-5)+60=70(杯). 答案 704.(2012·石家庄模拟)某医疗研究所为了了解某种血清预防感冒的作用,把500名使用过血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2≈3.918,经查临界值表知P (K 2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.解析因为K2≈3.918≥3.841,而P(K2≥3.814)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.答案①三、解答题(共22分)5.(10分)(2012·佛山模拟)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表.已知从全部105人中随机抽取1人为优秀的概率为2 7.(1)请完成上面的列联表;(2)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”;(3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到6号或10号的概率.附K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),解(1)(2)k =105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”.(3)设“抽到6号或10号”为事件A ,先后两次抛掷一枚均匀的骰子,出现的点数为(x ,y ),则所有的基本事件有(1,1)、(1,2)、(1,3)、…、(6,6),共36个. 事件A 包含的基本事件有(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个,∴P (A )=836=29.6.(12分)(2010·辽宁)为了比较注射A ,B 两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B.表1和表2分别是注射药物A 和药物B 后的试验结果(疱疹面积单位:mm 2).表1:注射药物A 后皮肤疱疹面积的频数分布表表2注射药物A 后皮肤疱疹面积的频率分布直方图注射药物B 后皮肤疱疹面积的频率分布直方图(2)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”. 表3:解 (1)注射药物A 后皮肤疱疹面积的频率分布直方图注射药物B 后皮肤疱疹面积的频率分布直方图可以看出注射药物A 后的疱疹面积的中位数在65至70之间,而注射药物B 后的疱疹面积的中位数在70至75之间,所以注射药物A 后疱疹面积的中位数小于注射药物B 后疱疹面积的中位数. (2)表3:K 2=200100×100×105×95≈24.56.由于K 2>6.635,所以有99%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.。
[精品]新人教版A版高考数学理科一轮复习10.4 变量间的相关关系、统计案例优质课教案
第四节变量间的相关关系、统计案例变量间的相关关系、统计案例1.变量间的相关关系(1)会作两个有关联变量的数据的散点图,会利用数点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.2.统计案例了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.(2)回归分析了解回归分析的基本思想、方法及其简单应用.知识点一回归分析1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)回归方程为y^=b^x+a^,其中b^=∑ni=1x i y i-n x y∑ni=1x2i-n x2,a^=y-b^x.(3)通过求Q=∑ni=1(y i-bx i-a)2的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫作最小二乘法.(4)相关系数:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性. 易误提醒1.易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(x,y)点,可能所有的样本数据点都不在直线上 .3.利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值).[自测练习]1.已知x,y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为y^=0.95x+a^,则a^=( )A.3.25C.2.2 D.0解析:∵回归直线必过样本点的中心(x,y),又x=2,y=4.5,代入回归方程,得a^=2.6.答案:B2.(2016·镇江模拟)如图所示,有A,B,C,D,E 5组(x,y)数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.解析:由散点图知呈带状区域时有较强的线性相关关系,故去掉D.答案:D知识点二独立性检验独立性检验假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:K2=(其中n=a+b+c+d a+b a+c b+d c+d为样本容量).易误提醒(1)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释.[自测练习]3.下面是2×2列联表:则表中a,bA.94,72 B.52,50C.52,74 D.74,52解析:∵a+21=73,∴a=52,又a+22=b,∴b=74.答案:C考点一相关关系的判断|1.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3解析:易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则r2<r4<0<r3<r1.答案:A2.(2015·高考湖北卷)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( )A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关解析:因为y=-0.1x+1,x的系数为负,故x与y负相关;而y与z正相关,故x与z负相关.答案:C相关关系的判断的两种方法(1)散点图法.(2)相关系数法:利用相关系数判定,当|r |越趋近于1相关性越强.考点二 回归分析|(2015·高考全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.x y w∑8i =1(x i -x )2∑8i =1(w i -w )2∑8i =1(x i -x )(y i -y )∑8i =1(w i -w )(y i -y )46.6563 6.8 289.8 1.6 1 469108.8表中w i =x i ,w =8∑8i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为β^=∑ni=1u i-u v i-v∑ni=1u i-u 2,α^=v-β^u.[解] (1)由散点图可以判断,y=c+d x适宜作为年销售量y 关于年宣传费x的回归方程类型.(2)令w=x,先建立y关于w的线性回归方程.由于d^=∑8i=1w i-w y i-y∑8 i=1 w i-w 2=108.81.6=68,c^=y-d^w=563-68×6.8=100.6,所以y关于w的线性回归方程为y^=100.6+68w,因此y关于x 的回归方程为y^=100.6+68x.(3)①由(2)知,当x=49时,年销售量y的预报值y^=100.6+6849=576.6,年利润z的预报值z^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z的预报值z^=0.2(100.6+68x)-x=-x+13.6x+20.12.所以当x=13.62=6.8,即x=46.24时,z^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.回归直线方程的求法(1)利用公式,求出回归系数b^,a^.(2)待定系数法:利用回归直线过样本点中心求系数.1.(2016·银川一中模拟)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x 345 6y 2.534 4.5(1)y关于x的线性回归方程y^=b^x+a^.(2)已知该厂技改前,100吨甲产品的生产能耗为90吨标准煤,试根据(1)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)解:(1)由对照数据,计算得∑4i=1x1y1=66.5,∑4i=1x21=32+42+52+62=86,x=4.5,y=3.5,b^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a^=y-b^x=3.5-0.7×4.5=0.35,所求的回归方程为y^=0.7x+0.35.(2)x=100,y^=100×0.7+0.35=70.35,预测生产100吨甲产品的生产能耗比技改前降低90-70.35=19.65(吨标准煤).考点三独立性检验|(2016·邯郸模拟)为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表.平均每天喝500 mL以上为常喝,体重超过50 kg为肥胖.已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为4 15 .(1)请将上面的列联表补充完整.(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由.(3)设常喝碳酸饮料且肥胖的学生中有2名女生,现从常喝碳酸饮料且肥胖的学生中抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:505k02.0722.7063.8415.0246.6357.87910.828参考公式:K2=a+b c+d a+c b+d,其中n=a +b+c+d.[解] (1)设常喝碳酸饮料肥胖的学生有x人,x+230=415,解得x=6.常喝不常喝合计肥胖628不肥胖41822合计102030(2)由已知数据可求得K2=210×20×8×22≈8.523>7.879.因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.(3)设常喝碳酸饮料的肥胖男生为A,B,C,D,女生为E,F,任取两人的取法有AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF,共15种.其中一男一女的取法有AE,AF,BE,BF,CE,CF,DE,DF,共8种.故抽出一男一女的概率是P=815.解独立性检验的应用问题的关注点(1)两个明确:①明确两类主体;②明确研究的两个问题.(2)两个关键:①准确画出2×2列联表;②准确理解K2.提醒:准确计算K2的值是正确判断的前提.2.通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:男女总计走天桥402060走斑马线203050总计6050110K2=a+b c+d a+c b+d,n=a+b+c+d.附表:P(K2≥k0)0.050.010.001k03.8416.63510.828A.有99%以上的把握认为‚选择过马路的方式与性别有关‛B.有99%以上的把握认为‚选择过马路的方式与性别无关‛C.在犯错误的概率不超过0.1%的前提下,认为‚选择过马路的方式与性别有关‛D .在犯错误的概率不超过0.1%的前提下,认为‚选择过马路的方式与性别无关‛解析:K 2=110× 40×30-20×20260×50×60×50≈7.8.P (K 2≥6.635)=0.01=1-99%,∴有99%以上的把握认为‚选择过马路的方式与性别有关‛,故选A.答案:A12.独立性检验与概率交汇综合问题的答题模板【典例】 (12分)(2016·保定调研)某高校为调查学生喜欢‚应用统计‛课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:(1)有关?(2)用分层抽样的方法从喜欢统计课程的学生中抽取6名学生做进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率.下面的临界值表供参考:(参考公式:K 2= a +b c +d a +c b +d,其中n=a +b +c +d )[规范解答] (1)由公式K 2=55× 20×20-10×5230×25×25×30≈11.978>7.879,(3分)所以有99.5%的把握认为喜欢‚应用统计‛课程与性别有关.(6分)(2)设所抽样本中有m 个男生,则630=m20,得m =4,所以样本中有4个男生,2个女生,分别记作B 1,B 2,B 3,B 4,G 1,G 2.从中任选2人的基本事件有(B 1,B 2),(B 1,B 3),(B 1,B 4),(B 1,G 1),(B 1,G 2),(B 2,B 3),(B 2,B 4),(B 2,G 1),(B 2,G 2),(B 3,B 4),(B 3,G 1),(B 3,G 2),(B 4,G 1),(B 4,G 2),(G 1,G 2),共15个,(9分)其中恰有1个男生和1个女生的事件有(B 1,G 1),(B 1,G 2),(B 2,G 1),(B 2,G 2),(B 3,G 1),(B 3,G 2),(B 4,G 1),(B 4,G 2),共8个.(11分)所以恰有1个男生和1个女生的概率为815.(12分)[模板形成]分析2×2列联表数据↓利用K2公式计算K2值↓对分类变量的相关性作出判断↓求相应事件的概率↓反思解题过程,注意规范化[跟踪练习] 某班主任对全班50名学生学习积极性和参加社团活动情况进行调查,统计数据见下表所示:(1)概率是多少?抽到不参加社团活动且学习积极性一般的学生的概率是多少?(2)运用独立性检验的思想方法分析:学生的学习积极性与参加社团活动情况是否有关系?并说明理由.附:K2=n ad-bc 2a+b c+d a+c b+d;其中n=a+b+c+d.解:(1)概率是2250=1125;抽到不参加社团活动且学习积极性一般的学生的概率是2050=25.(2)因为K2=n ad -bc 2a +bc +d a +c b +d=50× 17×20-5×8 225×25×22×28≈11.688>10.828,所以大约有99.9%的把握认为学生的学习积极性与参加社团活动情况有关系.A 组 考点能力演练1.根据如下样本数据得到的回归方程为y ^=b ^x +a ^,则( )A.a ^>0,b >0B.a >0,b <0C.a ^<0,b ^>0D.a ^<0,b ^<0解析:把样本数据中的x ,y 分别当作点的横、纵坐标,在平面直角坐标系xOy 中作出散点图(图略),由图可知b ^<0,a ^>0.故选B.答案:B2.已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得的线性回归方程可能为( )A.y^=0.4x+2.3B.y^=2x-2.4C.y^=-2x+9.5D.y^=-0.3x+4.4解析:依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5),代入A,B得A正确.答案:A3.春节期间,‚厉行节约,反对浪费‛之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到‚光盘‛行动,得到如下的列联表:附表及公式K2=,其中n=a+b+c+d.a+b c+d a+c b+d则下面的正确结论是( )A.有90%以上的把握认为‚该市居民能否做到‘光盘’与性别有关‛B.在犯错误的概率不超过1%的前提下,认为‚该市居民能否做到‘光盘’与性别无关‛C.在犯错误的概率不超过1%的前提下,认为‚该市居民能否做到‘光盘’与性别有关‛D.有90%以上的把握认为‚该市居民能否做到‘光盘’与性别无关‛解析:由2×2列联表得到a=45,b=10,c=30,d=15,则a +b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得K2的观测值k0=100× 675-300 255×45×75×25≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为‚该市居民能否做到‘光盘’与性别有关‛,故选A.答案:A4.根据如下样本数据:得到的回归方程为y=b x+a.若样本点的中心为(5,0.9),则当x每增加1个单位时,y就( )A.增加1.4个单位B.减少1.4个单位C.增加7.9个单位D.减少7.9个单位解析:依题意得,a+b-25=0.9,故a^+b^=6.5①;又样本点的中心为(5,0.9),故0.9=5b^+a^②,联立①②,解得b^=-1.4,a^=7.9,则y^=-1.4x+7.9,可知当x每增加1个单位时,y就减少1.4个单位,故选B.答案:B5.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y =b ^x +a ^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b ^=∑6i =1x i y i -6x ·y ∑6i =1x 2i -6x 2=58-6×72×13691-6×⎝ ⎛⎭⎪⎫722=57,a ^=y -b ^x =136-57×72=-13,所以b ^<b ′,a ^>a ′. 答案:C6.(2016·忻州联考)已知x ,y 的取值如下表:从散点图分析,y 与x 线性相关,且回归方程为y ^=1.46x +a ^,则实数a ^的值为________.解析:x =2+3+4+54=3.5,y =2.2+3.8+5.5+6.54=4.5,回归方程必过样本的中心点(x ,y ).把(3.5,4.5)代入回归方程,计算得a ^=-0.61.答案:-0.617.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:性别有关(请用百分数表示).解析:K 2= a +b c +da +cb +d=50× 20×15-5×10 225×25×30×20≈8.333>7.879.答案:0.5%8.已知下表所示数据的回归直线方程为y ^=4x +242,则实数a =________.解析:回归直线y ^=4x +242必过样本点的中心点(x ,y ),而x =2+3+4+5+65=4,y =251+254+257+a +2665=1 028+a5,∴1 028+a5=4×4+242,解得a =262. 答案:2629.(2015·东北三校联考)某学生对其亲属30人的饮食习惯进行了一次调查,并用下图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据以上数据完成下列2×2列联表:(2)出简要分析.解:(1)2×2列联表如下:(2)因为K 2=12×18×20×10=10>6.635,所以有99%的把握认为其亲属的饮食习惯与年龄有关. 10.(2015·高考重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:(1)求y 关于t 的回归方程y =b t +a ;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款.附:回归方程y ^=b ^t +a ^中, b ^=∑ni =1t i y i -n t y ∑n i =1t 2i -n t 2,a ^=y -b ^t .解:(1)列表计算如下这里n =5,t =1n ∑n i =1t i =155=3,y =1n ∑n i =1y i=365=7.2. 又l tt =∑ni =1t 2i -n t 2=55-5×32=10,l ty =∑ni =1t i y i -n t y =120-5×3×7.2=12,从而b ^=l ty l tt =1210=1.2,a ^=y -b ^t =7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).B 组 高考题型专练1.(2015·高考福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b ^x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元解析:∵x=10.0,y=8.0,b^=0.76,∴a^=8-0.76×10=0.4,∴回归方程为y^=0.76x+0.4,把x=15代入上式得,y^=0.76×15+0.4=11.8(万元),故选B.答案:B2.(2015·高考北京卷)高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.解析:(1)由题图分析乙的语文成绩名次略比甲的语文成绩名次靠前,但总成绩名次靠后,所以甲、乙两人中语文成绩名次比总成绩靠前的是乙;(2)丙同学的数学成绩名次位于中间稍微靠后,而总成绩名次相对靠后,所以丙同学的语文成绩名次比较靠后,所以丙同学的成绩名次靠前的科目是数学.答案:乙数学。
2013届高三人教A版理科数学一轮复习课时作业(55)变量的相关性与统计案例)
课时作业(五十五)[第55讲变量的相关性与统计案例][时间:45分钟分值:100分]基础热身1. [2011广东六校联考]有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和身体健康情况;④圆的半径与面积;⑤汽车的重量和每千米耗油量.其中两个变量成正相关的是()A .①③B .②④ C.②⑤ D .④⑤2. [2011丰台二模]已知x, y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为y = 0.95x+ a,贝U a=()A. 3.25B. 2.6C. 2.2D. 03. [2011大连双基检测]为了考察两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为11和12.已知在两人的试验中发现变量x的观测数据的平均值恰好都为s,变量y的观测数据的平均值恰好都为t,那么下列说法中正确的是()A •直线11, 12有公共点(s, t)B .直线11, 12相交,但是公共点未必是(s, t)C.由于斜率相等,所以直线11, 12必定平行D .直线11, 12必定重合4. [2011新余二模]为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2X 2列联表:则至少有_________的把握认为喜爱打篮球与性别有关. (请用百分数表示)附: K2=nad上2—(a+5.观察下列散点图,则①正相关;②负相关;③不相关,它们的排列顺序与图形相对应的是()o 1 o t 6a b图K55 — 1A . a —①,b—②,c—③B. a —②,b—③,c—①C. a —②,b—①,c—③D. a—①,b—③,c—②6. 对于给定的两个变量的统计数据,下列说法正确的是A .都可以分析出两个变量的关系B .都可以用一条直线近似地表示两者的关系C.都可以作出散点图D .都可以用确定的表达式表示两者的关系7. [2011江西卷]为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下则y对x的线性回归方程为()A . y= x—1 B. y= x+ 11C. y = 88+ 2x D . y = 176&在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A .若K2的观测值为k= 6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病C. 若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D. 以上三种说法都不正确9. [2011枣庄二模]某单位为了了解用电量y(kWh)与气温x(C )之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表.由表中数据得线性回归方程y =—2x+ a, 预测当气温为一4C时,用电量约为()A.68 kW h B . 67 kW hC. 66 kW hD. 65 kW h10. [2010广东卷]市居民2005〜2009年家庭年平均收入x(单位:万元)与年平均支出y (单位:万元)有________ 线性相关关系.11.2011辽宁卷]调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y = 0.254x+ 0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_________万元.12. [2011九江六校三联]假设关于某设备的使用年限x和所支出的维修费用y(万元), 有如下的统计资料:若由资料可知y对x呈线性相关关系,且线性回归方程为y= a+ bx,其中已知b= 1.23,请估计使用年限为20年时,维修费用约为.13. 某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H o:“这种血清不能起到预防感冒的作用”,利用 2 X 2列联表计算得K2~ 3.918,经查临界值表知P(K2> 3.841)疋0.05.则下列结论中,正确结论的序号是__________ .①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95% ;④这种血清预防感冒的有效率为5%.14. (10分)某种产品的广告费用支出x万元与销售额y万元之间有如下的对应数据:X24568y2030505070(1) 画出上表数据的散点图;(2) 根据上表提供的数据,求出y关于x的线性回归方程;⑶据此估计广告费用为10万元时,所得的销售收入.5 5(参考数值:X'x2= 145, l:Xi y i= 1270)i= 1 i = 115. (13分)[2011巢湖质检]地震、海啸、洪水、森林大火等自然灾害频繁出现,紧急避险常识越来越引起人们的重视. 某校为了了解学生对紧急避险常识的了解情况,从七年级和八年级各选取100名同学进行紧急避险常识知识竞赛•图K55 —2(1)和图K55 —2(2)分别是对七年级和八年级参加竞赛的学生成绩按[40,50) , [50,60) , [60,70), [70,80]分组,得到的频率分布直方图.(1) 分别计算参加这次知识竞赛的两个年级学生的平均成绩;(注:统计方法中,同一组数据常用该组区间的中点值作为代表)(2) 完成下面2X 2列联表,并回答是否有99%的把握认为“两个年级学生对紧急避险常L成绩小于60分人数成绩不小于60分人数合计七年级八年级合计附:K2= a+ b n;::c b+ d .临界值表:难点突破16. (12分)[2011揭阳一模]某食品厂为了检查甲乙两条自动包装流水线的生产情况, 随即在这两条流水线上各抽取 40件产品作为样本称出它们的重量 (单位:g),重量值落在 (495,510]的产品为合格品,否则为不合格品.下表是甲流水线样本频数分布表,图 K55 —3是乙流水线样本的频率分布直方图.产品重量(g) 频数 [490,495] 6 (495,500] 8 (500,505] 14 (505,510] 8 (510,515]4图 K55 — 3(1) 根据上表数据作出甲流水线样本的频率分布直方图;(2) 若以频率作为概率,试估计从甲、乙两条流水线分别任取 合格品的概率分别是多少?(3) 由以上统计数据完成下面 2X 2列联表,并回答有多大的把握认为“产品的包装质量 与两条自动包装流水线的选择有关”甲流水线乙流水线合计合格品不合格品合计宀 a + b ;;d —a :cb + d ,其中 n = a + b +c + d1件产品,该产品恰好是 P(K 2> k)0.15 0.10 0.05 0.025 0.010 0.005 0.001 k2.0722.7063.841 5.024 6.635 7.879 10.8280皿(重曲剧09他07060504030201 o.o.o.ao.oo.cici 附:下面的临界值表供参考:参考公式:课时作业(五十五)【基础热身】1. C [解析]由变量的相关关系的概念知,②⑤是正相关,①③是负相关,④为函数关系,故选C.2. B [解析]x = 2, y = 4.5,因为回归方程经过点(x , y ),所以a= 4.5 —0.95X 2 =2.6,故选B.3. A [解析]因为甲、乙两组观测数据的平均值都是(s, t),则由最小二乘法知线性回归直线方程为y= bx+ a,而a = y — b x , (s, t)在直线",l2上,故选A.4. 99.5%2 2片丄严 2nad —bc\ 5020X 15—5X 10\ n“ c”[解析]K = = =则至少有99.5%的把握认为喜爱打篮球与性别有关. 【能力提升】5. D [解析]变量的相关性的图形表示法,在相关变量中,图a从左下角到右上角是正相关,图c从左上角到右下角是负相关,图b的点分布不规则是不相关,故选 D.6. C [解析]给出一组样本数据,总可以作出相应的散点图,但不一定能分析出两个变量的关系,更不一定符合线性相关或函数关系,故选 C.7. C [解析]由表中数据知回归直线是上升的,首先排除 D. x = 176, y = 176,由线性回归性质知:点(x , y )= (176,176) —定在回归直线上,代入各选项检验,只有C符合, 故选C.& C [解析]根据独立性检验的思想知,某人吸烟,只能说其患肺病的可能性较大,有99%的把握认为吸烟与患肺病有关系,但并没有理由认为吸烟者有99%的可能患肺病,故选C.1 19. A [解析]由表中数据,得x = 4(18 + 13+ 10—1) = 10, y = Q24+ 34 + 38 + 64)= 40,_ _因为点(匚,7)在回归直线上,则40=—2X 10+ a, a = 60,当x = — 4 时,y=—2X (—4) + 60= 68,故选 A.10. 13正[解析]本题考查了统计中的线性相关关系、中位数等知识点,该知识点在高考考纲中是A级要求.A A -11. 0.254 [解析]由题意得y2 —Y1 = [0.254(x+ 1) + 0.321]—[0.254x+ 0.321]= 0.254, 即家庭年收入每增加1万元,年饮食支出平均增加0.254万元.12. 24.68万元[解析]易求得(x , y ) = (4,5),所以a= y —b x = 5—1.23X 4= 0.08,所以y= 0.08+ 1.23x,当x = 20时,维修费用约为0.08 + 1.23X 20 = 24.68.13. ① [解析]K2沁3.918>3.841,而P(K2> 3.841)~ 0.05,所以有95%的把握认为“这种血=5,清能起到预防感冒的作用”;但检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆,正确序号为①14.[解答](1)散点图如图所示:(2) x =2 + 4 + 5 + 6+85=5,145,5' X i y i = 2 X 20+ 4X 30 + 5 X 50 + 6 X 50+ 8 X 70= 1 270,i = 15 __、X i y i — 5 x yi = 1b =——"5X 2 — 5“i = 1a = y —b x = 44 — 8.5X 5= 1.5, 因此回归直线方程为 y = 8.5x + 1.5.⑶当 x = 10 时,y = 8.5X 10+ 1.5= 86.5. 15.[解答](1)七年级学生竞赛平均成绩为(45X 30 + 55X 40 + 65X 20 + 75X 10) -400= 56(分), 八年级学生竞赛平均成绩为 (45X 15+ 55X 35 + 65X 35 + 75X 15) 400= 60(分). (2)2 X 2列联表如下:16.[解答](1)甲流水线样本的频率分布直方图如下:频率⑵由表知甲样本中合格品数为 8+ 14+ 8= 30,由题中图知乙样本中合格品数为 (0.06 + 0.09+ 0.03) X 5X 40= 36, 故甲样本合格品的频率为30= 0.75, 40乙样本合格品的频率为36= 0.9, 40据此可估计从甲流水线任取 1件产品,该产品恰好是合格品的概率为 0.75,从乙流水线任取1件产品,该产品恰好是合格品的概率为 0.9.(3)2 X 2列联表如下:甲流水线乙流水线 合计—20+ 30+ 50+ 50+ 70y ==44,成绩小于60分人数成绩不小于60分人数合计 七年级 7030100 八年级 50 50 100 合计12080200,£ = 200 X 50X 30- 50X 70 2100X 100X 120X 80•••有99%的把握认为“两个年级学生对紧急避险常识的了解有差异”. 【难点突破】 1270 — 5X 5X44145 — 5 X 252n ad—be 80x 120 —360•/ K2= = 〜3.117>2.706.(a + b]c+ d va+ e (b + d) 66x 14x 40x 40•••有90%的把握认为产品的包装质量与两条自动包装流水线的选择有关.。
高考新课标数学(理)大一轮复习课时作业66变量间的相关关系、统计案例 Word版含解析
课时作业变量间的相关关系、统计案例
一、选择题
.在一组样本数据(,),(,),…,(,)(≥,,,…,不全相等)的散点图中,若所有样本点(,)(=,,…,)都在直线=
+上,则这组样本数据的样本相关系数为( )
.-.
.
解析:样本点都在一条直线上时,其样本数据的相关系数为.
答案:
.根据如下样本数据
得到的回归方程为=+,则().>,> .>,<
.<,> .<,<
解析:由表中数据画出散点图,如图,
由散点图可知<,>,选.
答案:
.(·辽宁大连双基)已知,的取值如表所示:
如果与线性相关,且线性回归方程为=+,则的值为()
.-
.-
解析:将=,=代入到=+中,得=-.故选.
答案:
.(·湖北武汉调考)根据如下样本数据
得到的回归直线方程为=+.若=,则每增加个单位,就()
.增加个单位
.减少个单位
.减少个单位
.增加个单位
解析:=(++++)=,=(+-+-)=,所以样本中心为(,),代入
回归直线方程可得=×+⇒
=-,所以每增加个单位,就减少个单位,故选.
答案:.(·兰州、张掖联考)对具有线性相关关系的变量,有一组观测数据(,)(=,,…,),其回归直线方程是=+,且+++…+=(+++…+)=,则实数的值是()
解析:依题意可知样本中心点为,则=×+,解得=.
答案:.(·东营一模)某商品的销售量(件)与销售价格(元件)存在线性相关关。
人教版高三理科数学课后习题(含答案)课时规范练54变量间的相关关系、统计案例
课时规范练54 变量间的相关关系、统计案例基础巩固组1.(2019湖南长郡中学一模,6)相关变量的样本数据如下表经回归分析可得y 与x 线性相关,并由最小二乘法求得回归直线方程为y ^=0.5x+2.3,下列说法正确的是( ) A.x 增加1时,y 一定增加2.3 B.变量x 与y 负相关 C.当y 为6.3时,x 一定是8 D.a=5.22.(2019山东临沂三模,6)某产品近期销售情况如下表:根据上表可得回归方程为y ^=b ^x+13.8,据此估计,该公司8月份该产品的销售额为( ) A.19.05B.19.25C.19.5D.19.83.某工厂为了对新研发的一种产物举行公道订价,将该产品按事先制定的代价举行试销,得到如下数据.由表中数据求得线性回归方程y ^=-4x+a ,则x=10元时预测销量为 件.综合提升组4.已知具有线性相关的变量x ,y ,设其样本点为A i (x i ,y i )(i=1,2,…,8),回归直线方程为y ^=12x+a ,若OA 1⃗⃗⃗⃗⃗⃗⃗ +OA 2⃗⃗⃗⃗⃗⃗⃗⃗ +…+OA 8⃗⃗⃗⃗⃗⃗⃗⃗ =(6,2)(O 为原点),则a=( ) A.18B.-18C.14D.-145.为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关干系,设其回归直线方程为x+.已知xi=225,yi=1 600,=4.该班某学生的脚长为24厘米,据此估计其身高为 厘米.6.(2019山东德州高三一模,19)改革开放以来,我国经济连续高速增长.如图给出了我国2003年至2012年第二产业增加值与第一产业增加值的差值(以下简称为:产业差值)的折线图,记产业差值为y(单位:万亿元).注:年份代码1—10分别对应年份2003—2012 (1)求出y 关于年份代码t 的线性回归方程;(2)利用(1)中的回归方程,分析2003年至2012年我国财产差值的变革环境,并预测我国产业差值在哪一年约为34万亿元; (3)联合折线图,试求出除去2007年产业差值后剩余的9年产业差值的平均值及方差(结果精确到0.1).附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=∑i=1n(t i -t )(y i -y )∑i=1n(t i-t )2,a ^=y −b ^t .样本方差公式:s 2=1n∑i=1n(y i -y )2.参考数据:y =110∑i=110y i =10.8,∑i=110(t i -t )(y i -y )=132,∑i=110(y i -y )2=211.6.创新应用组7.(2019河北衡水质检(四),7)某研究机构在对具有线性相关的两个变量x 和y 举行统计分析时,得到如下数据:由表中数据求得y 关于x 的回归方程为=0.8x+,则在这些样本点中任取一点,该点落在回归直线上方的概率为( ) A.14B.12C.34D.45参考答案课时规范练54 变量间的相关关系、统计案例1.D 由题设x 增加1时,y 可能增加0.5,当y 为6.3时,x 可能为8,变量x 与y 正相关,x =1+2+3+4+5+6+77=4,y=2.9+3.3+3.6+4.4+4.8+a+5.97=24.9+a 7,4×0.5+2.3=24.9+a7⇒a=5.2,故选D . 2.D ∵x =2+3+4+5+65=4,y =15.1+16.3+17.0+17.2+18.45=16.8,∴16.8=4b ^+13.8,解得b ^=0.75,∴y ^=0.75x+13.8,取x=8,得y ^=0.75×8+13.8=19.8,故选D .3.66 由已知得x =16×(4+5+6+7+8+9)=132,y =16×(90+84+83+80+75+68)=80, ∴a ^=80+4×132=106,∴x=10时,y ^=106-40=66,故答案为66.4.B 因为OA 1⃗⃗⃗⃗⃗⃗⃗⃗ +OA 2⃗⃗⃗⃗⃗⃗⃗⃗ +…+OA ⃗⃗⃗⃗⃗ 8=(x 1+x 2+…+x 8,y 1+y 2+…+y 8)=(8x ,8y )=(6,2),所以8x =6,8y =2⇒x =34,y =14,因此14=12×34+a ,即a=-18,故选B . 5.166 由∑i=110x i =225,∑i=110y i =1 600,利用平均值公式求得x =22.5,y =160,∵b ^=4,∴a ^=160-4×22.5=70,∴当x=24时,y=4×24+70=166,故答案为166. 6.解 (1)t =110(1+2+3+…+9+10)=5.5,∑i=1n (t i -t )2=(t 1-t )2+…+(t 10-t )2=2×(4.52+3.52+2.52+1.52+0.52)=82.5.b ^=13282.5=1.6,a ^=y −b ^t =10.8-1.6×5.5=2, 故回归方程是y ^=1.6t+2.(2)由(1)知,=1.6>0,故2003年至2012年我国财产差值逐年增长,平均每年增加1.6万亿元.令1.6t+2=34,解得t=20,故预测在2022年我国产业差值为34万亿元.(3)联合折线图,2007年产业差值为10.8万亿元,除去2007年(t=5时)产业差值外的9年的产业差值平均值为(10×10.8-10.8)=10.8.又因为∑i=110(y i -y )2=211.6,故除去2007年(t=5时)产业差值外的9年的产业差值的方差为19×[211.6-(10.8-10.8)2]≈23.5.7.B∵x=1+2+3+44=52,y=12+32+2+34=74,∴7 4=0.8×52+a^,∴a^=-14,因此点(4,3),(2,32)在回归直线y^=0.8x-0.25上方,概率为24=12,故选B.。
2013届人教A版文科数学课时试题及解析(56)变量的相关关系与统计案例
为 6℃,据此估计,该商场下个月羽绒服的销售量约为
________件.
能力提升
5.工人月工资 y(元 )关于劳动生产率 x(千元 )的回归方程为 确的个数是 ( )
①劳动生产率为 1000 元时,工资为 730 元; ②劳动生产率提高 1000 元,则工资提高 80 元; ③劳动生产率提高 1000 元,则工资提高 730 元; ④当月工资为 810 元时,劳动生产率约为 2000 元. A . 1 B. 2 C. 3 D. 4 6. 某产品的广告费用 x 与销售额 y 的统计数据如下表:
4. 2010 年一轮又一轮的寒潮席卷全国. 某商场为了了解某品牌羽绒服的月销售量 y(件 ) 与月平均气温 x(℃ )之间的关系,随机统计了某 4 个月的月销售量与当月平均气温,数据如
下表:
月平均气温 x(℃ )
17 13 8
2
月销售量 y(件 )
24 33 40 55
由表中数据算出线性回归方程 y^= bx+ a 中的 b≈- 2.气象部门预测下个月的平均气温约
C.若从统计量中求出有 95%的把握认为吸烟与患肺病有关系,是指有 得推断出现错误
5% 的可能性使
D .以上三种说法都不正确
8. 变量 X 与 Y 相对应的一组数据为 (10,1) , (11.3,2)(11.8,3) , (12.5,4), (13,5);变量 U 与 V 相对应的一组数据为 (10,5) , (11.3,4), (11.8,3), (12.5,2), (13,1) , r 1表示变量 Y 与 X 之
y= 650+ 80x,下列说法中正
广告费用 x(万元 )
4
2
3
5
1
销售额 y(万元 )
高考数学一轮总复习课时规范练56变量间的相关关系统计案例新人教A版
课时规范练56 变量间的相关关系、统计案例基础巩固组1.甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做了试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:学生甲乙丙丁r0.82 0.78 0.69 0.85m106 115 124 103哪位同学的试验结果体现的A,B两变量有更强的线性相关性()A.甲B.乙C.丙D.丁2.(2020全国Ⅰ,理5)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i,y i)(i=1,2,…,20)得到下面的散点图:由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bxB.y=a+bx2C.y=a+b e xD.y=a+b ln x3.(2022四川成都高考适应一)下图是某地区2001年至2021年环境保护建设投资额(单位:万元)的折线图.根据该折线图判断,下列结论正确的是()A.为预测该地2022年的环境保护建设投资额,应用2001年至2021年的数据建立回归模型更可靠B.为预测该地2022年的环境保护建设投资额,应用2010年至2021年的数据建立回归模型更可靠C.投资额与年份成负相关D.投资额与年份的相关系数r<04.某社区随机选取了部分居民,调查他们对今年春节期间社区组织文艺和体育活动的意见(每人只选择其中一项),调查结果如下表所示:性别文艺活动体育活动男15 20女25 10(1)估计该社区男性居民中选择体育活动的概率和全体居民中选择文艺活动的概率;(2)能否有95%的把握认为居民选择的活动类型与性别有关?附:K2=,其中n=a+b+c+d.P(K2≥k0) 0.050 0.010 0.001k03.841 6.635 10.828综合提升组5.某商家为了解某种加热手套如何定价可以获得最大利润,现对这种加热手套进行试销售.统计后得到其单价x(单位:元)与销量y(单位:副)的相关数据如表:x/元80 85 90 95 100y/副140 130 110 90 80(1)已知销量y与单价x具有线性相关关系,求y关于x的线性回归方程;(2)若每副该加热手套的成本为65元,试销售结束后,请利用(1)中所求的线性回归方程确定单价为多少元时,销售利润最大?(结果保留到整数)附:对于一组数据(x1,y1),(x2,y2),…,(x n,y n),其回归直线x+的斜率和截距的最小二乘估计分别为参考数据:x i y i=48 700,=40 750.创新应用组6.(2022山西临汾二模)买鞋时常常看到下面脚长与鞋号对应表,脚长(单位:mm) 220 225 230 235 240 245 250 255 260鞋号34 35 36 37 38 39 40 41 42 (1)若将表中两行数据看成数列,记脚长为数列{a n},鞋号为数列{b n},试写出b n关于a n的表达式,并估计30号童鞋所对应的脚长是多少mm?(2)有人认为可利用线性回归模型拟合脚长x(单位:mm)和鞋号y之间的关系,请说明合理性;若一名篮球运动员脚长为282 mm,请判断该运动员穿多大号的鞋?请说明理由.参考公式:r=答案:课时规范练56变量间的相关关系、统计案例1.D r越大,m越小,线性相关性越强,故选D.2.D结合题中散点图,由图象的大致走向判断,此函数应该是对数函数模型,故应该选用的函数模型为y=a+b ln x.3.B因为2009年之前与2010年之后投资额变化较大,故为预测该地2022年的环境保护建设投资额,应用2010年至2021年的数据建立回归模型更可靠,所以A错误,B正确;随年份的增长,投资额总体在增长,所以投资额与年份成正相关,r>0,故C,D错误.故选B.4.解 (1)由表格中的数据可知,该社区男性居民中选择体育活动的概率为,该社区全体居民中选择文艺活动的概率为(2)由表格中数据可得k=5.833>3.841,因此,有95%的把握认为居民选择的活动类型与性别有关.5.解 (1)由表中数据,计算得(80+85+90+95+100)=90,(140+130+110+90+80)=110, 则==3.2,=110+3.2×90=398,所以y关于x的线性回归方程为=3.2x+398.(2)设定价为x元,利润为f(x),则f(x)=(3.2x+398)(x65)=3.2x2+606x25 870,所以当x==94.687 5≈95(元)时,f(x)最大,所以为使得销售的利润最大,单价应该定为95元.6.解(1)在数列{a n}中,a n+1=a n+5,a1=220,∴{a n}为等差数列,可得a n=215+5n.①在数列{b n}中,b n+1=b n+1,b1=34,∴{b n}也是等差数列,可得b n=33+n.②由①②可得b n=0.2a n10.当b n=30时,a n=200,估计30号童鞋对应的脚长是200mm.(2)利用表格中数据可以发现,脚长与鞋号之间满足一次函数关系,相关系数为1,故可用线性回归模型拟合.利用公式算出=0.2,x=10, =0.2x10,将x=282代入=0.2x10,得=46.4.建议一:选46号鞋,刚开始会稍有挤脚,但穿过一段时间后鞋子会变大,就比较舒适了.建议二:选47号鞋,穿上会比较宽松,运动员运动量比较大,宽松的鞋子会更舒适一些.建议三:选46.5号鞋,相对而言更合脚一些.。
高三数学(理)一轮复习之双基限时训练:变量间的相关关系与统计案例(人教新课标).pdf
巩固双基,提升能力一、选择题 1.(2012·北京)某棵果树前n年的总产量Sn与n之间的关系如图所示.从目前记录的结果看,前m年的年平均产量最高,m的值为( ) A.5 B.7 C.9 D.11 解析:年平均产量为=,表示点(n,Sn)与原点连线的斜率,由图可知(9,S9)与原点连线的斜率最大,故选C. 答案:C 2.(2012·湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( ) A.y与x具有正的线性相关关系 B.回归直线过样本点的中心(,) C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg 解析:A中由于回归方程中的x系数为正,所以具有正的线性相关关系,A正确;B由线性回归方程的推导可知回归方程必过样本点的中心(,),B正确;C中,身高增加1 cm,则Δy=0.85(x+1)-85.71-(0.85x-85.71)=0.85(kg),C正确.D中,将170代入回归方程得y=58.79 kg,这个值只能是一个推测的结果,和实际值允许有误差,D错误. 答案:D 3.(2013·枣庄调研)通过随机询问100名性别不同的大学生是否爱好踢毽子运动,得到如下的列联表: 男女总计爱好104050不爱好203050总计3070100附表: P(K2≥k)0.100.050.025k2.7063.8415.024随机变量K2= 经计算,统计量K2的观测值k≈4.762,参照附表,得到的正确结论是( )A.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别有关” B.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别无关” C.有97.5%以上的把握认为“爱好该项运动与性别有关” D.有97.5%以上的把握认为“爱好该项运动与性别无关” 解析:根据题意得k≈4.762>3.841,故应该有95%的把握认为“爱好该项运动与性别有关”,因此选A. 答案:A 4.(2013·泰安模拟)下列说法: 将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; 设有一个回归方程=3-5x,变量x增加一个单位时,y平均增加5个单位; 线性回归方程=x+必过(,); 在一个2×2列联表中,由计算得K2=13.079,则有99.9%的把握确认这两个变量间有关系. 其中错误的个数是( ) A.0 B.1 C.2 D.3 本题可以参考独立检验临界值表P(K2≥k)0.500.400.250.150.10k0.4550.7081.3232.0722.706P(K2≥k)0.050.0250.010.0050.001k3.8415.0246.6357.8 7910.828解析:根据方差公式知正确;中应该为x增加一个单位时,y平均减少5个单位;正确;根据独立性检验表知正确.因此错误的为,只有1个. 答案:B 5.已知x与y之间的一组数据: x0123y1357则y与x的线性回归方程=x+必过( ) A.点(2,2) B.点(1.5,0) C.点(1,2) D.点(1.5,4) 解析:由=-知, y与x的线性回归方程必过点(,), 又由已知数据,得=(0+1+2+3)=1.5, =(1+3+5+7)=4,故必过点(1.5,4). 答案:D 6.(2013·泰安模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据: 月份x1234用水量y4.5432.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是=-0.7x+,则等于( ) A.10.5 B.5.15 C.5.2 D.5.25 解析:=2.5,=3.5,回归直线方程过定点(,), 3.5=-0.7×2.5+,=5.25. 答案: D 二、填空题 7.(2013·丽水调研)某单位为了了解用电量y度与气温x℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表: 气温(℃)181310-1用电量(度)24343864由表中数据得线性回归方程=x+中=-2,预测当气温为-4℃时,用电量的度数约为________. 解析:=10,=40,回归方程过点(,), 40=-2×10+. =60. =-2x+60.令x=-4,=(-2)×(-4)+60=68. 答案:68 8.某高校“统计初步”课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表: 专业性别 非统计专业统计专业男1310女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到 K2=≈4.844,因为K2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为__________. 解析:K2≈4.844>3.841,有95%的把握认为主修统计专业与性别有关系,即作出“主修统计专业与性别有关系”的判断,出错的可能性不超过5%. 答案:5% 三、解答题 9.(2013·开封调研)甲、乙两个学校高三年级分别有1 100人,1 000人,为了了解两个学校全体高三年级学生在该地区二模考试的数学成绩情况,采用分层抽样方法从两个学校一共抽取了105名学生的数学成绩,并作出了如下的频数分布统计表,规定考试成绩在[120,150]内为优秀. 甲校: 分组[70,80)[80,90)[90,100)[100,110)频数231015分组[110,120)[120,130)[130,140)[140,150]频数15x31乙校: 分组[70,80)[80,90)[90,100)[100,110)频数1298分组[110,120)[120,130)[130,140)[140,150]频数1010y3(1)计算x,y的值; (2)由以上统计数据填写下面2×2列联表,若按是否优秀来判断,是否有97.5%的把握认为两个学校的数学成绩有差异? 甲校乙校总计优秀非优秀总计解析:(1)x=6,y=7. (2)填表如下: 甲校乙校总计优秀102030非优秀453075总计5550105由表格计算,得K2=≈6.109>5.024,故有97.5%的把握认为两个学校的数学成绩有差异. 10.(2013·南京学情调研)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料: 日期1月 10日2月 10日3月 10日4月 10日5月 10日6月 10日昼夜温 差x(℃)1011131286就诊人 数y(人)222529261612该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验. (1)求选取的2组数据恰好是相邻两个月的概率; (2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y关于x的线性回归方程y=bx+a; (3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想? 参考公式:b==,a=-b. 解析:(1)设抽到相邻两个月的数据为事件A. 从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的.其中,抽到相邻两个月的数据的情况有5种, P(A)==. (2)由数据求得=11,=24. 由公式求得b=,a=-b=-, y关于x的线性回归方程为y=x-. (3)当x=10时,y=,<2; 同样,当x=6时,y=,<2. 该小组所得线性回归方程是理想的.。
高三人教A版理科数学一轮复习课时作业(55)变量的相关性与统计案例)(教学借鉴)
课时作业(五十五) [第55讲 变量的相关性与统计案例][时间:45分钟 分值:100分]基础热身 1.[2011·广东六校联考] 有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程; ②平均日学习时间和平均学习成绩; ③某人每日吸烟量和身体健康情况; ④圆的半径与面积;⑤汽车的重量和每千米耗油量. 其中两个变量成正相关的是( )A .①③B .②④C .②⑤D .④⑤ 2.[2011·丰台二模] 已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ,则a =( )x 0 1 3 4 y 2.2 4.3 4.8 6.7A.3.25 B .2.6 C .3.[2011·大连双基检测] 为了考察两个变量x 、y 之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l 1和l 2.已知在两人的试验中发现变量x 的观测数据的平均值恰好都为s ,变量y 的观测数据的平均值恰好都为t ,那么下列说法中正确的是( )A .直线l 1,l 2有公共点(s ,t )B .直线l 1,l 2相交,但是公共点未必是(s ,t )C .由于斜率相等,所以直线l 1,l 2必定平行D .直线l 1,l 2必定重合 4.[2011·新余二模] 为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进 喜爱打篮球 不喜爱打篮球 合计 男生 20 5 25 女生 10 15 25 合计 30 20 50则至少有)附:K 2=n (ad -bc )2P (K 2>k ) 0.10 0.05 0.025 0.010 0.005 0.001 k 2.706 3.841 5.024 6.635 7.879 10.8285.观察下列散点图,则①正相关;②负相关;③不相关,它们的排列顺序与图形相对应的是( )A .a —①,b -②,c -③B .a -②,b -③,c -①C .a -②,b -①,c -③D .a -①,b -③,c -②6.对于给定的两个变量的统计数据,下列说法正确的是( ) A .都可以分析出两个变量的关系B .都可以用一条直线近似地表示两者的关系C .都可以作出散点图D .都可以用确定的表达式表示两者的关系 7.[2011·江西卷] 为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下父亲身高x (cm) 174 176 176 176 178儿子身高y (cm) 175 175 176 177 177则y 对x A .y =x -1 B .y =x +1C .y =88+12x D .y =1768.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A .若K 2的观测值为k =6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病C .若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D .以上三种说法都不正确 9.[2011·枣庄二模] 某单位为了了解用电量y (kW·h)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表.由表中数据得线性回归方程y ^=-2x +a ,预测当气温为-4℃时,用电量约为( )气温x (℃) 18 13 10 -1 用电量y (kW·h) 24 34 38 64A.68 kW·h B C .66 kW·h D .65 kW·h 10.[2010·广东卷] 市居民2005~2009年家庭年平均收入x (单位:万元)与年平均支出y (单位:万元)的统计资料如下表所示:年份 2005 2006 2007 2008 2009 收入x 11.5 12.1 13 13.3 15 支出y 6.8 8.8 9.8 10 12有________线性相关关系.11.[2011·辽宁卷] 调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.12.[2011·九江六校三联] 假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:x2 3 4 5 6 y 2.2 3.8 5.5 6.57.0 若由资料可知y 对x 呈线性相关关系,且线性回归方程为y =a +bx ,其中已知b =1.23,请估计使用年限为20年时,维修费用约为________.13.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2≈3.918,经查临界值表知P (K 2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒; ③这种血清预防感冒的有效率为95%; ④这种血清预防感冒的有效率为5%.14.(10分)某种产品的广告费用支出x 万元与销售额y 万元之间有如下的对应数据:x 2 4 5 6 8 y 20 30 50 50 70(1)(2)根据上表提供的数据,求出y 关于x 的线性回归方程; (3)据此估计广告费用为10万元时,所得的销售收入.(参考数值:∑i =15x 2i =145,∑i =15x i y i =1270)15.(13分)[2011·巢湖质检] 地震、海啸、洪水、森林大火等自然灾害频繁出现,紧急避险常识越来越引起人们的重视.某校为了了解学生对紧急避险常识的了解情况,从七年级和八年级各选取100名同学进行紧急避险常识知识竞赛.图K55-2(1)和图K55-2(2)分别是对七年级和八年级参加竞赛的学生成绩按[40,50),[50,60),[60,70),[70,80]分组,得到的频率分布直方图.图K55-2(1)分别计算参加这次知识竞赛的两个年级学生的平均成绩;(注:统计方法中,同一组数据常用该组区间的中点值作为代表)(2)完成下面2×2列联表,并回答是否有99%的把握认为“两个年级学生对紧急避险常 成绩小于60分人数 成绩不小于60分人数 合计 七年级 八年级 合计。
高三数学一轮复习课时作业6:11.3 变量间的相关关系、统计案例
11.3 变量间的相关关系、统计案例一、选择题1.为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男 45 10 女3015附:P (K 2≥k 0) 0.10 0.05 0.025 k 02.7063.8415.024K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )参照附表,得到的正确结论是( )A .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”2.已知变量x ,y 之间具有线性相关关系,其回归方程为y ^=-3+b ^x ,若∑10i =1x i =17,∑10i =1y i=4,则b^的值为( ) A .2 B .1 C .-2D .-13.观察下面频率等高条形图,其中两个分类变量x ,y 之间关系最强的是( )A B C D4.对于下列表示五个散点,已知求得的线性回归方程为y ^=0.8x -155,则实数m 的值为( )x 196 197 200 203 204 y1367 mA.8 B .8.2 C .8.4D .8.55.登山族为了了解某山高y (km)与气温x (℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表.气温x (℃) 18 13 10 -1 山高y (km)24343864由表中数据,得到线性回归方程y ^=-2x +a ^(a ^∈R ),由此请估计出山高为72(km)处气温的度数为( )A .-10B .-8C .-4D .-66.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验,经计算K 2=7.069,则有多大把握认为“学生性别与支持该活动有关系”.( )附:P (K 2≥k 0) 0.100 0.050 0.025 0.010 0.001 k 02.7063.8415.0246.63510.828A.0.1% B .1% C .99% D .99.9%二、填空题7.(2014·济南模拟)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x (单位:万元)和年教育支出y (单位:万元),调查显示年收入x 与年教育支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.15x +0.2.由回归直线方程可知,家庭年收入每增加1万元,年教育支出平均增加__________万元.8.(2014·嘉兴联考)为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科 文科 男 13 10 女720已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025. 根据表中数据,得到K 2=50×13×20-10×7223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为__________.9.(2015·江西重点中学联考)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9.零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为______.三、解答题10.电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女合计(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),P(K2≥k0)0.100.050.01k0 2.706 3.841 6.63511.某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:『0,2』,(2,4』,(4,6』,(6,8』,(8,10』,(10,12』.估计该校学生每周平均体育运动时间超过4小时的概率;(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)P(K2≥k0)0.100.050.0100.005 k0 2.706 3.841 6.6357.879答案一、选择题 1.『解析』由题设知:a =45,b =10,c =30,d =15,所以k =100×45×15-30×10255×45×75×25≈3.030,2.706<3.030<3.841,由附表可知,有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选C.『答案』C2.『解析』依题意知,x =1710=1.7,y =410=0.4, 而直线y ^=-3+b ^x 一定经过点(x ,y ), 所以-3+b^×1.7=0.4,解得b ^=2. 『答案』A3.『解析』在频率等高条形图中,a a +b 与cc +d相差很大时,我们认为两个分类变量有关系,四个选项中,等高条形图中x 1,x 2所占比例相差越大,则分类变量x ,y 关系越强,故选D.『答案』D4.『解析』x =196+197+200+203+2045=200,y =1+3+6+7+m 5=17+m5.样本中心点为⎝⎛⎭⎫200,17+m 5,将样本中心点⎝⎛⎭⎫200,17+m 5代入y ^=0.8x -155,可得m =8.故A 正确.『答案』A5.『解析』由题意可得x =10,y =40,所以a^=y +2x =40+2×10=60. 所以y ^=-2x +60,当y ^=72时,-2x +60=72. 解得x =-6,故选D.『答案』D6.『解析』因为K 2=7.069>6.635,所以P (K 2>6.635)=0.010,所以说有99%的把握认为“学生性别与支持该活动有关系”.『答案』C二、填空题 7.『解析』回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.『答案』0.158.『解析』∵K 2≈4.844,根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.『答案』5%9.『解析』由已知可计算求出x =30,而回归直线方程必过点(x ,y ),则y =0.67×30+54.9=75,设模糊数字为a ,则a +62+75+81+895=75,计算得a =68.『答案』68三、解答题10.『解析』(1)由所给的频率分布直方图知, “体育迷”人数为100×(10×0.020+10×0.005)=25, “非体育迷”人数为75,则据题意完成2×2列联表:非体育迷 体育迷 合计 男 30 15 45 女 45 10 55 合计7525100将2×2列联表的数据代入公式计算: K 2=100×30×10-45×15275×25×45×55=10033≈3.030. 因为3.030>2.706,所以有90%的把握认为“体育迷”与性别有关. (2)由所给的频率分布直方图知“超级体育迷”人数为100×(10×0.005)=5,记a i (i =1,2,3)表示男性,b j (j =1,2)表示女性,所有可能结果构成的基本事件空间为Ω={(a 1,a 2),(a 1,a 3),(a 2,a 3),(a 1,b 1),(a 2,b 1),(a 3,b 1),(a 1,b 2),(a 2,b 2),(a 3,b 2),(b 1,b 2)},共有10个基本事件组成,且每个基本事件出现是等可能的.用A 表示事件“任选2人,至少1名女性”,则A ={(a 1,b 1),(a 2,b 1),(a 3,b 1),(a 1,b 2),(a 2,b 2),(a 3,b 2),(b 1,b 2)},共有7个基本事件组成,故任选2人,至少1名女性观众的概率为P (A )=710.11.『解析』(1)300×4 50015 000=90,所以应收集90位女生的样本数据.(2)由频率分布直方图得1-2×(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的.所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表男生 女生 总计 每周平均体育运动时间不超过4小时 453075每周平均体育运动时间超过4小时 165 60 225 总计21090300结合列联表可算得K 2=300× 2 250275×225×210×90=10021≈4.762>3.841.所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.。
2013届高考一轮数学复习理科课件(人教版)第5课时 线性回归分析与统计案例
高考调研
高三数学(新课标版· 理)
【解析】 以 x 轴表示身高,y 轴表示体重,可得到 相应的散点图如图所示:
由散点图可知, 两者之间具有相关关系, 且为正相关.
第十章
第5课时
高考调研
高三数学(新课标版· 理)
题型二
例2
利用回归方程对总体进行估计
(2011· 安徽文)某地最近十年粮食需求量逐年上升,
第十章
第5课时
高考调研
高三数学(新课标版· 理)
探究 1 散点图是由大量数据点分布构成的, 是定义 在具有相关关系的两个变量基础之上的, 对于性质不明确 的两组数据可先作散点图, 直观地分析它们有无关系及关 系的密切程度.
第十章
第5课时
高考调研
高三数学(新课标版· 理)
思考题 1 在某地区的 12~30 岁居民中随机抽取了 10 个人的身高和体重的统计资料如表: 身高 143 156 159 172 165 171 177 161 164 160 (cm) 体重 41 (kg) 49 61 79 68 69 74 69 68 54
答案 C
解析 根据独立性检验的思想方法,正确选项为 C.
第十章
第5课时
高考调研
高三数学(新课标版· 理)
3.甲、乙、丙、丁四位同学各自对 A、B 两变量的 线性相关性作试验, 并用回归分析方法分别求得相关系数 r 与残差平方和 m 如下表: 甲 乙 丙 丁
r 0.82 0.78 0.69 0.85 m 115 106 124 103
^
第十章
第5课时
高考调研
高三数学(新课标版· 理)
n n xi- x yi- y xiyi-n x y i=1 i=1 = b= n n 2 xi- x x2-n x 2 i i=1 i=1 a= y -b x ( x , y )称为样本点的中点.
人教版高考数学理科一轮总复习配套课件11.9变量间的相关关系、统计案例
-3-
1.相关关系: 当自变量取值一定时, 因变量的取值带有一定随机性的两 个变量之间的关系叫做相关关系.与函数关系不同, 相关关系是一种
非确
定性关系 .
2.散点图: 表示具有相关关系的两个变量的一组数据的图形叫做散点 图, 它可直观地判断两变量的关系是否可以用线性关系表示.若这些散点分 布在从左下角到右上角的区域, 则称两个变量 在从左上角到右下角的区域, 则称两个变量
������
, ������ = ������ − ������ ������ , 它主要用来估
^
计和预测取值, 从而获得对这两个变量之间整体关系的了解.
^ ^
想一想结合直线的点斜式方程, 你能推导出回归方程 ������ =
^
������ x+ ������ 经过的定点吗?
答案: 由������ = ������ − ������ ������ 得������ = ������ x+������ − ������ ������ , 即 ������ − ������ = ������ (x-������ ), 由此可知回
-4-
4.回归方程: ������ = ������ x+������ , 其中 ������ =
^
^ ^
^
������=1 ������
∑ ������������ ������������ -n������ ������ ^
2 ∑ ������2 ������ -n������ ������=1
关闭
^ ^ ^
^
������ =
^
4+2+3+5 4 ^
=3.5,������=
高三数学一轮复习课时作业11:§11.3 变量间的相关关系、统计案例
§11.3 变量间的相关关系、统计案例1.根据如下样本数据:得到的线性回归方程为y ^=b ^x +a ^,则( ) A.a ^>0,b ^>0 B.a ^ >0,b ^<0 C.a ^<0,b ^>0 D.a ^<0,b ^<0答案 B解析 根据给出的数据可发现:整体上y 与x 呈现负相关,所以b ^<0,由样本点(3,4.0)及(4,2.5)可知a ^>0,故选B.2.(2017·江西南城一中、高安中学等九校联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),得K 2=100×(45×22-20×13)265×35×58×42≈9.616.参照下表,正确的结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C .有99%以上的把握认为“生育意愿与城市级别有关”D .有99%以上的把握认为“生育意愿与城市级别无关” 答案 C解析 ∵K 2≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”,故选C.3.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其线性回归方程是y ^=13x +a ^ ,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a ^ 的值是( )A.116B.18C.14D.12 答案 B解析 依题意可知样本点的中心为⎝⎛⎭⎫34,38,则38=13×34+a ^ ,解得a ^ =18. 4.(2017·山东)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其线性回归方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( )A .160B .163C .166D .170 答案 C解析 ∵∑10i =1x i =225,∴x =110∑10i =1x i=22.5. ∵∑10i =1y i =1 600,∴y =110∑10i =1y i=160. 又b ^ =4,∴a ^ =y -b ^x =160-4×22.5=70. ∴线性回归方程为y ^=4x +70.将x =24代入上式,得y ^ =4×24+70=166.故选C.5.(2018·湖南永州模拟)已知x 与y 之间的几组数据如下表:假设根据上表数据所得的线性回归方程为y ^=b ^x +a ^.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( ) A.b ^>b ′,a ^>a ′ B.b ^ >b ′,a ^<a ′ C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^<a ′答案 C解析 由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b ^ =∑6i =1x i y i -6x ·y ∑i =16x 2i -6x2=58-6×72×13691-6×⎝⎛⎭⎫722=57,a ^ =y-b ^x =136-57×72=-13,所以b ^ <b ′,a ^ >a ′. 6.某地2009年至2015年中,每年的人口总数y (单位:万)的数据如下表:若t 与y 之间具有线性相关关系,则其回归直线y ^=b ^t +a ^一定过点( ) A .(3,9) B .(9,3) C .(6,14)D .(4,11)答案 A解析 t =17(0+1+2+3+4+5+6)=3,y =17(8+8+8+9+9+10+11)=9,所以回归直线y ^=b ^t +a ^一定过点(3,9).7.(2017·遵义联考)某公司为确定明年投入某产品的广告支出,对近5年的年广告支出m 与年销售额t (单位:百万元)进行了初步统计,得到下列表格中的数据:经测算,年广告支出m 与年销售额t 满足线性回归方程t ^=6.5m +17.5,则p =________. 答案 60解析 由于回归直线过样本点的中心,m =5,t =190+p 5,代入t ^=6.5m +17.5,解得p =60.8.以下四个命题,其中正确的序号是________.①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程y ^=0.2x +12中,当解释变量x 每增加一个单位时,预报变量y ^平均增加0.2个单位;④对分类变量X 与Y 的统计量K 2来说,K 2越小,“X 与Y 有关系”的把握程度越大. 答案 ②③解析 ①是系统抽样;对于④,统计量K 2越小,说明两个相关变量有关系的把握程度越小. 9.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示2×2列联表:已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到K 2的观测值k =50×(13×20-10×7)223×27×20×30≈4.844,则有________的把握认为选修文科与性别有关.答案 95% 解析由题意,K 2=50×(13×20-10×7)223×27×20×30≈4.844,因为5.024>4.844>3.841,所以有95%的把握认为选修文科与性别有关.10.(2017·武邑模拟)对具有线性相关关系的变量x ,y 有10组观测数据(x i ,y i )(i =1,2,…,10),其线性回归方程为y ^=-3+2x ,若∑10i =1x i =17,则∑10i =1y i =________. 答案 4解析 依题意x =1710=1.7,而直线y ^ =-3+2x 一定经过(x ,y ),∴y =-3+2x =-3+2×1.7=0.4, ∴∑10i =1y i =0.4×10=4. 11.某地区2009年至2015年农村居民家庭人均纯收入y (单位:千元)的数据如下表:(1)求y 关于t 的线性回归方程;(2)利用(1)中的线性回归方程,分析2009年至2015年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2018年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .解 (1)由所给数据计算得t =17(1+2+3+4+5+6+7)=4,y =17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i =17(t i -t )2=9+4+1+0+1+4+9=28,∑i =17(t i -t )(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=∑i =17(t i -t )(y i -y )∑i =17(t i -t )2=1428=0.5, a ^=y -b ^t =4.3-0.5×4=2.3, 所求线性回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2009年至2015年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2018年的年份代号t =10代入(1)中的线性回归方程,得y ^=0.5×10+2.3=7.3, 故预测该地区2018年农村居民家庭人均纯收入为7.3千元.12.(2017·西安质检)某省会城市地铁将于2017年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:(1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差异是多少(结果保留2位小数);(2)由以上统计数据填下面2×2列联表,分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)“赞成定价者”的月平均收入为x 1=20×1+30×2+40×3+50×5+60×3+70×41+2+3+5+3+4≈50.56.“认为价格偏高者”的月平均收入为x 2=20×4+30×8+40×12+50×5+60×2+70×14+8+12+5+2+1=38.75,∴“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x 1-x 2=50.56-38.75=11.81(百元).(2)根据条件可得2×2列联表如下:K 2=50×(3×11-7×29)210×40×18×32≈6.272<6.635,∴没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.13.(2017·通州一模)对两个变量y 和x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则下列说法中不正确的是( )A .由样本数据得到的回归直线y ^=b ^x +a ^必过样本点的中心(x ,y ) B .残差平方和越小的模型,拟合的效果越好C .用相关指数R 2来刻画回归效果,R 2的值越小,说明模型的拟合效果越好D .若变量y 和x 之间的相关系数r =-0.936 2,则变量y 与x 之间具有线性相关关系 答案 C解析 R 2的值越大,说明残差平方和越小,也就是模型的拟合效果越好,故选C.14.(2018·河北保定模拟)中央政府为了应对因人口老龄化而造成的劳动力短缺问题,拟定出台“延迟退休年龄政策”.为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研.人社部从网上年龄在15~65的人群中随机调查100人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:(1)由以上统计数据填写2×2列联表,并判断是否有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;(2)若以45岁为分界点,从不支持“延迟退休年龄政策”的人中按分层抽样的方法抽取8人参加某项活动.现从这8人中随机抽2人,求至少有1人是45岁及45岁以上的概率.参考数据:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d). 解(1)2×2列联表如下:因为K 2=100×(35×5-45×15)250×50×80×20=254=6.25>3.841,所以有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异.(2)从不支持“延迟退休年龄政策”的人中抽取8人,则45岁以下的应抽6人,45岁及45岁以上的应抽2人.则8人中随机抽2人共有C 28=28种抽法,至少有1人是45岁及45岁以上共有C 16C 12+C 22=13(种)抽法,故所求概率为1328.15.(2018·青岛模拟)针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有________人.答案 12解析 设男生人数为x ,由题意可得列联表如下:若有95%的把握认为是否喜欢韩剧和性别有关,则k >3.841,即k =3x 2⎝⎛⎭⎫x 6·x 6-5x 6·x 32x ·x 2·x 2·x =3x 8>3.841, 解得x >10.243.因为x 6,x 2为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有12人. 16.(2017·包头一模)如图是某企业2010年至2016年的污水净化量(单位:吨)的折线图. 注:年份代码1~7分别对应年份2010~2016.(1)由折线图看出,可用线性回归模型拟合y 和t 的关系,请用相关系数加以说明;(2)建立y 关于t 的回归方程,预测2017年该企业的污水净化量;(3)请用数据说明回归方程预报的效果.参考数据:y =54,∑7i =1(t i -t )(y i -y )=21,14≈3.74,∑7i =1 (y i -y ^i )2=94. 参考公式:相关系数r =∑n i =1(t i -t )(y i -y )∑n i =1(t i -t )2∑ni =1 (y i -y )2, 线性回归方程y ^=a ^+b ^t ,b ^=∑n i =1 (t i -t )(y i -y )∑n i =1(t i -t )2,a ^=y -b ^ t . 反映回归效果的公式为:R 2=1-∑n i =1(y i -y ^i )2∑ni =1 (y i -y )2,其中R 2越接近于1,表示回归的效果越好. 解 (1)由折线图中的数据得,t =4,∑7i =1(t i -t )2=28,∑7i =1 (y i -y )2=18, 所以r =2128×18≈0.935. 因为y 与t 的相关系数近似为0.935,说明y 与t 的线性相关程度相当大,所以可以用线性回归模型拟合y 与t 的关系.(2)因为y =54,b ^=∑7i =1 (t i -t )(y i -y )∑7i =1 (t i -t )2=2128=34, 所以a ^=y -b ^ t =54-34×4=51, 所以y 关于t 的线性回归方程为y ^=b ^t +a ^=34t +51. 将2017年对应的t =8代入得y ^ =34×8+51=57, 所以预测2017年该企业污水净化量约为57吨.(3)因为R 2=1-∑7i =1 (y i -y ^i )2∑7i =1 (y i -y )2=1-94×118 =1-18=78=0.875, 所以“污水净化量的差异”有87.5%是由年份引起的,这说明回归方程预报的效果是良好的.。
2013届高三数学(理)一轮复习方案课件【人教A版】第56讲变量的相关性与统计案例
个体所属不同类别 ,则这 (1)若变量的不同“值”表示____________________
类变量称为分类变量.
频数 表,称为列联表. (2)列出的两个分类变量的______
假设有两个分类变量 X 和 Y,它们的可能取值分别为{x1, y1}和{x2,y2},其样本频数列联表(称为 2×2 列联表)为
第56讲 │ 要点探究
► 探究点2 回归直线方程的求法及应用
例 2[2011· 郑州三模] 某研究机构对高三学生的记忆力 x 和判断力 y 进行统计分析,得下表数据:
x y 6 2 8 3 10 5 12 6
(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程^ y =^ b x+ ^ a; (3)试根据(2)求出的线性回归方程,预测记忆力为 9 的同 学的判断力.
第56讲 │ 问题思考
► 问题 3 回归分析 ) (1)回归分析就是研究两个相关事件的独立性;( 的.( )
(2) 回 归 模 型 都 是 确 定 性 的 函 数 , 且 回 归 模 型 都 是 线 性 (3)只有两个变量有相关关系,所得到的回归模型才有预测价 [答案] (1)错 (2)错 (3)对 值.( )
i= 1
n
(3)相关系数:r=
n 2 n i= 1 i= 1
;
xi- x yi- y 2
第56讲 │ 知识梳理
正相关 ;当 r<0 时,表明两 ①当 r>0 时,表明两个变量________ 负相关 . 个变量________
②r 的绝对值越接近于 0 时,表明两个变量之间几乎不存 在线性相关关系;通常|r|大于 0.75 时,认为两个变量有很强的 线性相关性. 3.独立性检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课时作业(五十五) [第55讲 变量的相关性与统计案例][时间:45分钟 分值:100分]基础热身 1.[2011·广东六校联考] 有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程; ②平均日学习时间和平均学习成绩; ③某人每日吸烟量和身体健康情况; ④圆的半径与面积;⑤汽车的重量和每千米耗油量. 其中两个变量成正相关的是( )A .①③B .②④C .②⑤D .④⑤ 2.[2011·丰台二模] 已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ,则a =( )A.3.25 B .2.6 C .3.[2011·大连双基检测] 为了考察两个变量x 、y 之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l 1和l 2.已知在两人的试验中发现变量x 的观测数据的平均值恰好都为s ,变量y 的观测数据的平均值恰好都为t ,那么下列说法中正确的是( )A .直线l 1,l 2有公共点(s ,t )B .直线l 1,l 2相交,但是公共点未必是(s ,t )C .由于斜率相等,所以直线l 1,l 2必定平行D .直线l 1,l 2必定重合 4.[2011·新余二模] 为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进则至少有)附:K 2=n (ad -bc )25.观察下列散点图,则①正相关;②负相关;③不相关,它们的排列顺序与图形相对应的是( )A .a —①,b -②,c -③B .a -②,b -③,c -①C .a -②,b -①,c -③D .a -①,b -③,c -②6.对于给定的两个变量的统计数据,下列说法正确的是( ) A .都可以分析出两个变量的关系B .都可以用一条直线近似地表示两者的关系C .都可以作出散点图D .都可以用确定的表达式表示两者的关系 7.[2011·江西卷] 为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下则y 对x A .y =x -1 B .y =x +1C .y =88+12x D .y =1768.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A .若K 2的观测值为k =6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病C .若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D .以上三种说法都不正确 9.[2011·枣庄二模] 某单位为了了解用电量y (kW·h)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表.由表中数据得线性回归方程y ^=-2x +a ,预测当气温为-4℃时,用电量约为( )A.68 kW·h B C .66 kW·h D .65 kW·h 10.[2010·广东卷] 市居民2005~2009年家庭年平均收入x (单位:万元)与年平均支出y (单位:万元)有________线性相关关系.11.[2011·辽宁卷] 调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.12.[2011·九江六校三联] 假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:若由资料可知y 对x 呈线性相关关系,且线性回归方程为y =a +bx ,其中已知b =1.23,请估计使用年限为20年时,维修费用约为________.13.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2≈3.918,经查临界值表知P (K 2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒; ③这种血清预防感冒的有效率为95%; ④这种血清预防感冒的有效率为5%.14.(10分)(1)(2)根据上表提供的数据,求出y 关于x 的线性回归方程; (3)据此估计广告费用为10万元时,所得的销售收入.(参考数值:∑i =15x 2i =145,∑i =15x i y i =1270)15.(13分)[2011·巢湖质检] 地震、海啸、洪水、森林大火等自然灾害频繁出现,紧急避险常识越来越引起人们的重视.某校为了了解学生对紧急避险常识的了解情况,从七年级和八年级各选取100名同学进行紧急避险常识知识竞赛.图K55-2(1)和图K55-2(2)分别是对七年级和八年级参加竞赛的学生成绩按[40,50),[50,60),[60,70),[70,80]分组,得到的频率分布直方图.图K55-2(1)分别计算参加这次知识竞赛的两个年级学生的平均成绩;(注:统计方法中,同一组数据常用该组区间的中点值作为代表)(2)完成下面2×2列联表,并回答是否有99%的把握认为“两个年级学生对紧急避险常附:K 2=(a +b )(c .临界值表:难点突破16.(12分)[2011·揭阳一模] 某食品厂为了检查甲乙两条自动包装流水线的生产情况,随即在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:g),重量值落在(495,510]的产品为合格品,否则为不合格品.下表是甲流水线样本频数分布表,图K55-3是乙流水线样本的频率分布直方图.(1)根据上表数据作出甲流水线样本的频率分布直方图;(2)若以频率作为概率,试估计从甲、乙两条流水线分别任取1件产品,该产品恰好是合格品的概率分别是多少?(3)由以上统计数据完成下面2×2列联表,并回答有多大的把握认为“产品的包装质量参考公式:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d课时作业(五十五)【基础热身】1.C [解析] 由变量的相关关系的概念知,②⑤是正相关,①③是负相关,④为函数关系,故选C.2.B [解析] x =2,y =4.5,因为回归方程经过点(x ,y ),所以a =4.5-0.95×2=2.6,故选B.3.A [解析] 因为甲、乙两组观测数据的平均值都是(s ,t ),则由最小二乘法知线性回归直线方程为y ^=bx +a ,而a =y -b x ,(s ,t )在直线l 1,l 2上,故选A.4.99.5% [解析] K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=50(20×15-5×10)225×25×30×20=8.333>7.879,则至少有99.5%的把握认为喜爱打篮球与性别有关.【能力提升】5.D [解析] 变量的相关性的图形表示法,在相关变量中,图a 从左下角到右上角是正相关,图c 从左上角到右下角是负相关,图b 的点分布不规则是不相关,故选D.6.C [解析] 给出一组样本数据,总可以作出相应的散点图,但不一定能分析出两个变量的关系,更不一定符合线性相关或函数关系,故选C.7.C [解析] 由表中数据知回归直线是上升的,首先排除D.x =176,y =176,由线性回归性质知:点(x ,y )=(176,176)一定在回归直线上,代入各选项检验,只有C 符合,故选C.8.C [解析] 根据独立性检验的思想知,某人吸烟,只能说其患肺病的可能性较大,有99%的把握认为吸烟与患肺病有关系,但并没有理由认为吸烟者有99%的可能患肺病,故选C.9.A [解析] 由表中数据,得x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,因为点(x ,y )在回归直线上,则40=-2×10+a ,a =60,当x =-4时,y ^=-2×(-4)+60=68,故选A.10.13 正 [解析] 本题考查了统计中的线性相关关系、中位数等知识点,该知识点在高考考纲中是A 级要求.11.0.254 [解析] 由题意得y ^2-y ^1=[0.254(x +1)+0.321]-[0.254x +0.321]=0.254,即家庭年收入每增加1万元,年饮食支出平均增加0.254万元.12.24.68万元 [解析] 易求得(x ,y )=(4,5),所以a =y -b x =5-1.23×4=0.08, 所以y ^=0.08+1.23x ,当x =20时,维修费用约为0.08+1.23×20=24.68.13.① [解析] K 2≈3.918>3.841,而P (K 2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”;但检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆,正确序号为①.14.[解答] (1)散点图如图所示:(2)x =2+4+5+6+85=5,y =20+30+50+50+705=44,∑i = 15x 2i = 22 + 42 + 52 + 62 + 82= 145,∑i =15x i y i =2×20+4×30+5×50+6×50+8×70=1 270,b = ∑i = 15x i y i -5x y ∑i = 15x 2i -5x2=1270-5×5×44145-5×25= 8.5,a =y --b x =44-8.5×5=1.5,因此回归直线方程为y =8.5x +1.5.(3)当x =10时,y =8.5×10+1.5=86.5. 15.[解答] (1)七年级学生竞赛平均成绩为 (45×30+55×40+65×20+75×10)÷100=56(分), 八年级学生竞赛平均成绩为(45×15+55×35+65×35+75×15)÷100=60(分). (2)2×2列联表如下:∴K 2=200×(50×30-50×70)100×100×120×80≈8.333>6.635,∴有99%的把握认为“两个年级学生对紧急避险常识的了解有差异”. 【难点突破】16.[解答] (1)(2) (0.06+0.09+0.03)×5×40=36,故甲样本合格品的频率为3040=0.75,乙样本合格品的频率为3640=0.9,据此可估计从甲流水线任取1件产品,该产品恰好是合格品的概率为0.75, 从乙流水线任取1件产品,该产品恰好是合格品的概率为0.9. (3)2×2列联表如下:∵K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)=80×(120-360)66×14×40×40≈3.117>2.706.∴有90%的把握认为产品的包装质量与两条自动包装流水线的选择有关.。