人教版数学高二章末检测第一章统计案例
人教A版高二文科数学选修1-2第一章统计案例章末检测试题().docx

高中数学学习材料鼎尚图文*整理制作第一章统计案例章末检测一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列两个变量之间的关系,不是函数关系的是( )A.角度和它的余弦值B.正方形的边长和面积C.正n边形的边数和内角和D.母亲的身高与子女的身高解析:变量是否具有函数关系,关键看两个变量是否具有一一对应关系.答案: D2.对于线性相关系数r,叙述正确的是( )A.|r|∈(0,+∞),|r|越大,相关程度越大,反之相关程度越小B.r∈(-∞,+∞),r越大,相关程度越大,反之,相关程度越小C.|r|≤1且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小D.以上说法都不对解析:由相关关系的概念可知,C正确.答案: C3.给出施化肥量对水稻产量影响的试验数据(变量x,y的单位都为:kg):施化肥量x 15202530354045水稻产量y 330345365405445450455利用上述数据得到的回归直线必过( )A.(29,398) B.(30,399) C.(31,400) D.(32,401)解析:回归直线必过样本点的中心(x,y),计算得到x=30,y≈399.答案: B4.某班主任对全班50名学生进行了作业量多少的调查,数据如下表所示:作业量的情况认为作用多认为作业不多总数玩电脑游戏的情况喜欢玩电脑游戏18 a 27不喜欢玩电脑游戏 b 1523总数262450则表中a、b的值分别为( )A.45,8 B.52、50 C.9,8 D.54,52解析:∵a+18=27,∴a=9.又18+b=26,∴b=8.故选C.答案: C5.设有一个回归方程为y=3-2x,变量x增加一个单位时( )A.y平均增加2个单位B.y平均减少3个单位C.y平均减少2个单位D.y平均增加3个单位解析:∵[3-2(x+1)]-(3-2x)=-2,∴y的值平均减少2个单位.答案: C6.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为y=0.66x+1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )A.83% B.72% C.67% D.66%解析:将y=7.675代入回归方程,可计算得x≈9.26,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.答案: A7.对四对变量Y和x进行线性相关检验,已知n是观测值组数,r是相关系数,且已知:①n=7,r=0.953 3;②n=15,r=0.301 2;③n=17,r=0.499 1;④n=3,r=0.995 0.则变量Y和x具有线性相关关系的是( )A.①和② B.①和③ C.②和④ D.③和④解析:由于小概率0.05与n-2在附表中分别查得:①r0.05=0.754;②r0.05=0.514;③r0.05=0.482;④r0.05=0.997.因此知①、③中相关系数比r0.05大,变量Y和x具有线性相关关系.而②、④中的相关系数小于r0.05,故变量Y与x不具有线性相关关系.答案: B8.冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示:杂质高杂质低旧设备37121新设备22202根据以上数据,则( )A .含杂质的高低与设备改造有关B .含杂质的高低与设备改造无关C .设备是否改造决定含杂质的高低D .以上答案都不对解析: 由已知数据得到如下2×2列联表:杂质高 杂质低 合计 旧设备 37 121 158 新设备 22 202 224 合计59323382由公式χ2=-2158×224×59×323≈13.11.由于13.11>6.635,故有99%的把握认为含杂质的高低与设备是否改造是有关的.答案: A 9.(2009·宁夏吴忠)下面是一个2×2列联表:y 1 y 2总计 x 1 a21 73 x 2225 27 总计b46则表中a 、b 处的值分别为( )A .94、96B .52、50C .52、54D .54、52解析: ∵a +21=73,∴a =52. 又∵a +2=b ,知b =54,故选C.答案: C10.已知某车间加工零件的个数x 与所花费时间Y (h)之间的回归直线方程为y =0.01x +0.5,则加工600个零件大约需要( )A .6.5 hB .5.5 hC .3.5 hD .0.5 h解析: 依题意,加工600个零件大约需要0.01×600+0.5=6.5(h).答案: A11.甲、乙两人抢答竞赛题,甲答对的概率为15,乙答对的概率为14,则两人中恰有一人答对的概率为( )A.720B.1220C.120D.220解析: 设甲答对为事件A ,乙答对为事件B ,A 、B 相互独立.P (A )=15,P (B )=14,则甲、乙两人中恰有一人答对的概率为P (C )=P (A B +A B )=P (A B )+P (A B )=P (A )P (B )+P (A )P (B )=15×⎝ ⎛⎭⎪⎫1-14+⎝⎛⎭⎪⎫1-15×14=320+420=720.答案: A12.(2010·广东中山)甲、乙、丙、丁四位同学各自对A 、B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m106115124103则哪位同学的试验结果体现A 、B 两变量有更强的线性相关性( ) A .甲 B .乙 C .丙 D .丁解析:丁同学所得相关系数0.85最大,所以A 、B 两变量线性相关性更强.故选D.答案: D 二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中横线上) 13.某人一周晚上值班2次,在已知他星期日一定值班的前提下,其余晚上值班所占的概率为________.解析: 本题为条件概率,在星期日一定值班的前提下,只需再从其余6天中选一天值班即可,概率为16.答案: 1614.若施化肥量x 与小麦产量y 之间的回归直线方程为y =250+4x ,当施化肥量为50 kg 时,预计小麦产量为________kg.解析: 把x =50 kg 代入y =250+4x ,可求得y =450 kg.答案: 450 15.考察棉花种子是否经过处理跟生病之间的关系,得下表所示的数据:种子处理 种子未处理 合计 得病 32 101 133 不得病 61 213 274 合计93314407根据以上数据得χ2的值是________.解析: 直接代入公式计算得χ2=0.164.答案: 0.16416.某商店统计了最近6个月某商品的进价x 与售价y (单位:元)的对应数据如下表:x 3 5 2 8 9 12 y46391214回归直线方程为________.解析: x =3+5+2+8+9+126=6.5.y =4+6+3+9+12+146=8.∑i =16x i 2=32+52+22+82+92+122=327,∑i =16x i y i =3×4+5×6+2×3+8×9+9×12+12×14=396.b =396-6×6.5×8327-6×6.52≈1.143,a =8-1.143×6.5≈0.57.回归直线方程为y =1.143x +0.57.答案: y =1.143x +0.57三、解答题(本大题共6小题,共70分.解答时应写出必要的文字说明、证明过程或演算步骤)17.(本小题满分10分)甲、乙两个篮球运动员互不影响地在同一位置投球,命中率分别为12与p ,且乙投球2次均未命中的概率为116.(1)求乙投球的命中率p ;(2)求甲投球2次,至少命中1次的概率.解析: (1)方法一:设“甲投球一次命中”为事件A ,“乙投球一次命中”为事件B . 由题意得(1-P (B ))2=(1-p )2=116,解得p =34或p =54(舍去),所以乙投球的命中率为34.方法二:设“甲投球一次命中”为事件A ,“乙投球一次命中”为事件B .由题意得P (B )P (B )=116,于是P (B )=14或P (B )=-14(舍去),故p =1-P (B )=34,所以乙投球的命中率为34.(2)由题设和(1)知,P (A )=12,P (A )=12,故甲投球2次至少命中1次的概率为1-P (A A )=34.18.(本小题满分12分)为了调查经常参加体育锻炼能否预防感冒,经统计得到数据列入下表:感冒 未感冒 合计 经常锻炼 62 206 268 不经常锻炼 164 104 268 合计226310536试问:经常参加体育锻炼能否预防感冒? 解析: 这是一个独立性检验问题, 由公式χ2=n ad -bc 2a +bc +d a +cb +d得χ2=-2268×268×226×310≈79.597,因为79.59>6.635,所以我们有99%的把握说经常参加体育锻炼能有效地预防感冒.19.(本小题满分12分)某公司利润y (单位:千万元)与销售总额x (单位:千万元)之间有如下对应数据:x 10 15 17 20 25 28 32 y11.31.822.62.73.3(1)画出散点图;(2)判断y 与x 是否具有线性相关关系,若有,求出其线性回归方程. 解析: (1)画散点图如图所示.(2)从散点图可看出各样本点都在一直线附近摆动,所以x 、y 之间存在线性相关关系.由表格数据可得:∑i =17x i 2=3 447,∑i =17x i y i =346.3,x =21,y =2.1,进而可求得b =∑i =17x i y i -7x y∑i =17x i 2-7x2=346.3-7×21×2.13 447-7×212≈0.104, a =y -b x =2.1-0.104×21=-0.084.∴x ,y 之间的线性回归方程为y =-0.084+0.104x .20.(本小题满分12分)(2010·课标全国)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者 男女 需要 40 30 不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? 附:χ2=n ad -bc 2a +bc +d a +cb +d解析: (1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要志愿者提供帮助的老年人的比例的估计值为70500=14%.(2)χ2=-2200×300×70×430≈9.967.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.21.(本小题满分12分)为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试分别用列联表和独立性检验的方法分析监督员甲对产品质量好坏有无影响.解析: 2×2列联表如下:合格品数 次品数 总计 甲在生产现场 982 8 990 甲不在生产现场 493 17 510 总 计1 475251 500由列联表可得|ac -bd |=|982×17-493×8|=12 750,相差较大,可在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”.由2×2列联表中数据,计算得到χ2的值为χ2=-2990×510×1 475×25≈13.097>10.828,所以有99.9%的把握认为“质量监督员甲是否在生产现场与产品质量有关系”.22.(本小题满分12分)研究某灌溉渠道水的流速Y 与水深x 之间的关系,测得一组数据如下:水深x (m) 1.40 1.50 1.60 1.70 1.80 1.90 2.00 2.10 流速Y (m/s)1.701.791.881.952.032.102.162.21(1)求Y 对x 的回归直线方程;(2)预测水深为1.95 m 的水的流速是多少?解析: (1)可以采用列表的方法计算a 与回归系数b .序号 xYx 2Y 2xY1 1.40 1.70 1.96 2.890 0 2.3802 1.50 1.79 2.25 3.204 1 2.6853 1.60 1.88 2.56 3.534 4 3.008 4 1.70 1.95 2.89 3.802 5 3.315 5 1.80 2.03 3.24 4.120 9 3.6546 1.90 2.10 3.61 4.410 0 3.9907 2.00 2.16 4.00 4.665 6 4.3208 2.10 2.21 4.41 4.884 14.641∑14.0015.8224.9231.511 6 27.993于是x =18×14.00=1.75,y =18×15.82=1.977 5,b =8×27.993-14×15.828×24.92-14≈0.733.a ≈1.977 5-0.733×1.75≈0.694 8,Y 对x 的回归直线方程为y =a +bx =0.694 8+0.733x .(2)由上述(1)中求出的回归直线方程,把x=1.95代入,得到Y=0.694 8+0.733×1.95≈2.12(m/s).计算结果表明:当水深为1.95 m时可以预测渠道水的流速约为2.12 m/s.。
高二数学 第一章 统计案例章末总结 新人教A版选修1-2

高中数学第一章统计案例章末总结回归方程及其应用对所抽取的样本数据进行分析,分析两个变量之间的关系——线性关系或非线性关系,并由一个变量的变化去推测另一个变量的变化,这就是对样本进行回归分析.某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x取整数)元与日销售量y台之间有如下对应数据:单位x/元35 40 45 50日销售量y/台56 41 28 11(1)(方程的斜率保留一个有效数字).(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润.分析:作出散点图,根据散点图观察是否具有线性相关关系.解析:(1)散点图如图所示:从图中可以看出这些点大致分布在一条直线附近,因此两个变量具有线性相关关系. (2)设回归直线方程为y ^=a ^+b ^x.∵x -=42.5,y -=34,∴b ^=错误!=-错误!≈-3,错误!=错误!-b 错误!=34-(-3)×42.5=161.5.∴y ^=161.5-3x.(2)由题意,有P =(161.5-3x)(x -30)=-3x 2+251.5x -4 845. ∴当x =251.56≈42时,P 有最大值.即预测销售单价为42元时,能获得最大日销售利润.点评:判断两个变量之间是否有线性相关关系一般有两种方法:一是计算样本相关系数;二是画散点图.两种方法要结合题目的要求合理选取,也可同时使用,则判断更加准确.►变式训练1.从某居民区随机抽取10个家庭,获得i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得错误!错误!=720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y =bx +a 中,b =错误!,a =错误!-b 错误!,其中错误!,错误!为样本平均值,线性回归方程也可写为y ^=b ^x +a ^.解析:(1)由题意知:n =10,x -=1n ∑i =1n x i =8010=8,y -=1n ∑i =1ny i =2010=2.又L xx =错误!i y i -n 错误!错误!=184-10×8×2=24,由此得b ^=L xy L xx =2480=0.3,a ^=y --b ^x -=2-0.3×8=-0.4.故所求回归方程为:y =0.3x-0.4.(2)由于变量y 的值随x 的值增加而增加(b ^=0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程,可以预测该家庭的月储蓄为:y =0.3×7-0.4=1.7(千元). 测得一个随机样本的数据如下表所示:x 21 23 25 27 29 32 35 y711212466115325(1)作出x 与(2)建立x 与y 的关系,并预报回归模型; (3)利用所得回归模型预报x =40时y 的值.解析:(1)x 与y 的散点图如下图,有散点分布猜测样本数据分布在一条曲线的附近,这条曲线接近指数函数曲线y =c 1e c 2x ,其中c 1,c 2为常数.(2)对y =c 1e c 2x 两边取对数的ln y =ln c 1+c 2x.令A =ln y ,则A =bx +a ,其中a =ln c 1,b =c 2.将y 与x 之间的数据转化为A 与x 之间的数据:x 21 23 25 27 29 32 35 A1.9462.3983.0453.1784.1904.7455.784可以求得回归直线方程为A =0.272x -3.849,所以y =e 0.272x -3.849. (3)当x =40时,y =e0.272×40-3.849≈1 131.点评:根据样本数据描出散点图,再由散点图直观地观察散点分布符合的函数模型,再根据有关公式进行计算.►变式训练2.在一化学反应过程中,化学物质的反应速度y(g/min )与一种催化剂的量x(g)有关,现收集了8组观测数据列于下表:催化剂的量x/g15 18 21 24 27 30 33 36化学物质的反应 速度y(g·min -1)6 8 30 27 70 205 65 350解析:根据收集的数据,作出散点图(如下图所示),根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y =a e bx的周围,其中a 和b 是待定的参数.令z =ln y ,则z =ln y =bx +ln a ,即变换后的样本点应该分布在直线z =bx +c(c =ln a)附近.有y 与x 的数据表可得到变换后的z 与x 的数据表: x 15 18 21 24 27 30 33 36 z1.7922.0793.4013.2964.2485.3234.1745.858z ^=0.181x -0.848,所以y 与x 之间的非线性回归方程为: y ^=e 0.181x -0.848. 独立性检验及其应用在日常生活中,分类变量是大量存在的,例如吸烟与患肺癌等,在实际问题中,我们常常关心两个变量之间是否有关系.为观察药物A 、B 治疗某病的疗效,某医生将100例该病病人随机地分成两组,一组40人,服用A 药;另一组60人,服用B 药.结果发现:服用A 药的40人中有30人治愈,服用B 药的60人中有11治愈,问A 、B 两药对该疾病的治愈率之间是否有显著差别?解析:为便于将数据代入公式计算,先列出2×2列联表:治愈未愈总计A 药 30 10 40B 药 11 49 60 总计4159100由公式得k =100240×60×41×59≈31.859.因为31.859>10.828,所以我们在犯错误的概率不超过0.001的前提下,认为A 、B 两药对该病的治愈率之间有显著差别.►变式训练3.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[71,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)求样本中日平均生产件数不足60件的工人人数.(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?P(K 2≥k)0.100 0.050 0.010 0.001附:K2=(a+b)(c+d)(a+c)(b+d)解析:(1)由已知得,样本中有“25周岁以上组”工人60名,“25周岁以下组”工人40名.由频率分布直方图知,样本中日平均生产件数不足60件的工人中,“25周岁以上组”工人有60×(0.005×10)=3(人),“25周岁以下组”工人有40×(0.005×10)=2(人),所以样本中日平均生产件数不足60件的工人有5人.(2)由频率分布直方图知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:所以得K2=(a+b)(c+d)(a+c)(b+d)=100×(15×25-×15×45)2 60×40×30×70=2514≈1.79.因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.。
高二数学 第一章 统计案例章末检测 新人教A版选修1-2

高中数学 第一章 统计案例章末检测 新人教A 版选修1-2一、选择题(本大题共10小题,每小题5分,共50分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.对于自变量x 和因变量y ,当x 取值时,y 的取值带有一定的随机性,x ,y 间这种非确定性关系叫(C )A .函数关系B .线性关系C .相关关系D .回归分析2.两个变量x 与y 的回归模型中分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合效果最好的模型是(A )A .模型1的相关指数R 2为0.98B .模型2的相关指数R 2为0.80C .模型3的相关指数R 2为0.50D .模型4的相关指数R 2为0.253.预报变量的值与下列哪些因素有关(D )A .受解释变量的影响与随机误差无关B .受随机误差的影响与解释变量无关C .与总偏差平方和有关与残差无关D .与解释变量和随机误差的总效应有关4.身高与体重的关系可以用________来分析(B )A .残差分析B .回归分析C .二维条形图D .独立检验5.如果有95%的把握说事件A 和B 有关,那么具体算出的数据满足(A )A .K 2>3.841B .K 2<3.841C .K 2>3.635D .K 2<3.6356.若对于变量y 与x 的10组统计数据的回归模型中,相关指数R 2=0.95,又知残差平方和为120.53,则 i =110(y i -y -)2的值为(B )A .241.06B .2 410.6C .253.08D .2 530.8解析:由R 2=1-错误!,得0.95=1-错误!(y i -错误!)2=2 410.6.故选B . 7.变量x 、y 具体线性相关关系,当x 的取值为8,12,14,16时,通过预测知y 的值分别为5,8,9,11,若在实际问题中,y 的预报值最大的是10,则x 的最大取值不能超过(B )A .16B .15C .17D .12解析:因为x =16时,y =11;当x =14时,y =9,所以当y 的最大值为10时,x 的最大值应介于区间(14,16)内,∴选B .8.下表是降耗技术改造后生产甲产品过程中记录的产品x(吨)与相应的生产能耗y(吨标准煤)的几组对数数据,根据表中提供的数据,求出y 关于x 的线性回归方程y ^=0.7x +0.35,那么表中m 的值为(D )A .4.5B .4C .3.5 解析:因为y =y ^=0.7x +0.35过点(x -,y -),又x -=4.5,代入方程得y -=3.5,所以m =3.9.甲、乙、丙、丁四位同学各自对A ,B 两变量的线性相关性试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:则哪位同学的试验结果体现A ,B 两变量有更强的线性相关性(D )A .甲B .乙C .丙D .丁解析:如题中表可知:丁的相关系数r 最大,而残差平方和m 最小,∴丁同学的实验结果体现A ,B 两变量有更强的线性相关性,故选D .10.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面列联表:A .0.5% C .1%B .2% D .5%解析:由表中数据代入公式得K 2=300×(37×143-85×35)2122×178×72×228≈4.514>3.84,∴由95%的把握认为数字成绩与物理成绩有关,因此判断出错率为5%.二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上) 11.对于回归直线方程y =4.75x +257,当x =28时,y 的估计值为____________.答案:39012.已知一个回归方程为y ^=1.5x +4.5,x ∈{1,5,7,13,19},则y -=________.解析:x -=9,∵y -=1.5×9+4.5=18. 答案:1813.如果由一个2×2列联表中的数据计算得k =4.073,那么有________的把握认为两变量有关系,已知P(K 2≥3.841)≈0.05,P(K 2≥5.024)≈0.025.解析:∵K 2=k =4.071>3.841,又P(K 2≥3.841)≈0.05, ∴有95%的把握认为两变量有关系. 答案:95%14.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下:由表中数据,求得线性回归方程为y =0.65x +a .根据回归方程,预测加工70个零件所花费的时间为________分钟.解析:由数据可得x -=30,y -=76,将中心点(30,76)代入线性回归方程可得a ^=76-0.65×30=56.5,所以线性回归方程为y ^=0.65x +56.5.当x =70,y ^=0.65×70+56.5=102.答案:102三、解答题(本大题共6小题,共80分,解答时应写出必要的文字说明、证明过程或演算步骤)15.(12分)在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.答案:作出性别与喜欢吃甜食的列联表如下:16.(12分)学生 A 1 A 2 A 3 A 4 A 5 数学/x 分 89 91 93 95 97 物理/y 分8789899293(1)要从5名学生中选2人参加一项活动,求选中的学生中至少有1人的物理成绩高于90分的概率;(2)请在所给的直角坐标系中画出它们的散点图,并求这些数据的线性回归方程y ^=b ^x +a ^.解析:(1)从5名学生中任取2名学生的所有情况为:(A 4,A 5),(A 4,A 1),(A 4,A 2),(A 4,A 3),(A 5,A 1),(A 5,A 2),(A 5,A 3),(A 1,A 2),(A 1,A 3),(A 2,A 3),共10种情况.其中至少有一人物理成绩高于90分的情况有:(A 4,A 5),(A 4,A 1),(A 4,A 2),(A 4,A 3),(A 5,A 1),(A 5,A 2),(A 5,A 3),共7种情况.故上述抽取的5人中选2人,选中的学生的物理成绩至少有1人的成绩高于90分的概率P =710.(2)散点图如下所示:可求得:x -=89+91+93+95+975=93,y -=87+89+89+92+935=90,b ^=3040=0.75,a ^=y --b ^x -=20.25. 故y 关于x 的线性回归方程是:y ^=0.75x +20.25.17.(14分)在北京奥运会上,水立方游泳池项目的世界纪录屡屡被打破,充满了神奇色彩.据有些媒体的报道,这可能与运动员身上的新式泳衣有着绝对的关系.为此有人进行了调查统计,对某游泳队的 96名运动员进行了调查,其中使用新式泳衣成绩提高的有12人,没有提高的有36人;没有使用新式泳衣成绩提高的有8人,没有提高的有40人.请根据该游泳队的成绩判断成绩提高与使用新式泳衣是否有关系.解析:根据给出的数据可以列出下列2×2列联表:成绩提高 成绩没有提高总计 用新式泳衣 12 36 48 未用新式泳衣8 40 48 总计207676于是K 2的观测值k =48×48×20×76≈1.011,由于1.011<2.706,所以我们没有理由认为成绩提高与使用新式泳衣有关系.18.(14分)假设关于某设备的使用年限x 和所支出的维修费用y(万元),有如下的统计资料:使用年限x 2 3 4 5 6 维修费用y2.23.85.56.57.0若由资料可知(1)求线性回归方程y ^=a ^+b ^x 的回归系数a ^,b ^; (2)判断回归模型拟合效果的好坏.分析:y 对x 呈线性相关关系,利用公式分别计算即可. 解析:(1)由已知数据制表如下:i 1 2 3 4 5 合计 x i2345620y i 2.23.8 5.5 6.5 7.0 25 x i y i4.4 11.4 22.0 32.5 42.0 112.3 x 2i4916253690x -=4,y =5,错误!i y i =112.3, 于是有b ^=112.3-5×4×590-5×42=12.310=1.23, a ^=y --b ^x -=5-1.23×4=0.08.(2)由(1)可求得回归直线方程为y ^=1.23x +0.08. 由此列表如下:i 1 2 3 4 5 x i 2 3 4 5 6 y i 2.2 3.8 5.5 6.5 7.0 y ^i2.543.7756.237.46∴回归模型的拟合效果很好.19.(14分)某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加 班级工作 不太主动参 加班级工作合计学习积 极性高 18725学习积极 性一般 6 19 25 合计242650少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关?并说明理由?解析:(1)积极参加班级工作的学生有24人,总人数为50人.概率为2450=1525;不太主动参加班级工作且学习的积极性一般的学生有19人,概率为1950.(2)由表中数据可得K 2=50(18×19-6×7)225×25×24×26=15013≈11.5>10.828∴由99.9%的把握说学习积极性与对待班级工作的态度有关系.20.(14分)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,据此资料,你是否认为“体育迷”与性别有关?非体育迷体育迷合计 男 女 合计(2),已知“超级体育迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )解析:(1)25人,从而2×2列联表如下:将2×2K 2=n (ad -bc )2(a +c )(b +d )(a +b )(c +d )=100×(30×10-45×15)275×25×45×55=10033≈3.030.因为3.030>2.706,所以有90%的把握认为“体育迷”与性别有关.(2)由频率分布直方图可知,“超级体育迷 ”有5人.从而从“超级体育迷”中任意选取2人所组成的基本事件空间为Ω={(a 1,a 2),(a 1,a 3),(a 2,a 3),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)}, 其中a i 表示男性,i =1,2,3,b j 表示女性,j =1,2.Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.设A 表示“任选2人中,至少有1人是女性”这一事件,则A ={(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)},事件A 由7个基本事件组成,因而P(A)=710.。
人教新课标版数学高二-数学选修1-2第一章 统计案例 章末综合检测

(时间:100分钟;满分:120分)一、选择题(本大题共10小题,在每小题给出的四个选项中,只有一项是符合题目要求的)1.以下可用来分析身高与体重间关系的是( ) A .残差图 B .回归分析 C .等高条形图D .独立性检验解析:选B.因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决. 2.已知样本点散落在某一条曲线y =e a+bx附近,作变换z =ln y ,利用线性回归模型来求其中的参数a ,b ,则拟合其变换后的样本点的直线方程为( )A.z ^=b ^x +a ^B.z ^=b ^x +e a ^C.z ^=b ^x +ln a ^D.z ^=x ln b +a ^解析:选A.对方程y =e a +bx 两边取以e 为底的对数即得. 3.下列有关线性回归的说法,不正确的是( )A .变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C .线性回归直线方程最能代表观测值x ,y 之间的关系D .任何一组观测值都能得到具有代表意义的回归直线方程解析:选D.根据课本相关概念容易判断A 、B 、C 正确.而D 中并非任何一组观测值都能得到具有代表意义的回归直线方程,只是说总体上大多数观测值符合,也可能有个别的观测值差距较大.4.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从下图可以看出( )A.性别与喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%解析:选C.显然图中,男生喜欢理科的比例为60%,而女生比例仅为20%,这两个比例差别较大,说明性别与是否喜欢理科是有关系的,因此,男生比女生喜欢理科的可能性更大一些.5.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A.100个心脏病患者至少有99人打鼾B.1个人患心脏病,则这个人有99%的概率打鼾C.100个心脏病患者中一定有打鼾的人D.100个心脏病患者中可能一个打鼾的人都没有解析:选D.这是独立性检验,犯错误的概率在不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义答案应选D.6.下列说法正确的是()A.预报变量的值受解释变量的影响,与随机误差无关B.预报变量的值受随机误差的影响,与解释变量无关C.预报变量的值与总偏差平方和有关,与残差无关D.预报变量的值与解释变量和随机误差的总效应有关解析:选D.依据预报变量的特点知与解释变量和随机误差的总效应有关.7.设两个变量x和Y之间具有线性相关关系,它们的相关系数是r,Y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有()A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反解析:选A.当斜率b>0时,说明两个变量正相关,∴r>0;当斜率b<0时,说明两个变量负相关,∴r<0,故b与r的符号相同.8.为了考察两个变量x和Y之间的线性相关性,甲、乙两位同学各自独立地做了60次和100次试验,并且利用线性回归的方法,求得回归直线分别为m和n,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量Y的观测数据的平均值都是t,那么下列说法正确的是()A.m和n有交点(s,t)B.m和n相交,但交点不一定是(s,t)C.m和n必定平行D.m和n必定垂直解析:选A.回归直线方程过定点(x,y),因为在m和n中x与y的平均值都相等,所以m和n必有交点(s,t).9.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),变量U 与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r2<r1<0 B.0<r2<r1C.r2<0<r1D.r2=r1解析:选C.由散点图可得:变量Y与X成正相关,变量V与U成负相关,故r1>0,r2<0.10.已知两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35,若“X与Y有关系”的可信程度为90%,则c等于() A.4 B.5C.6 D.7解析:选B.由a=10,b=21,c+d=35可得n=66,d=35-c,a+b=31,a+c=10+c,b+d=56-c,ad=10(35-c),bc=21c.∵“X与Y”有关系的可信度为90%,则随机变量K2的观测值k>2.706,得66×(350-10c-21c)2>2.706,此时代入检验,得c=5符合题意.31×35×(10+c)(56-c)二、填空题(本小题共5小题,请把正确的答案填在题中横线上)11.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=a+bx i+e i(i=1,2,…,n),若e i恒为0,则R2为________.解析:若e i 恒为0,则残差平方和∑i =1n(y i -y ^i )2=∑i =1ne 2i =0,而R 2=1-∑i =1n(y i -y ^i )2∑i =1n(y i -y )2=1-0=1.答案:112.某校高二(8)班学生每周用于数学学习的时间x (单位:小时)与数学成绩y (单位:分)构成如下数据(15,79),(23,97),(16,64),(24,92),(12,58).求得的回归直线方程为y ^=2.5x +a ^,则某同学每周学习20小时,估计数学成绩约为________分.解析:x =15×(15+23+16+24+12)=18,y =15×(79+97+64+92+58)=78.把(x ,y )代入y ^=2.5x +a ^, 可求得a ^=33.把x =20代入y ^=2.5x +33得y ^=2.5×20+33=83. 答案:8313.若两个变量的残差平方和是325,∑i =1n(y i -y )2=923,则随机误差对预报变量的贡献率约为________.解析:相关指数R 2表示解释变量对预报变量变化的贡献率,故随机误差对预报变量的贡献率为残差平方和总偏差平方和×100%=325923×100%≈35.2%.答案:35.2%14.某校在高二文理分科时,对学生数学成绩是否优秀和所选科类进行了调查,具体数据如下:根据上述数据,如果判断“科类与数学是否优秀有关系”,那么这种判断出错的概率为________.解析:由于k =50×(10×7-13×20)223×27×30×20≈4.844>3.841,所以我们有95%的把握认为“科类与数学是否优秀有关系”,因此这种判断出错的概率约为0.05.答案:0.0515.若对于变量y 与x 的10组统计数据的回归模型中,相关指数R 2=0.95,又知残差平方和为120.53,那么∑i =110(y i -y )2的值为________.解析:由R 2=1-∑i =110(y i -y ^i )2∑i =110(y i -y )2,得0.95=1-120.53∑i =110(y i -y )2,得∑i =110(y i -y )2=120.531-0.95=2 410.6.答案:2 410.6三、解答题(本大题共5小题,解答时应写出必要的文字说明、证明过程或演算步骤) 16.某地区的人口普查表明,该地区共有男性15 729 245人,其中3 497个是聋哑人,共有女性16 799 031人,其中3 072个是聋哑人,能否在犯错误的概率不超过0.001的前提下推断该地区性别与是否为聋哑人之间是否有关系.解:作列联表:k =32 528 276×(3 497×16 795 959-3 072×15 725 748)215 729 245×16 799 031×6 569×32 521 707≈62.64≥10.828,所以在犯错误的概率不超过0.001的前提下认为“性别与是否为聋哑人”有关.17.已知某商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:x 1416182022y 121075 3(1)画出y关于x(2)求出回归直线方程;(3)计算R2的值,并说明回归模型拟合程度的好坏(参考数据:x=18,y=7.4,∑i=15x2i=1 660,∑i=15y2i=327,∑i=15x i y i=620,∑i=15(y i-y^i)2=0.3,∑i=15(y i-y)2=53.2).解:(1)散点图如下.(2)x=18,y=7.4,∑i=15x2i=1 660,∑i=15y2i=327,∑i=15x i y i=620,所以b^=∑i=15x i y i-5x y∑i=15x2i-5x2=-1.15,a^=y-b^x=28.1.回归直线方程为:y^=-1.15x+28.1,(3)∑i =15(y i -y ^i )2=0.3,∑i =15(y i -y )2=53.2, R 2=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2≈0.994,回归模型拟合效果很好.18.某种书每册的成本费y (元)与印刷册数x (千册)有关,经统计得到数据如下:检验每册书的成本费y 与印刷册数的倒数1x 之间是否具有线性相关关系?如有,求出y对x 的回归方程.解:把1x 置换为z ,则有z =1x ,从而z 与y的数据为 用线性回归方程来拟合.z =110×(1+0.5+0.333+0.2+0.1+0.05+0.033+0.02+0.01+0.005)=0.225 1,y =110×(10.15+5.52+4.08+…+1.15)=3.14, ∑i =110z 2i =12+0.52+0.3332+…+0.012+0.0052≈1.415, ∑i =110y 2i =10.152+5.522+…+1.212+1.152=171.803,∑i =110z i y i =1×10.15+0.5×5.52+…+0.005×1.15=15.221 02,所以b^=∑i=110z i y i-10z y∑i=110z2i-10z2≈8.976,a^=y-b^z=3.14-8.976×0.225 1≈1.120,所以所求的z与y的回归方程为y^=8.976z+1.120.又因为z=1x,所以y^=8.976x+1.120.19.某地区男性身高与体重的数据如下表:身高x/cm60708090100110体重y/kg 6.137.909.9912.1515.0217.50身高x/cm120130140150160170体重y/kg20.9226.8631.1138.8547.2555.05(1)求y与x之间的回归方程;(2)求残差平方和与R2.解:(1)根据上表中数据画出散点图.由图看出,样本点分布在某条指数函数曲线y=c1e c2x的周围,于是令z=ln y.x 60708090100110120130140150160170 z 1.81 2.07 2.30 2.50 2.71 2.86 3.04 3.29 3.44 3.66 3.86 4.01由表中数据可得z与x之间的回归直线方程为z^=0.693+0.020x,则有y ^=e 0.693+0.02x(2)残差平方和:∑i =112e ^2i ≈33.71,相关指数:R 2=1-∑i =112e ^2i∑i =112(y i -y )2=0.988.20.针对时下的“韩剧热”,某校团委对“学生性别与是否喜欢韩剧有关”作了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?解:设男生人数为x ,依题意可得列联表如下:K 2>3.841, 即K 2=3x 2(x 6×x 6-5x 6×x 3)2x ·x 2·x 2·x =3x 8>3.841,解得x >10.24,∵x 2,x6为整数,∴若在犯错误的概率不超过0.05的前提下,认为是否喜欢韩剧和性别有关,则男生至少有12人.。
人教A版高中数学选修高二新课程第一章统计案例章末质量评估新

章末质量评估(一)(时间:100分钟 满分:120分)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的) 1.下列有关线性回归的说法不正确的是( ).A .变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在平面直角坐标系中用描点的方法得到具有相关关系的两个变量的一组数据的图形叫做散点图C .线性回归直线得到具有代表意义的回归直线方程D .任何一组观测值都能得到具有代表意义的回归直线方程解析 任何一组观测值并不能都得到具有代表意义的回归直线方程. 答案 D2.身高与体重有关系可以用________分析来分析.( ).A .残差B .回归C .等高条形图D .独立检验解析 因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决. 答案 B3.设有一个回归方程为y ^=3-5x ,当变量x 增加一个单位时( ).A .y 平均增加3个单位B .y 平均减少5个单位C .y 平均增加5个单位D .y 平均减少3个单位解析 -5是斜率的估计值,说明x 每增加一个单位,y 平均减少5个单位. 答案 B4.已知一个线性回归方程为y ^=1.5x +45,其中x 的取值依次为1,7,5,13,19,则y =( ).A .58.5B .46.5C .60D .75解析 x =1+7+5+13+195=9,因为回归直线方程过点(x ,y ),所以y =1.5×x +45=1.5×9+45=58.5. 答案 A5.一位母亲记录了儿子3~9岁的身高,数据略,由此建立的身高与年龄的回归模型为y ^=7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ).A .身高一定是145.83 cmB .身高在145.83 cm 以上C .身高在145.83 cm 左右D .身高在145.83 cm 以下解析 回归模型只能进行预测,应选C. 答案 C6.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施( ).A.有关 C .关系不明确D .以上都不正确解析 随机变量K 2的观测值k =100×(48×12-38×2)250×50×86×14≈8.306>6.635,则认为“实验效果与教学措施有关”的概率为0.99. 答案 A7.如图,5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( ).A .相关系数r 变大B .残差平方和变大C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强解析 由题中散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小. 答案 B8.(2012·济宁模拟)某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( ).A .83%B .72%C .67%D .66%解析 因为当y ^=7.675时,x =7.675-1.5620.66≈9.262,所以7.6759.262≈0.829≈83%. 答案 A9.变量x 、y 具有线性相关关系,当x 取值为16,14,12,8时,通过观测得到y 的值分别为11,9,8,5.若在实际问题中,y 最大取值是10,则x 的最大取值不能超过( ).A .14B .15C .16D .17解析 根据题意y 与x 呈正相关关系,由最小二乘法或计算器求得回归系数a ^≈-0.857,b ^≈0.729,所以线性回归方程为y ^=0.729x -0.857. 当y ^=10时,得x ≈15. 答案 B10.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面列联表:( ).A .0.5%B .1%C .2%D .5% 解析 代入公式得K 2的观测值k =300×(37×143-35×85)272×228×122×178≈4.514>3.841,查表可得. 答案 D二、填空题(本大题共4小题,每小题4分,共16分.把答案填在题中横线上) 11.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示:人.解析 由表中数据可知,男性不能自理的频率为23500, 女性不能自理的频率为21500, 故15 000×⎝ ⎛⎭⎪⎫23500-21500=60(人).答案 6012.(2012·湖南六校联考)甲、乙、丙、丁四位同学各自对A ,B 两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:相关性.解析 由题中表可知,丁同学的相关系数最大且残差平方和最小,故丁同学的试验结果体现A ,B 两变量有更强的线性相关性. 答案 丁13.若两个分类变量X 与Y 的列联表为:则“X 与Y 解析 由列联表数据,可求得随机变量K 2的观测值 k =81×(10×16-40×15)225×56×50×31≈7.227>6.635.因为P (K 2≥6.635)≈0.01,所以“x 与y 之间有关系”出错的概率仅为0.01. 答案 0.0114.(2012·东北四校联考)某小卖部为了了解热茶销售量y (杯)与气温x (℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:由表中数据算得线性回归方程y =b x +a 中的b ≈-2,预测当气温为-5 ℃时,热茶销售量为________杯.(已知回归系数b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b ^x )解析 根据表格中的数据可求得 x =14×(18+13+10-1)=10, y =14×(24+34+38+64)=40. ∴a =y -b ^x =40-(-2)×10=60, ∴y ^=-2x +60,当x =-5时,y ^=-2×(-5)+60=70. 答案 70三、解答题(本大题共5小题,共54分.解答应写出必要的文字说明,证明过程或演算步骤)15.(10分)在一次恶劣气候的飞行航程中调查男女乘客在飞机上晕机的情况,共调查了89位乘客,其中男乘客有24人晕机,31人不晕机;女乘客有8人晕机,26人不晕机.根据此材料你是否认为在恶劣气候飞行中男人比女人更容易晕机?解 由已知数据列出2×2列联表.根据公式k =55×34×32×57≈3.689.由于k >2.706,我们有90%的把握认为在本次飞机飞行中晕机与男女有关.尽管从这班飞行中男性晕机的比例为2455比女性晕机的比例834要高,但我们不能认为恶劣气候下飞行中男性比女性更容易晕机,因为这种独立性检验的结果犯错误的概率为10%,从而说明犯错误的可能性较大.16.(10分)某地10户家庭的年收入和年饮食支出的统计资料如下表:(2)如果某家庭年收入为9万元,预测其年饮食支出.解 (1)由题意知,年收入x 为解释变量,年饮食支出y 为预报变量,作散点图如下图所示:从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系. (2)x =6,y =1.83,∑i =110x 2i =406,∑i =110y 2i =35.13,∑i =110x i y i =117.7,b ^≈0.172,a ^=y -b ^x =0.798,从而得到回归直线方程为y ^=0.172x +0.798.当x =9时,y ^=0.172×9+0.798=2.346(万元).17.(10分)在某次试验中,有两个试验数据x ,y 统计的结果如下面的表格1.表格1(1)在给出的坐标系中画出x ,y 的散点图. (2)补全表格2,然后根据表格2的内容和公式b ^=∑i =1nx i y i -n x y ∑i =1nx 2i -n x 2,a ^=y -b ^x .①求出y 对x 的回归直线方程y ^=b ^x +a ^中回归系数a ^,b ^; ②估计当x 为10时y ^的值是多少? 解 (1)x 、y 的散点图如图所示(2)表格如下计算得x =3,y =3.6,b ^=∑i =15xi y i -5x y ∑i =15x 2i -5x 2=61-5×3×3.655-5×32=0.7,a ^=y -b ^x =3.6-0.7×3=1.5, 所以y ^=b ^x +a ^=0.7x +1.5, ∴当x 为10时,y ^=8.5.18.(12分)有两个分类变量x 与y ,其一组观测值如下面的2×2列联表所示:其中a,15-a 0.1的前提下认为x 与y 之间有关系?解 查表可知,要使在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系,则k ≥2.706,而k =65×[a (30+a )-(20-a )(15-a )]220×45×15×50=60×(65a -300)220×45×15×50=13×(13a -60)260×90.由k ≥2.706得a ≥7.19或a ≤2.04. 又a >5且15-a >5,a ∈Z ,即a =8,9.故a 为8或9时,在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系. 19.(12分)假定小麦基本苗数x 与成熟期有效穗y 之间存在相关关系,今测得5组数据如下:(1)(2)求y 与x 之间的回归直线方程,对于基本苗数56.7预报其有效穗; (3)计算各组残差,并计算残差平方和;(4)求R 2,并说明残差变量对有效穗的影响占百分之几. 解 (1)如下图所示:(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系. 设回归方程为y ^=b ^x +a ^,x =30.316,y =43.5,∑i =15x 2i =5 090.256,x y =1 320.66,y 2=1 892.25, x 2=919.059 9,∑i =15x i y i =6 737.322.则b^=∑i =15x i y i -5x y∑i =15x 2i -5x 2≈0.29.a^=y -b ^x ≈34.705.故所求的线性回归方程为y ^=0.29x +34.705. 当x =56.7时,y ^=0.29×56.7+34.705=51.148,估计成熟期有效穗51.148.(3)由于y =bx +a +e ,可以算得e i =y i -y ^i 分别为e 1=0.345,e 2=0.776 8,e 3=-0.505,e 4=-2.219,e 5=1.619.残差平方和:∑i =15e 2i =8.522 59.(4)总偏差平方和:∑i =15(y i -y )2=50.18, 回归平方和:50.18-8.522 59=41.657 41,R 2=41.657 4150.18=41.657 4150.18≈0.830.∴解释变量小麦基本苗数对总效应贡献了约83%. 残差变量贡献了约1-83%=17%.。
人教版2019学年高中数学第一章统计案例章末复习同步学案新人教B版选修1_2

第一章统计案例章末复学目 1. 理解独立性的基本思想及施步.2. 会求回直方程,并用回直行.1.2× 2 列表2× 2 列表如表所示:B B合A n n n+11121A n21n22n2+合n+1n+2n其中+ 1=11+21,+2= 12+22,n n n n n nn 1+11122+2122= n + n, n= n +n,n=n11+ n21+ n12+ n22. 2.最小二乘法于一数据 ( x i,y i ) ,i= 1,2,⋯, n,若是它性有关,回直方程^ ^y= b x+^^=!,!=!-!! .a,其中 b=!3.独立性常用量χ2= ! 来两个量可否有关系.型一独立性例 1认识某班学生喜打球可否与性有关,本班48 人行了卷获取了以下的2× 2 列联表:喜爱打篮球不喜爱打篮球共计男生6女生10共计482.已知在全班48 人中随机抽取 1 人,抽到喜爱打篮球的学生的概率为3(1)请将上面的 2× 2 列联表补充完满; ( 不用写计算过程 )(2)可否在出错误的概率不高出 0.05 的前提下认为喜爱打篮球与性别有关?说明你的原因.考点独立性查验及其基本思想题点独立性查验的综合应用解(1) 列联表补充以下:喜爱打篮球不喜爱打篮球共计男生22628女生101020共计321648(2) 由χ2=错误 ! ≈ 4.286.由于 4.286>3.841 ,因此能在出错误的概率不高出0.05 的前提下认为喜爱打篮球与性别有关.反省与感悟经过公式χ 2=错误!计算出χ 2的值,再与临界值作比较,最后得出结论.追踪训练 1 奥运会期间,为检查某高校学生可否愿意供应志愿者服务,用简单随机抽样方法从该校检查了 60 人,结果以下:可否愿意供应志愿者服务愿意不愿意性别男生2010女生1020(1) 用分层抽样的方法在愿意供应志愿者服务的学生中抽取 6 人,其中男生抽取多少人?(2) 你可否在出错误的概率不高出的前提下认为该高校学生可否愿意供应志愿者服务与性别有关?下面的临界值表供参照:20P(χ ≥ x )x0考点独立性查验思想的应用题点独立性查验在分类变量中的应用20解(1) 由题意,可知男生抽取6×20+10=4( 人).(2) χ2=错误 ! ≈ 6.667 ,由于 6.667 > 6.635 ,因此能在出错误的概率不高出0.01 的前提下认为该高校学生可否愿意供应志愿者服务与性别有关.种类二线性回归剖析例 2某城市理论展望2010 年到 2014年人口总数与年份的关系如表所示:年份 201x( 年)01234人口数 y(十万)5781119(1)请画出上表数据的散点图;^^^(2) 请依照上表供应的数据,求出y 对于 x 的回归直线方程y=b x+a;(3) 据此估计2019 年该城市人口总数.考点回归剖析思想的应用题点回归剖析思想的应用解 (1) 散点图如图:(2) 由于x=0+ 1+2+3+4= 2,5y =5+ 7+ 8+11+ 19= 10,55i i=0× 5+1× 7+2× 8+3×11+4×19= 132,x yi = 15x2i = 02+ 12+ 22+ 32+ 42= 30,i = 1^132-5×2×10=3.2 ,因此 b=30-5×22^^x =3.6.a=y- b^因此回归直线方程为y= x+3.6.^(3) 令x= 9,则 y=3.2 × 9+ 3.6 = 32.4 ,故估计 2019 年该城市人口总数为32.4( 十万 ) .反省与感悟解决回归剖析问题的一般步骤(1)画散点图.依照已知数据画出散点图.(2)判断变量的有关性并求回归方程.经过察看散点图,直观感知两个变量可否拥有有关关系;在此基础上,利用最小二乘法求回归系数,尔后写出回归方程.(3)本质应用.依照求得的回归方程解决实责问题.追踪训练2某运动员训练次数与运动成绩之间的数据关系以下:次数 x3033353739444650成绩 y3034373942464851(1)作出散点图;(2)求出回归直线方程;(3)计算有关系数并进行有关性查验;(4) 试展望该运动员训练47 次及 55 次的成绩.解(1) 作出该运动员训练次数x 与成绩 y 之间的散点图,以以下列图,由散点图可知,它们之间拥有线性有关关系.(2)列表计算:次数 x i成绩 y i x i2y i2x i y i30309009009003334 1 089 1 156 1 1223537 1 225 1 369 1 2953739 1 369 1 521 1 4433942 1 521 1 764 1 6384446 1 936 2 116 2 0244648 2 116 2 304 2 2085051 2 500 2 601 2 550由上表可求得8x = 39.25 , y =40.875 ,∑x i2= 12 656 ,i= 188x i y i=13 180,∑y i2=13 731,∑i = 1i = 18xiyi- 8x y^∑^^i = 1,∴ b=≈ 1.041 5 , a = y- b x =- 0.003 88 82∑ x2i - 8 xi = 1∴回归直线方程为y =1.041 5 - 0.003 88.x(3)计算有关系数 r =0.992 7,因此运动员的成绩和训练次数两个变量有较强的有关关系.(4) 由上述剖析可知,我们可用回归直线方程y=1.041 5 x-0.003 88作为该运动员成绩的预告值.将 x=47和 x=55分别代入该方程可得y≈49和 y≈57.故展望该运动员训练47 次和 55次的成绩分别为49 和 57.1.从某地域老人中随机抽取500 人,其生活可否自理的情况以下表所示,则()性别人数男女生活可否自理能178278不能够2321A. 有 95%的掌握认为老人生活可否自理与性别有关B.有 99%的掌握认为老人生活可否自理与性别有关C.没有充足原因认为老人生活可否自理与性别有关D.以上都不对考点独立性查验及其基本思想题点独立性查验的思想答案C剖析经计算,得χ 2=错误 !≈2.925<3.841 ,故我们没有充足的原因认为老人生活可否自理与性别有关.2.“回归”一词是在研究子女的身高与父亲母亲的身高之间的遗传关系时由高尔顿提出的,他的研究结果是子代的平均身高向中心回归.依照他的结论,在儿子的身高y 与父亲的^ ^ ^^)身高 x 的回归直线方程 y=b x+a中,b的值(A.在 ( - 1,0) 内B.等于 0C.在 (0,1) 内D.在 [1 ,+∞ ) 内考点线性回归剖析题点回归直线方程的应用答案C剖析子代平均身高向中心回归,^b应为正的真分数,应选 C.3.四名同学依照各自的样本数据研究变量x, y 之间的有关关系,并求得回归方程,分别获取以下四个结论:^① y 与 x 负有关且y= x-;^② y 与 x 负有关且y=- x+;③ y 与 x ^;正有关且 y = 5.437 x +④ y 与 x^x -4.578.正有关且 y =-其中必然不正确的结论的序号是()A .①②B .②③C .③④D .①④考点 线性回归剖析题点 回归直线方程的应用答案 D剖析①中,回归方程中 x 的系数为正,不是负有关;④中,回归方程中x 的系数为负,不是正有关,因此①④必然不正确.^ ^^时,对应的 y 的估计值是 17,当 x = 8 时,对应 4.对于回归直线方程 y = b x + a ,当 x = 3 的 y 的估计值是 22,那么,该回归直线方程是 ________,依照回归直线方程判断当x =________时, y 的估计值是 38. 考点 线性回归剖析题点 回归直线方程的应用答案 ^y = x +14 24剖析第一把两组值代入回归直线方程,得^^^3b + a = 17,b = 1,^ 解得^^8b + a = 22, a = 14.^因此回归直线方程是y = x + 14.令 x + 14= 38,可得 x = 24,即当 x = 24 时, y 的估计值是 38.1.成立回归模型的基本步骤(1) 确定研究对象,明确哪个变量是自变量,哪个变量是因变量. (2) 画出散点图,察看它们之间的关系. (3) 由经验确定回归方程的种类.(4) 依照必然的规则估计回归方程中的参数.2.独立性查验是对两个分类变量间可否存在有关关系的一种案例剖析方法 .一、选择题1.当χ2>3.841 时,认为事件A与事件 B()A.有 95%的掌握有关B.有 99%的掌握有关C.没有原因说它们有关D.不确定答案 A2.下表显示出样本中变量y 随变量 x 变化的一组数据,由此判断它最可能是() x45678910y14181920232528A. 线性函数模型B.二次函数模型C.指数函数模型D.对数函数模型考点回归剖析题点成立回归模型的基本步骤答案A剖析画出散点图 ( 图略 ) 能够获取这些样本点在某一条直线上或在该直线周边,故最可能是线性函数模型.3.下表是某厂1~ 4 月份用水量 ( 单位:百吨 ) 的一组数据:月份 x1234用水量 y43由散点图可知,用水量y 与月份 x 之间有较好的线性有关关系,其回归直线方程是^y=-^^)0.7 x+ a,则 a等于 (A.10.5 B.5.15 C. 5.2 D .考点回归直线方程题点样本中心点的应用答案D^剖析样本点的中心为(2.5,3.5),将其代入回归直线方程可解得a=5.25.4.据统计,用于数学学习的时间( 单位:小时 ) 与成绩 ( 单位:分 ) 近似于线性有关关系,对某小组每周用于数学学习时间x 与数学成绩y 进行数据收集如表:x1516181922y10298115115120由表中样本数据求回归直线方程^ ^ ^^ ^y=110的地址关系y= bx+a,则点(a,b)与直线 x+18为 ()A.点在直线左侧B.点在直线右侧C.点在直线上D.无法确定考点回归直线方程题点样本点中心的性质答案C剖析由题意知 x =18, y =110,样本点中心为^ (18,110) 在回归直线上,故 110= 18b+^^ ^a,即点( a, b)在直线上.5.某察看团对全国 10 大城市进行员工人均薪水水平x(单位:千元)与居民人均花销水平y(单位:千元)统计检查, y 与 x 拥有线性有关关系,回归直线方程为^y= 0.66 x+ 1.562.若某城市居民人均花销水平为7.675 千元,估计该城市人均花销额占人均薪水收入的百分比约为 ()A.83% B . 72% C.67% D .66%考点线性回归剖析题点回归直线方程的应用答案A剖析将 y=代入回归直线方程,可计算得x≈9.26 ,因此该城市人均花销额占人均薪水收入的百分比约为7.675 ÷9.2 6≈0.83 ,即约为83%.6.已知变量x和y知足关系y=- 0.1 x+1,变量y与z正有关.以下结论中正确的选项是() A.x与y正有关,x与z负有关B.x与y正有关,x与z正有关C.x与y负有关,x与z负有关D.x与y负有关,x与z正有关考点线性回归剖析题点回归直线方程的应用答案C剖析由于y =-+ 1,- 0.1<0 ,因此x与y负有关.又y与z正有关,故可设z=xay+ b( a>0),因此 z=- ax+a+ b,- a<0,因此 x 与 z 负有关.应选 C.二、填空题7.已知x与y之间的一组数据:x0246y a353a已求得对于 y 与 x 的回归直线方程为考点线性回归剖析题点回归直线方程的应用答案^y = x+,则 a=________.剖析x =3, y = a+2,将(3, a+2)代入方程,得a+2=+,解得 a=2.15. 8.某工厂为了新研发的一种产品进行合理订价,将该产品按起初拟订的价钱进行试销,获取以下数据:单位 x(元)456789销量 y(件)908483807568由表中数据,求得回归直线方程为^^y=- 4x+a,若在这些样本点中任取一点,则它在回归直线左下方的概率为________.考点线性回归剖析题点回归直线方程的应用答案1 3剖析由表中数据得 x = 6.5 , y =^^^ 80,由点 ( x , y ) 在直线y=- 4x+a上,得a=106,即回归直线方程为^x+106,经过计算只有点(9,68)和(5,84)在直线的左下y =-42 1方,故所求概率为= .6 39.某工厂为了检查工人文化程度与月收入之间的关系,随机检查了部分工人,获取以下表所示的 2× 2 列联表 ( 单位:人 ) :月收入 2 000 元以下月收入 2 000元及以上总计高中文化以上104555高中文化及以下203050总计3075105由 2× 2 列联表计算可知,我们有 ________以上的掌握认为“文化程度与月收入有关系”.P(χ2≥ x0)x0考点独立性查验及其基本思想题点独立性查验的方法答案97.5%2剖析由表中的数据可得χ =错误!≈ ,因此我们有97.5%以上的掌握认为“文化程度与月收入有关系”.10.某医疗研究所为了查验某种血清预防感冒的作用,把500 名使用血清的人与其他500名未使用血清的人一年中的感冒记录作比较,提出假定H0:“这种血清不能够起到预防感22冒的作用”,利用 2× 2 列联表计算得χ ≈ ,经查临界值表知P(χ ≥3.841)≈0.05.①在出错误的概率不高出5%的前提下认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,则他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%.考点独立性查验及其基本思想题点独立性查验的方法答案①剖析查临界值表知P(χ2≥3.841)≈,故有95%的掌握认为“这种血清能起到预防感冒的作用” .95%仅是指“血清与预防感冒有关”的可信程度,但也有“在100 个使用血清的人中一个患感冒的人也没有”的可能.故答案为①.三、解答题11.某城区为研究城镇居民家庭月人均生活费支出和月人均收入的有关关系,随机抽取10户进行检查,其结果以下:月人均收入x(元)300390420520570月人均生活费y(元)255324335360450月人均收入x(元)700760800850 1 080月人均生活费y(元)520580*********(1)作出散点图;(2)求出回归直线方程;(3) 试展望月人均收入为 1 100 元和月人均收入为 1 200 元的两个家庭的月人均生活费.考点题点解 (1) 作出散点图以以下列图,由图可知月人均生活费与月人均收入之间拥有较强的线性有关关系.(2) 经过计算可知x =639, y =480.4 ,10∑ x i2=4 610 300i =110,∑ x y =3 417 560,i = 1 i i10xiyi- 10 x y^∑^^i = 1,∴ b =≈ 0.659 9 , a= y - b x =58.723 9 10x2∑ x2i - 10i = 1∴回归直线方程为^=0.659 9 x+ 58.723 9. y(3)由以上剖析可知,我们能够利用线性回归方程^y = 0.659 9 x+ 58.723 9来计算月人均生活费的展望值.将 x=1 100代入,得 y≈,将 x=1 200代入,得 y≈850.60.故展望月人均收入分别为 1 100 元和 1 200 元的两个家庭的月人均生活费分别为元和 850.60 元.12.某公司有两个分厂生产某种零件,按规定内径尺寸( 单位:mm)的值落在 [29.94,30.06)的零件为优秀品.从两个分厂生产的零件中各抽出了500 件,量其内径尺寸,得结果如下表:甲厂:分组[29.86 ,[29.90 ,[29.94 ,[29.98 ,,[30.06 ,[30.10 ,29.90)29.94)29.98)30.02)30.06)30.10)30.14]频数12638618292614乙厂:分组[29.86 ,[29.90 ,[29.94 ,[29.98 ,,[30.06 ,[30.10 ,29.90)29.94)29.98)30.02)30.06)30.10)30.14]频数297185159766218(1)试分别估计两个分厂生产的零件的优秀品率;(2) 由以上统计数据填写下面的2× 2 列联表,并问可否在出错误的概率不高出0.01 的前提下认为“两个分厂生产的零件的质量有差别”?甲厂乙厂共计优秀品非优秀品共计考点独立性查验及其基本思想题点独立性查验的方法360解(1) 甲厂抽查的产品中有360 件优秀品,进而甲厂生产的零件的优秀品率估计为=500 72%;乙厂抽查的产品中有'320 件优秀品,进而乙厂生产的零件的优秀品率估计为320= 64%. 500(2)2 × 2 列联表以下:甲厂乙厂共计优秀品360320680非优秀品140180320共计5005001 000χ2=错误 ! ≈ 7.353>6.635 ,因此在出错误的概率不高出0.01 的前提下认为“两个分厂生产的零件的质量有差别.”四、研究与拓展13.某校高一年级理科有 8 个班,在一次数学考试中成绩情况剖析以下:班级12345678大于 145 分的人数66735337不大于 145 分的人数3939384240424238附:88∑x i y i=171,∑ x i2=204.i = 1i = 1求 145 分以上人数y 对班级序号x 的回归直线方程.( 精准到 0.000 1)考点独立性查验思想的应用题点独立性查验与回归直线方程、希望的综合应用解x = 4.5 , y =88i2= 204,5,∑i i =171,∑i=1x y i =1x8- 8 x y^∑ xiyi171-8×4.5 ×5i = 1=b=8204-8×x2i-8 x 2∑i = 13=-14≈- 0.214 3 ,^^×4.5≈ 5.964 4 ,a= y -b x =5- ( -0.214 3)^∴回归直线方程为y=- 0.214 3 x+ 5.964 4.。
人教新课标版数学高二选修1-2检测 第1章《统计案例》综合检测

综合检测(一)(时间90分钟,满分120分)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其横断面直径与高度之间的关系,其中有相关关系的是( )A .①②③B .①②C .②③D .①③④【解析】 曲线上的点与该点的坐标之间是确定关系——函数关系,故②不正确.其余均为相关关系.【答案】 D2.(2013·深圳高二检测)在两个变量的回归分析中,作散点图是为了( ) A .直接求出回归直线方程 B .直接求出回归方程C .根据经验选定回归方程的类型D .估计回归方程的参数【解析】 散点图的作用在于选择合适的函数模型. 【答案】 C3.甲、乙、丙、丁4位同学各自对A 、B 两变量做回归分析,分别得到散点图与残差平方和 i =1n(y i -y ^i )2如下表:甲 乙 丙 丁散点图A .甲B .乙C .丙D .丁【解析】 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R 2表达式中 i =1n(y i -y )2为确定的数,则残差平方和越小,R 2越接近于1),由回归分析建立的线性回归模型的拟合效果越好.由试验结果知丁要好些.故选D.【答案】 D4.下面是一个2×2列联表:则表中a 、b A .94、96 B .52、50 C .52、60D .54、52【解析】 ∵a +21=73,∴a =52. 又b =a +8=52+8=60. 【答案】 C5.(2013·济南高二检测)在线性回归模型y =bx +a +e 中,下列说法正确的是( )A .y =bx +a +e 是一次函数B .因变量y 是由自变量x 唯一确定的C .因变量y 除了受自变量x 的影响外,可能还受到其它因素的影响,这些因素会导致随机误差e 的产生D.随机误差e是由于计算不准确造成的,可以通过精确计算避免随机误差e的产生【解析】线性回归模型y=bx+a+e,反映了变量x、y间的一种线性关系,预报变量y除受解释变量x影响外,还受其他因素的影响,用e来表示,故C正确.【答案】 C6.下列关于等高条形图的叙述正确的是()A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条形图中可以看出两个变量频数的相对大小C.从等高条形图中可以粗略地看出两个分类变量是否有关系D.以上说法都不对【解析】在等高条形图中仅能粗略判断两个分类变量的关系,故A错,在等高条形图中仅能够找出频率,无法找出频数,故B错.【答案】 C7.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本^=0.577x-0.448(x为人的年龄,y为人体脂肪含数据,运用Excel软件计算得y量).对年龄为37岁的人来说,下面说法正确的是()A.年龄为37岁的人体内脂肪含量都为20.90%B.年龄为37岁的人体内脂肪含量为21.01%C.年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%D.年龄为37岁的人群中的大部分人的体内脂肪含量为21.01%^=20.90%,即对于年龄为37岁的人来说,大部分【解析】当x=37时,y人的体内脂肪含量为20.90%.【答案】 C8.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是()A.y^=1.23x+4 B.y^=1.23x+5C.y^=1.23x+0.08 D.y^=0.08x+1.23^=1.23x+a,【解析】由题意可设回归直线方程为y又样本点的中心(4,5)在回归直线上,故5=1.23×4+a,即a=0.08,故回归直线的方程为y^=1.23x+0.08.【答案】 C9.(2013·福州高二检测)工人月工资y(元)随劳动生产率x(千元)变化的回归^=50+80x,下列判断错误的是()方程为yA.劳动生产率为1 000元时,工资约为130元B.劳动生产率提高1 000元时,工资提高80元C.劳动生产率提高1 000元时,工资提高130元D.当月工资约为210元时,劳动生产率为2 000元【解析】此回归方程的实际意义是劳动生产率为x(千元)时,工人月工资约为y(元),其中x的系数80的代数意义是劳动生产率每提高1(千元)时,工人月工资约增加80(元),故应选C.【答案】 C10.(2013·开封高二检测)两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35,若判断变量X和Y有关出错概率不超过25%,则c等于()A.3 B.4C.5 D.6【解析】列2×2列联表如下:故K2的观测值k=66×[10(35-c)-21c]231×35×(10+c)(56-c)≥5.024.故选项A、B、C、D代入验证可知选A.【答案】 A二、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中横线上)11.关于随机变量K2的判断中,有以下几种说法:①K2在任何问题中都可以用来检验两个变量有关还是无关;②K2的值越大,两个分类变量的相关性就越大;③K2是用来判断两个分类变量是否有关系的随机变量,当K2的值很小时可以判定两个分类变量不相关.其中说法正确的是________.【解析】K2只适用于2×2列联表问题,故①错误.K2只能判断两个分类变量相关,故②正确.可能性大小不能判断两个分类变量不相关的程度大小,故③错误.【答案】②12.若由一个2×2列联表中的数据计算得k=4.013,那么在犯错误的概率不超过________的前提下认为两个变量之间有关系.【解析】因随机变量k2的观测值k=4.013>3.841,因此,在犯错误的概率不超过0.05的前提下,认为两个变量之间有关系.【答案】0.0513.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:已知P(K2≥3.841)≈根据表中数据,得到k=50×(13×20-10×7)223×27×20×30≈4.844,则认为“选修文科与性别有关系”出错的可能性为________.【解析】 k ≈4.844>3.81,故判断出错的概率为0.05. 【答案】 0.0514.(2012·广东高考)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系.小李这5预测小李该月6号打6小时篮球的投篮命中率为________.【解析】 平均命中率y =15×(0.4+0.5+0.6+0.6+0.4)=0.5;而x =3,∑i =15(x i -x )(y i -y )=(-2)×(-0.1)+(-1)×0+0×0.1+1×0.1+2×(-0.1)=0.1,∑i =15(x i -x )2=(-2)2+(-1)2+02+12+22=10,于是b^=0.01,a ^=y -b ^ x =0.47,∴y ^=0.01x +0.47,令x =6,得y ^=0.53.【答案】 0.5 0.53三、解答题(本大题共4小题,共50分.解答应写出文字说明,证明过程或演算步骤)15.(本小题满分12分)(2013·清远高二检测)在2008年北京奥运会上,游泳项目的世界记录在水立方屡屡被打破,充满了神奇色彩.据有些媒体的报道,这可能与运动员身上的新式泳衣有关系.为此有人进行了调查统计,对某游泳队的96名运动员的成绩进行了调查,其中使用新式泳衣成绩提高的有12人,没有提高的有36人;没有使用新式泳衣成绩提高的有8人,没有提高的有40人.请根据该游泳队的成绩判断:成绩提高与使用新式泳衣是否有关系?【解】根据给出的数据可以列出下列2×2列联表:成绩提高 成绩没有提高 总计 用新式泳衣 12 36 48 未用新式泳衣8 40 48 总计207696于是K 2=96×(12×40-36×8)248×48×20×76≈1.011,由于1.011<3.841,所以我们没有理由认为成绩提高与使用新式泳衣有关系.16.(本小题满分12分)某城市理论预测2000年到2004年人口总数与年份的关系如下表所示:年份200x (年) 0 1 2 3 4 人口数y (十万)5781119(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a^; (3)据此估计2015年该城市人口总数.(参考数值:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30,公式b^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2)【解】 (1)(2)x=2,y=10,0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30.b^=∑i=1nx i y i-n x y∑i=1nx2i-n x2=3.2,a^=y-b^x=3.6.故y关于x的线性回归方程为y^=3.2x+3.6.(3)当x=15时,y^=3.2×15+3.6=51.6(十万).据此估计2015年,该城市人口总数516万.17.(本小题满分12分)为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:天数x/天12345 6繁殖个数y/个612254995190(1)(2)描述解释变量x与预报变量y之间的关系;(3)计算相关指数.【解】(1)所作散点图如图所示.(2)由散点图看出样本点分布在一条指数型函数y=c1e c2x的周围,于是令z =ln y,则x 12345 6z 1.79 2.48 3.22 3.89 4.55 5.25由计算得:z ^=0.69x +1.115,则有y ^=e 0.69x +1.115. (3)∑i =1ne ^2i =∑i =1n(y i -y ^i )2=4.816 1,∑i =1n(y i -y )2=24 642.8,R 2=1-4.816 124 642.8≈0.999 8,即解释变量“天数”对预报变量“繁殖细菌个数”解释了99.98%. 18.(本小题满分14分)为了比较注射A ,B 两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B .下表1和表2分别是注射药物A 和药物B 后的试验结果.(疱疹面积单位:mm 2)表1:注射药物A 后皮肤疱疹面积的频数分布表射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”?表3【解】 列出2×2列联表K 2的观测值k =200×(70×65-35×30)2100×100×105×95≈24.56,由于k >10.828,所以在犯错误概率不超过0.001的前提下,认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.。
人教A版数学高二选修1-2单元测试第一章统计案例2

阶段质量检测(一)(时间:120分钟满分:150分)一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.有下列关系:①人的年龄与他拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其横断面直径与高度之间的关系,其中有相关关系的是() A.①②③B.①②C.②③D.①③④2.对于回归分析,下列说法中错误的是()A.在回归分析中,若变量间的关系是非确定性关系,则因变量不能由自变量唯一确定B.相关系数可以是正的也可以是负的C.回归分析中,如果R2=1,说明变量x与y之间是完全线性相关D.样本相关系数r∈(-∞,+∞)3.在一次调查后,根据所得数据绘制成如图所示的等高条形图,则()A.两个分类变量关系较弱B.两个分类变量无关系C.两个分类变量关系较强D.无法判断4.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有()A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反5.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是()x 45678910y 14181920232528A.C.指数函数模型D.对数函数模型6.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4 用水量y4.5432.5由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^=-0.7x +a ^,则a ^=( )A .10.5B .5.15C .5.2D .5.257.在研究吸烟与患肺癌的关系中,通过收集数据并整理、分析,得到“吸烟与患肺癌有关”的结论,并且有99%的把握认为这个结论成立.下列说法正确的个数是( )①在100个吸烟者中至少有99个人患肺癌;②如果一个人吸烟,那么这个人有99%的概率患肺癌;③在100个吸烟者中一定有患肺癌的人;④在100个吸烟者中可能一个患肺癌的人也没有.A .4B .3C .2D .18.下表是某小卖部一周卖出热茶的杯数与当天气温的对比表:气温(℃) 18 13 10 4 -1 杯数2434395163若热茶杯数y ( ) A.y ^=x +6 B.y ^=x +42 C.y ^=-2x +60 D.y ^=-3x +789.如图,5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变大C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强10.根据一位母亲记录儿子3~9岁的身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)的线性回归方程为y ^=7.19x +73.93,若用此方程预测儿子10岁时的身高,有关叙述正确的是( )A .身高一定为145.83 cmB .身高大于145.83 cmC .身高小于145.83 cmD .身高在145.83 cm 左右11.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:( ) A .没有充足的理由认为课外阅读量大与作文成绩优秀有关 B .有0.5%的把握认为课外阅读量大与作文成绩优秀有关 C .有99.9%的把握认为课外阅读量大与作文成绩优秀有关 D .有99.5%的把握认为课外阅读量大与作文成绩优秀有关12.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35.若X 与Y 有关系的可信程度不小于97.5%,则c 等于( )A .3B .4C .5D .6 附:二、填空题(本大题共) 13.下面是一个2×2列联表:则表中b -a =________.14.已知样本容量为11,计算得∑i =111x i =510,∑i =111y i =214,回归方程为y ^=0.3x +a ^,则x≈________,a ^≈________.(精确到0.01)15.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ^=b ^x +a ^,其中b ^=-2.现预测当气温为-4℃时,用电量的度数约为________.16.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:三、解答题(本大题共6小题,共70分,解答时应写出必要的文字说明、证明过程或演算步骤)17.(本小题10分)x与y有如下五组数据,试分析x与y由.18.(本小题12分)有两个分类变量x与y,其一组观测值如下面的2×2列联表所示:其中a,15-a0.1的前提下认为x与y之间有关系?19.(本小题12分)某学校高三年级有学生1000名,经调查,其中750名同学经常参加体育锻炼(称为A类同学),另外250名同学不经常参加体育锻炼(称为B类同学),现用分层抽样方法(按A类、B类分两层)从该年级的学生中共抽取100名同学,如果以身高达165 cm 作为达标的标准,对抽取的100名学生,得到以下列联表:(1)(2)能否在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系(K2的观测值精确到0.001)?20.(本小题12分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了4次试验,得到数据如下:加工的时间y (小时) 2.5 3 4 4.5(1)(2)求y 关于x 的线性回归方程y ^=b ^x +a ^; (3)试预测加工10个零件需要的时间.21.(本小题12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70), [70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?P (K 2≥k )0.100 0.050 0.010 0.001 k2.7063.8416.63510.82822.(本小题)之间的一组数据如下表:价格x 1.4 1.6 1.8 2 2.2 需求量1210753(1)画出散点图;(2)求出y 对x 的线性回归方程,并在(1)的图形上画出它的图象; (3)如果价格定为1.9万元,预测需求量大约是多少.(结果精确到0.01 t).答案1.解析:选D 曲线上的点与该点的坐标之间是确定关系——函数关系,故②不正确.其余均为相关关系.2.解析:选D 在回归分析中,样本相关系数r 的范围是|r |≤1,故选D.3.解析:选C 从条形图中可以看出,在x 1中y 1比重明显大于x 2中y 1的比重,所以两个分类变量的关系较强.4.解析:选A 因为b >0时,两变量正相关,此时r >0;b <0时,两变量负相关,此时r <0.5.解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.6.解析:选D 样本点的中心为(2.5,3.5),将其代入线性回归方程可解得a ^=5.25. 7.解析:选D 有99%的把握认为“吸烟与患肺癌有关”,指的是“吸烟与患肺癌有关”这个结论成立的可能性或者可信程度有99%,并不表明在100个吸烟者中至少有99个人患肺癌,也不能说如果一个人吸烟,那么这个人就有99%的概率患肺癌;更不能说在100个吸烟者中一定有患肺癌的人,反而有可能在100个吸烟者中,一个患肺癌的人也没有.故正确的说法仅有④,选D.8.解析:选C 由表格可知,气温与杯数呈负相关关系.把x =4代入y =-2x +60得y =52,e ^=52-51=1.把x =4代入y =-3x +78得y =66,e ^=66-51=15.故应选C.9.解析:选B 由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.10.解析:选D 用线性回归方程预测的不是精确值,而是估计值.当x =10时,y =145.83,只能说身高在145.83 cm 左右.11.解析:选D 根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.12.解析:选A 列2×2列联表如下:故K 2的观测值k =66×[10(35-c )-21c ]31×35×(10+c )(56-c )≥5.024. 把选项A ,B ,C ,D 代入验证可知选A. 13.解析:b -a =8. 答案:814.解析:由题意得x =111∑i =111x i =51011≈46.36,y =111∑i =111y i =21411,因为y =0.3x +a ^,所以21411=0.3×51011+a ^,可得a ^≈5.55.答案:46.36 5.5515.解析:由题意可知x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,b ^=-2.又回归直线y ^=-2x +a ^过点(10,40),故a ^=60, 所以当x =-4时,y ^=-2×(-4)+60=68. 答案:6816.解析:由列联表中的数据,得K 2的观测值为 k =89×(24×26-31×8)255×34×32×57≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系. 答案:0.1017.解:作出散点图,如图所示:由散点图可以看出,x 与y 不具有线性相关关系.18.解:查表可知,要使在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系,则k ≥2.706,而k =65×[a (30+a )-(20-a )(15-a )]220×45×15×50=65×(65a -300)220×45×15×50=13×(13a -60)260×90. 由k ≥2.706得a ≥7.19或a ≤2.04.又a >5且15-a >5,a ∈Z ,解得a =8或9,故a 为8或9时,在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系. 19.解:(1)填写列联表如下:身高达标 身高不达标总计 经常参加体育锻炼 40 35 75 不经常参加体育锻炼101525总计5050100(2)2k=100×(40×15-35×10)275×25×50×50≈1.333<3.841.所以不能在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系.20.解:(1)散点图如图所示:(2)由表中数据得x=3.5,y=3.5,∑i=14(x i-x)(y i-y)=3.5,∑i=14(x i-x)2=5,由公式计算得b^=0.7,a^=y--b^x-=1.05,所以所求线性回归方程为y^=0.7x+1.05.(3)当x=10时,y^=0.7×10+1.05=8.05,所以预测加工10个零件需要8.05小时.21.解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100所以得K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(15×25-15×45)260×40×30×70=2514≈1.79.因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.22.解:(1)散点图如图所示.(2)x-=1.8,y-=7.4,∑i=15x i y i=62,∑i=15x2i=16.6,b^=∑i=15x i y i-5x-y-∑i=15x2i-5x-2=62-5×1.8×7.416.6-5×1.82=-4.60.4=-11.5,a^=y--b^x-=7.4+11.5×1.8=28.1.所以y对x的线性回归方程为y^=-11.5x+28.1.画出图象如图.(3)当价格定为1.9万元,即x=1.9时,y=-11.5×1.9+28.1=6.25.所以商品价格定为1.9万元时,需求量大约是6.25t.。
人教新课标版数学高二A版选修1-2 第一章 统计案例 章末检测卷

章末检测卷(一)(时间:120分钟 满分:150分)一、选择题(本大题共12小题,每小题5分,共60分) 1.下列语句表示的事件中的因素不具有相关关系的是( ) A .瑞雪兆丰年 B .名师出高徒 C .吸烟有害健康 D .喜鹊叫喜,乌鸦叫丧2.下列结论正确的是( )①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A .①② B .①②③ C .①②④D .①②③④3.若线性回归方程为y ^=2-3.5x ,则变量x 增加一个单位,变量y 平均( ) A .减少3.5个单位 B .增加2个单位 C .增加3.5个单位D .减少2个单位4.下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^=-0.7x +a ^,则a ^等于( ) A .10.5 B .5.15 C .5.2D .5.255.独立性检验中,假设H 0:变量X 与变量Y 没有关系,则在H 0成立的情况下,P (K 2≥6.635)≈0.010表示的意义是( ) A .变量X 与变量Y 有关系的概率为1% B .变量X 与变量Y 有关系的概率为99.9% C .变量X 与变量Y 没有关系的概率为99% D .变量X 与变量Y 有关系的概率为99% 6.根据如下样本数据得到的回归方程为y ^=b ^x +a ^,则( ) A.a ^>0,b ^>0 B.a ^>0,b ^<0 C.a ^<0,b ^>0D.a ^<0,b ^<07.如图,5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( ) A .相关系数r 变大 B .残差平方和变大 C .R 2变大D .解释变量x 与预报变量y 的相关性变强8.根据一位母亲记录儿子3~9岁的身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)的线性回归方程y ^=7.19x +73.93,用此方程预测儿子10岁的身高,有关叙述正确的是( ) A .身高一定为145.83 cm B .身高大于145.83 cm C .身高小于145.83 cm D .身高在145.83 cm 左右9.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^ =2.347x -6.423; ②y 与x 负相关且y ^ =-3.476x +5.648; ③y 与x 正相关且y ^ =5.437x +8.493; ④y 与x 正相关且y ^ =-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④D .①④10.下列是x 与y 之间的一组数据( )x 0 1 2 3 y1357则y 关于x 的回归方程y ^=b ^x +a ,对应的直线必过点( )A .(32,4)B .(32,2)C .(2,2)D .(1,2)11.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则在犯错误的概率不超过0.005的前提下推断实验效果与教学措施( )A.有关 C .关系不明确D .以上都不正确12.某调查者从调查中获知某公司近年来科研费用支出x (万元)与公司所获得利润y (万元)的统计资料如下表:则利润y A.y ^=2x +20 B.y ^=2x -20 C.y ^ =20x +2D.y ^=20x -2二、填空题(本大题共4小题,每小题5分,共20分)13.许多因素都会影响贫穷,教育也许是其中之一.在研究这两个因素的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比(x )和收入低于官方规定的贫困线的人数占本州人数的百分比(y )的数据,建立的线性回归方程为y ^=0.8x +4.6.斜率的估计值为0.8说明________________________________________________________________________. 14.考古学家通过始祖鸟化石标本发现:其股骨长度x (cm)与肱骨长度y (cm)的线性回归方程为y ^=1.197x -3.660,由此估计,当股骨长度为50 cm 时,肱骨长度的估计值为________ cm.15.下面是一个2×2列联表:则b-d=________.16.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射14天内的结果如表所示:三、解答题(本大题共6小题,共70分)17.(10分)为研究质量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同质量的6个物体进行测量,数据如下表所示:(1)(2)求出R2;(3)进行残差分析.18.(12分)电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.根据已知条件完成下面的2×2列联表,并据此资料,你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女1055合计19.(12分)在海南省第二十四届科技创新大赛活动中,某同学为研究“网络游戏对当代青少年的影响”作了一次调查,共调查了50名同学,其中男生26人,有8人不喜欢玩电脑游戏,而调查的女生中有9人喜欢玩电脑游戏. (1)根据以上数据建立一个2×2的列联表;(2)根据以上数据,在犯错误的概率不超过0.025的前提下,能否认为“喜欢玩电脑游戏与性别有关系”?20.(12分)某校团对“学生性别与是否喜欢韩剧有关”作了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?21.(12分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?22.(12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?P(K2≥k)0.1000.0500.0100.001k 2.706 3.841 6.63510.828)(注:K2=(a+b)(c+d)(a+c)(b+d)。
高二数学 第一章 统计案例章末归纳总结课件 新人教A版选修1-2

a=18.
4.已知两个分类变量X与Y,它们的可能取值分别为{x1, x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35, 若“X与Y有关系”的可信程度为90%,则c等于( )
A.4
B.5
C.6
D.7
[答案] B
[解析] 由 a=10,b=21,c+d=35 可得 n=66,d=35 -c,a+b=31,a+c=10+c,b+d=56-c,ad=10(35-c), bc=21c.∵“X 与 Y”有关系的可信度为 90%,则随机变量 K2 的观测值 k>2.706,得3616××353×50-101+0cc-5261-cc2>2.706,将选项代 入检验,得 c=5 符合题意.
[答案] 0.254 [解析] 由回归直线方程为^y=0.254x+0.321 知收入每增 加 1 万元,饮食支出平均增加 0.254 万元.
三、解答题
7.对不同的麦堆测得如下表 6 组数据:
堆号
12 3
456
重量 y(斤) 2 813 2 705 11 103 2 590 2 131 5 181
a+b=360,c+d=880,a+c=381,b+d=859,n=a+b
+c+d=1240.
代入公式,得 K22=12403×602×258×807×243-811×358×591562
≈240.6112.
(3)列出数学与总分优秀的 2×2 列联表如下:
总分优秀 总分非优秀 合计
数学优秀
267
1.线性回归方程中的系数、及相关指数R2,独立性检验统 计量K2公式复杂,莫记混用错.
2.相关系数r是判断两随机变量相关强度的统计量,相关 指数R2是判断线性回归模型拟合效果好坏的统计量,而K2是判 断两分类变量相关程度的量,应注意区分.
高中数学 第一章 统计案例章末小结与测评创新应用学案 新人教A版选修1-2-新人教A版高二选修1-2

第一章 统计案例在散点图中样本点大致分布在一条直线附近,则利用线性回归模型进行研究,可近似地利用回归直线方程y ^=b ^x +a ^来预报,利用公式求出回归系数a ^,b ^,即可写出回归直线方程,并用回归直线方程进行预测说明.[典例1] 以下是某地收集到的新房屋的销售价格y 和房屋的面积x 的数据:房屋面积x /m 2115 110 80 135 105 销售价格y /万元24.821.618.429.222(1)(2)若线性相关,求线性回归方程;(3)根据(2)的结果估计当房屋面积为150 m 2时的销售价格. 解:(1)数据对应的散点图如图所示.(2)由散点图知y 与x 具有线性相关关系. 由表中数据知x =15∑i =15x i =109,y =15∑i =15y i =23.2,∑i =15x 2i =60 975,∑i =15x i y i =12 952.设所求回归直线方程为y ^=b ^x +a ^,则b ^=∑i =15x i y i -5x -y -∑i =15x 2i -5x 2≈0.196 2,a ^=y -b ^x -≈1.814 2,故所求回归直线方程为y ^=0.196 2x +1.814 2.(3)根据(2),当x =150时,销售价格的估计值为y ^=0.1962×150+1.814 2=31.244 2(万元).[对点训练]1.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(1)求y 关于t 的回归方程y =b t +a ;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款.附:回归方程y ^=b ^t +a ^中,b ^=∑i =1nt i y i -n t y∑i =1nt 2i -n t -2,a ^=y -b ^t .解:(1)列表计算如下:it iy it 2iti y i1 1 5 1 52 2 6 4 123 3 7 9 214 4 8 16 325 5 10 25 50 ∑153655120这里n =5,t =1n ∑i =1nt i =155=3,y =1n ∑i =1n y i =365=7.2,又l tt =∑i =1nt 2i -n t -2=55-5×32=10,l ty =∑i =1nt i y i -n t y =120-5×3×7.2=12,从而b ^=l ty l tt =1210=1.2,a ^=y -b ^t =7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).对于建立的回归模型,我们必须对模型的拟合效果进行分析,也就是对利用回归模型解决实际问题的效果进行评价.一方面可以对比残差或残差平方和的大小,同时观察残差图,进行残差分析;另一方面也可以研究数据的R 2(相关系数r ).对模型拟合效果的分析能够帮助我们利用最优化的模型来解决实际问题.[典例2] 在研究弹簧伸长长度y (cm)与拉力x (N)的关系时,对不同拉力的6根弹簧进行测量,测得如下表中的数据:x /N 5 10 15 20 25 30 y /cm7.258.128.959.9010.911.8若依据散点图及最小二乘法求出的回归直线方程为y =0.18x +6.34,求R 2,并结合残差说明拟合效果.解:列表求值如下:x =17.5,y ≈9.49,∑i =16x i y i =1 076.2,∑i =16x 2i =2 275,∑i =16(y i -y ^i )2=0.017 4,∑i =16(y i-y )2=14.678 4.∴R 2=1-0.017 414.678 4≈0.998 81,回归模型拟合效果较好.由表中数据可以看出残差比较均匀地落在宽度不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高.[对点训练]2.从某大学中随机选取5名女大学生,其身高和体重数据如下表所示:甲、分别得到以下回归模型:甲:y ^=0.75x -70;乙:y ^=0.76x -71.试依据R 2判定哪一个模型的拟合效果较好?解:对甲模型,y i -y ^i 与y i -y 的值如下表:所以∑i =15(y i -y ^i )2=(-5.75)2+3.252+2.252+(-3.5)2+2.752=68.5,∑i =15(y i -y )2=(-6.6)2+2.42+(-4.6)2+(-0.6)2+9.42=159.2.此时R 2=1-68.5159.2≈0.57.对乙模型,y i -y ^i 与y i -y 的值如下表:y i -y ^i -6.4 2.6 1.68 -4.2 2 y i -y-6.62.4-4.6-0.69.4所以∑i =15(y i -y ^i )2=(-6.4)2+2.62+1.682+(-4.2)2+22≈72.2,∑i =15(y i -y )2=(-6.6)2+2.42+(-4.6)2+(-0.6)2+9.42=159.2.此时R 2=1-72.2159.2≈0.55.因为0.57>0.55,所以甲模型的拟合效果较好.独立性检验就是根据采集的样本数据,利用公式求出随机变量K 2的观测值k ,通过比较k 与临界值k 0的大小来确定两个分类变量是否有关系的方法.[典例3] 户外运动已经成为一种时尚运动,某单位为了了解员工喜欢户外运动是否与性别有关,决定从本单位全体650人中采用分层抽样的办法抽取50人进行问卷调查,得到了如下列联表:喜欢户外运动不喜欢户外运动总计 男性5 女性 10 总计50已知在这50人中随机抽取1人抽到喜欢户外运动的员工的概率是5.(1)请将上面的列联表补充完整; (2)求该公司男、女员工各多少人;(3)在犯错误的概率不超过0.005的前提下能否认为喜欢户外运动与性别有关?并说明你的理由.下面的临界值表仅供参考:P (K 2≥k 0)0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828参考公式:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d解:(1)因为在全部50人中随机抽取1人抽到喜欢户外运动的员工的概率是35,所以喜欢户外运动的男女员工共30人,其中男员工20人,列联表补充如下:喜欢户外运动不喜欢户外运动总计 男性 20 5 25 女性 10 15 25 总计302050(2)该公司男员工人数为25÷50×650=325(人),则女员工有325人. (3)K 2的观测值k =50×20×15-10×5230×20×25×25≈8.333>7.879,所以在犯错误的概率不超过0.005的前提下认为喜欢户外运动与性别有关.[对点训练]3.吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表是性别与吃零食的列联表:男 女 总计 喜欢吃零食 5 12 17 不喜欢吃零食40 28 68 总计454085请问喜欢吃零食与性别是否有关? 解:k =n ad -bc 2a +bc +d a +cb +d,把相关数据代入公式,得 k =85×5×28-40×12217×68×45×40≈4.722>3.841.因此,在犯错误的概率不超过0.05的前提下,可以认为“喜欢吃零食与性别有关”.(时间:120分钟,满分:150分)一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.有下列关系:①人的年龄与他拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其横断面直径与高度之间的关系,其中有相关关系的是( ) A.①②③ B.①②C.②③ D.①③④解析:选D 曲线上的点与该点的坐标之间是确定关系——函数关系,故②不正确.其余均为相关关系.2.对于回归分析,下列说法中错误的是( )A.在回归分析中,若变量间的关系是非确定性关系,则因变量不能由自变量唯一确定B.相关系数可以是正的也可以是负的C.回归分析中,如果R2=1,说明变量x与y之间是完全线性相关D.样本相关系数r∈(-∞,+∞)解析:选D 在回归分析中,样本相关系数r的范围是|r|≤1,故选D.3.在一次调查后,根据所得数据绘制成如图所示的等高条形图,则( )A.两个分类变量关系较弱B.两个分类变量无关系C.两个分类变量关系较强D.无法判断解析:选C 从条形图中可以看出,在x1中y1比重明显大于x2中y1的比重,所以两个分类变量的关系较强.4.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有( )A .b 与r 的符号相同B .a 与r 的符号相同C .b 与r 的符号相反D .a 与r 的符号相反解析:选A 因为b >0时,两变量正相关,此时r >0;b <0时,两变量负相关,此时r <0. 5.下表显示出样本中变量y 随变量x 变化的一组数据,由此判断它最可能是( )A.C .指数函数模型 D .对数函数模型解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.6.下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^=-0.7x +a ^,则a ^=( )A .10.5B .5.15C .5.2D .5.25解析:选D 样本点的中心为(2.5,3.5),将其代入线性回归方程可解得a ^=5.25. 7.在研究吸烟与患肺癌的关系中,通过收集数据并整理、分析,得到“吸烟与患肺癌有关”的结论,并且有99%的把握认为这个结论成立.下列说法正确的个数是( )①在100个吸烟者中至少有99个人患肺癌;②如果一个人吸烟,那么这个人有99%的概率患肺癌;③在100个吸烟者中一定有患肺癌的人;④在100个吸烟者中可能一个患肺癌的人也没有.A .4B .3C .2D .1解析:选D 有99%的把握认为“吸烟与患肺癌有关”,指的是“吸烟与患肺癌有关”这个结论成立的可能性或者可信程度有99%,并不表明在100个吸烟者中至少有99个人患肺癌,也不能说如果一个人吸烟,那么这个人就有99%的概率患肺癌;更不能说在100个吸烟者中一定有患肺癌的人,反而有可能在100个吸烟者中,一个患肺癌的人也没有.故正确的说法仅有④,选D.8.下表是某小卖部一周卖出热茶的杯数与当天气温的对比表:气温(℃) 18 13 10 4 -1 杯数2434395163若热茶杯数y x ( ) A.y ^=x +6 B.y ^=x +42 C.y ^=-2x +60 D.y ^=-3x +78解析:选C 由表格可知,气温与杯数呈负相关关系.把x =4代入y =-2x +60得y =52,e ^=52-51=1.把x =4代入y =-3x +78得y =66,e ^=66-51=15.故应选C.9.如图,5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变大C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强解析:选B 由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.10.根据一位母亲记录儿子3~9岁的身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)的线性回归方程为y ^=7.19x +73.93,若用此方程预测儿子10岁时的身高,有关叙述正确的是( )A .身高一定为145.83 cmB .身高大于145.83 cmC .身高小于145.83 cmD .身高在145.83 cm 左右解析:选D 用线性回归方程预测的不是精确值,而是估计值.当x =10时,y =145.83,只能说身高在145.83 cm 左右.11.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计3030602( ) A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关解析:选D 根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.12.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b =21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c等于( ) A.3 B.4 C.5 D.6附:P(K2≥k0)0.050.025k0 3.841 5.024解析:选A 列2×2x1x2总计y1102131y2 c d 35总计10+c 21+d 66≥5.024.故K2的观测值k=31×35×10+c56-c把选项A,B,C,D代入验证可知选A.二、填空题(本大题共14小题,每小题5分,共20分,把答案填在题中横线上)13.下面是一个2×2列联表:y1y2总计x1 a 2173则表中b -a =解析:b -a =8. 答案:814.已知样本容量为11,计算得∑i =111x i =510,∑i =111y i =214,回归方程为y ^=0.3x +a ^,则x≈________,a ^≈________.(精确到0.01)解析:由题意得x =111∑i =111x i =51011≈46.36,y =111∑i =111y i =21411,因为y =0.3x +a ^,所以21411=0.3×51011+a ^,可得a ^≈5.55.答案:46.36 5.5515.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ^=b ^x +a ^,其中b ^=-2.现预测当气温为-4℃时,用电量的度数约为________.解析:由题意可知x =4(18+13+10-1)=10,y =14(24+34+38+64)=40,b ^=-2.又回归直线y ^=-2x +a ^过点(10,40),故a ^=60, 所以当x =-4时,y ^=-2×(-4)+60=68. 答案:6816.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:总计 32 57 89在犯错误的概率不超过________的前提下性别与休闲方式有关系. 解析:由列联表中的数据,得K 2的观测值为 k =89×24×26-31×8255×34×32×57≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系. 答案:0.10三、解答题(本大题共6小题,共70分,解答时应写出必要的文字说明、证明过程或演算步骤)17.(本小题10分)x 与y 有如下五组数据,x 1 2 3 5 10 y105422试分析x 与y 之间是否具有线性相关关系.若有,求出回归直线方程;若没有,说明理由.解:作出散点图,如图所示:由散点图可以看出,x 与y 不具有线性相关关系.18.(本小题12分)有两个分类变量x 与y ,其一组观测值如下面的2×2列联表所示:y 1 y 2x 1 a20-a x 215-a30+a其中a,15-a 均为大于5的整数,则a 取何值时,在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系?解:查表可知,要使在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系,则k ≥2.706,而k =65×[a 30+a -20-a 15-a ]220×45×15×50=65×65a -300220×45×15×50=13×13a -60260×90.由k ≥2.706得a ≥7.19或a ≤2.04.又a >5且15-a >5,a ∈Z ,解得a =8或9,故a 为8或9时,在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系. 19.(本小题 12分)某学校高三年级有学生1000名,经调查,其中750名同学经常参加体育锻炼(称为A 类同学),另外250名同学不经常参加体育锻炼(称为B 类同学),现用分层抽样方法(按A 类、B 类分两层)从该年级的学生中共抽取100名同学,如果以身高达165 cm 作为达标的标准,对抽取的100名学生,得到以下列联表:身高达标 身高不达标总计 经常参加体育锻炼 40 不经常参加体育锻炼15总计100(1)(2)能否在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系(K 2的观测值精确到0.001)?解:(1)填写列联表如下:身高达标 身高不达标总计 经常参加体育锻炼 40 35 75 不经常参加体育锻炼10 15 25 总计5050100(2)2k =100×40×15-35×10275×25×50×50≈1.333<3.841.所以不能在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系.20.(本小题12分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了4次试验,得到数据如下:零件的个数x (个) 2 3 4 5 加工的时间y (小时)2.5344.5(1)(2)求y 关于x 的线性回归方程y ^=b ^x +a ^; (3)试预测加工10个零件需要的时间. 解:(1)散点图如图所示:(2)由表中数据得x =3.5,y =3.5,∑i =14(x i -x )(y i -y )=3.5,∑i =14(x i -x )2=5,由公式计算得b ^=0.7,a ^=y --b ^x -=1.05, 所以所求线性回归方程为y ^=0.7x +1.05. (3)当x =10时,y ^=0.7×10+1.05=8.05, 所以预测加工10个零件需要8.05小时.21.(本小题12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?P(K2≥k)0.1000.0500.0100.001k 2.706 3.841 6.63510.828解:(1)40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100所以得K 2=nad -bc 2a +bc +d a +cb +d=100×15×25-15×45260×40×30×70=2514≈1.79. 因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”. 22.(本小题12分)在一段时间内,某种商品价格x (万元)和需求量y (t )之间的一组数据如下表:价格x 1.4 1.6 1.8 2 2.2 需求量1210753(1)画出散点图;(2)求出y 对x 的线性回归方程,并在(1)的图形上画出它的图象;(3)如果价格定为1.9万元,预测需求量大约是多少.(结果精确到0.01 t). 解:(1)散点图如图所示.(2)x -=1.8,y -=7.4,∑i =15x i y i =62,∑i =15x 2i =16.6,b ^=∑i =15x i y i -5x -y -∑i =15x 2i -5x -2=62-5×1.8×7.416.6-5×1.82=-4.60.4=-11.5,a ^=y --b ^x -=7.4+11.5×1.8=28.1.所以y 对x 的线性回归方程为y ^=-11.5x +28.1.画出图象如图.(3)当价格定为1.9万元,即x =1.9时,y =-11.5×1.9+28.1=6.25.所以商品价格定为1.9万元时,需求量大约是6.25t.。
高中数学 第一章 统计案例B章末测试 新人教A版选修1-2(2021年最新整理)

高中数学第一章统计案例B章末测试新人教A版选修1-2编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第一章统计案例B 章末测试新人教A版选修1-2)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第一章统计案例B章末测试新人教A版选修1-2的全部内容。
高中数学第一章统计案例B章末测试新人教A版选修1-2(高考体验卷)(时间:90分钟满分:100分)一、选择题(本大题共8小题,每小题5分,共40分)1.(2013湖北高考)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且错误!=2。
347x-6。
423;②y与x负相关且y,^=-3.476x+5.648;③y与x正相关且错误!=5.437x+8。
493;④y与x正相关且错误!=-4。
326x-4.578.其中一定不正确的结论的序号是()A.①②B.②③C.③④D.①④2.(2012湖南高考)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为错误!=0.85x-85。
71,则下列结论中不正确的是( )A.y与x具有正的线性相关关系B.回归直线过样本点的中心(错误!,错误!)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg3.(2011湖南高考)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K2=错误!算得,K2=错误!≈7。
高二数学 第一章 统 计 案 例

章末过关检测卷(一)第一章统计案例一、选择题(本大题共10小题,每小题5分,共50分;在每小题给出的四个选项中,只有一项是符合题目要求的)1.炼钢时钢水的含碳量与冶炼时间有()A.确定性关系B.相关关系C.函数关系D.无任何关系答案:B2.下列说法正确的有()①回归方程适用于一切样本和总体;②回归方程一般都有时间性;③样本取值的范围会影响回归方程的适用范围;④回归方程得到的预报值是预报变量的精确值A.①②B.②③C.③④D.①③答案:B3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y^=0.85 x-85.71,则下列结论中不正确的是() A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg 解析:根据线性回归方程中各系数的意义求解.由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确.又线性回归方程必过样本中心点(x,y),因此B正确.由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确.当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确.答案:D4.身高与体重有关系可以用________分析来分析() A.残差B.回归C.二维条形图D.独立检验答案:B5.设有一个回归方程为y=2-2.5x,则变量x增加一个单位时() A.y平均增加2.5个单位B.y平均增加2个单位C.y平均减少2.5个单位D.y平均减少2个单位答案:C6.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是( )A.y^=1.23x +4 B.y ^=1.23x +5C.y^=1.23x +0.08 D.y ^=0.08x +1.23 答案:C7.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下[已知P (K 2≥3.841)=0.025]根据表中数据,得到K 2=50×(13×20-10×7)223×27×20×30≈4.844,则认为选修文科与性别有关系出错的可能性为( )A .5%B .95%C .25%D .97.5%解析:∵P (K 2≥3.841)=0.05,∴认为选修文科与性别有关系出错的可能性为5%.故选A.答案:A8.已知x 与y则y 与x 的线性回归方程y =b x +a 必过( )A .点(2,2)B .点(1.5,0)C .点(1,2)D .点(1.5,4)答案:D9.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此( )A .99.9%B .97.5%C .95%D .99%解析:可计算K 2=11.377>10.828.答案:A10.为考虑广告费用x 与销售额y 之间的关系,抽取了5家餐厅,得万元(保留两位有效数字)( )A .1.8B .1.7C .1.6D .1.5答案:D二、填空题(本大题共4小题,每小题5分,共20分;将正确答案填在题中的横线上)11.回归直线方程为y =0.575x -14.9,则x =100时,y 的估计值为____________.答案:42.612.若由一个2×2列联表中数据计算得K 2=4.073,那么有__________的把握认为两变量有关系[已知P (K 2≥3.841)=0.05,P (K 2≥5.024)=0.025].解析:∵K 2=4.073>3.841,∴有95%的把握认为两变量有关系.答案:95%13.在两个变量的回归分析中,作散点图的目的是__________. 答案:①判断两变量是否线性相关;②判断两变量更近似于什么函数关系14.为预测某种产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取了8组观测值.计算知∑i =18xi =52,∑i =18yi =228,∑i =18x 2i =478,∑i =18x iyi =1 849,则y 对x 的线性回归方程是______________.解析:b ^=1 849-8×6.5×28.5478-8×6.52≈2.62,a ^=11.47, ∴y ^=2.62x +11.47.答案:y ^=2.62x +11.47三、解答题(本大题共6小题,共80分;解答时应写出必要的文字说明、证明过程及演算步骤)15.(12分)在回归分析中,通过模型由解释变量计算预报变量时,应注意什么问题?解析:应注意:①回归模型只适用于所研究的总体;②回归方程具有时效性;③样本的取值范围影响回归方程的适用范围;④预报值是预报变量可能取值的平均值.16.(14分)为考察性别与是否喜欢喝酒之间的关系,在某地随机地抽取160人,其中男性80人,女性80人,女性中有20人喜欢喝酒,另外60人不喜欢喝酒,男性中有50人喜欢喝酒,另外30人不喜欢喝酒.(1)根据以上数据建立一个2×2的列联表;(2)判断性别与喝酒是否有关系.解析:(1)喜欢喝酒不喜欢喝酒总计男503080女206080总计7090160(2)K2的观测值k=70×90×80×80=22.857>10.828.利用列联表的独立性检验,有99.9%的把握认为性别与喝酒有关系.17.(14分)某市5年的煤气消耗量y与使用煤气户数x的历史资料如下:年份20082009201020112012x/万户1 1.1 1.5 1.6 1.8y/万立方米6791112(1)(2)求y关于x的线性回归方程;(3)若市政府下一步再扩大2 000煤气用户,试预测该市煤气消耗量将达到多少.解析:(1)作散点图如下,观察呈线性正相关.(2)x -=75,y -=9,∑i =15x 2i =10.26,∑i =15x i y i =66.4, b ^=66.4-5×75×910.26-5×4925=17023, a ^=9-17023×75=-3123. ∴回归方程为y ^=17023x -3123. (3)当x =2时,y =17023×2-3123=30923≈13.4. ∴煤气量约达13.4万立方米.18.(12分)(2013·东莞二模)今年春节黄金周,记者通过随机询问某景区110游客对景区的服务是否满意,得到如下的列联表:性别与对景区的服务是否满意(1)从这50抽取一个容量为5的样本,问样本中满意与不满意的女游客各有多少名?(2)从(1)中的5名女游客样本中随机选取两名作深度访谈,求选到满意与不满意的女游客各一名的概率;(3)根据以上列联表,问有多大把握认为“游客性别与对景区的服务满意”有关.解析:(1)由题意知,样本中满意的女游客为550×30=3名,不满意的女游客为550×20=2名. (2)记样本中对景区的服务满意的3名女游客分别为a 1,a 2,a 3;对景区的服务不满意的2名女游客分别为b 1,b 2.从5名女游客中随机选取两名,共有10个基本条件,分别为:(a 1,a 2),(a 1,a 3),(a 1,b 1),(a 1,b 2),(a 2,a 3),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2).其中事件A :选到满意与不满意的女游客各一名包含了6个基本事件,分别为(a1,b1)(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2).所以所求概率P(A)=610=35.(3)假设H0:该景区游客性别与对景区的服务满意无关,则k2应该很小.根据题目中列联表得:k2=110×(50×20-30×10)280×30×60×50=53972≈7.486.由P(k2≥6.635)=0.010可知:有99%的把握认为:该景区游客性别与对景区的服务满意有关.19.(14分)为研究重量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同重量的6根弹簧进行测量,得如下数据:x 51015202530y 7.258.128.959.9010.911.8(1)(2)判断y与x之间是否有相关关系.若有,求出回归方程.(参考数据:∑i=16x i y i=1 076.2,∑i=16x2i=2 275)解析:(1)散点图如下图所示:(2)i 12345 6x i51015202530y i7.258.128.959.9010.911.8∑i=16x i y i=1 076.2,∑i= 16x2i=2 275,x=17.5,y=9.487,b^=∑i=16x i y i-6x-·y-∑i=16x2i-6x2=1 076.2-6×17.5×9.4872 275-6×17.5×17.5=80.065437.5=0.183.a^=y--b^x-=9.487-0.183×17.5=6.285.回归方程是y^=6.285+0.183x.20.(14分)下表为收集到的一组数据:x 21232527293235y 711212466115325(1)做出x与y的散点图,试建立x与y之间的关系;(2)利用所得模型,预报x=40时y的值.解析:(1)作散点图(如下图):(2)从图中可以看出,样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,故不能直接利用线性回归方程来建立两个变量之间的关系.但是根据已有的函数知识,由类比推理,可以发现样本点分布在某一条指数函数曲线y=a e bx的附近,其中a,b 为待定参数.此时我们就可以通过对数变换把指数型关系转化为线性关系:令z=ln y,则变换后样本点分布在直线z=cx+d(c=b,d=ln a)的附近,这样我们就可以利用线性回归建立y与x的非线性回归方程了.数据转化为:x 21 23 25 27 29 32 35z 1.946 2.398 3.045 3.178 4.190 4.745 5.784由图象可以看出,x与z的散点图分布在一条直线的周围,故猜测其具有线性相关关系,下面给予证明:r=∑i=17(x i-x)(y i-y)∑i=17(x i-x)2∑i=17(y i-y)2=L xyL xx·L yy=0.992 583.因为r>0.75,说明x和z具有很强的线性相关关系.故求得回归直线方程为z^=0.272x-3.843,∴y^=e0.272x-3.843.相关指数R2=1-∑i=17(y i-y^i)2∑i=17(y i-y)2=0.981 4,说明x可以解释y的98.14%的变化.因此可以用回归方程y^=e0.272x-3.843描述x和y之间的关系.所以当x=40时,y^=e0.272×40-3.843=1 137.97.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
章末检测一、选择题1.对于线性回归方程y ^=b ^x +a ^,下列说法中不正确的是( ) A .直线必经过点(x ,y )B .x 增加1个单位时,y 平均增加b ^个单位 C .样本数据中x =0时,可能有y =a ^D .样本数据中x =0时,一定有y =a ^2.根据如下样本数据:得到的线性回归方程为y =b x +a ,则( ) A.a ^>0,b ^<0 B.a ^>0,b ^>0 C.a ^<0,b ^>0D.0<0,b ^<03.如图是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( )A .性别与喜欢理科无关B .女生中喜欢理科的比例约为80%C .男生比女生喜欢理科的可能性大些D .男生中不喜欢理科的比例约为60%4.某个工业企业生产性固定资产价值与工业增加值数据如下(单位:万元):A .0B .-0.897 3C .1.022 8D .0.991 85.下列是x 与y 之间的一组数据( )则y 关于x 的回归方程y ^=b ^x +a ^,对应的直线必过点( ) A .(32,4)B .(32,2)C .(2,2)D .(1,2)6.为预测某种产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取了8组观察值.计算知∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1 849,则y 关于x 的回归方程是( )A.y ^=11.47+2.62x B.y ^=-11.47+2.62x C.y ^=2.62+11.47x D.y ^=11.47-2.62x7.如果某地的财政收入x 与支出y 满足线性回归方程y ^=b ^x +a ^+e (单位:亿元).其中,b ^=0.8,a ^=2,|e |≤0.5.若今年该地区财政收入10亿元,则年支出预计不会超过( ) A .9亿元 B .10亿元 C .9.5亿元D .10.5亿元8.甲、乙、丙、丁四位同学各自对A ,B 两变量进行线性相关检验,并用回归分析方法分别求得相关系数r如下表:( ) A .甲 B .乙 C .丙 D .丁9.根据下面的列联表得到如下四个判断:①至少有99.9%的把握认为“患肝病与嗜酒有关”;②至少有99%的把握认为“患肝病与嗜酒有关”;③在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒有关”;④在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒无关”.其中正确命题的个数为(A .0 B .1 C .2 D .310.下表给出5组数据(x ,y ),为选出4组数据使其线性相关程度最大,且保留第1组数据(-5,-3),则应去掉( )A.第2组 C .第4组 D .第5组二、填空题11.已知下表所示数据的线性回归方程为y ^=4x +242,则实数a =________.答案 26212.在评价建立的线性回归模型刻画身高和体重之间关系的效果时,R 2=________,可以叙述为“身高解释了64%的体重变化,而随机变量贡献了剩余的36%”. 13.若两个分类变量X 与Y 的2×2列联表为:则“X 与Y 14.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________ cm. 三、解答题15.要分析学生中考的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩,如下表:表中x (1)画出散点图; (2)求线性回归方程;(3)若某学生的入学成绩为80分,试预测他在高一年级期末考试中的数学成绩.16.为了了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级的学生进行了问卷调查得到如下列联表.平均每天喝500 mL以上为常喝,体重超过50 kg为肥胖.已知在30人中随机抽取1人,抽到肥胖的学生的概率为415.(1)请将上面的列联表补充完整.(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由.(3)现从常喝碳酸饮料且肥胖的学生中(其中有2名女生)抽取2人参加电视节目,则正好抽到1男1女的概率是多少?17.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?18.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本,称出它们的质量(单位:克),质量值落在(495,510]的产品为合格品,否则为不合格品.下图是甲流水线样本的频率分布直方图,乙流水线样本的频数分布表如下:(1)若以频率作为概率,试估计从甲流水线上任取5件产品,其中合格品的件数X的数学期望;(2)从乙流水线样本的不合格品中任取2件,求其中超过合格品重量的件数Y的分布列;(3)由以上统计数据完成下面的2×2列联表,并回答有多大的把握认为“产品的包装质量与两条自动包装流水线的选择有关”.,其中n=a+b+c+d.参数公式:K2=(a+b)(c+d)(a+c)(b+d)参数数据:答案精析1.D [线性回归方程是根据样本数据得到的一个近似曲线,故由它得到的值也是一个近似值.]2.A [根据题意,画出散点图.根据散点图,知两个变量为负相关,且回归直线与y 轴的交点在y 轴正半轴,所以a ^>0,b ^<0.]3.C [由图可知,女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些.] 4.D [利用相关系数公式即可求得.]5.A [(32,4)为样本点的中心,一定在回归直线上.]6.A [本题主要考查线性回归方程的计算.由b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x ,直接计算得b ^≈2.62,a ^≈11.47, 所以回归方程为y ^=2.62x +11.47.]7.D [回归方程为y ^=0.8x +2+e ,当x =10时,y =0.8×10+2+e ≤10+0.5=10.5.故选D.] 8.D [由相关系数的意义可知,相关系数的绝对值越接近于1,相关性越强,结合题意可知丁的线性相关性更强.故选D.]9.C [由列联表中数据可求得随机变量K 2的观测值k =992×(700×32-60×200)2760×232×900×92≈7.349>6.635,所以在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关系”,即至少有99%的把握认为“患肝病与嗜酒有关系”.因此②③正确,故选C.]10.B [通过散点图选择,画出散点图如图,应除去第三组,对应点的坐标是(-3,4).故选B.]11.262解析 由题意,得x =4,y =15(1 028+a ),代入y ^=4x +242,可得15(1 028+a )=4×4+242,解得a =262. 12.0.64解析 当R 2=0.64时,说明体重的差异有64%是由身高引起的,所以身高解释了64%的体重变化,而随机变量贡献了剩余的36%. 13.0.01解析 由列联表数据,可求得随机变量K 2的观测值 k =81×(10×16-40×15)225×56×50×31≈7.227>6.635.因为P (K 2≥6.635)≈0.01,所以“x 与y 之间有关系”出错的概率为0.01. 14.185解析 由题意可得父亲和儿子的身高组成了三个坐标(173,170)、(170,176)、(176,182), ∴x =173+170+1763=173,y =170+176+1823=176,∴b ^=∑3i =1 (x i -x )(y i -y )∑3i =1 (x i -x )2=1, ∴a ^=y -b ^ ×x =176-173=3, ∴y ^=x +3,即孙子的身高约为y ^=182+3=185.15.解 (1)作出散点图如图,从散点图可以看出,这两个变量具有线性相关关系.(2)列表如下:可求得x =110×(63+67+…+76)=70,y =110×(65+78+…+75)=76, ∑t =110x 2i =51 474,∑i =110x i y i =55 094.∴b ^=55 094-10×70×7651 474-10×702≈0.765 56.a ^≈76-0.765 56×70≈22.41,故所求的线性回归方程为y ^=22.41+0.765 56x .(3)若学生入学成绩为80分,代入上面线性线性回归方程y ^=22.41+0.765 56x ,可求得y ^≈84(分).故该同学高一期末数学成绩预测为84分.16.解 (1)设常喝碳酸饮料且肥胖的学生有x 人,则x +230=415,解得x =6.(2)由已知数据,得K 2=30×(6×18-2×4)210×20×8×22≈8.523>7.879.因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.(3)设常喝碳酸饮料的肥胖者男生为A ,B ,C ,D ,女生为E ,F ,则任取2人有AB ,AC ,AD ,AE ,AF ,BC ,BD ,BE ,BF ,CD ,CE ,CF ,DE ,DF ,EF 共15种.其中1男1女有AE ,AF ,BE ,BF ,CE ,CF ,DE ,DF ,故抽出1男1女的概率P =815.17.解 (1)设事件A 表示“选取的2组数据恰好是不相邻2天的数据”,则A 表示“选取的数据恰好是相邻2天的数据”.基本事件总数为10,事件A 包含的基本事件数为4. ∴P (A )=410=25,∴P (A )=1-P (A )=35.(2)x =12,y =27,∑i =13x i y i =977,∑i =13x 2i =434,∴b ^=∑i =13x i y i -3x y∑i =13x 2i -3x2=977-3×12×27434-3×122=2.5,a ^=y -b ^x =27-2.5×12=-3, ∴y ^=2.5x -3.(3)由(2)知:当x =10时,y ^=22,误差不超过2颗; 当x =8时,y ^=17,误差不超过2颗. 故所求得的线性回归方程是可靠的.18.解 (1)由题图知甲样本中合格品数为(0.06+0.09+0.03)×5×40=36,故合格品的频率为3640=0.9,据此可估计从甲流水线上任取1件产品,该产品为合格品的概率p =0.9,则X ~(5,0.9),E (X )=5×0.9=4.5.(2)由题表知乙流水线样本中不合格品共10个,超过合格品质量的有4件,则Y 的可能取值为0,1,2,且P (Y =k )=C k 4C 2-k 6C 210(k =0,1,2),于是有P (Y =0)=13,P (Y =1)=815,P (Y =2)=215.所以Y 的分布列为:(3)2×2列联表如下:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=80×(360-120)266×14×40×40≈3.117>2.706,所以有90%的把握认为“产品的包装质量与两条自动包装流水线的选择有关”.。