变量间的相关关系与统计案例随堂练习(含答案)

合集下载

高中数学 变量间的相关关系 练习题(含答案)

高中数学  变量间的相关关系 练习题(含答案)

型号二手车时车辆的使用年数不得超过多少年?
参考公式:回归方程
中斜率和截距的最小二乘估计公式分别为:
,
,
. 【答案】(1) 万元;(2)11. 【解析】
(1)由题意,计算

, 12.某地级市共有 200000 中小学生,其中有 7%学生在 2017 年享受了“国家精准扶贫”政策,在享受“国家精 准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为 5:3:2,为进一
,后因某未知原因使第 5 组数据的 值模糊不清,此位置数据记为 (如下表所示),则利用回 归方程可求得实数 的值为( )
196
197
200
203
204
1
3
6
7
A. 8.3 B. 8.2 【答案】D 【解析】 由题意可得:
C. 8.1
D. 8


回归方程过样本中心点,则:
,解得: . 本题选择 D 选项. 学.科.网
(Ⅱ)(1)
(2)
(2)由(1)得:


时 取最大
时,收益 预报值最大.
16.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,
每小时生产有缺点零件的多少,随机器运转速度而变化,下表为抽样试验的结果:
转速 x(转/秒)
16
14
12
8
每小时生产有缺点的零件数 y(件)
严重污染(六级),指数大于 300 .某气象站观测点记录了某市五月 1 号—4 号连续 4 天里,AQI 指数 M 与
当天的空气水平可见度 (单位 cm)的情况如下表 1:
M
900
700

第十章 第四节 变量间的相关关系、统计案例 课时作业 经典高考练习及答案详解

第十章  第四节 变量间的相关关系、统计案例    课时作业  经典高考练习及答案详解

课时作业 A 组 基础对点练1.(2017·长沙模拟)表中提供了某厂节能降耗技术改造后生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对应数据.根据下表提供的数据,求出y 关于x 的线性回归方程为y ^=0.7x +0.35,那么表中t 的值为( )A.3 C .3.5D .4.5解析:因为线性回归方程过样本中心点,所以由回归方程y ^=0.7x +0.35,可知y =0.7x +0.35,又y =2.5+t +4+4.54=11+t 4,x =3+4+5+64=92,所以11+t 4=0.7×92+0.35,解得t =3,故选A.答案:A2.(2017·泰安模拟)登山族为了了解某山高y (km)与气温x (℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:由表中数据,得到线性回归方程y =-2x +a (a ∈R).由此估计山高为72(km)处气温的度数为( )A .-10B .-8C .-6D .-4解析:因为x =10,y =40,所以样本中心点为(10,40),因为回归直线过样本中心点,所以40=-20+a ^,即a ^=60,所以线性回归方程为y ^=-2x +60,所以山高为72(km)处气温的度数为-6,故选C.答案:C3.(2017·南昌模拟)某商品的销售量y (件)与销售价格x (元/件)存在线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=-10x +200,则下列结论正确的是( )A .y 与x 具有正的线性相关关系B .若r 表示变量y 与x 之间的线性相关系数,则r =-10C .当销售价格为10元时,销售量为100件D .当销售价格为10元时,销售量为100件左右解析:y 与x 具有负的线性相关关系,所以A 项错误;当销售价格为10元时,销售量在100件左右,因此C 错误,D 正确;B 项中-10是回归直线方程的斜率.答案:D4.为了研究某大型超市当天销售额与开业天数的关系,随机抽取了5天,其当天销售额与开业天数的数据如下表所示:根据上表提供的数据,求得y 关于x 的线性回归方程为y =0.67x +54.9,由于表中有一个数据模糊看不清,请你推断出该数据的值为( )A .67B .68C .68.3D .71解析:设表中模糊看不清的数据为m .因为x =10+20+30+40+505=30,又样本中心点(x ,y )在回归直线y ^=0.67x +54.9上,所以y =m +3075=0.67×30+54.9,得m =68,故选B.答案:B5.某机构为了解某地区中学生在校月消费情况,随机抽取了100名中学生进行调查,将月消费金额不低于550元的学生称为“高消费群”,调查结果如表所示:A .有90%以上的把握认为“高消费群与性别有关”B .没有90%以上的把握认为“高消费群与性别有关”C .在犯错误的概率不超过1%的前提下,认为“高消费群与性别无关”D .在犯错误的概率不超过1%的前提下,认为“高消费群与性别有关” 参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解析:将表格中的数据代入公式可得K 2=100×(15×40-35×10)25×75×50×50=43≈1.33<2.706,所以没有90%以上的把握认为“高消费群与性别有关”.答案:B6.(2017·唐山模拟)为了研究某种细菌在特定环境下随时间变化的繁殖规律,得如下实验数据,计算得回归直线方程为y ^=0.85x -0.25.由以上信息,得到下表中c 的值为________.解析:x =3+4+5+6+75=5,y =2.5+3+4+4.5+c 5=14+c5,代入回归直线方程中得14+c5=0.85×5-0.25,解得c =6.答案:67.某班主任对全班30名男生进行了作业量多少的调查,数据如下表:不超过________.解析:计算得K 2的观测值为k =30×(12×8-2×8)214×16×20×10≈4.286>3.841,则推断犯错误的概率不超过0.05.答案:0.058.某企业为了增强自身竞争力,计划对职工进行技术培训,以提高产品的质量.为了解某车间对技术培训的态度与性别的关系,对该车间所有职工进行了问卷调查,利用2×2列联表计算得K 2≈3.918,经查对临界值表知P (K 2≥3.841)≈0.05.由此,三位领导得出以下判断:p :有95%的把握认为“对技术培训的态度与性别有关”; q :没有95%的把握认为“对技术培训的态度与性别有关”; r :有5%的把握认为“对技术培训的态度与性别有关”.则下列结论中,正确结论的序号是________.(把你认为正确的命题序号都填上)①p ∧(綈q );②(綈p )∨q ;③(綈p )∧(綈q );④p ∨r .解析:由题意,得K 2≈3.918,P (K 2≥3.841)≈0.05,所以只有p 的判断正确,即有95%的把握认为“对技术培训的态度与性别有关”.由真值表知①④为真命题.答案:①④9.(2017·唐山模拟)为了研究某种细菌在特定环境下随时间变化的繁殖情况,得如下实验数据:(1)求y 关于t (2)利用(1)中的回归方程,预测t =8时,细菌繁殖个数. 附:回归直线的斜率和截距的最小二乘法估计公式分别为:b ^=∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .解析:(1)由表中数据计算得t =5,y =4,∑i =1n (t i -t )(y i -y )=8.5,∑i =1n(t i -t )2=10,b ^=∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2=0.85,a ^=y -b ^t =-0.25.所以回归方程为y ^=0.85t -0.25.(2)将t =8代入(1)的回归方程中得y ^=0.85×8-0.25=6.55.故预测t =8时,细菌繁殖个数为6.55千个.B 组 能力提速练1.(2017·河北三市联考)下表是高三某位文科生连续5次月考的历史、政治的成绩,结果统计如下:(1)求该生5(2)一般来说,学生的历史成绩与政治成绩有较强的线性相关关系,根据上表提供的数据,求两个变量x 、y 的线性回归方程y ^=b ^x +a ^.(附:b ^=∑i =1n (x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x )解析:(1)x =15×(79+81+83+85+87)=83,∵y =15×(77+79+79+82+83)=80,∴s 2y =15×[(77-80)2+(79-80)2+(79-80)2+(82-80)2+(83-80)2]=4.8. (2) ∵∑i =15(x i -x )(y i -y )=30,∑i =15(x i -x )2=40,∴b ^=0.75,a ^=y-b ^x =17.75.则所求的线性回归方程为y ^=0.75x +17.75.2.(2017·郑州一中检测)为了解某地区观众对某大型综艺节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众观看该节目的场数与所对应的人数的表格:10名女性. (1)根据已知条件完成如下2×2列联表,并判断我们能否有95%的把握认为是否为“歌迷”与性别有关?(2)2名女性,若从“超级歌迷”中任意选取2人,求至少有1名女性观众的概率.注:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .解析:(1)由统计表可知,在抽取的100人中,“歌迷”有25人,从而完成2×2列联表如下:将2×2列联表中的数据代入公式计算得:K 2=100×(30×10-45×15)275×25×45×55=10033≈3.030<3.841, 所以我们没有95%的把握认为是否为“歌迷”与性别有关.(2)由统计表可知,“超级歌迷”有5人,其中2名女性,3名男性,设2名女性分别为a 1,a 2,3名男性分别为b 1,b 2,b 3,从中任取2人所包含的基本事件有:(a 1,a 2),(a 1,b 1),(a 1,b 2),(a 1,b 3),(a 2,b 1),(a 2,b 2),(a 2,b 3),(b 1,b 2),(b 1,b 3),(b 2,b 3),共10个,用A 表示“任意选取的2人中,至少有1名女性观众”这一事件,A 包含的基本事件有:(a 1,a 2),(a 1,b 1),(a 1,b 2),(a 1,b 3),(a 2,b 1),(a 2,b 2),(a 2,b 3),共7个,所以P (A )=710.。

第十章 第四节 变量间的相关关系与统计案例(优秀经典课时作业练习及答案详解)

第十章  第四节 变量间的相关关系与统计案例(优秀经典课时作业练习及答案详解)

[课时作业·巩固练习] 实战演练 夯基提能[A 组 基础保分练]1.(2020·桂林模拟)根据如下样本数据:x 3 4 5 6 7 8 y4.02.5-0.50.5-2.0-3.0得到的回归方程为y =bx +a ,则( ) A .a >0,b >0 B .a >0,b <0 C .a <0,b >0D .a <0,b <0解析:由表中数据画出散点图,如图,由散点图可知b <0,a >0. 答案:B2.通过随机询问200名性别不同的大学生是否爱好踢键子运动,计算得到统计量K 2的观测值k ≈4.892,参照附表,得到的正确结论是( )P (K 2≥k )0.10 0.05 0.025 k2.7063.8415.024A .有97.5%B .有97.5%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别无关” 解析:因为K 2的观测值k ≈4.892>3.841,所以有95%以上的把握认为“爱好该项运动与性别有关”.答案:C3.某考察团对10个城市的职工人均工资x (千元)与居民人均消费y (千元)进行调查统计,得出y 与x 具有线性相关关系,且回归方程为y ^=0.6x +1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( )A .66%B .67%C .79%D .84%解析:因为y 与x 具有线性相关关系,满足回归方程y ^=0.6x +1.2,该城市职工人均工资为x =5,所以可以估计该城市的职工人均消费水平y =0.6×5+1.2=4.2,所以可以估计该城市人均消费额占人均工资收入的百分比为4.25=84%.答案:D4.广告投入对商品的销售额有较大影响,某电商对连续5个年度的广告费和销售额进行统计,得到统计数据如表(单位:万元)由表可得回归方程为y =10.2x +a ,据此模拟,预测广告费为10万元时的销售额约为( )A .101.2B .108.8C .111.2D .118.2解析:由题意得:x =4,y =50,∴50=4×10.2+a ^,解得a ^=9.2,∴回归直线方程为y ^=10.2x +9.2,∴当x =10时,y ^=10.2×10+9.2=111.2,故选C.答案:C5.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下对照表:由表中数据得线性回归直线方程y =b x +a 中的b =-2,预测当气温为-4 ℃时,用电量为________度.解析:回归直线过点(x ,y ),根据题意得x =18+13+10+(-1)4=10,y =24+34+38+644=40,将(10,40)代入y ^=-2x +a ^,解得a ^=60,则y ^=-2x +60,当x =-4时,y ^=(-2)×(-4)+60=68,即当气温为-4 ℃时,用电量约为68度.答案:686.为了研究工人的日平均工作量是否与年龄有关,从某工厂抽取了100名工人,且规定日平均生产件数不少于80件者为“生产能手”,列出的2×2列联表如下:有________ 解析:由2×2列联表可知,K 2=100×(25×30-10×35)240×60×35×65≈2.93,因为2.93>2.706,所以有90%以上的把握认为“工人是否为‘生产能手’与工人的年龄有关”.答案:90%[B 组 能力提升练]1.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.由K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),得K 2=100×(45×22-20×13)265×35×58×42≈9.616.参照下表,A .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C .有99%以上的把握认为“生育意愿与城市级别有关”D .有99%以上的把握认为“生育意愿与城市级别无关”解析:∵K 2≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”. 答案:C2.为了解某商品销售量y (件)与其单价x (元)的关系,统计了(x ,y )的10组值,并画成散点图如图,则其回归方程可能是( )A.y ^=-10x -198 B.y ^=-10x +198 C.y ^=10x +198 D.y ^=10x -198解析:由图象可知回归直线方程的斜率小于零,截距大于零,故选B. 答案:B3.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg解析:A ,B ,C 均正确,是回归方程的性质,D 项是错误的,线性回归方程只能预测学生的体重.选项D 应改为“若该大学某女生身高为170 cm ,则估计其体重大约为58.79 kg ”.答案:D4.某服装商场为了了解毛衣的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:月平均气温x (℃) 17 13 8 2 月销售量y (件)24334055由表中数据算出线性回归方程y =bx +a 中的b ≈-2,气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月毛衣的销售量约为________件.⎝ ⎛⎭⎪⎪⎫参考公式:b =∑i =1nx i y i -n x y ∑i =1nx 2i-n x 2,a =y -b x 解析:由所提供数据可计算得出x =10,y =38,将b ≈-2代入公式a =y -b x 可得a =58,即线性回归方程y ^=-2x +58,将x =6代入可得y ^=46.答案:465.2019年全国“两会”,即中华人民共和国第十三届全国人大二次会议和中国人民政治协商会议第十三届全国委员会第二次会议,分别于2019年3月5日和3月3日在北京召开.为了了解哪些人更关注“两会”,某机构随机抽取了年龄在15~75岁之间的200人进行调查,并按年龄绘制的频率分布直方图如图所示,把年龄落在区间[15,35)和[35,75]内的人分别称为“青少年人”和“中老年人”.经统计“青少年人”和“中老年人”的人数之比为19∶21.其中“青少年人”中有40人关注“两会”,“中老年人”中关注“两会”和不关注“两会”的人数之比是2∶1.(1)求图中a ,b 的值;(2)现采用分层抽样的方法在[25,35)和[45,55)中随机抽取8名代表,从8人中任选2人,求2人中至少有1个是“中老年人”的概率;(3)根据已知条件,完成下面的2×2列联表,并根据此统计结果判断:能否有99.9%的把握认为“中老年人”比“青少年人”更加关注“两会”.关注 不关注合计 青少年人 中老年人 合计解析:(1)由题意得⎩⎨⎧(b +0.03)×10=1940,(a +0.02)×10=2140,解得⎩⎪⎨⎪⎧a =0.032 5,b =0.017 5.(2)由题意得在[25,35)中抽取6人,记为A ,B ,C ,D ,E ,F ,在[45,55)中抽取2人,记为1,2.则从8人中任取2人的全部基本事件(共28种)列举如下:AB ,AC ,AD ,AE ,AF ,A 1,A 2,BC ,BD ,BE ,BF ,B 1,B 2,CD ,CE ,CF ,C 1,C 2,DE ,DF ,D 1,D 2,EF ,E 1,E 2,F 1,F 2,12,记2人中至少有1个是“中老年人”为事件A ,则P (A )=1328.(3)2×2列联表如下:K 2=200×(40×35-55×70)295×105×110×90≈12.157>10.828.所以有99.9%的把握认为“中老年人”比“青少年人”更加关注“两会”.6.为了丰富学生的课外文化生活,某中学积极探索开展课外文体活动的新途径及新形式,取得了良好的效果.为了调查学生的学习积极性与参加文体活动是否有关,学校对300名学生做了问卷调查,列联表如下:已知在全部300人中随机抽取1人,抽到学习积极性不高的学生的概率为415.(1)请将上面的列联表补充完整;(2)是否有99.5%的把握认为学习积极性高与参加文体活动有关?请说明你的理由;(3)若从不参加文体活动的同学中按照分层抽样的方法选取5人,再从所选出的5人中随机选取2人,求至少有1人学习积极性不高的概率.附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解析:(1)设学习积极性不高的学生有x 名,则x 300=415,解得x =80. 列联表如下:(2)有.理由:由(1)中的列联表可求得K 2=300×(180×60-20×40)2200×100×220×80≈85>7.879,因此有99.5%的把握认为学习积极性高与参加文体活动有关.(3)根据题意,知从学习积极性高的学生中抽取2人,从学习积极性不高的学生中抽取3人.可设抽出的学习积极性高的学生为A 、B ,学习积极性不高的学生为C 、D 、E ,则选取的2人可以是AB ,AC ,AD ,AE ,BC ,BD ,BE ,CD ,CE ,DE ,其中至少有1人学习积极性不高的有AC ,AD ,AE ,BC ,BD ,BE ,CD ,CE ,DE ,所以至少有1人学习积极性不高的概率为910.。

两变量间的相关关系与统计案例练习题

两变量间的相关关系与统计案例练习题
父亲身高x(cm)
174
176
176
176
178
儿子身高y(cm)
177
则y对x的线性回归方程为()
A:y=x-1
B:y=x+1
C:y=88+
D:y=176
考点三:
1.计算下面2×2列联表的K2的值等于。
B
B
合计
A
39
157
196
A
29
167
196
合计
68
342
392
方法突破一:
能力测试点54:两变量间的相关关系与统计案例
考点一:
1.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()
A:y=-10x+200 B:y=10x+200
C:y=-10x-200 D:y=10x-200
考点二:
1.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
1.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:


需要
40
30
不需要
160
270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?

MS03变量间的相关关系统计案例训练题(含答案)

MS03变量间的相关关系统计案例训练题(含答案)

x0 12
3
y m 3 5.5 7
A.1 B.0.85 C.0.7 D.0.5
10.一名小学生的年龄和身高(单位:cm)的数据如下表:
年龄 x 6
7
8
9
身高 y 118
126
136
144
由散点图可知,身高 y 与年龄 x 之间的线性回归方程为 =8.8x+ ,预测该学生 10 岁时的身高为( )
A.154 B.153 C.152 D.151 11.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 5 次试验,收集数据如下: 加工零件 x(个)10 20 30 40 50 加工时间 y(分64 69 75 82 90 钟)
C.月收入的中位数是 16,x 与 y 有正线性相关关系 D.月收入的中位数是 16,x 与 y 有负线性相关关系
8.已知 x,y 的取值如下表所示:
x
2
3
4
y
6
4
5
如果 y 与 x 呈线性相关,且线性回归方程为
,则 b=( )
A. B. C.
D.
第1页共8页
9.已知 x 与 y 之间的一组数据:已求得关于 y 与 x 的线性回归方程为 =2.1x+0.85,则 m 的值为( )
变量间的相关关系统计案例训练题
一.选择题(共 15 小题)
1.(2015•湖北)已知变量 x 和 y 满足关系 y=﹣0.1x+1,变量 y 与 z 正相关,下列结论中正确的是( )
A.x 与 y 负相关,x 与 z 负相关 B.x 与 y 正相关,x 与 z 正相关
C.x 与 y 正相关,x 与 z 负相关 D.x 与 y 负相关,x 与 z 正相关

限时集训(五十八) 变量间的相关关系与统计案例

限时集训(五十八) 变量间的相关关系与统计案例

限时集训(五十八) 变量间的相关关系与统计案例(限时:45分钟 满分:81分)一、选择题(本大题共6小题,每小题5分,共30分) 1.下列关系中,是相关关系的为( ) ①学生的学习态度与学习成绩之间的关系; ②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. A .①② B .①③ C .②③D .②④2.(2012·新课标全国卷)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .13.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为( ) A.y ^=1.23x +4 B.y ^=1.23x +5 C.y ^=1.23x +0.08D.y ^=0.08x +1.234.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的线性回归方程为( ) A .y =x -1 B .y =x +1 C .y =88+12xD .y =1765.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:则大约有多大的把握认为多看电视与人变冷漠有关系( ) A .99% B .97.5% C .95%D .90%6.通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:由K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),算得K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A .有99%以上的把握认为“选择过马路的方式与性别有关”B .有99%以上的把握认为“选择过马路的方式与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关” 二、填空题(本大题共3小题,每小题5分,共15分)7.经调查某地若干户家庭的年收入x (万元)和年饮食支出y (万元)具有线性相关关系,并得到y 关于x 的线性回归直线方程:y ^=0.245x +0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.8.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.9.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:已知P (K 2≥3.841)≈0.05,P 根据表中数据,得到K 2=50×(13×20-10×7)223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为________.三、解答题(本大题共3小题,每小题12分,共36分) 10.已知x ,y 的一组数据如下表:(1)从x ,y (2)对于表中数据,甲、乙两同学给出的拟合直线分别为y =13x +1与y =12x +12,试利用“最小平方法(也称最小二乘法)”判断哪条直线拟合程度更好.11.为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x 、物理成绩y 进行分析.下面是该生7次考试的成绩.(1)(2)已知该生的物理成绩y 与数学成绩x 是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.(其中,数据(x i ,y i )(i =1,2,…,n )的线性回归方程为y ^=b ^x+a ^,b ^=∑i =1n(x i -x -)(y i -y -)∑i =1n(x i -x -)2,a ^=y --b ^x -)12.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表.已知从全部105人中随机抽取1人为优秀的概率为27.(1)请完成上面的列联表;(2)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”; (3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到6号或10号的概率.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),限时集训(五十八) 变量间的相关关系与统计案例答 案1.A 2.D 3.C 4.C 5.A 6.A 7.0.245 8.0.5 0.53 9.5%10.解:(1)从x ,y 中各取一个数组成数对(x ,y ),共有25对,其中满足x +y ≥10的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共9对.故所求概率P =925.(2)用y =13x +1作为拟合直线时,所得y 值与y 的实际值的差的平方和为S 1=⎝⎛⎭⎫43-12+(2-2)2+(3-3)2+⎝⎛⎭⎫103-42+⎝⎛⎭⎫113-52=73.用y =12x +12作为拟合直线时,所得y 值与y 的实际值的差的平方和为S 2=(1-1)2+(2-2)2+⎝⎛⎭⎫72-32+(4-4)2+⎝⎛⎭⎫92-52=12. ∵S 2<S 1,∴直线y =12x +12的拟合程度更好.11.解:(1)∵x -=100+-12-17+17-8+8+127=100,y -=100+-6-9+8-4+4+1+67=100,∴s 2数学=9947=142.∴s 2物理=2507, ∵s 2数学>s 2物理,∴该生的物理成绩更稳定.(2)由于x 与y 之间具有线性相关关系,∴b ^=71722177i ii i i x y x yx x==--∑∑=497994=0.5, a ^=y --b ^x -=100-0.5×100=50. ∴线性回归方程为y ^=0.5x +50. 当y =115时,x =130. 建议:进一步加强对数学的学习,提高数学成绩的稳定性,这将有助于物理成绩的进一步提高. 12.解:(1)(2)K 2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”.(3)设“抽到6号或10号”为事件A ,先后两次抛掷一枚均匀的骰子,出现的点数为(x ,y ),则所有的基本事件有(1,1)、(1,2)、(1,3)、…、(6,6),共36个.事件A 包含的基本事件有(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个,∴P (A )=836=29.。

高考数学一轮复习学案:11.3 变量间的相关关系、统计案例(含答案)

高考数学一轮复习学案:11.3 变量间的相关关系、统计案例(含答案)

高考数学一轮复习学案:11.3 变量间的相关关系、统计案例(含答案)11.3变量间的相关关系变量间的相关关系..统计案例统计案例最新考纲考情考向分析1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程3.了解独立性检验的基本思想.方法及其初步应用4.了解回归分析的基本思想.方法及简单应用.回归分析,独立性检验是全国卷高考重点考查的内容,必考一个解答题,选择.填空题中也会出现主要考查回归方程,相关系数,利用回归方程进行预测,独立性检验的应用等.1两个变量的线性相关1正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关2负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关3线性相关关系.回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线2回归方程1最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法2回归方程方程ybxa是两个具有线性相关关系的变量的一组数据x1,y1,x2,y2,,xn,yn的回归方程,其中a,b是待定参数bni1xixyiyni1xix2ni1xiyinxyni1x2inx2,aybx.3回归分析1定义对具有相关关系的两个变量进行统计分析的一种常用方法2样本点的中心对于一组具有线性相关关系的数据x1,y1,x2,y2,,xn,yn,其中x,y称为样本点的中心3相关系数当r0时,表明两个变量正相关;当rR22;x,y之间不能建立线性回归方程答案解析在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故正确;由散点图知用y21ecxc拟合比用ybxa拟合效果要好,则R21R22,故正确;x,y之间可以建立线性回归方程,但拟合效果不好,故错误思维升华判定两个变量正,负相关性的方法1画散点图点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关2相关系数r0时,正相关;r0时,正相关;b10.828,所以有99.9的把握认为“经常使用微信与年龄有关”求线性回归方程的方法技巧典例12分某地最近年粮食需求量逐年上升,下表是部分统计数据年份xxxxxxxxxx需求量/万吨2362462572762861利用所给数据求年需求量与年份之间的线性回归方程ybxa;2利用1中所求出的线性回归方程预测该地xx年的粮食需求量思想方法指导回归分析是处理变量相关关系的一种数学方法主要解决1确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;2根据一组观测值,预测变量的取值及判断变量取值的变化趋势;3求出线性回归方程规范解答解1由所给数据看出,年需求量与年份之间近似直线上升,下面来求线性回归方程,先将数据处理如下表年份xx42024需求257211101929对处理的数据,容易算得x0,y3.2,4分b421211219429503.242222242502260406.5,aybx3.2.6分由上述计算结果,知所求线性回归方程为y2576.5xxx3.2,即y6.5xxx260.2.8分2利用所求得的线性回归方程,可预测xx年的粮食需求量大约为6.5xxxx260.26.58260.2312.2万吨12分。

高考数学(理)一轮复习分层演练:10.3变量间的相关关系、统计案例(含答案)

高考数学(理)一轮复习分层演练:10.3变量间的相关关系、统计案例(含答案)

第3讲 变量间的相关关系、统计案例[学生用书P221])1.变量间的相关关系常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.(3)回归方程为y ^=b ^x +a ^,其中b ^=∑ni =1x i y i-n x y∑n i =1 x 2i -n x 2,a ^=y -b ^x . (4)相关系数当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r |大于0.75时,认为两个变量有很强的线性相关性.3.独立性检验(1)2×2列联表:假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称2×2列联表)为:(2)K 2统计量K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d 为样本容量).1.辨明三个易误点(1)回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(x ,y )点,可能所有的样本数据点都不在直线上.(2)利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值). (3)虽然任何一组不完全相同的数据都可以求出回归直线方程,但只有具有线性相关关系的一组数据才能得到有意义的回归直线方程,求出的方程才具有实际价值.2.求回归方程的方法求解回归方程的关键是确定回归系数a ^,b ^,因求解b ^的公式计算量太大,一般题目中给出相关的量,如x ,y ,∑i =1nx 2i ,∑i =1nx i y i 等,便可直接代入求解.充分利用回归直线过样本中心点(x ,y ),即有y =b ^x +a ^,可确定a ^.1.有关线性回归的说法,不正确的是( ) A .具有相关关系的两个变量是非确定性关系 B .散点图能直观地反映数据的相关程度C .回归直线最能代表线性相关的两个变量之间的关系D .散点图中的点越集中,两个变量的线性相关性越强 [答案] D2.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归直线方程可能是( ) A.y ^=-10x +200 B .y ^=10x +200C.y ^=-10x -200 D .y ^=10x -200A [解析] 因为商品销售量y (件)与销售价格x (元/件)负相关,所以b ^<0,排除B ,D .又因为x =0时,y >0,所以应选A.3.某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K 2=7.069,则所得到的统计学结论是:有多少的把握认为“学生性别与支持该活动有关系”.( )附:A.0.1% B .1% C .99%D .99.9%C [解析] 因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有1-0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”.4.下面是一个2×2列联表则表中a 、b 处的值分别为________. [解析] 因为a +21=73,所以a =52. 又因为a +2=b ,所以b =54, [答案] 52、545.已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ^,则a ^=________.[解析] 由已知得x =2,y =4.5,因为回归方程经过点(x ,y ),所以a ^=4.5-0.95×2=2.6.[答案] 2.6相关关系的判断[学生用书P222][典例引领](2015·高考湖北卷)已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( )A .x 与y 正相关,x 与z 负相关B .x 与y 正相关,x 与z 正相关C .x 与y 负相关,x 与z 负相关D .x 与y 负相关,x 与z 正相关【解析】 因为y =-0.1x +1的斜率小于0,故x 与y 负相关.因为y 与z 正相关,可设z =b ^y +a ^,b ^>0,则z =b ^y +a ^=-0.1b ^x +b ^+a ^,故x 与z 负相关.【答案】 C判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r >0时,正相关;r <0时,负相关. (3)线性回归方程中:b ^>0时,正相关;b ^<0时,负相关.某公司在2016年上半年的收入x (单位:万元)与月支出y (单位:万元)的统计资料如表所示:根据统计资料,则( )A .月收入的中位数是15,x 与y 有正线性相关关系B .月收入的中位数是17,x 与y 有负线性相关关系C .月收入的中位数是16,x 与y 有正线性相关关系D .月收入的中位数是16,x 与y 有负线性相关关系C [解析] 月收入的中位数是15+172=16,收入增加,支出增加,故x 与y 有正线性相关关系.线性回归方程及其应用(高频考点)[学生用书P222]线性回归问题是高考中的热点问题,考查形式可以是小题,也可以是解答题. 高考中对线性回归问题的考查主要有以下三个命题角度: (1)由回归直线方程求参数值; (2)求回归直线方程; (3)利用回归方程进行预测.[典例引领](2016·高考全国卷丙)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1-7分别对应年份2008-2014.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:参考数据:∑i =17y i =9.32, ∑i =17t i y i =40.17,∑i =17(y i -y )2=0.55,7≈2.646.参考公式:相关系数,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:【解】(1)由折线图中数据和附注中参考数据得 t =4, i =17(t i -t )2=28,=40.17-4×9.32=2.89, r =2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得=2.8928≈0.103, a ^=y -b ^t =1.331-0.103×4≈0.92. 所以,y 关于t 的回归方程为y ^=0.92+0.10t .将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.最小二乘估计的三个步骤(1)作出散点图,判断是否线性相关. (2)如果是,则用公式求a ^,b ^,写出回归方程. (3)根据方程进行估计.[注意] 回归直线方程恒过点(x -,y -).[题点通关]角度一 由回归直线方程求参数值1.表中提供了某厂节能降耗技术改造后生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对应数据.根据下表提供的数据,求出y 关于x 的线性回归方程为y ^=0.7x +0.35,那么表中t 的值为( )A.3 B .3.15C .3.5D .4.5A [解析] 因为线性回归方程过样本中心点,所以由回归方程y ^=0.7x +0.35,知y =0.7x +0.35,又y =2.5+t +4+4.54=11+t 4,x =3+4+5+64=92,所以11+t 4=0.7×92+0.35,解得t =3.故选A.角度二、三 求回归直线方程并进行预测2.(2017·石家庄市教学质量检测(二))为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)和年利润z 的影响,对近五年该农产品的年产量和价格统计如下表:(1)求y 关于x 的线性回归方程y ^=b ^x +a ^;(2)若每吨该农产品的成本为2千元,假设该农产品可全部卖出,预测当年产量为多少时,年利润z 取到最大值?(保留两位小数)参考公式:b ^=∑ni =1(x i -x -)(y i -y -)∑ni =1(x i -x -)2=∑ni =1x i y i-n x -y -∑n i =1x 2i -n x -2, a ^=y --b ^x -.[解] (1) x =3,y =5,∑5i =1x i y i =62.7,∑5i =1x 2i =55, 解得b ^=-1.23,a ^=8.69, 所以y ^=8.69-1.23x .(2)年利润z =x (8.69-1.23x )-2x =-1.23x 2+6.69x ,所以当x ≈2.72时,年利润z 最大.独立性检验[学生用书P223][典例引领](2017·云南省第一次统一检测)某校高二年级共有1 600名学生,其中男生960名,女生640名.该校组织了一次满分为100分的数学学业水平模拟考试.根据研究,在正式的学业水平考试中,本次成绩在[80,100]的学生可取得A等(优秀),在[60,80)的学生可取得B等(良好),在[40,60)的学生可取得C等(合格),不到40分的学生只能取得D等(不合格).为研究这次考试成绩优秀是否与性别有关,现按性别采用分层抽样的方法抽取100名学生,将他们的成绩按从低到高分成[30,40)、[40,50)、[50,60)、[60,70)、[70,80)、[80,90)、[90,100]七组加以统计,绘制成如图所示的频率分布直方图.(1)估计该校高二年级学生在正式的数学学业水平考试中成绩不合格的人数;(2)请你根据已知条件将下列2×2列联表补充完整.并判断是否有90%的把握认为“该校高二年级学生在本次考试中数学成绩优秀与性别有关”?【解】(1) 设抽取的100名学生中,本次考试成绩不合格的有x人,根据题意得x=100×[1-10×(0.006+0.012×2+0.018+0.024+0.026)]=2.据此估计该校高二年级学生在正式的数学学业水平考试中成绩不合格的人数为2100×1600=32.(2)根据已知条件得2×2列联表如下:因为K 2=100×(12×34-6×48)60×40×18×82≈0.407<2.706,所以没有90%的把握认为“该校高二年级学生在本次考试中数学成绩优秀与性别有关”.独立性检验的一般步骤(1)根据样本数据制成2×2列联表;(2)根据公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算K 2的值;(3)查表比较K 2与临界值的大小关系,作出统计判断.(2017·九江第一次统考)某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在40分以下的学生后,共有男生300名,女生200名.现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下所示频数分布表.(1)估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果看,数学成绩与性别是否有关;(2)规定80分以上为优分(含80分),请你根据已知条件作出2×2列联表,并判断是否有90%以上的把握认为“数学成绩与性别有关”.[解] (1) x 男=45×0.05+55×0.15+65×0.3+75×0.25+85×0.1+95×0.15=71.5,x 女=45×0.15+55×0.1+65×0.125+75×0.25+85×0.325+95×0.05=71.5, 从男、女生各自的平均分来看,并不能判断数学成绩与性别有关.(2)由频数分布表可知:在抽取的100名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得2×2列联表如下:可得K 2=100×(15×25-15×45)60×40×30×70≈1.79,因为1.79<2.706,所以没有90%以上的把握认为“数学成绩与性别有关”.[学生用书P314(独立成册)]1.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③C .③④D .①④D [解析] 正相关指的是y 随x 的增大而增大,负相关指的是y 随x 的增大而减小,故不正确的为①④.2.(2017·南昌市第一次模拟测试)为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据(x 1,y 1),(x 2,y 2),(x 3,y 3),(x 4,y 4),(x 5,y 5).根据收集到的数据可知x 1+x 2+x 3+x 4+x 5=150,由最小二乘法求得回归直线方程为y ^=0.67x +54.9,则y 1+y 2+y 3+y 4+y 5的值为( )A .75B .155.4C .375D .466.2C [解析] 由x 1+x 2+x 3+x 4+x 5=150,得x =30,代入回归直线方程y ^=0.67x +54.9,得y =75,则y 1+y 2+y 3+y 4+y 5=375.3.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),算得K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:参照附表,得到的正确结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关”C [解析] 根据独立性检验的定义,由K 2≈7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.4.(2017·东营模拟)已知变量x 与y 之间的回归直线方程为y ^=-3+2x ,若∑10i =1x i =17,则∑10i =1y i 的值等于( ) A .3 B .4C .0.4D .40B [解析] 依题意x =1710=1.7,而直线y ^=-3+2x 一定经过样本点的中心(x ,y ), 所以y =-3+2x =-3+2×1.7=0.4,所以∑10i =1y i =0.4×10=4. 5.春节期间,某销售公司每天销售某种取暖商品的销售额y (单位:万元)与当天的平均气温x (单位:℃)有关.现收集了春节期间这个销售公司4天的x 与y 的数据列于下表:根据以上数据,用线性回归的方法,求得y 与x 之间的线性回归方程y ^=b ^x +a ^的系数b ^=-125,则a ^=________. [解析] 由表中数据可得x -=-4,y -=25,所以线性回归方程y ^=-125x +a ^过点(-4,25),代入方程得25=-125×(-4)+a ^,解得a ^=775.[答案]7756.(2017·赣州摸底考试)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x 6,y 6)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,6)都在曲线y =bx 2-13附近波动.经计算∑6i =1x i =11,∑6i =1y i=13,∑6i =1x 2i =21,则实数b 的值为________. [解析] 令t =x 2,则曲线的回归方程变为线性的回归方程,即y =bt -13,此时t =∑6i =1x 2i 6=72,y =∑6i =1y i 6=136,代入y =bt -13,得136=b ×72-13,解得b =57. [答案] 577.(2017·广东省六校联考)某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为311.(1)请完成上面的列联表;(2)根据列联表的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”. 参考公式与临界值表:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).[解] (1)(2)根据列联表中的数据,得到K 2=110×(10×30-20×50)260×50×30×80≈7.486<10.828.因此按99.9%的可靠性要求,不能认为“成绩与班级有关系”.8.(2017·唐山第一次模拟)为了研究某种细菌在特定环境下随时间变化的繁殖情况,得如下实验数据:(1)求y 关于t 的线性回归方程;(2)利用(1)中的回归方程,预测t =8时,细菌繁殖个数. [解] (1)由表中数据计算得,t -=5,y -=4,所以回归方程为y ^=0.85t -0.25.(2)将t =8代入(1)的回归方程中得y ^=0.85×8-0.25=6.55. 故预测t =8时,细菌繁殖个数为6.55千个.9.(2017·郑州第二次质量预测)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为y ^=-4x +a ^.若在这些样本点中任取一点,则它在回归直线左下方的概率为( )A.16 B .13C.12D .23B [解析] 由表中数据得x =6.5,y =80,由y =-4x +a ^,得a ^=106,故线性回归方程为y ^=-4x +106.将(4,90),(5,84),(6,83),(7,80),(8,75),(9,68)分别代入回归方程可知有6个基本事件,因84<-4×5+106=86,68<-4×9+106=70,故(5,84)和(9,68)在直线的左下方,满足条件的只有2个,故所求概率为26=13.10.(2017·梅州一模)在2016年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:由散点图可知,销售量y 与价格x 之间有较强的线性相关关系,其线性回归方程是y ^=-3.2x +40,且m +n =20,则其中的n =________.[解析] x =9+9.5+m +10.5+115=8+m 5,y =11+n +8+6+55=6+n5,回归直线一定经过样本中心(x ,y ),即6+n5=-3.2⎝⎛⎭⎫8+m 5+40, 即3.2m +n =42.又因为m +n =20,即⎩⎪⎨⎪⎧3.2m +n =42,m +n =20,解得⎩⎪⎨⎪⎧m =10,n =10,故n =10.[答案] 1011.第31届夏季奥林匹克运动会于2016年8月5日至8月21日在巴西里约热内卢举行.下表是近五届奥运会中国代表团和俄罗斯代表团获得的金牌数的统计数据(单位:枚).(1)根据表格中两组数据完成近五届奥运会两国代表团获得的金牌数的茎叶图;(2)下表是近五届奥运会中国代表团获得的金牌数之和y (从第26届算起,不包括之前已获得的金牌数)随时间x 变化的数据:作出散点图如下:由图可以看出,金牌数之和y 与时间x 之间存在线性相关关系,请求出y 关于x 的线性回归方程;并预测到第32届奥运会时中国代表团获得的金牌数之和为多少?参考数据:x -=28,y -=85.6,附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为:[解] (1)近五届奥运会两国代表团获得的金牌数的茎叶图如下:(2)a ^=y --b ^x -=85.6-38.1×28=-981.2,所以金牌数之和y 关于时间x 的线性回归方程为 y ^=38.1x -981.2.当x =32时,中国代表团获得的金牌数之和的预报值 y ^=38.1×32-981.2=238,故预测到第32届奥运会时中国代表团获得的金牌数之和为238枚.。

习题-变量间的相关关系、统计案例

习题-变量间的相关关系、统计案例

10.3 变量间的相关关系、统计案例基础篇 固本夯基考点一 变量间的相关关系1.(2022届陕西宝鸡期末,4)下列两个变量具有相关关系的是( ) A.正方体的体积与棱长 B.汽车匀速行驶时的路程与时间 C.人的体重与饭量 D.人的身高与视力 答案 C2.(2021西南名校联盟联考,3)已知甲、乙、丙、丁四组数据变量间对应的线性相关系数分别为0.46,0.79, -0.92,0.85,则( )A.甲组数据变量间的线性相关程度最强B.乙组数据变量间的线性相关程度最弱C.丙组数据变量间的线性相关程度最强D.丁组数据变量间的线性相关程度最强 答案 C3.(2020陕西铜川二模,5)四名同学根据各自的样本数据研究变量x,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x-6.423; ②y 与x 负相关且y ^=-3.476x+5.648; ③y 与x 正相关且y ^=5.437x+8.493; ④y 与x 正相关且y ^=-4.326x-4.578. 其中不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④ 答案 D4.(2020陕西榆林三模,3)如图所示,给出了样本容量均为7的A,B 两组样本数据的散点图,已知A 组样本数据的相关系数为r 1,B 组样本数据的相关系数为r 2,则( )A.r 1=r 2B.r 1<r 2C.r 1>r 2D.无法判定 答案 C5.(2022届四川资阳一诊,4)我国在2020年如期完成了新时代脱贫攻坚目标任务,脱贫攻坚战取得全面胜利,历史性地解决了绝对贫困问题,并全面建成了小康社会.现就2013—2019 年年末全国农村贫困人口数进行了统计,制成如下散点图:据此散点图,下面 4个回归方程类型中最适宜作为年末贫困人口数y 和年份代码x 的回归方程类型的是( )A.y=a+bxB.y=a+bx C.y=a+be x D.y=a+bln x 答案 A6.(2022届四川绵阳阶段测试,3)某市物价部门对5家商场的某商品一天的销售量及其价格进行了调查,5家商场的价格x(元)和销售量y(件)之间的一组数据如表所示:价格x(元) 9 9.5 10 10.5 11 销售量y(件)1110865按公式计算,y 与x 的回归直线方程是y ^=-3.2x+a ^,相关系数|r|=0.992,则下列说法错误的是( ) A.变量x,y 线性负相关且相关性较强 B.a ^=40C.当x=8.5时,y 的估计值为12.8D.相应于点(10.5,6)的残差为0.4 答案 D7.(2020兰州一诊,7)近五年来某草场羊只数与草场植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示.年份 1 2 3 4 5 羊只数(万只) 1.4 0.9 0.750.60.3 草场植被指数1.14.315.6 31.349.7根据表及图得到以下判断:①羊只数与草场植被指数成减函数关系;②若利用这五组数据得到的两变量间的相关系数为r 1,去掉第一年数据后得到的相关系数为r 2,则|r 1|<|r 2|; ③可以利用回归直线方程,准确地得到当羊只数为2万只时的草场植被指数. 以上判断中正确的个数是( )A.0B.1C.2D.3 答案 B8.(2020课标Ⅱ,18,12分)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i=1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑i=120x i =60,∑i=120y i =1 200,∑i=120(x i -x )2=80,∑i=120(y i -y )2=9 000,∑i=120(x i -x)(y i -y)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘地块数);(2)求样本(x i ,y i )(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由. 附:相关系数 r=∑i=1n(x i -x)(y -y)√∑i=1(x i -x)2∑i=1(y i -y)2,√2≈1.414.解析(1)由已知得样本平均数y =120∑i=120y i =60,从而该地区这种野生动物数量的估计值为60×200=12 000.(2)样本(x i ,y i )(i=1,2,…,20)的相关系数 r=∑i=120(x i -x)(y -y)√∑i=1(x i -x)2∑i=1(y i-y)2=√80×9 000=2√23≈0.94.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.考点二 独立性检验1.(2022届黑龙江月考,8)某学校食堂对高三学生偏爱蔬菜还是肉类与性别的关系进行了一次调查,根据独立性检验原理,处理所得数据之后发现,有99%的把握但没有99.9%的把握认为偏爱蔬菜还是肉类与性别有关,则K 2的观测值可能为( )P(K 2≥k 0) 0.10 0.05 0.025 0.010 0.0050.001k0 2.706 3.841 5.024 6.6357.87910.828A.K2=3.206B.K2=6.625C.K2=7.869D.K2=11.208答案C2.(2022届山西运城期中,7)为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验.根据四个实验室得到的列联表画出如下四个等高堆积条形图,最能体现该药物对预防禽流感有显著效果的图形是()答案D3.(2020宁夏石嘴山二模,4)通过随机询问200名性别不同的大学生是否爱好踢毽子运动,计算得到K2的观测值k≈4.892,参照下表,得到的正确结论是()P(K2≥k0)0.100.050.025k0 2.706 3.841 5.024A.有97.5%以上的把握认为“爱好该项运动与性别有关”B.有97.5%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别无关”答案C4.(2021四川南充阆中中学4月质检,6)若由一个2×2列联表中的数据计算得K2=4.013,那么有的把握认为两个变量有关系.()P(K2≥k0)0.150.100.050.0250.0100.0050.001k0 2.0722.7063.8415.0246.6357.87910.828A.95%B.97.5%C.99%D.99.9%答案A5.(2021安徽黄山二模,7)给出下列命题:①在线性回归模型中,相关指数R2表示解释变量x对于预报变量y的贡献率,R2越接近于0,表示回归效果越好;②两个变量相关性越强,则相关系数的绝对值就越接近于1; ③两个模型中残差平方和越小的模型拟合的效果越好;④对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大. 其中正确命题的个数是( )A.1B.2C.3D.4 答案 C6.(2022届河南焦作模拟,17)第32届夏季奥运会于2021年7月23日至8月8日在日本举行,为了解某校学生对奥运会是否关注,随机调查了该校200名学生,统计结果如表:关注 不关注 合计 女生 34 51 85 男生 66 49 115 合计100100200(1)分别估计该校女生和男生关注奥运会的概率;(2)能否有99%的把握认为该校女生和男生对奥运会的关注度有差异? 参考公式及数据: K2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P(K 2≥k) 0.050 0.010 0.001k3.8416.635 10.828解析 (1)估计该校女生关注奥运会的概率约为3485=25;男生关注奥运会的概率约为66115. (2)由题表中数据可知K2=200×(34×49-66×51)2100×100×85×115=13623≈5.913. 因为5.913<6.635,故没有99%的把握认为该校女生和男生对奥运会的关注度有差异.7.(2022届昆明质检,17)“微信运动”是手机APP 推出的多款健康运动软件中的一款,某学校140名教师均在微信好友群中参与了“微信运动”,对运动10 000步或以上的教师授予“运动达人”称号,低于10 000步称为“参与者”.为了解教师们的运动情况,选取了教师们在某日的运动数据进行分析,统计结果如下:运动达人 参与者 合计 男教师 60 20 80 女教师 40 20 60 合计10040140(1)根据上表说明,能否在犯错误概率不超过0.05的前提下认为获得“运动达人”称号与性别有关; (2)从获得“运动达人”称号的教师中采用按性别分层抽样的方法选取5人参加全国第四届“万步有约”全国健走激励大赛某赛区的活动,若从选取的5人中随机抽取2人作为代表参加开幕式,求抽取的2人都为女教师的概率. 参考公式:K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.参考数据:P(K 2≥k 0) 0.050 0.0100.001k 03.8416.635 10.828解析 (1)∵K2=140×(60×20-40×20)280×60×100×40≈1.167<3.841,∴不能在犯错误的概率不超过0.05的前提下认为获得“运动达人”称号与性别有关.(2)根据分层抽样方法得:参赛的男教师有60100×5=3人,参赛的女教师有40100×5=2人,抽取的男教师记为A,B,C;女教师记为a,b.从抽取的这五名教师中随机选取2名,有AB,AC,Aa,Ab,BC,Ba,Bb,Ca,Cb,ab 共10种选法,其中2人都是女教师的选法有ab 一种,故抽取的2人都为女教师的概率P=110.8.(2019课标Ⅰ,17,12分)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到列联表:满意 不满意 男顾客 40 10 女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d).P(K 2≥k)0.050 0.010 0.001 k3.8416.63510.828.解析 (1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6. (2)K2=100×(40×20-10×30)250×50×70×30≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.综合篇 知能转换考法一 线性回归方程的求解与应用1.(2022届四川模拟,8)已知回归直线的斜率的估计值为1.23,样本点的中心为(5,6),则回归直线方程为( ) A.y ^=-0.15x+1.23 B.y ^=-2.38x+1.23C.y ^=1.23x-2.38 D.y ^=1.23x-0.15 答案 D2.(2022届哈尔滨模拟,10)已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间具有线性相关关系,利用下表中的五组数据求得回归直线方程为y ^=b ^x+a ^,根据该回归方程,预测当x=8时,y ^=84.8,则b ^=( )x23456y 25 37 50 56 64A.9.4B.9.5C.9.6D.9.8 答案 C3.(2021甘肃二模,7)某地以“绿水青山就是金山银山”理念为引导,推进绿色发展,现要订购一批苗木,苗木长度与售价如下表:苗木长度x(厘米) 38 485868 7888 售价y(元)16.8 18.8 20.8 22.8 2425.8由表可知,苗木长度x(厘米)与售价y(元)之间存在线性相关关系,回归方程为y ^=0.2x+a ^,则当苗木长度为150厘米时,售价大约为( ) A.33.3元 B.35.5元 C.38.9元 D.41.5元 答案 C4.(2021西安中学二模,4)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i=1,2,…,n),用最小二乘法建立的回归方程为y ^=0.85x-85.71. ①y 与x 具有正的线性相关关系; ②回归直线过样本点的中心(x ,y );③若该大学某女生身高增加1 cm,则其体重约增加0.85 kg; ④若该大学某女生身高为170 cm,则其体重必为58.79 kg. 则上述判断不正确的个数是( ) A.1 B.2 C.3 D.4 答案 A5.(2020中原名校质量考评,7)根据最小二乘法,由一组样本数据(x i ,y i )(其中i=1,2,…,300)求得的回归方程是y ^=b ^x+a ^,则下列说法正确的是( )A.至少有一个样本点落在回归直线y ^=b ^x+a ^上B.若所有样本点都在回归直线y ^=b ^x+a ^上,则变量间的相关系数为1 C.对所有的解释变量x i (i=1,2,…,300),b ^x i +a ^的值一定与y i 有误差 D.若回归直线y ^=b ^x+a ^的斜率b ^>0,则变量x 与y 正相关 答案 D6.(2021江西八校4月联考,14)如图,根据已知的散点图得到y 关于x 的线性回归方程为y ^=b ^x+0.2,则b ^= .答案 1.67.(2022届江西顶级名校调研,18)根据国际疫情形势以及传染病防控的经验,加快新冠病毒疫苗接种是当前有力的防控手段,我国正在安全、有序加快推进疫苗接种工作.某乡村采取通知公告、微信推送、广播播放、条幅宣传等形式,积极开展疫苗接种社会宣传工作,消除群众疑虑,提高新冠疫苗接种率,让群众充分地认识到了疫苗接种的重要作用.自宣传开始后村干部统计了本村200名居民(未接种)5天内每天新接种新冠疫苗的情况如下表:第x 天 1 2 3 4 5 新接种人数y1015192328(1)建立y 关于x 的线性回归方程;(2)假设全村共计2 000名居民(均未接种过新冠疫苗),用样本估计总体来预测该村80%居民接种新冠疫苗需要几天.参考公式:回归方程y ^=b ^x+a ^中斜率和截距的最小二乘估计公式分别为b ^=∑i=1nx i y i -nxy ∑i=1nx i 2-nx2,a ^=y -b ^x .解析 (1)x =1+2+3+4+55=3,y =10+15+19+23+285=19,则b ^=10+30+57+92+140-5×3×1912+22+32+42+52-5×32=225,a ^=19-225×3=295,故y 关于x 的线性回归方程为y ^=225x+295.(2)设a n =225n+295,数列{a n }的前n 项和为S n ,易知数列{a n }是等差数列, 则S n =n(a 1+a n )2=n (225+295+225n+295)2=115n 2+8n,因为S 6=127.2,S 7=163.8,所以10S 6=1 272,10S 7=1 638,又2 000×80%=1 600(人),所以预测该村80%居民接种新冠疫苗需要7天.8.(2021广西贵港港北模拟,17)某个体服装店经营各种服装,在某周内获纯利润y(元)与该周每天销售这种服装件数x 之间的一组数据关系如下表:x 3456789y66 69 73 81 89 90 91(1)求x ,y ;(2)若y 与x 线性相关,请求纯利润y(元)与每天销售件数x 的回归直线方程. 参考数据及公式:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2=∑i=1nx i y i -nx y ∑i=1nx i2-nx 2,a ^=y -b ^x ,∑i=17x i 2=280,∑i=17x i y i =3 487. 解析 (1)x =17×(3+4+5+6+7+8+9)=6,y =17×(66+69+73+81+89+90+91)=5597. (2)设回归直线方程为y ^=b ^x+a ^.∵∑i=17x i 2=280,∑i=17x i y i =3 487,∴b ^=3 487-7×6×5597280-7×36=13328=4.75,a ^=5597-6×4.75≈51.36.∴回归直线方程为y ^=4.75x+51.36.9.(2021成都郫都模拟,18)某人统计了近5年某网站“双11”当天的交易额,统计结果如下表:年份 2015 2016 2017 2018 2019 年份代码x 1 2 3 4 5 交易额y/百亿元912172126(1)请根据上表提供的数据,用相关系数r 说明y 与x 的线性关系的强弱(线性相关系数保留三位小数);(统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值x i ,变量y 的观测值为y i (1≤i ≤n),则两个变量的相关系数的计算公式为r=∑i=1n(x i -x)(y -y)√∑i=1(x i -x)2∑i=1(y i -y)2.统计学认为,对于变量x,y,如果r ∈[-1,-0.75],那么负相关很强;如果r ∈[0.75,1],那么正相关很强;如果r ∈(-0.75,-0.30]或r ∈[0.30,0.75),那么相关性一般;如果r ∈[-0.25,0.25],那么相关性较弱)(2)求出y 关于x 的线性回归方程,并预测2020年该网站“双11”当天的交易额. 参考公式:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2,a ^=y -b ^x ,参考数据:√1 860≈43.1.解析 (1)根据题表中的数据,可得x =15×(1+2+3+4+5)=3,y =15×(9+12+17+21+26)=17, 则∑i=15(x i -x )(y i -y )=(1-3)×(9-17)+…+(5-3)×(26-17)=43;√∑i=15(x i -x)2∑i=15(y i -y)2=√10×186≈43.1,所以r=∑i=15(x i -x)(y -y)√∑i=15(x i -x)2∑i=15(y i-y)2=4343.1≈0.998,所以变量y 与x 的线性相关性很强. (2)由(1)可得x =3,y =17,∑i=15(x i -x )(y i -y )=43,∑i=15(x i -x )2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10,所以b ^=∑i=15(x i -x)(y i -y)∑i=15(x i -x)2=4310=4.3,则a ^=y -b ^x =17-4.3×3=4.1.所以y 关于x 的线性回归方程为y ^=4.3x+4.1.令x=6,可得y ^=4.3×6+4.1=29.9,故预测2020年该网站“双11”当天的交易额为29.9百亿元.思路分析 (1)利用已知条件求解相关系数,判断即可;(2)根据公式求出回归直线方程的系数,得回归直线方程,然后把x=6代入,求出结果进行预测即可.考法二 独立性检验的应用1.(2022届河南月考,9)某外语学校要学生从德语和日语中选择一种作为“第二外语”进行学习,为了解选择第二外语的倾向与性别的关系,随机抽取100名学生,得到下面的数据表:选择德语 选择日语 男生 15 35 女生3020根据表中提供的数据可知( ) 附:K2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P(K 2≥k) 0.100 0.050 0.010 0.005 0.001 k2.7063.841 6.635 7.87910.828A.在犯错误的概率不超过0.1%的前提下,认为选择第二外语的倾向与性别无关B.在犯错误的概率不超过0.1%的前提下,认为选择第二外语的倾向与性别有关C.有99.5%的把握认为选择第二外语的倾向与性别无关D.有99.5%的把握认为选择第二外语的倾向与性别有关答案D2.(2020江西吉安、抚州、赣州一模,5)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A 的100天日落和夜晚天气,得到如下2×2列联表:夜晚天气下雨未下雨日落云里走出现255未出现2545临界值表P(K2≥k0)0.100.050.0100.001k0 2.706 3.841 6.63510.828并计算得到K2≈19.05,下列小波对地区A天气的判断不正确的是()A.夜晚下雨的概率约为12B.未出现“日落云里走”,夜晚下雨的概率约为514C.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨答案D3.(2020湖南衡阳八中月考,5)某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:喜欢应用统计课程不喜欢应用统计课程男生205女生1020附表:P(K2≥k)0.100.050.0250.0100.0050.001k 2.706 3.841 5.024 6.6357.87910.828参考公式:K2=n(ad-bc)2,其中n=a+b+c+d.(a+b)(c+d)(a+c)(b+d)参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为喜欢“应用统计”课程与性别有关B.在犯错误的概率不超过0.1%的前提下,认为喜欢“应用统计”课程与性别无关C.有99.99%以上的把握认为喜欢“应用统计”课程与性别有关D.有99.99%以上的把握认为喜欢“应用统计”课程与性别无关答案A4.(2020安徽蚌埠三模,15)某企业为了调查其产品在国内和国际市场的发展情况,随机抽取国内、国外各100名客户代表,了解他们对该企业产品的发展前景所持的态度,得到如图所示的等高条形图,则有99%以上的把握认为是否持乐观态度与国内外差异有关(填“能”或“不能”).P(K2≥k)0.0500.0100.0050.001k 3.841 6.6357.87910.828附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).答案能5.(2021山东青岛一模,15)某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为接受大密度集中培训的55名学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(K2≥k)0.050.0250.0100.001k 3.841 5.024 6.63510.828答案0.0256.(2022届吉林重点高中月考,19)新能源汽车是指除汽油、柴油发动机之外所有的其他能源汽车,被认为能减少空气污染和缓解能源短缺.在当今提倡全球环保的前提下,新能源汽车产业必将成为未来汽车产业发展的导向与目标.新能源汽车也越来越受到消费者的青睐.某机构调查了某地区近期购车的200位车主的性别与购车种类情况,得到数据如下:购置新能源汽车购置传统燃油汽车合计男性10020120女性503080合计15050200 (1)根据表中数据,判断是否有99.9%的把握认为购置新能源汽车与性别有关;(2)用分层抽样的方法按性别从被调查的购置新能源汽车的车主中选出6位,参加关于“新能源汽车驾驶体验”的问卷调查,并从这6位车主中随机抽取2位车主赠送一份小礼物,求这2位获赠礼品的车主中至少有1位女性车主的概率. 参考公式:K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.参考数据:P(K 2≥k 0) 0.10 0.05 0.010 0.001 k 02.7063.8416.63510.828解析 (1)由题表得K2=200×(100×30-20×50)2120×80×150×50=1009≈11.111>10.828.所以有99.9%的把握认为购置新能源汽车与性别有关.(2)用分层抽样的方法按性别从被调查的购置新能源汽车的车主中选出6位,其中男性车主有100150×6=4人,记为a,b,c,d;女性车主有50150×6=2人,记为E,F.从这6位车主中随机抽取2位车主包含的基本事件有:ab,ac,ad,aE,aF,bc,bd,bE,bF,cd,cE,cF,dE,dF,EF,共15种. 至少有1位女性车主包含的基本事件有:aE,aF,bE,bF,cE,cF,dE,dF,EF,共9种.故所求概率P=915=35. 7.(2022届山西长治质检,17)为了了解某种新型药物对治疗某种疾病的疗效,某机构日前联合医院进行了小规模的调查.结果显示,相当多的受访者担心使用新药后会有副作用.为了了解使用该种新型药品后是否会引起疲乏症状,该机构随机抽取了某地患有这种疾病的275人进行调查,得到统计数据如下表:无疲乏症状有疲乏症状总计 未使用新药 150 25 t 使用新药 x y 100 总计225m275(1)求2×2列联表中的数据x,y,m,t 的值,并确定能否有95%的把握认为有疲乏症状与使用该新药有关; (2)从使用该新药的100人中按是否有疲乏症状,采用分层抽样的方法抽出4人,再从这4人中随机抽取2人作进一步调查,求这2人中恰有1人有疲乏症状的概率. 附:K2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P(K 2≥k) 0.150 0.100 0.050 0.025 0.010 k2.072 2.7063.841 5.0246.635解析 (1)t=150+25=175,x=225-150=75,y=100-75=25,m=25+25=50,所以K 2的观测值k=275×(150×25-75×25)2225×50×100×175≈4.910 7>3.841,故有95%的把握认为有疲乏症状与使用新药有关.(2)从使用该新药的100人中按是否有疲乏症状,采用分层抽样的方法抽出4人,其中无疲乏症状的有75100×4=3人,记为a,b,c;有疲乏症状的有25100×4=1人,记为D,则从这4人中随机抽取2人的情况有ab,ac,aD,bc,bD,cD,共6种,这2人中恰有1人有疲乏症状的情况有aD,bD,cD,共3种.故所求概率P=36=12. 8.(2021安徽五校联盟联考(二),18)网购是当前人们购物的新方式,某公司为了改进营销方式,随机调查了100名市民,统计了不同年龄的人群网购的人数如下表:年龄段(岁) (0,20) [20,40) [40,60) [60,100) 网购人数 26 32 34 8 男性人数1510105(1)若把年龄在[20,60)的人称为“网购迷”,否则称为“非网购迷”,请完成下面的2×2列联表,并判断能否有99%的把握认为网购与性别有关;网购迷非网购迷总计男性 女性 总计(2)若从年龄小于40岁的网购男性中用分层抽样的方法抽取5人,再从中抽取两人,求两人年龄都小于20岁的概率. 附:K2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P(K 2≥k) 0.10 0.05 0.01 0.001k2.7063.841 6.635 10.828解析 (1)由题中信息完善2×2列联表如下表所示:网购迷 非网购迷 总计 男性 20 20 40 女性 46 14 60 总计6634100∴K2=100×(20×14-46×20)266×34×40×60≈7.605>6.635,故有99%的把握认为网购与性别有关.(2)年龄在(0,20)、[20,40)的网购男性分别有15人、10人.按分层抽样的方法随机抽取5人,从年龄段(0,20)内抽取3人,分别记为1、2、3;从年龄段[20,40)内抽取2人,分别记为a 、b,从中随机抽取2人的可能结果有(1,2)、(1,3)、(1,a)、(1,b)、(2,3)、(2,a)、(2,b)、(3,a)、(3,b)、(a,b),共10个.用A表示“两人年龄都小于20岁”这一事件,则事件A包含的结果为(1,2)、(1,3)、(2,3),共3个.故事件A发生的概率P(A)=310.9.(2021安徽黄山二模,17)2021年3月5日,人社部和全国两会政府工作报告中针对延迟退休给出了最新消息,人社部表示正在研究延迟退休改革方案,两会上指出十四五期间要逐步延迟法定退休年龄.现对某市工薪阶层关于延迟退休政策的态度进行调查,随机调查了50人,他们月收入的频数分布及对延迟退休政策赞成的人数如下表.月收入(单位:百元)[15,25)[25,35)[35,45)[45,55)[55,65)[65,75]频数510151055赞成人数123534(1)根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有99%的把握认为“月收入以55百元为分界点”对延迟退休政策的态度有差异;月收入不低于55百元月收入低于55百元合计赞成不赞成合计(2)若采用分层抽样法从月收入在[25,35)和[65,75]的被调查人中选取6人进行跟踪调查,并随机给其中3人发放奖励,求获得奖励的3人中至少有1人月收入在[65,75]的概率.参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K2≥k)0.0500.0100.001k 3.841 6.63510.828解析(1)2×2列联表如下:月收入不低于55百元月收入低于55百元合计赞成71118不赞成32932合计104050则K2=50×(7×29-3×11)210×40×32×18≈6.27<6.635,所以没有99%的把握认为“月收入以55百元为分界点”对延迟退休政策的态度有差异.(2)按照分层抽样的方法可知,月收入在[25,35)的抽取4人,记为a,b,c,d,月收入在[65,75]的抽取2人,记为A,B,则从6人中任取3人的所有情况为{A,B,a}、{A,B,b}、{A,B,c}、{A,B,d}、{A,a,b}、{A,a,c}、{A,a,d}、{A,b,c}、{A,b,d}、{A,c,d}、{B,a,b}、{B,a,c}、{B,a,d}、{B,b,c}、{B,b,d}、{B,c,d}、{a,b,c}、{a,b,d}、{a,c,d}、{b,c,d},共20种, 其中至少有1人月收入在[65,75]的情况有16种, 所以3人中至少有1人月收入在[65,75]的概率为1620=45.应用篇 知行合一应用 回归模型的应用1.(2020课标Ⅰ,5,5分探索创新情境)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i ,y i )(i=1,2,…,20)得到下面的散点图:由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( )A.y=a+bxB.y=a+bx 2C.y=a+be xD.y=a+bln x 答案 D2.(2022届宁夏顶级名校月考,20实际生活)“金山银山不如绿水青山;绿水青山就是金山银山.”复兴村借力“乡村振兴”国策,依托得天独厚的自然资源开展乡村旅游,乡村旅游事业蓬勃发展.复兴村旅游协会记录了近八年的游客人数,见下表.年份2013 年 2014 年 2015 年 2016 年 2017 年 2018 年 2019 年2020 年 年份代码x 1 2 345678 游客人数y (百人)4816 32 51 71 97122为了分析复兴村未来的游客人数变化趋势,公司总监分别用两种模型对变量y 和x 进行拟合,得到了相应的回归方程,绘制了残差图.残差图如下(注:残差e ^i =y i -y ^i ):模型①y ^=bx 2+a;模型②y ^=dx+c.(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由; (2)根据(1)中选定的模型求出相应的回归方程(系数均保留两位小数); (3)根据(2)中求出的回归方程来预测2021年的游客人数(结果保留整数). 其中,z=x2,z =18∑i=18z i .参考数据:∑i=18(x i -x )·(y i -y )=728∑i=18(x i -x )2=42∑i=18(z i -z )·(y i -y )=6 868∑i=18(z i -z )2=3 570∑i=18z i =204∑i=18y i =400附:回归直线的斜率和截距的最小二乘估计公式分别为b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2,a ^=y -b ^x .解析 (1)选择模型①.理由:根据残差图可以看出, 模型①的估计值和真实值相对比较接近;模型②的残差相对比较大,所以模型①的拟合效果相对较好.(2)由(1)可知y 关于x 的回归方程为y ^=bx 2+a.令z=x 2,则y ^=bz+a,由题中所给数据得b ^=6 8683 570≈1.92,又z =18∑i=18z i =2048=25.5,y =4008=50,所以a ^=50-1.92×25.5=1.04,所以y 关于x 的回归方程为y ^=1.92x 2+1.04. (3)将x=9代入回归方程,可得y ^=1.92×92+1.04≈157, 则2021年游客人数大约为157百人. 3.(2021哈尔滨三中一模,19实际生活)宁夏西海固地区,在1972年被联合国粮食开发署确定为最不适宜人类生存的地区之一.为改善这一地区人民生活的贫困状态,20世纪90年代,党中央和自治区政府决定开始吊庄移民,将西海固地区的人口成批地迁移到更加适合生活的地区.为了帮助移民人口尽快脱贫,党中央作出推进东西部对口协作的战略部署,其中确定福建对口帮扶宁夏,在福建人民的帮助下,原西海固人民实现了快速脱贫,下表是对2016年以来近5年某移民村庄100位移民的年人均收入的统计:年份 2016 2017 2018 2019 2020 年份代码x12 3 4 5 人均年收入y(千元) 1.32.85.78.913.8现要建立y 关于x 的回归方程,有两个不同回归模型可供选择,模型一y^(1)=b ^x+a ^;模型二y ^(2)=c ^x 2+d ^,即使画出y 关于x 的散点图,也无法确定哪个模型拟合效果更好,现用最小二乘法原理,已经求得模型一的方程为y ^=3.1x-2.8.(1)请你用最小二乘法原理,结合下面的参考数据及参考公式求出模型二的方程(计算结果保留到小数点后一位);(2)用计算残差平方和的方法比较哪个模型拟合效果更好(已经计算出模型一的残差平方和为∑i=15(y i -y ^i )2=3.7).参考数据:∑i=15t i y i -5ty ∑i=15t i2-5t 2≈0.52,其中t i =x i 2,i=1,2,3,4,5.参考公式:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u 的斜率和截距的最小二乘估计公式分别为β^=∑i=1nu i v i -nuv ∑i=1nu i 2-nu 2,α^=v -β^u .解析 (1)令t=x 2,则模型二可化为y 关于t 的线性回归问题, t =1+4+9+16+255=11,y =1.3+2.8+5.7+8.9+13.85=6.5, 则由参考数据可得c ^=∑i=15t i y i -5ty ∑i=15t i2-5t 2≈0.52≈0.5,d ^=y -c ^t =6.5-0.52×11≈0.8, 则模型二的方程为y ^(2)=0.5x 2+0.8. (2)由模型二的回归方程可得,y ^1(2)=0.5×1+0.8=1.3,y ^2(2)=0.5×4+0.8=2.8,y ^3(2)=0.5×9+0.8=5.3,y ^4(2)=0.5×16+0.8=8.8,y ^5(2)=0.5×25+0.8=13.3,∴∑i=15(y i -y ^i (2))2=02+02+0.42+0.12+0.52=0.42<3.7,故模型二的拟合效果更好.创新篇 守正出奇创新 统计与统计案例的综合应用。

11、变量间的相关关系、统计案例(有答案)

11、变量间的相关关系、统计案例(有答案)

学科教师辅导教案学员编号: 年 级:高一 课时数:3课时 学员姓名: 辅导科目:数学 学科教师:授课类型 T 同步知识梳理 C 相关专题训练T 能力提高教学目标星级★★★授课日期及时段 2016.教学内容 :变量间的相关关系、统计案例一、同步知识梳理 1. 变量间的相关关系2. 散点图以一个变量的取值为横坐标,另一个变量的相应取值为纵坐标,在直角坐标系中描点,这样的图形叫做散点图. 3. 回归直线方程与回归分析(1)直线方程y ^=a +bx ,叫做Y 对x 的回归直线方程,b 叫做回归系数.要确定回归直线方程,只要确定a 与回归系数b .(2)用最小二乘法求回归直线方程中的a ,b 有下列公式b ^=∑ni =1x i y i -n x y ∑ni =1x 2i -n x 2,a ^ =y -b ^ x ,其中的a ^ ,b ^表示是求得的a ,b 的估计值.(3)相关性检验①计算相关系数r ,r 有以下性质:|r |≤1,并且|r |越接近1,线性相关程度越强;|r |越接近0,线性相关程度越弱;②|r|>r0.05,表明有95%的把握认为变量x与Y直线之间具有线性相关关系,回归直线方程有意义;否则寻找回归直线方程毫无意义.二、题型解答题型一相关关系的判断思维点播判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图,根据散点图很容易看出两个变量之间是否具有相关性,是不是存在线性相关关系,是正相关还是负相关,相关关系是强还是弱.例15个学生的数学和物理成绩如下表:学生A B C D E学科数学8075706560物理7066686462画出散点图,并判断它们是否具有相关关系.解以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示.由散点图可知,各组数据对应点大致在一条直线附近,所以两者之间具有相关关系,且为正相关.巩固(1)对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图②,由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关答案 C(2)(2012·课标全国)在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12 D .1答案 D解析 利用相关系数的意义直接作出判断.样本点都在直线上时,其数据的估计值与真实值是相等的,即y i =y i ^,代入相关系数公式r =1-∑i =1n(y i -y i ^)2∑i =1n(y i -y )2=1.题型二 线性回归分析思维点播 (1)回归直线方程y ^=b ^x +a ^必过样本点的中心(x ,y ).(2)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过回归直线方程估计和预测变量的值.例2 某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数x (个) 2 3 4 5 加工的时间y (小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y 关于x 的回归直线方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少小时?(注:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x )思维启迪 求回归直线方程的系数b ^时,为防止出错,应分别求出公式中的几个量,再代入公式. 解 (1)散点图如图.(2)由表中数据得:∑i =14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,∴b ^=0.7,∴a ^=1.05,∴y ^=0.7x +1.05,回归直线如图所示.(3)将x =10代入回归直线方程,得y ^=0.7×10+1.05=8.05, 故预测加工10个零件约需要8.05小时.巩 固1 为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:时间x 1 2 3 4 5 命中率y0.40.50.60.60.4小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.答案 0.5 0.53解析 小李这5天的平均投篮命中率y =0.4+0.5+0.6+0.6+0.45=0.5,可求得小李这5天的平均打篮球时间x =3.根据表中数据可求得b ^=0.01,a ^=0.47,故回归直线方程为y ^=0.47+0.01x ,将x =6代入得6号打6小时篮球的投篮命中率约为0.53.巩 固2 (2013·大连模拟)某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元) 4 2 3 5 销售额y (万元)49263954根据上表可得回归直线方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元答案 B解析 ∵x =4+2+3+54=72,y =49+26+39+544=42,又y ^ =b ^ x +a ^ 必过(x ,y ),∴42=72×9.4+a ^ ,∴a ^ =9.1.∴回归直线方程为y ^=9.4x +9.1.∴当x =6时,y ^=9.4×6+9.1=65.5(万元).家庭作业1. 某地区调查了2~9岁的儿童的身高,由此建立的身高y (cm)与年龄x (岁)的回归模型为y ^=8.25x +60.13,下列叙述正确的是( )A .该地区一个10岁儿童的身高为142.63 cmB .该地区2~9岁的儿童每年身高约增加8.25 cmC .该地区9岁儿童的平均身高是134.38 cmD .利用这个模型可以准确地预算该地区每个2~9岁儿童的身高 答案 B2. 设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图), 以下结论中正确的是 ( )A .直线l 过点(x ,y )B .x 和y 的相关系数为直线l 的斜率C .x 和y 的相关系数在0到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同 答案 A解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以B 、C 错误.D 中n 为偶数时,分布在l 两侧的样本点的个数可以不相同,所以D 错误.根据线性回归直线一定经过样本点中心可知A 正确.3. (2012·湖南)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确...的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D解析 由于回归直线方程中x 的系数为0.85, 因此y 与x 具有正的线性相关关系,故A 正确.又回归直线方程必过样本点中心(x ,y ),因此B 正确.由回归直线方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,故C 正确. 当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值,因此D 不正确.4. 某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9.零件数x (个) 10 2030 40 50 加工时间y (min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为________. 答案 68解析 由已知可计算求出x =30,而回归直线必过点(x ,y ), 则y =0.67×30+54.9=75,设模糊数字为a ,则 a +62+75+81+895=75,计算得a =68.5.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元) 4 2 3 5 销售额y (万元)49263954根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时销售额为( ) A.63.6万元 B.65.5万元 C.67.7万元D.72.0万元解析:由题意可知x =3.5,y =42,则42=9.4×3.5+a ^,a ^=9.1,y ^=9.4×6+9.1=65.5,答案应选B. 答案:A6.下列各图中所示两个变量具有相关关系的是( )A .①②B .①③C .②④D .②③答案:D7.已知x ,y 的取值如下表所示:x 0 1 3 4 y2.24.34.86.7从散点图分析,y 与x 线性相关,且y ^=0.95x +a ^,则a ^=__________.答案:2.6。

11、变量间的相关关系、统计案例(有答案)解读

11、变量间的相关关系、统计案例(有答案)解读

学科教师辅导教案学员编号: 年 级:高一 课时数:3课时 学员姓名: 辅导科目:数学 学科教师:授课类型 T 同步知识梳理 C 相关专题训练T 能力提高教学目标星级★★★授课日期及时段 2016.教学内容 :变量间的相关关系、统计案例一、同步知识梳理 1. 变量间的相关关系2. 散点图以一个变量的取值为横坐标,另一个变量的相应取值为纵坐标,在直角坐标系中描点,这样的图形叫做散点图. 3. 回归直线方程与回归分析(1)直线方程y ^=a +bx ,叫做Y 对x 的回归直线方程,b 叫做回归系数.要确定回归直线方程,只要确定a 与回归系数b .(2)用最小二乘法求回归直线方程中的a ,b 有下列公式b ^=∑ni =1x i y i -n x y ∑ni =1x 2i -n x 2,a ^ =y -b ^ x ,其中的a ^ ,b ^表示是求得的a ,b 的估计值.(3)相关性检验①计算相关系数r ,r 有以下性质:|r |≤1,并且|r |越接近1,线性相关程度越强;|r |越接近0,线性相关程度越弱;②|r|>r0.05,表明有95%的把握认为变量x与Y直线之间具有线性相关关系,回归直线方程有意义;否则寻找回归直线方程毫无意义.二、题型解答题型一相关关系的判断思维点播判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图,根据散点图很容易看出两个变量之间是否具有相关性,是不是存在线性相关关系,是正相关还是负相关,相关关系是强还是弱.例15个学生的数学和物理成绩如下表:学生A B C D E学科数学8075706560物理7066686462画出散点图,并判断它们是否具有相关关系.解以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示.由散点图可知,各组数据对应点大致在一条直线附近,所以两者之间具有相关关系,且为正相关.巩固(1)对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图②,由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关答案 C(2)(2012·课标全国)在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12 D .1答案 D解析 利用相关系数的意义直接作出判断.样本点都在直线上时,其数据的估计值与真实值是相等的,即y i =y i ^,代入相关系数公式r =1-∑i =1n(y i -y i ^)2∑i =1n(y i -y )2=1.题型二 线性回归分析思维点播 (1)回归直线方程y ^=b ^x +a ^必过样本点的中心(x ,y ).(2)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过回归直线方程估计和预测变量的值.例2 某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数x (个) 2 3 4 5 加工的时间y (小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y 关于x 的回归直线方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少小时?(注:b^=∑i=1nx i y i-n x y∑i=1nx2i-n x2,a^=y-b^x)思维启迪求回归直线方程的系数b^时,为防止出错,应分别求出公式中的几个量,再代入公式.解(1)散点图如图.(2)由表中数据得:∑i=14x i y i=52.5,x=3.5,y=3.5,∑i=14x2i=54,∴b^=0.7,∴a^=1.05,∴y^=0.7x+1.05,回归直线如图所示.(3)将x=10代入回归直线方程,得y^=0.7×10+1.05=8.05,故预测加工10个零件约需要8.05小时.巩固1为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:时间x 1234 5命中率y 0.40.50.60.60.4小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.答案0.50.53解析小李这5天的平均投篮命中率y=0.4+0.5+0.6+0.6+0.45=0.5,可求得小李这5天的平均打篮球时间x=3.根据表中数据可求得b^=0.01,a^=0.47,故回归直线方程为y^=0.47+0.01x,将x=6代入得6号打6小时篮球的投篮命中率约为0.53.巩 固2 (2013·大连模拟)某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元) 4 2 3 5 销售额y (万元)49263954根据上表可得回归直线方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元答案 B解析 ∵x =4+2+3+54=72,y =49+26+39+544=42,又y ^ =b ^ x +a ^ 必过(x ,y ),∴42=72×9.4+a ^ ,∴a ^ =9.1.∴回归直线方程为y ^ =9.4x +9.1.∴当x =6时,y ^=9.4×6+9.1=65.5(万元).家庭作业1. 某地区调查了2~9岁的儿童的身高,由此建立的身高y (cm)与年龄x (岁)的回归模型为y ^=8.25x +60.13,下列叙述正确的是( )A .该地区一个10岁儿童的身高为142.63 cmB .该地区2~9岁的儿童每年身高约增加8.25 cmC .该地区9岁儿童的平均身高是134.38 cmD .利用这个模型可以准确地预算该地区每个2~9岁儿童的身高 答案 B2. 设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图), 以下结论中正确的是 ( )A .直线l 过点(x ,y )B .x 和y 的相关系数为直线l 的斜率C .x 和y 的相关系数在0到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同 答案 A解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以B 、C 错误.D 中n 为偶数时,分布在l 两侧的样本点的个数可以不相同,所以D 错误.根据线性回归直线一定经过样本点中心可知A 正确.3. (2012·湖南)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确...的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D解析 由于回归直线方程中x 的系数为0.85, 因此y 与x 具有正的线性相关关系,故A 正确.又回归直线方程必过样本点中心(x ,y ),因此B 正确.由回归直线方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,故C 正确. 当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值,因此D 不正确.4. 某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9.零件数x (个) 10 2030 40 50 加工时间y (min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为________. 答案 68解析 由已知可计算求出x =30,而回归直线必过点(x ,y ), 则y =0.67×30+54.9=75,设模糊数字为a ,则 a +62+75+81+895=75,计算得a =68.5.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元) 4 2 3 5 销售额y (万元)49263954根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时销售额为( ) A.63.6万元 B.65.5万元 C.67.7万元D.72.0万元解析:由题意可知x =3.5,y =42,则42=9.4×3.5+a ^,a ^=9.1,y ^=9.4×6+9.1=65.5,答案应选B. 答案:A6.下列各图中所示两个变量具有相关关系的是( )A .①②B .①③C .②④D .②③答案:D7.已知x ,y 的取值如下表所示:x 0 1 3 4 y2.24.34.86.7从散点图分析,y 与x 线性相关,且y ^=0.95x +a ^,则a ^=__________.答案:2.6。

2020高考数学(理数)复习作业本9.3 变量间的相关关系与统计案例(含答案)

2020高考数学(理数)复习作业本9.3 变量间的相关关系与统计案例(含答案)

^^ ^ (1)分别以五家 4S 店的平均单价与平均销量为散点,求出单价与销量的回归直线方程y=bx+a

(2)在大量投入市场后,销量与单价仍服从(1)中的关系,且该款汽车的成本为 12 万元/辆,为
使该款汽车获得最大利润,则该款汽车的单价约为多少万元(保留一位小数)?
n
∑xi-xyi-y
^ i=1 附:b=
n
∑xiyi-n x y
^ i=1 参考公式:b=
n
^^ ,a=y-b
x.参考数据:
5≈2.24.
∑x2i-n x2
i=1
16. “双十一网购狂欢节”源于淘宝商城(天猫)2009 年 11 月 11 日举办的促销活动,当时参与 的商家数量和促销力度均有限,但营业额远超预想的效果,于是 11 月 11 日成为天猫举办大规 模促销活动的固定日期.如今,中国的“双十一”已经从一个节日变成了全民狂欢的“电商购 物日”.某淘宝电商分析近 8 年“双十一”期间的宣传费用 x(单位:万元)和利润 y(单位:十 万元)之间的关系,得到下列数据:
C、回归分析中,如果 r 2 =1 或 r 2 = 1,说明 x 与 y 之间完全线性相关 D、样本相关系数 r(-1,+1)
8.某中学学生会为了调查爱好游泳运动与性别是否有关,随机询问了 110 名高中生是否爱好游
nad-bc2
泳运动并得到如下的列联表(表 1).由 K2=
,并参照附
a+bc+da+cb+d
2020 高考数学(理数)复习作业本 9.3
变量间的相关关系与统计案例
一、选择题
1.线性回归方程 yˆ =bx+a 必过( )
A、(0,0)点 B、( x ,0)点 C、(0, y )点 D、( x , y )点

高考数学专题复习十一-11.5变量间的相关关系、统计案例-高考真题练习(附答案)

高考数学专题复习十一-11.5变量间的相关关系、统计案例-高考真题练习(附答案)

11.5变量间的相关关系、统计案例考点一变量间的相关关系1.(2015湖北文,4,5分)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关答案C由y=-0.1x+1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而增大,减小而减小,所以z随x的增大而减小,x与z负相关,故选C.2.(2015课标Ⅰ,理19,文19,12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i和年销售量(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.yi表中==18∑J18.(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:(i)年宣传费x=49时,年销售量及年利润的预报值是多少?(ii)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为^=∑J1(-p(-p∑J1(-p 2,^=-^.解析(1)由散点图可以判断,y=c+d 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2分)(2)令w=,先建立y 关于w 的线性回归方程.由于^=∑J18(-p(-p ∑J18(-p2=108.81.6=68,^=-^=563-68×6.8=100.6,所以y 关于w 的线性回归方程为^=100.6+68w,因此y 关于x 的回归方程为^=100.6+68.(6分)(3)(i)由(2)知,当x=49时,年销售量y 的预报值^=100.6+6849=576.6,年利润z 的预报值^=576.6×0.2-49=66.32.(9分)(ii)根据(2)的结果知,年利润z 的预报值^=0.2(100.6+68)-x=-x+13.6+20.12.所以当=13.62=6.8,即x=46.24时,^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.(12分)3.(2015重庆文,17,13分)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20102011201220132014时间代号t 12345储蓄存款y(千亿元)567810(1)求y 关于t 的回归方程^=^t+^;(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.附:回归方程^=^t+^中,^=∑J1-nB∑J12-n2,^=-^.解析(1)列表计算如下:i t i y i t i2t i y i 11515226412337921448163255102550∑153655120这里n=5,=1∑J1t i =155=3,=1∑J1y i =365=7.2.又l tt =∑J12-n 2=55-5×32=10,l ty =∑J1t i y i -n=120-5×3×7.2=12,从而^=B B=1210=1.2,^=-^=7.2-1.2×3=3.6,故所求回归方程为^=1.2t+3.6.(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为^=1.2×6+3.6=10.8(千亿元).4.(2014课标Ⅱ理,19,12分)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2007200820092010201120122013年份代号t 1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y 关于t 的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:^=∑J1(-p(-p∑J1(-p 2,^=-^.解析(1)由所给数据计算得=17×(1+2+3+4+5+6+7)=4,=17×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑J17(t i -)2=9+4+1+0+1+4+9=28,∑J17(t i -)(y i -)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,^=∑J17(-p(-p ∑J17(-p2=1428=0.5,^=-^=4.3-0.5×4=2.3,所求回归方程为^=0.5t+2.3.(2)由(1)知,^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t=9代入(1)中的回归方程,得^=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.评析本题考查了回归直线方程的求解,注意回归直线恒过点(,)是关键,考查了回归系数^的几何意义.考查了学生的计算求解能力.5.(2016课标Ⅲ,18,12分)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附:参考数据:∑J17y i =9.32,∑J17t i y i J1=0.55,7≈2.646.参考公式:相关系数∑-p(-p回归方程^=^+^t 中斜率和截距的最小二乘估计公式分别为^=∑J1(-p(-p∑J1(-p 2,^=-^.解析(1)由折线图中数据和附注中参考数据得=4,∑J17(t i -)2(∑J17(t i -)(y i -)=∑J17t i y i -∑J17y i =40.17-4×9.32=2.89,r≈ 2.890.55×2×2.646≈0.99.(4分)因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(6分)(2)由=9.327≈1.331及(1)得^=∑J17(-p(-p ∑J17(-p2=2.8928≈0.10,^=-^=1.331-0.10×4≈0.93.所以,y 关于t 的回归方程为^=0.93+0.10t.(10分)将2016年对应的t=9代入回归方程得^=0.93+0.10×9=1.83.所以预测2016年我国生活垃圾无害化处理量约为1.83亿吨.(12分)6.(2017课标Ⅰ文,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得=116∑J116x i≈0.212,∑J116(t8.5)2≈18.439,∑J116(x i -)(i-8.5)=-2.78,其中x i 为抽取的第i 个零件的尺寸,i=1,2, (16)(1)求(x i ,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(-3s,+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ii)在(-3s,+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(x i ,y i )(i=1,2,…,n)的相关系数∑-p(-pJ1(0.008≈0.09.解析本题考查统计问题中的相关系数及样本数据的均值与方差.(1)由样本数据得(x i ,i)(i=1,2,…,16)的相关系数为∑-p(i-8.5)由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(i)由于=9.97,s≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(-3s,+3s)以外,因此需对当天的生产过程进行检查.(ii)剔除离群值,即第13个数据,剩下数据的平均数为115×(16×9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.∑J1162=16×0.2122+16×9.972≈1591.134,剔除第13个数据,剩下数据的样本方差为115×(1591.134-9.222-15×10.022)≈0.008,这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.方法总结样本的数字特征.(1)样本数据的相关系数r,∑-p(-p反映样本数据的相关程度,|r|越大,则相关性越强.(2)样本数据的均值反映样本数据的平均水平;样本数据的方差反映样本数据的稳定性,方差越小,数据越稳定;样本数据的标准差为方差的算术平方根.7.(2020课标Ⅱ理,18,12分)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑=201i x i =60,∑=201i y i =1200,∑=201i (x i -)2=80,∑=201i (y i -)2=9000,∑=201i (x i -)(y i -)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数=∑n−p(−p,2≈1.414.解析(1)由已知得样本平均数=120∑=201i y i =60,从而该地区这种野生动物数量的估计值为60×200=12000.(2)样本(x i ,y i )(i =1,2,…,20)的相关系数∑20−p(−p=.94.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.考点二独立性检验1.(2017课标Ⅱ文,19,12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50kg箱产量≥50kg 旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:P(K2≥k)0.0500.0100.001k 3.841 6.63510.828,K2=oB-B)2(rp(rp(rp(rp.解析本题考查了频率分布直方图及独立性检验.(1)旧养殖法的箱产量低于50kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表:箱产量<50kg箱产量≥50kg旧养殖法6238新养殖法3466K2=200×(62×66−34×38)2100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50kg到55kg之间,旧养殖法的箱产量平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.解后反思解独立性检验问题的关注点:(1)两个明确:①明确两类主体;②明确研究的两个问题.(2)两个关键:①准确画出2×2列联表;②准确求解K2.2.(2021全国甲理,17,12分)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:K 2=oB−B)2(rp(rp(rp(rp ,P (K 2≥k )0.0500.0100.001k3.8416.63510.828.解题指导:(1)根据表中数据分别计算甲、乙两台机床所生产的产品中一级品的数量,进而得出结论;(2)根据2×2列联表中的数据计算K 2,然后对照临界值表作出判断.解析(1)因为甲机床生产的200件产品中有150件一级品,所以甲机床生产的产品中一级品的频率为150200=34,因为乙机床生产的200件产品中有120件一级品,所以乙机床生产的产品中一级品的频率为120200=35.(2)根据2×2列联表中的数据,得K 2=oB−B)2(rp(rp(rp(rp =400×(150×80−120×50)2270×130×200×200=40039≈10.256,因为10.256>6.635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.方法总结解决独立性检验问题的一般步骤:3.(2020新高考Ⅰ,19,12分)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO 2浓度(单位:μg/m 3),得下表:SO 2PM2.5[0,50](50,150](150,475][0,35]32184(35,75]6812(75,115]3710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:SO2PM2.5[0,150](150,475][0,75](75,115](3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.附:K2=oB−B)2(rp(rp(rp(rp,P(K2≥k)0.0500.0100.001k3.8416.63510.828.答案解题思路:(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为64100=0.64.(4分) (2)根据抽查数据,可得2×2列联表:SO2PM2.5[0,150](150,475][0,75]6416(75,115]1010(8分) (3)根据(2)的列联表得K2=100×(64×10−16×10)280×20×74×26≈7.484.由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.(12分) 17.(2022全国甲文,17,12分,应用性)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A24020B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:K2=oB−B)2(rp(rp(rp(rp,P(K2≥k)0.1000.0500.010k2.7063.8416.635解析(1)由题意可得A公司长途客车准点的概率P1=240260=1213,B公司长途客车准点的概率P2=210240=78.(2)因为K2=500×(240×30−20×210)2450×50×240×260≈3.205>2.706,所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.。

高考数学核心素养提升练习 变量间的相关关系与统计案例

高考数学核心素养提升练习 变量间的相关关系与统计案例

核心素养提升练五十九变量间的相关关系与统计案例(30分钟60分)一、选择题(每小题5分,共25分)1.对于变量x,y有以下四个散点图,由这四个散点图可以判断变量x与y成负相关的是( )【解析】选B.对于A,散点图呈片状分布,不具相关性;对于B,散点图呈带状分布,且y随x的增大而减小,是负相关;对于C,散点图中y随x的增大先增大再减小,不是负相关;对于D,散点图呈带状分布,且y随x的增大而增大,是正相关.2.某考察团对全国10大城市居民人均工资水平x(千元)与居民人均消费水平y(千元)进行统计调查,y与x具有相关关系,回归方程为=0.66x+1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( )A.83%B.72%C.67%D.66%【解析】选A.由7.675=0.66x+1.562,得x≈9.262,所以×100%≈83%.3.(2018·衡水模拟)如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是( )A.相关系数r变大B.残差平方和变大C.相关指数R2变大D.解释变量x与预报变量y的相关性变强【解析】选B.去掉D点后,相关性变强,模型拟合效果越好,故残差平方和变小.4.根据如下样本数据得到的回归方程为=x+,若=5.4,则x每增加1个单位,y就( )x 3 4 5 6 7y 4 2.5 -0.5 0.5 -2A.增加0.9个单位B.减少0.9个单位C.增加1个单位D.减少1个单位【解析】选B.由题意可得=×(3+4+5+6+7)=5,=×(4+2.5-0.5+0.5-2)=0.9,因为回归方程为=x+,=5.4,且回归直线过点(5,0.9),所以0.9=5+5.4,解得=-0.9,所以x每增加1个单位,y就减少0.9个单位.5.观察两个变量(存在线性相关关系)得如下数据:x -10 -6.99 -5.01 -2.98 3.98 5 7.99 8.01 y -9 -7 -5 -3 4.01 4.99 7 8 则两变量间的线性回归方程为( )A. =x+1B. =xC. =2x+D. =x+1【解析】选B.根据表中数据,得=(-10-6.99-5.01-2.98+3.98+5+7.99+8.01)=0,=(-9-7-5-3+4.01+4.99+7+8)=0.所以两变量x,y间的线性回归方程过样本中心点(0,0),只有B选项符合.【变式备选】已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是( )A. =0.4x+2.3B. =2x-2.4C. =-2x+9.5D. =-0.3x+4.4【解析】选A.依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5),代入A,B 得A正确.二、填空题(每小题5分,共15分)6.(2018·阜阳模拟)某班主任对全班30名男生进行了作业量多少的调查,数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏12 8 20不喜欢玩电脑游戏 2 8 10总计14 16 30该班主任据此推断男生认为作业多与喜欢玩电脑游戏有关系,则这种推断犯错误的概率不超过________.【解析】计算得K2的观测值k=≈4.286>3.841,则推断犯错误的概率不超过0.05.答案:0.057.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温(℃)18 13 10 -1用电量(度) 24 34 38 64由表中数据得回归直线方程=x+中的=-2,预测当气温为-4 ℃时,用电量约为________.【解析】根据题意知==10,==40,因为回归直线过样本点的中心,所以=40-(-2)×10=60,所以=-2x+60,当x=-4时, =(-2)×(-4)+60=68,所以当气温为-4 ℃时,用电量约为68度.答案:68度8.某炼钢厂废品率x(%)与成本y(元/吨)的线性回归方程为y=105.492+42.569x.当成本控制在176.5元/吨时,可以预计生产的1 000吨钢中,约有________吨钢是废品(结果保留两位小数).【解析】因为176.5=105.492+42.569x,解得x≈1.668,即当成本控制在176.5元/吨时,废品率约为1.668%,所以生产的1 000吨钢中,约有1 000×1.668%=16.68吨是废品.答案:16.68【变式备选】经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y 关于x的回归直线方程: =0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】x变为x+1, =0.245(x+1)+0.321=0.245x+0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.答案:0.245三、解答题(每小题10分,共20分)9.已知某班n名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a,b,c 成等差数列,且成绩在(90,100]内的有6人.(1)求n的值.(2)规定60分以下为不及格,若不及格的人中女生有4人,而及格的人中,男生比女生少4人,借助独立性检验分析在犯错误的概率不超过0.1的前提下是否可以认为“本次测试的及格情况与性别有关”? 【解析】(1)依题意得b=0.01,因为成绩在(90,100]内的有6人,所以n=60.(2)由于2b=a+c,而b=0.01,可得a+c=0.02,则不及格的人数为0.02×10×60=12,及格的人数为60-12=48,于是本次测试的及格情况与性别的2×2列联表如下:及格不及格总计男22 8 30女26 4 30总计48 12 60结合列联表计算可得K2的观测值k≈1.667<2.706,故在犯错误的概率不超过0.1的前提下不能认为“本次测试的及格情况与性别有关”.【变式备选】某养鸡场为检验某种药物预防某种疾病的效果,取100只鸡进行对比试验,得到如下列联表(表中部分数据丢失,a,b,d,e,f,g表示丢失的数据):患病未患病总计未服用药 a b 50服用药15 d g总计 e f 100工作人员记得2a=3b.(1)求出列联表中数据a,b,d,e,f,g的值.(2)能否在犯错误的概率不超过0.005的前提下认为药物有效?【解析】(1)因为a+b=50,2a=3b.所以a=30,b=20.由50+g=100,15+d=g,得g=50,d=35.所以,e=a+15=45,f=b+d=55.(2)由(1)可得K2的观测值k=≈9.091>7.879.因此,在犯错误的概率不超过0.005的前提下认为药物有效.10.(2018·重庆模拟)第96届(春季)全国糖酒商品交易会于2017年3月23日至25日在四川举办,展馆附近一家四川特色小吃店为了研究参会人数与本店所需原材料数量的关系,在交易会前查阅了最近5次交易会的参会人数x(万人)与店铺所用原材料数量y(袋),得到如下数据:第一次第二次第三次第四次第五次参会人数11 9 8 10 12x/万人原材料28 23 20 25 29y/袋(1)请根据所给五组数据,求出y关于x的线性回归方程=x+.(2)若该店现有原材料12袋,据悉本次交易会大约有13万人参加,为了保证原材料能够满足需要,则该店应至少再补充原材料多少袋?(参考公式: = = ,=-)【解析】(1)由数据,求得==10,==25,(x i-)(y i-)=1×3+(-1)×(-2)+(-2)×(-5)+0+2×4=23,(x i-)2=12+(-1)2+(-2)2+02+22=10,由公式,求得=2.3, =-·=2,y关于x的线性回归方程为=2.3x+2.(2)由x=13,得=31.9,而31.9-12=19.9≈20,所以,该店应至少再补充原材料20袋.【变式备选】为了研究男羽毛球运动员的身高x(单位:cm)与体重y(单位:kg)的关系,通过随机抽样的方法,抽取5名运动员测得他们的身高与体重关系如下表:身高(x) 172 174 176 178 180体重(y) 74 73 76 75 77(1)从这5个人中随机地抽取2个人,求这2个人体重之差的绝对值不小于2 kg的概率.(2)求回归直线方程=x+.【解析】(1)从这5个人中随机地抽取2个人的体重的基本事件有(74,73),(74,76),(74,75),(74,77),(73,76),(73,75),(73,77),(76,75),(76,77),(75,77).满足条件的有(74,76),(74,77),(73,76),(73,75),(73,77),(75,77)6种情况,故2个人体重之差的绝对值不小于2 kg的概率为=.(2)=176,=75,x i--4 -2 0 2 4y i--1 -2 1 0 2===0.4,=-=4.6,所以=0.4x+4.6.(20分钟40分)1.(5分)已知x与y之间的几组数据如下表:x 1 2 3 4 5 6y 0 2 1 3 3 4,2)求得的直线方程为y′=b′x+a′,则以下结论正确的是( )A. >b′,>a′B. >b′,<a′C. < b′,>a′D. <b′,<a′【解析】选C.过(1,0)和(2,2)的直线方程为y=2x-2,画出六点的散点图,回归直线的大概位置如图所示,显然<b′,>a′.2.(5分)(2018·汕头模拟)某厂家为了解销售轿车台数与广告宣传费之间的关系,得到如表统计数据表:根据数据表可得回归直线方程=x+,其中=2.4, =-,据此模型预测广告费用为9万元时,销售轿车台数为( )广告费用x/万元 2 3 4 5 6销售轿车y/台 3 4 6 10 12A.17B.18C.19D.20【解析】选C.根据表中数据,计算=×(2+3+4+5+6)=4,=×(3+4+6+10+12)=7,且回归直线方程为=2.4x+,所以=-=7-2.4×4=-2.6,所以回归方程为=2.4x-2.6;当x=9时, =2.4×9-2.6=19,即据此模型预测广告费用为9万元时,销售轿车台数为19.3.(5分)已知回归直线斜率的估计值为1.23,样本点的中心为点(4,5),则回归直线的方程为________. 【解析】回归直线必过点(4,5),所以y-5=1.23(x-4),所以=1.23x+0.08.答案: =1.23x+0.08【变式备选】已知回归直线方程为=4.4x+838.19,则可估计x与y增长速度之比约为________.【解析】x与y增长速度之比为=.答案:4.(12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率.(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断在犯错误的概率不超过0.1的前提下能否认为“生产能手与工人所在的年龄组有关”.【解析】(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,在样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2), (A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),故所求的概率P=.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:生产能手非生产能手总计25周岁以上组15 45 6025周岁以下组15 25 40总计30 70 100所以K2==≈1.79,因为1.79<2.706,所以在犯错误的概率不超过0.1的前提下不能认为“生产能手与工人所在的年龄组有关”.5.(13分)某测试团队为了研究“饮酒”对“驾车安全”的影响,随机选取100名驾驶员先后在无酒状态、酒后状态下进行“停车距离”测试.测试的方案:电脑模拟驾驶,以某速度匀速行驶,记录下驾驶员的“停车距离”(驾驶员从看到意外情况到车子完全停下所需要的距离).无酒状态与酒后状态下的试验数据分别列于表1和表2.表1:无酒状态停车距(10,20] (20,30] (30,40] (40,50] (50,60] 离d/米频数26 m n 8 2表2:酒后状态平均每毫升血液酒精含量x/毫克10 30 50 70 90平均停车距离y/米30 50 60 70 90已知表1数据的中位数估计值为26,回答以下问题.(1)求m,n的值,并估计驾驶员无酒状态下停车距离的平均数.(2)根据最小二乘法,由表2的数据计算y关于x的回归方程=x+.(3)该测试团队认为:驾驶员酒后驾车的平均“停车距离”y大于(1)中无酒状态下的停车距离平均数的3倍,则认定驾驶员是“醉驾”.请根据(2)中的回归方程,预测当每毫升血液酒精含量大于多少毫克时为“醉驾”?【解析】(1)依题意,得m=50-26,解得m=40,又m+n+36=100,解得n=24.故停车距离的平均数为15×+25×+35×+45×+55×=27.(2)依题意,可知=50,=60,x i y i=10×30+30×50+50×60+70×70+90×90=17 800,=102+302+502+702+902=16 500,所以==0.7,=60-0.7×50=25,所以回归直线方程为=0.7x+25.(3)由(1)知当y>81时认定驾驶员是“醉驾”.令>81,得0.7x+25>81,解得x>80,当每毫升血液酒精含量大于80毫克时认定为“醉驾”.【变式备选】为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x、物理成绩y进行分析.下面是该生7次考试的成绩.数学88 83 117 92 108 100 112物理94 91 108 96 104 101 106(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明.(2)已知该生的物理成绩y与数学成绩x是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.【解析】(1)=100+=100;=100+=100;因为==142,=,所以>,所以物理成绩更稳定.(2)由于x与y之间具有线性相关关系,所以==0.5, =100-0.5×100=50,所以线性回归方程为=0.5x+50.当=115时,x=130.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.关闭Word文档返回原板块。

(福建专用)高考数学总复习 第十章第3课时 变量间的相关关系、统计案例随堂检测(含解析)

(福建专用)高考数学总复习 第十章第3课时 变量间的相关关系、统计案例随堂检测(含解析)

(福建专用)2013年高考数学总复习 第十章第3课时 变量间的相关关系、统计案例随堂检测(含解析)1.(2012·福州调研)以下四个命题中,其中正确的是 ( )①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样②两个随机变量相关性越强,则相关系数的绝对值越接近于1③在回归直线方程y ^=0.2x +12中,当解释变量x 每增加一个单位时,预报变量y ^平均增加0.2个单位④对分类变量X 与Y ,它们的随机变量K 2的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越大A .①④B .②④C .①③D .②③解析:选D.①是系统抽样;对于④,随机变量K 2的观测值k 越小,说明两个变量有关系的把握程度越小.2.下表是某厂1~4由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线是y ^=-0.7x+a ,则a 等于( )A .10.5B .5.15C .5.2D .5.25解析:选D.x =2.5,y =3.5,∵回归直线过定点(x ,y ),∴3.5=-0.7×2.5+a .∴a =5.25,故选D.3.下面是一个2×2列联表则表中a 、b 处的值分别为解析:∵a +21=73,∴a =52.又∵a +2=b ,∴b =54.答案:52、544若由资料可知y 对(1)线性回归直线方程;(2)估计使用年限为10年时,维修费用是多少?解:(1)b ^=∑i =15-nx - y-∑i =15x 2i -n x 2=112.3-5×4×590-5×42=1.23, 于是a ^=y -b ^x =5-1.23×4=0.08.所以线性回归直线方程为:y ^=1.23x +0.08.(2)当x =10时,y ^=1.23×10+0.08=12.38(万元),即估计使用10年时,维修费用是12.38万元.。

第十章 第四节 第四节 变量间的相关关系与统计案例

第十章  第四节  第四节 变量间的相关关系与统计案例

课时规范练A组基础对点练1.(2019·新乡模拟)下列四个选项中,关于两个变量所具有的相关关系描述正确的是()A.圆的面积与半径具有相关性B.纯净度与净化次数不具有相关性C.作物的产量与人的耕耘是负相关D.学习成绩与学习效率是正相关解析:对于A,圆的面积与半径是确定的关系,是函数关系,不是相关关系,A错误;对于B,一般地,净化次数越多,纯净度就越高,所以纯净度与净化次数是正相关关系,B错误;对于C,一般地,作物的产量与人的耕耘是一种正相关关系,所以C错误;对于D,学习成绩与学习效率是一种正相关关系,所以D正确.答案:D2.(2019·邯郸模拟)为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有效果的图形是()解析:选项D中不服药样本中患病的频率与服药样本中患病的频率差距最大.答案:D3.已知变量x ,y 之间具有线性相关关系,其回归方程为y ^=-3+b ^x ,若∑10i =1x i=17,∑10i =1y i =4,则b ^的值为( ) A .2B .1C .-2D .-1 解析:依题意知,x =1710=1.7,y =410=0.4,而直线y ^=-3+b^x 一定经过点(x ,y ),则-3+b^×1.7=0.4,解得b ^=2. 答案:A4.(2019·大连双基测试)已知x ,y 的取值如表所示:如果y 与x 线性相关,且线性回归方程为y ^=b ^x +132,则b ^的值为( ) A .-12B.12 C .-110 D.110解析:计算得x =3,y =5,代入到y ^=b ^x +132中,得b ^=-12.故选A. 答案:A5.(2019·重庆模拟)某青少年成长关爱机构为了调研所在地区青少年的年龄与身高状况,随机抽取6岁,9岁,12岁,15岁,18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出如图所示的散点图和回归直线L .根据图中数据,下列对该样本描述错误的是 ( )。

高考数学总复习 第十章第3课时 变量间的相关关系、统计案例随堂检测(含解析)

高考数学总复习 第十章第3课时 变量间的相关关系、统计案例随堂检测(含解析)

第十章第3课时 变量间的相关关系、统计案例 随堂检测(含解析)1.(2011·高考湖南卷)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计爱好 40 20 60不爱好 20 30 50总计 60 50 110由K 2=n ad -bc 2a +b c +d a +c b +d算得, K 2=110×40×30-20×20260×50×60×50≈7.8. 附表:P (K 2≥k ) 0.050 0.010 0.001k 3.841 6.635 10.828A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关”解析:选C.根据独立性检验的定义,由K 2≈7.8>6.635可知我们有99%以上的把握认为“爱好该项运动与性别有关”,故选C.2.已知变量x ,y 之间具有线性相关关系,其回归方程为y ^=-3+bx ,若∑i =110x i =17,∑i =110y i =4,则b 的值为( )A .2B .1C .-2D .-1解析:选A.依题意知,x =1710=1.7,y =410=0.4, 而直线y ^=-3+bx 一定经过点(x ,y ),所以-3+b ×1.7=0.4,解得b =2.3广告费用x (万元) 4 2 3 5 销售额y (万元) 49 26 39 54根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元解析:选B.∵x =4+2+3+54=72,y =49+26+39+544=42, 又y ^=b ^x +a ^必过(x ,y ),∴42=72×9.4+a ^,∴a ^=9.1. ∴线性回归方程为y ^=9.4x +9.1.∴当x =6时,y ^=9.4×6+9.1=65.5(万元).4.下面是一个2×2列联表y 1 y 2 总计则表中a、b处的值分别为解析:∵a+21=73,∴a=52. 又∵a+2=b,∴b=54.答案:52、54。

2020高考复习 变量间的相关关系、统计案例随堂练习

2020高考复习  变量间的相关关系、统计案例随堂练习

2020高考复习变量间的相关关系、统计案例随堂练习1.(2019·广州调研)某基地蔬菜大棚采用无土栽培方式种植各类蔬菜.过去50周的资料显示,该地周光照量X(单位:小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10周.根据统计,该基地的西红柿增加量y(千克)与使用某种液体肥料的质量x(千克)之间的对应数据为如图所示的折线图.(1)依据折线图计算相关系数r(精确到0.01),并据此判断是否可用线性回归模型拟合y 与x的关系.(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较高,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X限制,并有如下关系:对商家来说,若某台光照控制仪运行,则该台光照控制仪产生的周利润为3 000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1 000元.若商家安装了3台光照控制仪,求商家在过去50周的周总利润的平均值.参考数据:0.3≈0.55,0.9≈0.95.2.某机构为研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值.x y u ∑i =18(x i -x )2∑i =18(x i -x )(y i -y )∑i =18(u i -u )2∑i =18(u i -u )(y i -y )15.253.630.2692 085.5 -230.3 0.787 7.049表中u i =1x i ,u =18∑i =18u i .(1)根据散点图判断:y =a +bx 与y =c +dx 哪一个模型更适合作为该图书每册的成本费y (单位:元)与印刷数量x (单位:千册)的回归方程?(只要求给出判断,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程(回归系数的结果精确到0.01).(3)若该图书每册的定价为10元,则至少应该印刷多少册才能使销售利润不低于78 840元?(假设能够全部售出.结果精确到1)附:对于一组数据(ω1,υ1),(ω2,υ2),…,(ωn ,υn ),其回归直线υ^=α^+β^ω的斜率和截距的最小二乘估计分别为β^=∑i =1n(ωi -ω)(υi -υ)∑i =1n(ωi -ω)2,α^=υ-β^ω.3.(2018·全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m 和不超过m的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),参考答案1.解析:(1)由已知数据可得x =2+4+5+6+85=5,y =3+4+4+4+55=4.因为∑i =15(x i -x )(y i -y )=(-3)×(-1)+0+0+0+3×1=6,∑i =15(x i -x )2=(-3)2+(-1)2+02+12+32=25,∑i =15(y i -y )2=(-1)2+02+02+02+12=2,所以相关系数r =∑i =15(x i -x )(y i -y )∑i =15(x i -x)2 ∑i =15(y i -y )2=625×2=910≈0.95. 因为|r |>0.75,所以可用线性回归模型拟合y 与x 的关系. (2)由条件可得在过去50周里,当X >70时,共有10周,此时只有1台光照控制仪运行, 每周的周总利润为1×3 000-2×1 000=1 000(元).当50≤X ≤70时,共有35周,此时有2台光照控制仪运行, 每周的周总利润为2×3 000-1×1 000=5 000(元).当30<X <50时,共有5周,此时3台光照控制仪都运行, 每周的周总利润为3×3 000=9 000(元). 所以过去50周的周总利润的平均值为 1 000×10+5 000×35+9 000×550=4 600(元),所以商家在过去50周的周总利润的平均值为4 600元.2.解析:(1)由散点图判断,y =c +dx 更适合作为该图书每册的成本费y (单位:元)与印刷数量x (单位:千册)的回归方程.(2)令u =1x,先建立y 关于u 的线性回归方程,由于d ^=∑i =18(u i -u )(y i -y )∑i =18(u i -u )2=7.0490.787≈8.957≈8.96, ∴c ^=y -d ^·u =3.63-8.957×0.269≈1.22, ∴y 关于u 的线性回归方程为y ^=1.22+8.96u , ∴y 关于x 的回归方程为y ^=1.22+8.96x .(3)假设印刷x 千册,依题意得10x -⎝⎛⎭⎫1.22+8.96x x ≥78.840, 解得x ≥10,∴至少印刷10 000册才能使销售利润不低于78 840元. 3.解析:(1)第二种生产方式的效率更高. 理由如下:(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间高于80 min ,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间低于79 min.因此第二种生产方式的效率更高.(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5 min ,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5 min.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需平均时间高于80 min ;用第二种生产方式的工人完成生产任务所需平均时间低于80 min.因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分) (2)由茎叶图知m =79+812=80.列联表如下:(3)因为K 2=40×(15×15-5×5)220×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.。

专题35 变量间的相关关系、统计案例(解析版)

专题35 变量间的相关关系、统计案例(解析版)

y5
y6
y7
7
7
7
但其中数据污损不清,经查证 yi 9.32 , ti yi 40.17 , yi y2 0.55 .
i 1
i 1
i 1
(1)请用相关系数说明销售量 y 与月份代码 t 有很强的线性相关关系;
(2)求 y 关于 t 的回归方程(系数精确到 0.01);
(3)公司经营期间的广告宣传费 xi ti (单位:万元)( i 1, 2,, 7 ),每件产品的销售价为 10 元,预
③相关指数 R2 用来刻画回归的效果, R2 越小,说明模型的拟合效果越不好.
A.0
B.1
C.2
D.3
【答案】C
3/9
【解析】①线性相关关系 r 是衡量两个变量之间线性关系强弱的量, r 越接近于 1,这两个变量线性相关关 系越强, r 越接近于 0,线性相关关系越弱,故①错误;
②回归直线 y bx a 过样本点中心 x, y ,故②正确;
给出两个回归方程:(1) yˆ 0.42x 25.32 (2) yˆ 2 1.02x
通过计算,得到它们的相关指数分别为 R12 0.931,R22 0.998 ,则拟合效果最好的回归方程是( )
A. yˆ 21.02x
B. yˆ 0.42x 25.32
C.两个一样好
D.无法判断
【答案】A
抽取 4 名进行面谈,求恰好抽到 3 名“ A 类员工”的概率.
附:
K
2
a
n ad bc2 bc da cb
d
,其中
n
a
b
c
d
.
参考数据:40
0.25
0.15
0.10
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

变量间的相关关系与统计案例
(时间:45分钟 分值:100分)
一、选择题
1. [2013·大同质检]下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程y ^
=3-5x ,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程y ^=b ^x +a ^
必过(x ,y );
④在一个2×2列联表中,由计算得K 2=13.079,则有99%的把握确认这两个变量间有关系;
其中错误的个数是( ) A. 0 B. 1 C. 2 D. 3
答案:C
解析:①方差不变,对.
②错.变量x 增加一个单位时,y 平均降低5个单位. ③对.
④错,应该有99.9%的把握确认这两个变量间有关系.
2. [2013·山东威海二模]已知回归直线斜率的估计值为1.23,样本点的中心为点(4,5),则回归直线的方程为( )
A. y ^
=1.23x +4 B. y ^
=1.23x +5 C. y ^
=1.23x +0.08 D. y ^
=0.08x +1.23 答案:C
解析:回归直线必过点(4,5),故其方程为y ^-5=1.23(x -4),即y ^
=1.23x +0.08. 3. 已知x 、y 取值如下表:
从所得的散点图分析可知:y 与x 线性相关,且y =0.95x +a ,则a =( ) A. 1.30 B. 1.45 C. 1.65 D. 1.80
答案:B
解析:依题意,得x =16×(0+1+4+5+6+8)=4,y =1
6×(1.3+1.8+5.6+6.1+7.4
+9.3)=5.25;又直线y ^
=0.95x +a 必过中心点(x ,y ),即点(4,5.25),于是有5.25=0.95×4+a ,由此解得a =1.45,选B.
4. 对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是( )
A. r 2<r 4<0<r 3<r 1
B. r 4<r 2<0<r 1<r 3
C. r 4<r 2<0<r 3<r 1
D. r 2<r 4<0<r 1<r 3
答案:A
解析:由相关系数的定义以及散点图所表达的含义可知r 2<r 4<0<r 3<r 1.故选A. 5. 从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:
根据上表可得回归直线方程:y =0.56x +a ,据此模型预报身高为172 cm 的高三男生的体重为( )
A. 70.09 kg
B. 70.12 kg
C. 70.55 kg
D. 71.05 kg
答案:B
解析:x =160+165+170+175+1805=170,y =63+66+70+72+74
5=69.∵回归直
线过点(x ,y ),∴将点(170,69)代入回归直线方程得y ^
=0.56x -26.2,代入x =172 cm ,则其体重为70.12 kg.
6. [2013·武昌调研]通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:
由K 2
=n (ad -dc )(a +b )(c +d )(a +c )(b +d )

算得K 2
=110×(40×30-20×20)2
60×50×60×50
≈7.8.
附表:
A. 有99%以上的把握认为“选择过马路的方式与性别有关”
B. 有99%以上的把握认为“选择过马路的方式与性别无关”
C. 在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”
D. 在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关” 答案:A
解析:∵K 2
=110×(40×30-20×20)2
60×50×60×50
≈7.8>6.635,
∴有99%以上的把握认为“选择过马路的方式与性别有关”. 二、填空题
7. [2011·辽宁高考]调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^
=0.254x +0.321.由回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
答案:0.254
解析:以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^
=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.
8. [2013·嘉兴联考]为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:
已知到K 2=50×(13×20-10×7)2
23×27×20×30
≈4.844,则认为选修文科与性别有关系出错的可能性约为________.
答案:5%
解析:由K 2=4.844>3.841.
故认为选修文科与性别有关系出错的可能性约为5%.
9. [2013·金版原创]在2013年元旦期间,某市物价部门对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一组数据如下表所示:
格x 的线性回归方程为________.(参考公式:b ^

∑i =1
n
x i y i -n x y ∑i =1
n
x 2i -n x
2
,a ^=y -b ^
x )
答案:y ^
=-3.2x +40
解析:∑i =1
5
x i y i =392,x =10,y =8,∑i =1
5
x 2i =502.5,
代入公式,得b ^=-3.2,所以,a ^=y -b ^x =40,故线性回归方程为y ^
=-3.2x +40. 三、解答题
10. 某学生对其30位亲属的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数.说明:下图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.
(1)根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯; (2)根据以上数据完成2×2列联表:
(3)能否有99% 解:(1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主. (2)如表所示:
(3)K 2
=30×(8-128)12×18×20×10=30×120×12012×18×20×10
=10>6.635.
∴有99%以上的把握认为其亲属的饮食习惯与年龄有关.
11. [2013·怀化检测]某班主任对全班50名学生进行了作业量多少的调查.数据如下表:
(1)(2)试通过计算说明在犯错误的概率不超过多少的前提下认为喜欢玩游戏与作业量的多少有关系?
附:
K 2
=n (ad -bc )(a +b )(c +d )(a +c )(b +d )
解:(1)
(2)K 2
=n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )

K 2
=50×(18×15-8×9)2
26×24×27×23
≈5.059>5.024,
查表知P (K 2≥5.024)=0.025,即说明在犯错误的概率不超过0.025的前提下认为喜欢玩游戏与作业量的多少有关系.
12. [2013·杭州模拟]某电脑公司有6名产品推销员,其工作年限与年推销金额的数据如下表:
(1)(2)求年推销金额y 关于工作年限x 的线性回归方程;
(3)若第6名推销员的工作年限为11年,试估计他的年推销金额. 解:(1)依题意,画出散点图如图所示,
(2)从散点图可以看出,这些点大致在一条直线附近,设所求的线性回归方程为y ^=b ^
x +a ^.
x =1
5(3+5+6+7+9)=6,
y =1
5
(2+3+3+4+5)=3.4,
则b ^=
5
i =1 (x i -x )(y i -y ) 5
i =
1
(x i -x )2
=1020=0.5, a ^=y -b ^
x =0.4,
∴年推销金额y 关于工作年限x 的线性回归方程为y ^
=0.5x +0.4. (3)由(2)可知,当x =11时,y ^
=0.5x +0.4=0.5×11+0.4=5.9(万元). ∴可以估计第6名推销员的年推销金额为5.9万元.。

相关文档
最新文档