高考数学高中数学知识点课时跟踪检测(五十六) 变量间的相关关系、统计案例(普通高中)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课时跟踪检测(五十六) 变量间的相关关系、统计案例
(一)普通高中适用作业
A 级——基础小题练熟练快
1.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y 与x 负相关且y ^
=2.347x -6.423; ②y 与x 负相关且y ^
=-3.476x +5.648; ③y 与x 正相关且y ^
=5.437x +8.493; ④y 与x 正相关且y ^
=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④
D .①④
解析:选D 正相关指的是y 随x 的增大而增大,负相关指的是y 随x 的增大而减小,故不正确的为①④.
2.下列说法错误的是( )
A .自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B .在线性回归分析中,相关系数r 的值越大,变量间的相关性越强
C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D .在回归分析中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好
解析:选B 根据相关关系的概念知A 正确;当r >0时,r 越大,相关性越强,当r <0时,r 越大,相关性越弱,故B 不正确;对于一组数据的拟合程度的好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好.二是R 2越大,拟合效果越好,所以R 2为0.98的模型比R 2为0.80的模型拟合的效果好,C 、D 正确,故选B.
3.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =1
2x +1上,则这组样本数据的样
本相关系数为( )
A .-1
B .0 C.12
D .1
解析:选D 因为所有样本点都在直线y =1
2
x +1上,所以这组样本数据完全正相关,
故其相关系数为1.
4.某考察团对10个城市的职工人均工资x (千元)与居民人均消费y (千元)进行调查统计,得出y 与x 具有线性相关关系,且线性回归方程为y ^
=0.6x +1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( )
A .66%
B .67%
C .79%
D .84%
解析:选D ∵y 与x 具有线性相关关系,且满足回归方程y ^
=0.6x +1.2,该城市居民人均工资为x =5,∴可以估计该城市的职工人均消费水平y =0.6×5+1.2=4.2,∴可以估计该城市人均消费额占人均工资收入的百分比为4.2
5
=84%.
5.某产品生产厂家的市场部在对4家商场进行调研时,获得该产品售价x (单位:元)和销售量y (单位:件)之间的四组数据如下表:
y ^=-1.4x +a ^,那么方程中的a ^
值为( )
A .17
B .17.5
C .18
D .18.5
解析:选B x =
4+4.5+5.5+64=5,y =12+11+10+9
4
=10.5,∵回归直线过样本
点的中心(x ,y ),代入线性回归方程y ^=-1.4x +a ^,得a ^
=10.5+1.4×5=17.5.
6.(2018·江西九校联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.
由K 2
=n (ad -bc )(a +b )(c +d )(a +c )(b +d )
,
得K 2
=100×(45×22-20×13)2
65×35×58×42
≈9.616.
参照下表,
A .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
B .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
C .有99%以上的把握认为“生育意愿与城市级别有关”
D .有99%以上的把握认为“生育意愿与城市级别无关”
解析:选C ∵K 2≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”.
7.经调查某地若干户家庭的年收入x (万元)和年饮食支出y (万元)具有线性相关关系,并得到y 关于x 的线性回归直线方程:y ^
=0.245x +0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:x 变为x +1,y ^
=0.245(x +1)+0.321=0.245x +0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.
答案:0.245
8.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下对照表:
由表中数据得线性回归直线方程y =b x +a 中的b =-2,预测当气温为-4 ℃时,用电量为________度.
解析:回归直线过点(x ,y ),根据题意得x =
18+13+10+(-1)
4
=10,y =
24+34+38+644=40,将(10,40)代入y ^=-2x +a ^,解得a ^=60,则y ^
=-2x +60,当x =-4
时,y ^
=(-2)×(-4)+60=68,即当气温为-4 ℃时,用电量约为68度.
答案:68
9.已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表:
根据以上信息,判断下列结论:
①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系; ②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;
③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.
其中正确的个数为________.
解析:由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次函数关系,故①正确,②错误;若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故③错误.综上,正确的个数为1.
答案:1
B 级——中档题目练通抓牢
1.为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x 轴,y 轴的单位长度相同),用回归直线方程y ^=b ^x +a ^
近似地刻画其相关关系,根据图形,以下结论最有可能成立的是( )
A .线性相关关系较强,b ^
的值为1.25 B .线性相关关系较强,b ^
的值为0.83 C .线性相关关系较强,b ^
的值为-0.87 D .线性相关关系较弱,无研究价值
解析:选B 由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比y =x 的斜率要小一些,综上可知应选B.
2.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
根据上表可得回归直线方程y ^=b ^x +a ^,其中b ^=0.76,a ^=y -b ^
x .据此估计,该社区一户年收入为15万元家庭的年支出为( )
A .11.4万元
B .11.8万元
C .12.0万元
D .12.2万元
解析:选B 由题意知,x =8.2+8.6+10.0+11.3+11.9
5=10,
y =
6.2+
7.5+
8.0+8.5+
9.8
5
=8,
∴a ^
=8-0.76×10=0.4,
∴当x =15时,y ^
=0.76×15+0.4=11.8(万元).
3.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:
附表及公式:
K 2
=n (ad -bc )(a +b )(c +d )(a +c )(b +d )
,n =a +b +c +d .
A .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”
B .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”
D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”
解析:选A 由列联表得到a =45,b =10,c =30,d =15,则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100,计算得K 2的观测值k =n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=100×(675-300)2
55×45×75×25
≈3.030.因为2.706<3.030<3.841,所以有90%以
上的把握认为“该市居民能否做到‘光盘’与性别有关”.
4.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量
及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:
由散点图可知,销售量y 与价格x 之间有较强的线性相关关系,其线性回归方程是y ^
=-3.2x +40,且m +n =20,则其中的n =________.
解析:x =9+9.5+m +10.5+115=8+m
5,
y =
11+n +8+6+55=6+n 5
,
回归直线一定经过样本点中心(x ,y ), 即6+n
5=-3.2⎝⎛⎭⎫8+m 5+40,即3.2m +n =42. 又因为m +n =20,
即⎩⎪⎨⎪⎧ 3.2m +n =42,m +n =20,解得⎩⎪⎨⎪
⎧
m =10,n =10,
故n =10. 答案:10
5.某炼钢厂废品率x (%)与成本y (元/吨)的线性回归直线方程为y ^
=105.492+42.569x .当成本控制在176.5元/吨时,可以预计生产的1 000吨钢中,约有________吨钢是废品(结果保留两位小数).
解析:因为176.5=105.492+42.569x ,解得x ≈1.668,即当成本控制在176.5元/吨时,废品率约为1.668%,所以生产的1 000吨钢中,约有1 000×1.668%=16.68吨是废品.
答案:16.68
6.(2018·合肥模拟)某校计划面向高一年级1 200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类、自然科学类这两大类校本选修课程进行选课意向调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人.
(1)分别计算抽取的样本中男生及女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类学生的人数;
(2)根据抽取的180名学生的调查结果,完成下列2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?
附:K 2
=n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
,其中n =a +b +c +d .
男生选择社会科学类的频率为45105=37, 女生选择社会科学类的频率为
4575=35. 由题意,男生总人数为1 200×105
180
=700, 女生总人数为1 200×
75
180
=500. 所以估计实际选课中选择社会科学类的学生人数为 700×37+500×3
5
=600.
(2)根据统计数据,可得2×2
列联表如下:
所以K 2
=105×75×90×90
≈5.143>5.024,
所以在犯错误的概率不超过0.025的前提下可以认为科类的选择与性别有关. 7.某地区2011年至2017年农村居民家庭纯收入y (单位:万元)的数据如下表:
(2)利用(1)中的回归方程,分析2011年至2017年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2019年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:
b ^=
∑i =1
n
(t i -t )(y i -y )
∑i =1
n
(t i -t )2
,a ^=y -b ^t .
解:(1)由所给数据计算得t =17(1+2+3+4+5+6+7)=4,y =1
7(2.9+3.3+3.6+4.4
+4.8+5.2+5.9)=4.3,∑i =17
(t i -t )2=9+4+1+0+1+4+9=28,
∑i =1
7
(t i -t )(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+
2×0.9+3×1.6=14,b ^
=
∑i =1
7
(t i -t )(y i -y )
∑i =1
7
(t i -t )2
=14
28
=0.5, a ^=y -b ^
t =4.3-0.5×4=2.3, 所求回归方程为y ^
=0.5t +2.3.
(2)由(1)知,b ^
=0.5>0,故2011年至2017年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5万元.
将2019年的年份代号t =9代入(1)中的回归方程,得y ^
=0.5×9+2.3=6.8, 故预测该地区2019年农村居民家庭人均纯收入为6.8万元. C 级——重难题目自主选做
1.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
表中w i =x i ,w =18∑i =1
8
w i .
(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.
(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?
附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截
距的最小二乘估计分别为β^
=
∑i =1
n
(u i -u )(v i -v )
∑i =1
n
(u i -u )2
,α^
=v -β^
u .
解:(1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.
(2)令w =x ,先建立y 关于w 的线性回归方程.
由于d ^
=
∑i =1
8
(w i -w )(y i -y )
∑i =1
8
(w i -w )2
=108.81.6
=68, c ^
=y -d ^
w =563-68×6.8=100.6,
所以y 关于w 的线性回归方程y ^
=100.6+68w , 因此y 关于x 的回归方程为y ^
=100.6+68x . (3)①由(2)知,当x =49时,
年销售量y 的预报值y ^
=100.6+6849=576.6,
年利润z 的预报值z ^
=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值
z ^
=0.2(100.6+68x )-x =-x +13.6x +20.12.
所以当x =13.6
2
=6.8,即x =46.24时,z ^
取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.
2.为了了解某学校高二年级学生的物理成绩,从中抽取n 名学生的物理成绩(百分制)作
为样本,按成绩分成5组:[50,60),[60,70),[70,80),[80,90),[90,100],频率分布直方图如图所示,成绩落在[70,80)中的人数为20.
(1)求a 和n 的值;
(2)根据样本估计总体的思想,估计该校高二学生物理成绩的平均数x -
和中位数m ; (3)成绩在80分以上(含80分)为优秀,样本中成绩落在[50,80)中的男、女生人数比为1∶2,成绩落在[80,100)中的男、女生人数比为3∶2,完成2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下认为物理成绩优秀与性别有关.
附:参考公式和数据:K 2
=n (ad -bc )(a +b )(c +d )(a +c )(b +d )
,
解:(1)解得a =0.05,则n =20
10×0.05
=40.
(2)由频率分布直方图可知各组的频率分别为0.05,0.2,0.5,0.15,0.1, 所以x -
=55×0.05+65×0.2+75×0.5+85×0.15+95×0.1=75.5, (m -70)×0.05=0.5-(0.05+0.2),得m =75.
(3)由频率分布直方图可知成绩优秀的人数为40×(0.015+0.01)×10=10,则不优秀的人数为40-10=30.
所以优秀的男生为6人,女生为4人; 不优秀的男生为10人,女生为20人. 所以2×2列联表如下:
所以K2=40×(6×20-4×10)
16×24×10×30
≈2.222<3.841,
所以在犯错误的概率不超0.05的前提下不能认为物理成绩优秀与性别有关.古今中外有学问的人,有成就的人,总是十分注意积累的。
知识就是机积累起来的,经验也是积累起来的。
我们对什么事情都不应该像“过眼云烟”。
学习知识要善于思考,思考,再思考。
——爱因斯坦
镜破不改光,兰死不改香。
——孟郊
生活的全部意义在于无穷地探索尚未知道的东西,在于不断地增加更多的知识。
—
做学问的功夫,是细嚼慢咽的功夫。
好比吃饭一样,要嚼得烂,方好消化,才会对人体有益。
——陶铸
研卷知古今;藏书教子孙。
——《对联集锦》
凡事豫(预)则立,不豫(预)则废。
——《礼记》
知识是珍贵宝石的结晶,文化是宝石放出来的光泽。
——泰戈尔
你是一个积极向上,有自信心的孩子。
学习上有计划、有目标,能够合理安排自己的时间,学习状态挺好;心态平和,关心、帮助同学,关心班集体,积极参加班级、学
校组织的各项活动,具有较强的劳动观念,积极参加体育活动,尊敬师长。
希望你再接再厉,不满足于现状,争取做的更好。