2014届高中数学文教师备选作业:第10章 第三节 变量间的相关关系与统计案例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十章 第三节 变量间的相关关系与统计案例
一、选择题
1.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( )
A .x 和y 的相关系数为直线l 的斜率
B .x 和y 的相关系数在0到1之间
C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同
D .直线l 过点(x ,y )
2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
由K 2
=n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
算得,
K 2
=110×(40×30-20×20)2
60×50×60×50
≈7.8.
附表:
参照附表,得到的正确结论是( )
A .有99%以上的把握认为“爱好该项运动与性别有关”
B .有99%以上的把握认为“爱好该项运动与性别无关”
C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
3.一位母亲记录了自己儿子3~9岁的身高数据(略),由此建立的身高与年龄的回归模型为y ^
=7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )
A .身高一定是145.83 cm
B .身高在145.83 cm 以上
C .身高在145.83 cm 左右
D .身高在145.83 cm 以下
4.如图5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )
A .相关系数r 变大
B .残差平方和变大
C .相关指数R 2变大
D .解释变量x 与预报变量y 的相关性变强
5.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( ) A.y ^
=-10x +200 B.y ^
=10x +200 C.y ^
=-10x -200
D.y ^
=10x -200
6.下列四个命题正确的是( )
①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱; ②残差平方和越小的模型,拟合的效果越好;
③用相关指数R 2来刻画回归效果,R 2越小,说明模型的拟合效果越好; ④随机误差e 是衡量预报精确度的一个量,它满足E (e )=0. A .①③ B .②④ C .①④
D .②③
二、填空题
7.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^
=0.254x +0.321.由回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
8.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.
9.第二十届世界石油大会将于2011年12月4日~8日在卡塔尔首都多哈举行,能源问题已经成为全球关注的焦点.某工厂经过技术改造后,降低了能源消耗,经统计该厂某种产品的产量x (单位:吨)与相应的生产能耗y (单位:吨)有如下几组样本数据:
根据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得回归直线的斜率为0.7.已知该产品的年产量为10吨,则该工厂每年大约消耗的汽油为________吨.
三、解答题
10.已知x ,y 的一组数据如下表:
(1)从x ,y 中各取一个数,求x +y ≥10的概率;
(2)对于表中数据,甲、乙两同学给出的拟合直线分别为y =13x +1与y =12x +1
2,试利用“最
小平方法(也称最小二乘法)”判断哪条直线拟合程度更好.
11.为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x 、物理成绩y 进行分析.下面是该生7次考试的成绩.
(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明;
(2)已知该生的物理成绩y 与数学成绩x 是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.(其中,数据(x i ,y i )(i =1,2,…,n )的线性回归方程为y ^=b ^x +a ^
,
b ^=
∑i =1
n
(x i -x -)(y i -y -
)∑i =1
n
(x i -x -
)2
,a ^=y --b ^x -)
12.某学生对其亲属30人的饮食习惯进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.)
乙(50岁以上)
(1)
(2)根据以上数据完成下列2×2的列联表:
(3)能否有99%的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析.
附:K2=n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
.
详解答案
1. 解析:回归直线过样本中心(x ,y ). 答案:D
2.解析:根据独立性检验的思想方法,正确选项为A. 答案:A
3.解析:用回归模型y ^
=7.19x +73.93,只能作预测,其结果不一定是一个确定值. 答案: C
4.解析:相关系数r 越接近1,R 2越大,残差平方和越小,拟合效果越好. 答案:B
5.解析:由图象可知,选项B 、D 为正相关,选项C 不符合实际意义,只有A 项符合要求.
答案:A
6.解析:线性相关系数r 满足|r |≤1,并且|r |越接近1,线性相关程度越强;|r |越接近0,线性相关程度越弱,故①错误;③相关指数是度量模型拟合效果的一种指标.相关指数越大,模型拟合效果越好.故②④正确
答案:B 二、填空题
7.解析:以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^
=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.
答案:0.254
8.解析:设父亲身高为x cm ,儿子身高为y cm ,则
x -=173,y -=176,b ^=0×(-6)+(-3)×0+3×602+9+9
=1,
a ^=y --
b ^x -=176-1×173=3,∴y ^=x +3,当x =182时,y ^
=185. 答案:185
9.解析:由题知,x -=3+4+5+64=4.5,y -=2.5+3+4+4.5
4=3.5,故样本数据的中心
点为A (4.5,3.5).设回归方程为y =0.7x +b ,将中心点坐标代入得:3.5=0.7×4.5+b ,解得b =0.35,故回归方程为y =0.7x +0.35,所以当x =10时,y =0.7×10+0.35=7.35,即该工厂每年大约消耗的汽油为7.35吨.
三、解答题
10.解:(1)从x ,y 中各取一个数组成数对(x ,y ),共有25对,其中满足x +y ≥10的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共9对.故所求概率P =925
.
(2)用y =13x +1作为拟合直线时,所得y 值与y 的实际值的差的平方和为S 1=(4
3-1)2+(2
-2)2+(3-3)2+(103-4)2+(113-5)2=7
3
.
用y =12x +1
2作为拟合直线时,所得y 值与y 的实际值的差的平方和为S 2=(1-1)2+
(2-2)2+(72-3)2+(4-4)2+(92-5)2=1
2.
∵S 2<S 1,∴直线y =12x +1
2
的拟合程度更好.
11.解:(1)∵x -
=100+-12-17+17-8+8+127=100,
y -
=100+-6-9+8-4+4+1+67=100,
∴s 2数学=9947=142,∴s 2物理=250
7
, 从而s 2数学>s 2物理,∴该生的物理成绩更稳定.
(2)由于x 与y 之间具有线性相关关系,
∴b ^=
i =1
7x i y i -7
x - y
-i =1
7x 22-7x -2
=497994
=0.5,a ^=y --b ^x -
=100-0.5×100=50, ∴线性回归方程为y ^
=0.5x +50.当y =115时,x =130. 建议:
进一步加强对数学的学习,提高数学成绩的稳定性,这将有助于物理成绩的进一步提高. 12.解:(1)在30位亲属中,50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主.
(2)2×2的列联表如下:
主食肉类
(3)因为K 2
=30×(8-128)212×18×20×10=30×120×120
12×18×20×10
=10>6.635,
所以有99%的把握认为其亲属的饮食习惯与年龄有关.。