高考数学第一轮基础复习同步10-3 相关关系、回归分析与独立性检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

10-3 相关关系、回归分析与独立性检验
1.(2011·济南模拟)对于回归分析,下列说法错误的是( )
A.在回归分析中,变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定
B.线性相关系数可以是正的或负的
C.回归分析中,如果r=±1,说明x与y之间完全线性相关
D.样本相关系数r∈(-1,1)
[答案] D
[解析]∵相关系数|r|≤1,∴D错.
2.(2011·西安模拟)在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误A.①B.①③
C.③D.②
[答案] C
[解析]①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A,B,③正确.排除D,选C.
3.(文)(2011·陕西文,9)设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如下图),以下结论正确的是( )
A .直线l 过点(x ,y )
B .x 和y 的相关系数为直线l 的斜率
C .x 和y 的相关系数在0到1之间
D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同 [答案] A
[解析] ∵回归直线方程y ^=a ^+b ^x 中a ^=y --b ^x -

∴y ^=y --b ^x -+b ^x ,当x =x -时,y ^=y -,∴直线l 过定点(x -,y -). (理)(2011·山东文,8)某产品的广告费用x 与销售额y 的统计数据如下表
根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( )
A .63.6万元
B .65.5万元
C .67.7万元
D .72.0万元
[答案] B
[解析] 此题必须明确回归直线方程过定点(x ,y ).
易求得x =3.5,y =42,则将(3.5,42)代入y ^=b ^x +a ^中得:42=9.4×3.5+a ^,即a ^
=9.1,则y =9.4x +9.1,所以当广告费用为6万元时销售额为9.4×6+9.1=65.5万元.
4.(2011·湖南文,5)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
由χ2
=n ad -bc 2a +b
c +
d a +c
b +d
算得,χ2


2
60×50×60×50
≈7.8.
附表:
A .有99%以上的把握认为“爱好该项运动与性别有关”
B .有99%以上的把握认为“爱好该项运动与性别无关”
C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” [答案] A
[解析] 根据独立性检验的定义,由χ2≈7.8>6.635可知,有99%以上把握认为“爱好该项运动与性别有关”.
5.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关
关系,现取8对观测值计算,得∑i =1
8
x i =52,∑i =1
8
y i =228,∑i =1
8
x 2
i =478,∑i =1
8
x i y i =1849,则其回
归直线方程为( )
A.y ^
=11.47+2.62x B.y ^
=-11.47+2.62x C.y ^
=2.62+11.47x D.y ^
=11.47-2.62x
[答案] A
[解析] 由∑i =1
8
x i =52,∑i =1
8
y i =228知,
x -=6.5,y -=28.5,b ^=
∑i =18
x i y i -8x -y

∑i =1
8
x 2
i -8x -2
=1849-8×6.5×28.5478-8×6.52
≈2.62,
∴a ^=y --b ^x -
=28.5-2.62×6.5=11.47.
6.(2011·中山四校联考、湖南六校联考)甲、乙、丙、丁四位同学各自对A 、B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:
A .甲
B .乙
C .丙
D .丁
[答案] D
[解析] r 越接近1,相关性越强,残差平方和m 越小,相关性越强,故选D.
7.(2011·辽宁文,14)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^
=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
[答案] 0.254
[解析] 由回归直线方程为y ^
=0.254x +0.321知收入每增加1万元,饮食支出平均增加0.254万元.
8.(2011·合肥模拟)已知x 、y 之间的一组数据如下表:
对于表中数据,甲、乙两同学给出的拟合直线分别为l 1:y =3x +1与l 2:y =12x +1
2,
利用最小二乘法判断拟合程度更好的直线是________(填l 1或l 2).
[答案] l 2
[解析] 用y =13x +1作为拟合直线时,所得y 值与y 的实际值的差的平方和为s 1=7
3;
用y =12x +12作为拟合直线时,所得y 值与y 的实际值的差的平方和为s 2=1
2.∵s 2<s 1,故
用直线y =12x +1
2
拟合程度更好.
9.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
-2
23×27×20×30
≈4.844.
因为χ2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.
[答案] 5%
[解析] 根据独立性检验临界值表可知“x 与y 有关系”的可信度,P (χ2≥3.841)=0.05,∴有95%的可能认为x 与y 有关系,即判断出错的可能性为5%.
10.(2010·扬州模拟)为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x 、物理成绩y 进行分析.下面是该生7次考试的成绩:
(2)已知该生的物理成绩y 与数学成绩x 是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理性建议.
[解析] (1)x -
=100+-12-17+17-8+8+12
7=100;
y -
=100+-6-9+8-4+4+1+6
7=100;
∴s 2数学=9947=142,s 2
物理
=2507, 从而s 2
数学>s 2
物理,∴物理成绩更稳定.
(2)由于x 与y 之间具有线性相关关系,根据回归系数公式得到
b ^

∑i =1
7
x i y i -7x -y
-∑i =1
7
x 2i -7x -
2
=497
994
≈0.5, a ^=y --b ^x -
=100-0.5×100=50, ∴回归直线方程为y ^
=0.5x +50.
当y =115时,x =130,即该生物理成绩达到115分时,他的数学成绩大约为130分.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.
11.(2010·广东文)某市居民2005~2009年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)的统计资料如下表所示:
根据统计资料,居民家庭平均收入的中位数是________,家庭年平均收入与年平均支出有________线性相关关系.
[答案] 13 正
[解析] 找中位数时,将样本数据按大小顺序排列后奇数个时中间一个是中位数,而偶数个时须取中间两数的平均数,由统计资料可以看出,年平均收入增多时,年平均支出也增多,因此两者正相关.
12.(2011·佛山二模)在2010年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一组数据如下表所示:
格x 的回归直线方程为________.
[答案] y ^
=-3.2x +40
[解析] ∑i =15
x i y i =392,x -=10,y -=8,∑i =1
5
(x i -x -)2
=2.5,代入公式,得b ^=-3.2,
所以,a ^=y --b ^x -=40,故回归直线方程为y ^
=-3.2x +40.
13.(2011·东北四校联考)某小卖部为了了解热茶销售量y (杯)与气温x (℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:
由表中数据算得线性回归方程y =bx +a 中的b ≈-2,预测当气温为-5℃时,热茶销
售量为________杯.(已知回归系数b =
∑i =1
n
x i y i -n x -y

∑i =1
n
x 2
i -n x

2
,a =y --b x -)
[答案] 70
[解析] 根据表格中的数据可求得x -=14×(18+13+10-1)=10,y -
=1
4×(24+34
+38+64)=40.
∴a =y --b x -=40-(-2)×10=60,∴y ^=-2x +60,当x =-5时,y ^
=-2×(-5)+60=70.
14.(2011·湖南六校联考)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
性回归方程,再用被选取的2组数据进行检验.
(1)求选取的2组数据恰好是相邻两个月的概率;
(2)若选取的是1月与6
月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y ^
=bx +a ;
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?
(参考公式:b =
∑i =1
n
x i -x
-y i -y
-∑i =1
n
x i -x
-2
,a =y --b x -.)
[解析] 将6组数据按月份顺序编号为1,2,3,4,5,6,从中任取两组数据,基本事件空间Ω={(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)}中共15个基本事件,设抽到相邻两个月的事件为
A ,则A ={(1,2),(2,3),(3,4),(4,5),(5,6)}中共5个基本事件,
∴P (A )=515=1
3
.
(2)由表中数据求得x -=11,y -
=24, 由参考公式可得b =18
7

再由a =y --b x -求得a =-307,所以y 关于x 的线性回归方程为y ^
=187x -30
7.
(3)当x =10时,y ^
=1507,|1507-22|=4
7<2;
同样,当x =6时,y ^
=787,|787-12|=6
7<2.
所以,该小组所得线性回归方程是理想的.
15.(文)(2011·郑州市质检)某中学对高二甲、乙两个同类班级进行“加强‘语文阅读理解’训练对提高‘数学应用题’得分率作用”的试验,其中甲班为试验班(加强语文
阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:
(1)试分析估计两个班级的优秀率;
(2)由以上统计数据填写下面2×2列联表,并问是否有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.
参考公式及数据:χ2

a +b
c +
d a +c
b +d

[甲班优秀人数为30人,优秀率为30
50=60%,
乙班优秀人数为25人,优秀率为25
50
=50%,
所以甲、乙两班的优秀率分别为60%和50%.
(2)
因为χ2=
50×50×55×45=
99
≈1.010,
所以由参考数据知,没有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.
(理)(2011·福建普通高中质检)某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师采用A、B两种不同的教学方式分别在甲、乙两个班级进行教改实验.为了了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如下.记成绩不低于90分者为“成绩优秀”.
(1)2个,求抽出的两个均“成绩优秀”的概率;
(2)由以上统计数据填写下面列联表,并判断是否有90%的把握认为:“成绩优秀”与教学方式有关.
附:χ2

11221221
n 1+n 2+n +1n +2
从不低于86分的成绩中随机抽取2个的基本事件为(86,93),(86,96),(86,97),(86,99),(86,99),(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共15个.
而事件A 包含基本事件:
(93,96),(93,97),(93,99),(93,99),(96,97),
(96,99),(96,99),(97,99),(97,99),(99,99),共10个.
所以所求概率为P (A )=1015=23.
(2)由已知数据得
χ2


2
6×34×20×20
≈3.137,
由于3.137>2.706,所以有90%的把握认为“成绩优秀”与教学方式有关.
1.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表
s1、s2、s3( ) A.s3>s1>s2B.s2>s1>s3
C.s1>s2>s3D.s2>s3>s1
[答案] B
[解析]计算可得甲、乙、丙的平均成绩都为8.5.
s1=
1
20
-2+-2+-2+-2]
=25
20
.同理s2=
29
20
,s3=
21
20

∴s2>s1>s3.
2.(2010·厦门三中阶段训练)某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是( )
A.5
C.3 D.2
[答案] D
[解析]去掉最低分87,去掉最高分94(假设x≤4),则7×91=80×2+9+8+90×5+2+3+2+1+x,∴x=2,符合题意,故选D.
3.(2010·广东佛山)为了对2007年佛山市中考成绩进行分析,在60分以上的全体同学中随机抽出8位,他们的数学分数(已折算为百分制)从小到大排列是60、65、70、75、80、85、90、95,物理分数从小到大排列是72、77、80、84、88、90、93、95.
(1)若规定85分(包括85分)以上为优秀,求这8位同学中恰有3位同学的数学和物理分数均为优秀的概率;
(2)若这8位同学的数学、物理、化学分数事实上对应如下表:
(3)求y与x、z与x的线性回归方程(系数精确到0.01),并用相关指数比较所求回归模型的效果.
参考数据:x -=77.5,y -=85,z -=81,∑i =1
8 (x i -x -)≈1050,∑i =1
8
(y i -y -)2≈456,
∑i =18
(z i -z -)≈550,∑i =18 (x i -x -)(y i -y -)≈688,∑i =18 (x i -x -)(z i -z -)≈755,∑i =1
8
(y i -y
^i )≈7,∑i =1
8
(z i -z ^i )2
≈94,
1050≈32.4,456≈21.4,550≈23.5. [解析] (1)这8位同学中恰有3位同学的数学和物理分数均为优秀,则需要先从物
理的4个优秀分数中选出3个与数学优秀分数对应,种数是C 34A 33(或A 3
4),然后将剩下的5个数学分数和物理分数任意对应,种数是A 55.根据乘法原理,满足条件的种数是C 34A 33A 55.
这8位同学的物理分数和数学分数分别对应的种数共有A 88.
故所求的概率P =C 34A 33A 5
5
A 88=114
.
(2)变量y 与x 、z 与x 的相关系数分别是
r =
68832.4×21.4≈0.99,r ′=75532.4×23.5
≈0.99
可以看出,物理与数学、化学与数学的成绩都是高度正相关. (3)设y 与x 、z 与x 的线性回归方程分别是y ^=bx +a ,z ^
=b ′x +a ′ 根据所给的数据可以计算出,b =688
1050
=0.65,a =85-0.65×77.5=34.63,
b ′=
755
1050
=0.72,a ′=81-0.72×77.5=25.20 所以y 与x 和z 与x 的回归方程分别是 y ^
=0.65x +34.63,z ^
=0.72x +25.20,
又y 与x 、z 与x 的相关指数是R 2=1-7456≈0.98,R ′2=1-94
550≈0.83
故回归模型y ^=0.65x +34.63比回归模型z ^
=0.72x +25.20的拟合的效果好.。

相关文档
最新文档