回归分析与独立性检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
湛江一中2016届高二级第二学期数学科临界生辅导资料(初诊卷)
选修1-2 专题二 回归分析与独立性检验
学科老师:_____________ 辅导老师:___________
高二( )班 学号 ____________ 学生姓名:____________
一、基础知识
1.两个变量的线性相关
如果散点图中点的分布从整体上看大致在 ,就称这两个变量之间具有线性相关关系,这条直线叫做 . 2.回归方程
(1)最小二乘法求回归直线使得样本数据的点到回归直线的________________的方法叫做最小二乘法.
(2)回归方程方程 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程.
其中b
ˆ= _______________________,a ˆ =______________, ____________称为样本点的中心. 3、相关系数
当r >0时,表明两个变量_______;当r <0时,表明两个变量_________.
r 的绝对值越接近于1,表明两个变量的线性相关性_______;r 的绝对值越接近于0,表明两个变量之间________________________. 4、相关指数
∑∑==---
=n i i
n
i i i
y y
y
y
R 1
2
122
)()ˆ(1 其
中
∑=-n
i i i
y
y
1
2
)ˆ(为_________________,
∑=-n
i i
y y 1
2
)
(为
_________________ 。当2
R 越大,则模型拟合效果__________
5.独立性检验
(1)2×2列联表:假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其_________列联表(称为2×2列联表)为:
y 1 y 2 总计
x 1 a b a+b x 2
c d c+d 总计
a+c
b+d
a+b+c+d
(2)利用随机变量
来确定在多大程度上可认为____________________的方法称为两个分类变量的独立性检验. 下面的临界值表供参考:
20
()P K k ≥ 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0k
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
22
n ad bc K a b c d a c b d -=++++()()()()()n a b c d =+++(其中)
二、例题讲解
一、与概念有关的练习
1、在下列量与量的关系中,是相关关系的为()
①正方体的体积与棱长间的关系;②一块农田的水稻产量与施肥量的关系;
③人的身高与年龄;④家庭的支出与收入;
A. ②③
B. ③④
C. ①④
D. ②③④
2、下列说法中正确的是()
A. 任何两个变量之间都有相关关系
B. 球的体积与该球的半径具有相关关系
C. 农作物的产量与施化肥量之间是一种确定性的关系
D. 某商品的生产量与该商品的销售价格之间是一种非确定性的关系
3.在画两个变量的散点图时,下面叙述中正确的是()
A. 预报变量在x轴上,解释变量在y轴上
B. 解释变量在x轴上,预报变量在y轴上
C. 可以选择两个变量中任意一个变量在x轴上
D. 可以选择两个变量中任意一个变量在y轴上
4.对于两个变量之间的相关系数,下列说法中正确的是()
A. |r|越大,相关程度越大
B. |r|∈(0,+∞),|r|越大,相关程度越小,|r|越小,相关程度越大
C. |r|≤1且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小
D. 以上说法都不对
5、两个变量y与x的回归模型中,通常用2R来刻画回归的效果,则正确的叙述是()
R越小,残差平方和小 B. 2R越大,残差平方和大
A. 2
R于残差平方和无关 D. 2R越小,残差平方和大
C. 2
6、在比较两个模型的拟合效果时,甲、乙两个模型的相关指数2R的值分别约为0.96和0.85,则拟合效果好的模型是.
7、在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( )
A.总偏差平方
B.残差平方和
C.回归平方和
D.相关指数R2
8、若一组观测值(x1,y1)(x2,y2)…(x n,y n)之间满足y i=bx i+a+e i (i=1、2.…n)若e i恒为0,则R2为_____
=+,已知:数据x的9、某同学由x与y之间的一组数据求得两个变量间的线性回归方程为y bx a
平均值为2,数据y的平均值为3,则 ( )
A.回归直线必过点(2,3) B.回归直线一定不过点(2,3)
C.点(2,3)在回归直线上方 D.点(2,3)在回归直线下方
10、一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7。19x+73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是()
A. 身高一定是145.83 cm
B. 身高在145.83 cm以上
C. 身高在145.83 cm以下
D. 身高在145.83 cm左右
11、下面是2×2列联表:
y1 y2 合计
x1 a21 73
x2 22 25 47
合计b46 120
则表中a,b的值分别为()
A.94,72
B.52,50
C.52,74
D.74,52
12.利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.利用独立性检验不仅可以考察两个分类变量是否有关系,而且()
A. 能较精确地给出这种判断的可靠程度
B. 得出的结论完全正确,不会出错
C. K2的观测值很大时(比如大于20),则得出的结论完全正确,不会出错
D. K2的观测值很小时(比如小于2),则得出的结论肯定错误