回归分析与独立性检验

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

湛江一中2016届高二级第二学期数学科临界生辅导资料(初诊卷)

选修1-2 专题二 回归分析与独立性检验

学科老师:_____________ 辅导老师:___________

高二( )班 学号 ____________ 学生姓名:____________

一、基础知识

1.两个变量的线性相关

如果散点图中点的分布从整体上看大致在 ,就称这两个变量之间具有线性相关关系,这条直线叫做 . 2.回归方程

(1)最小二乘法求回归直线使得样本数据的点到回归直线的________________的方法叫做最小二乘法.

(2)回归方程方程 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程.

其中b

ˆ= _______________________,a ˆ =______________, ____________称为样本点的中心. 3、相关系数

当r >0时,表明两个变量_______;当r <0时,表明两个变量_________.

r 的绝对值越接近于1,表明两个变量的线性相关性_______;r 的绝对值越接近于0,表明两个变量之间________________________. 4、相关指数

∑∑==---

=n i i

n

i i i

y y

y

y

R 1

2

122

)()ˆ(1 其

∑=-n

i i i

y

y

1

2

)ˆ(为_________________,

∑=-n

i i

y y 1

2

)

(为

_________________ 。当2

R 越大,则模型拟合效果__________

5.独立性检验

(1)2×2列联表:假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其_________列联表(称为2×2列联表)为:

y 1 y 2 总计

x 1 a b a+b x 2

c d c+d 总计

a+c

b+d

a+b+c+d

(2)利用随机变量

来确定在多大程度上可认为____________________的方法称为两个分类变量的独立性检验. 下面的临界值表供参考:

20

()P K k ≥ 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001

0k

0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

22

n ad bc K a b c d a c b d -=++++()()()()()n a b c d =+++(其中)

二、例题讲解

一、与概念有关的练习

1、在下列量与量的关系中,是相关关系的为()

①正方体的体积与棱长间的关系;②一块农田的水稻产量与施肥量的关系;

③人的身高与年龄;④家庭的支出与收入;

A. ②③

B. ③④

C. ①④

D. ②③④

2、下列说法中正确的是()

A. 任何两个变量之间都有相关关系

B. 球的体积与该球的半径具有相关关系

C. 农作物的产量与施化肥量之间是一种确定性的关系

D. 某商品的生产量与该商品的销售价格之间是一种非确定性的关系

3.在画两个变量的散点图时,下面叙述中正确的是()

A. 预报变量在x轴上,解释变量在y轴上

B. 解释变量在x轴上,预报变量在y轴上

C. 可以选择两个变量中任意一个变量在x轴上

D. 可以选择两个变量中任意一个变量在y轴上

4.对于两个变量之间的相关系数,下列说法中正确的是()

A. |r|越大,相关程度越大

B. |r|∈(0,+∞),|r|越大,相关程度越小,|r|越小,相关程度越大

C. |r|≤1且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小

D. 以上说法都不对

5、两个变量y与x的回归模型中,通常用2R来刻画回归的效果,则正确的叙述是()

R越小,残差平方和小 B. 2R越大,残差平方和大

A. 2

R于残差平方和无关 D. 2R越小,残差平方和大

C. 2

6、在比较两个模型的拟合效果时,甲、乙两个模型的相关指数2R的值分别约为0.96和0.85,则拟合效果好的模型是.

7、在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( )

A.总偏差平方

B.残差平方和

C.回归平方和

D.相关指数R2

8、若一组观测值(x1,y1)(x2,y2)…(x n,y n)之间满足y i=bx i+a+e i (i=1、2.…n)若e i恒为0,则R2为_____

=+,已知:数据x的9、某同学由x与y之间的一组数据求得两个变量间的线性回归方程为y bx a

平均值为2,数据y的平均值为3,则 ( )

A.回归直线必过点(2,3) B.回归直线一定不过点(2,3)

C.点(2,3)在回归直线上方 D.点(2,3)在回归直线下方

10、一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7。19x+73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是()

A. 身高一定是145.83 cm

B. 身高在145.83 cm以上

C. 身高在145.83 cm以下

D. 身高在145.83 cm左右

11、下面是2×2列联表:

y1 y2 合计

x1 a21 73

x2 22 25 47

合计b46 120

则表中a,b的值分别为()

A.94,72

B.52,50

C.52,74

D.74,52

12.利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.利用独立性检验不仅可以考察两个分类变量是否有关系,而且()

A. 能较精确地给出这种判断的可靠程度

B. 得出的结论完全正确,不会出错

C. K2的观测值很大时(比如大于20),则得出的结论完全正确,不会出错

D. K2的观测值很小时(比如小于2),则得出的结论肯定错误

相关文档
最新文档