人教版高数选修2-3第7讲:独立性检验与回归分析(学生版)-(2)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

独立性检验与回归分析
__________________________________________________________________________________ __________________________________________________________________________________
1.了解变量间的相关关系,能根据给出的线性回归方程系数建立线性回归方程.
2.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.
3.了解回归分析的基本思想、方法及其简单应用.
1.独立性检验
(1)概念:用2χ统计量研究独立性问题的检验的方法称为独立性检验.
(2)m×n列联表指有m行n列的列联表
(3)必备公式2χ=
2
()
()()()()
n ad bc
a c
b d a b
c d
-
++++
2.2χ统计量中的四个临界值
经过对2
χ统计量分布的研究,已经得到了四个经常用到的临界值:2.706、3.841、6.635、10.828.
由2×2列联表计算出2
χ,然后与相应的临界值进行比较,当2χ>2.706时,有______的把握说事件A与B有关.当2
χ>3.841时,有______的把握说事件A与B有关.当2χ>6.635时,有______的把握说事件A与B有关.当2
χ>10.828时,有______的把握说事件A与B有关.当2χ≤2.706时,认为事件A与B是无关的.
3.回归分析
(1)线性回归模型是指方程y a bxε
=++,其中________称为确定性函数,____称为随机误差.
(2)线性回归方程是指直线方程ˆˆˆy
a bx =+,其中回归截距ˆa 、回归系数ˆ
b 公式如下: ˆb
=_______________________ˆa =_____________. (3)参数r 检验线性相关的程度,计算公式为r
()()
n
i
i
x x y
y --∑

n
i i
x y
nx y
-∑化简后r =
x y
xy x y
S S -,其中y S 表示数据i y (i =1,2,…,
n )的标准差,这个r 称为y 与x 的样本相关系数,简称相关系数,其中-1≤r ≤1.若r >0,则x 与y 是正相关,若r <0,则x 与y 是负相关,若r =0,则x 与y 不相关,r =1或r =-1时,x 与y 为完全线性相关.
类型一.独立性检验
例1:为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:
判断性别与是否喜欢数学课程有关吗?
用独立性检验方法判断父母吸烟对子女是否吸烟有影响.
类型二.变量间的相关关系及线性回归方程
例2:下列关系中,是带有随机性相关关系的是______. ①正方形的边长与面积之间的关系; ②水稻产量与施肥量之间的关系;
③人的身高与年龄之间的关系;
④降雪量与交通事故的发生率之间的关系.
例3:某工业部门进行一项研究,分析该部门的产量与生产费用的关系,从这个工业部门内随机抽选了10个企业作样本,资料如下表:
练习1:下列两个变量之间的关系哪个不是函数关系( ) (A)角度和它的余弦值 (B)正方形边长和面积
(C)正n 边形的边数和顶点角度之和 (D)人的年龄和身高 类型三.相关检验与回归分析
例3:某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系.从这个工业部门内
完成下列问题:
(1)计算x 与y 的相关系数;
(2)对这两个变量之间是否线性相关进行相关性检验;
(3)设线性回归方程为ˆˆˆ,y
bx a =+求系数ˆˆ,.a b
试预测该运动员训练47次以及55次的成绩.
1.在调查中学生近视情况中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )
A.期望与方差
B.排列与组合
C.独立性检验
D.概率
2.通过对2
χ统计量的研究,得到了若干临界值,当2
χ≤2.706时,我们认为事件A 与B ( ) A.有90%的把握认为A 与B 有关系 B.有95%的把握认为A 与B 有关系
C.没有充分理由说明事件A 与B 有关系
D.不能确定
3.下列关于2χ的说法中正确的是( )
A.2
χ在任何相互独立问题中都可以用来检验有关还是无关 B.2χ的值越大,两个事件的相关性就越大
C.2χ是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合
D.2
χ的观测值2
χ的计算公式为2
()
()()()()
n ad bc a b c d a c b d χ-=
++++
4.下列两个变量之间的关系是相关关系的是( ) A.角度和它的余弦值 B.正方形边长和面积 C.正n 边形的边数和顶点数 D.人的年龄和身高
5.由一组样本数据1122(,),(,),,(,n x y x y x )n y 得到的回归方程为ˆˆˆ,y
bx a =+下面说法不正确的是( )
A.直线ˆˆˆy
bx a =+必经过点(,)x y B.直线ˆˆˆy
bx a =+至少经过点1122(,),(,),,(,)n n x y x y x y 中的一个点
C.直线ˆˆˆy
bx a =+的斜率为1
22
1
()n
i i
i n
i
i x y nxy
x
n x ==--∑∑
D.直线ˆˆˆy
bx a =+和各点1122(,),(,),,(,)n n x y x y x y 的偏差平方和21
ˆˆ[()]n
i i
i y bx a =-+∑是该坐标平面上所有直线与这些点的偏差平方和中最小的直线
6.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下非优秀统计成绩,得到如下所示的列联表:
已知在全部105人中随机抽取1人,成绩优秀的概率为2
7,则下列说法正确的是( )
A .列联表中c 的值为30,b 的值为35
B .列联表中c 的值为15,b 的值为50
C .根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与班级有关系”
D .根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩与班级有关系”
7.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:
已知P (K 2≥3.841)≈0.05根据表中数据,得到
K 2=
50×(13×20-10×7)2
23×27×20×30
≈4.844.
则认为选修文科与性别有关系出错的可能性为________.
8.某数学老师身高176cm ,他爷爷、父亲和儿子的身高分别是173cm 、170cm 和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.
_________________________________________________________________________________ _________________________________________________________________________________
基础巩固
1.(2014重庆卷)已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得的线性回归方程可能是()
A.y^=0.4x+2.3 B.y^=2x-2.4
C.y^=-2x+9.5 D.y^=-0.3x+4.4
2.(2014湖北卷)根据如下样本数据:
得到的回归方程为y=bx+a,则()
A.a>0,b>0
B.a>0,b<0
C.a<0,b>0
D.a<0,b<0
3.(2014江西卷)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()
及格
20
32
A.成绩
B.视力
C.智商
D.阅读量
4.下列两个变量之间的关系是相关关系的是()
A.正方体的棱长和体积
B.角的弧度数和它的正弦值
C.单产为常数时,土地面积和总产量
D.日照时间与水稻的亩产量
5.(2015福建)为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,
得到如下统计数据表:
根据上表可得回归直线方程ˆˆˆy
bx a =+,其中ˆˆˆ0.76,b a y bx ==-,据此估计,该社区一户收入为15万元家庭年支出为( )
A.11.4万元
B.11.8万元
C.12.0万元
D.12.2万元
6.“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时,由高尔顿提出的.他的研究结果是子代的平均身高向中心回归.根据他的结论,在儿子的身高y 与父亲的身高x 的回归方程
ˆˆˆy
a bx =+中,ˆ
b ( ) A.在(-1,0)内
B.等于0
C.在(0,1)内
D.在[1,+∞)
7.线性回归方程ˆˆˆy
a bx =+中,回归系数ˆ
b 的含义是________________. 8.在一项打鼾与患心脏病是否有关的调查中,共调查了1978人,经过计算2
χ=28.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(填“有关”、“无关”)
能力提升
1.下列说法:
①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;
②设有一个线性回归方程y ^
=3-5x ,变量x 增加1个单位时,y 平均增加5个单位;
③设具有相关关系的两个变量x ,y 的相关系数为r ,则|r |越接近于0,x 和y 之间的线性相关程度越强;
④在一个2×2列联表中,由计算得K 2的值,则K 2的值越大,判断两个变量间有关联的把握就越大.
其中错误的个数是( ) A.0
B.1
C.2
D.3
2.已知x 与y 之间的几组数据如下表:
假设根据上表数据所得线性回归直线方程y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )
A.b ^
>b ′,a ^
>a ′
B.b ^>b ′,a ^
<a ′ C.b ^
<b ′,a ^
>a ′
D.b ^
<b ′,a ^
<a ′
3.对相关系数r ,下列说法正确的是( ) A.||r 越大,相关程度越小
B.||r 越小,相关程度越大
C.||r 越大,相关程度越小,||r 越小,相关程度越大
D.||r≤1且||r越接近1,相关程度越大,||r越接近0,相关程度越小
4.
若由资料知,y对x呈线性相关关系,试求:
(1)线性回归方程;
(2)估计设备的使用年限为10年时,维修费用约是多少?
5.
若由资料可知y对x呈线性相关关系,试求:
(1)线性回归直线方程;
(2)根据回归直线方程,估计使用年限为12年时,维修费用是多少?
6.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为思心脏病而住院的男性病人中有175人秃顶,利用独立性检验方法判断秃顶与患心脏病是否有关系?
课程顾问签字: 教学主管签字:。

相关文档
最新文档