11.4回归分析与独立性检验-PPT文档资料
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A
版
数
学
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计 a+c b+d a+b+c+d
第十一章 统计与概率
在 2×2 列 联 表 中 , 随 机 变 量 k2 =
(a+b)(cn+(add-)(ab+c)c2)(b+d),其中 n=a+b+c+d 为样本容量, 人
教
用 k2 的取值范围可以判断“X 与 Y 有关系“的可信度,临
分布从整体上看大致在一条直线附近,我们就称这两个变 量之间具有线性相关关系,这条直线叫做回归直线.
第十一章 统计与概率
②回归直线方程的求法——最小二乘法. 设具有线性相关关系的两个变量 x、y 的一组观察值为(xi,
yi)(i=1,2,…,n),则回归直线方程^y=^a+^bx 的系数为
n
第十一章 统计与概率
3.回归分析 (1)回归分析 对具有相关关系的两个变量进行统计分析的方法叫回 归分析.通俗地讲,回归分析是寻找具有相关关系的两个 人
教 A
变量的非确定性关系的某种确定性,其基本步骤是:①画 版 数
散点图,②求回归直线方程,③用回归直线方程作预报. 学 (2)回归直线方程的求法 ①回归直线:观察散点图的特征,如果散点图中点的
(2)利用回归直线可以对总体进行估计
(3)线性相关强度的检验:
n
(xi- x )(yi- y )
i=1
r=
人 教
n
n
A
(xi- x )2· (yi- y )2
版 数
i=1
i=1
学
n
xiyi-n x ·y
i=1
=
叫做 y 与 x 间的相
n
n
(x2i -n x 2)(y2i -n y 2)
i=1
i=1
关系数.简称相关系数.
第十一章 统计与概率
r具有以下性质:|r|≤1,并且|r|越接近1,线性相关程
度越强;|r|越接近0,线性相关程度越弱.r>0表明两变量
正相关,r<0表明两变量负相关.
n
(yi-y^ i)2
人 教 A
i=1
版
(4)相关指数 R2=1-
,R2 越接近于 1,模
数 学
不同点:函数关系是一种确定的因果关系,是两个非
随机变量的关系.相关关系是一种非确定的关系,是非随 人 教
A
机变量与随机变量的关系或两个随机变量之间的关系. 版
数
2.两个变量的线性相关
学
(1)散点图
将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直 角坐标系中,表示两个变量关系的一组数据的图形叫做散
第十一章 统计与概率
① 当 k>10.828 时 , 有 99.9% 的 把 握 认 为 “ X 与 Y 有 关
系”.
② 当 k>7.879 时 , 有 99.5% 的 把 握 认 为 “ X 与 Y 有 关
系”.
人
教
A
③当k≤3.841时,认为没有充分的证据显示“X与Y有关
版 数
系”.
学
(3)利用随机变量k2来确定是否能以一定把握认为“两
分析:描点可画出散点图,观察散点图中的点大致分
布在一条直线附近,则线性相关.
第十一章 统计与概率
解析:(1)散点图如下:
人 教 A 版 数 学
n
xiyi-n x ·y (xi- x )(yi- y )
人 教 A 版
i=1 ^b=
i=1
=
数 学
nnຫໍສະໝຸດ x2i -n x 2
(xi- x )2
i=1
i=1
^a= y -^b x
其中
x
=n1
n
xi,
i=1
y
=n1
n
yi,
i=1
(
x
,
y
)称作样本点的中心.
第十一章 统计与概率
数 学
④按一般规则估计回归方程中的参数.(如最小二乘法) ⑤得出结果后分析残差图有否异常,若存在异常,则 检查数据是否有误,模型是否恰当.
第十一章 统计与概率
4.独立性检验
(1)变量的不同“值”表示个体所属的不同类别,这些
变量称为分类变量.
(2)两个分类变量X与Y的频数表,称作2×2列联表.
人 教
点图.
第十一章 统计与概率
(2)正相关、负相关
散点图中各点散布的位置是从左下角到右上角的区域,
即一个变量的值由小变大时,另一个变量的值也由小变大,人 教
A
这种相关称为正相关.
版
数
散点图中点散布的位置是从左上角到右下角的区域, 学
即一个变量的值由小变大时,另一个变量的值由大变小,
这种相关称为负相关.
第十一章 统计与概率
11.4 回归分析与独立性检验
人 教 A
版
数
学
第十一章 统计与概率
1.变量间的相关关系
(1)相关关系
一个变量变化时,另一个变量也随之发生变化,但其
取值带有一定的随机性,这样两个变量之间的关系叫做相
人
关关系.
教
A
版
数
学
第十一章 统计与概率
(2)相关关系与函数关系的异同点
相同点:两者均是指两个变量的关系.
证据说明“X与Y有关系”.
误区警示
1.线性回归方程中的系数a、b及相关指数k2公式复杂
莫记混用错.
第十一章 统计与概率
[例1] 下面是水稻产量与施化肥量的一组观测数据:
施化肥量 15 20 25 30 35 40 45
人
教
A
水稻产量 320 330 360 410 460 470 480
版 数
学
(1)将上述数据制成散点图; (2)你能从散点图中发现施化肥量与水稻产量近似成什 么关系吗?水稻产量会一直随施化肥量的增加而增长吗?
A 版
数
界值如表.(其中频数 a、b、c、d 都不小于 5)
学
P(k2≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
个分类变量有关系”的方法,称作对这两个分类变量的独
立性检验.
第十一章 统计与概率
(4)独立性检验的步骤:
①据实际问题需要的可信度确定临界值k0.
②利用公式,由观测数据,求出k2的观测值k.
人 教
A
③作判断,如果k≥k0,就以(1-P(k2≥k0))×100%的把
版 数
握认为“X与Y有关系”,否则就说样本数据没有提供充分 学
n
(yi- y )2
i=1
型的拟合效果越好. 在含有一个解释变量的线性回归模型中,R2恰好等于
相关系数r的平方.
第十一章 统计与概率
(5)建立回归模型的基本步骤:
①确定研究对象,明确解释变量和预报变量.
②画出散点图,观察它们是否存在相关关系.(如线性
相关关系)
人 教
A
版
③确定回归方程类型.(如线性回归方程y^ =b^x+a^)