相关性、最小二乘估计、回归分析与独立性检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(xi -x)(yi -y)
i=1
n
n
(xi -x)2 (yi -y)2
i=1
i=1
n
xiyi -n x y
=
i=1
.
n xi2 -nx2 n yi2 -n y2
i=1
i=1
②当r>0时,称两个变量___正__相__关____. 当r<0时,称两个变量___负__相__关____. 当r=0时,称两个变量__线__性__不__相__关___. r的绝对值越接近于1,表明两个变量之间的线性相关程度越 高;r的绝对值越接近于0,表明两个变量之间的线性相关程度 越低.
中的一个点;
()
n
xiyi -nxy
③直线y=a+bx的斜率
b=
i=1 n
x
2 i
-n
x
2
;
()
i=1
④直线y=a+bx和各点(x1,y1),(x2,y2),…,(xn,yn)的偏
差
n
[yi-(bxi+a)]2
是该坐标平面上所有直线与这些点的偏差
i=1
中最小的.
()
(2)已知回归方程y=4.4x+838.19,则可估计x与y的增长速度
第三节 相关性、最小二乘估计、回归分析与 独立性检验
点击进入相应模块
三年ห้องสมุดไป่ตู้考 高考指数:★★★ 1.会作两个有关联变量的数据的散点图,并利用散点图认识变 量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公 式建立线性回归方程(不记公式). 3.了解独立性检验的基本思想、方法及其初步应用. 4.了解回归分析的基本思想、方法及其简单应用.
B
A
B1
B2
总计
A1
a
b
a+b
A2
c
d
c+d
总计
a+c
b+d
n=a+b+c+d
(2)独立性判断方法 选取统计量___2_=_(_a+_b_)_(n_c+(_ad_d)_-(ba_c+_)c_2)_(b_+_d_)____,用它的大小来检验
变量之间是否独立. ①当χ2__≤__2_._7_0_6__时,没有充分的证据判定变量A,B有关联,
称变量间是不相关的.
【即时应用】 (1)思考:相关关系与函数关系有什么异同点? 提示:相同点:两者均是指两个变量的关系. 不同点:①函数关系是一种确定的关系,相关关系是一种非确 定的关系.②函数关系是一种因果关系,而相关关系不一定是因 果关系,也可能是伴随关系.
(2)判断下列各关系是否是相关关系.(请在括号内填“是”或
(3)线性相关:若在两个变量x和y的散点图中,所有点看上去 都在__一_条__直__线___附近波动,则称变量间是线性相关的.此时, 我们可以用__一__条__直__线___来近似. (4)非线性相关:若散点图上所有点看上去都在_某__条__曲__线___ _(_不__是__一__条__直__线__)_附近波动,则称此相关为非线性相关.此时, 可以用__一__条__曲__线___来拟合. (5)不相关:如果所有的点在散点图中_没__有__显__示__任__何__关__系__,则
“否”)
①路程与时间、速度的关系;
()
②加速度与力的关系;
()
③产品成本与产量的关系;
()
④圆周长与圆面积的关系;
()
⑤广告费支出与销售额的关系.
()
【解析】①②④是确定的函数关系,成本与产量,广告费支出 与销售额是相关关系. 答案:①否 ②否 ③是 ④否 ⑤是
2.回归直线方程与相关系数 (1)最小二乘法 如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达 式来刻画这些点与直线y=a+bx的接近程度: __[__y_1-_(_a_+_b_x_1_)_]__2_+_[__y_2-_(_a_+_b_x_2_)_]__2_+_…__+_[__y_n-_(_a_+_b_x_n_)_]__2_.____ 使得上式达到__最__小__值___的直线y=a+bx就是我们所要求的直线 ,这种方法称为最小二乘法.
(2)x与y的增长速度之比即约为回归方程的斜率的倒数
1 10 5 . 4.4 44 22
答案:(1)①× ②× ③√ ④√ (2)
5
22
3.独立性检验
(1)2×2列联表
设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,
A2= A1 ;变量B:B1,B2= B1,通过观察得到如表所示的数据:
【即时应用】
(1)由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回 归直线方程y=a+bx,判断下面说法是否正确.(请在括号内打
“√”或“×”)
①任何一组观测值都能得到具有代表意义的回归直线方程;
()
②直线y=a+bx至少经过点(x1,y1),(x2,y2),…,(xn,yn)
之比约为_________.
【解析】(1)任何一组观测值都能利用公式得到直线方程,但
这个方程可能无意义,①不正确;回归直线方程y=bx+a经过
样本点的中心 (x,y可),能不经过(x1,y1),(x2,y2),…, (xn,yn)中的任何一点,这些点分布在这条直线附近,②不正 确;③正确;④正确.
1.线性回归方程的建立及应用和独立性检验的应用是考查重点 ; 2.题型以选择题和填空题为主,主要是求线性回归方程的系数 或利用线性回归方程进行预测,在给出临界值的情况下判断两 个变量是否有关.
1.相关性 (1)散点图:在考虑两个量的关系时,为了对_变__量__之间的关系 有一个大致的了解,人们通常将___变__量__所__对__应___的点描出来, 这些点就组成了变量之间的一个图,通常称这种图为变量之间 的散点图. (2)曲线拟合:从散点图上可以看出,如果变量之间_存__在__着__某__ _种__关__系___,这些点会有一个_集__中__的大致趋势,这种趋势通常可 以用一条_光__滑__的__曲__线__来近似,这种近似的过程称为曲线拟合.
(2)线性回归方程
假设样本点为(x1,y1),(x2,y2),…,(xn,yn),则
b=
x1y1+x2y2 +…+xn yn -nx
x12
+x
2 2
+…+x
n
2
-n
x
2
y
,a=
y-b
x.
直线方程y=a+bx称为线性回归方程,a、b是线性回归方程的
__系__数____.
(3)相关系数r
n
①
r=
lxy = lxxlyy
可以认为变量A,B是没有关联的; ②当χ2__>__2_._7_0_6__时,有90%的把握判定变量A,B有关联; ③当χ2___>__3_._8_4_1_时,有95%的把握判定变量A,B有关联; ④当χ2__>__6_._6_3_5__时,有99%的把握判定变量A,B有关联.