变量间的相互关系
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ˆ b
( x x)( y y) x y n x y
i 1 i i
n
n
( x x)
i 1 i
n
2
i 1 n
i
i
x
i 1
2 i
nx
2
,
ˆx ˆ y b a
例1:观察两相关变量得如下表:
x y
解:
-1 -9
-2 -7
-3 -5
-4 -3
-5 -1
(2)当x=5时, y=30.3676≈30.37。
小结
1、现实生活中存在许多相关关系:商品销售与 广告、粮食生产与施肥量、人体的脂肪量与年 龄等等的相关关系. 2、通过收集大量的数据,进行统计,对数据 分析,找出其中的规律,对其相关关系作出 一定判断. 3、由于变量之间相关关系的广泛性和不确定 性,所以样本数据应较大,才有代表性.才能对 它们之间的关系作出正确的判断.
25 脂肪含量
如图:
20 15 10 5 年龄
O
20 25 30 35 40
45 50 55 60 65
我们再观察它的图像发现这些点大致分布在一条 直线附近,像这样,如果散点图中点的分布从整体上看 大致在一条直线附近,我们就称这两个变量之间具有 线性相关关系,这条直线叫做回归直线,该直线叫回归 直线方程。 脂肪含量
Ù
= bx + a
7.回归方程被样本数据惟一确定,各样本点 大致分布在回归直线附近.对同一个总体, 不同的样本数据对应不同的回归直线,所以 回归直线也具有随机性.
8.对于任意一组样本数据,利用上述公式都 可以求得“回归方程”,如果这组数据不具 有线性相关关系,即不存在回归直线,那么 所得的“回归方程”是没有实际意义的.因此, 对一组样本数据,应先作散点图,在具有线 性相关关系的前提下再求回归方程.
O
相关关系与函数关系的异同点 (1)相同点:两者均是指两个变量的关系; (2)不同点:函数关系是一种确定的关系, 如匀速直线运动中时间t与路程s的关系; 相关关系是一种非确定的关系,如一块 农田的水稻产量与施肥量之间的关系,事 实上,函数关系是两个非随机变量的关系, 而相关关系是非随机变量与随机变量的关 系。
探究:
年龄 23 27
.
39
41
45
49 5053Leabharlann 545657
58
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6 30.2 31.4 30.8 33.5 年龄 60 61
脂肪 35.2 34.6
如上的一组数据,你能分析人体的脂肪含量与年龄 之间有怎样的关系吗?
从上表发现,对某个人不一定有此规律,但对很多个体 放在一起,就体现出“人体脂肪随年龄增长而增加”这 一规律.而表中各年龄对应的脂肪数是这个年龄人群的样 本平均数.我们也可以对它们作统计图、表,对这两个变 量有一个直观上的印象和判断. 下面我们以年龄为横轴, 脂肪含量为纵轴建立直 40 角坐标系,作出各个点,35 称该图为散点图。 30
热饮杯数 156 150 132 128 130 116 104 89 93 76 54
(1)画出散点图;
(2)从散点图中发现气温与热饮销售杯数之间关系的一
般规律; (3)求回归方程; (4)如果某天的气温是 C,预测这天卖出的热饮杯数。
解: (1)散点图
160 150 140 130 120 110 100 90 80 70 60 50 40 -10 0
第二步,求和
第三步,计算 b i1
x y , x ( x x )( y y ) x y nx y
2
n
n
i 1 n
i
i
i 1
i
n
i
i
2 ( x x ) i i 1
n
i 1 n
i i
2 2 x nx i i 1
, a y bx
第四步,写出回归方程 y
D.铁的大小与质量
4. 回归方程^ y=1.5x-15,则( A )
A. y=1.5 x-15 B. 15是回归系数a
C. 1.5是回归系数a
D. x=10时,y=0
(x, y) 5.线性回归方程^ y=bx+a过定点________.
6.下表是某地的年降雨量与年平均气温, 判断两者是相关关系吗?求回归直线方程 有意义吗?
年平均气温 12.51 12.84 12.84 13.69 13.33 12.74 13.05 (°C) 748 542 507 813 574 701 432 年降雨量 (mm)
由散点图看出, 求回归直线方 程无实际意义。
7.某市近10年的煤气消耗量与使用煤气户 数的历史资料如下:
年份
1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
i
x
i 1
10
i
110 , xi
i 1
y
i
110
b
x y 10x y
i 1 10
x
i 1
2 i
10 x
2
110 10 0 1 110 10 0
a y b x 0 b 0 0
∴所求回归直线方程为 ^ y=x
小结:求线性回归直线方程的步骤: 第一步:列表 x , y , x y ;
5 1
3 5
4 3
2 7
1 9
求两变量间的回归方程
列表:
i 1 -1 -9
i
x y xy
i
2 -2 -7 14
3 -3 -5 15
4 -4 -3 12
5 -5 -1 5
6 5 1 5
2
7 3 5 15
8 4 3 12
10
9 2 7 14
10 1 9 9
i
i
9
计算得:
10 i
x 0, y 0
i i i i
第二步:计算
x, y, xi , xi y
2 i 1 i 1
n
n
i
;
第三步:代入公式计算b,a的值;
第四步:写出直线方程。
例2:有一个同学家开了一个小卖部,他为了研究气温对热 饮销售的影响,经过统计,得到一个卖出的热饮杯数与当 天气温的对比表:
摄氏温度 -5 0 4 7 12 15 19 23 27 31 36
下列两个变量之间的关系,哪个不是相关关系
A、粮食的产量与施肥量
B、商品的销售收入和广告支出经费
C、人的年龄和身高 D、正方形的边长和面积 E、作文水平和课外阅读量 F、降雪量和交通事故的发生率
具有相关关系
不具有相关关系
如何分析变量之间是否具有相关的关系
分析变量之间是否具有相关的关系,可 以借助日常生活和工作经验对一些常规问 题来进行定性分析,如儿童的身高随着年 龄的增长而增长,但它们之间又不存在一 种确定的函数关系,因此它们之间是一种 非确定性的随机关系,即相关关系。但仅 凭这种定性分析不够;
由表中数据可以看出,y有随x增加 而增加的趋势,并且增加的趋势变缓。 为了更清楚地看出x与y是否有相关 关系,我们以年收入x的取值为横坐标,
把年饮食支出y的相应取值作为纵坐标,
在直角坐标系中描点。这样的图形叫做
散点图。
y
从这个散点图发现:家庭年收入和年饮食支出之 x 间具有相关关系。并且当年收入的值由小变大时, 年饮食支出的值也在由小变大。点的位置散布在 从左下角到右上角的区域。称它们成正相关。
如果一个变量的值由小变大时,另一个变量 的值由大变小,它们的点散布在从左上角到右下 角的区域内。这种相关称作负相关。如下图所示:
如高原含氧量与海拔高度 的相关关系,海平面以上, 海拔高度越高,含氧量越少。 作出散点图发现,它们散 布在从左上角到右下角的区 域内。又如汽车的载重和汽 车每消耗1升汽油所行使的 平均路程,称它们成负相关.
1 6 1.2 7 1.6 9.8 1.8 12 2 2.5 3.2 20 4 24 4.2 4.5
x用户(万 户)
y (百万立 方米)
12.1 14.5
25.4 27.5
(1)求回归方程; (2)若市政府下一步再扩大5千煤气用户, 试预测该市煤气消耗量将达到多少.
解:(1)画散点图并求回归方程
^ y=6.0573x+0.0811
一来定性分析有时会给我们以误导; 二来 定性分析无法确定变量之间相互影响的程度 有多大。因些,我们还需要进行定量分析。
如何进行定量分析呢?由于变量间的相 关关系是一种随机关系,因此,我们只能借 助统计这一工具来解决问题,也就是通过收 集大量数据,在对数据进行统计分析的基础 上,发现其中的规律,并对它们之间的关系 作出推断。
2. 有关线性回归的说法,不正确的是( D ) A. 相关关系的两个变量不是因果关系 B. 散点图能直观地反映数据的相关程度
C. 回归直线最能代表线性相关的两个变量 之间的关系 D. 任一组数据都有回归方程
3.下面哪些变量是相关关系( C ) A.出租车费与行驶的里程
B.房屋面积与房屋价格
C.身高与体重
热饮杯数
温度
10 20 30 40
(2)气温与热饮杯数成负相关,即气温越高, 卖出去的热饮杯数越少。
(3)从散点图可以看出,这些点大致分布 在一条直线附近。
160 150 140 130 120 110 100 90 80 70 60 50 40 -10 0 10 20 30 40
(3)
b
x y nx y
2.3 变量间的相互关系
一、变量之间的相关关系 变量与变量之间的关系常见的有两类: 一类是确定性的函数关系,像正方形的边 长a和面积S的关系,另一类是变量间确实 存在关系,但又不具备函数关系所要求的 确定性,它们的关系是带有随机性的。 人的身高并不能确定体重,但一般来说 “身高者,体也重”,因此身高与体重这 两个变量具有相关关系.
40 35
30
25 20 15 10 5 年龄 20 25 30 35 40 45 50 55 60 65
0
最小二乘法:
求 ( yi a bxi )
i 1
n
2
为最小的方法.
利用配方法求得:
用方程 y b x a 来表示.
在一般统计书中习惯用b表示一次项 系数,用a表示常数项,这正好与我们表示的 一次函数习惯相反.
4.对于两个变量之间的关系,有函数关系 和相关关系两种,其中函数关系是一种确 定性关系,相关关系是一种非确定性关系.
5.散点图能直观反映两个相关变量之 间的大致变化趋势,利用计算机作散点 图是简单可行的办法. 6.一般情况下两个变量之间的相关关系 成正相关或负相关,类似于函数的单调 性.
3.求样本数据的线性回归方程,可按 下列步骤进行: 第一步,计算平均数 x , y
i 1 n i i
n
x
i 1
2 i
nx
2
=-2.352
a y b x
^
=143.767
y=-2.352x+147.767
^ (4)当x=2时,y=143.063, 因此,这天大 约可以卖出143杯热饮。
练习题 1.下列说法正确的是( D ) (A)y=2x2+1中的x,y是具有相关关系的 两个变量 (B)正四面体的体积与其棱长具有相关 关系 (C)电脑的销售量与电脑的价格之间是 一种确定性的关系 (D)传染病医院感染“非典”的医务人 员数与医院收治的“非典”病人数是具有 相关关系的两个变量
从散点图上可以看出,如果变量之间存 在着某种关系,这些点会有一个集中的大 致趋势,这种趋势通常可以用一条光滑的 曲线来近似描述,这种近似的过程称为曲 线拟合。在两个变量x和y的散点图中,所 有点看上去都在一条直线附近波动,则称 变量间是线性相关的。此时,我们可以用 一条直线来拟合(如图),这条直线叫回 归直线。
自变量取值一定时,因变量的取值带 有一定随机性的两个变量之间的关系叫 相关关系。 怎样判断两个变量有没有相关关系 设某地10户家庭的年收入和年饮食支出 的统计资料如下表: (单位:万元)
年收入 2 4 4 6 6 6 7 7 8 10 饮食支出 0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3