相关分析与回归分析PPT优秀课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11
2 xy
(xx)(yy) ;
n
x
(xx)2
n ;y
(yy)2 n
去掉n,公式如下:
__ __
r2xy
(x-x)(y-y)
xy
__
__
(x-x)2 (y-y)2
r
( X X )( Y Y ) l XY
( X X )2 (Y Y )2
l XX lYY
l XY ( X X )( Y Y ) l XX ( X X ) 2 lYY (Y Y ) 2
相关分析与回归分析PPT优秀 课件
第一、二节 - 相关分析概述 -相关关系测定
变量间关系
血压 ~ 年龄 动物死亡率 ~ 毒物剂量 体重~身高 肺活量~体重
相关: 血压和年龄关联的程度如何? 动物死亡率与毒物剂量关联的程度如何?
回归: 人群中,平均而言, 血压 如何随年龄变化? 毒性实验中, 动物死亡率如何随剂量变化?
一、一元线性回归理论模型
• 一元线性回归模型是用于分析一个自变量x与一个因变量y 之间线性关系的数学方程,在变量x与y的直角坐标平面上, 可以绘制散点图,可以看出所有的散点大致呈线性关系
y0 1x or
y abx
• 在一元线性回归之中,因变量由两个部分组成,一 个是 0 1x,其解释了自变量x变动引发的线性 变化。
Pearson’s 乘积-矩线性相关系数:
“两个标准化变量之乘积” 的总体平均
---- 简单相关系数(simple correlation coefficient)
E[( X
x
Y )(
y
)]
11
x
y
E[
(Xx)(Yy)]
2 xy
xy
xy
xy E[( X x )(Y y )] -- X 和 Y 的总体协方差
式中:
y 时间序列中各期实际值
y 趋势线求出的趋势值
观察方法: 散点图或分配数量规律观察
(一)Fra Baidu bibliotek线方程
• 适用条件:现象发展的各期逐期增长量大体相等。
年份 粮食产量 逐期增长量
1990 1991 1992 1993 1994 1995 1996 1997 100 112 125 140 155 168 180 194 -- 12 13 15 15 13 12 14
为了求 S的最小值,要求 S对于 a、b的两个偏导数,并令其 为0.
S b
2
(y
a
bx)x
0
S a
2
(y
a
bx)
0
将上式整理得出求解参 数a、b的方程组:
na b x y
a
x
b
x2
xy
求方程组:
b
n xy x y n x2 ( x)2
a y b x
n
n
b求出来都代入到a公式里面
收缩压
散点图
舒张压
Fig. 7.1 收缩压和舒张压 (mmHg) (665 名 6 至 10 岁女孩)
Y 和 X之间的函数关系
指数函数
对数函数
正弦函数
对应于给定的 X值, 相应的Y 值是确定的.
三、相关关系P177 correlation coefficient
相关系数是度量两个变量之间线性相关的方向和
例 - 某省1991~1998年人口资料如表所示,要求拟合时点的趋势方程,并
以此趋势预测1999年末的人口数。
n=8
y 8763
根据上述公式:
bnnxxy2(xx)2y 83289210448336627242777.68
aybx 7242777.8636870.832
n
n8
8
so: yabx870.83277.68x
强度的测度,常用的度量指标是皮尔逊(Pearson)
相关系数
__ __
r2xy
(x-x)(y-y)
xy
__
__
(x-x)2 (y-y)2
【专栏】在相关分析中,定性分析或经济理论分析重要吗?
相关系数(Correlation Coefficient)
1.总体相关系数(Population correlation coefficient)
• 另一部分为剩余变动 ,反映了不能为自变量x和 因变量y之间的线性关系所解释的其他剩余变动。
• 最小平方法 OLS
是测定长期趋势最常用的的方法。它是通过建立数学方程,
对元时间序列配合一条较为理想的趋势线,使得原序列中的各
实际值和趋势值的离差平方最小。一般最小平方法的统计表达
式是:
2
(yy) 最小值
度量线性关系的强度和方向:
1r1
1) r =0
-- 无线性关系, 或很弱
2) 若绝对值较大
-- 线性关系较强
3) 符号正负
-- 线性关系的方向
4) +1 or -1 -- 完全相关, 实践中少见
P181
No. 父亲身高, X 儿子身高, Y
No. 父亲身高, X 儿子身高, Y
1
234
5
6
7
8
9
1998 206 12
直线方程公式表示为:
趋势值
y a bx
式中a— ,纵轴截b距 —直 ,线的斜率。
即 上述直线方程式中,a、b为两个未定参数,根据最小平方法的要求
( y y )2 最小值的要求,将 y a bx代入,即:
S ( y y)2 ( y a bx)2 最小值
lXY (XX)Y (Y)10.4 59 lXX (XX)218.2 59 lYY (YY)269.585
r lxy 10.549 0.9296 lxlxyy 18.52969.585
例子8-1 P180
第三节 一元线性回归分析
第三节 一元线性回归分析
回归分析实质就是通过建立数学方程,研究因变 量与自变量之间的变动关系,如果分析一个自变 量与一个因变量的线性关系,称为一元线性回归 分析,如果分析两个或两个以上的自变量与一个 因变量的线性关系,则称为多元线性回归。
将1999年时间序列号9带入配合的趋势方程,可得到1999年末某省人 口数的趋势值(预测值)
y a b x 87 .80 2 73 .6 7 8 9 94 .9(0 万 42 ) 人
既,1999年末该省人口数将达到9402.94万人。
例子 8-2 P184
10
150 153 155 158 161 164 165 167 168 169
159 157 163 166 169 170 169 167 169 170
11
12 13 14
15 16
17 18 19
20
170 171 172 174 175 177 178 181 183 185
173 170 170 176 178 174 173 178 176 180