第10章 相关与回归分析_PPT幻灯片
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
170
47
173
42
160
44
155
41
173
47
188
50
178
47
183
46
180
49
165
43
166
44
1891
500
Xy 7990 7266 7040 6355 8131 9400 8366 8418 8820 7095 3174 86185
x2 28900 29929 25600 24025 29929 35344 3684 33489 32400 27225 28561 326081
2. 计算检验统计量
0.8012
t
4.017
1 (0.8012 )2
11 2
n 2 11 2
3. 确定 P 值下结论(根据 t 值或查附表 11 r 界值表)
t=4.017>t0.05(9)=3.69,按 =0.05 水准拒绝 Ho,…
五、总体相关系数的区间估计(了解)
必须先对 r 作 z 变换
直线相关
相关 ---- 变量间的互依关系
直 线 相 关 (linear correlation) : 简 单 相 关 (simple correlation),用于双变量正态分布资料。
图10-2 相关系数示意图
散点呈椭圆形分布,
X、Y 同时增减---正相关
(positive correlation);
长之间的相关系数。
解:由例 10-1 已算得,
lXX
x2 ( x)2 326081 1891 2 1000 .909
n
11
lXY
xy
(
x)(
n
y)
86185
1891 500 11
230 .455
lYY =82.727
按公式 r
230 .455
0.8012
1000 .999 82.727
实例
例 10-3 有人研究了温度对蛙的心率的影响,得到表 10-2 中所示的资料,试进行回归分析。
对象 1 2 3 4 温度(x) 2 4 6 8 心率(y) 5 11 11 14
5 6 7 8 9 10 11 10 12 14 16 18 20 22 22 23 32 29 32 34 33
X: 自变量(independent variable);通常也称为“解释变量”(explanatory variable) 只有一个自变量,称简单回归(simple regression); 多个自变量,称多元回归(multiple regression)
X、Y 此增彼减---负相关
(negative correlation) 。
散点在一条直线上,
X、Y 变化趋势相同----
完全正相关;
反向变化----完全负相关。
非线性相关
图10-2 相关系数示意图
X、Y 变化互不影响----零
相关(zero correlation)
一、 相关系数概念
相关系数(correlation coefficient),又称积差 相 关 系 数 ( coefficient of product – moment correlation),或 Pearson 相关系数(软件中常 用此名称)
变量间关系问题:年龄~身高、肺活量~体重、药物剂 量与动物死亡率等。
两种关系:
依存关系:应变量(dependent variable) Y 随自变量 (independent variable) X变化而变化。
—— 回归分析
互依关系: 变量Y与变量 X间的彼此依赖关系 。
—— 相关分析
内容:
线性相关 线性回归
六、进行线性相关的注意事项
• 1、相关系数ρ>0表示正相关,相关系数ρ<0表示
负相关,相关系数ρ=0表示无线性相关,并不表 示没有任何关系。 • 2、资料要求双变量正态分布。 • 3、对相关系数要做假设检验 • 4、相关未必有真联系,两变量间相关关系是一种 共变关系,不一定就代表因果关系。 • 5、分层资料别盲目合并
三、 相关系数的计算
• 例10.1 从男青年总体中随机抽取11名男青年
组成样本,分别测量每个男青年的身高和前臂长, 测量结果如表10-1所示,试计算身高与前臂长之 间的相关系数。
表10-1 12名男青年身高与前臂长的测量结果
编号 1 2 3 4 5 6 7 8 9 10 11
合计
身高(x) 前臂长(y)
y2 2209 1764 1936 1681 2209 2500 2209 2116 2401 1849 2116 22810
前臂长(cm)
散点图
50 45 40 35
150 155 160 165 170 175 180 185 190 身高(cm)
图 10-1 11名男青年身高与前臂长散点图
例10.1 就 10-1 资料(见表 7-1)试计算身高与前臂
z tanh1 r 或 z 1 ln (1 r)
2 (1 r)
r tanh z
或
e2z 1 r
e2z 1
公式中 tanh 为双曲正切函数;tanh-1 为反双曲正切函数,
r 的取值范围 -1<r<1,相应的 z 值范围 -∞< z < +∞。
按正态近似原理,z 的 1- 可信区间为:
(z u/2 n 3 , z u/2 n 3 )
Y: 因变量(dependent variable);通常也称为“反应变量”(response variable)
散点图
心率
40 30 20 10
0 0
ห้องสมุดไป่ตู้
5
10
15
20
图10-3 温度与蛙的心率之间关系的散点图
X
25 温度
直线回归
函数关系: 确定。例如园周长与半径:y=2πr 。 回归关系:不确定。例如血压和年龄的关系,称为直线回
说明相关的密切程度和方向的指标。
r ——样本相关系数
二、相关系数的意义
r X X Y Y lXY X X 2 Y Y 2 lXlX YY
r无单位,-1 ≤ r ≥ 1。r 值为正 ——正相关, 为负 ——负相关;
(与后面回归系数b的符号相同)
|r|=1 --- 完全相关, |r|=0 --- 零相关。
四、相关系数的假设检验
r≠0原因:① 由于抽样误差引起,ρ=0 ② 存在相关关系, ρ≠0
公式 t r 0 = r
,υ=n-2
Sr
1 r2
n2
Sr---- 相关系数的标准误
例 10-1 资料,身高与前臂长之间是否有直线相关关系。
解:1. 建立假设并确定检验水准
H0: =0;H1: ≠0; =0.05。