第十章线性相关与回归-68页精选文档

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 分析问题:总体-样本、 目的、变量、关系
30.03.2020
19
表10-1 11名男青年身高与前臂长的测量结果(cm)
编号
1 2 3 4 5 6 7 8 9 10 11 合计
身高(cm) (X) 170 173 160 155 173 188 178 183 180 165 166 1891
前臂长(cm) (Y) 47 42 44 41 47 50 47 46 49 43 44 500
➢ 第一节 线性相关 ➢ 第二节 线性回归 ➢ 第三节 相关与回归的关系 ➢ 第四节 等级相关 (自学)
30.03.2020
9
第一节 线性相关
30.03.2020
10
线性相关的掌握要点
线性相关描述了什么问题? 线性相关分析的具体步骤是什么? 线性相关分析对资料有什么要求? 如何对这些要求进行检查或检验? 仅用样本线性相关系数能否说明相关程度? 总体相关系数非常接近1,能否说明Y=X?
实例分析
• 健康调查发现男青年身高与他的前臂长有关; • 于是设想,通过测量男青年的身高,可以预测其
前臂长,以便更好对男青年的发育情况进行评价。 因此随机抽取了11名男青年组成样本,分别测量 每个人的身高和前臂长。见表10-1 • 问男青年的身高与前臂长之间的相关系数是多少? 是正相关还是负相关?
30.03.2020
13
线性相关的类型
X和Y伴随同时上升或伴随下降称为线性正相关 (Linear Positive Correlation)
X与Y的反方向伴随直线变化趋势称为线性负相关 (linear negative correlation)
X和Y无任何直线伴随变化趋势,则称为零相关 (零线性相关) 。
30.03.2020
14
★ 正相关 ★负相关 ★称零相关
★ 完全正相关 ★完全负相关
30.03.2020
15
线性相关系数
线性相关系数 (linear correlation coeffiecient) , 简称相关系数。或 Pearson相关系数
相关系数是描述两个变量之间线性相关的程度 和相关方向的统计指标。样本相关系数用 r 表示, 总体相关系数用ρ表示。
试问:为何说是单变量? 因为每种类型只牵涉一个变量。
30.03.2020
1
医学上,许多现象之间(即变量之间)都有相互联系,
例如:身高与体重、父亲身高与儿子身高、体温与脉搏、 产前检查与婴儿体重、乙肝病毒与乙肝等。 在这些有关系的现象中,它们之间联系的程度和性质也 各不相同。比如:
➢ 乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙 肝之间是因果关系;
发现:
30.03.2020
3
儿子身高(Y,英寸)与父亲身高(X,英寸) 存在线性关系:
Yˆ33.730.516X
即高个子父代的子代在成年之后的身高平均来 说不是更高,而是稍矮于其父代水平,而矮个子 父代的子代的平均身高不是更矮,而是稍高于其 父代水平。Galton将这种趋向于种族稳定的现象 称之“回归”。
➢ 有的现象之间因果不清,只是伴随关系,例如哥哥的身 高和弟弟的身高之间,就不能说有因果关系。
相关与回归就是用于研究和解释两个变量之间相互关系的。
30.03.2020
2
历史背景:
十九世纪英国人类学家 F.Galton首次在《自然 遗传》一书中,提出并阐明了“相关”和“相关 系数”两个概念,为相关论奠定了基础。其后, 他和英国统计学家 Karl Pearson对上千个家庭的身 高、臂长、拃长(伸开大拇指与中指两端的最大 长度)做了测量,并做成散点图。
30.03.2020
4
Regression 释义
210=1024
3来自百度文库.03.2020
5
30.03.2020
6
小插曲——F.Galton
Galton(1822-1911)是一位人类学家,著名生物 学家达尔文的表兄弟,早年学医,曾在剑桥大学念书。 尽管他的数学不是很好,但在人类学和优生学研究中 萌发的统计学思想,对生物统计的发展产生了深远影 响,如“回归”、 “双变量正态分布”的概念等。 他没有子女,但一生写了9部书,发表了近200篇论文。 1860年当选英国皇家学会会员,1909年被封为爵士, 1910年获得英国皇家学会Copley奖。
lxx (x 的离均差平方和 ) lyy (y 的离均差平方和 ) lxy (x和y的离均差乘积和,简称乘积和)
r (XX)(YY) lXY (XX)2(YY)2 lXXlYY
lXXX2
(X)2 n
lYY
Y2
(Y)2 n
( X) (Y)
lXY XY
n
30.03.2020
18
上一张 下一张 首 页 退 出
第2、第3、第5和第9章介绍了计量资料单变量的 统计描述与统计推断。比如:
计算140名成年男子红细胞数的平均指标与变异指 标。 ( X , S )
比较药物+饮食疗法(试验组)与仅药物疗法(对照组) 降低糖尿病人的空腹血糖值有无差别。 t 检验
研究白血病时,比较四组鼠脾DNA含量有无差别。
秩和检验
30.03.2020
7
Karl Pearson (英,1857~1936)是 Francis Galton 的得 意门生,他开创了统 计方法学。他对统计 学的主要贡献:变异 数据的处理、分布曲 线的选配、卡方检验 的提出、回归与相关 的发展。
30.03.2020
Karl Pearson
8
基本内容
30.03.2020
11
例:考察身高与体重的伴随关系
体重
散点图
身高
问题:通过散点图可以得出什么结论?
30.03.2020
12
线性相关的概念
图中不是每个身材较高的对象必有较重的体 重,但大多数对象的体重Y与其身高X的变化呈 一种伴随增大或减小的直线变化趋势,这种现象 称为直线相关 。
刻画两个随机变量之间线性相关程度称为 线性相关(linear correlation)
30.03.2020
16
相关系数的特点:
-1 ≤ r ≤ 1 r>0为正相关 r<0为负相关 r=0为零相关或无相关
|r| < 0.4 为低度线性相关; 0.4≤ |r| <0.7为中度线性相关; 0.7≤|r| <1.0为高度线性相关。
30.03.2020
17
相关系数的计算公式
相关文档
最新文档