回归分析首医大研究生2010

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

由父高推测子女身高的设想
影响子女身高y的因素: 基本生长规律、父母的身高x 个体差异(随机误差) 问题的模型化:回归分析模型 子高=基本生长+父母高作用+个体差异
2) 回归方程
回归研究目的是由自变量的信息去推断 因变量,并用直线方程来表示它们的线 性关系。 直线回归方程的一般表达式为
回归分析的数据基本格式
---------------------------------------------------------
3 做出推断 p<α,拒绝H0 ; p>α,不拒绝H0。
5 ) 回归系数的假设检验:t检验
建立假设 H0: β =0 H1: β≠ 0 α=0.05
回归系数的标准误与t统计量
得到P,做出推断 p<α,拒绝H0 ; p>α,不拒绝H0。
7) 直线回归图
若两变量间存在直线关系,在散点图上绘 上回归直线,形成直线回归图.
直线回归图的CHISS实现
1、进入数据模块 点击 数据→文件→ 数据→文件→打开数据库表 打开文件名为: 打开文件名为:b12-1.DBF →确认 确认 2、进入图形模块 进行绘图 点击 图形 统计图→曲线拟合 →确认 图形→统计图 统计图→ 确认 横轴: 纵轴:Y热量 横轴:X脂肪
9) 回归分析的条件
线性 独立 正态 等方差
10) 相关与回归的注意事项
1.相关与回归的关系
二者反映的是一个问题的两个角度 相关:关联程度 回归:数量关系 二者的基本结论一致 相关系数的假设检验与回归系数的假设 检验等价
2.回归系数与相关系数的关系(1)
r1>0, b1>0 r2>0, b2>0 r1<r2 , b1=b2
子代的平均身高没有比他们的父辈更低。
正因为子代的身高有回到父辈平均身高的 趋势,才使人类的身高在一定时间内相对 稳定,没有出现父辈个子高其子女更高, 父辈个子矮其子女更矮的两极分化现象。
这个例子说明了生物学中“种”的概念 的稳定性。正是为了描述这种有趣的现 象,Galton引进了“回归”这个名词来 描述父辈身高与子代身高的关系。 大自然界很多物种都有 “回归”. 人类社会如果出现两极分化,就会产出 动荡,矛盾,不稳定。
a1>0, b1>0 a2>0, b2>0 a1<a2 , b1>b2
回归方程与散点图的关系(三)
a1>0, b1>0 a2>0, b2>0 a1=a2 , b1>b2
回归方程与散点图的关系(四)
a1>0, b1>0 a2>0, b2>0 a1>a2 , b1=b2
4 ) 回归方程的检验
回归方程的抽样误差: 回归方程来自样本,存在抽样误差
变量x x1 x2 . . . xn 变量y y1 y2 . . . yn
问题
回归分析的任务: 在平面上怎么找最佳的直线? 实现的类似问题: 某地区有若干个房子, 现要修建一条直的 公路,怎样让大家都满意?
3) 参数的估计
采用最小二乘法原理: 所有实测点到回归直线的纵向距离平方 之和最小. 回归方程: 求解线性方程组,而得到最小二乘估计 系数b和a
观察研究
Galton观察了1078对夫妇,以每对夫妇的平 均身高作为x,取他们的一个成年儿子的身高 作为y,将结果在平面直角坐标系上绘成散点 图,发现趋势近乎一条直线。 计算出的回归直线方程为: Y^=33.73+0.516x, 这种趋势及回归方程表明父母平均身高x每增 加一个单位时,其成年儿子的身高y也平均增 加0.516个单位。
回归方程:Y^=-47.1170+0.5278*x
回归方程的基本含义
回归方程在坐标轴上的含义 a:截距 b: 斜率
回归方程的实际含义: 回归系数反映的是x每增加1个单位时y的增加 幅度;b越大,x对y的影响幅度越大。
回归方程与散点图的关系(一)
b>0
b<0
b=0
b=0
b=0
b=0
回归方程与散点图的关系(二)
肾脏体积计算公式: 经验公式: V=π/4*长*宽*高 公式怎样产生的? 公式怎样产生的?
a
c b
Βιβλιοθήκη Baidu
肾脏体积测量实验
实验的回顾 用20个肾脏标本,测量计录每 个体积及其长,宽,高的数据: 1 100 10 5 采用什么方法找规律呢? 2 110 10 6 回归方程的构造: 回归方程的构造 y = a+b*x 3 105 11 5
统计学应用的普适性
[回归分析应用典型统计案例1] 牛顿的自由落体运动 自由落体运动规律: 公式: h=1/2 g*t2 重力加速度常数 g=9.80665米/秒2 米秒 公式是怎样产生的? 公式是怎样产生的? 中学物理课实验的回顾> <中学物理课实验的回顾>
h
牛顿的自由落体运动实验
牛顿发现定律方法的探究
回归系数与相关系数的关系(2)
r1>0, b1>0 r2>0, b2>0 r1=r2 , b1>b2
3.回归应用中需注意的问题
适用范围 现在观测的范围即将来的应用范围,结 果不可无限推广. 回归反映的仅仅是两变的数量关系,不 能证明‘因果’,只可以作为‘因果’ 的证据
4.因果关系的判断
判断因果关系至少需要以下证据: 数量方面的关系 时间上的先后关系 条件消失,结果消失;条件重现,结果 重现 剂量反应关系 动物模型方面的证据 生物学理论依据
6) 回归方程价值的评价
回归方程评价:方程的假设检验 回归价值的评价:确定系数
确定系数反映回归方程对因变量y的影响 程度。
决定系数的意义
决定系数越大,回归方程价值越高. 实际中,决定系数大于0.5时才有好的应 用价值.
本实例回归方程的评价
回归模型的方差分析: F= 50.3878 P=0.0001 回归系数的t检验: tb=7.0984 , P=0.000 R2=0.863
结果表明,虽然高个子父辈确实有生高个 子儿子的趋势,但父辈身高增加一个单位, 儿子身高仅半个单位左右。 平均说来,一群高个子父辈的儿子们的平 均高度要低于他们父辈的平均高度,他们 儿子的身高没有比他们更高,高个子父辈 偏离其父辈平均身高的一部分被其子代拉 回来了,即子代的平均身高向中心回归。
低个子父辈的儿子们虽然仍为低个子,平 均身高却比他们的父辈增加了,即父辈偏 离中心的部分在子代被拉回来一些。说明
Regression Analsys
回归分析
童新元 中国人民解放军总医院
问题
知道父代身高,可否推测子代身高? 能否由儿童的身高推出体重的多少?
……
1) “回归”概念的来源
“香港回归”, “澳门回归”…. “回归”这一名词起源于19世纪生物学家和 统计学家F·Galton的遗传学研究。 问题:现实直观经验: “通常都认为子女比父母的身高要高”。 这是人身的客观规律还是一种假象? 如果这个趋势是客观规律话,人身高应该 是越来越高,早就超过了现在的水平。
回归方程的假设检验步骤:
1 建立假设:
H0:回归方程对y无作用 H1:回归方程对y有作用 α=0.05
变异分解示意图
2 变异的分解: 方差分析思想 yi- y = (yi - y^) + (y^ - y) ∑(yi- y)2 =∑(yi- y^)2 +∑ (y^ - y)2 SS总 = SS残差 + SS回归
2 计算统计量:方差分析表 ---------------------------------------------------------y的变异来源 总变异 回归方程 随机误差 SS SST SS回归 SSe DF n-1 1 n- 2 MS F值 P
---------------------------------------------------------MS回归 F=MS回归/Mse Mse
…… 编 体积 长 宽 高 号V a b c 2.5 2.6 2.1
V=π/4*长*宽*高 影响公式的因素: 影响公式的因素 测量误差 模型的选择
…. …. ….
多次重复实验,测量计录每 次下落的高度与时间数据: 采用什么方法找规律呢? 运用了统计学思想 回归分析 直线回归方程: y = a+b*x h 1/2 g t 时间 高度 t h 1 4.9 2 3 … 39.1 88.3 ….
h
h
。 。 。 。 。 。 。 。 。 0 1 2 3 4 散点图 t
参数的计算公式
β的估计:
α 的估计:
Galton 父母与子女身高计算结果 a=33.73, b=0.516
回归方程:y^=33.73+0.516x
例 一项关于儿童健康和发育的研究, 测得10名儿童的身高和体重数据。 试建立身高和体重之间的回归方程. 现一儿童身高150cm,试预测其体重。
计算结果 a=47.117, b=0.5278
5.关于‘相关’的若干提法及其关系*
A与B是否有关 A与B是否独立 不同A下B是否相等 A对B是否有影响 A与B的结果是否一致(配对) 有关=不独立=不相等=有影响=一致 无关=独立=相等=无影响=不一致
6.相关与回归系数的区间估计*
相关系数的区间估计 回归系数的区间估计 回归方程中常数项的区间估计
牛顿的自由落体定律的产生
自由落体定律的探究 回归方程的构造: 回归方程的构造 回归方程: y = a+b*x h 0 1/2 g t2 影响定律公式的因素: 影响定律公式的因素 测量误差 模型的选择
灵感
h
[回归分析应用典型统计案例2]
肾脏体积的测量
肾脏为不规则体,怎样测量? 肾脏为不规则体,怎样测量? 立方体体积规律: 公式: V=长*宽*高=abc
8) 回归分析的应用---预测
若回归方程有意义时,可以通过自变量X 的值来预测因变量Y的值. 通过知道父代身高推测子代平均身高
模型的预测
现一儿童身高150cm,试预测其体重。 解: 已求得回归方程为: Y^=-47.1170+0.5278*x 当x=150 时,代入回归方程求得: y^=32 KG
相关文档
最新文档