【生物数学】生物数学_回归分析180411更新
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
故当 F >F (1, n-2)时,拒绝H0,认为x与y之间有显著的线
性关系,或称回归方程是显著的.
相关系数R(样本相关系数)
定义:R SR 为x与y的相关系数. S yy
F
Se
SR /(n
2)
(n 2)R2 (1 R2 )
~ F (1, n 2)
可以证明:R b1Sxy Sxy
S yy
并指定显著性概率alpha polytool(x,y,n,alpha,xname,yname) — 多项式拟合,并添加坐标轴说明 举例:
x=[1 2 3 4 5 6 7 8]; y=[1 3 10 15 26 35 50 65]; %拟合二次多项式: polytool(x,y,2) %拟合二次多项式,指定显著性水平0.05,添加坐标轴说明: polytool(x,y,2,0.05, '横坐标x', '纵坐标y')
§2 多元线性回归
一、多元线性回归的数学模型
设因变量y与p个自变量x1,…,xp之间有线性关系:
y 0 1x1 p xp
回归分析是研究变量之间的相关关系的一种统计方法。回 归(regression)这一术语是1886年高尔顿(Galton)研究遗传 现象时引进的。
§1 一元线性回归
例1 以家庭为单位,某商品年需求量与其价格之间的调查数 据如下:
价格x(元) 1 2 2 2.3 2.5 2.6 2.8 3 3.3 3.5
Sxx S yy
R2
F
(n F 2)
相关系数检验: 给定显著性水平α,查相关系数表得临界值R (n-2), 当 |R|> R (n-2) 时拒绝H0.
F检验:
查F分布表得临界值F (1, n-2),当 F> F (1, n-2) 时拒绝 H0.
t 检验:t F ~ t(n-2 ),当 t> t (n-2) 时拒绝H0.
例2为研究某一化学反应过程中,温度对产品得率Y ( % )的影响, 测得数据如下表, 求 Y 关于 x 的线性 回归方程 .
温度x(oC)100 110 120 130 140 150 160 170 180 190
得率Y(%) 45 51 54 61 66 70 74 78 85 89
在MATLAB中求解 源程序 x=100:10:190;
n i 1
xi ,
y
1 n
n i 1
yi .
解正规方程得到:
n
(xi x )( yi y)
b1 i1 n
(xi x )2
i 1
b0 y b1x
记
Sxy (xi x )( yi y) i
Se ( yi yˆi )2 i
Sxx (xi x )2
i
Syy ( yi y )2 i
需求量y(500g) 5 3.5 3 2.7 2.4 2.5 2 1.5 1.2 1.2
1. x与y之间是相关 关系,不能用解析表达 式 y = f(x) 表示.
2. 作散点图。发现这 些点分布在一条直线附 近.
3. 把y 看成是由两部分叠加而成:一是x的线性式 β0 + β1 x; 二是由随机因素引起的误差 .于是有
n
总平方和 S yy ( yi y )2 i 1 n
回归平方和 SR ( yˆi y )2,可以证明SR b1Sxy i 1 n
剩余平方和 Se ( yi yˆi )2 i 1
可以证明:Syy= SR + Se ,且当假设H0成立时,
F SR ~ F (1, n 2) Se / (n 2)
y =β0 + β1 x +
(1)
且假定 ~ N(0, 2) .
Baidu Nhomakorabea
4. 为估计未知参数β0 、β1,将n组观测值(xi, yi)代入得
yi=β0+β1xi+ i (i =1, 2, …, n)
(2)
假定 i 相互独立,且 i ~ N(0, 2) .称(1)式为一元线 性回归的数学模型.
一、β0,β1的最小二乘估计
生物数学 回归分析
一般来说,变量之间的关系可分为两类: 1. 确定性的函数关系:已知一个(或几个)变量的值,就 可以精确地求出另一个变量的值。如 V = 4/3 R3,S = V t 2. 非确定性的相关关系:几个变量之间存在着密切的关系, 但不能由一个(或几个)变量的值精确地求出另一个变量的值。 在相关关系中至少有一个变量是随机变量。如人的血压与年龄, 环境因子与农作物的产量,商品价格与消费者的需求量等。
设 b0 ,b1 分别为β0, β1的 估计值,即
ˆ0 b0, ˆ1 b1
则可将yi写成 yi b0 b1xi ei. 记 yˆi b0 b1xi , 称yˆi为yi估计值, 并称 ei yi yˆi 为残差或剩余.
最小二乘法是要选取bi使残
差平方和Q最小:
n
n
Q ei2 [ yi (b0 b1xi )]2
i 1
i 1
由微积分的极值原理得到
Q
b0
n
2
i 1
( yi
b0
b1xi )
0
Q b1
2
n i 1
( yi
b0
b1xi )xi
0
整理得
nb0
b1
n i 1
xi
n i 1
yi
n
n
n
b0 i1 xi b1 i1 xi2 i1 xi yi
称上述方程为正规方程.记
x
1 n
则
b1
S xy S xx
b0 y b1x
于是得到经验回归方程
yˆ b0 b1x
但当假定
y =β0 + β1 x + ε 不成立时,求得的经验回归方程 是无意义的.
因此,要检验 “y与x 存在 线性关系” 这一假设是否成立.
二、回归问题的统计检验
欲检验假设 H0: β1 = 0 H1: β1 ≠ 0
x=[100 110 120 130 140 150 160 170 180 190] y=[45,51,54,61,66,70,74,78,85,89]; polytool(x,y,1,0.05) %确定多项式回归的次数
Polytool函数说明
polytool(x,y) — 拟合 y =β0 + β1 x polytool(x,y,n) ) — 拟合 y =β0 + β1 x + β2 x2 +…+ βn xn polytool(x,y,n,alpha) — 拟合 y =β0 + β1 x + β2 x2 +…+ βn xn ,
性关系,或称回归方程是显著的.
相关系数R(样本相关系数)
定义:R SR 为x与y的相关系数. S yy
F
Se
SR /(n
2)
(n 2)R2 (1 R2 )
~ F (1, n 2)
可以证明:R b1Sxy Sxy
S yy
并指定显著性概率alpha polytool(x,y,n,alpha,xname,yname) — 多项式拟合,并添加坐标轴说明 举例:
x=[1 2 3 4 5 6 7 8]; y=[1 3 10 15 26 35 50 65]; %拟合二次多项式: polytool(x,y,2) %拟合二次多项式,指定显著性水平0.05,添加坐标轴说明: polytool(x,y,2,0.05, '横坐标x', '纵坐标y')
§2 多元线性回归
一、多元线性回归的数学模型
设因变量y与p个自变量x1,…,xp之间有线性关系:
y 0 1x1 p xp
回归分析是研究变量之间的相关关系的一种统计方法。回 归(regression)这一术语是1886年高尔顿(Galton)研究遗传 现象时引进的。
§1 一元线性回归
例1 以家庭为单位,某商品年需求量与其价格之间的调查数 据如下:
价格x(元) 1 2 2 2.3 2.5 2.6 2.8 3 3.3 3.5
Sxx S yy
R2
F
(n F 2)
相关系数检验: 给定显著性水平α,查相关系数表得临界值R (n-2), 当 |R|> R (n-2) 时拒绝H0.
F检验:
查F分布表得临界值F (1, n-2),当 F> F (1, n-2) 时拒绝 H0.
t 检验:t F ~ t(n-2 ),当 t> t (n-2) 时拒绝H0.
例2为研究某一化学反应过程中,温度对产品得率Y ( % )的影响, 测得数据如下表, 求 Y 关于 x 的线性 回归方程 .
温度x(oC)100 110 120 130 140 150 160 170 180 190
得率Y(%) 45 51 54 61 66 70 74 78 85 89
在MATLAB中求解 源程序 x=100:10:190;
n i 1
xi ,
y
1 n
n i 1
yi .
解正规方程得到:
n
(xi x )( yi y)
b1 i1 n
(xi x )2
i 1
b0 y b1x
记
Sxy (xi x )( yi y) i
Se ( yi yˆi )2 i
Sxx (xi x )2
i
Syy ( yi y )2 i
需求量y(500g) 5 3.5 3 2.7 2.4 2.5 2 1.5 1.2 1.2
1. x与y之间是相关 关系,不能用解析表达 式 y = f(x) 表示.
2. 作散点图。发现这 些点分布在一条直线附 近.
3. 把y 看成是由两部分叠加而成:一是x的线性式 β0 + β1 x; 二是由随机因素引起的误差 .于是有
n
总平方和 S yy ( yi y )2 i 1 n
回归平方和 SR ( yˆi y )2,可以证明SR b1Sxy i 1 n
剩余平方和 Se ( yi yˆi )2 i 1
可以证明:Syy= SR + Se ,且当假设H0成立时,
F SR ~ F (1, n 2) Se / (n 2)
y =β0 + β1 x +
(1)
且假定 ~ N(0, 2) .
Baidu Nhomakorabea
4. 为估计未知参数β0 、β1,将n组观测值(xi, yi)代入得
yi=β0+β1xi+ i (i =1, 2, …, n)
(2)
假定 i 相互独立,且 i ~ N(0, 2) .称(1)式为一元线 性回归的数学模型.
一、β0,β1的最小二乘估计
生物数学 回归分析
一般来说,变量之间的关系可分为两类: 1. 确定性的函数关系:已知一个(或几个)变量的值,就 可以精确地求出另一个变量的值。如 V = 4/3 R3,S = V t 2. 非确定性的相关关系:几个变量之间存在着密切的关系, 但不能由一个(或几个)变量的值精确地求出另一个变量的值。 在相关关系中至少有一个变量是随机变量。如人的血压与年龄, 环境因子与农作物的产量,商品价格与消费者的需求量等。
设 b0 ,b1 分别为β0, β1的 估计值,即
ˆ0 b0, ˆ1 b1
则可将yi写成 yi b0 b1xi ei. 记 yˆi b0 b1xi , 称yˆi为yi估计值, 并称 ei yi yˆi 为残差或剩余.
最小二乘法是要选取bi使残
差平方和Q最小:
n
n
Q ei2 [ yi (b0 b1xi )]2
i 1
i 1
由微积分的极值原理得到
Q
b0
n
2
i 1
( yi
b0
b1xi )
0
Q b1
2
n i 1
( yi
b0
b1xi )xi
0
整理得
nb0
b1
n i 1
xi
n i 1
yi
n
n
n
b0 i1 xi b1 i1 xi2 i1 xi yi
称上述方程为正规方程.记
x
1 n
则
b1
S xy S xx
b0 y b1x
于是得到经验回归方程
yˆ b0 b1x
但当假定
y =β0 + β1 x + ε 不成立时,求得的经验回归方程 是无意义的.
因此,要检验 “y与x 存在 线性关系” 这一假设是否成立.
二、回归问题的统计检验
欲检验假设 H0: β1 = 0 H1: β1 ≠ 0
x=[100 110 120 130 140 150 160 170 180 190] y=[45,51,54,61,66,70,74,78,85,89]; polytool(x,y,1,0.05) %确定多项式回归的次数
Polytool函数说明
polytool(x,y) — 拟合 y =β0 + β1 x polytool(x,y,n) ) — 拟合 y =β0 + β1 x + β2 x2 +…+ βn xn polytool(x,y,n,alpha) — 拟合 y =β0 + β1 x + β2 x2 +…+ βn xn ,