第十二章 非线性回归分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十二章非线性回归分析
第一节可化为直线回归的非线性回归
•有些形式的曲线可以采用适当的数据转换方法转化为直线,从而用直线回归的方法来分析。一、指数曲线
•当α>0时其曲线形状见图12.1。
•对公式(12.1)取导数
•可知随着x的增加,β>0的曲线的绝对生长速度越来越快,而β<0的曲线的衰减速度越来越慢。•再对公式(12.1)取二阶导数
•因此β是生长或衰减的加速度,又称相对生长率或相对衰减率,是固定不变的。
•指数曲线的回归分析模型为:
•要求ε相互独立且服从同一对数正态分布。令
•并用直线回归分析的方法解得α和β的估计值
•从而建立指数曲线回归方程
•〔例12.1〕棉花红铃虫的产卵数(y,粒/头)与温度(x,℃)有关,调查结果见表12.1,试作回归分析。
表12.1 棉花红铃虫温度x(℃)与产卵数y(粒/头)的调查结果
•解:首先作调查数据的散点图(图12.2)
•将y做对数转换,
•根据表12.1中的x与y’可求得
•图12.2 棉花红铃虫温度x与产卵数y的散点图
•据此建立指数曲线回归方程
•回归方程的显著性检验,选用相关系数检验法。
•查r0.01(5)=0.874,|r|=0.9926>0.874,因此指数曲线回归关系在0.01水平上显著(实际P=9.01×10-6)。
带常数的指数函数
•当β<0时其曲线见图12.3。其中,α<0的曲线经常用来描述孵化过程,又称孵化曲线。
•由于是3参数曲线,所以要先求K值。选3个等距的x值所对应的y值,有
•然后作数据转换
y’=ln(y-K), a’=ln a
•y’=ln(y-K), a’=ln a (12.8)
即可将其线性化并估计a和b值了
•其图形见图12.4。
•幂函数曲线常用于描述体积、重量等倍数性资料的变化规律。采用与指数曲线回归模型类似的方法,令y’=ln y, x’=ln x, a’=ln a,ε’=lnε (12.10) 即可将幂函数曲线回归模型线性化
从而建立幂函数曲线回归方程
〔例12.2〕玉米杂交种四单19的果穗直径(x,cm)与穗粒重(y,g)间的关系如表12.2,试作回归分析。
表12.2 玉米果穗直径x(cm)和穗粒重y(g)的调查数据
图12.5 玉米果穗直径x和穗粒重y的散点图(左)和对数散点图(右)
•解:从调查数据的散点图(图12.5)中可以看出x与y之间呈一种中间略下凹的曲线关系,x’与y’
之间呈直线关系,因此作幂函数曲线回归分析。由表12.2可求得
•查r0.01(6)=0.834,|r|=0.9922>0.834,因此幂函数曲线回归关系在0.01水平上显著(实际P=1.26×10-6),可建立幂函数曲线回归方程:
•其图形也见图12.5,不同的x值对应的值见表12.2。
•本例也可作直线回归和指数曲线回归分析,结果均极为显著。
•还可能求出其它也显著的曲线形式。实践中通常不存在支持某种曲线形式的绝对依据,选择合适的曲线形式的考虑之一是所研究问题的生物学意义。如温度或时间与生长量的关系一般应选用指数曲线,而直径或长度与重量或体积的关系一般可选用幂函数曲线等。
•考虑之二是曲线的显著性。可根据散点图的特征试配几种不同的曲线,从中选择显著程度最高或较高的。本例从散点图看可配合直线、指数曲线和幂函数曲线,显著程度相差不多,但以幂函数曲线的生物学意义最为吻合,因此较合适。
三、对称S形曲线回归
•许多害虫的日发生量在暴发期以前逐日增加,过了暴发期又逐日减少,基本上是对称的,接近正态分布。因此其累积发生量就成为上下对称的S形曲线,与正态累积函数曲线差不多,见图12.6。
图12.6 对称S形曲线
•以y为累积发生量,x为日期并令
•可将此对称S形曲线转换为线性并估计a和b了。
•y’一般称为概率单位,可由概率单位表中查出。由回归方程求得后也可从该表中反查出。•〔例12.3〕江苏东台县测定了1972年越冬代棉红铃虫不同时期(x,以5月31日为0)的化蛹进度(y,%)结果见表12.3,试作回归分析。
表12.3 棉红铃虫不同时期x(以5月31日为0)的化蛹进度y(%)
图12.7 棉红铃虫不同时期x和化蛹进度y的散点图
•解:从散点图(图12.7)中看出x与y基本上呈对称的S形曲线关系,将y转换为概率单位y’后与x 呈直线关系,因此作x与y’的直线回归分析。
•查r0.01(8)=0.765,|r|=0.9983>0.765,因此回归关系在0.01水平上显著(实际P=3.64×10-11),也即有概率单位y’与日期x间的直线回归方程
•成立。将各x值代入回归方程求出同并反查出值列于表12.3的最后两列,可见吻合得相当好。
四、不对称S形曲线回归
•动植物生长的普遍规律是先越来越快,过了生长高峰以后由于内外条件的限制则越来越慢直至停止。生长速度的变化呈不对称的单峰曲线,因此累积生长量呈不对称的S形曲线。有许多描述不对称S形曲线的方程,如
•等,也可用y的概率单位对x的对数作线性回归。但是最常用且最符合生物学意义的还是Logistic 曲线,见图12.8。
•如果无阻抑时的生长情况可用指数曲线
•来描述,有限制条件时的生长情况可用孵化曲线
•来描述,那么整个生长周期可用Logistic曲线
•可知当y< •可求出拐点为 •此时的生长速度最快,为 •生长速度在此之前逐渐加快,在此之后逐渐下降直至y=K时为0。