第7章 回归分析与相关分析(3)-可线性化的非线性回归
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二篇回归分析与相关分析
第7章可线性化的非线性回归
线性模型在现实中其实是较少出现的,大量的规律都表现为非线性模型。
线性模型的价值与其说在于处理线性问题,毋宁说在于处理线性化的非线性模型,或者说近似拟合相互作用不太强烈非线性系统。
在实际工作中,我们会遇到许多简单而又实用的非线性模型,这些模型都可以通过某种数学变换转换为线性关系,从而利用最小二乘技术进行回归运算。
比较常见的有指数模型、对数模型、幂指数模型、双曲线模型、抛物线模型、正态分布模型,等等。
下面逐一举例说明。
§7.1 线性与非线性
非线性是相对于线性关系而言的。
当变量数目一定的时候,线性关系只有一种,而非线性关系各式各样,千变万化。
传统的科学理论主要是基于线性理论建立起来的,非线性科学的兴起历史并不长久。
虽然非线性理论年龄尚幼,但简单的非线性关系的应用却历史悠久。
首先需要区别函数
y=
f
(x
)
对自变量x的依赖关系。
对于一个变量而言,线性形式为
=,
bx
y+
a
这是只有一个自变量的一次多项式表达,式中a、b为参数,表现为常数形式。
如果多项式出现大于1的幂次,就是非线性函数。
最简单的非线性函数之一是抛物线,这是一种二次多项式
=2,
c
y+
+
ax
bx
式中a、b、c为参数。
一般函数为
f
=,
yμ
(x
)
,
式中μ为参量集。
我们可以从如下方面理解线性关系和非线性关系的区别。
第一,线性是简单的比例关系,而非线性则是对简单比例关系的偏离。
有位学者打了一个通俗的比方,线性就是水涨船高,多多益善;非线性就是过犹不及,物极必反。
以三次曲线为例,该曲线是对线性关系的局部偏离,科学上称之为“微扰”或者“摄动”。
第二,线性关系表明各个变量之间互不相干,独立贡献,非线性关系则意味着相互作用。
线性关系暗示各个变量可以相互叠加,对于非线性而言,暗示整体不等于部分之和。
因此,线性回归要求各个自变量彼此独立,因为最小二乘技术主要是基于线性思想发展的一种参数求解方法。
第三,线性关系意味着信号的频率成分不变,而非线性关系则暗示频率结构发生变化。
可见线性联系着静态结构,非线性联系着动态结构。
§7.2 常用的非线性数学模型
7.2.1 指数函数(1型)
指数模型是最为常见的模型之一,在理论上和实践中都非常有用。
Albert A. Bartlett 曾经有一个感叹:“人类的最大缺陷在于我们不能理解指数函数。
”对指数函数的奥秘的研究看来没完没了。
指数模型又有多种表现形式,首先讲述最为常见的一种形式及其拟合方法。
⑴ 数学表达式
指数函数(exponential funcion )的一般数学表达式为
bx ae y =,
式中x 为自变量,y 为因变量,a 、b 为参数(a >0)。
⑵ 函数图像
指数函数1的变化趋势可以作图如下(图7-2-1)。
x
y
图7-2-1 指数方程(I )图像
⑶ 变换方法
在公式两边取对数,化为
bx a y +=ln ln .
令y y ln =′,a a ln =′,于是得线性模型
bx a y +′=′.
然后用x 与y ′进行线性回归,得到截距a ′和斜率b ,最后将截距还原为参数a ,还原公式为
a e a ′=.
⑷ 地理学实例
经济学中,T. Malthus 的人口增长模型就是指数函数形式。
在人文地理学中,指数模型很常见。
例如,C. Clark (1951)研究发现,城市人口空间分布密度服从负指数模型,即有
br e r −=0)(ρρ,
式中r 为到市中心的距离,)(r ρ为r 处的人口密度。
又如,M. J. Beckmann (1958)的城镇等级—规模模型
R K KS P m
m m )1(1
−=− 本质上也是一个指数模型,式中m 为自下而上的城镇等级,P m 为第m 级城市的人口,R 为每个底级(m =1)城镇平均所服务的乡村人口,S 为每个城镇拥有下级卫星城的数目,K 为比例系数。
上式可以化为
1111)1(−−=−=m m m a P K
S P P . 这是指数模型的一种表达形式,式中a =S /(1-K )为参数。
容易将上式化为标准的指数函数式。
正是在这种模型的研究过程中,梁进社(1999)提出了逆序的Beckmann 模型。
在自然地理学中,著名的Horton -Strahler 水系构成定律实际上也是指数函数形式:假定按照某种准则将一个水系分成M 个等级,则水系结构服从以下基于平移变换的标度定律
m M b M m R N N −=,
11−=m l m R L L ,
11−=m a m R A A ,
式中m 为河道等级(m =1,2,…, M ),N m 为第m 级河道数目,N M 为最高级(第M 级)河道的数目(一般取N M =1),R b =N m /N m +1为河道分支比;L m 为第m 级河道的累积平均长度,L 1为第1级即最低级河道的平均长度,R l =L m +1/L m 为河道长度比;A m 为对应于L m 的流域面积,A 1为第1级即最低级河道的平均流域面积,R a =A m +1/A m 为面积比。
研究发现,地震的能量分布,城市体系的人口分布,都服从类似的一组指数律。
7.2.2 指数函数(2型)
第二种指数模型在现实中较少出现,但也并非不能遇到。
而且,有些模型虽然不是直接表现为这种函数形式,但却可以转化为这种数学表达。
如果今后在应用中遇到了这种趋势的点列分布,不要错过了选择的机会。
⑴ 数学表达式
一种特殊的指数模型表达式为
x b ae y /=,
式中x 为自变量,y 为因变量,a 、b 为参数(a >0)。
⑵ 函数图像
指数函数2的变化趋势可以作图如下(图7-2-2)。
x
y
图7-2-2 指数方程(II )图像 ⑶ 变换方法
在公式两边取对数,化为对数双曲线形式
x
b a y +
=ln ln . 令y y ln =′,a a ln =′,x x /1=′于是得线性模型 x b a y ′+′=′.
然后用x ′与y ′进行线性回归,得到截距a ′和斜率b ,最后将截距还原为参数a ,还原公式为
a e a ′=.
⑷ 地理学实例
在城市地理学中,从标准圆出发,基于城市形态的几何测度关系可以推导出边界维数的倒数与紧凑度(compactness ratio )以及圆形率(circularity ratio )的半对数关系。
也就是说,城市形态的紧凑度和圆形率与城市边界的分维数呈现为上述二型指数关系。
用Co 表示紧凑度,用Ci 表示圆形率,再用D 表示城市边界的分维,则可以推导出如下关系
)ln 1exp(1P D
P k Co =
, 以及 )ln 2exp(12P D P
k Ci π=.
式中A 为城区的面积,P 为城区的周长,参数k 可以视为系统结构的协调因子。
此外,研究发现,一类区域人口预测模型可以表示为如下对数双曲线形式
t k P t P ln 1)(11
−=. 式中P 1、k 为参数,其中参数P 1在理论上为t =1时的人口值。
在上式两边同除以k ,移项化为
)
(11ln 1t kP kP t −=
, 从而 )(/1/111])
(11exp[t kP kP e e t kP kP t −=−=. 令)/1exp(1kP a =,k b /1=,上式可以表作
)(/t P b ae t −=.
可见,上述对数双曲线函数与指数二型函数互为反函数。
7.2.3 对数函数
对数函数与指数函数互为反函数,它与指数函数一起被统称为“单对数模型”,因为经过一个变量的对数变换就可以将它们化为线性形式。
⑴ 数学表达式
对数函数(logarithmic function )的一般数学表达式为
x b a y ln +=,
式中x 为自变量,y 为因变量,a 、b 为参数。
⑵ 函数图像
对数函数的变化趋势可以作图如下(图7-2-3)。
x
y
图7-2-3 对数方程图像
⑶ 变换方法
在原模型中,令x x ln =′,则上式化为线性模型
x b a y ′+=.
然后用x ′与y 进行线性回归,得到截距a 和斜率b 。
⑷ 地理学实例
对数函数在人文地理学中比较常用。
例如,1982年,周一星发现并提出了城市化水平与人均产值关系服从对数模型,该模型可以表作
b x a z −=ln .
式中z 为城市化水平,x 为人均产值或收入,a 、b 为参数。
几乎与周模型提出同时,Taylor (1983)其《地理学的计量方法》一书中提出,交通网络连接度与人均收入之间也满足对数关系,即有如下模型
ϕβ+=x k ln .
式中β为表征交通连接度的β指数,x 为人均收入,k 、φ为参数。
假定y 为总收入,P 为区域总人口,则x 可以表示为x =y /P 。
β指数被定义β=c /ν,这里ν为交通结点数,实则区域城镇数目,c 为结点间直接连通的交通线路数目。
7.2.4 幂指数函数
幂指数模型在当代地理学的前沿领域非常重要,分形(fractal )模型的最简单形式就是幂指数模型。
空间复杂性研究的一个重要课题乃是大自然的负幂律(reverse power-law of nature )的数理本质。
在传统的地理分析中,幂指数也非常重要。
其实今天人们研究的许多新兴科学的许多内容,通常早早就有人从传统科学的角度发现,只不过现在引入了新的思想、赋予了新的含义、提出了新的解释、从而使得应用的功能更为增强而已。
x x
a. b >0
b. b <0
图7-2-4 幂指数方程图像
⑶ 变换方法
在公式两边取对数,化为
x b a y ln ln ln +=,
令y y ln =′,a a ln =′,x x ln =′,于是得线性模型
x b a y ′+′=′.
然后用x 与y ′进行线性回归,得到截距a ′和斜率b ,最后将截距还原为参数a ,还原公式为
a e a ′=
⑷ 地理学实例
在地理学中,幂指数模型的实例是最多的。
在人文地理学中,关于城市人口(P )-城区面积(A )的异速生长(allometric )模型便是一种典型的幂指数模型
b aP A =.
式中a 为比例系数,b 为标度指数。
关于城市人口密度的Smeed 模型则是一种负幂指数模型
α−=Kr r D )(.
式中r 为到城市中心的距离,D (r )为距城市中心r 处的人口密度,K 为比例系数,α为关于距离的参数。
关于城市位序-规模分布的Zipf 定律,也是一种负幂率模型
q r P r P −=1)(.
式中r 为城市位序,P (r )为位序为r 的城市的人口规模,1P 、q 为参数。
为了解释关于城市位序—规模法则的Zipf 定律,Beckmann 于上个世纪50年代末期提出了著名的城市体系异速生长模型
t
x x b t y y d d 1d d 1⋅=⋅. 式中y 为城市体系中最大城市的人口,x 为全体城市的人口,b 为异速生长系数。
借助积分,不难从上式导出幂律形式
b x y ∝.
可见Beckmann 异速生长模型也是一种幂指数模型。
此外,人类的旅行活动或者流的空间分布,一般情况下服从负幂律
b r N r N −=1)(,
式中r 为到出发点的距离,N (r )为从出发点到距离r 处的旅行者数目或者货流量,N 1和b 为参数。
在自然地理学中,关于河道长度-流域面积关系的著名Hack (1957)定律,也是幂指数形式
b m
m A L μ=. 式中L 为主河道长度,A 为对应的流域面积,m 为河流的等级,μ为比例系数,b 为标度指数,数值约为0.6左右。
在生物地理学中,Edward O. Wilson (1996)发现,相对封闭地域空间范围(如岛屿)与物种数量之间也是服从幂指数法则的
z CA S =.
式中A 为某种地域例如岛屿的面积,S 为相应岛屿发现的物种数量,C 、z 为参数,幂指数z 的数值介于0.15~0.35之间,一般为z =0.3或者z =log 102,即岛屿面积增加10倍物种数目翻一番。
7.2.5 正态函数
正态分布(normal distribution )函数最早由德国数学王子Gauss 提出,因此又叫Gauss 函数。
Gauss 在天文测量的误差研究中发现了它。
回归分析的奠基人Galton 称正态分布为“均数偏移律”或者“误差频数律”,他甚至感叹:“没有什么东西能像将宇宙秩序表示为误差频数律
这一美妙形式那样令人印象深刻。
”而这种误差偏移律恰是我们进行回归检验的一个重要判据。
⑴ 数学表达式
广义的Gaussian 函数为
2bx ae y =,
式中x 为自变量,y 为因变量,a 、b 为参数(a >0)。
Gauss 分布函数的一般形式为
22
2)(21
)(σμσπ−−=x e x f .
式中μ为x 的期望值,σ为x 的标准差。
当数据标准化以后,μ=0,σ=1,于是上式化为标准正态分布形式
2
2121
)(x e x f −=π.
当然,广义的正态函数并不要求数据标准化后一定有a =1/√(2π),b =1/2。
⑵ 函数图像
正态分布以其优美的对称形式被人称为钟形曲线(图7-2-5)。
y
图7-2-5 正态分布函数图像(钟形曲线)
⑶ 变换方法
在公式两边取对数,化为
2ln ln bx a y +=
令y y ln =′,a a ln =′,2
x x =′于是得线性模型
x b a y ′+′=′
然后用x ′与y ′进行线性回归,得到截距a ′和斜率b ,最后将截距还原为参数a ,还原公式为
a e a ′=
⑷ 地理学实例
正态分布在地理学中可以找到许多应用实例。
继Clark 模型提出之后,G . G . Sherratt (1960)提出的城市人口密度模型便是一种正态分布模型
2
0)(br e r −=ρρ.
显然这是Gaussian 函数形式,式中r 为到城市中心的距离,ρ(r )为距城市中心r 处的人口密度,ρ0为比例系数,它在理论上等于城市中心处的人口密度,参数b 为距离衰减效应的速率,它描述的城市人口密度在偏离中心的城区范围内远较Clark 模型衰减为快。
在我国的一定时期内,许多区域的GDP 增长也服从二次指数模型 2
0)(bt e G t G −=,
式中G 表示GDP ,t 为时间,用基于年份的时序表示。
任何一个地理数学模型,回归的结果如果能够通过检验,其误差(残差)的分布都是Gaussian 函数形式。
7.2.6 对数正态函数
对数正态函数(lognormal function ),顾名思义,就是自变量取对数以后表现为正态函数形式。
对数正态分布在自然和人文地理学研究中都比较常见。
不过,为了方便,我们在应用时都采取广义的对数正态函数。
⑴ 数学表达式
广义的对数正态分布一般表示为
2
)(ln x b ae y =,
式中x 为自变量,y 为因变量,a 、b 为参数不(a >0)。
可见,所谓对数正态分布(lognormal distribution ),其实就是自变量取对数之后服从正态分布 22
2)(ln 21
)(σμσπ−−=x e x f .
式中μ为ln x 的均值,σ为ln x 的标准差,当取对数后的数据标准化以后,μ=0,σ=1,于是上式化为标准对数正态分布形式
2)(ln 2121)(x e x f −=
π.
⑵ 函数图像
对数正态分布不像钟形曲线那么端端正正,其对称性有所丧失,表现为侧偏的单峰形式(图7-2-6)。
y
图7-2-6 对数正态分布函数图像
⑶ 变换方法
在公式两边取对数,化为
2)(ln ln ln x b a y +=.
令y y ln =′,a a ln =′,2
)(ln x x =′,于是得线性模型 x b a y ′+′=′.
然后用x ′与y ′进行线性回归,得到截距a ′和斜率b ,最后将截距还原为参数a ,还原公式为
a e a ′=.
⑷ 地理学实例
在人文地理学中,J. B. Parr (1985)发展的城市和区域人口密度模型是一种对数正态分布,其表达式为
2
)(ln 0)(r b e D r D −=.
式中r 为到城市中心的距离,D (r )为距城市中心r 处的人口密度,D 0为比例系数,参数b 为距离衰减系数。
7.2.7 双曲函数
双曲线(hyperbola )在地理系统的建模分析和预测中时常可以碰到,不过有时非常隐晦,需要通过数学变换才能揭示出来;有时又是一种近似结果,也只有通过变换才能显示。
⑴ 数学表达式
通常的双曲线函数的数学表达式为
x
b a y 11+=, 式中x 为自变量,y 为因变量,a 、b 为参数(a >0)。
⑵ 函数图像
双曲线函数的图像我们在中学就比较熟悉,它是一种中心对称图形,不过我们这里只是给出现实中有用的局部(图7-2-7)。
x
y
图7-2-7 双曲线函数图像
⑶ 变换方法
令y y /1=′,x x /1=′,于是得线性模型
x b a y ′+=′
然后用x ′与y ′进行线性回归,得到截距a 和斜率b 。
⑷ 地理学实例
从Beckmann (1958)城市等级-规模模型中可以导出一个城市化水平模型如下
1
),(−+=S K KS S K Z , 式中Z 为城市化水平,K 为乡镇化水平,S 为各级城市拥有下级卫星城的数目(平均意义)。
当K 一定即为常数时,我们有
KS
K K KS K S Z 11)1(1−+=−+=.
由于10<<K ,上式实则相当于一个b <0的双曲线函数。
另一方面,当S 一定即为常数时,我们有
SK
S S SK S K Z 11)1(1−+=−+=. 由于1>S ,上式相当于一个b >0的双曲线函数。
研究表明,一些城市的人口增长服从这种双曲线函数反映的规律(参见下一章)。
下面接着要讲Logistic 曲线,而Logistic 曲线的一个近似表达也是双曲线的一种。
7.2.8 生长函数(Logistic 函数)
一般认为,Logistic 方程最初是比利时数学家P.F. Verhulst (1838)修正Malthus 的人口指数增长方程时提出的。
Logistic 模型在发展预测中特别重要,大量的自然和人文现象,其生长与变化体现为Logistic 曲线形式,所以,Logistic 曲线又叫“生长曲线”——当然生长曲线还有其它形式,如指数增长。
不仅如此,这个简单的曲线有隐含有非常深刻的科学道理,1976年R. May 通过研究生态学中虫口变换的Logistic 过程发现了复杂的混沌(chaos )现象。
⑴ 数学表达式
Logistic 函数的数学表达式为
bx ae
k y −+=1,. 式中x 为自变量,y 为因变量,a 、b 、k 为参数(a , b , k >0)。
⑵ 函数图像
Logistic 曲线的图像为S 形,故又称“S 形曲线”(图7-2-8)。
x
y
图7-2-8 Logistic 曲线图像
⑶ 变换方法
首先要决定生长曲线的饱和值k ,在多数情况下,对数据进行适当的转换以后,可是1=k ,然后两边取倒数,化为
bx ae y
−+=11, 移项可得
bx ae y
−=−11. 在上式两边取对数,化为
bx a y
−=−ln )11ln(. 令)1/1ln(−=′y y ,a a ln =′,于是得线性模型
bx a y +′=′.
然后用x 与y ′进行线性回归,得到截距a ′和斜率b ,最后将截距还原为参数a ,还原公式为
a e a ′=.
⑷ 地理学实例
联合国采用的城市化水平即城市人口比重随时间变化的模型就是一种Logistic 模型
t me
k t Z α−+=1)(.
式中t 为时间,Z (t )为第t 个年份某区域的城市化水平,k 、m 、α为参数。
城市或者区域人口的增长也是Logistic 形式,模型可以表作
)
(00)1(1)(t t r m m
e P P P t P −−−+=,
式中P (t )为第t 个年份(观测时间)的人口,P m 为饱和人口,P 0为初始年份即第t 0年的人口,r 为参数。
在一定条件下,上述模型可以近似转换为双曲线函数的一种。
7.2.9 生产函数(Cobb-Douglas 函数)
生产函数原是经济学中的一种重要数学模型,由Cobb 和Douglas 最先提出。
其实,这是一个先验的具有普适意义的函数,它在地理学中的重要性近年来才得到较多的认识。
由于现实中的很多变量之间表现为这种多元对数线性关系,我们在主成分分析或者因子分析中有时需要事先对变量取对数。
⑴ 数学表达式
在最简单的情况下,数学表达式为
2121b b x ax y =,
式中x 为自变量,y 为因变量,a 、b 1、b 2为参数(a >0)。
⑵ 函数图像
生产函数的图像为3维乃至多维形式(图7-2-9)。
Z A x i s
图7-2-9 三维生产函数图像
⑶ 变换方法
在公式两边取对数,化为
2211ln ln ln ln x b x b a y ++=.
令y y ln =′,a a ln =′,11
ln x x =′,22ln x x =′,于是得多元线性模型 221
1x b x b a y ′+′+′=′. 然后用x´与y ′进行线性回归,得到截距a ′和斜率b ,最后将截距还原为参数a ,还原公式为
a e a ′=
⑷ 地理学实例
人文地理学中的城市引力模型实际上是Cobb-Douglas 函数形式
b
ij j
i ij r M M G I β
α=.
当两个城市确定时,它们之间的距离r ij 为常数,令a =Gr ij -b ,上式便是二元幂指数模型
β
αj i ij M aM I =.
回归处理方法与生产函数一样。
在城市系统和生态系统中,有时会出现多变量的生产函数形式,例如
∏==m
i i i x k y 1α.
式中m 为自变量数目(i =1,2,…,m ),k 、α为参数。
7.2.10 多项式函数
多项式是地理数学方法入门者最喜欢选择的模型,也是陷阱最多的地方。
其实,任何一个非线性模型经过Taylor 级数展开,都可以化作某种多项式形式,从而多项式函数可以用来拟合各种曲线,且其测定系数都比较高。
但是,多项式的拟合效果与普通模型不具备很高的可比性;尤为需要注意的是,多项式的参数意义通常并不明确。
采用多项式形式进行插值和逼近倒是不错,但在进行预测分析时,建议初学者不要轻易地选择这个模型。
⑴ 数学表达式
多项式函数的一般形式为
∑==++++=n
k k n
n x a x a x a x a a y 002210L . 当k =1时,为一元线性回归模型
x a a y 10+=;
当k =2时,为抛物线
2210x a x a a y ++=;
当k =3时,为三次曲线
332210x a x a x a a y +++=.
⑵ 函数图像
多项式的函数曲线有很多形式,这里只给出两种代表性的图像(图7-2-10)。
x y
x y
a. 抛物线
b. 三次曲线
图7-2-10 多项式方程图像
⑶ 变换方法
下面以二次多项式即抛物线为例说明多项式模型的回归方法。
令2
x x =′,于是得二元线性模型 x a x a a y ′++=210.
然后用x 和x’与y 进行二元线性回归,得到截距a 0和斜率a 1、a 2。
有人可能会提出疑问,多项式会不会引起多重共线性的问题?答案是不会。
固然,如果我开展共线性检测,可能会出现多重共线性的征兆。
但是,这种征兆遇到这种非线性模型不再有效。
以截距a 为步长,对一元线性模型实施一步平移,得到y’=bx 。
这意味着线性关系实质上是一种比例关系。
多重共线性涉及到多种比例。
要想一个变量与另外一个变量成比例,它们的量纲必须一致,或者说维数一致。
在一个多项式里,维数从0维到n 维,任何两个变量之间维数都不一样,因而不能形成比例关系,当然也就不能出现所谓多重共线性的问题。
⑷ 地理学实例
地理计量运动时期,B. E. Newling (1969)等曾用二次曲线代替了Clark 模型的一次变量,提出了所谓二次指数式模型,其数学表达式为
2
0)(cr br e D r D −=.
式中r 为到城市中心的距离,D (r )为距城市中心r 处的人口密度,D 0为比例系数,它在理论上等于城市中心处的人口密度, b 、c 均为参数。
在Newling 模型两边取对数,化为 20ln )(ln cr br D r D −+=.
显然,这是多项式模型的特例——抛物线模型。
另外,Logistic 模型是如下微分方程的解
2d d by ay t
y +=, 令
t t t t y y y z −=Δ=+1, 1=Δt ,
则上式离散化为
2t t t by ay z +=,
可见,这也是一种抛物线形式。
还有其他一些常见的非线性模型,如复利模型——由于复利模型在多数情况下与指数模型等价,故不特别讲述。
更多的模型留待实习部分练习。
§7.3 小结
这一章我们讨论了10多个常见的非线性模型,这些模型的共同特点在于:其一,自变量和参数不多。
自变量一般不超过两个,参数通常不超过三个。
其二,它们都可以借助对数变换或者变量替换表示为线性函数形式。
其三,它们可以用于刻画各种复杂的自然和人文现象中简单而常见的非线性关系。
研究这些模型的作用和意义如下。
首先,上述模型大多是一个学科理论建设的基础。
我们面临的对象尽管复杂,但是基本规律往往非常简单,问题在于我们选择怎样的角度刻画这些规律。
高斯函数、指数模型的奥秘令人神往,幂指数模型在自然规律中扮演着重要的角色。
标度律、大自然的负幂律,如此等等,是当今复杂性理论探讨的重要的问题,也是必不可少的描述形式。
其次,上述模型在实际工作中是最基本的分析和预测模型。
对于线性关系,因、果之间为比例关系;对于非线性关系,因、果之间不再服从简单的比例法则。
如果一种因果关系不能表现为线性形式,那就需要借助非线性函数进行描述和解释。
当我们运用趋势外推法对非线性系统的演化进行预测分析的时候,通常要借助这一类非线性函数关系。
其三,上述简单的非线性函数是我们今后开展非线性自相关分析、建立非线性自回归模型的基础。
自相关和自回归模型是复杂过程的分析和预测的必备工具。
可是,自相关分析和自回归分析都是线性分析。
如果现实中的自相关和自回归过程不是线性的时候,我们就需要利用本章讨论的非线性函数对数据进行转换,然后才能利用常规的自相关和自回归方法。