实验三 树高曲线的绘制
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验三、绘制树高曲线
一、目的
1.熟悉资料的整理方法;
2.掌握随手曲线的绘制技术和曲线调整方法;
3.学会采用数式法利用计算机绘制树高曲线。
二、仪器用具
计算机、方格纸及绘图工具。
三、方法步骤
林木的高度是反映林木生长状况的数量指标,同时也是反映林分立地质量高低的重要依据。
平均高则是反映林木高度平均水平的测度指标,根据不同的目的,通常把平均高分为林分平均高和优势木平均高(average top height记作H T)
树木的高生长与胸径生长之间存在着密切的关系,一般的规律为随胸径的增大树高增加,两者之间的关系常用树高——胸径曲线来表示。
这种反映树高随胸径变化的曲线称为树高曲线。
树高曲线是林分调查中常用的曲线,在树高曲线上,与林分平均直径(Dg)相时应的树高,称为林分的条件平均高,简称平均高。
另外,从树高曲线上根据各径阶中值查得的相应的树高值,称为径阶平均高。
(一)资料的整理
1) 建立数据库
将标准地调查所测定的林木胸径和树高建立计算机数据库,每株树作为一条记录,作为建立树高曲线的基础数据。
本实验数据由指导教师提供图片,每组将数据全部输入到Excel表格中,如果图片不太清楚,可以用软件增强对比度等办法使之清晰,如果还不清楚或缺失数据请联系老师。
.
2)异常数据的剔除
基础数据是总体中的一组样本,如有个别过大或过小的异常数据混杂进去,会影响拟合曲线的精度。
为此,必须剔除异常数据以提高曲线的质量。
异常数据的剔除过程分两步进行:首先,用计算机绘制各自变量和因变量的散点图,通过肉眼观察确定出明显远离样点群的数据并删除,这类数据是属于因调查、记录、计算等错误而引起的异常值;其次是根据具体问题,用基础数据拟合某一基础模型(如选择Richards方程作为基础模型),并绘制模型
yˆ)的标准残差图。
在标准残差图中,将超出±2倍标准差以外的数据作为极端观测预估值(
i
值予以剔除
此步工作只做肉眼剔除。
注意:如果树木有断梢,则胸径数据照用,树高数据不要。
如树种不同,则该条数据剔除,在报告中都要予以说明。
(二)图解法
在标准地内,随机选取一部分林木测定树高和胸径的实际值,一般每个径阶内应量测3~5株林木,平均直径所在的径阶内测高的株数要多些,其余递减,测定树高的林木株数不能少于25~30株。
因为本次提供的数据中每木测高,所以本次实验时:将标准地中各样木的胸径按2cm 径阶整化,并把结果记入测高记录表中,分别径阶利用算术平均法计算出各径阶的平均胸径、平均高及株数见表5-2。
表3-1 测高记录表
在方格纸上以横坐标表示胸径(D)、纵坐标表示树高H,选定合适的坐标比例,将各径阶平均胸径和平均高点绘在方格纸上,并注记各点代表的林木株数。
根据散点分布趋势随手绘制一条均匀圆滑的曲线,即为树高曲线。
要用径阶平均胸径对应的树高值与曲线值和株
数进行曲线的调整。
利用调整后的曲线,依据林分平均直径(
g
D)由树高曲线上查出相应的树高,即为林分条件平均高。
同理可由树高曲线确定各径阶的平均高。
树高曲线实质是一条平均值曲线,但同一份资料每人随手绘出的曲线常常会不相同,必须通过检查调整保证曲线反映出平均值。
通常采用计算平均离差的方法进行调整,平均离差的计算方法为:
∑
=
-
=
∆
k
1
i
i
)
(f
Ti
Oi
H
H(3-1)
∑
=
∆
=
∆
k
i
i
f
1
(3-2)式中:∆—离差代数和;
i
f—第i径阶的林木株数;
Oi
H—第i径阶林木平均高的实际值;
Ti
H—第i径阶林木平均高的曲线值;
k—径阶个数;
∆—平均离差。
根据离差的“+”或“-”调整曲线的高低,直到调整后的曲线满足平均离差等于“0”或接近“0”,曲线可以使用。
采用图解法绘制树高曲线,方法简便易行,但绘制技术和实践经验要求较高,必须保证树高曲线的绘制质量。
注意:小组内每人用输入的数据绘制树高曲线,并按公式计算出自己所绘曲线的平均离差。
(二)数式法
1. 备选模型的确定
确定备选模型的方法有两种:a)根据专业理论知识(从理论上推导或根据以往的经验)和前人研究结果来确定;b)在a不能确定的情况下,通过观测自变量和因变量之间散点图,并结合专业知识确定模型的大体类型。
只有一个自变量时,根据散点图并结合专业知识较容易确定曲线类型和模型。
但是,对于多个自变量的问题,由于变量之间的相互影响很难确定候选模型。
分析者可以根据以往类似问题的研究结果,并通过分析各个自变量和因变量的散点图来确定。
迄今为止国内外提出了上百种树高曲线模型,表4-3中仅列出了具有代表性的22种树高曲线方程。
实际工作中,可以根据不同的树种选用这些树高曲线方程。
2)参数的估计及统计推断
测树学中许多模型,如树高曲线、削度方程、树木生长方程及收获模型等,均属于典型的非线性回归模型,估计参数时需采用非线性最小二乘法(详见有关文献)。
许多高级统计软件包,如SAS、SPSS、Statistica、统计之林等,均提供了这些非线性回归模型的参数估计方法。
任何一种参数估计方法,均需要给定回归模型参数初始值。
因此,在非线性回归模型参数估计时,初始值的选择非常重要。
如果初始值选择不当,就可能收敛很慢,或者收敛到局部极小值,甚至不收敛。
初始值选择得当,一般收敛很快,如果存在多个极小点,则能收敛到全局极小点而不是局部极小点。
3)备选模型的比较
结合各候选模型参数检验结果,进一步比较各模型拟合统计量,从中选择几个最佳模型(一般2-3个)作为最终模型的候选模型进行的残差分析和独立性检验。
对于线性和内线性回归模型,可以采用MSE,R2,R2a,AIC和PRESS等拟合统计量作为比较和评价备选模型的标准。
各统计量的表达式和具体比较方法如下:
1)残差均方(MSE)
MSE-
=(3-3)
SSE
)
/(p
n
MSE统计量广泛地用作选定模型的标准,一般选择具有最小MSE值的备选回归作为最终模型。
然而,当分析者的目的在于估计参数或者是选定一个模型用于外推的目的,这种方法是最适合的;如果分析者的目的是为了选择一个用于提供可靠估计值的模型(林业上的回归分析多为此目的),MSE统计量可能应该按以下方法使用。
①p值很大时,绘MSE对应于p个变量的关系图,MSE值通常围绕着一条水平线上
下波动。
MSE值与线的关系表示了δ2值,因为MSE值常为δ2的满意估计值。
②由备选模型中选择最终模型,应具备以下两点最优配合的原则:(i)模型最小,即
自变量最少;(ii )具有合理的最为近于δ2值的MSE 值。
2) 相关指数(R 2)
SST
SSE R -
=12 (3-4)
随着模型中自变量个数的增多,R 2值会变小,同时,很少以R 2最大作为选择最优方程的依据。
选择最优模型的依据应该是:(a )变量越少越好;(b )R 2值实质上不小于R 2max (R 2的最大值)。
如果最大模型中所含的变量也存在于其他模型之中,通常,可以用R 2值对应于p 值作图。
这种典型图反映了在p 值大的情况下R 2值随着p 值的减小而接近于R 2max 的上渐近线。
然而,有一个点,它是R 2值急骤下降的起点,这个点对应p 值相应的模型常被定为最终模型。
3) 修正的相关指数(2
a R )
()
⎪⎭⎫ ⎝⎛--=⎪⎪⎭
⎫ ⎝⎛----=SST n SSE p n n R R a 1111122
(3-5) 这个统计量基本上与MSE 等价,MSE 更便于解释。
因此,作为选择模型的标准,MSE
优于2
a R 。
4) 预测平方和统计量(PRESS )
以上介绍的几种基于预测的统计量都有一个共同的缺点,即在计算某点的预测偏差时,该点曾在建立回归模型时已经使用过。
PRESS 统计量克服了这一缺点:
∑=-=
n
i ip i
y
y
PRESS 1
2)ˆ( (3-6) 式中 i y 为第i 个Y 的观测值;
ip y ˆ为原始数据中删除第i 个样本观测值后,按p 个参数模型拟合回归方程计算出
相应的第i 个观测值x i 的因变量y 的预测值。
PRESS 统计量的计算,要求使用n 个不同数据,分别拟合p 个参数的模型之后,对于每一个回归分别求算出相应的PRESS 统计量。
采用PRESS 统计量选择模型,实际上是最优调和两种有时相矛盾因素的方法。
第一种是选择较小p 值的模型;第二种是选择PRESS 值并不比备选模型PRESS 值中最小的PRESS min 值明显过大的模型。
近年来,人们越来越多地采用PRESS 统计量作为选择模型标准,特别是将预测作为建模的目的时,这个统计量具有直观的吸引力。
但是,当数据组过多时,计算工作量过大。
每人最少选用3个方程拟合。
四、实验报告
1.随手绘制的树高曲线。
平均离差?利用树高曲线图计算的各径阶平均高、林分平均高。
2.3个树高曲线模型的参数拟合结果。
哪个方程最优?,计算出林分平均高? 3. 正态分布规律的验证:
在方格纸上,以横轴示径阶,纵轴示株数,把每木调查所得的各径阶株数点绘于图上,联结各点得折线图,观察该林分的直径分布状态。
4. 求算林分最大径阶和最小径阶之组中值与林分平均直径之比值;
5. 求算优势木平均高,以优势木的算术平均高作为上层木平均高。
6. 求算最大、最小树高与林分平均高的比值并观察其范围大小。
每人一份报告,以组形式上交。