SAS统计分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最小值 7.4 6.O 20.0 3.2 100.0
最大值 22.5 13.0 24.0 3.9 114.0
2.02618×(1.54919/4.13944)=0.75830010。各通径系
每株穗数 每穗小穗数
百粒重 株高 单株产量
塞!主亡!量圭曼室茎焦堕塑笪塑羞墨塑
每棒疆救
每■小疆
百粒t
株高
l 0000
性状
每捧稚敦 每暮结实小穗教 百粒重 照亘
每髑数
Q:!§!§Q!li# 一0.10293193 O.37970463 :!:!!!!!!!!
每焉篙小
一o.0262239i Q:!13112Ⅱ· —0.02876438
!:!!塑i!塑
百粒重
株高
o.i7i21768 -o.00i98i73
一O.05056135
st扭d砌zadon calclllated by a
medlod of re伊e鼹ion coe伍cient.
an如is Tllis paper discu鼹sAs procedure of padl
by uSing correladon and padl aIlalysis of mai芏l a蓼onoInical
n岫ber characterisdcs of龟ngchaIl
3 w-heat.Pam coe伍dent iS
O.00654556
Q:a3塑3鲤±# Io.∞190071
:!:!!!!!塑!坠箜§2±卫
;盖麓萎
o 8973i磊
0.04619 0.6姻98#
二!:塑堑!
的简单相关系数,可分解为该自变量与因变量之间的 直接通径系数加上所有其它间接通径系数之代数和. 如每株穗数与单株籽粒产量问的相关系数ryl=pyl+ r12py2+r13py3+r14py4 20.75830213+(一0.02622391)+ 0.17021768+(一O.00498173)=0.89731其它性状与株产 之间相关系数的分解与此相同.
残差标准差的估计值为1.35711,这些都说明所求的线
性回归方程非常显著,作y关于x。X2 X3)【I的通径分析
是有意义的。
模型 误差 总和 均方根 因变量均值 变异系数
221.47175 18.41758 239.88933
舻 校正R2
2.4通径系数的计算及显著性检验 根据通径系数为标准的偏回归系数回,可求得各自
(3)百粒重与单株籽粒产量的相关系数以及直接通 径系数都较大,且都达到了极显著水平。百粒重通过株 高和每穗结实小穗数对单株籽粒产量所起的负向作用 较小,但通过每株穗数对单株籽粒产量的间接通径系数 (0.37970463)是所有间接通径系数中最大者,并且还高 出百粒重自身的直接通径系数(0.33993904)4个百分 点,这表明在对百粒重性状进行选择时,通过每株穗数 间接选择效果比直接选择效果还好.百粒重通过每株穗 数的问接通径系数之所以最大,原因在于百粒重与每株 穗数间的相关系数达到了显著水平,其余性状间不显著 (表4)M。
表中画“一”的数为直接通径系数,其余为间接通
径系数。 由表5可看出,各性状对单株籽粒产量的作用由大
到小依次为每株穗数>百粒重>每穗结实小穗数>株高。 (1)每株穗数与单株籽粒的相关系数最大(R=
0.89731),直接通径系数亦最大(pyl=0.75830213),且都 达到极显著水平。每株穗数通过其它性状的间接效应较 小,这说明每株穗数对单株籽粒产量的作用主要来自于 本身。当每株穗数增加一个标准差单位(sXl=1.54919 个)可使单株籽粒产量增加0.89731个标准差单位(呵=
万方数据
一18—
《计算机与农业》2003年第4期 农业信息化
1)3)对影响因素的研究人们常采用的方法是多 元回归分析。多元回归分析虽能选择最有影响的因素 进入回归方程,但它不能解释那些因素对因变量有直 接作用,那些有间接作用,以及因素间的相互作用。通 径分析通过对相关系数的分解,使人们能够透过相关 这一表面现象看清自变量对因变量的直接、间接作用 程度。从而性状的选择上提供了行之有效的方法。
2结果与分析
2.1 SAS程序
(1ata】dao栅:
input y x卜x4@@;
cards: 15.7 10 23 3.6 113 14.5 9 20 3.6 106 17.5 10 22 3.7 111 22.5 13 21 3.7 109 15.5 10 22 3.6 110 16.9 10 23 3.5 103 8.6 8 23 3.3 100 17.0 10 24 3.4 114 13.7 10 20 3.4 104 13.4 10 21 3.4 110 20.3 10 23 3.9 104 10.2 8 21 3.5 109 7.4 6 23 312 114 11.6 8 21 3.7 113 12.3 9 22 3.6 105
1材料与方法
1.1材料来源 分析数据来自文献【1】多元回归部分。具体数值见
以下所编sAs程序部分。 1.2分析方法
以小麦丰产3号单株籽粒产量为因变量y,每株 穗数为自变量x。,每穗结实小穗数为自变量X2,百粒重 为自变量X3,株高为自变量】(4,利用SAs拟合因变量关 于自变量的线性回归方程。然后通过标准化回归系数 方法计算各自变量对因变量的通径系数。最后将各自 变量(农艺性状)与因变量(株产)的相关系数进行分解, 并对通径分析结果作出全面解释。
pye2
2.5相关系数的分解及通径分析结果的解释 回归方程中任一自变量除可通过直接作用引起
因变量变化外(大小以直接通径系数衡量),还可通过 与其相关的其他自变量间接引起因变量的变化(大小 以间接通径系数衡量)。某一自变量通过另一自变量间 接作用于因变量的间接通径系数等于另一自变量的直 接通径系数乘以二者的相关系数。例如,每株穗数通过 百粒重作用于单株籽粒产量的间接通径系数为py37 r13=O.50073×0.33993904=O.17021768,其他自变量的 间接通径系数求法与此相同,其计算结果列于表5。 通径分析的理论业已证明,任一自变量与因变量之间
参考文献 【1】盖钧镒.试验统计方法.北京:中国农业出版社,2000年 【2】李永孝.农业应用生物统计.济南:山东科学技术出版社,
1998年 [3】边宽江等.小麦品种产量与产量因素通径分析.西北农业学 报,1999,8(2):20 ̄21 【4】梁晓玲等.玉米杂交种的产量比较及主要农艺性状的相关
和通径分析.玉米科学,2001,9(1):1伊20
P值 0.∞30 O.O∞l 0.056l 0∞75 O.5626
由表1可得多重线性回归方程:
= y
一51.902066 +2.02618x1 +0.653997x2 +
7.796938x3+0.049697x4
对截距一51.902066检验结果, t=一3.887,p≤
0.003;各偏回归系数显著性检验结果为x,X3达极显著
(4) 株高与单株籽粒产量呈弱负相关(R=一 0.00651),直接通径系数最小(py4=0.05304790),且不显 著.通过其它性状的的正负间接作用都不大,说明株高 对单株籽粒产量的影响不明显,故在选择时不作为重 点。
3小结与讨论
1)以小麦丰产3号各农艺性状与单株籽粒产量间 的相关及通径分析为例,提供了sAs分析的样板程序, 并对通径分析的全过程作了详细阐述.业已证明利用 sAS统计软件结合多元线性回归的理论进行通径分析 是完全可行的。
4.139449),即0.89731×4.13944=3.714369 (2)每穗结实小穗数与单株籽粒产量之间的相关系
数不显著,直接通径系数虽接近显著水平,但由于通过 百粒重和每株穗数的间接效应皆为负值,使得最后对单 株籽粒产量的效应小到O.04619。这说明在对每穗结实 小穗数进行选择时必须兼顾其它性状的选择才能获得 丰产效果。
水平,X2接近显著水平,x4不显著.说明除株高外,截距
和其它三项偏回归系数与0之间差别显著,可认为所求
的直线回归方程成立。
2.3方差分析
方差分析的目的是为了检验所求的线性回归方程
是否显著。从表2可以看出,F=30.063,p≤O.0001,多元
决定系数R2=0.9232,校正多元决定系数R2=0.8925,
【中图分类号】 S126
【文献标识码】B
【文章编号】1007—6581(2003)04一o0017一03
通径分析作为一种衡量自变量(性状)相对重要性 的方法,已在众多领域得到广泛应用。但由于其样本量 之大,计算过程复杂,使得一些分析难以进行,计算结 果不够准确。如何利用sAs统计软件实现其计算过程 的自动化,笔者就此进行了论述,旨在方便读者处理各 种类型有关通径分析的资料。
O.∞000∞0
1
2.026l∞
0.7鼹30213
标准误差 13.35181742 O.27204247
1
0.653997
O.19319217
O.3027∞79
1
7.796938
0.33993904
2.33281450
l
0.049697
n 05304790
n 082鲫779
t值 —3.蚰7 7.448 2.161 3.342 晚5鲫
2)通径网络应尽可能是一个封闭系统,即影响反 映变量y的所有因素都应尽可能包含在系统中.其度量 指标为多元决定系数R2.生物学系统虽不能达到全封 闭,但一个可能应用于实践的系统,R2应在0.9左右,并
尽可能接近于1.本例中勉=0.9232, 剩余通径系数
pye=0.277128,仅次于百粒重对单株籽粒产量的直接效 应(py3=0.33993904),这说明对影响因素的估计还不完 全,还有些因素有待于继续探讨。
《计算机与农业》2003年第4期 研究开发
通径分析的SAS实现方法
任红松,吕新,曹连莆,袁继勇
(石河子大学新疆作物高产研究中心,新疆石河子832003)
摘要:本文以小麦丰产3号主要农艺性状的相关及通径分析为例,阐明其SAS实施过程。并通过标准化回归系数的方法计算通 径系数,最后在各性状与产量的相关系数分解为直接通径系数和间接通径系数之和的基础上对通径分析结果作全面解释。 关键词:线性回归;相关系数;通径分析;sAs程序
Path柚l螂 -n地implem蜘ted memod of SAS in
REN H明g_∞嘴,LUⅪ,CAo Lian—pu,”啪J卜y0吣 0嘶iaIlg crop H讪Yidd Research center,shihezi university,
Abstmct:
Sllihezi,832003 Chma)
圻可:以=矿万:o.277128 出各自变量关于因变量的通径系数。比如pyl=
观涮须敦 15 15 15 15 15
均值 14.源自文库7333 9.柏0∞ 21.93333 3.54000 108.33333
标准差 4.13944 1.54919 1.22280 0 18048 4.41858
总和 217.1 141.0 329.0 53.10 1625
数 _0 13574
0.50073·
-0.09391
1.00000
—0.14889 l_00000
0.12339 —0 03583
1.00000
簟株产量
0.89731料 0.04619 O.68898村 —0.00651 1.00000
数显著性检验结果与上述各回归系数显著性检验结 果相同。上述回归方程的多元决定系数R2=o.9232,表 明因变量变异中92.32%可由线性回归部分来解释,误 差仅占7.68%,据此可求出误差e对y的通径系数
变量)d关于因变量y的通径系数分别为
pyl
20.75830213
py2
20.19319217
py320.33993904
py420.05304790
万方数据
—17—
《计算机与农业》2003年第4期 研究开发
这些通径系数值即为表1标准参数估计部分的值。由 于标准偏回归系数=自变量的回归系数×(自变量的标 准差/因变量的标准差),因而由表1和表3也可以算
'
proc corr; var y x1一x4;
ptoc te舀 model y=x1一x4/Stb;
rUn:
2.2参数估计及检验 参数估计部分给出了截距和偏回归系数的估计值
及标准误差和显著性检验结果(表1)
变量 截距 X1 X2 X3 x4
寰1 参数估计
自由度参数估计标准◆数估计
1
—51.∞2066