第八章 参估计方法
![第八章 参估计方法](https://img.360docs.net/imge3/1qjzbg4pch3s6oqdpdyl26ov6rt4qykj-31.webp)
![第八章 参估计方法](https://img.360docs.net/imge3/1qjzbg4pch3s6oqdpdyl26ov6rt4qykj-52.webp)
第八章参数估计方法
研究工作的目的在于了解总体特征的有关信息,因而用样本统计数估计相应总体参数,并由之进行统计推断。总体特征的各种参数,在前几章主要涉及平均数、标准差等,并只从直观上介绍其定义和公式,未就其历,即参数估计(parameter estimation)的方法作讨论。本章将简要介绍几种常用参数估计方法,即矩法、最小二乘法、极大似然法。第五章述及参数的点估计(point estimation)和区间估计(interval estimation),本章讨论点估计方法。区间估计是在点估计的基础上结合统计数的抽样分布而进一步作出的推论,有关内容将散见在其它各章。
第一节农业科学中的主要参数及其估计量的评选标准
一、农业科学中的主要参数
农业科学研究中需要估计的参数是多种多样的,主要包括总体数量特征值参数,例如,用平均数来估计品种的产量,用平均数差数来估计施肥等处理的效应;用百分数(或比例)来估计遗传分离比例、群体基因或基因型频率、2个连锁主基因间的重组率;通过变异来源的剖分,用方差来估计环境方差、遗传方差和表型方差,在此基础上以估计性状的遗传力等遗传参数;用标准误来估计有关统计数的抽样误差,如重组率的标准误、遗传抽样误差、遗传多样性误差、频率误差等。在揭示变数间的相互关系方面,用相关系数来描述2个变数间的线性关系;用回归系数、偏回归系数等来描述原因变数变化所引起的结果变数的平均变化的数量,用通径系数来描述成分性状对目标性状的贡献程度等。有关数量关系和数量变化方面的内容将在第9至11章介绍。
二、参数估计量的评选标准
讨论参数估计方法前需要了解数学期望(expectation)的概念和评价估计方法优劣的标准。
(一) 数学期望
在抽样分布中,已经讲述了从总体中抽出所有可能样本的样本平均数的平均数等于总体平均数,这里,样本平均数的平均数就是一种数学期望。例如,一个大豆品种的含油量为20%,测定一次可能是大于20%,再测定可能小于20%,大量反复测定后平均结果为20%,这时20%便可看作为该大豆品种含油量的数学期望,而每单独测定一次所获的值只是1个随机变量。抽象地,随机变量的数字特征是指随机变量的数学期望值,本书以前各章常见的数学期望有平均数和方差等。求数学期望往往是求总体的特征参数表达式。
对于离散型(间断性)随机变量y的分布列为:P{y=y i}=p i,其中,i=1,2,…,那么随机变量y的数学期望E(y)为:
∑=∞
=1
i i i p y y E )( (8·1)
这样可以求得总体平均值。
对于连续型随机变数y 的数学期望E (y )为:
E (y )=?+∞
∞-dy y yf )
( (8·2) 其中f (y )为随机变量y 的概率密度函数,这样可以求得总体均值。
方差在前面已有大量应用,这里用D (y )表示,有
D (y )=
E [y -E (y )]2 (8·3)
这就是随机变量函数的数学期望。同理,离散型随机变量方差的数学期望为: []∑-=+∞
=12
i i i p y E y y D )()( (8·4)
连续型随机变量方差的数学期望为:
[]?-=+∞
∞-dy y f y E y y D )()()(2 (8·5) 数学期望有这样一些常用的性质:(1) 常数的数学期望为常数本身;(2) 随机变量与常数的乘积的数学期望是常数与随机变量的数学期望的乘积;(3) 多个随机变量分别与常数的乘积的求和函数的数学期望是常数与多个随机变量的数学期望的乘积的和;(4) 多个相互独立的随机变量的乘积的数学期望是多个随机变量的数学期望的乘积。
(二) 参数估计量的评选标准
参数估计可用不同的方法,后文将介绍矩法、最小二乘法和极大似然法等,使用不同的方法会得到不同的参数估计量(parameter estimator ),各种估计量均有其优点,评价估计量优劣的标准主要有无偏性、有效性、相合性等。
(1) 无偏性 参数估计量的期望值与参数真值是相等的,这种性质称为无偏性,具有无偏性的估计量称为无偏估计量。例如,在抽样分布中已经介绍了离均差平方和除以自由度得到的均方的平均数等于总体方差,即该均方的数学期望等于相应总体参数方差,这就是说该均方估计量是无偏的。估计量的数学期望值在样本容量趋近于无穷大时与参数的真值相等的性质称为渐进无偏性,具有渐进无偏性的估计量称为渐进无偏估计量。
(2) 有效性 无偏性表示估计值是在真值周围波动的一个数值,即无偏性表示估计值与真值间平均差异为0,近似可以用估计值作为真值的一个代表。同一个参数可以有许多无偏估计量,但不同估计量的期望方差不同,也就是估计量在真值周围的波动大小不同。估计量的期望方差越大说明用其估计值代表相应真值的有效性越差;否则越好,越有效。不同的估计量具有不同的方差,方差最小说明最有效。如果一个无偏估计量相对与其它所有可能无偏估计量,其期望方差最小,那么称这种估计量为一致最小方差无偏估计量。
(3) 相合性 用估计量估计参数涉及一个样本容量大小问题,如果样本容量越大估计值越接近真值,那么这种估计量是相合估计量。
除以上三方面标准外,还有充分性与完备性也是常考虑的。充分性指估计量应充分利用样本中每一变量的信息;完备性指该估计量是充分的唯一的无偏估计量。
前几章介绍了平均数与方差的计算公式,实际上估计总体平均数与方差有多种统计数或公式,如平均数有算术平均数、中数、众数等,方差有以(n -1)或n 为除数的方法等。经比较算术平均数与由自由度n -1计算的方差最符合上述各项标准的综合要求,因而得到广泛的应用。
第二节 矩法
一、矩的概念
矩(moment )分为原点矩和中心矩两种。对于样本n y y y ,,,Λ21,各观测值的k 次方的平
均值,称为样本的k 阶原点矩,记为k y ,有∑==n
i k i k y n y 11,例如,算术平均数就是一阶原点矩;
用观测值减去平均数得到的离均差的k 次方的平均数称为样本的k 阶中心矩,记为k y y )(-或
k μ
?,有∑-=-=n i k i k y y n y y 1)(1)(,例如,样本方差∑-=n
i i y y n 1
2)(1就是二阶中心矩。 对于总体N y y y ,,,Λ21,各观测值的k 次方的平均值,称为总体的k 阶原点矩,记为
)(k y E ,有∑==N
i k i k y N y E 1
1)(;用观测值减去平均数得到的离均差的k 次方的平均数称为总体的
k 阶中心矩,记为])[(k y E μ-或k μ,有∑-=-=N
i k i k y N y E 1
)(1])[(μμ。
二、矩法及矩估计量
所谓矩法就是利用样本各阶原点矩来估计总体相应各阶原点矩的方法,即
∑==n
i k i k y n y 1
1→)(k y E (8·6)
并且也可以用样本各阶原点矩的函数来估计总体各阶原点矩同一函数,即若
))(,),(),((k y E y E y E f Q Λ2=
则
),,,(k y y y f Q Λ2?= 由此得到的估计量称为矩估计量。
[例8.1] 现获得正态分布),(2σμN 的随机样本n y y y ,,,Λ21,要求正态分布),(2σμN 参数μ和2σ的矩估计量。
首先,求正态分布总体的1阶原点矩和2阶中心矩: ?
=??
?
???--?=?
=∞+∞
-∞
+∞
-μσμσπdy y y dy y yf y E 2
2exp 2)(21
)()( (此处??????--22exp σμ2)(y 表示自然对数底数e 的??
????--2
2σμ2)(y 的指数式,即]
[2)(22
σμ--y e ) 2
2
22
2
exp σσμσπμμμ?=??
????--?-=?-=-∞+∞
-∞
+∞
-dy y y dy y f y y E 2)(21
)()()()][(2
然后求样本的1阶原点矩和2阶中心矩,为
∑-==∑====n
i i n i i y y n s y n y 1
2221??)(1,1μμ
最后,利用矩法,获得总体平均数和方差的矩估计
∑-==∑====n
i i n i i y y n s y n y 1
2221??)(1,1σμ
故总体平均数和方差的矩估计值分别为样本平均数和样本方差,方差的分母为n 。 单峰分布曲线还有二个特征数,即偏度(skewness )与峰度(kurtosis ),可分别用三阶中心矩
3μ和四阶中心矩4μ来度量。但3μ和4μ是有单位的,为转化成相对数以便不同分布之间的比
较,可分别用偏度系数和峰度系数作测度。偏度系数(coefficient of skewness )是指3阶中心矩与标准差的3次方之比;峰度系数(coefficient of kurtosis )是指4阶中心矩与标准差的4次方之比。当偏度为正值时,分布向大于平均数方向偏斜;偏度为负值时则向小于平均数方向偏斜;当偏度的绝对值大于2时,分布的偏斜程度严重。当峰度大于3时,分布比较陡峭,峰态明显,即总体变数的分布比较集中。
由样本计算的偏度系数cs =2
31i 21
i 3
)(1)(1??
????∑-∑-===n i n
i y y n y y n 33??μ (8·7) 峰度系数ck =2
4
1i 21
i 4
)(1)(1??
????∑-∑-===n
i n
i y y n y y n 44??σμ
(8·8) [例8.2] 计算表3.4数据资料(140行水稻产量)所属分布曲线的偏度和峰度。
首先,计算样本的2、3、4阶中心矩432???μμμ
,,,以及标准差估计值: ∑-==n
i i y y n 122?)(1μ=1303.735
∑-==n
i i y y n 133?)(1μ
=3953.891 ∑-==n i i y y n 1
44?)(1μ=4.67729×106
∑-==n i y y n 1
2
2??)(1μσ=36.107
然后,根据矩法原理,该分布的偏度与峰度估计值分别为:
cs =0.0849=33?/?σμ
ck = 2.752=43?/?σμ
因此,说明资料比较集中在平均数左右,分布曲线并不是特别陡峭。
[例8.3] 例6.9为研究籼粳稻杂交F 5代系间单株干草重的遗传变异,随机抽取76个系进行试验,每系随机取2个样品测定干草重(g /株)。按单向分组方差分析进行分析,结果见表6.9。此处用来说明由矩法估计误差2σ、遗传方差2τσ和干草的遗传力h 2。
因为76个系是随机抽取的,因而为随机模型。方差结果说明系间差异显著,因而系间效应存在。根据矩法,首先应求出系间和误差变异来源的样本均方和总体期望均方(表6.9)。 然后,利用矩估计原理,令样本的均方与总体相应变异的期望均方相等,从而求出2σ和2τσ的矩估计值。
此处E (MS 系统间)=E [T t -E (T t )]2
,(T t 为各个系统的总和数) =22τσσn +
E (MS 误差)=E (e 2
),(e 为误差)
=2σ
因而 17.77=2?σ
72.792=+22??τσσ
2?τσ
=(72.79-17.77)/2=27.51 2222
22
222
????????σσ
σσσσ
σσττ+=+==e g g p g h =+17.7727.5127.51
60.76%
第三节 最小二乘法
从总体中抽出的样本观察值与总体平均数是有差异的,这种差异属于抽样误差。因而,在
总体平均数估计时要尽可能地降低这种误差,使总体平均数估计值尽可能好。参数估计的最小二乘法就是基于这种考虑提出的。其基本思想是使误差平方和最小,达到在误差之间建立一种平衡,以防止某一极端误差对决定参数的估计值起支配地位。这有助于揭示更接近真实的状况。具体方法是为使误差平方和Q 为最小,可通过求Q 对待估参数的偏导数,并令其等于0,以求得参数估计量。
[例8.4] 用最小二乘法求总体平均数μ的估计量。
若从平均数为μ的总体中抽得样本为y 1、y 2、y 3、…、y n ,则观察值可剖分为总体平均数μ与误差e i 之和,
i i e y +=μ
总体平均数μ的最小二乘估计量就是使y i 与μ间的误差平方和为最小,即
∑-=∑==n
i i i y e Q 12?2)(μ
为最小。为获得其最小值,求Q 对μ的导数,并令导数等于0,可得:
0)(2=∑--=??=n i i y Q
1?μ
μ 即总体平均数的估计量为:
∑==n
i i y n 1
?1μ
因此,算术平均数为总体平均数的最小二乘估计。这与矩法估计是一致的。此处顺便介绍估计离均差平方和2)(y y Q i -∑='的数学期望:
])([])([)(22μμ+--∑=-∑='y y E y y E Q E i i
n
n n y y E y y y y E i i i /])(-)([])())((2-)([2
2
2
2
22σσμμμμμμ-=-∑-∑=-∑+--∑-∑=
=(n -1)2σ
因而,2σ估计为:
2?σ
=1)(1)(-∑-=-'n y y n Q i 2)( 与矩法所得不同,而与常规以自由度为除数法一致。
[例8.5] 求例6.13的两向分组方差分析资料缺1个小区(表8.1)的最小二乘估计量和估计值。
从第6章可知,这种资料模式的线性模型为:ij j i ij y εβτμ+++=。该模型的约束条件为:∑==a
i i 10τ,∑==r
j j 1
0β和误差项服从正态分布。按照最小二乘法的估计原理,使
∑∑∑---=∑===a i j i ij r
j ij y Q 121
2?)(βτμε
为最小时可以求出效应和缺失小区y e 的估计量,即 ???
???????
???∑∑=---=??∑=----=??∑=----=??∑∑=----=??======a i r j j i ij e a i j i ij j r j j i ij i a i r
j j i ij y y Q y Q y Q y Q 11
11
11
)2(0
1))(2(01))(2(01))(2(βτμβτμββτμτ
βτμμ 从而,最小二乘估计量分别为:
∑∑-∑+∑=++=∑∑-∑=-=∑∑-∑=-=∑∑==============a i r
j ij
a i ij r j ij j i e a i r j ij a i ij j j a i r
j ij
r j ij i i a i r
j ij
y ar y a y r y y ar y a y y y ar y r y y y ar y 11
1111
111
111
???????11111111βτμβτμ
表8.1 生长素处理豌豆的试验结果
处 理 (A ) 组(B ) 总和i T 平均i y Ⅰ Ⅱ Ⅲ
Ⅳ 对照(CK ) 60 62 61 60 243 60.8 赤霉素 65 65 68 y e 198+y e 动力精 63 61 61 60 245 61.3 吲哚乙酸 64 67 63 61 255 63.8 硫酸腺嘌吟 62 65 62 64 253 63.3 马来酸 61 62 62 65 250 62.5 总 和 j T
375
382
377
310+y e
T =1444+y e
因而表8.1中,缺失小区的估计值可由下式求出:
6
4144463104198?+-
+++=e
e e e y y y y 解上述方程,最小二乘估计值为:y e =65.6。 缺区估计是根据线性模型,以及最小二乘法的原理得到的。不过,试验中尽可能不要缺区,因为缺区估计尽管可以估计缺区的值,但是误差的自由度将减少,本试验的误差自由度将减少1。
一般地,若m 个自变数x 1、x 2、x 3、…、x m 与依变数y 存在统计模型关系
εθθθ+=),,,;,,
,(k m x x x f y ΛΛ2121 (8·9) 其中,k θθθ,,
,Λ21为待估参数。通过n 次观测(n >k )得到n 组含有),1,2,(,,,,n i y x x x i mi i i ΛΛ=21的数据以估计k θθθ,,,Λ21。其最小二乘估计值为使
221211
1
2][?),,,;,,,(k mi i i i n i n
i x x x f y Q θθθε
ΛΛ-∑∑==== (8·10) 为最小的k
θθθ???21,,,Λ。这种估计方法称为参数估计的最小二乘法(least squares ),或最小平方法。第9章将应用最小二乘法估计线性回归中有关参数的估计量,此处不再赘述。
第四节 极大似然法
极大似然法(maximum likelihood method )是参数估计的重要方法。首先,通过举例来说明其思路。例如,有1个射手射击3次,命中0次。试问该射手的命中概率最有可能为3个命中概率:1/5、8/15和4/5中的哪一个?回答该问题可以从两方面来看,一方面,该射手的命中率为0,与此最接近的命中概率为1/5,即1/5最有可能;另一方面,分别假定该射手的命中率为1/5、8/15和4/5,根据二项分布原理分别计算出该射手射击3次命中0次的概率分别为:
3375
27)54(1)54(,3375343)158(1)158(,33751728)51(1)51(30
0330033003=
-=-=-C C C 因此,选择使事件发生概率最大的可能命中概率为1/5,从而认为该射手的命中概率最有可能为1/5。这种参数估计方法称为极大似然法。极大似然法,包括二个步骤:首先建立包括有该参数估计量的似然函数(likelihood function ),然后根据实验数据求出似然函数达极值时的参数估计量或估计值。上面根据二项分布计算概率,因而包含有待估概率的二项分布便是似然函数,它是关于待估参数的函数。由于试验结果是由总体参数决定的,那么参数估计值就应该使参数真值与试验结果尽可能一致,似然函数正是沟通参数与试验结果一致性的函数。
一、似然函数
对于离散型随机变量,似然函数是多个独立事件的概率函数的乘积,该乘积是概率函数值,它是关于总体参数的函数。例如,一只大口袋里有红、白、黑3种球,采用复置抽样50次,得到红、白、黑3种球的个数分别为12,24,14,那么根据多项式的理论,可以建立似然函数为:
143242121)()()(12!24!14!
50!
p p p
其中p 1,p 2,p 3分别为口袋中红、白、黑3种球的概率(p 3=1-p 1-p 2),它们是需要估计的。
对于连续型随机变量,似然函数是每个独立随机观测值的概率密度函数的乘积,则似然函数为:
);();();();,,,()(θθθθθn n y f y f y f y y y L L ΛΛ2121== (8·11) 若y 1服从正态分布),(2σμN ,则),(σμθ=,上式可变为:
]
)()[(212)(2)(2212
2
22
21222μμσσμσμσ
πσ
πσ
πσμ-++--
--
--==
n n y y n
y y e
e
e
L ΛΛ
)1(
11),((8·12)
二、极大似然估计
所谓极大似然估计就是指使似然函数为最大以获得总体参数估计的方法。其中,所获得的估计总体参数的表达式称为极大似然估计量,由该估计量获得的总体参数的估计值称为总体参数的极大似然估计值。为了计算上的方便,一般将似然函数取对数,称为对数似然函数,因为取对数后似然函数由乘积变为加式,其表达式为:
∑===n
i i n y f y y y L L 1
21,ln ln ln )();,,
,()(θθθΛ
(8·13) 通过对数似然函数和似然函数的极大化以估计总体参数的结果是一致的,一般说来,前者在计算上要容易处理些。因此,往往利用对数似然函数极大化的方法来获得极大似然估计。求极大似然估计量可以通过令对数似然函数对总体参数的偏导数等于0来获得,即当
),,,(l θθθθΛ21=,有
),,,;,,,(l n k y y y L θθθθΛΛ2121ln ??
0),,,;(=∑??
==l i n i k
y f θθθθΛ211(k =1,2,…,l ) (8·14)
由此获得总体参数的极大似然估计量。
[例8.6] 设n y y y ,,,Λ21是正态总体),(2σμN 的随机样本,求正态分布
),(2σμN 参数的极大似然估计量。
似然函数为:
∏
--
==n
i i y L 1
2
2
2]exp[σμσ
πσμ2)(21),(]exp[12
2
2
2∑--??
? ??==n i i n
y )(2121μσπσ 取对数,得:
∑----==n i i y n n L 1
2
2
22
ln ln ln )(212)(22),(μσσπσμ 那么似然方程组为:
???????∑=-+-=??∑=-=??n i n i y n L y L 124222122
ln ln 0)(212),(0)(1),(μσσσμσ
μσσμμ
解得:
因此,正态分布总体平均数的极大似然估计量为:∑===n
i i y y n 1
?1μ
。当总体平均值为未知时,方差估计量为∑-==n
i i y y n 1
22?)(1σ
;当总体平均值为已知时,方差估计量为∑-==n
i i y n 1
22?)(1μσ
。 [例8.7] 求红、白、黑球事例中p 1,p 2,p 3的极大似然估计值。
由
143242121)()()(12!24!14!
50!
p p p 可获得对数似然函数
)
(1142412142412)(21213
21321ln ln ln ln ln ln ,,ln p p p p C p p p C p p p L --+++=+++=
其中,C 为常数。分别求)1,,(2121ln p p p p L --对p 1,p 2的偏导数,并令为0,得似然方程组: ???????=-?--+=--??=-?--+=--??
01)(114241,,(01)(11412)1,,(21221212
21121211
) ln ln p p p p p p p L p p p p p p p p L p
联立求解,得:
7/2512/256/25,===321?,??p p p
显然,极大似然估计值321???p p p
,,等于其观测频率。 [例8.8] 两个亲本的基因型分别为AABB 和aabb ,这两个亲本杂交后F 2出现了4种基
因型,分别为A _B _、A _bb 、aaB _和aabb ,得到四种基因型的个数分别为c 、d 、e 、f ,已知AA 和BB 两对基因间存在连锁关系,现欲估计重组率?
设重组率为r ,根据遗传学推导,可以得到4种基因型的概率见表8.2。
表8.2 F 2群体基因型的分离情况
基 因 型 A _B _ A _bb aaB _ aabb 总数 观察得到基因型个数
c (289)
d (26)
e (29)
f (76)
n (420) 概 率
4
)(122r -+ 4)(112r -- 4)(112r -- 4)(12
r -
1
首先,通过表8.3介绍由两对连锁主基因控制的F 2群体16种基因型的概率计算出4种表
现型的概率(表8.2)。
表8.3 F 2群体的基因型及其概率
按多项式分布,可以根据概率函数得到似然函数为:
!!!!!
)(f e d c n r L =c r ??????-+4)(122d r ??????--4)(112e r ????
??--4)(112f
r ??????-4)(12 (8·15)
若以2)(1r -=θ代入上式,则似然函数和对数似然函数分别为: !!!!!
)(f e d c n L =θc
??????+42θd
??????-41θe
?
?
????-41θf
???
???4θ (8·16) ]ln[]ln[)(]ln[)(ln 4
4
142θ
θ
θθf
e d c k L +-++++= (k 是常数项) (8·17) 对上式求导数,并令导数为0,可得方程:
012=+-+-+θ
θθf e d c 上式化解为一元二次方程
02)22(=-+---f f e d c n θθ2
n
fn f e d c f e d c 28)22()22(+---±---=2?θ (8·18)
在θ
?的两个解中取一个符合遗传规律的解,那么,重组率的解为:θ??-=1r 。 对于本例,有
420
242076876)292262(28976)292262(289???++?-?-±+?-?-=2?θ
=0.1226±0.6140
取正根,θ
?=0.7366,由此,0.73661-=r ?=0.142。 统计理论已证明:重组率方差估计量为:
)2(12))(2(1)(θ
θθ
????++-=n r D (8·19)
对于本例,有 0.0190.7366)
2(142020.7366)
0.7366)(2(1)()(=?+??+-==r D r
s ??
三、关于三种估计方法的讨论
通过上述3种参数估计方法已获得总体平均数、方差的估计量。对于总体平均数的估计量,3种估计方法都具有无偏性、有效性和相合性;对于总体方差的估计量,由离均差平方和期望值所得的是无偏的,但由矩法和极大似然法所得两种估计量是有偏的,但都是相合的;最小二乘法无直接的总体方差估计量。
本章介绍了点估计的3种常用方法,但其要求不同。极大似然法要求已知总体的分布,才能获得估计量,另外两种方法对分布没有严格的要求。一般地,极大似然法估计结果大多具有无偏性、有效性和相合性等优良的估计量性质,因此被广泛采用,但也并不是该法估计的结果就一定最好,例如极大似然方法估计平均数尽管是无偏估计,但其估计的方差是有偏的,在样本容量小时不能很好地反映总体变异。最小二乘法在估计线性回归模型参数时具有灵活方便的特点,因此被广泛采用。矩估计方法由于不需要知道总体分布也是经常采用的方法,但该方法估计结果有时不具备优良的估计量性质,而且局限在与矩有关的估计量。
在实际应用中,往往将上述三种方法联系起来应用,有时它们估计结果是一样的,例如在固定模型情况下,如果误差是正态的,那么应用上述三种方法估计处理的效应是一致的。
本章例题中给出的估计量多数在前面已经用到,这里只是简要说明估计原理,学习时可对照前面的例题以加深理解。估计方法在应用中是很复杂的,本章只举出了几个简单的例子,详细学习可参阅数理统计专业书籍。
习 题
8.1 用矩法估计原理解释均方与期望均方间的关系。
8.2 何谓矩法、最小二乘法和极大似然法?何谓估计量、估计值?
8.3 某正态总体的随机样本观察值为:9.56、8.33、10.12、10.28、8.85、11.19、11.18、9.96、10.32、10.17、9.81、10.72。试求算平均数和方差的极大似然估计值。
[答案:平均数10.04,方差0.787]。
8.4 从二项总体(包含0,1两个数值的总体)随机抽样得到10组每组15次,计算每组的总和数,得到10个观察值3、2、0、4、2、4、2、0、1、3。试用极大似然法求总体平均数和方差估计值。
[答案:平均数0.2,方差:1.89]
8.5 为检验某种自来水消毒设备的效果,现从消毒后的水中随机抽取50L ,化验每升水中大肠杆菌的个数(一升水中大肠杆菌个数服从Poisson 分布),化验结果如下:
大肠杆菌数/L 0 1 2 3 4 5 6 升 数
17
20
10
2
1
试问平均每升水中大肠杆菌个数为多少时,才能使上述情况的概率为最大?
[答案:1]
8.6 在一个回交群体中出现的基因型的个数和与其期望数列于下表,试求出重组率r AB 的极大似然估计量。
基因型 AaBb Aabb aaBb aabb 总 计 观测数 a b c d n
期望数
)(12
AB r n
- AB r n
2
AB r n
2
)(12
AB r n
- n
[答案:n c b r
AB )/(+=?] 8.7 以下数据可用模型e cx bx a y +++=2进行分析,模型中e 是正态性误差,试用最小二乘
法求参数a ,b ,c 的估计值。
x 8 7 5 9 7 9 7 5 6 8 x 2 64 49 25 81 49 81 49 25 36 64 y
29.19
25.35
14.44
38.51
24.29
37.62
25.31
14.57
17.82
30.74
[答案:4.9783、-0.3351、0.4433] 8.7 设总体y 的分布密度为:
?????+=,其它
01<,0<1)();(
2y y a a y p
y 1,y 2,…,y n 为其样本,求参数a 的矩估计量和极大似然估计量。若样本值为0.1,0.2,0.9,
0.8,0.7,0.7,求参数a 的估计值。 [答案:0.3,0.2]