参数估计在实际问题中当所研究的总体分布类型已知但分布
几个抽样分布的性质及其应用
几个抽样分布的性质及其应用重庆师范大学涉外商贸学院数学与应用数学(师范)2008级阮国勇指导老师陈勇摘要在概率论中,我们是在随机变量的分布是假设已知的前提下去研究的;而数理统计中,随机变量的分布是未知或不完全知道。
我们通过对随机变量进行重复独立观察得到许多观察值,并对观察值的数据进行分析,从而对所研究的随机变量的分布做出推断。
本文介绍三种重要的抽样分布及其性质,并给出了抽样分布在参数估计、假设检验、分布拟合检验的简单应用。
χ分布;t分布;F分布关键词抽样分布;2Abstract In the theory of probability, we are in the distribution of random variable is assumed known base on the research, however,in the mathematical statistics, random variable distribution is unknown or incompletely known. we base on the random variables are independent observations are repeated many observed value, and the observation data analysis, to study the distribution of random variable to make inference. This paper introduces three kinds of important sampling distribution and its properties, and gives the sampling distribution in parameter estimation, hypothesis testing, fitting of distribution of the simple application.Key words sampling distribution, 2χdistribution, t distribution, F distribution第 1 页共 13 页目录1 引言 (4)2 几个有关概念2.1 总体、个体 (4)2.2 简单随机抽样 (4)2.3 统计量 (5)2.3.1 统计量的定义 (5)2.3.2 常用统计量 (5)2.4 自由度 (5)2.5 抽样分布 (6)3 常用抽样分布及其性质χ分布 (6)3.1 2χ分布的定义 (6)3.1.1 2χ分布的性质 (6)3.1.2 23.2 t分布 (7)3.2.1 t分布的定义 (7)3.2.2 t分布的性质 (7)3.3 F分布 (7)3.3.1 F分布的定义 (7)3.3.2 F分布的性质 (7)4 几个常用抽样分布的应用χ分布的应用 (8)4.1 2χ分布在参数估计中的应用 (8)4.1.1 2χ分布在假设检验中的应用 (8)4.1.2 2χ分布在分布拟合检验中的应用 (8)4.1.3 24.2 t分布的应用 (9)4.2.1 t分布在参数估计中的应用 (9)4.2.2 t分布在假设检验中的应用 (9)4.3 F分布的应用 (10)4.3.1 F分布在参数估计中的应用 (10)4.3.2 F分布在假设检验中的应用 (11)5 总结 (11)6 致谢 (12)7 参考文献 (13)1 引言数理统计中的统计估计与推断需要我们进行抽样估计,样本是统计估计和推断的依据,然而,在处理具体的理论与应用问题时,却很少直接利用样本,而利用他们经过适当处理导出来的量,这个量即统计量,统计量的分布称为抽样分布,三大分布都是在正态分布产生的,他们是正态总体统计估计和校验的基础。
概率论与数理统计讲义 (27)
原点矩
由矩法,
0
X 1
2
总体矩
样本矩
2
从中解得 ˆ 2X 1 , 即为 的矩估计.
1 X
例2 设X1,X2,…Xn是取自总体X的一个样本
X
~
f
(
x)
1
e( x
)
,
x
, 为未知参数
0,
其它
其中 >0,求 , 的矩估计.
解: 由密度函数知
X 具有均值为 的指数分布
故 E(X- )= 即 E(X)=
缺点是,当总体类型已知时,没有 充分利用分布提供的信息 . 一般场合下, 矩估计量不具有唯一性 .
其主要原因在于建立矩法方程时, 选取那些总体矩用相应样本矩代替带 有一定的随意性 .
第 七 章第一节 矩估计
矩是基于一种简单的“替换” 思想建立起来的一种估计方法 .
是英国统计学家K.皮尔逊最早提出的 .
其基本思想是用样本矩估计总体矩 . 理论依据: 大数定律
记总体k阶矩为 k E( X k )
样本k阶矩为
Ak
1 n
n i 1
X
k i
记总体k阶中心矩为 k E[ X E( X )]k
参数估计问题的一般提法
设有一个统计总体,总体的分布函数
为 F(x, ),其中为未知参数 ( 可以是
向量) . 现从该总体抽样,得样本 X1, X2 , … , Xn
要依据该样本对参数 作出估计,或估计 的某个已知函数 g( ) .
这类问题称为参数估计.
点估计
参数估计
区间估计
假如我们要估计某队男生的平均身高.
1
n
n i 1
X
m i
管理统计学习题参考答案第八章
第八章1. 解:(1)假设检验的基本思想是,样本平均数与总体平均数出现差异不外乎两种可能:一是改革后的总体平均长度不变,但由于抽样的随机性使样本平均数与总体平均数之间存在抽样误差;二是由于工艺条件的变化,使总体平均数发生了显著的变化。
因此,可以这样推断:如果样本平均数与总体平均数之间的差异不大,未超出抽样误差范围,则认为总体平均数不变;反之,如果样本平均数与总体平均数之间的差异超出了抽样误差范围,则认为总体平均数发生了显著的变化。
根据样本平均数的抽样分布定理,有x Z σx μ±=或Z /σμx x ≤-。
当0=Z 时,表明样本均值等于总体均值,即μx =;当Z 很大时,表明样本均值离总体均值很远,即∆很大。
后一种情况是小概率事件。
在正常情况下,小概率事件是不会发生的,那么在一次抽样中小概率事件居然发生了,我们就有理由认为样本均值是不正常的,它与原总体相比,性质已经发生变化,应该拒绝接受原假设。
(2)假设检验的一般步骤包括:① 提出原假设和备择假设;对每个假设检验问题,一般可同时提出两个相反的假设:原假设和备择假设。
原假设又称零假设,是正待检验的假设,记为H 0;备择假设是拒绝原假设后可供选择的假设,记为H 1。
原假设和备择假设是相互对立的,检验结果二者必取其一。
接受H 0,则必须拒绝H 1;反之,拒绝H 0则必须接受H 1。
② 选择适当的统计量,并确定其分布形式;不同的假设检验问题需要选择不同的统计量作为检验统计量。
在例中,我们所用的统计量是Z ,在H 0为真时,N Z ~(0,1)。
③选择显著性水平α,确定临界值;显著性水平表示H 0为真时拒绝H 0的概率,即拒绝原假设所冒的风险,用α表示。
假设检验就是应用了小概率事件实际不发生的原理。
这里的小概率就是指α。
但是要小到什么程度才算小概率? 对此并没有统一的标准。
通常取α=0.1,0.05,0.01。
给定了显著性水平α,就可由有关的概率分布表查得临界值,从而确定H 0的接受区域和拒绝区域。
应用数理统计——参数估计
这就是矩法估计的理论依据。
三、正态总体参数的区间估计 前面讨论了未知参数的点估计问题,它是用估计
量 θ 的值作为未知参数θ的估计。然而不管θ 是一 个怎样优良的估计量,它也只是一定程度的精确, 至于如何反映精确度,参数的点估计并没有回答。 由于θ 是一随机变量,需说明用θ 去估计θ的精度, 也就是要说明在一定概率意义下, 与θ的误差有 θ 多大。即确定具有特定概率意义的区间,使它以 相当大的概率包含未知参数的真值,以表明总体 参数真值所处的范围。
α
α
α
2
− uα
σ
n } = 1−α ) = 1−α
2
2
2
uα
2
σ
n
< µ < X + uα 2 < µ < x − uα 2
于是P{x − uα 2
σ
n
σ
n
例6:见教材82页例1。
(2)总体方差σ 2未知时,正态总体均值µ的区间估计
X −µ 因为若X服从N ( µ , σ ),则T = 服从t (n − 1) S n
2 2
小结:学习了
1、点估计法——矩法 2、评价估计量优劣的标准——无偏性、有效性 和一致性 3、正态总体的区间估计——均数和方差的区间估计 作业:教材98页第4题。 教材99页第10、13题。 教材100页第17、18题。
3、正态总体方差σ 的区间估计
2
因为若X服从N ( µ , σ 2 ),则χ 2 = 由附表4知P{χ12−α 2 < (n − 1) S 2
(n − 1) S 2
σ2
服从χ 2 (n − 1)
σ2
2 < χα 2 } = 1 − α
参数估计在数理统计学中总体的分布是未知的包括两种情形
第七章 参数估计
1、 矩估计法原理: 以样本矩作为相应地总体矩的估计量; 以样本矩的连续函数作为相应地总体矩的连续函数 的估计量.
设总体 X的 l阶矩 : l E ( X )(l 1,2, , k )存在时 ,
l
由辛钦大数定理知:
1 n l Al X i n i 1
参数估计问题是利用从总体抽样得到的信息来估 计总体的某些参数或者参数的某些函数. 估计新生儿的体重 估计废品率 估计湖中鱼数 在参数估计问题 中,假定总体分 估计降雨量 布形式已知,未 … 知的仅仅是一个 … 或几个参数.
第 2页
第七章 参数估计
参数估计方法:
(1)根据抽自总体的样本 X 1 , X 2 , , X n 去确定参数 空间 中的一点作为 的值
l x p( x;1 ,, k ), l 1,2,, k.
第14页
第七章 参数估计
这是包含 k个未知参数 1, , k 的联立方程组,
1 1 1 , 2 , , k , , , 2 2 1 2 k k k 1 , 2 , , k
其中 1 , , k 是待估参数 , X 1 , , X n为来自 X的样本 .
1) 求总体 X 的 l 阶矩 :
l E ( X ) x f ( x;1 ,, k )dx, l 1,2,, k .
l l
或 l E ( X l )
xR X
------点估计
(2)确定中的某一小部分作为 的取值的范围
------区间估计
第 3页
第七章 参数估计 §1 点估计 §3 估计量的评选标准 §4 区间估计 §5 正态总体均值与方差的区间估计 §6 (0-1)分布参数的区间估计 §7 单侧置信区间
第七章参数估计参考答案
f ( xi ; )
.
定义: 设总体的分布类型已知,但含有未知参数θ. (1)设 ( x , x
1 2
, , x n )
为总体 X 的一个样本观察值,若似
1 2
然函数 L ( ) 在 ˆ ˆ ( x , x
, , xn )
处取到最大值,则称
ˆ ( x1 , x 2 , , x n ) 为θ的极大似然估计值.
f ( xi ; 1 , 2 , , k )
将其取对数,然后对 1 , 2 , , k 求偏导数,得
ln L ( 1 , 2 , , k ) 0 1 ln L ( 1 , 2 , , k ) 0 k
1 2 n i i 1
(2) 设连续型总体 X 的概率密度函数为 f ( x ; ) , 则样本
( X 1 , X 2 , , X n ) 的联合概率密度函数
f ( x1 ; ) f ( x 2 ; ) f ( x n ; )
n
i 1
f ( x i ; )
n
仍称为似然函数,并记之为 L ( ) L ( x , x , , x ; )
用上面的解来估计参数θi就是矩法估计.
例: 设总体 X 服从泊松分布 ( ) ,参数λ 未知,
( X 1 , X 2 , , X n ) 是来自总体的一个样本,求参数λ
的矩
估计量.
解 总体X的期望为 E ( X ) 从而得到方程
1
X n
i 1
n
i
所以λ的矩估计量为
ˆ
得到含有未知参数(θ1,…,θk)的k个方程.解这k 个联立方程组就可以得到(θ1,…,θk)的一组解:
医学统计学期末考试 名词解释
10、测定某地107名正常人尿铅含量(μmol/L)如下表,该资料是计量资料,呈正偏态分布,欲表示该资料的集中趋势和离散趋势,宜选用的指标分别是中位数和四分位数间距。
12、算术均数常用于描述对称分布资料和正态分态资料的平均水平。
13、描述正态分布或对称分布资料离散程度常用的指标是标准差,而反映偏态分布资料离散程度用四分位数间距。
16、中位数一般用于描述偏态分布、分布型不明或开口资料的平均水平。
19、正态分布是以μ为中心左右对称,正态曲线在均数位置最高,离中心越远,观察值分布越少。
25、正态分布的形态由σ决定,t分布的形态由自由度决定。
20、正态分布和t分布都呈单峰和对称分布,但是曲线下相同的面积所对应的界值是不同的,t界值比u界值大,而且自由度越小,二者相差越大。
22、计算正态分布资料95%正常值范围的公式是X±1.96S ;估计总体均数95%可信区间的公式是X±1.96Sx 。
26、在抽样研究中,当样本含量趋向无穷大时,X趋向等于μ,Sx趋向于 0 ,t(0.05,v)趋向于1.96 。
①选有代表性的、较稳定的、数量较大的人群做标准;②将相互比较的各组数据合并作标准;③选择相互比较的各组中的一组作为标准。
一、名词解释1、定量资料:又称计量资料,是用定量的方法测定观察单位某项指标数值的大小,所得到的资料称为定量资料。
根据变量的取值特征,可分为连续型数据(身高、体重)和离散型数据(家庭成员数、白细胞计数)。
2、定性资料:又称计数资料,是将观察单位按照某种属性或类别分组,清点各组的观察单位数,所得的资料称为定性资料。
各类别属性没有程度或顺序上的差别,如男女,血型。
3、等级资料:又称有序分类资料,是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料称为等级资料。
各类别属性有程度或顺序上的差别,如显效、有效、无效等。
4、总体:是根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。
参数估计作业范文
参数估计作业范文参数估计是统计学中一个重要的概念,它用于通过样本数据来估计总体参数。
在实际应用中,参数估计经常用于确定总体的均值、方差、比例等参数。
本文将以总体均值的参数估计为例,介绍参数估计的原理、方法以及应用。
首先,参数估计的原理是根据样本数据来推断总体参数。
总体均值的参数估计使用样本均值作为总体均值的估计值。
样本均值通常是样本中所有观测值的平均数,用数学符号表示为x̄。
根据大数定律,当样本容量趋于无穷大时,样本均值趋于总体均值。
因此,样本均值是总体均值的一个无偏估计。
其次,参数估计的方法有点估计和区间估计。
点估计是通过一个数值来估计总体参数。
在总体均值的参数估计中,样本均值是一个无偏的点估计。
然而,点估计没有体现估计的准确性。
为了评估估计的准确性,需要引入区间估计。
区间估计是用一个区间来估计总体参数,常用的区间估计方法有置信区间估计和预测区间估计。
在总体均值的参数估计中,常用的是置信区间估计。
置信区间是用来表示估计值的准确性的,它表示参数估计值位于一些区间内的概率。
一般地,置信区间可以表示为样本均值加减一个标准误差的乘积,即x̄±zα/2σ/√n。
其中,x̄是样本均值,zα/2是正态分布的分位数,σ是总体标准差,n是样本容量。
最后,参数估计在实际应用中具有广泛的应用。
例如,在医学研究中,可以通过参数估计来估计其中一种药物的有效性,确定合适的剂量;在市场调研中,可以通过参数估计来估计其中一种产品的受欢迎程度,制定市场策略;在质量控制中,可以通过参数估计来估计产品的质量水平,改进生产过程。
综上所述,参数估计是统计学中一个重要的概念,它通过样本数据来估计总体参数。
参数估计的原理是根据样本数据来推断总体参数,常用的方法有点估计和区间估计。
参数估计在实际应用中具有广泛的应用,可以用于估计总体的均值、方差、比例等参数。
通过参数估计,我们可以更好地理解总体的特征,并作出正确的决策和推断。
总结一下,参数估计是在统计学中,通过样本数据来估计总体参数的方法。
参数估计方法
参数估计方法参数估计是统计学中的一个重要概念,它是指根据样本数据推断总体参数的过程。
在实际应用中,我们往往需要利用已知数据来估计总体的各种参数,比如均值、方差、比例等。
参数估计方法有很多种,其中最常用的包括最大似然估计和贝叶斯估计。
本文将对这两种参数估计方法进行详细介绍,并分析它们的优缺点。
最大似然估计是一种常用的参数估计方法,它是建立在似然函数的基础上的。
似然函数是关于总体参数的函数,它衡量了在给定参数下观察到样本数据的概率。
最大似然估计的思想是寻找一个参数值,使得观察到的样本数据出现的概率最大。
换句话说,就是要找到一个参数值,使得观察到的样本数据出现的可能性最大化。
最大似然估计的优点是计算简单,且在大样本情况下具有较好的渐近性质。
但是,最大似然估计也有一些局限性,比如对于小样本情况下可能会出现估计不准确的问题。
另一种常用的参数估计方法是贝叶斯估计。
贝叶斯估计是建立在贝叶斯定理的基础上的,它将参数看作是一个随机变量,而不是一个固定但未知的常数。
在贝叶斯估计中,我们需要先假设参数的先验分布,然后根据观察到的样本数据,利用贝叶斯定理来计算参数的后验分布。
贝叶斯估计的优点是能够充分利用先验信息,尤其在小样本情况下具有较好的稳定性。
但是,贝叶斯估计也存在一些问题,比如对于先验分布的选择比较敏感,且计算复杂度较高。
在实际应用中,我们需要根据具体的问题和数据特点来选择合适的参数估计方法。
对于大样本情况,最大似然估计可能是一个不错的选择,因为它具有较好的渐近性质。
而对于小样本情况,贝叶斯估计可能更适合,因为它能够充分利用先验信息,提高估计的稳定性。
当然,除了最大似然估计和贝叶斯估计之外,还有很多其他的参数估计方法,比如矩估计、区间估计等,每种方法都有其特点和适用范围。
总之,参数估计是统计学中的一个重要概念,它涉及到如何根据已知数据来推断总体的各种参数。
最大似然估计和贝叶斯估计是两种常用的参数估计方法,它们各有优缺点,适用于不同的情况。
《卫生统计学》课后思考题答案
《卫生统计学》思考题参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。
(4)整群抽样:优点是易于组织和操作大规模抽样调查;缺点是抽样误差大。
3、调查设计包括那些基本内容?答:(1)明确调查目的和指标(2)确定调查对象和观察单位(3)选择调查方法和技术(4)估计样本大小(5)编制调查表(6)评价问卷的信度和效度(7)制定资料的收集计划(8)指定资料的整理与分析计划(9)制定调查的组织措施4、调查表中包含那几种项目?答:(1)分析项目直接整理计算的必须的内容;(2)备查项目保证分析项目填写得完整和准确的内容;(3)其他项目大型调查表的前言和表底附注。
应用数理统计(中国矿业大学)2012年卷
√
√
( 87.80, 278.69) ≈ (9.37, 16.69).
(2分)
√ 三:(15分) 设炮弹着落点 (x, y) 离目标 (原点) 的距离为 z = x2 + y2 , 若设 x 和 y 为独立同分布的随机变量, 其共同分布为 N (0, σ2) ,可得 z 的分布密度为:
z
z2
p(z) = σ2 exp(− 2σ2 ),
H0 : P (Ai) = 1/6 i = 1, 2, · · ·, 6.
(2分) 因为分布不含未知参数, 又 k = 6, α = 0.05, 查表可得 χ2α(k − 1) = χ20.05(5) = 11.07. 又
χ2 = ∑6 (fi − npi)2 = 4.4 < 11.07.
i=1
npi
z > 0,
这个分布称为瑞利分布. (1): 设 z1, z2, · · ·, zn 为来自上述瑞利分布的一个样本, 求 σ2 的极大似然估计, 证明它是 σ2 的无偏估计; (2): 求瑞利分布中 σ2 的费希尔信息量 I(σ2).
解:(1): 易知 z1, z2, · · ·, zn 的似然函数为
1dy = 1 − e−z/2.
e−z/2
e−z/2
6
所以 Z = −2 ln Y 的密度函数为
fZ (z)
=
FZ′ (z)
=
1 e−z/2, y 2
>
0,
fZ(z) = 0,
z≤0
(8分)
又 Γ(1) = 1, 2, · · ·, n
F= Y /m
服从自由度为 (n, m) 的 F 分布, 记为 F ∼ F (n, m).
统计学原理A期末考试试卷及其答案
一.判断题1、统计数字的具体性是统计学区别于数学的根本标志。
(对)2、离散变量的数值包括整数和小数。
(对)3、总体和总体单位的概念不是固定不变的,任何一对总体和总体单位都可以互相变换。
(错)4、统计指标系是对许多指标的总称。
(错)5、全面调查只适用于有限总体的调查。
(对)6、人口普查可以经常进行,所以它属于经济性调查。
(错)7、在任何条件下,典型调查的资料郡可以推算总体指标。
(错)8、在统计调查中,调查单位和报告单位两者通常是一致的,但有时也是不一致的。
(对)9、专门调查是为了研究某些专门问题而临时组织的调查,它与定期统计报表是两种不同的方式。
(对)10、在等距数列中,组距的大小与组数的多少成反比。
(对)11、两个简单分组并列起来就是复合分组。
(错)12、在确定组限时,最小组的下限应高于最小变量值。
(错)13、组中值是各组的实际平均数的近似代表值,因此,用组中值来计算总平均数,只是一个近似值。
(对)14、分区简单分组与复合分组的根据是分组对象的复杂程度。
(对)15、全国人均国民生产总值,属于强度相对数。
(对)16、标志总量是指总体单位某一数量标志值的总和。
(对)17、在计算相对指标时,分子、分母可以互换的相对指标唯一只有强度相对数。
(错)18、某企业工人劳动生产率,计划提高5%,实际提高10%,则劳动生产率的计划完成程度为104.76%。
(对)二单选题1、统计研究的数量必须是(B )A抽象的量 B具体的量 C连续不断的量 D可直接相加的量2、统计总体最基本的特征是(B )A数量性 B同质性 C综合性 D差异性3、统计总体的同质性是指( D)A总体单位各标志值不应有差异 B总体的各项指标都是同类性质的指标 C总体全部单位在所有标志上具有同类性质 D总体全部单位在所有某一个或几个标志上具有同类性质4、一个统计总体( D)A只能有一个标志 B只能有一个指标 C可以有多个标志 D可以有多个指标5、总体和总体单位不是固定不变的,由于研究目的不同(A )A总体单位有可能变换为总体,总体也有可能变换为总体单位B总体只能变换为总体单位,总体单位不能变换为总体C总体单位只能变换为总体,总体不能变换为总体单位D任何一对总体和总体单位都可以互相变换6、某小组学生数学考试分别为60分、68分、75分和85分。
应用数理统计(武汉理工大)2-参数估计
1
D(S 2 )nI (
2)
n 1 n
1,
n
故S 2是渐进有效的。
第二章 参数估计
例: 设总体X (), X1, X 2 , , X n是X的一个样本, 讨论的无偏估计X的有效性。
解:lnp( X
,)
ln
X e
X!
X
ln
ln( X
!)
区间估计的关键: 用合适的方法确定两个统计量
1(X1, X2 , , Xn), 2(X1, X2 , , Xn)
第二章 参数估计
1.区间估计的定义及计算步骤
3) 区间估计的例子
例1 设总体X~N(μ , σ2), σ2已知,μ未知,设X1,…,Xn是X的样本, 求μ的置信度为1-α的置信区间。
)
2
n
,
D(ˆ2 )
D(nZ )
n2D(Z )
n2
n
2
2
当n 1时,显然D(ˆ1) D(ˆ2 ),故ˆ1比ˆ2有效。
第二章 参数估计
最小方差无偏估计问题 设 若 及T对 任(g意X(1, , X)的2都,任有一 , XD无n()T是 偏) g估(D计()T的量')一, T '个 ( X无1, X偏2估 , 计, X量n ), 则 无称 偏T估(计X1,, X或2 ,者,称X为n )是最g优(无)的偏一估致计最。小方差
其它类型的估计,如 贝叶斯估计…
第二章 参数估计
2.1参数的点估计
1. 矩估计 2. 极大似然估计 3. 点估计量的评价
统计学参数估计
统计学参数估计统计学参数估计是统计学中一种重要的方法,它通过观察样本数据来估计总体参数的值。
参数是描述总体特征的数值,例如总体均值、总体比例等。
参数估计的目的是根据样本信息对总体参数进行推断,从而得到总体特征的近似值。
参数估计的过程通常分为点估计和区间估计两种方法。
点估计是指根据样本数据求出总体参数的一个数值估计量,例如样本均值、样本比例等。
点估计的基本思想是用样本统计量作为总体参数的估计值,它是参数的无偏估计量时,表示点估计是一个良好的估计。
区间估计是指根据样本数据求出一个区间,这个区间包含总体参数的真值的概率较高,通常用置信区间表示。
区间估计的基本思想是总体参数位于一个区间中的可能性,而不是一个确定的值。
置信区间的构造依赖于样本统计量的分布以及总体参数的估计量的抽样分布。
点估计和区间估计的方法有很多,其中最常用的是最大似然估计和矩估计。
最大似然估计是指根据已知样本观测值,选择使样本观测值出现的概率最大的总体参数作为估计值。
最大似然估计的基本思想是找到一个参数值,使得已观测到的样本结果出现的概率尽可能大。
矩估计是指根据样本矩的观测值,选择使样本矩的偏差与总体矩的偏差最小的总体参数作为估计值。
矩估计的基本思想是利用样本矩估计总体矩,从而近似估计总体参数。
参数估计在实际应用中具有广泛的应用价值。
例如,在医学研究中,需要对患者的疾病概率进行估计,以帮助医生做出正确的诊断和治疗决策。
在经济学研究中,需要对经济指标(如GDP、通胀率等)进行估计,以帮助政府制定宏观经济政策。
在市场调研中,需要对消费者行为进行估计,以帮助企业确定产品定价和市场策略。
然而,参数估计也存在一些局限性。
首先,参数估计的结果仅仅是对总体参数的估计,并不是总体参数的确切值。
其次,参数估计的结果受到样本容量的影响,样本容量越大,估计结果越可靠。
另外,参数估计还需要满足一些假设条件,如总体分布的形式、样本的独立性等,如果这些假设条件不满足,估计结果可能会失效。
点估计中两种方法的分析和比较
点估计中两种常用方法的比较与分析楚尚坤河南理工大学数学与信息科学学院信息与计算科学专业2005级3班摘 要:本文首先介绍矩估计法和极大似然估计法,然后对于同一分布和同一参数,用这两种不同的方法求出矩估计量和极大似然估计量,利用估计量的三条评选标准:无偏性、有效性和一致性来判断哪个估计量在这种情况下与该参数的真实值更相近,从而选择相应的点估计法。
关键词:矩估计 极大似然估计 无偏性 有效性 一致性§1 引言当我们碰到这样的问题:假设总体分布函数的形式已知(它可由理论分析和过去经验得到,或者从抽样数据的直方图和概率纸描点初步估计出),但它的一个或多个参数未知,借助于总体的一个样本值,构造适当的样本函数来估计总体未知参数的问题,我们称之为点估计问题。
点估计是数理统计学中内容很丰富的一个分支,其中两种最常用的构造的估计量的方法是矩估计法和极大似然估计法。
当对于同一分布和同一参数时,先用矩估计法和极大似然估计法分别求得矩估计量和极大似然估计量,然后用无偏性、有效性和一致性对这两个估计量进行衡量,当样本容量足够大时,从而选出一个估计量使得这个估计量既在未知参数的真实值附近,又与未知参数真实值的偏离程度很小,而且随着样本容量n 的增大估计量与被估计参数的偏差越来越小,进而选择相应的点估计法。
§2 相关概念2.1 参数估计所谓参数估计,是指从样本),,,(21n X X X 中提取有关总体X 的信息,即构造样本的函数——统计量),,,(21n X X X g ,然后用样本值代入,求出统计量的观测值12(,,,)n g x x x ,用该值来作为相应待估参数的值。
此时,把统计量),,,(21n X X X g 称为参数的估计量,把),,(,21n x x x g 称为参数的估计值。
2.2 参数估计的类型参数估计问题常有两类:点估计和区间估计。
(1) 点估计:指对总体分布中的参数θ,根据样本),,,(21n X X X 及样本值),,,(21n x x x ,构造一统计量),,,(21n X X X g ,将),,(,21n x x x g 作为θ的估计值,则称),,,(21n X X X g 为θ的点估计量,简称点估计,记为∧θ=),,,(21n X X X g 。
概率参数估计方法
第一部分 点估计的方法
1. 矩估计法 2. 极大似然法 3. 最小二乘法
4. 贝叶斯方法 …… 这里我们主要介绍前面两种方法 .
第一节 矩 估 计
可能产生样本值X1,X2,…,Xn的一种度量 .
极大似然估计法就是用使L(θ)达到最大
值的ˆ去估计θ.
L(ˆ) max L( )
称ˆ 为θ的极大似然估计(MLE).
求极大似然估计(MLE)的一般步骤是: (1) 由总体分布导出样本的联合概率函数(或 (2) 联合密度); (2) 把样本联合概率函数(或联合密度)中自变 量看成已知常数,而把参数 θ看作自变量, 得到 似然函数L(θ); (3) 求似然函数L(θ) 的最大值点(常常转化为 求ln L(θ)的最大值点) ,即θ的MLE;
2 1
ቤተ መጻሕፍቲ ባይዱ
2 2
n1
n2
2 1
2 2
n1
n2
正 态
1
2 1
2 未知
2
2 ( X Y t S
2
1 n1
_________
1 1 2 X Y t s
)
n2
1 2 X Y t s
11
n1
n2
11
n1
n2
____
总 体
12
2 2
1, 2
未知
(
S12 S22
1 F /2
,
S12 S22
这个例子所作的推断已经体现了极大似 然法的基本思想 .
极大似然估计原理:
《医学统计学》习题与答案
一、最佳选择题1.卫生统计工作的步骤为 cA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表3.统计资料的类型包括A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用A.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是A.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用A.变异系数B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是A.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有A.算术均数=几何均数B.算术均数=中位数C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为A.μ+1.96σB.μ-1.96σC.μ+2.58σD.μ+1.64σE.μ-2.58σ12.下列哪个变量为标准正态变量 A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指A.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t 分布 A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. xs x μ- 15.统计推断的主要内容为A.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指A.αB.1-αC.βD.1-βE.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大A.变异系数B.标准差C.标准误D.极差E.四分位数间距18.两样本比较作t 检验,差别有显著性时,P 值越小说明A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.I 型错误越大19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小A.α=0.05B.α=0.01C.α=0.10D.α=0.20E.α=0.0220.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高A.α=0.01B.α=0.10C.α=0.05D.α=0.20E.α=0.0221.在假设检验中,P 值和α的关系为A. P 值越大,α值就越大B. P 值越大,α值就越小C. P 值和α值均可由研究者事先设定D. P 值和α值都不可以由研究者事先设定E. P 值的大小与α值的大小无关22.假设检验中的第二类错误是指A.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.方差分析中,组内变异反映的是A. 测量误差B. 个体差异C. 随机误差,包括个体差异及测量误差D. 抽样误差E. 系统误差24.方差分析中,组间变异主要反映A. 随机误差B. 处理因素的作用C. 抽样误差D. 测量误差E. 个体差异25.多组均数的两两比较中,若不用q 检验而用t 检验,则A. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对26.说明某现象发生强度的指标为A.构成比B.相对比C.定基比D.环比E. 率27.对计数资料进行统计描述的主要指标是A.平均数B.相对数C.标准差D.变异系数E.中位数28.构成比用来反映A.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对29. 样本含量分别为1n 和2n 的两样本率分别为1p 和2p ,则其合并平均率c p 为A. 1p +2pB. (1p +2p )/2C. 21p p ⨯D. 212211n n p n p n ++ E. 2)1()1(212211-+-+-n n p n p n 30.下列哪一指标为相对比A. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数31.发展速度和增长速度的关系为A.发展速度=增长速度一1B. 增长速度=发展速度一1C.发展速度=增长速度一100D.增长速度=发展速度一100E.增长速度=(发展速度一1)/10032.SMR 表示A.标化组实际死亡数与预期死亡数之比B.标化组预期死亡数与实际死亡数之比C.被标化组实际死亡数与预期死亡数之比D.被标化组预期死亡数与实际死亡数之比E.标准组与被标化组预期死亡数之比33.两个样本率差别的假设检验,其目的是A.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同34.用正态近似法进行总体率的区间估计时,应满足A. n 足够大B. p 或(1-p )不太小C. np 或n(1-p)均大于5D. 以上均要求E. 以上均不要求35.由两样本率的差别推断两总体率的差别,若P 〈0.05,则A. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义36.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为A. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u37.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为A. A ≥5B. T ≥5C. A ≥5且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4038.三个样本率比较得到2χ>2)2(01.0χ,可以为A.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同39.四格表2χ检验的校正公式应用条件为A. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<140.下述哪项不是非参数统计的优点A.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料41.秩和检验和t 检验相比,其优点是A.计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小42.等级资料比较宜用A. t 检验B. u 检验C.秩和检验D.2χ检验E.F 检验43.作两均数比较,已知1n 、2n 均小于30,总体方差不齐且分布呈极度偏态,宜用A. t 检验B. u 检验C.秩和检验D.F 检验E.2χ检验44.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为A.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大45.欲比较某地区1980年以来三种疾病的发病率在各年度的发展速度,宜绘制A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图46.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图47.调查某地高血压患者情况,以舒张压≥90mmHg 为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:A.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料48. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。
统计学原理-期末考试试卷2
统计学原理 课程期末考试试卷(B )一、填空题(每空1分,共14分)1、按照统计数据的收集方法,可以将其分为 观测数据、实验数据 。
2、收集数据的基本方法是 自填式 、 面访式 和 电话式 。
3、某企业有两个生产车间,A 车间的人均日加工产量为20件,标准差为5件,B 车间的人均日加工产量为30件,标准差为7件,则A 车间人均日加工产量的代表性__大于_B 车间人均日加工产量的代表性。
4、设连续型随机变量X 在有限区间(a,b)内取值,且X 服从均匀分布,其概率密度函数为0()1f x b a⎧⎪=⎨⎪-⎩则X 的期望值为 2a b+ ,方差为 2()12b a - 。
5、设随机变量X 、Y 的数学期望分别为E(X)=2,E(Y)=3,求E(2X-3Y)= -5 。
6、设总体X ~),(2σμN ,x 为样本均值,S 为样本标准差。
当σ未知,且为小样本时,则n sx μ-服从自由度为n-1的___t__分布。
7、对回归方程线性关系的检验,通常采用的是 F 检验。
8、在参数估计时,评价估计量的主要有三个指标是无偏性、 一致性 和 有效性 。
9、测试7种新型小轿车的耗油量,每百公里耗油量(公升)分别为:10, 13, 9 ,7, 15, 11, 8,则这7个数据的中位数是 10 。
二、单项选择题(本大题共20道小题,每小题1分,共20分)。
在每小题列出的四个备选项中只有一个是符合要求的,请将其代码填写在下面的方格内。
1、社会经济统计的研究对象是( C ) A 抽样的数量关系B 社会经济现象的规律性C 社会经济现象的数量特征和数量关系D 社会经济统计认识过程的规律和方法2、指出下面的数据哪一个属于数值型数据( A )。
A 5个人的年龄(岁)分别是25,22,34,41,33 B 性别 C 企业类型D 员工对企业某项改革措施的态度(赞成、中立、反对) 3、某城市工业企业未安装设备普查,总体单位是( B ) A 工业企业全部未安装设备 B 工业企业每一台未安装设备 C 每个工业企业的未安装设备 D 每一个工业企业4、统计工作过程不包括( B ) A 统计调查 B 统计分布 C 统计整理D 统计分析5、某市工业企业2010年生产经营成果年报呈报时间规定在2011年1月31日,其他 (a<b)则调查期限为( B )A一日B一个月C一年D一年零一个月6、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=2,其意义是( A )。
医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习95%答案
一、SPSS 基本功能SPSS基本功能数据管理统计分析图表分析:条图、直方图、饼图、线图、散点图等输出管理:对输出结果复制、编辑等描述性分析均数比较一般线性模型相关与回归分析非参数检验生存分析FrequenciesDescriptivesExploreCrosstabs 统计资料的类型资料类型定量资料:用定量的方法获得的数值资料计数资料:按性质或类别分组后清点各组个数等级资料:半定量资料定量资料的统计推断正态分布两组均数比较单样本设计t检验配对设计t检验成组设计t检验三组及以上均数比较完全随机设计方差分析随机区组设计方差分析重复测量方差分析析因设计方差分析偏态分布配对设计秩和检验单样本设计秩和检验成组设计秩和检验资料类型定量资料计数资料等级资料统计分析统计描述统计推断相对数总体率的估计假设检验u检验卡方检验4假设检验参数检验非参数检验正态分布等级资料偏态分布资料分布类型未知方差不齐,且不易变换达到齐性数据一端或两端不确定的资料1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广,可适用于任何类型资料 参数检验➢ 优点:资料信息利用充分;检验效能较高 ➢ 缺点:对资料的要求高;适用范围有限 2.非参数检验➢ 优点:适用范围广,可适用于任何类型的资料 ➢ 缺点:检验效能低,易犯Ⅱ型错误 凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其 检验效能低,易犯Ⅱ型错误研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
统计09年二学期 B 卷及答案
2009---2010学年第2学期统计学原理课程考核试卷(B)考核方式: (闭卷)考试时量:120 分钟一、填空题(每空1分,共15分)1、按照统计数据的收集方法,可以将其分为和。
2、收集数据的基本方法是、和。
3、在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据:1080,750,780,1080,850,960,2000,1250,1630(单位:元),则人均月收入的平均数是,中位数是。
4、设连续型随机变量X在有限区间(a,b)内取值,且X服从均匀分布,其概率密度函数为0 ()1 f xb a⎧⎪=⎨⎪-⎩则X的期望值为,方差为。
5、设随机变量X、Y的数学期望分别为E(X)=2,E(Y)=3,求E(2X-3Y)= 。
6、概率是___ 到_____ 之间的一个数,用来描述一个事件发生的经常性。
7、对回归方程线性关系的检验,通常采用的是检验。
8、在参数估计时,评价估计量的主要有三个指标是无偏性、和。
二、判断题,正确打“√”;错误打“×”。
(每题1分,共10分)1、理论统计学与应用统计学是两类性质不同的统计学()2、箱线图主要展示分组的数值型数据的分布。
()3、抽样极限误差可以大于、小于或等于抽样平均误差。
()4、在全国人口普查中,全国人口数是总体,每个人是总体单位。
()5、直接对总体的未知分布进行估计的问题称为非参数估计;当总体分布类型已知,仅需对分布的未知参数进行估计的问题称为参数估计。
()6.当置信水平一定时,置信区间的宽度随着样本量的增大而减少()7、在单因素方差分析中,SST =SSE+SSA()8、右侧检验中,如果P值<α,则拒绝H。
()9、抽样调查中,样本容量的大小取决于很多因素,在其他条件不变时,样本容量与边际误差成正比。
()10、当原假设为假时接受原假设,称为假设检验的第一类错误。
()三、单项选择题(每小题1分,共 15分)1、某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 参数估计在实际问题中, 当所研究的总体分布类型已知, 但分布中含有一个或多个未知参数时, 如何根据样本来估计未知参数,这就是参数估计问题.参数估计问题分为点估计问题与区间估计问题两类. 所谓点估计就是用某一个函数值作为总体未知参数的估计值;区间估计就是对于未知参数给出一个范围,并且在一定的可靠度下使这个范围包含未知参数.例如, 灯泡的寿命X 是一个总体, 根据实际经验知道, X 服从),(2σμN , 但对每一批灯泡而言, 参数2,σμ是未知的,要写出具体的分布函数, 就必须确定出参数. 此类问题就属于参数估计问题.参数估计问题的一般提法:设有一个统计总体, 总体的分布函数为),(θx F , 其中θ为未知参数(θ可以是向量). 现从该总体中随机地抽样, 得一样本n X X X ,,,21 ,再依据该样本对参数θ作出估计, 或估计参数θ的某已知函数).(θg第一节 点估计问题概述内容分布图示★ 引言★ 点估计的概念 ★ 例1★ 评价估计量的标准★ 无偏性 ★ 例2 ★ 例3★ 有效性★ 例4 ★ 例5 ★ 例6★ 相合性 ★ 例7 ★ 例8★ 内容小结 ★ 课堂练习 ★ 习题6-1内容要点:一、点估计的概念设n X X X ,,,21 是取自总体X 的一个样本, n x x x ,,,21 是相应的一个样本值. θ是总体分布中的未知参数, 为估计未知参数θ, 需构造一个适当的统计量),,,,(ˆ21nX X X θ然后用其观察值),,,(ˆ21nx x x θ 来估计θ的值.称),,,(ˆ21n X X X θ为θ的估计量. 称),,,(ˆ21nx x x θ为θ的估计值. 在不致混淆的情况下, 估计量与估计值统称为点估计,简称为估计, 并简记为θˆ.注: 估计量),,,(ˆ21nX X X θ是一个随机变量, 是样本的函数,即是一个统计量, 对不同的样本值, θ的估计值θˆ一般是不同的.二、评价估计量的标准从例1可见,参数点估计的概念相当宽松, 对同一参数,可用不同的方法来估计, 因而得到不同的估计量, 故有必要建立一些评价估计量好坏的标准.估计量的评价一般有三条标准:1. 无偏性;2. 有效性;3. 相合性(一致性).在本节的后面将逐一介绍之.在具体介绍估计量的评价标准之前, 需指出: 评价一个估计量的好坏, 不能仅仅依据一次试验的结果, 而必须由多次试验结果来衡量. 因为估计量是样本的函数, 是随机变量. 故由不同的观测结果, 就会求得不同的参数估计值. 因此一个好的估计, 应在多次重复试验中体现出其优良性.1.无偏性估计量是随机变量, 对于不同的样本值会得到不同的估计值. 一个自然的要求是希望估计值在未知参数真值的附近, 不要偏高也不要偏低. 由此引入无偏性标准.定义1 设),,(ˆ1nX X θ是未知参数θ的估计量, 若 ,)ˆ(θθ=E 则称θˆ为θ的无偏估计量.注: 无偏性是对估计量的一个常见而重要的要求, 其实际意义是指估计量没有系统偏差,只有随机偏差. 在科学技术中, 称θθ-)ˆ(E 为用θˆ估计θ而产生的系统误差.例如, 用样本均值作为总体均值的估计时, 虽无法说明一次估计所产生的偏差, 但这种偏差随机地在0的周围波动,对同一统计问题大量重要使用不会产生系统偏差. 对一般总体而言,我们有定理1 设n X X ,,1 为取自总体X 的样本,总体X 的均值为μ, 方差为2σ.则(1) 样本均值X 是μ的无偏估计量;(2) 样本方差2S 是2σ的无偏估计量;(3) 样本二阶中心矩∑=-ni i X X n 12)(1是2σ的有偏估计量.2.有效性一个参数θ常有多个无偏估计量,在这些估计量中,自然应选用对θ的偏离程度较小的为好,即一个较好的估计量的方差应该较小.由此引入评选估计量的另一标准—有效性.定义2 设),,(ˆˆ111n X X θθ=和),,(ˆˆ122nX X θθ=都是参数θ的无偏估计量, 若 )ˆ()ˆ(21θθD D <, 则称1ˆθ较2ˆθ有效.注: 在数理统计中常用到最小方差无偏估计, 其定义如下:设n X X ,,1 是取自总体X 的一个样本, ),,(ˆ1nX X θ是未知参数θ的一个估计量, 若θˆ满足:(1) ,)ˆ(θθ=E 即θˆ为θ的无偏估计; (2) ),ˆ()ˆ(*≤θθE *θˆ是θ的任一无偏估计. 则称θˆ为θ的最小方差无偏估计(也称最佳无偏估计).3.相合性(一致性)我们不仅希望一个估计量是无偏的, 并且具有较小的方差, 还希望当样本容量无限增大时, 估计量能在某种意义下任意接近未知参数的真值, 由此引入相合性(一致性)的评价标准.定义 3 设),,(ˆˆ1nX X θθ=为未知参数θ的估计量, 若θˆ依概率收敛于θ, 即对任意0>ε, 有,1}|ˆ{|lim =<-∞→εθθP n 或,0}|ˆ{|lim =≥-∞→εθθP n 则称θˆ为θ的(弱)相合估计量.例题选讲:点估计的概念例1 (讲义例1)设X 表示某种型号的电子元件的寿命(以小时计),它服从指数分布:⎪⎩⎪⎨⎧≤>=-.0,00,1),(~/x x e x f X x θθθθ为未知参数, 0>θ. 现得样本值为168, 130, 169, 143, 174, 198, 108, 212, 252,试估计未知参数θ.解 由题意知, 总体X 的均值为,θ 即),(X E =θ 因此, 如用样本均值X 作为θ的估计量看起来是最自然的. 对给定的样本值计算得,7.172)252130168(91=+++= x故X =θˆ与7.172ˆ==x θ分别为θ的估计量与估计值.评价估计量的标准例2(讲义例2)设总体),0(~2σN X ,n x x x ,,,21 是来自这一总体的样本. (1) 证明∑==n i i x n 1221ˆσ是2σ的无偏估计; (2) 求).ˆ(2σD 解(1) )(1)(1)ˆ(122i ni i X D n XE nE ∑===σ221σσ==n n故2ˆσ是2σ的无偏估计. (2) 因∑∑==⎪⎭⎫⎝⎛=ni i ni iX X1212,σσ 而),,,2,1()1,0(~n i N X i =σ且它们相互独立, 故依2χ分布定义)(~2212n X ni i χσ∑=n X D n i i 2212=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛∑=σ由此知.2211)ˆ(44221224122n n n X D nX n D D n i i ni i σσσσσ==⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎭⎫ ⎝⎛=∑∑==例3(讲义例3)设n X X X ,,,21 是总体),(2σμN 的一个简单随机样本. 求k 使∑∑==-=ni nj j i X X k 11||ˆσ为σ的无偏估计.解由于),,(~2σμN X i 且相互独立, 于是当j i ≠时 ),2,0(~2σN X X j i -dx ex X X E x j i 2242221|||)(|σσπ-∞+∞-⋅=-⎰.2022222404πσπσσπσσ=∞+⎪⎪⎪⎭⎫ ⎝⎛-==-∞+-⎰x x edx xe因为当j i =时, ,0|)(|=-j i X X E 所以,2)1()|(|)ˆ(11πσσ-⋅=-=∑∑==n n k X X E k E n i nj j i故当)1(2-=n n k π时, 有∑∑==--=ni nj j iX Xn n 11||)1(2ˆπσ为σ的无偏估计.例4(讲义例4)设n X X X ,,,21 为来自总体X 的样本, X ,),,2,1(n i X i =均为总体均值μ=)(X E 的无偏估计量, 问哪一个估计量有效?解由于),,,2,1()(,)(n i X E E i ===μμ所以),,2,1(,n i X i =为μ和无偏估计量,但,)(11)(2121nX D n X n D X D ni ini i σ=⎪⎪⎭⎫⎝⎛=∑∑==),,2,1()(2n i X D i ==σ故X 较),,2,1(n i X i =更有效.例5 设总体X 在区间],0[θ上服从均匀分布, n X X X ,,,21 是取自总体X 的简单随机样本, ,11∑==ni i X n X ).,,m ax(1)(n n X X X = 求常数,,b a 使)(21ˆ,ˆn bX X a ==θθ均为θ的无偏估计, 并比较其有效性.解已知⎩⎨⎧≤≤=,,000,/1)(~其它x x f X θ 其分布函数为⎪⎩⎪⎨⎧<≤≤<==⎰∞-,,10,/0,0)()(x x x x dt t f x F xθθθ因,2/)(θ=x E ,12/)(2θ=X D 故.2/)()ˆ(1θθ⋅==a X aE E 当2=a 时, ,)ˆ(1θθ=E 1ˆθ为θ无偏估计, 且 ).3/()12/(4)(4)2()ˆ(221n n X D X D D θθθ==== 又,,00,/)()]([)(11⎩⎨⎧≤≤==--其它θθx nx x f x F n x f n n n n所以 ,11)(01)(+=+==+⎰n n x n n dx nx X E n n nnn θθθθθ,2)(212)(+==⎰+n n dx nx X E nn n θθθ,)1)(2()(22)(++=n n n X D n θ故,1)()ˆ()(2+==n n b X bE E n θθ 当nn b 1+=时, ,)ˆ(2θθ=E 即)(21ˆn X n n +=θ为θ的无偏估计, 且222)(22)1)(2(1)()ˆ(++⋅⎪⎭⎫ ⎝⎛+==n n n n n X D b D n θθ)ˆ(3)2(122θθθD n n n =<+= 所以2ˆθ比1ˆθ更有效.例6(讲义例5)设分别自总体),(21σμN 和),(22σμN 中抽取容量为21,n n 的两独立样本.其样本方差分别为2221,S S . 试证, 对于任意常数2221),1(,bS aS Z b a b a +==+都是2σ的无偏估计, 并确定常数b a ,使)(Z D 达到最小.解,)(221σS E ,)(222σ=S E 由第5章第三节的定理2, 知 ),1(~/)1(122211--n S n χσ)1(~/)1(222222--n S n χσ 且相互独立, 所以),1/(2)(1421-=n S D σ),1/(2)(1222-=n S D σ 故当1=+b a 时, ,)()()(22221σ=+=S bE S aE Z E 即Z 是2σ的无偏估计. 由2221,S S 相互独立, 及)()(2221bS aS D Z D +=422122))1()1/((σ⋅-+-=n b n a 422122))1/()1()1/((σ⋅--+-=n a n a令,01)1(2122)(2142=⎥⎦⎤⎢⎣⎡----=n a n a da Z dD σ 得驻点 ,21211-+-=n n n a又,012122)(21422>⎪⎪⎭⎫ ⎝⎛-+-=n n da Z D d σ 知该点为极小值点, 所以, 当,21211-+-=n n n a 21212-+-=n n n b 时, 统计量222221121])1()1[(21w defS S n S n n n Z =-+--+=具有最小方差.(注: 此例结果表明, 第5章第三节定理4中的统计量2w S 是方差2σ的最佳无偏估计).例7(讲义例6)设n X X ,,1 是取自总体X 样本, 且)(kX E 存在k 为正整数, 则∑=ni k iXn11为)(k X E 的相合估计量.证事实上, 对指定的k , 令,kX Y =,k i i X Y =∑∑====n i k i ni i X n Y nY 11,11由大数定理知 ),()(lim kn X E Y E Y ==∞→ 从而∑=ni kiXn11是)(k X E 的相合估计量.作为特例, 样本均值X 是总体均值)(X E 的相合估计量.例8(讲义例7)设总体),(~2σμN X ,n X X ,,1 为其样本. 试证样本方差2S 是2σ的相合估计量.证 由本节定理1, ,)(22σ=S E 又由第5章第三节定理2, 知),1(~)1(222--n S n χσ 从而)1(2)1(22-=⎥⎦⎤⎢⎣⎡-n S n D σ12)(22-=n S D σ 故由切比雪夫不等式推得, 对任意,0>ε}|{|}|)({|02222εσε≥-=≥-≤S P S E S P )1(2)(12422-=≤n S D εσε 当∞→n 时, 上式左、右端均趋于0, 根据相合性定义可知2S 是2σ的相合估计量.课堂练习设总体X 的k 阶矩)1)((≥=k X E k k μ存在, 又设n X X X ,,,21 是X 的一个样本. 试证明不论总体服从什么分布, k 阶样本矩∑==n i ki k X n A 11是k 阶总体矩k μ的无偏估计量.。