第5章 参数估计及点估计
第5章--抽样分布与参数估计教案资料

(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
(9.5)
10
10,1
10,2
10,3
10,4
10,5
10,6
10,7
10,8
10,9
10,10
数是 ,标准差是 ,从这个总体中抽出一 个容量是 n 的样本,则样本平均数 X 也服从 正态分布,其平均数 E( X ) 仍为 ,其标准
差为 。 X 5-19
从正态分布的再生定理可以看出,只要总体 变量服从正态分布,则从中抽取的样本,不管n 是多少,样本平均数都服从正态分布。但是在 客观实际中,总体并非都是正态分布。对于从 非正态分布的总体中抽取的样本平均数的分布 问题,需要由中心极限定理来解决。
第5章--抽样分布与参数估计
第一节 抽样的基本概念与数学原理
一、有关抽样的基本概念 二、大数定理与中心极限定理
5-2
一、有关抽样的基本概念
(一)样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分
单位的集合,这个集合的大小称为样本容量, 一般用n表示,它表明一个样本中所包含的单 位数。
lim
n
1 n
p
n
i 1
X
i
1
(5.5)
5-17
大数定理表明:尽管个别现象受偶然因 素影响,有各自不同的表现。但是,对总体 的大量观察后进行平均,就能使偶然因素的 影响相互抵消,消除由个别偶然因素引起的 极端性影响,从而使总体平均数稳定下来, 反映出事物变化的一般规律。
概率论知识点

第一章随机事件及其概率§ 1.1 随机事件及其运算随机现象:概率论的基本概念之一。
是人们通常说的偶然现象。
其特点是,在相同的条件下重复观察时,可能出现这样的结果,也可能出现那样的结果,预先不能断言将出现哪种结果•例如,投掷一枚五分硬币,可能国徽”向上,也可能伍分”向上;从含有5件次品的一批产品中任意取出3件,取到次品的件数可能是0,1,2或3.随机试验:概率论的基本概念之一•指在科学研究或工程技术中,对随机现象在相同条件下的观察。
对随机现象的一次观察(包括试验、实验、测量和观测等),事先不能精确地断定其结果,而且在相同条件下可以重复进行,这种试验就称为随机试验。
样本空间:概率论术语。
我们将随机试验E的一切可能结果组成的集合称为E的样本空间,记为1。
样本空间的元素,即E的每一个结果,称为样本点。
随机事件:实际中,在进行随机试验时,人们常常关心满足某种条件的那些样本点所组成的集合.称试验E的样本空间I ■■的子集为E的随机事件,简称事件•在每次试验中,当且仅当这一子集中的一个样本点出现时,称这一事件发生.特别,由一个样本点组成的单点集,称为基本事件.样本空间门包含所有的样本点,它是门自身的子集,在每次试验中它总是发生的,称为必然事件.空集?不包含任何样本点,它也作为样本空间的子集,它在每次试验中都不发生称为不可能事件.互斥事件(互不相容事件):若事件A与事件B不可能同时发生,亦即A B =①,则称事件A与事件B是互斥(或互不相容)事件。
互逆事件:事件A与事件B满足条件A B =①,A B =1 ,则称A与B是互逆事件,也称A与B是对立事件,记作B (或A = B )。
互不相容完备事件组:若事件组A,A2,…A满足条件A i A j二①,(i,i=t n ),nA-、_:,则称事件组A, A2,…A n为互不相容完备事件组(或称A, A2,…A n为样本空i=1间门的一个划分)。
§ 1.2 随机事件的概率概率:随机事件出现的可能性的量度。
统计第五章练习题

统计第五章练习题部门: xxx时间: xxx整理范文,仅供参考,可下载自行编辑第五章参数估计<一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内>1.在抽样推断中,必须遵循( >抽取样本。
①随意原则②随机原则③可比原则④对等原则2.抽样调查的主要目的在于( >。
①计算和控制抽样误差②了解全及总体单位的情况③用样本来推断总体④对调查单位作深入的研究b5E2RGbCAP3.抽样误差是指< )。
①计算过程中产生的误差②调查中产生的登记性误差③调查中产生的系统性误差④随机性的代表性误差4.在抽样调查中( >。
①既有登记误差,也有代表性误差②既无登记误差,也无代表性误差③只有登记误差,没有代表性误差④没有登记误差,只有代表性误差5.在抽样调查中,无法避免的误差是( >。
①登记误差②系统性误差③计算误差④抽样误差6.能够事先加以计算和控制的误差是( >。
①抽样误差②登记误差③系统性误差④测量误差7.抽样平均误差反映了样本指标与总体指标之间的( >。
①可能误差范围②平均误差程度③实际误差④实际误差的绝对值8.抽样平均误差的实质是( >。
①总体标准差②全部样本指标的平均差③全部样本指标的标准差④全部样本指标的标志变异系数p1EanqFDPw9.在同等条件下,重复抽样与不重复抽样相比较,其抽样平均误差( >。
①前者小于后者②前者大于后者③两者相等④无法确定哪一个大10.在其他条件保持不变的情况下,抽样平均误差( >。
①随着抽样数目的增加而加大②随着抽样数目的增加而减小③随着抽样数目的减少而减小④不会随抽样数目的改变而变动DXDiTa9E3d11.允许误差反映了样本指标与总体指标之间的( >。
①抽样误差的平均数②抽样误差的标准差③抽样误差的可靠程度④抽样误差的可能范围12.极限误差与抽样平均误差数值之间的关系为( >。
概率论与数理参数估计

概率论与数理参数估计参数估计是概率论与数理统计中的一个重要问题,其目标是根据样本数据推断总体的未知参数。
参数估计分为点估计和区间估计两种方法。
点估计是通过样本计算得到总体未知参数的一个估计值。
常见的点估计方法有最大似然估计和矩估计。
最大似然估计是通过观察到的样本数据,选择使得观察到的样本数据出现的概率最大的未知参数值作为估计值。
矩估计是通过样本的矩(均值、方差等统计量),与总体矩进行对应,建立样本矩与总体矩之间的方程组,并求解未知参数。
这两种方法都可以给出参数的点估计值,但是其性质和效果不尽相同。
最大似然估计具有渐近正态性和不变性,但是可能存在偏差较大的问题;矩估计简单且易于计算,但是可能存在方程组无解的情况。
区间估计是给出参数估计结果的一个范围,表示对未知参数值的不确定性。
常见的区间估计方法有置信区间和预测区间。
置信区间是指给定的置信水平下,总体参数的真值落在一些区间内的概率。
置信区间的计算依赖于样本的分布和样本量。
预测区间是对一个新的观察值进行预测的区间,它比置信区间要宽一些,以充分考虑不确定性。
在参数估计过程中,需要注意样本的选取和样本量的确定。
样本是总体的一个子集,必须能够代表总体的特征才能得到准确的估计结果。
样本量的确定是通过统计方法和实际需求来确定的,要保证估计结果的可靠性。
参数估计在实际应用中有着广泛的应用。
例如,在医学领域中,通过对病人的样本数据进行统计分析,可以推断患者患其中一种疾病的概率,进而进行治疗和预防措施的制定。
在金融领域中,可以通过对股票的历史价格进行统计分析,推断未来股价的变动趋势,从而进行投资决策和风险评估。
在市场调研中,可以通过对消费者的问卷调查数据进行统计分析,推断消费者的偏好和需求,为企业的市场开发和产品设计提供依据。
综上所述,概率论与数理统计中的参数估计是一门重要的学科,通过对样本数据的统计分析,可以推断总体的未知参数,并对不确定性进行评估。
参数估计在实际应用中有着广泛的应用,对于科学研究和决策制定具有重要的意义。
第五章 参数估计

1
X 2 t n1 n2 2
2
2 Sp
n1
n2
X
1
X 2 z
2
2 S12 S 2 n1 n2
2 Sp
2 2 n1 1S1 n2 1S 2
n1 n2 2
20
例题:
分别在城市1和城市2中随机抽取n1=400, n2=500的职工进行调查,经计算两城市职工的 平均月收入及标准差分别为X1=1650元,
22
思考题:
一个研究机构做了一项调查,以确定稳定的吸 烟者每周在香烟上的消费额。他们抽取49位固 定的吸烟者,发现均值为20元,标准差5元。
1.总体均值的点估计是多少?
2.总体均值μ的95%置信区间是什么?
23
思考题解答:
1.总体均值的点估计是20元。
2.总体均值μ的95%置信区间: 随机变量X表示每周香烟消费额,由题意可知,X=20, S=5,1-α=0.95,α=0.05;n=49 属于大样本,σ 未知以S估计。总体均值μ的95%置信区间为
P z Z z 1 2 2
P L U 1
X P z z 1 2 2 n
Step3:将上面等式进行等价变换即可。
P L U 1
第五章 参数估计
第五章 参数估计
利用样本数据对总体特征进行推断,通常在以下 两种情况下进行:
当总体分布类型已知(如:正态),根据样本数据对 总体分布的未知参数进行估计或检验。参数估 计或参数检验。(如:μ或σ为何?) 当总体分布类型未知或知道很少,根据样本数据 对总体的未知分布的形状或特征进行推断。非参 数检验。(如:是否正态分布?是否随机?)
《统计学原理》第5章:抽样推断

σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理
统计学贾俊平-第五章-参数估计-练习题答案

0.058375,s0.005846, F ?2.464484, F1
0.405764
所以,方差比的置信区间为
4.051926,24.61011
5.10已知置信水平
95%,Z
/2
E1.96,120,E
20
所以,n
z
~Er
138.3,取n=139。
5.11已知
n1n2
n, E 5,112,
215,置信水平1
95%,Z
/2
1.96
所以,n
Z
2 2
1 2
256.7,取
E
n=57。
5.12已知置信水平1
95%,n1
n2n,E=0.05,取1
20.5
Z111212
所以
768.32,取n=769
12的置信区间为八01门2
(2)置信水平195%,
P1P2
0.1 1.96, 0.00096一0.00084
0.0168,0.1832
c
D
S
SI
0- 241609
S1A2
0. 058375
1S2
F0.076457
0- 005846
N
2. 464424
0-405764
1
2置信区间
5.9
Excel得,$0.241609, S20.076457, s;
统计学(第四版)贾俊平 第五章 参数估计 练习题答案
5.1(答案精确到小数点后两位)
(1)已知:n=49,15,
样本均值的标准误差X二=15荷2.14
(2)
已知:置信水平:1
95%,Z2
1.96,
(3)
统计学(李荣平)2014-5

P{t>tα(n)}= h(t;n)dt
t (n)
的数tα(n)为t(n)分布的上α分为点。 例:查表求:t0.05(8), t0.95(8)
o
t (n)
第一节 抽样分布
(三)F 分布
设 U ~ 2(n1 ),V ~ 2(n2 ), 且设 U,V 独立,则称随机变量
F U / n1 V / n2
保证质量,规定σ≤0.6mm时,认为生产过程处于良好控制
状态。为此,每隔一定时间抽取20个零件作为一个样本,并
计算样本方差S2。若P{S2≥c } ≤0.01(此时σ=0.6mm),
则认为生产过程失去控制,必须停产检查,问:
(1)C为何值时,S2≥c的概率才小于或等于0.01? (2)若取得的一个样本的标准差S=0.84,生产过程是
第五章 抽样分布与参数估计
主
第一节 抽样分布
要 内
第二节 参数点估计
容
第三节 区间估计
第一节 抽样分布
一、随机样本
总体与个体:试验全部可能的观测值叫总体;试验的 每一个观测值叫个体。
样本容量与样本个数:样本中包含的单位数叫样本容 量;从一个总体中可能抽取多少个样本叫样本个数。
总体容量:总体中所包含的个体数。 有限总体和无限总体:总体容量可数的称有限总体, 不可数的称无限总体。 重置抽样(重复抽样)和无重置抽样(不重复抽样)
X
1 n
n i 1
Xi
为样本均值;称统计量
S 2
1 n1
n i1
(Xi
X )2
为 样本方差 ,称统计量 S
S2
1n
( X X ) 2 为样本标准差 ;统计量
n 1 i1 i
统计学(第四版)期末复习资料

第一章统计和统计数据名词解释1.统计学:收集处理分析解释数据并从数据中得出结论的科学。
2.描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。
3.推断统计:研究如何利用样本数据来推断总体特征的统计方法。
4.分类数据:只能归于某一类别的非数字型数据。
5.顺序数据:只能归于某一有序类别的非数字型数据。
6.数值型数据:按数字尺度测量的观察值。
7.总体:包含所研究的全部个体(数据)的集合。
8.样本:从总体中抽取的一部分元素的集合。
9.参数:用来描述总体特征的概括性数字度量。
10.变量:说明现象某种特征的概念。
11.分类变量:说明事物类别的一个名称。
12.顺序变量:说明事物有序类别的一个名称。
13.数值型变量:说明事物数字特征的一个名称。
14.概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
15.非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
16.简单随机抽样:从包括总体的N个单位的抽样框中随机,一个个抽取n个单位作为样本,每单位等概论。
17.分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同层中独立、随机地抽取样本。
18.整群抽样:总体中若干单位合并为组,群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。
19.系统抽样:总体中所有单位按顺序排列,在规定范围内随机抽取一单位作为初始单位,然后按事先规则确定其它样本单位。
20. 抽样误差:由于抽样的随机性引起的样本结果与总体真值之的误差简答题。
1.概率抽样与非概率抽样比较:性质不同,非概不依据随机原则选样本,样本统计量分布不确切,无法使用样本的结果对总体相应参数进行推断。
操作简便,时效快,成本低,专业要求不很高。
概率抽样依据随机原则抽选样本,理论分布存在,对总体有关参数可进行估计,计算估计误差,得到总体参数的置信区间。
提出精度要求。
2.数据收集方法的选择:抽样框中有关信息,目标总体特征,调查问题的内容,有形辅助物的使用,实施调查的资源,管理与控制,质量要求3.误差的控制:抽样误差是抽样随机性带来的,不可避免可以计算,改大样本量。
统计学习题05

2.下面哪些是影响必要样本容量的因素()。
A.总体各单位标志变异程度B.允许的极限误差大小
C.推断的可靠程度D.抽样方法和抽样组织方式
E.样本均值和样本统计量
答案:ABCD
3.评价估计量是否优良的常用标准有( )。
A.无偏性B.有效性
C.准确性D.一致性
E.随机性
答案:ABC
4.点估计( )。
[参考答案]
28.306
2.现有一大批种子,为了估计其发芽率,随机抽取400粒进行发芽试验。结果有15粒每发芽。试以90%的置信度估计这批种子的发芽率。
[参考答案]
[ 0.95 , 0.97 ]
3.设总体X服从参数 的泊松分布,其概率分布率为 ,
x=0,1,2,……试求参数 的极大似然估计量及矩估计量。
A.求每晚睡眠时间总体均值的点估计。
B.假定总体是正态分布,求总体均值的点估计的95%置信区间。
[参考答案]
A.6.86,B.[6.54 , 7.18]
5.在某地方选举进行以前展开的民意测验表明,在随机抽取的121名居民中有65名支持某候选人,试求该候选人支持率的信赖区间。( =5%)
[参考答案]
0.54-0.089=0.451
答案:C
21.已知σ2的1-α置信区间为,该区间也可表示为()。
(D)以上答案都不正确
答案:B
二、多项选择题
1.在区间估计中,如果其他条件保持不变,置信度与精确度之间存在下列关系( )。
A.前者愈低,后者也愈低B. 前者愈高,后者也愈高
C. 前者愈低,后者愈高D.前者愈高,后者愈低
E. 两者呈相反方向变化
3.在进行参数估计时,我们并不是直接用一个个的具体样本之来估计、推断总体参数,而是根据样本构造出一些特定的量,用这些特定量来估计总体参数,这些根据样本构造的特定量就称为样本统计量。在估计过程中,我们把用来推估总体参数的样本统计量称为估计量。
第5章抽样调查及参数估计(练习题)

第五章抽样调查及参数估计5.1 抽样与抽样分布5.2 参数估计的基本方法5.3 总体均值的区间估计5.4 总体比例的区间估计5.5 样本容量的确定一、简答题1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计?2.什么是抽样误差,影响抽样误差的主要因素有哪些?3.简述概率抽样的五种方式二、填空题1.抽样推断是在随机抽样的基础上,利用样本资料计算样本指标,并据以推算总体数量特征的一种统计分析方法。
2.从全部总体单位中随机抽选样本单位的方法有两种,即重复抽样和不重复抽样。
3.常用的抽样组织形式有简单随机抽样、类型抽样、等距抽样、整群抽样等四种。
4.影响抽样误差大小的因素有总体各单位标志值的差异程度、抽样单位数的多少、抽样方法和抽样调查的组织形式。
5.总体参数区间估计必须具备估计值、概率保证程度或概率度、抽样极限误差等三个要素。
6.从总体单位数为N的总体中抽取容量为n的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。
7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。
8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。
三、选择题1.抽样调查需要遵守的基本原则是( B )。
A.准确性原则 B.随机性原则 C.代表性原则 D.可靠性原则2.抽样调查的主要目的是( A )。
A.用样本指标推断总体指标 B.用总体指标推断样本指标C.弥补普查资料的不足 D.节约经费开支3.抽样平均误差反映了样本指标与总体指标之间的( B )。
A.实际误差 B.实际误差的平均数C.可能的误差范围 D.实际的误差范围4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D )。
A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。
参数估计方法

第八章参数估计方法研究工作的目的在于了解总体特征的有关信息,因而用样本统计数估计相应总体参数,并由之进行统计推断。
总体特征的各种参数,在前几章主要涉及平均数、标准差等,并只从直观上介绍其定义和公式,未就其历,即参数估计(parameter estimation)的方法作讨论。
本章将简要介绍几种常用参数估计方法,即矩法、最小二乘法、极大似然法。
第五章述及参数的点估计(point estimation)和区间估计(interval estimation),本章讨论点估计方法。
区间估计是在点估计的基础上结合统计数的抽样分布而进一步作出的推论,有关内容将散见在其它各章。
第一节农业科学中的主要参数及其估计量的评选标准一、农业科学中的主要参数农业科学研究中需要估计的参数是多种多样的,主要包括总体数量特征值参数,例如,用平均数来估计品种的产量,用平均数差数来估计施肥等处理的效应;用百分数(或比例)来估计遗传分离比例、群体基因或基因型频率、2个连锁主基因间的重组率;通过变异来源的剖分,用方差来估计环境方差、遗传方差和表型方差,在此基础上以估计性状的遗传力等遗传参数;用标准误来估计有关统计数的抽样误差,如重组率的标准误、遗传抽样误差、遗传多样性误差、频率误差等。
在揭示变数间的相互关系方面,用相关系数来描述2个变数间的线性关系;用回归系数、偏回归系数等来描述原因变数变化所引起的结果变数的平均变化的数量,用通径系数来描述成分性状对目标性状的贡献程度等。
有关数量关系和数量变化方面的内容将在第9至11章介绍。
二、参数估计量的评选标准讨论参数估计方法前需要了解数学期望(expectation)的概念和评价估计方法优劣的标准。
(一) 数学期望在抽样分布中,已经讲述了从总体中抽出所有可能样本的样本平均数的平均数等于总体平均数,这里,样本平均数的平均数就是一种数学期望。
例如,一个大豆品种的含油量为20%,测定一次可能是大于20%,再测定可能小于20%,大量反复测定后平均结果为20%,这时20%便可看作为该大豆品种含油量的数学期望,而每单独测定一次所获的值只是1个随机变量。
第五章参数估计与非参数估计

N
k
∴ 条件密度的估计:P(x) N
V
(V足够小)
讨论:① 当V固定的时候N增加, k也增加,当 N 时 k
P
k
1
P(x)
k N
1
只反映了P(x)的空间平均估计
N
VV
而反映不出空间的变化
② N固定,体积变小
k
当 V 0时,k=0时 P(x) N 0
V
k
k 0 时 P(x) N
i=1,2,…M
所以后验概率
P(
|
X
i)
P( X i | ).P() P(X i | )P()d(贝叶斯公式)
因为N个样本是独立抽取的,所以上式可以写成
N
P( | X i) a P(X k | ).P()
k 1
其中 a
1
P( X i | )P()d 为比例因子,只与x有关,与μ无关
∵ P(Xk| μ)=N(μ,σ2),P(u)=N(μ0,σ02)
P( X i | i) 服从正态分布
待估参数为 i 1
N
k1
logP(X k | ) 0
所以在正态分布时
P(
X
k
|
)
1 2
log[
2
n
|
|]
1 2
X
k
T
1 X k
代入上式得
N
1 X k 0
k 1
N
1 X k 0 k 1
N
所以 1( X k N) 0 k 1
出使它最大时的θi值。
∵学习样本独立从总体样本集中抽取的
N
∴ P( X i | i. i) P( X i | i) P( X k | i)
第5章 参数估计

猎物射击,结果该猎物身中一弹,你认为谁打中的可能
性最大? 根据经验而断:老猎人打中猎物的可能性最大. 极大似然估计法的思想就是对固定的样本值,选
择待估参数的估计值使“样本取样本值”[离散型]或 “样
本取值落在样本值附近”[连续型] 的概率最大。
(2、极大似然估计的求法
单参数情形
根据总体分 布律写出似 然函数:换x 为xi
来得到待估参数θ 的极大似然估计值(驻点);
③ 、必要时,参照极大似然估计值写出极大似然
估计量.
【例6】求服从二项分布B(m,p)的总体X未知参数 p的极大似然估计量。 〖解〗单参数,离散型。 因为总体 X
~ B(m, p),
x m x
其分布律为
m x
f ( x; p) C p (1 p)
下面分离散型与连续型总体来讨论. 设离散型总体X的分布律
P{X x} p( x; )
( )
形式已知,θ 为待估参数. X 1 , X 2 ,..., X n 为来自总体X的
样本, x1 , x2 ,..., xn 为其样本值,则 X 1 , X 2 ,..., X n 的联合分
布律为:
用其观察值
ˆ( X , X ,..., X ), 1 2 n
——θ 的估计量
ˆ( x , x ,..., x ) 1 2 n
——θ 的估计值
来估计未知参数θ .
今后,不再区分估计量和估计值而统称为θ 的估计,
ˆ . 均记为
二、构造估计量的两种方法
1、矩估计法 理论根据:样本矩(的连续函数)依概率收敛于总
因为X~N(μ ,σ 2),所以X总体的概率密度为
2 1 (x ) 2 f ( x; , ) exp ( R, 0) 2 2 2
第5章概率论与假设检验简介

样本均 值分布
σ σx = n
µx = µ
2011-4-27
X
23
2.样本方差的分布
Statistics Statistics
设总体~ 的样本, 设总体 ~ N(µ,σ2 ), 取容量 的样本 , 则样 , 取容量n的样本 本方差 s2
χ2(n – 1):自由度为 :自由度为(n-1)的卡方分布 的卡方分布
1. 2.
密度函数f(x)曲线下的面积等于 曲线下的面积等于1 密度函数 曲线下的面积等于 分布函数是f(x) 下小于 x0 的面积 分布函数是
f(x)
F ( x0 )
x0
2011-4-27
x
8
期望和方差
Statistics Statistics
2011-4-27
E( X ) = ∫ xf (x)dx = µ
2011-4-27
12
正态分布标准化
Statistics Statistics
1. 标 准 化 线 性变换
2.
标准正态 分布的概 率密度和 分布函数
2011-4-27
13
一般正态分布
标准正态分布
σ
σ =1
µ
x
µ=0
Z
Excel:正态分布函数
Statistics Statistics
NORMDIST (x, mean, std, cumulative) Cumulative=0:返回指定平均值和标准差的正态分 : 布函数的概率密度 Cumulative=1:返回累积概率密度(分布函数值) :返回累积概率密度(分布函数值) NORMINV (prob, mean, std) NORMDIST (x, mean, std, 1)的反函数 的反函数 NORMSDIST(z) 返回标准正态分布函数的累积概率P(X ≤ z ) 返回标准正态分布函数的累积概率 NORMSINV(probability) NORMSDIST(z)的反函数 的反函数
第5章抽样分布与参数估计

第5章抽样分布与参数估计在统计学中,抽样分布与参数估计是重要的概念。
抽样分布是指从总体中随机抽取样本,计算样本统计量,然后将这些统计量进行分布的过程。
参数估计是通过样本数据对总体参数进行估计的方法。
首先,我们来了解抽样分布。
在统计学中,我们通常很难直接获得总体数据,因为总体数据往往很大,难以收集。
因此,我们采用抽样的方式来获取样本数据,并通过样本数据来推断总体特征。
抽样分布是指在重复抽取样本的过程中得到的统计量的分布。
抽样分布的中心趋于总体参数,而抽样分布的形状可以通过中心极限定理进行描述。
中心极限定理认为,当样本数量足够大时,样本均值的抽样分布近似服从正态分布,且均值等于总体均值。
这对于统计推断和参数估计具有重要意义。
其次,我们来了解参数估计的概念及其方法。
参数估计是指根据样本数据对总体参数进行估计的统计方法。
常见的参数包括总体均值、总体方差等。
参数估计可以分为点估计和区间估计两种方法。
点估计是指通过样本数据计算得到的单个数值来估计总体参数。
常用的点估计方法包括最大似然估计和矩估计。
最大似然估计是基于样本的观测值选择使得观测值出现的概率最大的参数值作为估计值的方法。
矩估计是通过样本矩与总体矩的对应关系来估计总体参数的方法。
区间估计是指对总体参数给出一个区间估计值,该区间包含了真实参数值的概率。
常用的区间估计方法包括置信区间估计和预测区间估计。
置信区间估计是通过样本数据计算得到的一个区间,可以包含真实参数值的概率。
置信区间的置信水平是指在多次重复抽样中,这个区间包含了真实参数值的概率。
预测区间估计是在给定自变量取值的情况下,通过样本数据对应的因变量的取值的一个区间估计。
总之,抽样分布与参数估计是统计学中重要的概念和方法。
通过抽样分布可以了解样本统计量的分布情况,而参数估计可以通过样本数据对总体参数进行估计。
这些概念和方法对于数据分析和决策具有重要的实际应用价值。
统计学知识点

第一章1、什么是统计学:收集、处理、分析、解释数据并从数据中得出结论的科学2、统计方法:(1)描述统计(知道总体数据)①含义:研究数据收集、整理和描述的统计学方法②内容:搜集数据、整理数据、展示数据、描述性分析③目的:描述数据特征、找出数据的基本规律(2)推断统计①含义:研究如何利用样本数据来推断总体特征的统计学方法②内容:参数估计、假设检验③目的:对总体特征作出推断3、统计应用上的两个极端:不用或几乎不用统计;简单问题复杂化4、统计的滥用:不好的样本;过小的样本;误导性图表;局部描述;故意曲解5、什么是变量:从一次观察到下一次观察会出现不同结果的某种特征6、数据:观察到的变量的结果7、数值变量:又称定量变量,观测结果表现为数字的变量8、分类变量:又称无序分类变量,观测结果表现为某种类别的变量,分类变量和顺序变量统称为定性变量9、顺序变量:又称有序分类变量,观测结果表现为某种有序类别的变量10、总体:包含所研究的全部个体(数据)的集合11、样本:从总体中抽取的一部分元素的集合12、样本量:构成样本的元素的数目13、概率抽样:根据一个已知的概率来抽取样本单位,也称随机抽样特点:按一定的概率以随机原则抽取样本;抽取样本时使每个单位都有一定的机会被抽中;每个单位被抽中的概率是已知的,或是可以计算出来的;当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率14、简单随机抽样含义:从总体N个单位(元素)中随机地抽取n个单位作为样本,使得总体中每一个元素都有相同的机会(概率)被抽中方法:抽取元素的具体方法有重复抽样和不重复抽样特点:简单、直观,在抽样框完整时,可直接从中抽取样本;用样本统计量对目标量进行估计比较方便局限性:当N很大时,不易构造抽样框;抽出的单位很分散,给实施调查增加了困难;没有利用其他辅助信息以提高估计的效率15、分层抽样含义:将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点:保证样本的结构与总体的结构比较相近,从而提高估计的精度;组织实施调查方便;既可以对总体参数进行估计,也可以对各层的目标量进行估计16、系统抽样含义:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难17、整群抽样含义:将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点:抽样时只需群的抽样框,可简化工作量;调查的地点相对集中,节省调查费用,方便调查的实施;缺点是估计的精度较差第二章18、频数:落在各类别中的数据个数19、比例:某一类别数据个数占全部数据个数的比值20、百分比:将对比的基数作为100而计算的比值21、比率:不同类别数值个数的比值22、定性数据与定量数据的表示方法(表+图)定性数据:频数分布表、条形图、帕累托图、饼图、环形图定量数据:频数分布表、直方图、茎叶图、箱线图、垂线图、误差图、散点图、雷达图、轮廓图23、环形图与饼图的区别:饼图只能显示一个总体各部分所占的比例;环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环24、生成频数分布表的步骤:确定组数、确定组距、统计出各组的频数25、直方图是用于展示分组数据分布的一种图形,用矩形的宽度和高度来表示频数分布(本质上是用矩形的面积来表示频数分布),在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图;直方图下的总面积等于1 26、直方图与条形图的区别:①条形图中的每一矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距;②由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列;③条形图主要用于展示定性数据,而直方图则主要用于展示定量数据27、茎叶图与直方图的区别:①直方图可观察一组数据的分布状况,但没有给出具体的数值;②茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息;③直方图适用于大批量数据,茎叶图适用于小批量数据28、箱线图:用于显示未分组的原始数据的分布29、垂线图:用于展示多个变量或多个样本取值的分布状况30、散点图:用于展示两个变量之间的关系;用横轴代表变量x,纵轴代表变量y,每组数据(x i,y i)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的图31、雷达图:也称为蜘蛛图;用于研究多个样本在多个变量上的相似程度;当多个变量的取值相差较大或量纲不同时,可进行变换(线性变换或对数变换)处理后再做图。
参 数 估 计

二、参 数 估 计
【例5-5】 设X~B(1,p),(X1,X2,…,Xn)是取自总体X的一个子样, 试求参数p的极大似然估计量。
解:设(x1,x2,…,xn)是子样(X1,X2,…,Xn)的一组相应的取值。总体X 的分布律为
则似然函数为 取对数后,有 令
二、参 数 估 计
从而得p的极大似然估计值为 p的极大似然估计量为
项目
参数估计
二、参 数 估 计
一、 参数估计的基本原理
参数估计是指由样本指标值(统计量)估计总体指标值 (参数),即当总体的分布性质已知,但其所含参数真值未 知时,根据一组样本的观察值X1,X2,…,Xn来估计总体中未 知参数θ或θ的某函数。首先从样本(X1,X2,…,Xn)中提取有 关总体X的信息,即构造样本的函数——统计量 g(X1X2,…,Xn);然后用样本值代入,求出统计量 g(x1,x2,…,xn)的值,用该值来作为相应待估参数的值。
二、参 数 估 计
二 、 评价估计量的标准
在参数估计中,用样本估计量 作为总体参数θ的估 计量,实际上,对于同一参数,用不同的估计方法求出的估 计量可能不相同,用相同的方法也可能得到不同的估计量。 也就是说,同一参数可能具有多种估计量,而且,从原则上 讲,任何统计量都可以作为未知参数的估计量,那么采用哪 一个估计量好呢?这就涉及估计量的评价问题,而判断估计 量好坏的标准是:有无系统偏差,波动性的大小,伴随样本 容量的增大是否越来越精确,这就是估计的无偏性、有效性 和一致性。
区间的概念,并给出在一定可信程度的前提下求置信区间的
方法,使区间的平均长度最短。
二、参 数 估 计
用给定的置信度1-α说明区间估计的可靠程度
,通常α取值很小,如取0.05、0.01,有时取0.1。
应用统计学 知识点考点汇总

SA
SA r 1
FA
SA SE
因素 B S B
s1
SB
SB s1
FB
SB SE
交互作用 S AB (r 1)(s 1)
S AB
(r
S AB 1)(s 1)
F A B
S AB SE
误 差 SE
rs(t 1)
SE
SE rs(t 1)
总 和 ST
rst 1
表2 无交互作用的双因素方差分析表
第十章 指数
1.指数的概念、性质 2.总指数的编制
拉氏指数、 帕氏指数
简单指数、加权综合指数(质量指标综合指数、数 量指标综合指数)、加权平均指数
3.消费价格指数的编制和使用
消费价格指数、实际收入、货币购买力
4.指数基期改换的方法
5.总量指标变动的因素分析
• 两因素分析
销售额指数=拉氏销售量指数 ×帕氏价格指数
第四章 集中趋势和离中趋势
1.集中趋势的计量 算术平均、加权算术平均、中位数、众数、
分位数、几何平均数、调和平均数等的计算;(注 意应用条件及分组数据的计算)
均值、中位数、众数之间的关系(数量、位置) 2. 离中趋势的计量
极差、方差和标准差、变异系数、四分位差、 异众比率、平均差系数等的计算
• Chebishev定理:
一元线性回归模型、假定条件、参数估计(最小二乘法)
ˆ1
( xi x)(Yi Y )
i
( xi x)2
i
ˆ0 Y ˆ1 x
n xiYi xi Yi
ˆ1=
i
n
i
xi2 (
i
xi )2
i
i
ˆ0 Y ˆ1 x
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第5章参数估计及点估计5.1考点归纳一、点估计1.矩估计法(1)定义设X为连续型随机变量,其概率密度为,或X为离散型随机变量,其分布律为,其中为待估参数,,,,是来自X的样本,假设总体X的前k阶矩或(X离散型)存在,其中,=1,2,…,k.一般来说,它们是的函数,基于样本矩依概率收敛于相应的总体矩(=1,2,,k),样本矩的连续函数依概率收敛于相应的总体矩的连续函数,我们就用样本矩作为相应的总体矩的估计量,而以样本矩的连续函数作为相应的总体矩的连续函数的估计量,这种估计方法称为矩估计法.(2)矩估计法的具体做法设这是一个包含k个未知参数的联立方程组,一般来说,可以从中解出,得到以分别代替上式中的,i=1,2,…,k,就以,i=1,2,…,k,分别作为,=1,2,…,k的估计量,这种估计量称为矩估计量,矩估计量的观察值称为矩估计值.2.克拉默-拉奥(Cramer-Rao)不等式(1)克拉默一拉奥不等式克拉默一拉奥不等式设ξ1,ξ2,…,ξn为取自具有概率函数f(x;0),θ∈Θ={θ:a<0<b}的母体ξ的一个子样,a,b为已知常数,a可以取-∞,b可以取+∞。
又η=u(ξ1,ξ2,…,ξn)是g(θ)的一个无偏估计,且满足正则条件:①集合{x:f(x;0)>0}与0无关;②与存在,且对一切θ∈Θ,;③令称为信息量,则等式成立的充要条件为存在一个不依赖于但可能依赖于θ的K,使得等式依概率1成立。
特别当g(θ)=θ时,上式可化为:称它为克拉默—拉奥不等式。
也称为信息不等式。
(2)重要性质及定义①性质:若则②定义a.若θ的一个无偏估计使克拉默一拉奥不等式中等式:成立,则称的有效估计。
b.若的一个无偏估计,且克拉默一拉奥不等式下界存在,则称下界与的比为估计的有效率,这里。
c.若当时,一个估计的有效率则称为参数的渐近有效估计。
3.拉奥-勃拉克维尔(Rao-Blackwell)定理(1)拉奥-勃拉克维尔定理设ξ与η是两个随机变量,且Eη=μ,Dη>0.设ξ=x条件下叼的条件期望,则(2)相关定理设ξ1,ξ2,…,ξn是取自一个母体ξ的子样,ξ有概率函数,且是θ的一个充分统计量,不仅是η的函数,且Eη2=θ,则是θ的充分统计量的函数,其均值=0,方差。
4.最大似然估计法(1)样本似然函数①离散型随机变量若总体X属离散型,其分布律的形式为已知,为待估参数,是可能取值的范围,设是来自X的样本,则的联合分布律为又设是相应于样本的一个样本值,易知样本取到观察值的概率,亦即事件发生的概率为这一概率随的取值而变化,它是的函数,称为样本的似然函数.注意:这里是已知的样本值,它们都是常数.②连续型随机变量若总体X属连续型,其概率密度的形式已知,为待估参数,是可能取值的范围.设是来自X的样本,则的联合密度为设是相应于样本的一个样本值,则随机点()落在点()的邻域(边长分别为的n维立方体)内的概率近似地为其值随的取值而变化,我们取的估计值使概率取到最大值,但因子不随而变,故只需考虑函数的最大值,这里L()称为样本的似然函数.(2)最大似然估计值的求法①在很多情形下,和关于可微,这时常可从方程解得.②L()与lnL()在同一处取到极值,因此,的最大似然估计也可以从方程求得,该方程称为对数似然方程.(3)最大似然估计法的推广最大似然估计法也适用于分布中含多个未知参数的情况,这时,似然函数L是这些未知参数的函数.分别令或令解上述由k个方程组成的方程组,即可得到各未知参数的最大似然估计.(4)最大似然估计不变性设的函数,θ∈Θ具有单值反函数,又假设是X的概率分布中参数θ的最大似然估计,则是的最大似然估计,这一性质称为最大似然估计的不变性.二、基于截尾样本的最大似然估计1.截尾寿命试验(1)定时截尾寿命试验假设将随机抽取的n个产品在时间t=0时同时投入试验,试验进行到事先规定的截尾时间停止,如试验截止时共有m个产品失效,它们的失效时间分别为,此时m是一个随机变量,所得的样本称为定时截尾样本.(2)定数截尾寿命试验假设将随机抽取的挖个产品在时间t=0时同时投入试验,试验进行到有m个(m是事先规定的,)产品失效时停止.m个失效产品的失效时间分别为,这里是第m个产品的失效时间,是随机变量,所得的样本称为定数截尾样本.2.截尾样本的最大似然估计(1)定数截尾寿命试验的最大似然估计量为其中称为总试验时间,它表示直至时刻为止,n个产品的试验时间的总和.(2)定时截尾寿命试验的最大似然估计为其中称为总试验时间,它表示直至时刻为止n个产品的试验时间的总和.三、估计量的评选标准1.无偏性设是总体X的一个样本,是包含在总体X的分布中的待估参数,这里是的取值范围.若估计量的数学期望存在,且对于任意则称是的无偏估计量.2.有效性设(X1,X2,…,X n)与(X1,X2,…,X n)都是θ的无偏估计量,若对于任意θ∈Θ,有,且至少对于某一个θ∈Θ上式中的不等号成立,则称较有效.3.相合性设(X1,X2,…,X n)为参数θ的估计量,若对于任意θ∈Θ,当n→∞时(X1,X2,…,X n)依概率收敛于θ,则称为θ的相合估计量.即,若对于任意θ∈Θ都满足:对于任意ε>0,有,则称是θ的相合估计量.四、最小方差无偏估计1.均方误差(1)使用条件:小样本,有偏估计。
(2)均方误差为:,常用来评价点估计。
将均方误差进行如下分解:由分解式可以看出均方误差是由点估计的方差与偏差的平方两部分组成。
如果是的无偏估计,则。
(3)一致最小均方误差设有样本,对待估参数有一个估计类,如果对该估计类中另外任意一个的估计,在参数空间上都有,称是该估计类中的一致最小均方误差估计。
2.一致最小方差无偏估计定义:设是的一个无偏估计,如果对另外任意一个的无偏估计.在参数率间上都有,则称是的一致最小方差无偏估计,简记为UMVUE。
关于UMVUE,有如下一个判断准则:设是来自某总体的一个样本,是的一个无偏估计,,则是的UMVUE的充要条件是:对任意一个满足和的都有。
这个定理表明UMVUE的重要特征是:的最小方差无偏估计必与任一零的无偏估计不相关,反之亦然。
3.充分性原则定理:总体概率函数是是其样本,是的充分统计量,则对的任一无偏估计;令,则也是的无偏估计,且。
定理说明:如果无偏估计不是充分统计量的函数,则将之对充分统计量求条件期望可以得到一个新的无偏估计,该估计的方差比原来的估计的方差要小,从而降低了无偏估计的方差.换言之,在考虑的估计问题只需要在基于充分统计量的函数中进行,这就是充分性原则。
4.Cramer-Rao不等式(1)费希尔信息量定义:设总体的概率函数满足下列条件:①参数空间是直线上的一个开区间;②支撑与无关;③导数对一切都存在;④对,积分与微分运算可交换次序,即;⑤期望存在,则称为总体分布的费希尔信息量。
(2)定理(Cramer-Rao不等式)设总体分布满足费希尔信息里,是来自该总体的样本,是的任一个无偏估计,存在,且对中一切,对的微商可在积分号下进行,即对离散总体,则将上述积分改为求和符号后,等式仍然成立。
则有,称为克拉默-拉奥(C-R)不等式,其中称为的无偏估计的方差的C-R下界,简称的C-R下界。
特别,对的无偏估计有。
注意:大多数场合无偏估计都达不到其C-R下界。
五、贝叶斯估计1.统计推断的基础(1)总体信息:总体分布或总体所属分布族提供的信息;(2)样本信息:抽取样本所得观测值提供的信息;(3)先验信息:抽样(试验)之前有关统计问题的一些信息。
2.贝叶斯公式的密度函数形式公式:3.贝叶斯估计由后验分布估计有三种常用的方法:(1)使用后验分布的密度函数最大值点作为的点估计的最大后验估计;(2)使用后验分布的中位数作为的点估计的后验中位数估计;(3)使用后验分布的均值作为的点估计的后验期望估计。
用得最多的是后验期望估计,它一般也简称为贝叶斯估计,记为。
4.共轭先验分布(确定先验分布最常用的)定义:设是总体分布中的参数,是其先验分布,若对任意来自的样本观测值得到的后验分布与属于同一个分布族,则称该分布族是的共轭先验分布(族)。
六、区间估计1.置信区间设总体X的分布函数F(x;θ)含有一个未知参数θ,θ∈Θ(Θ是θ可能取值的范围),对于给定值α(0<α<1),若由来自X的样本X1,X2,…,X n确定的两个统计量和,对于任意θ∈Θ满足则称随机区间是θ的置信水平为1-α的置信区间,和分别称为置信水平为1-α的双侧置信区间的置信下限和置信上限,1-α称为置信水平.2.置信区间的具体求法(1)寻求一个样本X1,X2,…,X n和θ的函数W=W(X1,X2,…,X n;θ)使得W的分布不依赖于θ以及其他未知参数,称具有这种性质的函数W为枢轴量.(2)对于给定的置信水平1-α,定出两个常数a,b使得3.大样本置信区间对给定,利用标准正态分布的分位数可得。
4.(0-1)分布参数的区间估计设X1,X2,…,X n是一个样本,因样本容量n较大,由中心极限定理,知近似地服从N(0,1)分布,于是得到参数p的置信水平为1-的置信区间为此处5.单侧置信区间(1)单侧置信下限对于给定值α(0<α<1),若由样本X1,X2,…,X n确定的统计量(X1,X2,…,X n),对于任意θ∈Θ满足称随机区间是θ的置信水平为1-α的单侧置信区间,称为θ的置信水平为1-α的单侧置信下限.(2)单侧置信上限若统计量(X1,X2,…,X n),对于任意θ∈Θ满足称随机区间是θ的置信水平为1-α的单侧置信区间,称为θ的置信水平为1-α的单侧置信上限.七、正态总体均值与方差的区间估计1.单个总体的情况设已给定置信水平为1-α,并设X1,X2,…,X n为总体的样本.,S2分别是样本均值和样本方差.(1)均值μ的置信区间①σ2为已知,此时采用的枢轴量,已得到μ的一个置信水平为1-α的置信区间为②σ2为未知,因其中含未知参数σ,考虑到S2是σ2的无偏估计,将σ换成,知于是得μ的一个置信水平为1-α的置信区间(2)方差σ2的置信区间σ2的无偏估计为S2,,取作为枢轴量,即得方差σ2的一个置信水平为1-α的置信区间标准差σ的一个置信水平为1-α的置信区问2.两个总体,的情况设已给定置信水平为1-α,并设是来自第一个总体的样本;是来自第二个总体的样本,这两个样本相互独立,且设,分别为第一、第二个总体的样本均值,,分别是第一、第二个总体的样本方差.(1)两个总体均值差的置信区间①均为已知.因分别为的无偏估计,故是的无偏估计,由的独立性以及,得或取Z为枢轴量,即得的一个置信水平为1-α的置信区间②,但σ2为未知,此时取T为枢轴量,可得的一个置信水平为1-α的置信区间为此处(2)两个总体方差比的置信区间并且分布F(n1-1,n2-1)不依赖任何未知参数,取为枢轴量得的一个置信水平为1-α的置信区间为5.2典型题(含考研真题)详解一、选择题1.假设总体X的方差DX存在,X1,…,X n是取自总体X的简单随机样本,其均值和方差分别为,S2,则EX2的矩估计量是()。