第三章 参数估计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章参数估计
重点:
1.总体参数与统计量
2.样本均值与样本比例及其标准误差
难点:
1.区间估计
2.样本量确实定
知识点一:总体分布与总体参数
统计分析数据的方法包括:描绘统计和推断统计〔第一章〕
推断统计是研究如何利用样本数据来推断总体特征的统计学方法,包括参数估计和假设检验两大类。
总体分布是总体中所有观测值所形成的分布。
总体参数是对总体特征的某个概括性的度量。
通常有
总体平均数〔μ〕
总体方差〔σ2〕
总体比例〔π〕
知识点二:统计量和抽样分布
总体参数是未知的,但可以利用样本信息来推断。
统计量是根据样本数据计算的用于推断总体的某些量,是对样本特征的某个概括性度量。
统计量是样本的函数,如样本均值〔〕、样本方差〔 s2〕、样本比例〔p〕等。
构成统计量的函数中不能包括未知因素。
由于样本是从总体中随机抽取的,样本具有随机性,由样本数据计算出的统计量也就是随机的。
统计量的取值是根据样本而变化的,不同的样本可以计算出不同的统计量值。
[例题·单项选择题]以下为总体参数的是( )
a.样本均值b.样本方差
c.样本比例d.总体均值
答案:d
解析:总体参数是对总体特征的某个概括性的度量。
通常有总体平均数、总体方差、总体比
例题·判断题:统计量是样本的函数。
答案:正确
解析:统计量是样本的函数,如样本均值〔〕、样本方差〔〕、样本比例〔p〕等。
构成统计量的函数中不能包括未知因素。
[例题·判断题]在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、唯一的。
答案:错误
解析:作为推断对象的总体是唯一的,但作为观察对象的样本不是唯一的,不同的样本可以计算出不同的统计量值。
〔一〕样本均值的抽样分布
设总体共有n个元素,从中随机抽取一个容量为n的样本,在重置抽样时,共有n n种抽法,即
可以组成n n不同的样本,在不重复抽样时,共有个可能的样本。
每一个样本都可以计算出一个均值,这些所有可能的抽样均值形成的分布就是样本均值的分布。
但现实中不可能将所有的样本都抽取出来,因此,样本均值的概率分布实际上是一种理论分布。
数理统计学的相关定理已经证明:
即样本均值的均值就是总体均值。
在重置抽样时,样本均值的方差为总体方的1/n,即
在不重置抽样时,样本均值的方差为
其中,为修正系数,对于无限总体进展不重置抽样时,可以按照重置抽样计算,当总体为有限总体,n比拟大而n/n≥5% 时,修正系数可以简化为1-n/n,当n比拟大,而n/n<5%时,修正系数可以近似为1,即可以按重置抽样计算。
当总体服从正态分布时,样本均值一定服从正态分布,即有x~n(,)时,~n(,) 假设总体为未知的非正态分布时,只要样本容量 n足够大〔通常要求n ≥30〕,样本均值仍会接
近正态分布。
样本分布的期望值为总体均值,样本方差为总体方差的1/n 。
这就是统计上著名的中心极限定理。
该定理可以表述为:从均值为,方差为的总体中,抽取样本量为n的随机样本,当n充分大时〔通常要求n ≥30〕,样本均值的分布近似服从均值为,方差为的正态分布。
假如总体不是正态分布,当n为小样本时〔通常n<30〕,样本均值的分布那么不服从正态分布。
[例题·单项选择题]设一个总体共有5个元素,从中随机抽取一个容量为2的样本,在重置抽样时,共有( )个样本
a.25
b.10
c.5
d.1
答案:a
解析:在重置抽样时,共有n n种抽法,共有样本n n个,即52=5×5=25个。
[例题·单项选择题]设一个总体共有5个元素,从中随机抽取一个容量为2的样本,在不重置抽样时,共有( )个样本
a.25 b.10
c.5 d.1
答案:b
解析:在不重复抽样时,共有个可能的样本。
即
〔个〕
〔二〕样本比例的抽样分布
比例是指具有某种属性的单位占全部单位数的比重。
总体比例〔通常用π表示〕是总体中具有某种属性的单位数占全部总体单位数的比例,是一个参数,通常是未知的,也是我们想通过抽样得到的说明总体特征的数据。
样本比例〔通常用p表示〕是随机抽取的样本中具有某种属性的单位数占样本全部单位数的比例,是一个样本统计量,是随机变量,对于一个已经抽取出来的样本来讲,是可以观察到的。
描绘所
有可能样本比例的概率分布就是样本比例的抽样分布。
当样本容量比拟大时,样本比例p近似服从正态分布,且有p的数学期望就是总体比率π,即σ(p)=π
而p的方差与抽样方法有关,在重置抽样下为,在不重置抽样下为
即在重置抽样时, p的分布为p~n(,)
在不重置抽样时, p的分布为p~n(,)
一般讲,当 np≥5,并n(1-p) ≥5时,就可以认为样本容量足够大。
对于无限总体进展不重置抽
样时,可以按照重置抽样计算,当总体为有限总体,当n比拟大,而n/n ≤5%时,修正系数
会趋向1,这时也可以按重置抽样计算方差。
从上述分析可以看出,随着样本容量的增大,样本比例的方差愈来愈小,说明样本比例随样本容量增大,围绕总体比例分布的峰度愈来愈高。
[例题·单项选择题]当样本容量比拟大时,在重置抽样条件下,样本比例p的方差为( )
a. b. c. d.
答案:a
解析:当样本容量比拟大时,在重置抽样条件下,样本比例p的方差为
[例题·单项选择题]设一个总体含有3个可能元素,取值分别为1,2,3。
从该总体中采取重复抽样方法抽取样本量为2的所有可能样本,样本均值为2的概率值是( )
a.1/9 b.2/9 c.1/3 d. 4/9
答案:c
解析:在重复抽样下,样本为1,2,3的概率都是1/3。
[例题·判断题] 样本容量是指从一个总体中可能抽取的样本个数。
答案:错误
解析:样本容量是样本中个体的数目。
一个总体可以有多个样本,各个样本的的容量可以一样可以不同。
[例题·判断题]在确定总体比例估计中的样本容量时,假如缺少比例的方差,常取比例值为。
答案:正确
知识点三:统计量的标准误差
统计量的标准误差也称为标准误,是指样本统计量分布的标准差。
可用于衡量样本统计量的离散程度。
在参数估计中,它是用于衡量样本统计量与总体参数之间差距的一个重要尺度。
样本均值的标准误计算公式为:
当总体标准差σ未知时,可用样本标准差s代替计算,这时计算的标准误差称为估计标准误差。
相应地,样本比例的标准误计算公式为
同样,当总体比例的方差π〔1-π 〕未知时,可用样本比例的方差p(1-p)代替。
[例题·单项选择题] 样本均值的标准误差计算公式为( )
a. b. c. d.
答案:b
解析:样本均值的标准误差计算公式为
[例题·单项选择题]样本比例的标准误差计算公式为( )
a. b. c. d.
答案:a
解析:样本比例的标准误差计算公式为
[例题·单项选择题]统计量的标准误差也称为标准误,其大小与〔〕。
a. 样本量的平方根成反比
b. 样本量的大小成反比
c. 样本量的大小成正比
d. 总体的标准差成反比
答案:a
解析:样本均值的标准误计算公式为:,标准误与标准差成正比,与样本量的平方根成反比。
[例题·多项选择题]在参数估计中统计量的标准误差可用于〔〕
a.衡量样本统计量与总体参数之间的差距
b.衡量样本统计量的离散程度
c.衡量样本统计量的集中程度
d.衡量总体参数的离散程度
e.衡量总体参数的集中程度。
答案:ab
解析:统计量的标准误差也称为标准误,是指样本统计量分布的标准差。
可用于衡量样本统计量的离散程度。
在参数估计中,它是用于衡量样本统计量与总体参数之间差距的一个重要尺度。
第二节参数估计
知识点一:点估计与区间估计
一.点估计与区间估计
参数估计是用样本统计量去估计总体的参数。
用样本统计量来估计总体参数有两种方法:点估计和区间估计
点估计:是用样本统计量的实现值来近似相应的总体参数。
区间估计:是根据估计可靠程度的要求,利用随机抽取的样本的统计量确定可以覆盖总体参数的可能区间的一种估计方法。
区间估计是包括样本统计量在内〔有时是以统计量为中心〕的一个区间,该区间通常是由样本统计量加减估计标准误差得到的。
与点估计不同,进展区间估计时,根据样本统计量的抽样分布,
可以对统计量与总体参数的接近程度给出一个概率度量。
标准正态分布为n〔0,1〕分布,将概率分布标准化的公式为:
=
将z所对应的概率称为置信度或置信程度,将表示的范围称为置信区间。
几个概率下的置信区间:
1.以68.73%的置信程度推断总体参数推断总体参数μ的置信区间为〔z=1〕
〔〕
2.以95.45%的置信程度推断总体参数推断总体参数μ 的置信区间为(z=2)
〔〕
3.以99.73%的置信程度推断总体参数推断总体参数μ的置信区间为(z=3)
〔〕
4.还有一个95%的概率度为z=1.96
〔〕
[例题·多项选择题]由样本统计量来估计总体参数的方法有〔〕
a.点估计
b.区间估计
c.假设检验
d.近似估计
e.抽样估计
答案:ab
解析:用样本统计量来估计总体参数有两种方法:点估计和区间估计
[例题·单项选择题]以68. 27%的置信程度推断总体参数的置信区间为
a. b.
c. d.
答案:a
解析:68.27%的置信程度,其置信度为1,那么置信区间为
知识点二:评价估计量的标准
用于估计总体参数的估计量可以有很多,如何选择估计效果最好的那种估计量,评价估计量的好坏的标准详细有:
1.无偏性,是指估计量抽样分布的期望值等于被估计的总体参数。
e〔〕=
2.有效性,是指估计量的方差尽可能小。
对同一个总体参数的两个无偏估计量,有更小方差的估计量更有效。
3.一致性,是指随着样本量的增大,标准误越小,点估计量的值越来越接近被估计总体的参数。
[例题·多项选择题]评价估计量的标准为〔〕。
a.一致性 b.无偏性 c.显著性
d.有效性 e.综合性
答案:abd
解析:评价估计量的标准为:一致性、无偏性、有效性。
[例题·多项选择题]样本均值是总体均值的〔〕
a.无偏估计量
b.一致估计量
c.有偏估计量
d.无效估计
e.近似估计量
答案:ab
解析:从无偏性和一致性来看,样本均值是总体均值的无偏估计量、一致估计量。
知识点三:一个总体均值的区间估计
在对总体均值进展区间估计时,需要考虑总体是否为正态分布、总体方差是否,用于估计的样本是大样本〔n≥30〕还是小样本〔n<30〕等几种情况。
但不管哪种情况,总体均值的置信区间都是由样本均值加减估计误差得到的
一般将置信程度表示为1- a ,统计量分布两侧面积各为 a /2的分位数值,它取决于事先所要求的置信度〔或可靠程度〕。
因此总体均值在1- a 置信程度下的置信区间可一般性地表达为:〔
-分位数值*的标准误差,+分位数值*的标准误差〕
〔一〕大样本的估计
大样本〔n ≥30〕情况下,当总体方差时,总体均值在1-置信程度下的置信区间为〔〕
式中:为事先确定的一个概率值,它是总体均值不包括在置信区间的概率;1-为置信程度;
为标准正态分布上两侧面积各为/2时的z值;为估计误差。
大样本情况下,当总体方差未知时,上式中的可以用样本方差代替,总体均值在1-置信程度下的置信区间为〔〕
[例题·单项选择题]以95. 45%的置信程度推断总体参数的置信区间为
a. b.
c. d.
答案:b
解析:95.45%的置信程度,其置信度为2,那么置信区间为
〔二〕小样本的估计
小样本〔n<30〕情况下,对总体均值的估计都是建立在总体服从正态分布的假定前提下。
〔1〕当总体方差时,样本均值经过标准化后仍服从标准正态分布,此时总体均值在1-
置信程度下的置信区间仍为〔〕
〔2〕假如总体方差未知时,样本均值经过标准化后仍服从自由度为〔n-1〕的t分布,即。
t分布也是对称分布,只不过计算出来的t值对应的概率要查t分布概率表。
总体均值在1-置信程度下的置信区间为〔〕
总体均值的置信区间是由样本均值和估计误差两局部组成的。
[例题·单项选择题]小样本情况下,总体服从正态分布,总体方差,总体均值在置信程度
a. b.
c. d.
答案:a
解析:小样本〔n<30〕情况下,当总体方差时,样本均值经过标准化后仍服从标准正态分布,此时总体均值在1-置信程度下的置信区间仍为
〔〕
[例题·单项选择题]小样本情况下,总体服从正态分布,总体方差未知,总体均值在置信程度a. b.
c. d.
答案:a
解析:小样本情况下,假如总体方差未知时,总体均值在置信程度〔1-a〕下的置信区间为〔〕
[例题·单项选择题]在其他条件不变的情况下,进步抽样推断的置信度,抽样误差范围会〔〕。
a. 不变
b. 变小
c. 变大
d. 不能确定
答案:c
解析:估计误差,当抽样推断的置信度进步,为变大,范围会变大。
知识点四:一个总体比例的区间估计
在大样本〔n ≥30〕情况下,当总体比例时,在1-置信程度下,总体比例的置信区间为〔,〕
在大样本〔n ≥30〕情况下,当总体比例未知时,在1-置信程度下,总体比例的置信区间为〔〕
总体比例的置信区间是由样本比例和估计误差两局部组成的。
[例题·单项选择题]根据随机抽样调查资料,某企业工人消费定额平均完成 103%,标准误为 1%,置信度为 95.45%时,可以推断该企业工人的消费定额平均完成百分比〔〕。
a. 小于 101%
b. 大于 105%
c. 在 102%—104%之间
d. 在 101%—105%之间
答案:d
解析:估计误差=2*1%,那么103%±2%,范围为〔101%,105%〕
[例题·判断题]当np≥5,并且n(1-p) ≥5时,就可以认为样本容量足够大,样本比例近似服从正态分布。
答案:正确
解析:在大样本条件下,根据中心极限定理,假设np≥5,n(1-p) ≥5,那么二项分布可用正态分布近似。
第三节样本量确实定
知识点一:估计总体均值时样本量确实定
总体均值的置信区间是由样本均值和估计误差两局部组成的。
1.在重置抽样条件下,设e代表允许的估计误差,那么样本量计算公式为:
假如总体标准差σ未知,可以用样本标准差s来代替;也可以用试验调查的方法,选择一个初始样本,以该样本的标准差s作为总体标准差σ的估计值。
样本量与置信程度成正比,与总体方差成正比,与允许的估计误差的平方成反比。
[例题·计算题]对某大学的消费支出进展估计,该校的大学生消费支出的标准差为300元,如今想要估计消费支出95%的置信区间,允许的估计误差不超过30元,那么应抽取多大的样本量?
解:σ=300,e=30,zα/2=1.96.那么
=≈385人
即应抽取385人作为样本。
〔注意,不是四舍五入〕
[例题·多项选择题]决定样本量大小的因素有〔〕
a.置信程度
b.总体方差
c.允许的估计误差
d.总体均值
e.总体比例
答案:abc
解析:在重置抽样条件下,设e代表允许的估计误差,那么样本量计算公式为:
[例题·判断题]样本量与置信程度成正比,与总体方差成反比,与允许的估计误差成正比.〔〕答案:错误
解析:样本量,样本量与置信程度的平方成正比,与总体方差成正比,与允许的估计误差的平方成反比.
知识点二:估计总体比例时样本量确实定
在重置抽样条件下,设e代表允许的估计误差,那么样本量计算公式为:
样本量越大,估计误差就越小,估计的精度就越高。
估计误差由使用者预先确定。
大多数情况下,估计误差的取值一般应小于0.1.
假如总体比例π的值不知道,可以用样本比例s来代替,或者取π,使得π〔1- π〕到达最大。
[例题·计算题]某冷库对贮藏一批禽蛋的变质率进展抽样调查,根据以前的资料,禽蛋贮藏期变质率为5.3%。
4.9%,如今允许误差不超过5%,推断的置信程度为95%,问至少要抽取多少禽蛋进展检查?
解:π1=5.3%,π2=4.9%,e=5%,zα/2=1.96.
因为:π1〔1-π1〕χ〔〕
π2〔1-π2〕χ〔〕,选方差最大的,那么
=≈77个
即应抽取77个禽蛋作为样本。
[例题·多项选择题]计算样本容量,假如总体比例的值未知,可以〔〕
a.用样本比例来代替
b.取总体比例值为,使得π〔1- π〕到达最大
c.取总体比例值为,使得π〔1- π〕到达最大
d.取总体比例值为,使得π〔1- π〕到达最小
e.取总体比例值为,使得π〔1- π〕到达最小
答案:ab
解析:计算样本容量,假如总体比例的值未知,大多数情况下,估计误差的取值一般应小于0.1.假如总体比例π的值不知道,可以用样本比例s来代替,或者取π,使得π〔1- π〕到达最大。
[例题·判断题]在确定总体比例估计中的样本容量时,假如缺少比例的方差,常取比例值为。
答案:正确
解析:取π,使得π〔1- π〕到达最大。