社会统计学(卢淑华),第六章精编版
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n 1 i 1
3)样本成数 ˆP m n
第三节 参数的点估计
一、总体参数(均值与方差)的点估计公式
1、总体均值的点估计值
用样本均值:x 1 n xi n i 1
2、总体方差的点估计值
用样本方差:2
1 n
n
xi
1 i 1
x
2
用标准差: S S 2 作为σ 的点估计值
3、总体成数的点估计值
第六章 参数估计
第一节 统计推论
一、统计推论:根据局部资料对总体特征进行推断 特点: 1、局部资料的特性在某种程度上能反映总体的特征 2、抽样结果不能恰好等于总体的结果
二、理论基础:概率论 三、内容:
1、通过样本对总体的未知参数进行估计(参数估计) 2、通过样本对总体的某种假设进行检验(假设检验)
第二节 名词解释
信度为0.95时的 的双侧置信区间。
2、 2 为未知时
当总体满足正态分布,但 2未知的情况
下,以下统计量满足自由度k=n-1的t分布。
t x
sn
t n 1
的双侧置信区间有:p t t 2 1
代入:
P x t 2
s
x t 2
s 1
n
n
接上例
如果 2 未知,x 800 s 10 0.05
一、例
二、样本均值的分布
1、总体分布为正态分布 N , 2 ,且方差已知,样本均值自
然服从正态分布。
x
2、总体为正态分布 N ,2 ,但方差为未知,统计量 s n
已不再服从正态分布,而是服从自由度k=n-1的t分布。
3、任意总体,大样本情况,根据中心极限定理,在大样本
情况下,x 的分布接近于正态分布。
Q,则
2、有效性:
1)方法:如果两个估计值Qˆ1 x1 x2 xn 及 Qˆ 2 x1 x2 xn ,它
都满足无偏性,那么当 Qˆ1 的方差比 Qˆ 2 的方差小时,则Q1 较 Q2 更
有效。
2)增加样本容量可以有效的增加一次抽样接近待估参数的概率。
x 样本均值
2
的方差:Dx n
样本方差
S 2 的方差
结论:在社会现象的研究中,只要n足够大,x 的分布将确
定它为一个近似的正态分布。
2
一般情况下 S2 分布很复杂,它的精确分布 不一定能求出来。要知道它的大致形状, 可通过计算机模拟的方法,从总体中随机 抽取相当数目的样本,并作出样本方差的 频率直方图。
第五节 正态总体的区间估计
一、置信度、置信区间
二、正态总体均值的区间估计
1、2 为已知
以下统计量满足正态分布
x Z n
对于 的双侧置信区间有
P Z 2 Z Z 2 1
z z 即: P x x 1
2n
2 n
N 0,1
练习
例:某地月收入状况服从正态分布,根据 64人的抽样,其平均收入为800元,求置
1、总体:研究的全体 2、样本与简单随机样本:
从总体中按一定方式抽出的一部分叫样本。要求 抽样的数据不但是随机变量而且相互独立,遵从 同一分布,那么,这种样本就叫简单随机样本。
▲简单随机样本有3种情况
3、统计量:根据样本数据计算的统计指标称统计 量。
1n n i 1
2)样本方差 S 2 1
n
xi x 2
抽样人数为20,求置信区间。
三、正态总体方差的区间估计
对于正态总体 N , 2 ,以下统计量满足自
由度k=n-1的 x2 分布: n21S 2 x2 n 1
对于给定置信度 1 ,双侧区间2 x 的临界
值应满足: 2
2 2
x x x p
1 2
2
1
整理: n 12s
x p 2
2
:D2 S
4
n 2 1
3、一致性: 一个数的估计值要求随样本容量n的增大而以较
大的概率去接近被估计参数的值。
把样本容量为n时的估计值记作 Qˆ n ,如果 n
时,Qˆ n 按概率收敛于总体参数Q,即对于任何正 数 ,有:
lim P ˆ Q Q
1
n
则称 Qˆ n 是Q的一致估计值。
第四节 抽样分布
作为总体均值差 1 2 的点估计值。
2、区间估计:
z z x x x x x x x x p
1 2 1 2 1 2 1 2 1 2 1
2
2
2
2
x x n n 1 2
1 2
1
2
s 2 1
2 1
s 2 2 2 2
z z 区间:
p p p p
p1 p2
11
1
21
2
p p
n1
n2
1 1
p2 p 2
z 为正态分布双侧区间的分位点 2
n
(二)大样本总体成数p的区间估计 区间估计公式:
z z p p
2
p p p 2
p 1
p
总体成数p的点估计值
p
p1 p
n
当p未知情况下,用 p 代替 p p
z 为正态分布双侧区间的分位点 2
三、大样本二总体均值差的区间估计
1、样本均值差为:x1 x2 1 2
如果用Qˆ x1 x2 xn 作为未知参数Q的估计值,那么区间
包含参数Q之概率为1
的关系表达式为
Q Q,
——置信区间(反映估计的准确性)
1
置信度(置信概率)(置信区间估计的可靠性)
显著性水平(置信区间不可靠的概率)
置信区间与置信度的关系:
在样本容量一定的情况下,置信区间和置信度是相互制约
的。置信度愈大,则相应的置信区间也愈宽。
x x x x x x x x 1 2
1 2 1 , 2
1 2
2
2
z 为正态分布双侧区间的分位点 2
四、大样本二总体成数差的区间估计
1、样本成数差
p1
p
为总体成数差
2
p1 p2 的
点估计值。
2、区间估计
z p p z pp1
p2
2
p 1
p2
1
2 p1 p2 2
1
p
2p
1
用样本成数:p
1n
x n i 1 i
m n
n
xi
m
表示在样本n次观测中,A类共出
i 1
现m次。
例: 5位被调查者的月收入: A 500 B 510 C 490 D 520 E 480 求总体均值、方差的点估计值
二、评价估计值的标准
1、无偏性:x 的均值等于待估参数μ
如果 Qˆ 是总体参数Q的估计值,且Qˆ 分布的均值有 E Qˆ 称 Qˆ 是Q的无偏估计。
s 2
n
1
源自文库
2
2
1
x1 2
接上例:
抽样10户,收入状况如下: 790 800 810 820 780 760 840 800 750 850
求 的2 置信区间。( 0.05 )
第六节 大样本区间估计
一、大样本总体均值 的区间估计
z
p x
2
z s
n x 2
s 1 n
为总体标准差,当 为未知情况下,可
用样本标准差代替总体标准差。
n为样本容量 n 50
z2 为正态分布双侧区间的分位点。
二、总体成数(二项总体参数)的估计
(一)总体成数P的点估计
如果在样本容量为n的简单随机抽样中,对 于所要研究的A共出现m次,则样本成数 Pˆ
pˆ m 为总体中A成数P的点估计值。
n
E pˆ
Dp pˆpq