统计学之抽样与总体参数的估计(ppt 67页)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解: 根据中心极限定理,在总体不很偏的情况下,
8, X
0.6 0.12,
X n 25
X ~ N ( , 2 ) N (8,0.122 ), XX
(1)
P( X 7.9) P( X 8 7.9 8) P(Z 0.83)
ቤተ መጻሕፍቲ ባይዱ
0.12 0.12
P(Z 0.83) 0.5 P(0 Z 0.83) 0.5 0.2967 0.2033
完全随机地选取样本,要求有一个完美的抽样框或有总体中每一个个 体的详尽名单。可以采取抽签或随机数字表的办法实现。
(2)分层抽样(Reduced sampling)
先将总体分成不同的“ 层”, 然后,在每一“ 层”内进行简单随机 抽样。可防止简单随机抽样造成的样本构成与总体构成不成比例的 现象。
(3)整群抽样(Cluster Sampling)
2、非概率抽样
不是完全按随机原则选取样本。
(1)方便抽样(Convenience sampling)
由调查人员自由、方便地选择被调查者的非 随机选样。
(2)判断抽样(Judgement sampling)
通过某些条件过滤选择某些被调查者参与调 查的判断抽样法。
建议使用概率抽样方法:简单随机抽样、分层抽样、整群抽样或系统 抽样。从所估总体特征与样本结果的接近程度上讲,公式可用于估计 抽样结果的“ 优良性”。而用方便抽样和判断抽样方法不能对该“ 优 良性”进行估计。因而,当解释由非概率抽样方法得到的结果时,要 特别小心。
抽样方法分为两类:概率抽样和非概率抽样
1、概率抽样 •根据已知的概率选取被调查者; •最理想、最科学的抽样方法; •能保证样本数据对总体的代表性; •能有效控制抽样误差,将其限制在一定范围内; •缺点是:相对非概率抽样,花费较大。 概率抽样的几种形式:
(1)简单随机抽样(Simple random sampling)
6.1 抽样与抽样分布
6.1.1 总体、个体和样本
总体(Population)--要研究的事物或现象的总体。 个体(Item unit)--组成总体的每个元素(成员)。 总体容量(Population size)--一个总体中所含个体的数量。 样本(Sample)--从总体中抽取的部分个体。 样本容量(Sample size)--样本中所含个体的数量。 抽样(Sampling)--为推断总体的某些重要特征,需要从总体
x
X
什么叫n充分大呢?
总体偏离正态越远,则要求n就越 大。在实际应用中常要求n30。
例6.1 从一个均值=8,=0.6的总体中随机选取容 量为n=25的样本。假定该总体不是很偏的,
求:(1) 样本均值 X 小于7.9的近似概率;
(2) X 超过7.9的近似概率; (3) X 在总体均值=8附近0.1范围内的概率.
6.1.3 样本均值的分布与中心极限定理
1、样本均值X分布的含义
采用随机抽样的方法,从总体中抽取大小为n的一个样本,计 算出它的平均值X1,然后将这些个体放回总体去,再抽取n个个 体,又可以计算出平均值X2,… 再将n个个体放回去,再抽取n个 个体,如此可以计算出无限个X,这些样本均值X所有可能值的 概率分布叫均值X的抽样分布.
第六章 抽样与总体参数的估计
统计推断是统计学研究的重要内容。抽样是进行统计 统计推断的基础工作。参数估计是统计推断的重要内 容之一。 6.1 抽样与抽样分布 6.2 参数的估计方法 6.3 总体均值和总体比例的区间估计 6.4 两个总体均值及两个总体比例之差的估计 6.5 正态总体方差及两个正态总体方差比的区间估计 6.6 相关系数的区间估计
在整群抽样中,总体首先被分成称作群的独立的元素组,总体中的每一 元素属于且仅属于某一群。抽取一个以群为元素的简单随机样本, 样本中的所有元素组成样本。在理想状态下,每一群是整个总体小
范围内的代表。
(4)系统抽样(Systematic sampling)
又称等距抽样。从前k个元素中随机选一个,然后在样本框中每隔一 定距离抽取一个。
(2)
P( X 7.9) 1 P( X 7.9) 1 P( X 7.9) 1 0.2033
0.7967
(3)
P(7.9 X 8.1) P(7.9 8 X 8 8.1 8) P(0.83 Z 0.83)
0.12 0.12 0.12
2P(0 Z 0.83) 2 0.2967 0.5934
中按一定抽样技术抽取若干个体的过程。 统计量(Statistic)--由样本构造,用来估计总体参数的函数。统
计量是样本的函数,只依赖于样本;统计量不含任何参数。 样本均值、样本方差等都是统计量。
6.1.2 抽样方法 抽样设计与全面调查相比有如下特点:
(1)节省人力及费用; (2) 节省时间,提高调查研究的时效性; (3)保证研究结果的准确性。
(2)当总体的分布不是正态分布时,只要样本容量n足 够大时,样本均值的分布总是近似正态分布,此时要 求总体方差2有限。
假定总体均值为,方差为2
E X
E
n
Xi
i 1
n
1 n
EX1
X2
...
Xn
1 n
E( X1)
E( X 2 )
...
E(X n )
1 n
(
...
)
n
n
D( X )
D
n
Xi
i 1
n
1 n2
n
D(
i 1
Xi)
1 n2
D( X1)
D( X 2 ) ...
D(X n )
1 n2
( 2
2
... 2 )
n 2
n2
2
n
2 X
D(X )
n
中心极限定理(Central Limit theorem): 设从均值为,方差为2(有限)的任意一个总体中抽 取大小为n的样本,当n充分大时(n30),样本均值X 的抽样分布近似服从均值为,方差为2/n的正态分 布。
设X1,X2,…,Xn为某总体中抽取的随机样本, X1,X2,…,Xn为相 互独立,且与总体有相同分布的随机变量.
(1)当总体为正态分布N(, 2)时,X的抽样分布仍为正态分
布,
E(X ) , X
D( X ) 2
2
,
X
n
X
~
N
,
2
n
当n越来越大时,X的 离散程度越来越小, 即用X估计越准确。