统计学 第 6 章 抽样与参数估计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第6章抽样与参数估计
第6章抽样与参数估计
6.1抽样与抽样分布
6.2参数估计的基本方法
6.3总体均值的区间估计
6.4总体比例的区间估计
6.5样本容量的确定
学习目标
理解抽样方法与抽样分布
估计量与估计值的概念
点估计与区间估计的区别
评价估计量优良性的标准
总体均值的区间估计方法
总体比例的区间估计方法
样本容量的确定方法
参数估计在统计方法中的地位
统计推断的过程
6.1抽样与抽样分布
什么是抽样推断
概率捕样方法
抽样分布
抽样方法
抽样方法
概率抽样
(probabilitysampling)
也称随机抽样
特点
按一定的概率以随机原则抽取样本
抽取样本时使每个单位都有一定的机会被抽中
每个单位被抽中的概率是已知的,或是可以计算出来的
当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率
简单随机抽样
(simplerandomsampling)
从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础
特点
简单、直观,在抽样框完整时,可直接从中抽取样本
用样本统计量对目标量进行估计比较方便
局限性
当N很大时,不易构造抽样框
抽出的单位很分散,给实施调查增加了困难
没有利用其它辅助信息以提高估计的效率
分层抽样
(stratifiedsampling)
将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点
保证样本的结构与总体的结构比较相近,从而提高估计的精度
组织实施调查方便
既可以对总体参数进行估计,也可以对各层的目标量进行估计
系统抽样
(systematicsainplmg)
将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范闱内随机地抽取一个单位作为初始单位,然后按爭先规定好的规则确定其它样本单位
先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度
缺点:对估计量方差的估计比较困难
整群抽样
(clustersampling)
将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查
特点
抽样时只需群的抽样框,可简化工作量
调查的地点相对集中,节省调查费用,方便调查的实施
缺点是估计的精度较差
抽样分布
总体中各元素的观察值所形成的分布
分布通常是未知的
可以假定它服从某种分布
总体分布
(populationdistribution)
一个样本中各观察值的分布
也称经验分布
当样本容屋n逐渐增大时,样本分布逐渐接近总体的分布
样本分布
(sampledistribution)
抽样分布的概念
(samplingdistribution)
抽样分布是指样本统计屋的分布,即把某种样本统计量看作一个随机变量,这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布.
统计量:样本均值,
样本比例,
样本方差等
样本统计量的概率分布
是一种理论概率分布
随机变量是样本统计量
样本均值,样本比例,样本方差等
结果来自容量相同的所有可能样本
提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据对抽样分布的理解
抽样分布:即不是总体分布,也不是样本分布,是根据所有可能样本计算的统计量的全部可能取值形成的分布
样本均值的抽样分布
容量相同的所有町能样本的样本均值的概率分布
一种理论概率分布
进行推断总体均值的理论基础
样本均值的抽样分布
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为xl=l、
x2=2、x3=3、x4=4。总体的均值、方差及分布如下
均值和方差
样本均值的抽样分布
(例题分析)
现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为样本均值的抽样分布
(例题分析)
计算岀各样本的均值,如下表。并给出样本均值的抽样分布
样本均值的分布与总体分布的比较
(例题分析)
=2.5
02=1.25
总体分布
抽样分布-样本平均数的分布
某班组5个工人的口工资为34、38、42、46、50元。
=42
2=32
现用重置抽样的方法从5人中随机抽2个构成样本。共有52=25个样本。如右图。
验证了以下两个结论:
抽样平均数的标准差
反映所有的样本平均数与总体平均数的平均误差,称为抽样平均误差,用表示。
抽样分布—样本平均数的分布
样本均值的抽样分布
与中心极限定理
当总体服从正态分布N〜(u,o2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X的数学期望为U,方差为02/no即X〜N@,o2/n)
中心极限定理
(centrallmiittheorem)
中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分犬时,样本均值的抽样分布近似服从均值为u、方差为c2/n的正态分布
中心极限定理
(centrallimittheorem)
非正态总体的均值的抽样分布趋于正态分布的过程
补充:大数定理
大数定理
当样本容量n充分大时,可以用样本平均估计总体平均。
当试验次数n充分大时,可以用频率代替概率。
人数定理的意义:个别现象受偶然因素影响,但是,对总体的人量观察后进行平均,就能使偶然因素的影响相互抵消,从而使总体平均数稳定下来,反映出爭物变化的一般规律,这就是大数定理的意义。
极限定理:包扌舌大数定理与中心极限定理两类
人数定理:体现偶然性与必然性的辨证关系,偶然性是必然性的表现形式.频率稳定于概率,均值稳定于数学期望.
中心极限定理:研究在什么条件下,随机变量的和的分布可以近似正态分布.
极限定理是我们作人量社会调查具有科学性之所在,它从理论上表明了抽样调查的科学性,也为抽样调查的定量分析奠定了基础.
抽样分布与总体分布的关系
样本均值的数学期望
样本均值的方差
重复抽样
不重复抽样
PI10说明
样本均值的抽样分布的特征pl09
(数学期望与方差)
样本均值的抽样分布的特征
(数学期望与方差)
比较及结论:1.样本均值的均值(数学期塑)等于总体均值
2.样本均值的方差等于总体方差的1/n
样本比例的抽样分布
总体(或样本)中具有某种属性的单位与全部单位总数之比
不同性别的人与全部人数之比
合格品(或不合格品)与全部产品总数之比
总体比例可表示为样本比例可表示为
比例