《抽样与参数估计》PPT课件

合集下载

统计学基础ppt课件

统计学基础ppt课件
➢ 调查失败的主要原因是抽样框出现了问题。在经济大萧条 时期由于电话和汽车并不普及,只是富裕阶层才会拥有, 调查有电话和汽车的人们,并不能够反映全体选民的观点
4-4
统计学 参数估计在统计方法中的地位
基础
统计方法
描述统计
推断统计
参数估计
假设检验
4-5
第 4 章 抽样与参数估计
4.1 抽样与抽样分布
4 - 14
统计学 基础
有关抽样的几个基本概念
4、抽样比 抽样比是指在抽选样本时,所抽取的样本
单位数n与总体单位数N之比。一般地讲, n≥30为大样本,n<30为小样本。研究社会 经济现象时,通常采用大样本进行抽样调查。
对于给定的研究对象,全及总体是唯一确定 的,而样本总体不是唯一的,它是随机的。
有关抽样的几个基本概念
2、抽样框
目标总体规定了理论上的抽样范围,但是进行抽样 的总体单位与目标总体有时是不一致的,因而, 在抽样之前,还必须明确实际进行抽样的总体范 围和抽样单位。
抽样框是指用以代表总体,并从中抽选样本的一个
框架。
目标总体与抽样框有时是一致的;多数情 况下,目标总体的范围要率大于抽样框。
4. 局限性
当N很大时,不易构造抽样框 抽出的单位很分散,给实施调查增加了困难 没有利用其它辅助信息以提高估计的效率
4 - 17
统计学 基础
抽样方法和样本可能数目
1、重复抽样
重复抽样也叫重置抽样,是指每次抽取一个元素 后又放回,重新参加下一次的抽选,直到抽取n个 元素为止。全及总体单位数始终保持不变,每个总 体单位都有被重复抽中的可能。 重复抽样通常要考虑单位排列顺序,如电话号 码中的“8651”和“1568”不同。
其样本可能数目为 m重 N n

抽样调查与参数估计_PPT课件

抽样调查与参数估计_PPT课件
3、缺点:(1)若群内个单元有趋同性, 效率将会降低;(2)通常无法预先知道 总样本量,因为不知道群内有多少单元; (3)方差估计比简单随机抽样更为复杂。
4-23
(四)分层抽样 1、定义:在抽样之前将总体分为同质的、 互不重叠的若干子总体,也称为层。然后 在每一个层独立地随机抽取样本。 分层抽样示意图:
算估计值的抽样误差。
4-12
2.各种非概率抽样方法
➢方便抽样,又称任意抽样。样本单元的选取有调查 员决定,又被调查者主动提供信息。如街道拦截访问。 ➢志愿者抽样。被调查者都是自愿参与调查。如网上 问卷,自愿回答。 ➢判断抽样。由专家有目的地挑选“有代表性”的样 本进行调查。如典型调查。 ➢配额抽样。从总体的各个子总体中选取特定数量的 样本单元组成样本。如市场调查中,规定男女消费者 的样本各多少。 ➢ 滚雪球抽样。适合于总体中某种较为稀少的特殊子 总体而又缺少完整的抽样框。抽样时通过已知的少数 个体获得信息逐渐扩大。
3、缺点:(1)效率不如简单随机抽样; (2)通常不能提前知道最终的样本量; (3)调查的组织较整群抽样复杂;(4) 估计值与抽样方差的计算较为复杂。
4-27
(六)多相抽样
1、定义:在同一个抽样框内,先抽一个 大样本,收集基本的信息,然后在这个大 样本中再抽一个子样本,收集调查的详细 信息。
多相抽样示意图:
包括以下内容
重置抽样分布
4-14
七、抽样误差和非抽样误差
抽样误差是指由于抽选样本的随机性,用样本数据对 总体参数进行估计是所引起的误差。只有采取概率抽 样方式才能产生样误差,得到估计量的精度,因此我 们说抽样误差仅仅表现于概率抽样方式之中。与非概 率抽样方式相比,能够计算抽样误差是概率抽样最突 出的优点。

《抽样与参数估计》PPT课件

《抽样与参数估计》PPT课件
13
系统抽样〔等距抽样〕:先将总体各单位 按某种顺序排列,并按某种规那么确定一 个随机起点,然后每隔一定的间隔抽取一 个单位,直至抽取n个形成一个样本。
······ · · · · · ·
优点:具有简单随机抽样的特征,能比 较均匀地抽到总体中各个局部的单位, 简单易行。
14
非概率抽样
根据研究人员的主观判断来抽取样本, 研究人员有意识地选取样本单位,样本 单位的抽取不是随机的。
样本均值的抽样分布
30

n



xi M 1x i 1 .0 1 .5 1 2 6 4 .0 2 .5

n

(xi x)2
值 和
2 i1 x
M
方 差
(1.02.5)2 (4.02.5)2
0.6
2
25
16
n
式中:M为样本数目,n 为样本容量 比较及结论:1. 样本均值的均值〔数学期望〕等于总体均值
26
【例】设一个总体,含有4个元素〔个体〕,即总体单 位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、 X4=4 。总体的均值、方差?
均值和方差
N
Xi
i1 2.5
N
N
(Xi )2
2 i1
N
1.25
27
现从总体中抽取n=2的简单随机样本,在重复
抽样条件下,所有样本的均值如何分布?
4.1.1 概率抽样方法 4.1.2 抽样分布
20
三种不同性质的分布
总体分布 样本分布
频数分布表、图等
抽样分布:样本统计量的概率分布。结 果来自容量一样的所有可能样本。
21
某生产车间50名工人日加工零件数如下(单位:个)

统计学课件05第5章抽样与参数估计

统计学课件05第5章抽样与参数估计

反映样本数据的集中趋势和平均水平。
样本方差
定义
样本方差是每个样本数据与样本均值差的平方和的平均值,即 $s^2 = frac{1}{n} sum_{i=1}^{n} (x_i - overline{x})^2$。
计算方法
先计算每个样本数据与样本均值的差,然后将差平方,最后求和平 均。
作用
反映样本数据的离散程度和波动情况。
样本量的确定
根据调查目的和精度要求确定样 本量:精度要求越高,需要的样
本量越大。
根据总体规模和抽样方法确定样 本量:总体规模越大,需要的样 本量越大;分层或整群抽样较简 单随机抽样需要的样本量更大。
根据调查资源确定样本量:资源 有限时,需要在满足调查目的和 精度要求的前提下,合理确定样
本量。
02 参数估计
大数定律的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布函数F(x),则对于任意正实数ε,有 lim(n->∞)P(|X1+X2+...+Xn/n-E(X))/ε)=0,其中E(X)是随机变量X的期望值。
大数定律的实例
在抛硬币实验中,随着实验次数的增加,正面朝上的频率将趋近于0.5。
中心极限定理
中心极限定理定义
中心极限定理是指在大量独立同分布的随机变量中,不论 这些随机变量的分布是什么,它们的平均值的分布总是趋 近于正态分布。
中心极限定理的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布 函数F(x),则对于任意实数x,有lim(n->∞)P(∑Xi≤x)=∫(∞->x)F(t)dt。
样本分布的性质
无偏性
如果样本统计量的数学期 望等于总体参数,则该统 计量是无偏的。

四章抽样与参数估计

四章抽样与参数估计
统计学
(核心课程)
第 四 章 抽样与参数估计
4.1 抽样与抽样分布 4.2 参数估计的基本方法 4.3 总体均值的区间估计 4.4 总体比例的区间估计 4.5 样本容量的确定
4- 1
统计学
(核心课程)
学习目标
1. 理解抽样方法与抽样分布 2. 估计量与估计值的概念 3. 点估计与区间估计的区别 4. 评价估计量优良性的标准 5. 总体均值的区间估计方法 6. 总体比例的区间估计方法 7. 样本容量的确定方法
数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)
=10
n=4
x 5
n =16
x 2.5
= 50 X
总体分布
x 50
X
抽样分布
4- 24
统计学
(核心课程)
中心极限定理
(central limit theorem)
中心极限定理:设从均值为,方差为 2的一个任意总
体中抽取容量为n的样本,当n充分大时,样本均值的
2. 优点:操作简便,可提高估计的精度 3. 缺点:对估计量方差的估计比较困难
4- 11
统计学
(核心课程)
整群抽样
(cluster sampling)
1. 将总体中若干个单位合并为组(群),抽样时 直接抽取群,然后对中选群中的所有单位 全部实施调查
2. 特点
抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用,方便
样本均值的抽样分布
4- 18
统计学
(核心课程)
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概 率分布
2. 一种理论概率分布
3. 进行推断总体总体均值的理论基础

抽样与参数估计(9)

抽样与参数估计(9)

– 不重复抽样
2 x
2
n
2 x
2
n
N n N 1
样本均值的抽样分布 (数学期望与方差)
n
x
xi
i 1
M
1.0 1.5 4.0 16
2.5
n
(xi x )2
2 x
i 1
M
(1.0 2.5)2 (4.0 2.5)2 0.625 2
16
n
M为样本数目
比较及结论:1. 样本均值的均值(数学期望) 等于总体均值 2. 样本均值的方差等于总体方差的1/n
抽样方法
抽样方法
抽样方式
概率抽样
非概率抽样
简单随机抽样 整群抽样
二阶抽样与多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
简单随机抽样
(simple random sampling)
1. 从总体N个单位中随机地抽取n个单位作为样本,使
得每一个容量为样本都有相同的机会(概率)被抽中 2. 抽取元素的具体方法有重复抽样和不重复抽样 3. 特点

未知参数进行的估计
参数估计的基本方法
估计量与估计值
(estimator & estimated value)
1. 估计量:用于估计总体参数的随机变量 – 如样本均值,样本比例、样本方差等 – 例如: 样本均值就是总体均值 的一个估计量
2. 参数用 表示,估计量用 表示 3. 估计值:估计参数时计算出来的统计量的具体值
样本比例的抽样分布
1. 在重复选取容量为的样本时,由样本比例的所有可能取值形成的相对频数 分布
2. 一种理论概率分布 3. 当样本容量很大时,样本比例的抽样分布可用正态分布近似 4. 推断总体比例的理论基础

第五抽样分布与参数估计第一第二

第五抽样分布与参数估计第一第二

类型组的样本单位数。
3、等距抽样(系统抽样、机械抽 样)
概念:将总体各单位标志值按某一标志顺序排
队,然而按一定的间隔抽取样本单位。
排队的方法:①按无关标志 ②按有关标志
抽取样本单位的方法
◦ ①按相等的距离取样 ②对称等距取样
抽取第一个样本单位的方法
◦ ①随机抽取
②居中抽取
4、整群抽样
概念:把总体分为若干群,从总体群中抽取若干样 本群,对抽中的群进行全数登记调查。 如:某水泥厂一昼夜的产量为14400袋,现每隔 144分钟抽取1分钟的水泥(10袋)检查平均每袋 重量和一级品率
例子
根据古典概率定义可算出,抛一枚质地均匀的硬币, 出现正面与出现反面的概率都是0.5。历史上有很
多人都曾经做过抛硬币试验。
试验者
试验次数
正面出现的频率
蒲丰
4040
0.5069
K.皮尔逊
12000
0.5016
K.皮尔逊
24000
0.5005
罗曼诺夫斯基
80640
0.4979
第二节
抽样分布
一、三种分布含义
第五抽样分布与参数估计第一第二
第一节
抽样的基本概念
(二)样本容量与样本个数
1.样本容量
◦ 是一个样本中所包含的单位数。
2.样本个数
◦ 即样本可能数目。是指从一个总体中可能抽取多少个样本。 与抽样方法有关。
(三)抽样方法
1、重复抽样
◦ 从总体的N 个单位中要随机抽取一个容量为n的样本,每次 从总体中抽出一个单位后,经过调查又把它放回到总体中, 重新再参加下一次抽选。
类型组,然后从各类型组中采用简单随机抽样方式或 其它方式抽取样本单位。

第六章 抽样和参数估计

第六章 抽样和参数估计
16
2.5
D X2116X20 .62 5 2
X 1i6 1
n
例6.1 设从均值为μ=8,标准差σ=0.6 的总体中 随机抽取样容量为 n=25 的样本,假定总体并不是很偏
的,则 1.求样本均值 X 小于 7.9 的近似概率 2.求样本均值 X 超过 7.9 的近似概率
它是θ的函数,记
n
L,x1,x2, ,xnfxi , i1
称为似然函数。
(6.14)
最大似然估计法就是求似然函数的最大值点 作ˆ 为
θ 的估计量。
例6.4 设 X1,X2,,Xn来自正态总体 N(,2) ,求μ
与 2 的最大似然估计。
解:正态总体 N,2的概率密度为
2. P(X7.9)1P(X7.9)
1P(Z0.83 )0.7967
3. P( X 0.1) P( 0.1 X 0.1 )
0.12 0.12 0.12
PZ 0.83P(Z 0.83) 20.83120.79671
0.5934
解:⑴.根据中心极限定理,当厂商假定正确时,50个
电池的平均寿命 X 近似服从正态分布,有

54,
2
2

62
0.72
X
X n 50
0.720.85 X

X~N5,0 4 .825


P X 52P X0.8554502.8554
PZ2.351PZ2.35
Z0.0
5
2
2451
1
2
1.645 89 61.37
2
五、两个样本方差比的分布
设 X1,X2,,Xn1 为来自正态总体 N1,12 的一个 随机样本,Y1,Y2,,Yn2 是来自正态总体 N2,22 的一个

第5章 抽样和参数估计PPT演示课件

第5章  抽样和参数估计PPT演示课件

一个任意 分布的总

x


n
当样本容量足
够大(n﹥30)
,样本均值的 抽样分布逐渐 趋于正态分布
x
x
南京农业大学工学院 5
12
单一总体样本统计量的抽样分布
样本统计量
样本均值 x
样本比例 p
正态或非正 态
大样本
正态分布
非正态总 体
(小样本 )
非正态分布
大样本
正态分布
样本方差 s 2
2分布

21
(一)科学的估计方法具备的条件
要有合适的统计量作为估计量 要有合理的允许误差范围 要有一个可接受的置信度,即概率保证
程度
南京农业大学工学院 5
22
(二)点估计(point estimate)
用样本的估计量的某个取值直接作为总体参数的 估计值
例如:用样本均值直接作为总体均值的估计;用两个样 本均值之差直接作为总体均值之差的估计
x 2.5
σ2 =1.25
0.625 2
x 南京农业大学工学院 5
9
所有样本均值的均值和方差
n
x

xi
i1
M
1.0 1.5 4.0 16

2.5

(M为样本数目)
n
(xi x )2

2 x

i 1
M
(1.0 2.5)2 (4.0 2.5)2 0.625 2
的概率落入某一区间”
是不严格的,因为总体
均值是非随机的 。
南京农业大学工学院 5
19
5.2 参数估计
5.2.1 参数估计的一般问题 5.2.2 一个总体参数的区间估计 5.2.3 两个总体参数的区间估计 5.2.4 全及总量指标的推算

抽样和参数估计PPT - 第六章 抽样和参数估计 29页PPT文档

抽样和参数估计PPT - 第六章 抽样和参数估计 29页PPT文档
经济、管理类 基础课程
统计学
第四章 抽样与参数估计
4-1
经济、管理类 基础课程
统计学
参数估计在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
4-2
经济、管理类 基础课程
统计学
统计推断的过程
总体
4-3

样本统计量

例如:样本均
值、比例、方

经济、管理类 基础课程
统计学
第四章 抽样与参数估计
x
2 (1 n )(不重复抽样)
nN
3. 案例\抽样平均误差.doc ,P98例6-1,关于成数的抽样平均 误差
4. 3.抽样极限误差
4 - 15
经济、管理类 基础课程
统计学
四 参数估计的两种方法
1. 点估计:直接用样本统计量的值来代替总体参 数的值。
2. 区间估计:给出一个概率保证程度,求在这一 概率下总体参数的置信区间。
抽样分布近似服从均值为μ、方差为σ2/n的正态分布
一个任意分
x
n
布的总体
当样本容量足够
大时(n 30) ,
样本均值的抽样
分布逐渐趋于正
态分布
4 - 14
x
X
经济、管理类
基础课程 三 抽样过程中的几个误差概念 统计学
1. 抽样误差
2. 抽样平均误差
x
2 (重复抽样) n
xZ2

n,xZ2

n
4 - 18
经济、管理类 基础课程
统计学
总体均值的区间估计
(正态总体:实例)
【例】某种零件 解:已知X~N(,0.152),x=2.14, n=9,

统计学之抽样与总体参数的估计(ppt 67页)

统计学之抽样与总体参数的估计(ppt 67页)

6.1.3 样本均值的分布与中心极限定理
1、样本均值X分布的含义
采用随机抽样的方法,从总体中抽取大小为n的一个样本,计 算出它的平均值X1,然后将这些个体放回总体去,再抽取n个个 体,又可以计算出平均值X2,… 再将n个个体放回去,再抽取n个 个体,如此可以计算出无限个X,这些样本均值X所有可能值的 概率分布叫均值X的抽样分布.
第六章 抽样与总体参数的估计
统计推断是统计学研究的重要内容。抽样是进行统计 统计推断的基础工作。参数估计是统计推断的重要内 容之一。 6.1 抽样与抽样分布 6.2 参数的估计方法 6.3 总体均值和总体比例的区间估计 6.4 两个总体均值及两个总体比例之差的估计 6.5 正态总体方差及两个正态总体方差比的区间估计 6.6 相关系数的区间估计
2 2
2 2
S
2 X
1 n1 1
n1 i 1
(Xi
X )2,
X
1 n1
n1 i 1
Xi
SY2
1 n2 1
n2
(Yi
i 1
Y )2,Y
1 n2
n2
Yi
i 1
F(n1-1,n2-1)为第一自由度(分子自由度)为n1-1,为第二自由度 (分母自由度)为n2-1的F分布。
F分布的定义
设有两个总体X, Y,已知X ~ 2 (n1), Y ~ 2 (n2 ),并且X与Y相互独立,则称随机变量
具有可加性。
4) E( 2 (n)) n,
D( 2 (n)) 2n
卡方分布表给出了卡方变
量在不同自由度下的临界
值. P( 2 2 (n)) 0
2 (n)
当n很大时, 2 2(n) 近似服从 N ( 2n 1,1)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

X
x
x N XN x N
x
x
p p P p p p p N PN p p N
区间估计案例1
耐用时数 900以下 900——950 950——1000 1000——1050 1050——1100 1100——1150 1150——1200 1200以上
(2)种类:等比例、不等比例类型抽样 (3)抽样平均误差的计算
平均数抽样平均误差:重复抽样、不重复抽样 成数抽样平均误差:重复抽样、不重复抽样
抽样组织形式二
三、机械抽样
(1)概念——先按某一标志对总体各单位进行排队,然后依一 定顺序和间隔来抽取样本单位的一种抽样组织形式。
(2)种类:有关标志、无关标志机械抽样 (3)抽样平均误差的计算 :无关标志机械抽样用简单随机抽样
x n 400
t 1.96 100 196元
x
x
下限 x 8500196 8304元 x
上限
x

x

8500 196

8696元
区间估计案例3
为了研究新式时装的销路,在市场上随机对 900名成年人进行调查,结果有540名喜欢该新 式时装,要求以90%的概率保证程度,估计该市 成年人喜欢该新式时装的比率。
三、抽样平均误差
1、平均数抽样平均误差:重复抽样、不重复抽样 2、成数抽样平均误差:重复抽样、不重复抽样
四、抽样极限误差
Δ=tμ
第二节、抽样估计
一、点估计
以样本指标的实际值作为总体参数的估计量
二、区间估计
(1)平均数的置信区间 (2)成数的置信区间 (3)总量指标的置信区间
合计
组中值(x) 元件数(f)
875
1
925
2
975
6
1025
35
1075
43
1125
9
1175
3
1225
1

100
xf 875
1850 5850 35875 46225 10125 3525 1225 105550
区间估计案例1答案
已知:F(t) 95.45%
x
xf f
105550 1055.5 100
N

n


n N 1

2
1
n

n N
p
p1 p
n
p
p1 p N n
n N 1
p1 p1 n
n N
x

2
x

R

r

r R 1
p

2 p

R

r

r R 1
类型抽样案例1
何秀余: 重点
公式7、1 xn源自 x 2 N n
n N 1
x
2 1 n
n N
p
p1 p
n
p
p1 p N n
n N 1
P
p1 p1 n
n N
x X x
上限 p p 60% 2.67% 62。67%
第三节、抽样组织形式
一、简单随机抽样
(1)概念——按随机原则直接从总体N个单位中抽取n个单 位为样本。
(2)方法:随机数表法、抽签法
二、类型抽样
(1)概念——先对总体各单位按主要标志加以分组,再从各 组中按随机原则抽取一定单位构成样本。
x x 2 f 8751055.52 1 9251055.52 2 12251055.52 1 51.91
f
100
51.91 5.191
x n 100
t 2 5.191 10.4
x
x
平均数区间下限:x 1055.5 10.4 1045小时 x
平原 山区 合计
全部面积 (亩)
样本面积 (亩)
样本平均 亩产标准 亩产(公 差(公斤)
斤)
14000
280
560
80
6000
120
350
150
20000
400
497
106
类型抽样案例1答案
公式;有关标志机械抽样用类型抽样公式。
四、整群抽样
(1)概念——把总体各单位划分成许多群,然后从其中随机抽 取部分群,对中选群的所有单位进行全面调查的抽样组织形式。
(2)抽样平均误差的计算
– 平均数抽样平均误差的计算 – 成数抽样平均误差的计算
公式7、2
2
x
n
x

2

区间估计案例2

某城市进行居民家计调查,随机抽取400
户居民,调查得年平均每户耐用品消费支出为
8500元,标准差为2000元,要求以95%的概率
保证程度,估计该城市居民年平均每户耐用品消
费支出。
区间估计案例2答案
已知:n=400 F(t)=95% x 8500 元 2000元
2000 100元
第七章 抽样与参数估计
抽样误差 抽样估计的方法 抽样组织设计
何秀余: 重点
第一节、抽样误差
一、抽样误差的概念
抽样误差是代表性的随机性误差
二、影响抽样误差大小的因素:
1、总体各单位标志变异程度; 2、样本单位数大小; 3、抽样方法:重复抽样、不重复抽样 4、抽样组织形式:简单随机抽样、类型抽样、机械抽样、整群抽样
区间估计案例3答案
已知:n=900 n1=540 F(t)=90%
p n1 540 60% n 900
p
p1 p
n
0.61 0.6 1.63%
900
p t p 1.64 1.63% 2.67%
下限 p p 60% 2.67% 57.33%
平均数区间上限:x 1055.5 10.4 1066小时 x
区间估计案例1答案2
已知概率为90%
p n1 91 0.91 n 100
p
p1 p
n
0.911 0.91 2.86%
100
p t p 1.64 2.86% 5%
合格率区间下限: p p 91% 5% 86% 合格率区间上限: p p 91% 5% 96%
相关文档
最新文档