应用统计学第六章抽样与参数估计-学生版

合集下载

统计学第六章抽样推断

统计学第六章抽样推断

尖山一委…
尖山二委
居民一组
居民二


第六章 抽样推断
某外国公司在##进行 微波炉市场调查:
STAT
在商场的大门口
在微波炉柜台前
在市区街道旁边
在某个住宅小区
时间表抽样框
第六章 抽样推断
连续出产的产品总体 可以编制抽样框:均STAT 匀的出产时间、可以 预见到的产品总量.
连续到加油站加油的 汽车总体无法编制抽 样框:时间不定、总 量也无法确定.
抽样估计的特点
第六章 抽样推断
按随机原则抽取样本单位
目的是推断总体的数量特征
抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
抽样估计的应用
第六章 抽样推断
不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时
抽样调查研究
Sampling Study
P N nN N NN n
共n个
⒉ 不重复抽样的可能样本数目:
C N n N N 1 N n 1
第六章 抽样推断
第六章 抽样推断
STAT
★§1.1 抽样方案的设计 ★§1.2 简单随机抽样的抽样误差的测定
§1.3 简单随机抽样的抽样估计
第六章 抽样推断
§1.2 简单随机抽样的抽样误差的测定 STAT
n1 1{i n1E(xiX)2nn(E xX)2} 由E(于 xX)2D (x)D (i1 nxi)n 1 2i n1D (xi)n2
E(sn21)n11{n2nn2}
2
⒋ 样本成数:
pn1,qn0 1p nn
⒌ 样本单位是非标志的标准差:
第六章 抽样推断

统计学 第 6 章 抽样与参数估计

统计学  第 6 章   抽样与参数估计

第6章抽样与参数估计第6章抽样与参数估计6.1抽样与抽样分布6.2参数估计的基本方法6.3总体均值的区间估计6.4总体比例的区间估计6.5样本容量的确定学习目标理解抽样方法与抽样分布估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准总体均值的区间估计方法总体比例的区间估计方法样本容量的确定方法参数估计在统计方法中的地位统计推断的过程6.1抽样与抽样分布什么是抽样推断概率捕样方法抽样分布抽样方法抽样方法概率抽样(probabilitysampling)也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样(stratifiedsampling)将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计系统抽样(systematicsainplmg)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范闱内随机地抽取一个单位作为初始单位,然后按爭先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难整群抽样(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差抽样分布总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布(populationdistribution)一个样本中各观察值的分布也称经验分布当样本容屋n逐渐增大时,样本分布逐渐接近总体的分布样本分布(sampledistribution)抽样分布的概念(samplingdistribution)抽样分布是指样本统计屋的分布,即把某种样本统计量看作一个随机变量,这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布.统计量:样本均值,样本比例,样本方差等样本统计量的概率分布是一种理论概率分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据对抽样分布的理解抽样分布:即不是总体分布,也不是样本分布,是根据所有可能样本计算的统计量的全部可能取值形成的分布样本均值的抽样分布容量相同的所有町能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。

统计学课后答案(第3版)第6章抽样分布与参数估计习题答案

统计学课后答案(第3版)第6章抽样分布与参数估计习题答案

第六章 抽样分布与参数估计习题答案一、单选1.B ;2.D ;3.D ;4.C ;5.A ;6.B ;7.C ;8.D ;9.A ;10.A 二、多选1.ADE ;2.ACDE ;3.ABCD ;4.ADE ;5.BCE6.ACD ;7.ACDE ;8.ACE ;9.BCE ;10.ABD 三、计算分析题1、解:n=10,小样本,由EXCEL 计算有:11.6498==S x ; (1)方差已知,由10596.14982⨯±=±nz x σα得,(494.9,501.1)(2)方差未知,由1011.62622.2498)1(2⨯±=-±nS n t x α得,(493.63,502.37)2、n=500为大样本,p=80/500=16%,则置信区间为 016.096.1%16500)16.01(16.096.1%16)1(2⨯±=-⨯±=-±n p p z p α=(14.4%,17.6%) 3、nx σσ=,由于大国抽取的样本容量大,则抽样平均误差小。

4、(1)3.10100103===nS x σ(小时);=-=-=100)95.01(95.0)1(n p p p σ 2.18%(2)=⨯±=±3.10211202x z x σα(1099.4,1140.6) ⨯±=±2%952p z p σα2.18%=(90.64,99.36)5、为简化起见,按照重复抽样形式计算 (1)∑∑=ff s Si22=22.292; 472.010072.4===nS x σ(2)93.0691472.096.1100691002±=⨯±=±nSz x α=(690.07,691.93) 6、由于总体标准差已知,则用标准状态分布统计量估计nz x σα2=∆(1)10160170102022=-===∆αασz nz x则58.12=αz ,有%29.94)58.1(=F α=1-94.29%=5.71%,则概率%58.88%71.5%29.941=-=-=α (2)=⇒⨯=⇒⨯=∆n n nz x 2096.142σα97(个)(3)=⇒⨯=⇒⨯=∆n nnz x 2096.122σα385(个)允许误差缩小一半,样本容量则为原来的4倍。

统计学第六章 抽样法

统计学第六章  抽样法
31
第六章 抽样法
序号
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15 16 合计
样本变量x
40、40 40、50 40、70 40、80
50、40 50、50 50、70 50、80
70、40 70、50 70、70 70、80
80、40 80、50 80、70 80、80

x
x E(x)
总体
研究如何利用 样本数据来 推断总体特 征。
内容包括:参 数估计和假 设检验。
目的:对总体
特征作出推
样 本
断。
这是推断统计学研 究的问题
5
第六章 抽样法
描述统计与推断统计的关系
反映客观 现象的数

概率论
(包括分布理论、大 数定律和中心极限定
理等)
样本数
描述统计
推断统计

总体数 据
(统计数据的搜集 、整理、显示和分
13
第六章 抽样法
第二节 有关抽样的基本概念(2)
(二)抽样总体
也称子样,样本或样本总体,它是从全 及总体中随机抽取出来的,代表全及总体的 那部分单位的集合体。抽样总体的单位数称 为样本容量,用n表示,对于N来说,n是很 小的。
总体
样 本
14
第六章 抽样法
第二节 有关抽样的基本概念(3)
• 二 全及指标和抽样指标p.249 (一) 全及指标
研究总体中 的品质标志
总体成数 P N1
N
总体成数标准差 P
P1 P
17
第六章 抽样法
第二节 有关抽样的基本概念(5)
(二)抽样指标
抽样指标是由样本总体各单位标志值 或标志特征计算的综合指标,也称统计量。 与全及指标相对应有:样本平均数,样本 标准差;样本成数,样本成数的标准差。

第六章 统计量及其抽样分布

第六章 统计量及其抽样分布

样本均值的抽样分布
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概率分 布
2. 一种理论概率分布 3. 进行推断总体总体均值的理论基础
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。 总体的均值、方差及分布如下

第 一
16个样本的均值(x)

第二个观察值
观 察值1 2
3
4
11
1.
20.

52. 0.
5
21
2.
25.

03. 5.
0
23
2.
30.

53. 0.
5
24
3.
35.

04. 5.
0
.3 P (X ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
第六章 统计量及其抽样分布
抽样理论依据: 1、大数定律 (1)独立同分布大数定律:证明当N足够大时,平均数据有稳定性,为用样本平 均数估计总体平均数提供了理论依据。 (2)贝努力大数定律:证明当n足够大时,频率具有稳定性,为用频率代替概率 提供了理论依据 2、中心极限定律 (1)独立同分布中心极限定律:设从均值为u、方差为s2(有限)的任意一个总体 中抽取样本量为n的样本,但n充分大时,样本均值X的抽样分布近似服从均值为u, 方差为s2/n的正态分布。 (2)德莫佛-拉普拉斯中心极限定律:证明属性总体的样本数和样本方差,在n足 够大时,同样趋于正态分布。
(central limit theorem)

统计学第六章抽样和抽样分布

统计学第六章抽样和抽样分布

2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布

《抽样与参数估计》PPT课件

《抽样与参数估计》PPT课件
13
系统抽样〔等距抽样〕:先将总体各单位 按某种顺序排列,并按某种规那么确定一 个随机起点,然后每隔一定的间隔抽取一 个单位,直至抽取n个形成一个样本。
······ · · · · · ·
优点:具有简单随机抽样的特征,能比 较均匀地抽到总体中各个局部的单位, 简单易行。
14
非概率抽样
根据研究人员的主观判断来抽取样本, 研究人员有意识地选取样本单位,样本 单位的抽取不是随机的。
样本均值的抽样分布
30

n



xi M 1x i 1 .0 1 .5 1 2 6 4 .0 2 .5

n

(xi x)2
值 和
2 i1 x
M
方 差
(1.02.5)2 (4.02.5)2
0.6
2
25
16
n
式中:M为样本数目,n 为样本容量 比较及结论:1. 样本均值的均值〔数学期望〕等于总体均值
26
【例】设一个总体,含有4个元素〔个体〕,即总体单 位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、 X4=4 。总体的均值、方差?
均值和方差
N
Xi
i1 2.5
N
N
(Xi )2
2 i1
N
1.25
27
现从总体中抽取n=2的简单随机样本,在重复
抽样条件下,所有样本的均值如何分布?
4.1.1 概率抽样方法 4.1.2 抽样分布
20
三种不同性质的分布
总体分布 样本分布
频数分布表、图等
抽样分布:样本统计量的概率分布。结 果来自容量一样的所有可能样本。
21
某生产车间50名工人日加工零件数如下(单位:个)

应用统计学第6章参数估计(置信区间)ppt课件

应用统计学第6章参数估计(置信区间)ppt课件
从中解得
P{(n1)S2 2(n1)S2 }1
22(n1)
(n1) 2
p1 p t精选版2
20
于是 所求置信区间为:
(n1)S2 (n1)S2
[2
, 2(n1)
2 1
] 2(n 的 95% 置
信解区:间由。例1,S2 =196.52,n =10,
(1)实用中应在保证足够可靠的前提 下,尽量使得区间的长度短一些 .
(2)增大样本容量n,可在保证足够可 靠的前提下,提高估计的精度.
n
n
L 2 z /2
n
ppt精选版
31
估计均值μ时的样本容量n确定
1.指定估计的精度:
dX dL2z/2
n
2.指定估计的可靠度1-α;
3.确定σ:
(1)由历史资料确定;
对给定的置信水平1,
查正态分布表得 z 2 ,
使 P{|Xn|z2}1
ppt精选版
6
从中解得:
P{X nz2
Xnz2}
1
于是所求的 置信区间为
[X nz2, X nz2]
也可简记为
X n z 2
ppt精选版
7
求置信区间的一般步骤(1-2):
给定置信水平1:
1. 寻找参数的一个良好的点估计
T (X1,X2,…Xn)
实用中应在保证足够可靠的前提下,尽
量使得区间的长度短一些 .
ppt精选版
28
置信度与置信区间长度的关系
考虑单个正态总体μ的置信区间: 当σ已知时,
Z X n
~N(0, 1)
例如,由 P(-1.96≤U≤1.96)=0.95
我们得到 均值 的置信水平为 1 的

统计学抽样与参数估计

统计学抽样与参数估计

12
12
2

N
n )
1.25
(
4
2)
5
n N -1 2 4 1 12
样本平均数的标准差又称为抽样平均误差(或抽样标 准差)。
第19页/共87页
样本均值的分布与总体分布的比较
总体分布
.3
.2
.1 0
1
234
= 2.5
σ2 =1.25
.3 P ( X ) 抽样分布
.2
.1
0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 X

x
n
N n ,即均值推断的抽样误差 N 1
第25页/共87页
样本均值抽样分布的实际应用

样本统计量的估计值与其所要测度的总体参数值之
间的绝对差距,被称为抽样误差(sampling error)。
• 抽样分布能够用来提供抽样误差大小的可能性(概
率)。
在例1中,如果人事部经理认为
在一次抽样中所得到的中层干部的
第22页/共87页
B、当总体分布未知时,需要用到中心极 限定理(Central limit Theorem)
对容量为n 的简单随机样本,样本均值的分 布随样本容量的增大而趋于正态分布。
经验上验证,当样本容量等于或大于30时,无 论总体的分布如何,样本均值的分布则非常接近正 态分布。
因此统计上常称容量在30(含30)以上的样本 为大样本(large-sample-size)。
n+1)
Nn
32、、不考考虑虑顺顺序序的的重不复重抽复样抽:样:
C
n N
N! n!(N n)!
4、不考虑顺序的重复抽样:

统计学课件第六章抽样调查PPT课件

统计学课件第六章抽样调查PPT课件

特点
每个样本被选中的机会都 相等,样本的代表性相对 较好。
分层抽样
定义
先将总体按一定标准分成 若干层次或群,然后从各 层或群中按随机原则抽取 样本。
方法
分类抽样、比例抽样、类 型抽样。
特点
能够提高样本的代表性, 降低误差,减少资源浪费。
系统抽样
定义
先将总体中的所有个体按某种顺序排列,然后按 照固定的间隔或系统选取样本。
改进抽样方法
采用更科学的抽样方法和技术,如分层抽样、系统抽样等,以提 高样本的代表性。
提高样本代表性
在抽样过程中尽量减少非随机误差,如无回答、不完整数据等, 以提高样本对总体的代表性。
05 抽样调查的组织与实施
抽样调查的设计
确定调查目的
明确调查的目标和意图,为后 续的抽样设计提供指导。
确定调查对象
合理安排问题的顺序、布局和格式,以提高 问卷的易用性和回答率。
确定调查方式
选择合适的调查方式,如自填式、面访式等, 并确定数据收集的途径。
测试与修正
对问卷进行测试和修正,确保问卷的准确性 和可靠性。
调查的实施与质量控制
培训调查员
对调查员进行培训,确保他们了解调 查目的、问卷内容、调查方法等。
现场实施
将总体分成若干个群集或组,然后从每个 群集或组中抽取一定数量的样本,也称为 簇抽样或组抽样。
抽样调查的应用场景
01
02
03
04
市场调查
通过对目标市场的部分消费者 进行调查,了解市场需求、消 费者行为和产品反馈等信息。
社会调查
通过对一定范围内的社会成员 进行调查,了解社会现象、人 口状况和社会问题等信息。
统计学课件第六章抽样调查ppt课 件

统计学,刘照德06-1第六章 参数估计

统计学,刘照德06-1第六章  参数估计

第一节 点估计
点估计的求解方法主要有 : • 矩估计法 • 最大似然估计法
第一节 点估计
一 、矩估计法
• 矩估计法是一种常用的估计方法,其基本 思想是,用样本原点矩作为总体原点矩的 估计。
第一节 点估计
• 设k个参数 ( , , ),求 k个参数 ˆ (ˆ ,ˆ ,ˆ ) 矩估计 需要建立k个方程,方法是:设总体 的一个样本观测值是 (x , x ,, x ) ,其l阶原点 1 A x 矩 ,总体观测量X的l阶原点矩 n ml E( X l ) ml ( ) ,用样本原点矩Al作为总体 原点矩ml的估计,得出k个方程Al =ml(θ )(l =1,…,k),解此方程组得出的 即为参数 的矩 估计。
对于给定的抽样方法 ,不同的抽样,就有不同的 ˆ , ˆ) 估计区间 ( 1 2
在用同样方法构造的总体参数的多个估计区间 中,包含总体参数真值的区间所占的比例称为 置信水平,表示为 (1 - 。 2.为是未包含总体参数的区间所占的比例。 •
3. 常用的置信水平值有 99%, 95%, 90%
第一节点估计??????????222221???xexdxemxem??????2221??????aa??????21221??aaa????????????????niiniixxnxxnx12122211?????二最大似然估计法?最大似然方法的基本思想是固定样本观测值在可能的取值中挑选使似然函数达到最大从而概率p达到最大的作为参数的估计
1 2
ˆ) P(
ˆ 的抽样分布 1
B A
ˆ2 的抽样分布
ˆ

第一节 点估计
• 3.一致性 依 设 为 的一个估计量,若当 n 时, ,则称 为 的一致估计量。此即 概率收敛于 随着样本容量n的增大,点估计量 越来越接近 被估总体参数 。

第六章 抽样分布及总体平均数的估计

第六章 抽样分布及总体平均数的估计
假设与假设检验 1、什么是假设?
• 对总体参数的一种看法 总体参数包括总体均值、比例、方差等 分析之前必需陈述
三 假设检验的基本原理
2、什么是假设检验?
1)概念 事先对总体参数或分布形式作出某种假设, 然后利用样本 信息来判断原假设是否成立。 2) 类型 参数假设检验 非参数假设检验 3)特点 采用逻辑上的反证法 依据统计上的小概率原理
二 总体平均数的估计
(3)区间估计(interval estimation)
根据估计量以一定可靠程度推断总体参数所在的区间 范围,用数轴上一段距离表示未知参数可能落入的范围, 虽不具体指出总体参数等于什么,但能指出未知总体参数 落入某一区间的概率有多大。
(4)置信区间(confidence interval)
一 抽样分布与平均数抽样分布
3、样本平均数与总体平均数离差的形态
(2)总体方差未知 总体正态,样本平均数与总体平均数的离差统 计量呈 t 分布; 总体非正态,但满足n>30这一条件,样本平均 数与总体平均数的离差统计量 近似t 分布。
t分布
t 分布(t-distribution)是统计分析中应用较多 的一种随机变量函数的分布,是统计学者高赛特 1908年以笔名“Student”发表的论文中推导出来 的一种分布,又叫学生氏分布。这种分布是一种 左右对称,峰态比较高狭,分布形状随样本容量 n-1的变化而变化的一组分布。
二 总体平均数的估计
4 总体方差σ2未知时,总体平均数μ的估计 用样本的无偏方差作为总体方差的估计值,样本 平均数的分布为t分布,应查t值表,包括以下两 种情况:
(1)总体的分布为正态时,可不管n值大小。 (2)总体分布为非正态,只有n>30,才能用概率对其样本 分布进行解释。

统计学第六章抽样调查

统计学第六章抽样调查
2 2
标 差 总 标 差 、 本 准 s 准 : 体 准 σ 样 标 差
总体参数和样本统计量符号
总体指标符号 总体容量: N 总体平均数: µ 总体成数: P 总体方差: σ2 总体标准差: σ 样本指标符号 样本容量: n 样本平均数: x 样本成数: p 样本方差: S2 样本标准差: S
抽样组织形式
抽样估计效果好坏,关键是抽样平均误差的 抽样估计效果好坏,关键是抽样平均误差的 抽样平均误差 控制。抽样平均误差小, 控制。抽样平均误差小,抽样效果从整体上 看就是好的;否则,抽样效果就不理想。 看就是好的;否则,抽样效果就不理想。 抽样平均误差受以下几方面的因素影响: 抽样平均误差受以下几方面的因素影响:
抽样调查的基本概念 抽样调查的基本概念 重复抽样和不重复抽样
重复抽样:又称有放回的抽样 有放回的抽样,从总体中 重复抽样 有放回的抽样 抽取样本时,每次被抽中的单位都再被 放回总体中参与下一次抽样。 不重复抽样:又称无放回的抽样 无放回的抽样,总体中 不重复抽样 无放回的抽样 随机抽选的单位经观察后不放回到总体 中,即不再参加下次抽样。
µ ( p) =
P (1 − P ) n
不重复抽样条件下: 不重复抽样条件下: 条件下
µ ( p) =
P (1 − P ) n (1 − ) n N
抽样极限误差
样本平均数的抽样极限误差: 样本平均数的抽样极限误差:以绝对值形式 表示的样本平均数的抽样误差的可能范围, 表示的样本平均数的抽样误差的可能范围, 用符号表示为: 用符号表示为:
样本成数
从成数总体中抽取样本容量为n的样本 从成数总体中抽取样本容量为 的样本 样本中具有此种特征的单位占全部样本单位 数的比例称为样本成数,记作p 数的比例称为样本成数,记作p p=n1/n

统计学之抽样与总体参数的估计(ppt 67页)

统计学之抽样与总体参数的估计(ppt 67页)

6.1.3 样本均值的分布与中心极限定理
1、样本均值X分布的含义
采用随机抽样的方法,从总体中抽取大小为n的一个样本,计 算出它的平均值X1,然后将这些个体放回总体去,再抽取n个个 体,又可以计算出平均值X2,… 再将n个个体放回去,再抽取n个 个体,如此可以计算出无限个X,这些样本均值X所有可能值的 概率分布叫均值X的抽样分布.
第六章 抽样与总体参数的估计
统计推断是统计学研究的重要内容。抽样是进行统计 统计推断的基础工作。参数估计是统计推断的重要内 容之一。 6.1 抽样与抽样分布 6.2 参数的估计方法 6.3 总体均值和总体比例的区间估计 6.4 两个总体均值及两个总体比例之差的估计 6.5 正态总体方差及两个正态总体方差比的区间估计 6.6 相关系数的区间估计
2 2
2 2
S
2 X
1 n1 1
n1 i 1
(Xi
X )2,
X
1 n1
n1 i 1
Xi
SY2
1 n2 1
n2
(Yi
i 1
Y )2,Y
1 n2
n2
Yi
i 1
F(n1-1,n2-1)为第一自由度(分子自由度)为n1-1,为第二自由度 (分母自由度)为n2-1的F分布。
F分布的定义
设有两个总体X, Y,已知X ~ 2 (n1), Y ~ 2 (n2 ),并且X与Y相互独立,则称随机变量
具有可加性。
4) E( 2 (n)) n,
D( 2 (n)) 2n
卡方分布表给出了卡方变
量在不同自由度下的临界
值. P( 2 2 (n)) 0
2 (n)
当n很大时, 2 2(n) 近似服从 N ( 2n 1,1)

应用统计学第6章 抽样分布与参数估计

应用统计学第6章 抽样分布与参数估计

μx
6. 3抽样分布
多大是足够的大?
6. 3抽样分布
例子
假设总体的平均数μ = 8 且标准差σ = 3. 假 设选中容量n = 36随机样本。
样本平均数介于7.8和8.2之间的概率是多少?
第6章 6. 3抽样分布
例子
(续)
结论:
即使总体非正态分布, 中心极限定理可以应用 (n > 30)
6.2 抽样误差
样本统计量和对应的总体参数之间的差异,称之为抽 样误差。
抽样误差的产生是由于抽样的非全面性和随机性所引 起的,是偶然性误差。
非抽样误差
抽样框误差 系统性误差 测量误差 登记误差
6. 3抽样分布
6. 3抽样分布
6.3.1 样本均值的抽样分布
6. 3抽样分布
1.样本均值的均值
样)
6. 3抽样分布
p的抽样分布
近乎正态分布分布,如果:
n 5
P( ps)
抽样分布
.3

.2
.1
n(1 ) 5
0 0 . 2 .4 .6
p
81
μ 其中 p
π

π(1 π)
σp
n
(其中 π = 总体比例)
6. 3抽样分布
比例的Z值
使用公式将p标准化为Z值:
p
Z
σp
p (1 )
n
在判断样本中,我们得到预先选好的专家就主题 发表的意见。
6.1 抽样理由和抽样方法
样本类型:概率样本
在概率样本中, 样本中条目的选择基于已知的概率。
概率样本
简单 随机样本
系统样本
分层样本 群样本
6.1 抽样理由和抽样方法
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 -6
经济类管理类
基础课程
需要知道Mean 的抽样分布!
x_
- 2.58x
-1.65 x
+1.65x
+ 2.58x
X
-1.96 x
+1.96x
90%的样本 95% 的样本
何为? 为何?
99% 的样本
z z P 1 - 7
2
x
x
2
1
x
经济类管理类
基础课程
统计推断的过程
总体
基础课程
2004年,珠海地区的移动通信市场已近饱和,移动电话 普及率已经超过100%。为保有存量市场的占有率, 要求运营商通过提供新的服务产品捆绑客户,提高客 户忠诚度。
珠海地区的通信市场除了存量市场激烈竞争外,也依然存 在广阔的增量市场前景。珠海市毗邻港澳,地理位置 优越;通过工业西进、大学园区、科技创新、旅游文 化的城市发展定位,造就了珠海通信市场高、新、快 的发展新特点。目前6000多家大型企业融入了珠海工 业园区的建设大潮、17所知名学府在珠海办学,被评 为全国旅游40佳之一。这些属性都是珠海公司推出创 新服务手段的依据所在,也是珠海移动在本地信息化 建设扮演重要角色的关键所在。
间估计 5. 掌握运用总体均值、总体比例和总体方差
的区间估计方法解决实际问题
1 - 10
经济类管理类
基础课程
第一节 参数估计基本方法
一. 点估计 二. 点估计的优良性准则 ‫ג‬- 区间估计
1 - 11
经济类管理类
基础课程
估计方法
点估计
区间估计
1 - 12
经济类管理类
基础课程
1 - 13
P
2
1 2
1 -5
经济类管理类
基础课程
对珠海地区的移动通信市场开展调查,内容包括 消费者的个人信息、移动业务消费状况、移 动数据业务的消费意愿等。
对个人客户运用标准问卷电话调查了500位固定 电话用户,共获取有效问卷330份。其中获 得用户月移动话费支出数据如下。
根据调查数据,珠海的手机用户ARPU值为多少 ?
1 - 15
经济类管理类
基础课程
1. 用于估计总体某一参数的随机变量
如样本均值,样本比例、样本中位数等
例如: 样本均值就是总体均值的一个估计量
如果样本均值 x = 3 ,则 3 就是 的估计值
2. 理论基础是抽样分布
1 - 16
经济类管理类
基础课程
无偏性:估计量的数学期望等于被估计的总体 参数
P( X )
无偏
有偏
A
C
X
1 - 17
经济类管理类
基础课程
有效性:一个方差较小的无偏估计量称为一个更
有效的估计量。如,与其他估计量相比
,样本均值是一个更有效的估计量
P(X )
均值的抽样分布
B
A
中位数的抽样分布
1 - 18
X
经济类管理类
基础课程
一致性:随着样本容量的增大,估计量越来越接 近被估计的总体参数
1 -3
经济类管理类
基础课程
N的另一个点估计公式是:用观测到的最大编号乘以因子1+1/n ,其中 n 是被俘虏坦克个数。假如你俘虏了10 辆坦克,其 中最大编号是50,那么坦克总数的一个估计是( 1+1/10)50=55。此处我们认为坦克的实际数略大于最大编 号。
从战后发现的德军记录来看,盟军的估计值非常接近所生产的坦
1 - 21
置信上限
经济类管理类
基础课程
在区间估计中,寻找两个统计量 1 和 2
分别估计总体参数 的下限和上限,使总
体参数
包括在区间 内的 ,
1
2
概率 P 1
1
2
即有100(1- )%的把握断定的真值在区
间 内 ,
1
2
1 - 22
克的真实值。记录仍然表明统计估计比通常通过其他情报方
式作出估计要大大接近于真实数目。统计学家们做得比间谍
们更漂亮!
资 料 来 源 : GUDMUND R.IVERSEN 和 MARY GERGRN著,吴喜之等译:《统计学—基本概念和 方法》,高等教育出版社,施普林格出版社,2000。
1 -4
经济类管理类
P1 P2
2 1
2 2
x pˆ
s2 x1 x2 pˆ1 pˆ2 s12 s22
经济类管理类
基础课程
点估计
1 - 14
经济类管理类
基础课程
1. 从总体中抽取一个样本,根据该样本 的统计量对总体的未知参数作出一个 数值点的估计
▪ 例如: 用样本均值作为总体未知均值的 估计值就是一个点估计
2. 点估计没有给出估计值接近总体未知 参数程度的信息

样本统计量

例如:样本均
值、比例、方

1 -8
经济类管理类
基础课程
第六章
抽样与参数估计
第一节 参数估计基本方法 第二节 总体均值和总体比例的区间估计 第三节 两个总体均值及两个总体比例之差的估计 第四节 正态总体方差及两正态总体方差比的区间估计
1 -9
经济类管理类
基础课程
1. 了解抽样和抽样分布的基本概念 2. 理解抽样分布与总体分布的关系 3. 了解点估计的概念和估计量的优良标准 4. 掌握总体均值、总体比例和总体方差的区
较大的样本容量
P(X )
B
较小的样本容量
A
1 - 19
X
经济类管理类
基础课程
区间估计
1 - 20
经济类管理类
基础课程
1. 根据一个样本的观察值给出总体参数的估计范围
2. 给出总体参数落在这一区间的概率
3. 例如: 总体均值落在50~70之间,置信度为 95%
置信区间
样本统计量 (点估计)
置信下限
经济类管理类
基础课程
第六章 抽样与参数估计
1 -1
经济类管理类 参数估计在统计方法统计
推断统计
参数估计
假设检验
1 -2
经济类管理类
基础课程
开篇案例:二战中的点估计 ——德军有多少辆坦克?
二战期间,盟军非常想知道德军总共制造了多少辆坦克。德国 人在制造坦克时是墨守成规的,他们把坦克从1开始进行 了连续编号。在战争过程中,盟军缴获了一些敌军坦克, 并记录了它们的生产编号。那么怎样利用这些号码来估计 坦克总数呢?在这个问题中,总体参数是未知的坦克总数 N,而缴获坦克的编号则是样本。
假设我们是盟军手下负责解决这个问题的统计人员。制造出来 的坦克总数肯定大于等于记录的最大编号。为了找到它比 最大编号大多少,我们先找到被缴获坦克编号的平均值, 并认为这个值是全部编号的中点。因此样本均值乘以2就 是总数的一个估计;当然要特别假设缴获的坦克代表了所 有坦克的一个随机样本。这种估计N的公式的缺点是:不 能保证均值的2倍一定大于记录中的最大编号。
相关文档
最新文档