统计学第六章 抽样估计
统计学第6章统计量及其抽样分布
整理ppt
16
2. T统计量
设X1,X2,…,Xn是来自正态总体N~ (μ,σ2 )
n
的一个样本,
X
1 n
n i 1
Xi
(Xi X )2 s 2 i1
n 1
则 T(X) ~t(n1)
S/ n
称为T统计量,它服从自由度为(n-1)的t分布。
整理ppt
17
F分布
定义:设随机变量Y与Z相互独立,且Y和Z分别服 从自由度为m和n的c2分布,随机变量X有如下表达式:
整理ppt
8
中心极限定理
设从均值为,方差为2的一个任意总 体中抽取容量为n的样本,当n充分大时, 样本均值的抽样分布近似服从均值为μ、 方差为σ2/n的正态分布。
当样本容量足够大时
(n≥30),样本均值的抽样
分布逐渐趋于正态分布
整理ppt
9
标准误差
标准误差:样本统计量与总体参数之间的平均差异
1. 所有可能的样本均值的标准差,测度所有样本 均值的离散程度
因此,估计这100名患者治愈成功的比 例在85%至95%的概率为90.5%
整理ppt
22
6.5 两个样本平均值之差的分布
设
X
1
是独立地抽自总体
X1 ~N(1,12)
的一个容量
为n1的样本的均值。 X 2 是独立地抽自总体
X2 ~N(2,22)的一个容量为n2的样本的均值,则有
E (X 1X 2)E (X 1) E (X 2)12
2. 样本均值的标准误差小于总体标准差
3. 计算公式为
x
n
整理ppt
10
【例】设从一个均值μ=8、标准差σ=0.7的总 体中随机抽取容量为n=49的样本。要求:
统计学第六章抽样推断
尖山一委…
尖山二委
居民一组
居民二
组
…
第六章 抽样推断
某外国公司在##进行 微波炉市场调查:
STAT
在商场的大门口
在微波炉柜台前
在市区街道旁边
在某个住宅小区
时间表抽样框
第六章 抽样推断
连续出产的产品总体 可以编制抽样框:均STAT 匀的出产时间、可以 预见到的产品总量.
连续到加油站加油的 汽车总体无法编制抽 样框:时间不定、总 量也无法确定.
抽样估计的特点
第六章 抽样推断
按随机原则抽取样本单位
目的是推断总体的数量特征
抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
抽样估计的应用
第六章 抽样推断
不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时
抽样调查研究
Sampling Study
P N nN N NN n
共n个
⒉ 不重复抽样的可能样本数目:
C N n N N 1 N n 1
第六章 抽样推断
第六章 抽样推断
STAT
★§1.1 抽样方案的设计 ★§1.2 简单随机抽样的抽样误差的测定
§1.3 简单随机抽样的抽样估计
第六章 抽样推断
§1.2 简单随机抽样的抽样误差的测定 STAT
n1 1{i n1E(xiX)2nn(E xX)2} 由E(于 xX)2D (x)D (i1 nxi)n 1 2i n1D (xi)n2
E(sn21)n11{n2nn2}
2
⒋ 样本成数:
pn1,qn0 1p nn
⒌ 样本单位是非标志的标准差:
第六章 抽样推断
统计学原理-第六章 抽样调查(复旦大学第六版)
2.样本总体:简称样本,是从全及总体中随机
抽取出来,代表全及总体部分单 位的集合体。单位数用n表示。
5
二.全及指标和抽样指标
(一)全及指标
X 总体平均数: X N 总体成数:P
2
XF 或X F Q=
2 2
N1 N N
(X-X) 总体方差: = 总体标准差:= (X-X)
(一)考虑顺序的不重复抽样数目
N! A N ( N 1)(N 2) ( N n 1) ( N n)! 4 3 2 1 2 例如A4 12 2 1
n N
(二)考虑顺序的重复抽样数目
B N
n N 2 4
n 2
例如 B 4 16
10
(三)不考虑顺序的不重复抽样数目
Ex X
28
2、一致性 当抽样单位数充分大时,抽样指标和未知 的总体指标之间的绝对离差为任意小的可能性 也趋于必然性。
x X 任意小
3、有效性
即用抽样指标估计总体指标,要求作为优良估 计量方差应该比其他估计量的方差小。
2
x X f
2
f
2
x X f
x
x E ( x)
2
18
说明:根据数理统计理论,在重复抽样条件下, 抽样平均误差与全及总体的标准差成正比例关系。 与抽样总体单位平方根成反比关系。
19
在不重复抽样情况下,抽样平均误差计算公式如下:
x x
N n 250 4-2 ( )= ( ) =9.13(件) n N 1 2 4-1
2
N
X X F 或 F X X F 或 F
统计学第六章 抽样法
第六章 抽样法
序号
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15 16 合计
样本变量x
40、40 40、50 40、70 40、80
50、40 50、50 50、70 50、80
70、40 70、50 70、70 70、80
80、40 80、50 80、70 80、80
-
x
x E(x)
总体
研究如何利用 样本数据来 推断总体特 征。
内容包括:参 数估计和假 设检验。
目的:对总体
特征作出推
样 本
断。
这是推断统计学研 究的问题
5
第六章 抽样法
描述统计与推断统计的关系
反映客观 现象的数
据
概率论
(包括分布理论、大 数定律和中心极限定
理等)
样本数
描述统计
推断统计
据
总体数 据
(统计数据的搜集 、整理、显示和分
13
第六章 抽样法
第二节 有关抽样的基本概念(2)
(二)抽样总体
也称子样,样本或样本总体,它是从全 及总体中随机抽取出来的,代表全及总体的 那部分单位的集合体。抽样总体的单位数称 为样本容量,用n表示,对于N来说,n是很 小的。
总体
样 本
14
第六章 抽样法
第二节 有关抽样的基本概念(3)
• 二 全及指标和抽样指标p.249 (一) 全及指标
研究总体中 的品质标志
总体成数 P N1
N
总体成数标准差 P
P1 P
17
第六章 抽样法
第二节 有关抽样的基本概念(5)
(二)抽样指标
抽样指标是由样本总体各单位标志值 或标志特征计算的综合指标,也称统计量。 与全及指标相对应有:样本平均数,样本 标准差;样本成数,样本成数的标准差。
第六章 统计量及其抽样分布
样本均值的抽样分布
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概率分 布
2. 一种理论概率分布 3. 进行推断总体总体均值的理论基础
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。 总体的均值、方差及分布如下
第 一
16个样本的均值(x)
个
第二个观察值
观 察值1 2
3
4
11
1.
20.
52. 0.
5
21
2.
25.
03. 5.
0
23
2.
30.
53. 0.
5
24
3.
35.
04. 5.
0
.3 P (X ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
第六章 统计量及其抽样分布
抽样理论依据: 1、大数定律 (1)独立同分布大数定律:证明当N足够大时,平均数据有稳定性,为用样本平 均数估计总体平均数提供了理论依据。 (2)贝努力大数定律:证明当n足够大时,频率具有稳定性,为用频率代替概率 提供了理论依据 2、中心极限定律 (1)独立同分布中心极限定律:设从均值为u、方差为s2(有限)的任意一个总体 中抽取样本量为n的样本,但n充分大时,样本均值X的抽样分布近似服从均值为u, 方差为s2/n的正态分布。 (2)德莫佛-拉普拉斯中心极限定律:证明属性总体的样本数和样本方差,在n足 够大时,同样趋于正态分布。
(central limit theorem)
统计学第六章抽样和抽样分布
2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布
统计学第六章抽样调查
n
N
例题2
xf
x
f
8400 200
42
s (x x)2 f 12200 7.81
f
200
2 (1 n ) 7.812 (1 200 ) 0.55
x
n
N
200
2000
例题3
❖某冷库的10万只冻鸡合格率为97%, 如果按重复抽样与不重复抽样各抽 取1000只和2000只,分别计算抽样 平均误差。
A
B
较小的样本容量
X
成数
❖ 总体成数
每个总体单位标志值设为0或1 1:具有某种属性的总体单位标志值 0:不具有某种属性的总体单位标志值 总体中具有某种特征的单位占全部总体单位
数的比例称为总体成数,记作P 成数总体方差:P(1-P)
总体成数和样本成数
❖ 样本成数
从成数总体中抽取样本容量为n的样本 样本中具有此种特征的单位占全部样本单位
从1、2 、3、4中随机抽取2个的样本数
重复抽样考虑顺序
16
1、1 2、1 3、1 4、1
1、2 2、2 3、2 4、2
1、3 2、3 3、3 4、3
1、4 2、4 3、4 4、4
从1、2 、3、4中随机抽取2个的样本数
不重复抽样考虑顺序 12
2、1 3、1 4、1
1、2
3、2 4、2
1、3 2、3
- 2.58x
-1.65 x
+1.65x + 2.58x
x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
区间估计
❖ 根据一个样本的观察值给出总体参数的估计范围 ❖ 给出总体参数落在这一区间的概率 ❖ 例如: 总体均值落在50~70之间,置信度为 95%
经济应用统计学-第六章抽样推断
非参数检验优缺点总结
• 易于理解和实现:非参数检验方法通常基于直观和易于理解的思想,计算和实现相对简单。
非参数检验优缺点总结
检验效能较低
与参数检验方法相比,非参数检 验方法的检验效能通常较低,即 当原假设为真时,非参数检验方 法更容易犯第二类错误(接受原 假设)。
对数据信息的利用不 充分
非参数检验方法通常只利用数据 的部分信息(如排序信息),而 忽略了数据的其他有用信息(如 数值大小),因此可能无法充分 利用数据信息。
两配对样本非参数检验
包括Wilcoxon 符号秩次检验、McNemar 检验 等方法,用于比较同一总体内两个配对样本的差 异是否显著。
两独立样本非参数检验
包括Mann-Whitney U 检验、Kruskal-Wallis H 检验等方法,用于比较两个独立样本所来自的 总体的分布位置或分布形状是否存在差异。
考虑样本量大小
在选择置信水平时,应充分考虑样本量的大小。当样本量较小时,应选择较低的置信水平以避免过大的估计误差;当 样本量较大时,可以选择较高的置信水平以获得更精确的估计结果。
参考相关文献或行业标准
在选择置信水平时,可以参考相关领域的文献或行业标准,了解通常采用的置信水平及其依据。这有助 于确保研究结果的可比性和可靠性。
04
假设检验原理与步骤
假设检验基本概念阐述
原假设与备择假设
原假设通常是研究者想要推翻的 假设,而备择假设则是研究者希 望证实的假设。
检验统计量与拒绝域
检验统计量是根据样本数据计算出 的用于检验原假设的统计量,而拒 绝域则是根据显著性水平和检验统 计量的分布确定的,当检验统计量 落入拒绝域时,我们拒绝原假设。
单侧检验
当研究者对备择假设的方向有明确预期时,即备择假设只可能大于或小于原假设时,应选择单侧检验 。例如,在比较两种药物疗效的研究中,如果研究者预期新药疗效优于旧药,则应选择单侧检验。
统计学课件第六章抽样调查PPT课件
特点
每个样本被选中的机会都 相等,样本的代表性相对 较好。
分层抽样
定义
先将总体按一定标准分成 若干层次或群,然后从各 层或群中按随机原则抽取 样本。
方法
分类抽样、比例抽样、类 型抽样。
特点
能够提高样本的代表性, 降低误差,减少资源浪费。
系统抽样
定义
先将总体中的所有个体按某种顺序排列,然后按 照固定的间隔或系统选取样本。
改进抽样方法
采用更科学的抽样方法和技术,如分层抽样、系统抽样等,以提 高样本的代表性。
提高样本代表性
在抽样过程中尽量减少非随机误差,如无回答、不完整数据等, 以提高样本对总体的代表性。
05 抽样调查的组织与实施
抽样调查的设计
确定调查目的
明确调查的目标和意图,为后 续的抽样设计提供指导。
确定调查对象
合理安排问题的顺序、布局和格式,以提高 问卷的易用性和回答率。
确定调查方式
选择合适的调查方式,如自填式、面访式等, 并确定数据收集的途径。
测试与修正
对问卷进行测试和修正,确保问卷的准确性 和可靠性。
调查的实施与质量控制
培训调查员
对调查员进行培训,确保他们了解调 查目的、问卷内容、调查方法等。
现场实施
将总体分成若干个群集或组,然后从每个 群集或组中抽取一定数量的样本,也称为 簇抽样或组抽样。
抽样调查的应用场景
01
02
03
04
市场调查
通过对目标市场的部分消费者 进行调查,了解市场需求、消 费者行为和产品反馈等信息。
社会调查
通过对一定范围内的社会成员 进行调查,了解社会现象、人 口状况和社会问题等信息。
统计学课件第六章抽样调查ppt课 件
统计学第六章公式及例题
P(277)
总体平均数的估计区间计算公式小结
1.重复抽样平均数估计 2 步骤1: 抽样平均误差 x
步骤2:抽样极限误差 步骤3:总体估计范围
x t x
n
n
x x X x x
2.重复抽样成数估计
步骤1:抽样平均误差 步骤2:抽样极限误差 步骤3:总体估计范围
例
x
900以下 900~950 950~1000 1000~1050 1050~1100 1100~1150 1150~1200 1200以上 合计
灯泡使用寿命资料
xf 875 925 975 1025 1075 1125 1175 1225 1750 3700 10725 72775 90300 20250 8225 3675 211400
x x
2
n
53.63
71 84 18 7 3 183 p 91.5% 200 200
211400 x 1057 200 f
xf
x x
2
p
71 84 18 7 3 183 91.5% 200 200
p
p(1 p) n
p t p
p p P p p
总体平均数的估计区间计算公式小结
3.不重复抽样平均数估计
步骤1:抽样平均误差 步骤2:抽样极限误差 步骤3:总体估计范围
x
x t x
n 1 n N
2
x x X x x
P278
已知:N 10000 ,n 100 ,x 400 , 12(不重复随机抽样 )
(1) x
统计学 第6章 练习题
一、 填空题 1. 抽样调查可以是 抽样,也可以是 抽样,但作为抽样推断 抽样。 基础的必须是 2. 抽样推断运用 的方法对总体的数量特征进行估计。 3. 在 组 织 抽 样 时 , 以 清 单 、 名 册 、 图 表 等 形 式 来 界 定 总 体 的 范 围 , 称 为 。 。 4. 样本成数的方差是 5. 重复抽样有 个可能的样本,而不重复抽样则有 个可能 的样本。 6. 抽样误差是由于抽样的 而产生的误差,这种误差不可避免,但可 以 。 。 7. 样本平均数的平均数等于 8. 抽样误差与抽样平均误差之比称为 。 9 优良估计的三个标准是 、 和 。 10. 在 实 际 的 抽 样 推 断 中 , 常 用 的 抽 样 组 织 形 式 有 、 、 、 和 等。 二、 单项选择题 1. 抽样推断的目的是( ) A、以样本指标推断总体指标 B、取得样本指标 C、以总体指标估计样本指标 D、以样本的某一指标推断另一指标 2. 在抽样推断中,可以计算和控制的误差是( ) A、抽样实际误差 B、抽样标准误差 C、非随机误差 D、系统性误差 3. 总体参数是( ) A、唯一且已知 B、唯一但已知 C、非唯一但可知 D、非唯一且不可知 4. 样本容量也称( ) A、样本个数 B、样本单位数 C、样本可能数目 D、样本指标数 5. 从总体的 N 个单位中随机抽取 n 个单位, 用不重复抽样方法一共可抽取 ( ) 个样本。 A、 PN B、 p C、 N D、 C N n 1
n
n
ቤተ መጻሕፍቲ ባይዱ
n
n
6. 在重复抽样条件下,平均数的抽样平均误差计算公式是(
)
2
n
)
A、 n B、 n C、 n D、
7. 不重复抽样的抽样标准误公式比重复抽样多了一个系数(
统计学计算公式抽样估计
统计学计算公式抽样估计在统计学中,抽样估计是一种用样本数据来估计总体参数的方法。
通过对样本数据进行分析和计算,可以得到对总体参数的估计值。
抽样估计是统计学中非常重要的一个概念,它可以帮助我们更好地了解总体特征,并且可以用来进行决策和预测。
在本文中,我们将介绍一些常见的统计学计算公式,以及如何利用这些公式进行抽样估计。
一、样本均值的抽样估计。
在统计学中,样本均值是对总体均值的估计。
样本均值的计算公式为:\[\bar{x} = \frac{\sum_{i=1}^{n}x_i}{n}\]其中,\(\bar{x}\)表示样本均值,\(x_i\)表示第i个样本数据,n表示样本容量。
通过计算样本均值,我们可以得到对总体均值的估计值。
通常情况下,样本容量越大,样本均值对总体均值的估计越准确。
二、样本方差的抽样估计。
样本方差是对总体方差的估计。
样本方差的计算公式为:\[s^2 = \frac{\sum_{i=1}^{n}(x_i \bar{x})^2}{n-1}\]其中,\(s^2\)表示样本方差,\(x_i\)表示第i个样本数据,\(\bar{x}\)表示样本均值,n表示样本容量。
样本方差可以帮助我们了解样本数据的离散程度,通过样本方差的计算,我们可以得到对总体方差的估计值。
三、总体比例的抽样估计。
在一些情况下,我们需要对总体比例进行估计。
总体比例的计算公式为:\[p = \frac{x}{n}\]其中,p表示总体比例,x表示总体中满足某一条件的个体数,n表示总体容量。
通过对总体中的个体进行抽样,我们可以得到对总体比例的估计值。
四、抽样误差的计算。
在进行抽样估计时,我们需要考虑抽样误差。
抽样误差是指样本估计值与总体参数之间的差异。
抽样误差的计算公式为:\[E = \frac{Z \times \sigma}{\sqrt{n}}\]其中,E表示抽样误差,Z表示置信水平对应的Z值,\(\sigma\)表示总体标准差,n表示样本容量。
统计学课件之抽样估计
抽样的程序--系统随机抽样
特点:总体中的每一个单位均有同等的被抽中的概率 样本单位在总体中分布均匀
优缺点:在有可供利用图表的条件下,易于操作;由于样本单 位分布均匀,可提高推断精度 当总体单位按有关标志排序并有线性趋势时,会影响 推断精度导致系统性误差 ?
抽样的程序--分层随机抽样
程序:将总体的N个单位按其某一标志划分为互不重叠的 若干个层,再分别从各层中独立地随机地抽取一定 数量的单位构成样本,用以推断总体参数。
D
i
2
,
=
n i 1
i
E() n
D()=n
2
则当n 时,有:
P(z1 <
E( ) D()
<z2 )=
1
2
Z2
e
z2 2
dz
Z1
(z E( ) ) D()
n
i n
即:lim n
P(z1
<
i
n
<z2 )=
1
Z2
e
z2 2
dz
2 Z1
两大核心理论
中心极限定理说明:假如被研究的随机变量可表示为大量
全体;容量为n。
总体是确定的、未知的;样本是随机的、可观测的; 从总体(N)中抽取样本(n),可能的样本个数为:
重置抽样: k = N n 不重置抽样: k = CNn
四组基本概念
推断的相关概念(2):参数、估计量
参数:反映总体某一水平的指标;未知的、需要估计的 估计量:描述样本某一水平的指标;已知的,随机变量,
--结论:该咨询项目对预防青少年再次犯罪是有益的
抽样估计
推断:
调查了A市全部1000个新雇员中的100名发现,拥有 MPA文凭、无工作经验的新雇用的女性管理人员的平均月薪 为3000元,而那些拥有同样文化程度也无工作经验的新雇用 的男性管理人员的平均工资是3200元。
统计学 抽样估计习题
第六章抽样估计题一、单项选择题1、抽样推断的基本内容是:A.参数估计B.假设检验C.参数估计和假设检验两方面D.数据的收集2、抽样平均误差的实质是A. 总体标准差B. 抽样总体的标准差C. 抽样总体方差D. 样本平均数(成数〉的标准差3、不重复抽样平均误差:A. 总是大于重复抽样平均误差B. 总是小于重复抽样平均误差C. 总是等于重复抽样平均误差D. 上情况都可能发生4、在其它条件不变的情况下,抽样单位数增加一半,抽样平差A. 缩小为原来的81.6%B. 缩小为原来的50%C. 缩小为原来的25%D.扩大为原来的四倍5、样本的形成是:A.随机的B.随意的C. 非随机的D.确定的6、抽样误差之所以产生是由于:A. 破坏了随机抽样的原则。
B. 抽样总体的结构不足以代表总体的结构。
C. 破坏了抽样的系统。
D.调查人员的素质。
7、抽样误差指的是:A. 代表性随机误差B. 非抽样误差C. 代表性误差D. 随机性误差8、抽样误差大小A. 可以事先计算,但不能控制B. 不可事先计算,但能控制C. 能够控制和消灭D.能够控制,但不能消灭9、随机抽出100个工人,占全体工人1%,工龄不到一年的比重为10%。
在概率为0.9545时,计算工龄不到一年的工人比重的极限抽样误差。
A.0.6%B. 6%C. 0.9%D. 3%10、根据抽样调查25个工厂(抽取2%)资料,采购阶段流动资金平均周转时间为52天,方差100,在概率为0.954时,计算流动资金平均周转时间的极限抽样误差。
A.0.8B.3.96C.4D.22611、根据某城市抽样调查225户,计算出户均储蓄额30000元,抽样平均误差800元,试问概率为90%,户均储蓄余额极限误差是多少?A.53.3B.1.65C.720D.132012、根据某市公共电话网100次通话情形抽样调查,知道每次通话平均持续时间为4分钟,均方差为2分钟。
在概率为0.9545时,计算每次通话平均持续时间的极限抽样误差。
统计学第六章 抽样估计
(2)通过试访问进行估计 通过试访问的方法,先获得少数一部分样 本的误差数据,然后根据这些数据去计算最终 所需要的样本量,然后再将所需要的样本量完 成。
(3)序贯抽样方法 所谓序贯抽样,是指依次抽取样本,每抽 取一次,进行一次误差计算,直至达到所需要 的精度。
一般做序贯抽样时,会有一张图,如黑板 上图所示。
案例:
假定欲估计喜欢某产品的居民比例在95% 置信度水平下,要求绝对误差小于5%,求样 本量。
本题解法:
但是,如果是相对误差,已知P
五、其他抽样组织形式
1、分层抽样(Stratified Sampling) 2、整群抽样(Cluster Sampling) 3、多阶段抽样(Multi-stage Sampling) 4、设计效应(deff)
序贯抽样的方式操作比较简单,但不适用 于经济调查,一般运用于质量检验中。
(4)成数估计时,使用最大值判断 绝对误差与相对误差 有时候绝对误差很小,但相对误差会很大。
对于绝对误差: 当成数是P时,其标准差为 在成数估计的条件下,方差的最大值为 0.25,因此可以使用最大的方差作为推断最大 样本量的基础。
1、样本平均数的分布
从一个总体中抽出一部分单位,构成一个 样本,可计算出一个样本平均数。
无数次抽选的结果,将会产生无数个样本 平均数,这些样本平均数具有自己的分布形式。
根据大数定理,当样本量超过30时,样本 平均数的分布为正态分布。
2、分布特征
在有放回条件下,简单随机抽样的误差计 算公式如下:
3、多阶段抽样(Multi-stage Sampling)
多阶段抽样的误差计算取决于各阶段的 抽样方式,以最简单的二阶段抽样为例,如 果每一阶段的抽选都是简单随机抽样,一阶 单位的规模相同,则有下列公式:
统计学A第6章 抽样推断
2
样本可能数目
3 0.577 9
计算复杂,可对 定义公式变形为 更为简单的形式
3.2 抽样平均误差
(2)抽样平均误差的计算 1)抽样平均数的抽样平均误差 ① 重复抽样
第6章 抽样推断 第3节 抽样平均误差
x
(总体标准差)
n (样本容量)
在总体标准差未知, 且样本单位数较大时, 可用样本标准差代替。
解: 已知: n 100, x 58, x
则:
x
10
10 1(公斤) 100 n
x
即: 当根据样本学生的平均体重估计全部学生 的平均体重时,抽样平均误差为1公斤。
② 不重复抽样
1)抽样平均数的抽样平均误差
例2: 某厂生产一种新型灯泡共2000只,随机抽出400只作 耐用时间试验,测试结果平均使用寿命为4800小时, 样本标准差为300小时,求抽样推断的平均误差?
的数量特征做出具有一定可靠性的估计判断,从而达
到对全部研究对象的认识的一种统计方法。 一、 2.特点 ① 抽样调查建立在随机取样的基础上; ② 抽样推断是由部分推算总体的一种方法; ③ 抽样推断是运用概率估计的方法; ④ 抽样推断的抽样误差可以事先计算并加以控制。
1.2 抽样调查的作用
第6章 抽样推断 第1节 抽样调查的意义和作用
x E x
1 0.25 0 0.25 0 0.25 0 0.25 1
2
合计
—
—
27
3
3.2 抽样平均误差
第6章 抽样推断 第3节 抽样平均误差
例1 样本平均数的平均数(总体平均数)
27 23 4 E x 3(或X 3) 9 3
统计学第六章抽样与抽样估计
2019/9/13
30
三峡大学
经济与管理学院
(四)总体均值的区间估计 (2已知)
1. 假定条件
– 总体服从正态分布,且总体方差(2)已知 – 如果不是正态分布,可以由正态分布来近似 (n 30)
2. 使用正态分布统计量Z
Z x ~N(0,1) n
3. 总体均值 在1-置信水平下的置信区间为
总体分布
N
Xi
.3
i1 2.5
2
N
.1
N
(Xi )2
0 1 234
2 i1
N
1.25
2019/9/13
12
三峡大学
经济与管理学院
现从总体中抽取n=2的简单随机样本,在重复 抽样条件下,共有42=16个样本。所有样本的结果 如下表
所有可能的n = 2 的样本(共16个)
置信区间
样本统计量 (点估计)
置信下限
2019/9/13
置信上限
27
三峡大学
经济与管理学院
(二)区间估计的内容
置信区间
均值
比例
2 已知
2 未知
方差
2019/9/13
28
三峡大学
经济与管理学院
落在总体均值某一区间内的样本
x - 3x
x -1.65 x
x +1.65x
x + 3 x
x -1.96 x
(1)重复抽样
(x) 2
nn
(2)不重复抽样
(x) 2(Nn) 2(1n)
n N1 n N
2019/9/13
16
三峡大学
经济与管理学院
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
运用上表结果可得:
从此例子可以逆推: 某总体标准差为10,其一个36个单位组成 的样本的平均数为39,试在95%的置信度水平 下,估计总体平均数的置信区间。
从上面的例子中可得出如下结论:
在不同的置信度下,其对应的置信区间也 是不同的,置信度与置信区间是一个反比的关 系。
重要的置信度与概率度之间的关系:
案例:
假定欲估计喜欢某产品的居民比例在95% 置信度水平下,要求绝对误差小于5%,求样 本量。
本题解法:
但是,如果是相对误差,已知P
五、其他抽样组织形式
1、分层抽样(Stratified Sampling) 2、整群抽样(Cluster Sampling)
3、多阶段抽样(Multi-stage Sampling) 4、设计效应(deff)
在做总体推断时,可以观察到这样一个现 象:每次抽出来的样本平均数都是不相同的, 但样本平均数呈现出一个钟型分布,样本平均 数在总体平均数的两端分布。
二、有放回条件下的简单随机抽样 (Simple Random Sampling)
1、样本平均数的分布 2、分布特征 3、抽样推断 4、利用样本标准差推断总体标准差 5、无放回条件下的简单随机抽样误差
本题解法:
2、总体标准差的估算方法
(1)根据以往的经验数值 对于一些连续进行的调查来说,使用过去 的经验数据进行估算是有可能的。
(2)通过试访问进行估计 通过试访问的方法,先获得少数一部分样 本的误差数据,然后根据这些数据去计算最终 所需要的样本量,然后再将所需要的样本量完 成。
(3)序贯抽样方法 所谓序贯抽样,是指依次抽取样本,每抽 取一次,进行一次误差计算,直至达到所需要 的精度。
2、样本容量
对于一个确定的总体,减小抽样误差的主 要手段就是增加样本量。从公式中可以知道, 抽样误差与样本量的平方根成正比,欲使抽样 误差缩小一半,必须使样本量增加到原来的四 倍。
三、影响抽样误差的因素
1、目标总体的变异程度 2、样本容量 3、抽样方式 4、抽样的组织形式
这就说明了为什么在大城市进行调查和在 小城市进行调查,要获得同样的精度时,所需 的样本量相差无几。
1、样本平均数的分布
从一个总体中抽出一部分单位,构成一个 样本,可计算出一个样本平均数。
无数次抽选的结果,将会产生无数个样本 平均数,这些样本平均数具有自己的分布形式。
根据大数定理,当样本量超过30时,样本 平均数的分布为正态分布。
2、分布特征
在有放回条件下,简单随机抽样的误差计 算公式如下:
4、抽样的组织形式
抽样的组织形式是纯随机抽样、分层抽样、 整群抽样或者多阶段抽样等方式,各种方式都 有对应的误差计算公式,不同情况下的抽样误 差相差也比较大。
四、样本量的估计
1、简单随机抽样条件下样本量的计算公 式 2、总体标准差的估算方法
案例:
已知某总体的标准差为100,欲在95%的 置信度水平下使抽样估计的误差范围小于5, 试求样本量。
第六章
抽样估计
一、参数与统计量
参数是指描述总体分布状况的数。
统计量是指由样本构造出来的数。 平均年龄为21岁,
平均年龄即为班级总体的一个参数;在班级中 抽出20名学生,了解其年龄,并根据20名学生 的年龄计算平均数为21.5岁,则21.5即为由样 本构造出来的统计量。
二、有放回条件下的简单随机抽样 (Simple Random Sampling)
1、样本平均数的分布 2、分布特征 3、抽样推断 4、利用样本标准差推断总体标准差 5、无放回条件下的简单随机抽样误差
1、样本平均数的分布
从一个总体中抽出一部分单位,构成一个 样本,可计算出一个样本平均数。 以扑克牌的例子进行说明。
一般做序贯抽样时,会有一张图,如黑板 上图所示。 序贯抽样的方式操作比较简单,但不适用 于经济调查,一般运用于质量检验中。
(4)成数估计时,使用最大值判断 绝对误差与相对误差 有时候绝对误差很小,但相对误差会很大。
对于绝对误差: 当成数是P时,其标准差为 在成数估计的条件下,方差的最大值为 0.25,因此可以使用最大的方差作为推断最大 样本量的基础。
3、多阶段抽样(Multi-stage Sampling)
多阶段抽样的误差计算取决于各阶段的 抽样方式,以最简单的二阶段抽样为例,如 果每一阶段的抽选都是简单随机抽样,一阶 单位的规模相同,则有下列公式:
第二个参数:
如果从一副扑克牌中抽出30张牌的平均数, 运用上述公式,可以精确的得出: n=30
案例:
某总体标准差为10,平均值为40,从中抽 出一个n=36的简单随机样本,试在95%的置信 度水平下,估计样本平均数的分布区间。
样本平均数的分布特征:
查标准正态分布表,可以获得下列概率度 与概率值的对应关系:
1-f=0.999,
对于现实的调查活动,万分之五的误差很 难被判断出来,可以忽略不计。 因此,在大规模的抽样调查中,抽样比可 以忽略掉。
三、影响抽样误差的因素
根据抽样误差的计算公式,可以看出,影 响抽样误差的主要因素主要有下列四个方面:
1、目标总体的变异程度
2、样本容量
3、抽样方式
4、抽样的组织形式
如果置信度改为99%, 则:当P=99%,t=2.58时,
本题的解题思路:
要估计
本题解的具体过程:
5、无放回条件下的简单随机抽样误差
样本平均数的标准差的推导过程:
因此可知,在无放回抽样调查中:
无放回条件下的简单随机抽样误差公式:
如果 例如,假定N=100万,n=1000,f=0.001,
在一副牌中抽五张牌所计算出的平均数应 该是在1和13之间,但是实际上抽到牌的平均 数为1和13的情况会非常少。
假如用一个分布去描述抽出牌的平均数, 可以得出如黑板上图所示的钟型分布图。
抽样推断的核心就是要通过研究样本平均 数的性质来判断一次抽样将会给我们带来什么 样的结果。
一般认为,从一副牌中抽5张牌的总体平 均数是7,从实验结果看其样本平均数是在5到 9之间,假定这是一个真实情况。可以将其表 示为: