生物统计学 抽样分布 PPT课件
合集下载
统计学(8)抽样分布ppt课件
23
三、两个样本方差比的抽样分 布
1. 两个总体都为正态分布,即X1~N(μ1,σ12)的一个样本, Y1,Y2,… ,Yn2是来自正态总体X2~N(μ2,σ22 )
2. 从两个总体中分别抽取容量为n1和n2的独立样本
3. 两个样本方差比的抽样分布,服从分子自由度为(n1-1), 分母自由度为(n2-1) F分布,即
第八章 抽样分布
ppt课件完整
1
• 统计方法
描述统计
推断统计
参数估计
假设检验
ppt课件完整
2
所谓统计推断,就是根据概率论所揭示的随机变 量的一般规律性,利用抽样调查所获得的样本信息, 对总体的某些性质或数量特征进行推断。
参数估计
统计推断 假设检验
这两类问题的基本原理是一致的,只是侧重点不同 而已。 参数估计问题侧重于用样本统计量估计总体的某一 未知参数; 假设检验问题侧重于用样本资料验证总体是否具有 某种性质或数量特征。
21
一、两个样本均值之差的抽样分 布
1. 两个总体都为正态分布,即 X1 ~N(1,12,) X2 ~N(2,22)
2. 两个样本均值之差 X1 X2的抽样分布服从正态分 布,其分布的数学期望为两个总体均值之差
E(X1X2)12
•
方差为各自的方差之和
2
2
2 X1X2
1
2
n n 1
2
ppt课件完整
X
n
ppt课件完整
15
二、样本比例的抽样分 布
比例:
1. 比例:指总体(或样本)中具有某种属性的单位与 全部单位总数之比。
• 例1:不同性别的人与全部人数之比
• 例2:合格品与全部产品总数之比
生物统计学课件抽样分布及应用一
但这还不够,历史上也没有因此避免 正态分布在应用上的危机,因为要获得σ 的准确数值,其难度比μ大得多。到1908 年W.S.Gosset公开发表一篇论文才使抽样 误差的研究走出应用上的困境。
如例2.1中定义样本标准误SӮ = S /√n,
则可将抽样误差转换成另一个标准化变量
t = ( Ӯ-μ)÷S/√n = 0.55 ÷ 0.9 = 0.61 查附表3可知获得0.55的两尾概率
第二节 显著性检验的原理
附表3所列为9种双侧概率对应的 | t | , 如右图所示, 当 n –1= 9时, 0.05 和0.10栏目下的2.262和1.833就表明 所得标准化变量 t 在 n =10时绝对值 超过2.262的概率(双侧面积)为0.05, 超过1.833的概率(双侧面积)为0.10。
0.15 0.1
0.05 0
2.262
↓ 0.025
0.025
1.833 ↓
0.05
t
-3.9 -2.7 -1.5 -0.3
0.9 2.1 3.3
第二节 显著性检验的原理
0.45 0.4
0.35 0.3
f(t)
N(0, 1)
←ν= 7
0.25 0.2
ν=∞→
0.15 0.1
0.05
ν= 2→
←ν= 4
4.0
1
Σ 还是正态分布,只是其变量特殊罢了。 16
12 36 0 0 14 49 0.5 2 4 16 0 1
48 148 — 8
⑶只有以自由度 n –1算得的样本方差 S2才是σ2 的无偏估计值。
( ΣS2 / Nn = 8÷16 = 1/2 = σ2 )
(但 S 不是σ的无偏估计值)
第一节 单个母总体抽样
如例2.1中定义样本标准误SӮ = S /√n,
则可将抽样误差转换成另一个标准化变量
t = ( Ӯ-μ)÷S/√n = 0.55 ÷ 0.9 = 0.61 查附表3可知获得0.55的两尾概率
第二节 显著性检验的原理
附表3所列为9种双侧概率对应的 | t | , 如右图所示, 当 n –1= 9时, 0.05 和0.10栏目下的2.262和1.833就表明 所得标准化变量 t 在 n =10时绝对值 超过2.262的概率(双侧面积)为0.05, 超过1.833的概率(双侧面积)为0.10。
0.15 0.1
0.05 0
2.262
↓ 0.025
0.025
1.833 ↓
0.05
t
-3.9 -2.7 -1.5 -0.3
0.9 2.1 3.3
第二节 显著性检验的原理
0.45 0.4
0.35 0.3
f(t)
N(0, 1)
←ν= 7
0.25 0.2
ν=∞→
0.15 0.1
0.05
ν= 2→
←ν= 4
4.0
1
Σ 还是正态分布,只是其变量特殊罢了。 16
12 36 0 0 14 49 0.5 2 4 16 0 1
48 148 — 8
⑶只有以自由度 n –1算得的样本方差 S2才是σ2 的无偏估计值。
( ΣS2 / Nn = 8÷16 = 1/2 = σ2 )
(但 S 不是σ的无偏估计值)
第一节 单个母总体抽样
统计学之抽样与抽样分布培训课件(ppt 79页)
总体变量 频 数
X
N
80
1
90
1
100
1
110
1
120
1
合计
5
第四章 抽样和抽样分布
频率 N/ΣN 1/5 1/5 1/5 1/5 1/5 1.00
21
3.2 重置抽样下的抽样分布
样本平均日工资计算表
变量/元 80
90 100 110
80
80
85
90
95
90
85
90
95 100
100 90
95 100 105
N
性质:1. Pi 0; 2. Pi 1 i=1
1.离散型随机变量的概率分布: X 的概率分布表
F x P X x P X Xi Pi
Xi x
Xi x
X
X1 X2 X N
P
P1
P2 PN
2020/1/13
第四章 抽样和抽样分布
第四章 抽样和抽样分布
31
3.2 重置抽样下的抽样分布
E p P 80 %
E x ( x ) X μp
P 1 P
n
0.8 1 0.8 4%
100
样本成数的抽样分布
已知某批零件的一级品率 为 80%,现用重置抽样方 法从中抽取100件,求样本 一级品率的抽样平均误差。
2020/1/13
第四章 抽样和抽样分布
9
2.2 连续型随机变量概率分布
N
期望: E X X1P1 X 2 P2 X n Pn X i Pi i1 f(x)
0
2020/1/13
统计学5.+抽样分布与抽样方法PPT
5.1 抽样调查的概念、特点和作用
二、抽样调查的特点 (一)按照随机原则抽取总体中的一部分单位
进行调查:
随机原则是指在抽取样本单位时完全排除调查者的主观判断 ,使各总体单位都有同等的被抽中的机会。只有严格遵循 随机原则,才能使样本的内部结构类似于总体的结构分布 特征,对总体具有充分的代表性。
(二)用一部分单位的指标数值去推断总体的 指标数值
抽样调查的目的是根据所得到的样本数据推断被调查现象总 体的特征。如总体指标、总体的概率分布等,这是其他非 全面调查方法都无法做到的。
5.1 抽样调查的概念、特点和作用
二、抽样调查的特点(续) (三)抽样调查会产生抽样误差,抽样误差可
以计算,并且可以加以控制。
任何调查方法都会产生误差,抽样调查以概率论为其 理论依据,根据数理统计所提供的抽样误差的理论 和方法,可以把推断的误差控制在一定的精确度内 ,以满足实际工作的需要。而其他调查方法都无法 计算和控制误差。
5.2 抽样调查的方法
一、两种抽样方式:
抽样方式可分为重复抽样和不重复抽样两种。 ⑴重复抽样 ——又称放回抽样,指每次从总体中随机抽取一个
样本单位,观察登记其标志值后再放回总体中,如
此进行 n 次的抽样方法。
重复抽样的特点: ①在重复抽样的过程中,被抽取的总体单位总数始终
保持不变,每一次抽样中各总体单位被抽到的机会 都相同,每次抽样结果相互独立。 ②每一总体单位都有被重复抽取的可能。
学习目标
❖ 了解各种抽样设计方法 ❖ 了解常用的统计分布; ❖ 掌握常用的统计量及其分布;
5.1 抽样调查的概念、特点和作用
统计学的目的是揭示总体数量分布的规律性,通常可 以采用两种方法:全面调查和非全面调查(抽样 调查)。
生物统计课件:随机抽样和抽样分布
例. 求7, 9, 4, 4, 6, 6, 6, 8, 8, 11的众数. 例. 众数是否唯一?
6. 极差 数据中最大值与最小值之差
例. 甲大学学生年龄的极差是6岁。 乙大学学生年龄的极差是10岁。
平均数、中位数 和众数关系
抽样分布
样本均数的分布 三大分布
抽样分布
精确抽样分布 渐近分布
• 统计量是随机变量; • 统计量的“抽样分布”
(Xi
−
X
)2
∑ ∑ =
1
n
[
n − 1 i=1
X
2 i
−
1( n n i=1
X i)2]
3. 标准误 SX 即样本均数的标准差
DX = 1 σ 2 = 1 DX
n
n
DX = 1 DX = DX
n
n
SX =
S n
S 2 = DX
4. 中位数
成绩 2 10 78 80 90 人数 1 1 1 22 5
nπ Γ( n)
(1
+
t2 n
)
−
n+1 2
2
E(t) = 0, D(t) = n ( when n > 2 ) n−2
n → ∞, t(n) ~ N (0,1)
iid
Theorem : if X1,L, X n ~ N (µ,σ 2 ), then X − µ ~ t(n −1) S/ n
X −µ X −µ = σ / n = S/ n S/ n
8 8
2.5 ≤ x < 2.7 2.7 ≤ x < 3
7 / 8 3 ≤ x < 3.5
1
x ≥ 3.5
正态概率纸原理
6. 极差 数据中最大值与最小值之差
例. 甲大学学生年龄的极差是6岁。 乙大学学生年龄的极差是10岁。
平均数、中位数 和众数关系
抽样分布
样本均数的分布 三大分布
抽样分布
精确抽样分布 渐近分布
• 统计量是随机变量; • 统计量的“抽样分布”
(Xi
−
X
)2
∑ ∑ =
1
n
[
n − 1 i=1
X
2 i
−
1( n n i=1
X i)2]
3. 标准误 SX 即样本均数的标准差
DX = 1 σ 2 = 1 DX
n
n
DX = 1 DX = DX
n
n
SX =
S n
S 2 = DX
4. 中位数
成绩 2 10 78 80 90 人数 1 1 1 22 5
nπ Γ( n)
(1
+
t2 n
)
−
n+1 2
2
E(t) = 0, D(t) = n ( when n > 2 ) n−2
n → ∞, t(n) ~ N (0,1)
iid
Theorem : if X1,L, X n ~ N (µ,σ 2 ), then X − µ ~ t(n −1) S/ n
X −µ X −µ = σ / n = S/ n S/ n
8 8
2.5 ≤ x < 2.7 2.7 ≤ x < 3
7 / 8 3 ≤ x < 3.5
1
x ≥ 3.5
正态概率纸原理
生物统计学课件2、抽样分布及应用一
体均值的置信区间。
样本量确定
在确定样本量时,我们需要考虑 抽样误差和总体变异程度。通过 抽样分布,我们可以确定一个具
有足够精确度的样本量。
在假设检验中的应用
假设检验
在假设检验中,我们通常会根据已知的抽样分布来构建拒 绝域或临界值,以判断样本数据是否符合预期的假设。
检验效能
在假设检验中,我们还需要考虑检验效能,即当原假设为 假时,我们能够正确拒绝原假设的概率。通过抽样分布, 我们可以计算检验效能。
抽样分布的期望值和方差
总结词
抽样分布的期望值等于总体均值,而方差则与样本大小和总体方差有关。
详细描述
在统计学中,抽样分布的期望值(或平均值)等于总体均值,这是大数定律的一个结果。此外,抽样 分布的方差与样本大小和总体方差有关。随着样本量的增加,样本方差趋于总体方差,这是样本方差 估计总体方差的基础。
02
抽样的方法
随机抽样
简单随机抽样
每个样本被选中的概率相等,不受其 他因素的影响。
分层随机抽样
将总体分成不同的层,然后在每一层 内进行随机抽样。
系统抽样
等距抽样
将总体分成若干个部分,然后每隔一定距离抽取一个样本。
时间序列抽样
按照时间顺序抽取样本,例如每天、每周或每月抽取一个样 本。
分层抽样
分类抽样
单一样本方差的区间估计
使用卡方分布或F分布的临界值,结合样本方差和样本大小,计算 总体方差的置信区间。
两独立样本均值的比较
1 2
两独立样本均值的比较方法
使用t检验或Z检验等方法比较两组独立样本的均 值。
t检验的前提条件
两组样本应来自正态分布的总体,且方差应相等 。
3
Z检验的前提条件
样本量确定
在确定样本量时,我们需要考虑 抽样误差和总体变异程度。通过 抽样分布,我们可以确定一个具
有足够精确度的样本量。
在假设检验中的应用
假设检验
在假设检验中,我们通常会根据已知的抽样分布来构建拒 绝域或临界值,以判断样本数据是否符合预期的假设。
检验效能
在假设检验中,我们还需要考虑检验效能,即当原假设为 假时,我们能够正确拒绝原假设的概率。通过抽样分布, 我们可以计算检验效能。
抽样分布的期望值和方差
总结词
抽样分布的期望值等于总体均值,而方差则与样本大小和总体方差有关。
详细描述
在统计学中,抽样分布的期望值(或平均值)等于总体均值,这是大数定律的一个结果。此外,抽样 分布的方差与样本大小和总体方差有关。随着样本量的增加,样本方差趋于总体方差,这是样本方差 估计总体方差的基础。
02
抽样的方法
随机抽样
简单随机抽样
每个样本被选中的概率相等,不受其 他因素的影响。
分层随机抽样
将总体分成不同的层,然后在每一层 内进行随机抽样。
系统抽样
等距抽样
将总体分成若干个部分,然后每隔一定距离抽取一个样本。
时间序列抽样
按照时间顺序抽取样本,例如每天、每周或每月抽取一个样 本。
分层抽样
分类抽样
单一样本方差的区间估计
使用卡方分布或F分布的临界值,结合样本方差和样本大小,计算 总体方差的置信区间。
两独立样本均值的比较
1 2
两独立样本均值的比较方法
使用t检验或Z检验等方法比较两组独立样本的均 值。
t检验的前提条件
两组样本应来自正态分布的总体,且方差应相等 。
3
Z检验的前提条件
生物统计学正态分布和抽样分布PPT课件
u而符是合服从N(具0有,(1)n-分1)布自,由t度则的不服t 分从布标,准其正中态分s 布, (P样n理四4=、(一本论、2保-03) 方 平 正险、s均态1u公2样数分和司3本(布s)赔2平总表2=偿,均体(0损.则数平累失标的均积的准分数函数化布)数学后表期的)望样的本查方法差之比称为 F。
1、单侧分位数 上侧分位数: 当 P(Uu)时的 u 下侧分位数: 当 P(Uu)时的 u
0.05
u0.05 2、双侧分位数
当 P(U u)
2
时的 u 2
3、正态分布上侧分位数(u)表的查法:
1
u2
e 2 du
2 u
0 .0 0 5
u 2 .5 7 6
0 .0 1 0
2 .3 2 6
四、正态分布表(累积函数表)的查法
1、标准正态分布 随机变量落在某区间(a,b)内的概率,可以从标准正态 分布表中查出。
附表 2 列出了对于 -2.99 U 2.99时的(u)的值。
附表2 正态分布表
u
0 .0 0
0 .0 1 0 .0 2 0 .0 3 0 .0 4 0 .0 5
-1 .2 0 .11 5 0 7 0 .11 3 1 4 0 .111 2 3 0 .1 0 9 3 5 0 .1 0 7 4 9 0 .1 0 5 6 5
生物界乃至整个自然界中,符合正态分布的现 象非常之多,所以正态分布是生物统计学的基 础。
复习思考题 ①什么是随机变量?举例说明随机变量的种类? ②举例说明如何利用随机变量表示一个事件?如何利用随机变 量定义总体和样本? ③为什么连续型随机变量取得某一具体观测值的概率是0? ④离散型随机变量和连续型随机变量的累积函数有何区别? ⑤累计函数和分布曲线的主要用途。 ⑥二项分布的应用前提和条件?泊松分布和二项分布概率函数 的关系? ⑦正态分布的意义和特点。 ⑧正态分布的密度函数和分布曲线的特点。 ⑨什么是正态分布的分位数?都有哪些种?
生物统计学课件 3、抽样分布及应用二
=
ˆ np np npq
第一节
二项总体抽样
习题 给定一个二项总体 {0,1,0,0,1,1,0,1,1,0},现从中以 n = 4进行复置抽样, 则分析如下:
例3.1 假定调查某地全部棉株受盲椿危 害的情况,发现704株受害,且 N = 2000, 得μ= 0.352,σ= 0.4776;现从中以n = 200 ˆ = 74,受害 抽取一个样本,知受害株数np ˆ = 0.37,试计算获此抽样误差的概率。 率p
ˆ y或 np
Ӯ或 p ˆ
0 0
1 0.25
2 0.5
3 0.75
4 1.0
ˆ –p|≥0.018) 解 依题意应求P( | p n = 0.4776÷√200 = 0.034 ∵ p ˆ ∴原式 = P(|u| ≥ 0.53)= 2 P(u ≤ - 0.53) = 2 Φ(- 0.53) = 2×0.2981= 0.5962
0 N(1- p)
μ=Σfy /N = Np/N = p σ2 = Σf ( y –μ)2/N = Np(1- p) /N = pq 可见二项总体的两个参数 μ,σ2 都由平均数p (即个体出现某种性状的概率) 唯一确定。
ˆ~N(μΣy ,σ2Σy )且: Σy或 np μΣy = nμ= np, 2 2 = npq, σ2Σy = n = nσ ˆ p 于是: u = (Ӯ – μӮ ) /σӮ ˆ p p pq n = u = (Σy – μΣy ) /σΣy
ˆq ˆ n 1 是σ2= pq的无偏估计值 ⑵∵S 2 np
∴ Sp ˆq ˆ n 1 =√(0.4×0.6÷19)=0.1124 p ˆ
tc= ( | p = 0.667 ˆ – p | – 0.5/n ) / S p ˆ = ( 0.1-0.025 ) / 0.1124
ˆ np np npq
第一节
二项总体抽样
习题 给定一个二项总体 {0,1,0,0,1,1,0,1,1,0},现从中以 n = 4进行复置抽样, 则分析如下:
例3.1 假定调查某地全部棉株受盲椿危 害的情况,发现704株受害,且 N = 2000, 得μ= 0.352,σ= 0.4776;现从中以n = 200 ˆ = 74,受害 抽取一个样本,知受害株数np ˆ = 0.37,试计算获此抽样误差的概率。 率p
ˆ y或 np
Ӯ或 p ˆ
0 0
1 0.25
2 0.5
3 0.75
4 1.0
ˆ –p|≥0.018) 解 依题意应求P( | p n = 0.4776÷√200 = 0.034 ∵ p ˆ ∴原式 = P(|u| ≥ 0.53)= 2 P(u ≤ - 0.53) = 2 Φ(- 0.53) = 2×0.2981= 0.5962
0 N(1- p)
μ=Σfy /N = Np/N = p σ2 = Σf ( y –μ)2/N = Np(1- p) /N = pq 可见二项总体的两个参数 μ,σ2 都由平均数p (即个体出现某种性状的概率) 唯一确定。
ˆ~N(μΣy ,σ2Σy )且: Σy或 np μΣy = nμ= np, 2 2 = npq, σ2Σy = n = nσ ˆ p 于是: u = (Ӯ – μӮ ) /σӮ ˆ p p pq n = u = (Σy – μΣy ) /σΣy
ˆq ˆ n 1 是σ2= pq的无偏估计值 ⑵∵S 2 np
∴ Sp ˆq ˆ n 1 =√(0.4×0.6÷19)=0.1124 p ˆ
tc= ( | p = 0.667 ˆ – p | – 0.5/n ) / S p ˆ = ( 0.1-0.025 ) / 0.1124
抽样和抽样分布培训课件(PPT 49张)
0.07 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989
7
自有限总体的抽样
• 无放回抽样:一个元素一旦选入样本,就从总体中剔除, 不能再次被选入。 • 放回抽样:一个元素一旦选入样本,仍被放回总体中。
先前被选入的元素可能再次被选,并且在样本中可出现
多次(多于一次)。
8
自无限总体的抽样
• 无限总体经常被定义为一个持续进行的过程,总体的元 素由在相同条件下过程无限运行下去产生的每一项构成。 在这种情况下,对总体内所有项排列是不可能的。
14
点估计
样本均值 51814.00美元 样本标准差
3347.72美元
样本比率 0.63
点估计的 统计过程
15
由30名管理人员组成的简单随机样本的点估计值
16
由30名管理人员组成的500个简单随机样本的点估计值
17
由30名管理人员组成的500个简单随机样本的抽样分布
• 抽样分布:样本统计量所有可能值构成的概率分布。
0.04 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.9988
抽样分布与抽样误差PPT(51张)
按无关标志排队,其抽样效果相当于简单随机抽样; 按有关标志排队,其抽样效果相当于类型抽样。
4·整群抽样(集团抽样)
—— 将总体全部单位分为若干“群”,然后 随机抽取一部分“群”,被抽中群体的所有 单位构成样本
例:总体群数R=16 样本群数r=4
A D
E
B F G
CM N
J H
L K
P O I
LP HD
样本比例的抽样分布
(数学期望与方差)
1. 样本比例的数学期望
E(p)
2. 样本比例的方差
– 重复抽样
p2
(1)
n
–
不重复抽样
2 p
(1)Nn
n N1
第二节 抽样误差
一、抽样误差的概念 二、抽样平均误差 三、抽样极限误差
指样本估计量与总体参数之间数量抽样Biblioteka 差 上的差异,仅指由于按照随机原则
•第一个
•第二个观察值
•观察值
•1
•2
•3
•4
•1
•1,1
•1,2
•1,3
•1,4
•2
•2,1
•2,2
•2,3
•2,4
•3
•3,1
•3,2
•3,3
•3,4
•4
•4,1
•4,2
•4,3
•4,4
计算出各样本的均值,如下表。并给出样本均 值的抽样分布
•16个样本的均值(x)
•第一个 •观察值
•第二个观察值 •1 •2 •3 •4
•
值越来越接近被估计的总体参数
P(ˆ ) 较大的样本容量
B
较小的样本容量
A
ˆ
抽样与抽样分布PPT-PPT精品文档
特点:
(1)遵循随机原则; (2)推断被调查对象的总体特征; (3)计算推断的准确性与可靠性。 江西财经大学统计学院
1
统计学
所谓抽样
第三章
抽样和抽样分布
抽签 编号 摇号 随机数字表
75 18 26 53 86
90 85 89 64 97
96 18 48 81 06
91 63 57 95 12
江西财经大学统计学院
7
统计学
第三章
抽样和抽样分布
[例]10人年龄资料如下。N=10 n=3。 人: A B C D E F G H I J 年龄: 5 8 12 40 42 46 48 70 72 76 分类: N1=3 N2=4 N3=3 N=10 1=2.87 2=3.16 3=2.49 =8.52 n1=? n2=? n3=? n=3 1、等额分配:n1= n2= n3= 1 2、等比例分配:n1/N1= n2/N2= … = n/N ∵ n/N =0.3 ∴n1/N1=0.3 n1=0.3×N1=0.3 ×3= 0.9 3、最优分配: i/ =ni/Ni ∵ 1/ =2.87/8.52=0.34 ∴ n1/N1=0.34 n1=0.34×3 =1.02 江西财经大学统计学院 8 二、抽样误差的计算
Z x
2
t 概率度 抽样平均误差 x n
s替代 不知 ˆ替代 p P不知
江西财经大学统计学院
3
x x x tx x x x tx
统计学
第三章
抽样和抽样分布
[例]某公司出口一种名茶,规定每包规格重量不低于150g,现用
x x P { x } 1 F ( t ) x x x x P { x x } 1 F ( t ) x x x x
《抽样统计》PPT课件
分层抽样可以提高抽样调查结果的精度, 或者在一定条件下减少样本的单位数 以节约调查费用. 因为分层抽样在总体中散布得更均匀, 大大降低了出现极端数 值的风险, 故其样本对这个总体也有较高的代表性, 可看出, 对总体分层后, 总 体方差可以理解为层内方差和层间方差两部分, 在分层抽样时, 其与层间无关.
11/9/2020
三. 重复抽样与不重复抽样
从N个总体单位中抽取n个组成样本, 有重复抽样与不重复抽样两种抽取方法. 重复抽样是: 每抽出一个个体进行调查登记后, 放回去, 再抽下一个, 直到抽取登 记n个为止. 采用这种抽样方法时, 每次每个单位被抽出的机会都是1/N.
不重复抽样的方法是: 每次抽出一个单位进行调查登记后, 不再放回去, 因此 凡是前面已经抽到过的单位,以后不会再被抽到.
故两种方式下可能抽到的样本个数M为
(1) 在重复抽样方法下:
M=N n,
(2) 在不重复抽样方法下:
11/9/2020
M
C
n N
=
n!
N! N r
n!
四. 抽样误差与抽样标准误差
统计中误差有两类, 一是登记性误差, 即在点数, 测量,登记, 计算,抄录等 过程中产生的误差, 二是代表性误差, 即用非全面资料推算或代替总体指标时产生 的误差.代表性误差又分为系统性与偶然性两种, 系统性误差是指没有遵守随机原 则而有意选取变量值较大或较小单位组成样本造成的误差, 这是应当避免的. 偶 然性误差是遵守了随机原则仍会产生的不可避免的误差.
来确定
n
Z 2P(1 2
P)
Z 2 P(1 P )N n N 2 Z 2 P(1 P )
(重复抽样) (不重复抽样)
11/9/2020
11/9/2020
三. 重复抽样与不重复抽样
从N个总体单位中抽取n个组成样本, 有重复抽样与不重复抽样两种抽取方法. 重复抽样是: 每抽出一个个体进行调查登记后, 放回去, 再抽下一个, 直到抽取登 记n个为止. 采用这种抽样方法时, 每次每个单位被抽出的机会都是1/N.
不重复抽样的方法是: 每次抽出一个单位进行调查登记后, 不再放回去, 因此 凡是前面已经抽到过的单位,以后不会再被抽到.
故两种方式下可能抽到的样本个数M为
(1) 在重复抽样方法下:
M=N n,
(2) 在不重复抽样方法下:
11/9/2020
M
C
n N
=
n!
N! N r
n!
四. 抽样误差与抽样标准误差
统计中误差有两类, 一是登记性误差, 即在点数, 测量,登记, 计算,抄录等 过程中产生的误差, 二是代表性误差, 即用非全面资料推算或代替总体指标时产生 的误差.代表性误差又分为系统性与偶然性两种, 系统性误差是指没有遵守随机原 则而有意选取变量值较大或较小单位组成样本造成的误差, 这是应当避免的. 偶 然性误差是遵守了随机原则仍会产生的不可避免的误差.
来确定
n
Z 2P(1 2
P)
Z 2 P(1 P )N n N 2 Z 2 P(1 P )
(重复抽样) (不重复抽样)
11/9/2020
相关主题