统计学第六章抽样推断
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
尖山一委…
尖山二委
居民一组
居民二
组
…
第六章 抽样推断
某外国公司在##进行 微波炉市场调查:
STAT
在商场的大门口
在微波炉柜台前
在市区街道旁边
在某个住宅小区
时间表抽样框
第六章 抽样推断
连续出产的产品总体 可以编制抽样框:均STAT 匀的出产时间、可以 预见到的产品总量.
连续到加油站加油的 汽车总体无法编制抽 样框:时间不定、总 量也无法确定.
抽样估计的特点
第六章 抽样推断
按随机原则抽取样本单位
目的是推断总体的数量特征
抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
抽样估计的应用
第六章 抽样推断
不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时
抽样调查研究
Sampling Study
P N nN N NN n
共n个
⒉ 不重复抽样的可能样本数目:
C N n N N 1 N n 1
第六章 抽样推断
第六章 抽样推断
STAT
★§1.1 抽样方案的设计 ★§1.2 简单随机抽样的抽样误差的测定
§1.3 简单随机抽样的抽样估计
第六章 抽样推断
§1.2 简单随机抽样的抽样误差的测定 STAT
n1 1{i n1E(xiX)2nn(E xX)2} 由E(于 xX)2D (x)D (i1 nxi)n 1 2i n1D (xi)n2
E(sn21)n11{n2nn2}
2
⒋ 样本成数:
pn1,qn0 1p nn
⒌ 样本单位是非标志的标准差:
第六章 抽样推断
sp
n p1p
n1
n pq n1
假如:1:已经得到了如下的结果: 总体均值:51800 总体标准差:
=4000
第六章 抽样推断
STAT
2、同时,有1500人参加了公司培训,则 参加公司培训计划的比例为:P =1500/2500=0.60
上述总体均值、总体标准差、比例均称为总体的参 数
如:上例中的中层干部平均年薪,年薪标准差及受培训人数 所占比例均为该公司中层干部这一总体的参数.
第六章 抽样推断
4·整群抽样(集团抽样) —— 将总体全部单位分为若干“群”,然后STAT
随机抽取一部分“群”,被抽中群体的所有 单位构成样本
例:总体群数R=16 样本群数r=4
A D
E
B F G
CM N
J H
L K
P O I
LP HD
样本容量
nndnpnl nh
简单、方便,能节省人力、物力、财 力和时间,但其样本代表性可能较差
n
n
由 (于 x i X ) x i n X n x n X n (x X )
i 1
i 1
第六章 抽样推断
E (s n 2 1 ) n 1 1 E { i n 1 (x i X )2 2 n (x X )2 n (x X )2 }
n1 1E{i n1(xiX)2n(xX)2}
STAT
n≥30,为大样本;n < 30,为小样本
确定适当样本容量的意义:
若n过大,调查工作量增大,体现不出抽样
调查的优越性;
若n 过小,抽样误差会增大,抽样推断就
会失去价值。
确定样本容量
第六章 抽样推断
在考虑顺序的抽样条件下,从 样本的可能数目 总体N中随机抽取n个样本单位
共有多少种可能的抽选结果
⒈ 重复抽样的可能样本数目:
P2P1PPQ
第六章 抽样推断
指根据样本单位的标志值计算的用
样本指标 以估计和推断相应总体指标的综合
指标,又被称为估计量或统计量
设样本中 n个样本单位某项标志的标志值
分别为 x1,x2,xn ,其中具有和不具有某 种属性的样本单位数目分别为 n1和 n 个0 ,则
⒈ 样本平均数〔又叫样本均值〕:
n
m
xi
xi fi
x i 1 n
或x
i 1 m
fi
i 1
计算 公式
1. 样本平均数的计算公式为:
第六章 抽样推断
m
x
x1f1 x2 f2 xmfm f1 f2 fm
xi fii1 mfi NhomakorabeaSTAT
i1
设总体均值为X
方差为 2
E(x)E1 n(x1x2 xn) 1 n[E(x1)E(x2) E(xn)]
设总体中 N个总体单位某项标志的标志值分别
为 X1,X2,XN ,其中具有某种属性的有 N 1个 单位,不具有某种属性的有N 0个单位,则
⒈ 总体平均数〔又叫总体均值〕:
N
m
Xi
Xi fi
X i1 N
或X
i 1 m
fi
i 1
⒉ 总体单位标志值的标准差:
第六章 抽样推断
1N Ni1
为什么要抽样? 1. 涉及破坏受试对象 质量控制 2. 取得精确可靠的结果 3. 实际情况的约束 时间,成本等
第六章 抽样推断
STAT
抽样估计的一般步骤
设
抽
收
计
取
集
抽
样
样
样
本
本
方
单
数
案
位
据
第六章 抽样推断
计
推
算
断
样 本 统
总 体
计
参
量
数
总体参数
第六章 抽样推断
指被估计的总体指标,又被
称为全及指标
样本n=100×10=1000(户)
第六章 抽样推断
确定抽样组织方式
在实际工作中,选择适当的抽样组织 STAT 方式主要应考虑:
调查对象的性质特点 对调查对象的了解程度〔抽样框 的特点〕 抽样误差的大小 人力、财力和物力等条件的限制
确定样本容量
第六章 抽样推断
样本容量 指样本中含有的总体单位的 数目,通常用n 来表示。
⒍ 样本单位是非标志的方差:
sp2nn 1p1pnn 1pq
第六章 抽样推断
§1.1 抽样方案的设计 STAT
★ 一、抽样估计的意义和一般步骤 ★ 二、抽样方案设计的基本准则
三、抽样方案设计的主要内容
抽样方案设计的基本准则
第六章 抽样推断
㈠ 随机原则 ——抽取样本单位时,应确保每个总体单位都有 被抽取的可能;在对样本单位的资料进行搜集 和整理时,不能随意遗漏或更换样本单位
1 nE(x) n
X
⒉ 样本单位标志值的标准差:
为自由度
s
1n n1i1
xix2或 s
1
m
m
2
xix fi
fi 1i1
i1
⒊ 样本单位标志值的方差:
s2n1 1i n1xix2或 s2m1 fi1im 1
2
xix fi
i1
计算 公式
2.样本方差的计算公式为:
第六章 抽样推断
Xi X2或
1m
2
m
XiX fi
fi i1
i1
⒊ 总体单位标志值的方差:
21N
Ni1
XiX2或2m 1 fi
m i1
2
XiX fi
i1
⒋ 总体成数:
第六章 抽样推断
PN1,QN0 1P NN
⒌ 总体是非标志的标准差:
PP1PPQ 当 PQ 0 .5 时 P , 有最 大值
⒍ 总体是非标志的方差:
STAT
0.3
相 对 0.2 频 数
0.1
第六章 抽样推断
STAT
图4.1 500个 x 的相对频数分布 这里, 的x 相对频数分布,就称为 的x抽样分布.
一、抽样分布 二、抽样估计量的优良标准 三、抽样误差的概念 四、抽样平均误差 五、抽样极限误差
第六章 抽样推断
抽样分布
样本统计量所有可能值的 概率分布
样计样 计本 量样 计样 计样 计量本样 计统本量样 计本量样 计本量统样 计本量统样 计本 量统样 计量本统样计量本统样计量本统量本统本量统本量统统统统
是最为常用的抽样方法,用于无限总 体和许多有限总体样本单位的抽样.
第六章 抽样推断
确定抽样组织方式
1·简单随机抽样(纯随机抽样)
STAT
——对总体单位逐一编号,然后按随机原 则直接从总体中抽出若干单位构成样本
应用
仅适用于规模不大、内部各单位 标志值差异较小的总体
是最简单、最基本、最符合随机原则, 但同时也是抽样误差最大的抽样组织形式
总体未 知参数
主要样本 平均数 比率(成数) 方差
x 统计量
p
S2
第六章 抽样推断
例:某大公司人事部经理整理其2500个中层干部的档案.其
中一项内容是考察这些中层干部的平均年薪及参加过公
司培训计划的比例.
STAT
总体:2500名中层干部,
如果:上述情况可由每个人的个人档案中得知,可容易地 测出这2500名中层干部的平均年薪及标准差.
确定抽样组织方式
第六章 抽样推断
3·等距抽样(机械抽样或系统抽样)
STAT
——将总体单位按某一标志排序,而后按一 定的间隔抽取样本单位。
随机起点
半距起点
对称起点
······
〔总体单位按某一标志排序〕
按无关标志排队,其抽样效果相当于简单随机抽样; 按有关标志排队,其抽样效果相当于类型抽样.
确定抽样组织方式
确定抽样方法
第六章 抽样推断
STAT
重复抽样 又被称作重置抽样、有放回抽样
抽出 个体
特点
登记 特征
放回 总体
继续 抽取
同一总体单位有可能被重复抽中, 而且每次抽取都是独立进行
确定抽样方法
第六章 抽样推断
不重复抽样
又被称作不重置抽样、不放 STAT 回抽样
抽出 个体
登记 特征
继续 抽取
特点
同一总体中每个单位被抽中的机会并 不均等,在连续抽取时,每次抽取都不是 独立进行
第六章 抽样推断
三、抽样方案设计的主要内容
STAT
㈠ 编制抽样框 ㈡ 确定抽样方法 ㈢ 确定抽样组织方式 ㈣ 确定样本容量
编制抽样框
第六章 抽样推断
抽样框
指包括全部抽样单位的名单框架,STAT 仅对有限总体而言
主
名单抽样框
要 形
区域抽样框
式
时间表抽样框
区域抽样框
##区…
沙
河口区
星海街道…
黑石礁街道
㈡ 抽样误差最小
— 小—的在方其案他条件相同的在设情误计况差抽下达样,选到方抽一案样定时误要,通差求常最的是条 ㈢——费在用其最他少条件相同的件情下况,选下择,选费费用用最最少少的的方案 方案
第六章 抽样推断
§1.1 抽样方案的设计 STAT
★ 一、抽样估计的意义和一般步骤 ★ 二、抽样方案设计的基本准则 ★ 三、抽样方案设计的主要内容
指样本单位的抽取不受主
观因素及其他系统性因素 的影响,每个总体单位都有
均等的被抽中机会
抽样估计
第六章 抽样推断
全及总体指标: 参数〔未知量〕
统计推断
样本总体指标: 统计量〔已知量〕
随机样本 第六章 抽样推断
与总体分布 特征相同
与总体分布 特征不同
总体
非随机样本
并非所有的抽样估计都按随机原 则抽取样本,也有非随机抽样
第六章 抽样推断
确定抽样组织方式
2·类型抽样(分层抽样)
STAT
——将总体全部单位分类,形成若干个类型组,
然后从各类型中分别抽取样本单位组成样本。
N1
n1
总体
N
N2
n2
··· ···
Nk
nk
等额抽取
样本
n 等比例抽取
能使样本结构更接近于总体结构,提高样本的 代表性;能同时推断总体指标和各子总体的指标
●抽样估计就是要通过样本而非总体来估计总体参数.
第六章 抽样推断
如果抽样的样本与前一次的不同,则可得到另外的平均年
薪样本均值、标准差以及受训干部的比例.
STAT
如果多次抽样,则可得到多个不同的结果.
下表是一个假设的经过500次抽样后的情况表.
第六章 抽样推断
下表给出了500个 x 的频数分布与相对频数分布,
m
sn 2 1(X 1X )2f1(f1 X 2 f2X ) 2 f2 fm 1(X mX )2fmi 1(X m if i X 1 )2 STfiAT i 1
E(sn21)En11i n1(xi x)2
n1 1E{i n1[x(iX)(xX)2]}
n 1 1 E { i n 1 (x i X )2 2 i n 1 (x i X )x (X ) n (x X )2 }
第六章 抽样推断
第六章 抽样推断
STAT
•
参数估计
• 基本内容
•
假设检验
• 科学的抽样估计方法应具备3个条件:
• 1>要有合适的统计量作为估计量.
• 2>要有合理的允许误差范围.
• 3>要有一个可接受的置信度.
第六章 抽样推断
第六章 抽样推断
STAT
★§1.1 抽样方案的设计
§1.2 简单随机抽样的抽样误差的测定 §1.3 简单随机抽样的抽样估计
第六章 抽样推断
确定抽样组织方式
5·多阶段抽样
STAT
—— 指分两个或两个以上的阶段来完成抽
取样本单位的过程
例:在某省100多万农户抽取1000户调查 农户生产性投资情况.
第一阶段:从该省所有县中抽取5个县 第二阶段:从被抽中的5个县中各抽4个乡 第三阶段:从被抽中的20个乡中各抽5个村 第四阶段:从被抽中的100个村中各抽10户
第六章 抽样推断
§1.1 抽样方案的设计 STAT
★ 一、抽样估计的意义和一般步骤
二、抽样方案设计的基本准则
第六章 抽样推断
一、抽样估计的意义和一般步骤
STAT
㈠ 抽样估计的定义 ㈡ 抽样估计的特点 ㈢ 抽样估计的运用 ㈣ 抽样估计的一般步骤 ㈤ 总体参数与样本指标
抽样估计
第六章 抽样推断
按照随机原则 从调查对象中抽取一部 分单位进行调查,并以调查结果对总体 数量特征作出具有一定可靠程度的估计 与推断,从而认识总体的一种统计方法