统计学第七章

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
E (~ p1 ~ p2 ) p1 p 2
~ p ~ p
1
2
2

2
p1 (1 p1 ) p (1 p2 ) 2 n1 n2 p1 (1 p1 ) N1 n1 p (1 p2 ) N 2 n2 ( ) 2 ( ) n1 N1 1 n2 N2 1
或 ~ p1 ~ p2
第 7章
基本概念
• 总体与样本
名称 定义
抽样和抽样分布
样本 从总体中抽出的部分单位
总体 研究对象的全部单位
特征
统计量
样本容量 样本平均数 样本比率 样本方差 样本标准差
n x ~ p s s2
参数
总体容量 总体平均数 总体比率 总体方差 总体标准差
N

P
符号
2
• 随机抽样与判断抽样 随机原则:机会均等原则(抽样时避免主观倾向,以保证样 本的代表性) • 非抽样误差和抽样误差
例:某项粮食播种面积20000亩,其中有平原和山区两种地形。以类型抽样 的方法了解平均粮食产量。
地形 全部面积(Ni) 样本面积(ni) 平原 山区 合计 14000 6000 20000
• 整群抽样
将总体按某个标志分为多个群,随机抽取若干群,对被抽中的群进 行全面调查。 优缺点:调查方便,但抽样误差较大。
两个非正态总体
X 1 ( 1 , 1 , n1 ), X 2 ( 2 , 2 , n2 ), 则 X1 - X 2的分布为
2 2
X1 X 2 ~ N(1 2,
12
n1

22
n2
) (大样本)

样本比率的抽样分布
当样本容量n足够大并且np和n(1-p)都大于5时,根据中心极限定理可 知,样本比率的抽样分布近似服从正态分布,其特征值为:
x 1 e 2 ( x ) 2
2
0
x
• 两个样本均值之差的抽样分布
两个正态总体
X 1 ( 1 , 1 , n1 ), X 2 ( 2 , 2 , n2 ), 则 X1 - X 2的分布为
2 2
X1 X 2 ~ N(1 2,
12
n1

22
n2
)
总群数R=13 A B C E F D G L H K M I J C G D K n=nc+nd+ng+nk 样本数r=4 样本容量
例:从某县100个村中抽出10个村,进行全面调查,就可以大致了 解农 村家庭副业发展情况。
• 多阶段抽样
特点:多个阶段、多种方法综合抽样
例:对某山区的林采蓄积量作抽样调查。将总体50块面积相等的地划 为10个区,每个区包括5个地块。采用两阶段抽样,先从10个区选 中30%,再从选中的区域中抽取60%的地块组成样本进行调查。
记 p N1 N n ~ p 1, 则 n pq pq N n 2 2 ~ ~ P 或 P ( ) n n N 1
E (~ p) P

两个样本比率之差的抽样分布(大样本)
从2个总体中分别抽取容量为n1和n2的2个独立随机样本,当样本容 量足够大时2个样本比率之差的抽样分布就近似正态分布,其特征值为:
• 抽样技术
放回抽样:抽样总体不变 不放回抽样:抽样总体逐次减少

抽样分布
样本统计量的概率分布(理论分布)。 • 样本均值的抽样分布
数字特征 数学期望 方 抽样分布 差

E( X )
2 x

2
n

2
x

2 N n
n ( N 1
)
1 当总体服从正态分布时,从该总体中取样所得到的样本均 值仍然服从正态分布。 2 从非正态总中抽取的样本,只要容量足够大,根据中心极 限定理可知,样本均值的分布也趋向正态分布。
一般认为样本容量足够大的标准为:n大于等于30
正态分布
f ( x)
X ~ N ( , 2 )
f(x)
1 e 2
( x )2 2 2
( x )
f ( x)

x
对X标准化: Z X- Z ~ N (0,1)
标准正态分布
f ( x)

(x)
f ( x)
样本号 A B C D E
A
B C D E
重置抽样:25个样本 不重置抽样:20个样本
• 等距抽样(机械抽样或系统抽样)
将总体按某一标志值顺序排列,然后按一定间隔抽取样本。
排序标志
无关标志
有关标志
间隔距离;
N k n
起点的选择 半距中点取样 对称等距取样 随机取样
例:从某企业5000名职工中抽取100人进行家庭收入水平调查。 样本的距离=
5000 50 100
起点的选择:按姓氏排序,在第一个间隔中随机选取。
• 类型抽样(分层抽样)
将总体按某个标志分组,然后从各组按随机原则或其他方式抽样。确 定各组样本的方法:
总体N
N1 N2
N3
n1 wk.baidu.com2
比例抽样
n1
n1
Ni n N
n3
适宜抽样
Ni i n N i i
登记性误差 非抽样误差
偏 差
抽样误差
总体内部差异度
样 本容量 抽样方法
随机抽样设计
• 纯随机抽样(简单随机抽样)
对总体不做任何分类或排序,完全按随机原则抽样。 适用范围: 总体规模不大,内部差异较小。
例:一个班组有A、B、C、D、E五个工人,随机抽取2个工人的日 工资数作为了解整个班组平均工资水平的样本。 可能的结果是
相关文档
最新文档