统计学课件第七章 抽样推断

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统 计 学 概 论 内 容
第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章 第九章 第十章 第十一章
中南大学
统 计 学 概 论
统计总论 统计调查 统计数据的整理与显示 统计指标 指数的因素分析 时间序列分析 抽样推断 相关与回归分析 统计预测 统计的综合评价 统计分析报告
20
平均数的抽样分布
统 计 学 概 论
全部可能样本平均数的均值等于总体均值,即:
E( x ) X (x X )
从非正态总体中抽取的样本平均数当n足够大时其 分布接近正态分布。 从正态总体中抽取的样本平均数不论容量大小其分 布均为正态分布。
样本均值的标准差为总体标准差的
1 n
lim
P( x X
) 1
n
如果变量总体存在有限的平均数和方 中心极限定律 差,那么不论这个总体的分布如何, 随着样本容量的增加,样本平均数的 分布,便趋近于正态分布。
中南大学
抽样推断理论基础
统 计 学 概 论
表明大量随机观象平均结果具有稳定性 的性质。大数定律论证了如果独立随机 大数定律 变量总体存在有限的平均数和方差,则 对于充分大的样本可以近乎100%的概率, 期望样本平均数与总体平均数的绝对离 差为任意小。

X
i 1 N
X
i

或 X
i 1 m
m
X
i
fi
N

i 1
fi
⒉ 总体单位标志值的标准差:

1 N
X
N i 1
i
X

2

1

i 1
m
X
m
i
X

2
fi
fi
i 1
中南大学
统 计 学 概 论
⒊ 总体单位标志值的方差:

2

1 N
X
N i 1
i
X
把某一抽样方法的全部可能的样本指标与其相应的概 率排列起来,就得到样本的概率分布。 若将样本指标的取值分别记为 x 1 , x 2 ,... x n , 其相应的概率记为P1,P2,„Pn,将它们按顺序排列 起来,可得如下概率分布表。
Pn
x
P(x)
中南大学
x1
P1
x2
P2
…… ……
xn
Pn
第二节
抽样分布
⒈ 样本平均数(又叫样本均值):

x
i 1 n
xi 或 x

i 1
m
xi f f
i
n

i 1
m
i
中南大学
统 计 学 概 论
为自由度
⒉ 样本单位标志值的标准差:
s n 1
x 1
n i 1
i
x

2
或s
1

i 1
m
x
m i 1
i
x

2
fi
fi 1

中南大学
抽样推断的应用
统 计 学 概 论

不可能进行全面调查时 不必要进行全面调查时


来不及进行全面调查时
对全面调查资料进行补充修正时
中南大学
抽样推断理论基础
统 计 学 概 论
表明大量随机观象平均结果具有稳定性 的性质。大数定律论证了如果独立随机 大数定律 变量总体存在有限的平均数和方差,则 对于充分大的样本可以近乎100%的概率, 期望样本平均数与总体平均数的绝对离 差为任意小。
抽样总体
中南大学
抽样推断的基本概念
统 计 学 概 论
n≥30称为大样本,n <30称为小样本.n/N称 为抽样比.
例如:在100万户居民中,随机抽取1000户 居民进行家庭收支情况调查,其中的100万 户居 民就是全及总体,而被抽中的1000户 居民则构成抽样总体。
中南大学
全及指标
统 计 学 概 论
随机抽样的概率分布
统 计 学 概 论
样本统计 样本统计 样本统计 量 量样本统计 量样本统计 量样本统计 量样本统计 量样本统计 量样本统计 量样本统计 量样本统计 量样本统计 量样本统计 量 量 主要样本 统计量
中南大学
样本统计量所有可能值的概率分 布
Hale Waihona Puke Baidu
总体未知 参数 分布的形状及接 近总体参数的程 度
的无偏估计
⒊ 样本单位标志值的方差:
s
2
x n 1
1
n i 1
2
i
x 或s
2

2
1

的无偏估计

i 1
m
x
m i 1
i
x

2
fi
fi 1
中南大学
统 计 学 概 论
⒋ 样本成数:
p n1 n ,q n0 n 1 p
⒌ 样本单位是非标志的标准差:
平均数的抽样分布 ABCD 45 ACDG
统 计 学 概 论

50 52.5 55 F G 样本均值 45 47.5 2 D E 57.5 60 学生 A B C
统 计 学 概 论
N n 出现次数 1 x 1 2 3 4 4 5 成绩 差 N 401 50 -10 -7.5 70 80 90 30 -15 -12.5n 60 -5 -2.5 0 离
方差
平均数
比率(成数)

本 均


本 均
值 样
本 均
57.5 BCEG 62.5 ABCE 47.5 ACEF 57.5 BCFG 65 学生 A 45B47.5 50 D E 57.5 60 C 52.5 55 F G 样本均值 ABCF 50 ACEG 60 BDEF 62.5 4 出现次数 ABCG 52.5 1 40 1 50 262.53 70 8065 5 ACFG BDEG 4 成绩 30 60 90 ABDE 50 60 BDFG 65 样本均值 62.5 ADEF 67.5 70 72.5 75 67.5 2 6 2 按随机原则抽选出4名学 ABDF 52.5 ADEG 62.5 BEFG 70 5 4 4 3 2 1 1 出现次数 ABDG 55 ADFG 65 CDEF 生,并计算平均分数。 65 二者均值相等 4 ABEF 55 AEFG 67.5 CDEG 67.5 1 1 3 ABEG 57.5 BCDE 55 CDFG 70 2 ABFG 60 BCDF 57.5 CEFG 72.5 1 0 ACDE 30 52.5 BCDG60 60 75 40 50 70 80 DEFG 90 0 0 ACDF50 55 60 65 BCEF 75 6030 40 50 60 70 80 90 55 45 70 中南大学
x ~ N (X
中南大学
,
2
n)
比率的抽样分布
统 计 学 概 论
全部可能样本比率的均值等于总体比率,即:
E ( p) P ( p P)
从非正态总体中抽取的样本比率,当n足够大时其 分布接近正态分布。 从正态总体中抽取的样本比率,不论容量大小其分 布均为正态分布。 样本比率的标准差为总体标准的 。
计算机模拟法
是将随机数字编制为程序存储在计算 机中,需要时将总体中各单位编上号 码,启用随机数字发生器输出随机数 字,然后从总体中找到相应总体单位 形成样本。
中南大学
随机样本
统 计 学 概 论
与总体分布特 征相同
与总体分布特 征不同 总体
非随机样本
并非所有的抽样估计都按随机原 则抽取样本,也有非随机抽样
总体单位数N不变,同一单位可能多次被抽中。
中南大学
抽样方法的分类
统 计 学 概 论
不重复抽样
每次从总体中抽选一个单位 后就不再将其放回参加下一 次的抽选。又称不放回抽样.
总体单位数减少n,同一单位只可能被抽中一次。
中南大学
抽样方法的分类 根据对样本的要求不同,可分为:
统 计 学 概 论
考虑顺序抽样
sp n n 1 p 1 p n n 1 pq
为P 的 无偏估计
为 P 的 无偏估计
2
⒍ 样本单位是非标志的方差:
sp
2

n n 1
p 1 p
n n 1
pq
中南大学
抽样方法的分类 根据取样方式不同,可分为:
统 计 学 概 论
重复抽样
从总体N个单位中随机抽取一个 样本容量为n的样本,每次从总 体中抽取一个,并把结果登记 下来,又放回总体中重新参加 下一次的抽选。又称放回抽样
72.5 75 样本均值 62.5 65 67.5 0 70 10 20 30 离差 -30 -20 -10 2 74 4 1 1 出现次数 20 4 3 1 2 100 7 . 07 离 7 差 2.5 5 7.5 10 12.5 15 1 4 2
x 7.07
中南大学
根据全及总体各个单位的标志值或标志 特征所计算的反映总体某种属性的综合 指标 ,又称总体参数。 设总体中 N 个总体单位某项标志的标志值分 别为 X , X , X ,其中具有某种属性的有 N
1 2 N
1
个单位,不具有某种属性的有
N
0
个单位,则
中南大学
全及指标
统 计 学 概 论
⒈ 总体平均数(又叫总体均值):
第七章
抽样推断
统 计 学 概 论
第一节 第二节 第三节 第四节
抽样推断概述 随机抽样的概率分布 参数估计 抽样设计
中南大学
第一节 抽样推断
抽样推断概述
统 计 学 概 论
按照随机原则 从全部研究对象中抽取一部分单位 进行调查,并以调查结果对总体数量特征作出具有 一定可靠程度的估计与推断,从而认识总体的一种 统计方法。
中南大学
抽样推断的特点 按随机原则抽取样本单位
统 计 学 概 论
以样本的数量特征推断总体的数量特征 抽样推断产生抽样误差,但抽样误差可以事先计算 并控制 与全面调查相比,抽样调查既节省了人力、物力、 财力和时间,又达到了认识总体数量特征的目的。 我国在1994年确立了以周期性普查为基础,以经常 性抽样调整为主体,同时辅之以重点调查、科学核 算等综合运用的统计调查方法体系。


中南大学


比率的抽样分布
1 n
p ~ N ( P , P 1 P np

n)
5 , n (1 p ) 5
中南大学
比率的抽样分布
统 计 学 概 论
教师
是否博士




具有博士学位的比率:
P=0.5
比率的标准差: C 否 从总体中按重复抽样方法随机抽取4人,计 =0.5 算其比率P和标准差 p D 否
考虑各单位的中选顺序。
ABC≠CBA 不考虑各单位的中选顺序。
不考虑顺序抽样
ABC=CBA
考虑顺序的重复抽样 考虑顺序的不重复抽样 不考虑顺序的不重复抽样
综合起来共有四 种抽样方法
中南大学
不考虑顺序的重复抽样
样本的可能数目 考虑顺序的不重复抽样
p
n N
统 计 学 概 论
N ! /( N n )!
指样本单位的抽取不受主观因素 及其他系统性因素的影响,每个 总体单位都有均等的被抽中机会
中南大学
抽样推断
统 计 学 概 论
全及总体指标:参数 (未知量)
统计推断
样本总体指标:统计量 (已知量)
中南大学
随机原则的实现
统 计 学 概 论
是将总体中每个单位的编号写在外形完全 一致的签上,将其搅拌均匀,从中任意抽 抽签法 选,签上的号码所对应的单位就是样本单 位。 将总体中每个单位编上号码,然后使 用随机数表,查出所要抽取的调查单 随机数表法 位。
考虑顺序的重复抽样
不考虑顺序的不重复抽样
N
C
n
n
n N
不考虑顺序的重复抽样
C N n 1
把填湖南风采35选7福利彩票号码看作一次抽 样,则它属于哪一种抽样?中特等奖的概率是 多少?(0—9选6呢?) 不考虑顺序的不重复抽样
中南大学
1 / C 36 1 / 8347680
7
样本的概率分布
统 计 学 概 论

2
2

1

i 1
m
X
m
i
X

2
fi
fi
i 1
⒋ 总体成数:
P
N1 N
,Q
N0 N
1 P
中南大学
统 计 学 概 论
⒌ 总体是非标志的标准差:

P

P 1 P
PQ
当 P
Q 0 . 5时, P 有最大值

⒍ 总体是非标志的方差:

2 P
P 1 P PQ
中南大学
统 计 学 概 论
指根据抽样总体各个单位的标志 抽样指标 值或标志特征计算的综合指标, 又被称为统计量,它是随机变量。
设样本中 n个样本单位某项标志的标志值 分别为 x1 , x 2 , x n ,其中具有和不具有某 种属性的样本单位数目分别为n 和n 个,则
1
0
中南大学
统 计 学 概 论
lim
P( x X
) 1
n
如果变量总体存在有限的平均数和方 中心极限定律 差,那么不论这个总体的分布如何, 随着样本容量的增加,样本平均数的 分布,便趋近于正态分布。
中南大学
抽样推断的基本概念
统 计 学 概 论
全及总体
又称总体或母体,是所要认识研 究对象的全体,它由具有某种共 同性质或特征的单位所组成。常 用N表示全及总体的单位数目。 又称样本或子样,是指从全及 总体中按照随机原则抽取的那 部分个体的组合。抽样总体的 单位数称为样本容量,通常用 n表示。1<n<N 。
相关文档
最新文档