统原PP第七章抽样估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本指标 根据抽样总体单位计算的统计指标。x P s s2变数计算
3、重置抽样和不重置抽样
重置抽样 被抽中单位仍放回总体参加下次抽取。
不重置抽样 被抽中单位不放回总体不参加下次抽取。
4、全部可能样本数
不重置抽样考虑顺序
不重复排列数
ANn
N! (N n)!
A42 12
重置抽样考虑顺序 可重复排列数 BNn Nn
• 样本单位 样本单位数 样本容量 n 有限
• 大样本 n≥50 n≥30(精度不高,方差小)方法易 社会经济统计
• 小样本 n<50 n<30 (非正态,为t分布) 方法难 自然技术统计
•
★从全及总体中,可抽一个样本,也可抽一系列样本,每
个样本都可以计算各种指标。
2
2、全及指标和样本指标
全及指标 根据全及总体单位计算的统计指标。X P σσ2常数未知
第一、抽样估计计算的是总体指标所在的范围称为置信区间。
• 不等式表示: xtxXxtx • 区间表示: xtx,xtx
• 定值表示:
x tx
•
第二、置信区间表明的是一个可能范围,不是可靠范围,总
体落在置信区间内的概率称为置信概率。用γ表示。
•
第三、扩大置信区间可提高置信概率,缩小置信区间可降低
置信概率,扩大或缩小的倍数称为概率度,用t表示。
就趋近于正态分布x~NX (,x) ,作变量代换 z x X
• 则z服从于标准正态分布:z~N(0,1)
x
P(z t)
P( x X t)
P(xXtx)
x
P(Xxtx)
P ( txXxtx)
P (x txX x tx) 9
P (x t x X x t x)
• 二、区间估计的特点
•
11
四、大样本平均数抽样估计综述
P (x xXx x)
•
重置抽x样txxxn
s s n1 n
• •
不重置抽样 估计步骤:
xn
Nn N1
s 1ns n1 N n
5、置信区间和置信概率
置信区间:估计的总体指标所在的范围。 置信概率:置信区间的可靠性大小。
二、抽样估计的意义
抽样估计——按照随机原则,从全及总体中抽取部分 单位组成样本,对样本进行调查并计算出各种统计指标, 以此对全及指标所在范围进行概率估计的统计方法。4
三、抽样估计的作用
1、用于无限总体或特大总体 如环境污染 、 大气测量 、 含水率等。
• x tx 称为极限抽样误差,是抽样误差的最大限度。
• 例如:若概率度t=2 ,则极限误差为 x 2x ,置信区间为
•
x2x,x2x ,置信概率为95.45%。
10
P (x txXx tx)
•
三、抽样误差的计算
• 误差,以简上称公抽式样中误,差x ,的用计算是x 表抽示样。估理计论的上基:础,x称为抽x 样平n均
x
6
二、样本的分布
1、样本的代表性
①分布越接近于总体的样本代表性越强,然而有些
接近,有些不接近。
②总希望接近总体的样本数量多一些,抽到它们的
概率高一些。
③样本平均数是样本的代表值,研究它的分布规律
是研究样本代表性问题的关践。
①总 体 的 分 布 单位数N 分布未知 均数 X
②样 本 的 分 布 ③样本均数分布
4、抽样误差
统计误差 登记性误差(登记或计算) 代表性误差 (统计值与实际值之差) 系统性误差(偏差 违反随机原则)
(非全面调查) 随机误差 实际误差(某一样本) (不同样本带来) 平均误差(全部样本)
抽样平均误差(抽样误差):由于抽样的随机性而产生的, 样本指标与总体指标之间的平均误差,是所有可能 出现的样本指标的标准差。
• (3)样本平均数的平均数等于总体平均数 X x = X
• (4)样本平均数的标准差为:
• 重置抽样
x
n
•
不重置抽样 x
n
N n N 1
1 n (N1) n 为抽样比
n
N来自百度文库
N
(Nn)
n
8
第三节 总体平均数的抽样估计
•
一、总体均数估计的公式
•
中心极限定理表明,只要n足够大(n>50),样本均数的分布
2、用于破坏性试验 3、用于其它特殊总体 没必要或不可能全面 调查的总体。 4、验证和修正全面调查的结果 如人口普查。
5
第二节 抽样估计的理论基础
对概率论与数理统计知识的简单回顾。
一、正态分布 1、密度函数
数学期望 x
f (x) 1 ex222
2
决定正态分布曲线的位置
标准差σ 决定正态曲线的形状,
•
数理统计证明,样本标准差 s 是总体标准差 σ 的偏误估
•
•
计量,当而n>>1n时n,1ns-1≈n,是s总 体标准,差可σ用的样无本偏标估准计差量。s 代替总体
标准差σ计算。
• • •
重不置重抽置抽样抽样:样误:差 的xx计 算 n x公式N N :n 1 nns n 1 s 1s1 nN nsn
当σ值变小时,中心分布升高,正态曲线趋于集中;
当σ值变大时,中心分布降低,正态曲线趋于平缓。 2、标准正态分布 μ=0 σ=1的正态分布 f (x) 1
x2
e2
t=1 γ=68.27%
2
t=2 γ=95.45%
t=3 γ=99.73%
t=1.96 γ=95%
t=2.58 γ=99%
3、标准化 变量代换 z
• •
•
苦科
第 七
战学 章
能有 陈过 险
抽 样
毅关 阻
估 计
1
第七章 抽样估计
笫一节 抽样估计的意义和作用
•
一、抽样估计的基本概念
•
1、全及总体和样本总体
• 全及总体 被调查研究的事物的全体,母体。
• 样本总体 从全及总体中随机抽取的部分,样本。
• 总体单位 总体单位数 总体总量 N 有限 无限 特大
B42 16
不重置抽样不考虑顺序
不重复组合数
CNn
N! (Nn)!n!
C42 6
重置抽样不考虑顺序 可重复组合数
DNn
(Nn1)! (N1)!n!
D42 10
※ N n固定,则所有可能样本数固定 ◎考虑顺序所有可能样本数>不考虑顺序所有可能样本数 #重置抽样所有可能样本数>不重置抽样所有可能样本数 3
单 单位位数数nC
n N
不太偏 正态分布
均数 均x 数
x X
x
标准差σ 标 标准 准差 差 sx
2、大数定理:只要n充分大,样本的分布一致于总体
的分布,样本均数趋近于总体均数,样本标准差趋近于总
体标准差。
7
3、中心极限定理
• (1)若总体为正态分布,样本均数 x 也服从正态分布。
• (2)总体为任意分布(不太偏),样本均数 x 随着n的增大 而趋近于正态分布。(n≥50)
3、重置抽样和不重置抽样
重置抽样 被抽中单位仍放回总体参加下次抽取。
不重置抽样 被抽中单位不放回总体不参加下次抽取。
4、全部可能样本数
不重置抽样考虑顺序
不重复排列数
ANn
N! (N n)!
A42 12
重置抽样考虑顺序 可重复排列数 BNn Nn
• 样本单位 样本单位数 样本容量 n 有限
• 大样本 n≥50 n≥30(精度不高,方差小)方法易 社会经济统计
• 小样本 n<50 n<30 (非正态,为t分布) 方法难 自然技术统计
•
★从全及总体中,可抽一个样本,也可抽一系列样本,每
个样本都可以计算各种指标。
2
2、全及指标和样本指标
全及指标 根据全及总体单位计算的统计指标。X P σσ2常数未知
第一、抽样估计计算的是总体指标所在的范围称为置信区间。
• 不等式表示: xtxXxtx • 区间表示: xtx,xtx
• 定值表示:
x tx
•
第二、置信区间表明的是一个可能范围,不是可靠范围,总
体落在置信区间内的概率称为置信概率。用γ表示。
•
第三、扩大置信区间可提高置信概率,缩小置信区间可降低
置信概率,扩大或缩小的倍数称为概率度,用t表示。
就趋近于正态分布x~NX (,x) ,作变量代换 z x X
• 则z服从于标准正态分布:z~N(0,1)
x
P(z t)
P( x X t)
P(xXtx)
x
P(Xxtx)
P ( txXxtx)
P (x txX x tx) 9
P (x t x X x t x)
• 二、区间估计的特点
•
11
四、大样本平均数抽样估计综述
P (x xXx x)
•
重置抽x样txxxn
s s n1 n
• •
不重置抽样 估计步骤:
xn
Nn N1
s 1ns n1 N n
5、置信区间和置信概率
置信区间:估计的总体指标所在的范围。 置信概率:置信区间的可靠性大小。
二、抽样估计的意义
抽样估计——按照随机原则,从全及总体中抽取部分 单位组成样本,对样本进行调查并计算出各种统计指标, 以此对全及指标所在范围进行概率估计的统计方法。4
三、抽样估计的作用
1、用于无限总体或特大总体 如环境污染 、 大气测量 、 含水率等。
• x tx 称为极限抽样误差,是抽样误差的最大限度。
• 例如:若概率度t=2 ,则极限误差为 x 2x ,置信区间为
•
x2x,x2x ,置信概率为95.45%。
10
P (x txXx tx)
•
三、抽样误差的计算
• 误差,以简上称公抽式样中误,差x ,的用计算是x 表抽示样。估理计论的上基:础,x称为抽x 样平n均
x
6
二、样本的分布
1、样本的代表性
①分布越接近于总体的样本代表性越强,然而有些
接近,有些不接近。
②总希望接近总体的样本数量多一些,抽到它们的
概率高一些。
③样本平均数是样本的代表值,研究它的分布规律
是研究样本代表性问题的关践。
①总 体 的 分 布 单位数N 分布未知 均数 X
②样 本 的 分 布 ③样本均数分布
4、抽样误差
统计误差 登记性误差(登记或计算) 代表性误差 (统计值与实际值之差) 系统性误差(偏差 违反随机原则)
(非全面调查) 随机误差 实际误差(某一样本) (不同样本带来) 平均误差(全部样本)
抽样平均误差(抽样误差):由于抽样的随机性而产生的, 样本指标与总体指标之间的平均误差,是所有可能 出现的样本指标的标准差。
• (3)样本平均数的平均数等于总体平均数 X x = X
• (4)样本平均数的标准差为:
• 重置抽样
x
n
•
不重置抽样 x
n
N n N 1
1 n (N1) n 为抽样比
n
N来自百度文库
N
(Nn)
n
8
第三节 总体平均数的抽样估计
•
一、总体均数估计的公式
•
中心极限定理表明,只要n足够大(n>50),样本均数的分布
2、用于破坏性试验 3、用于其它特殊总体 没必要或不可能全面 调查的总体。 4、验证和修正全面调查的结果 如人口普查。
5
第二节 抽样估计的理论基础
对概率论与数理统计知识的简单回顾。
一、正态分布 1、密度函数
数学期望 x
f (x) 1 ex222
2
决定正态分布曲线的位置
标准差σ 决定正态曲线的形状,
•
数理统计证明,样本标准差 s 是总体标准差 σ 的偏误估
•
•
计量,当而n>>1n时n,1ns-1≈n,是s总 体标准,差可σ用的样无本偏标估准计差量。s 代替总体
标准差σ计算。
• • •
重不置重抽置抽样抽样:样误:差 的xx计 算 n x公式N N :n 1 nns n 1 s 1s1 nN nsn
当σ值变小时,中心分布升高,正态曲线趋于集中;
当σ值变大时,中心分布降低,正态曲线趋于平缓。 2、标准正态分布 μ=0 σ=1的正态分布 f (x) 1
x2
e2
t=1 γ=68.27%
2
t=2 γ=95.45%
t=3 γ=99.73%
t=1.96 γ=95%
t=2.58 γ=99%
3、标准化 变量代换 z
• •
•
苦科
第 七
战学 章
能有 陈过 险
抽 样
毅关 阻
估 计
1
第七章 抽样估计
笫一节 抽样估计的意义和作用
•
一、抽样估计的基本概念
•
1、全及总体和样本总体
• 全及总体 被调查研究的事物的全体,母体。
• 样本总体 从全及总体中随机抽取的部分,样本。
• 总体单位 总体单位数 总体总量 N 有限 无限 特大
B42 16
不重置抽样不考虑顺序
不重复组合数
CNn
N! (Nn)!n!
C42 6
重置抽样不考虑顺序 可重复组合数
DNn
(Nn1)! (N1)!n!
D42 10
※ N n固定,则所有可能样本数固定 ◎考虑顺序所有可能样本数>不考虑顺序所有可能样本数 #重置抽样所有可能样本数>不重置抽样所有可能样本数 3
单 单位位数数nC
n N
不太偏 正态分布
均数 均x 数
x X
x
标准差σ 标 标准 准差 差 sx
2、大数定理:只要n充分大,样本的分布一致于总体
的分布,样本均数趋近于总体均数,样本标准差趋近于总
体标准差。
7
3、中心极限定理
• (1)若总体为正态分布,样本均数 x 也服从正态分布。
• (2)总体为任意分布(不太偏),样本均数 x 随着n的增大 而趋近于正态分布。(n≥50)