第2章-总体特征数的点估计与区间估计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

总体特征数的点估计与区间估计 第 2 章 总体特征数的点估计与区间估计 本章先介绍抽样的基本概念,然后介绍几个重要统计量如样本平均数、样本 本章先介绍抽样的基本概念,然后介绍几个重要统计量如样本平均数、 如样本平均数 方差、样本比率的抽样分布。然后介绍这些总体特征数的点估计与区间估计 这些总体特征数的 方差、样本比率的抽样分布。然后介绍这些总体特征数的点估计与区间估计 方法。这些研究方法都是在分析经济数据中常常用到的、基本的分析方法 分析方法。 方法。这些研究方法都是在分析经济数据中常常用到的、基本的分析方法。 2.1 抽样的基本概念 的优点是对研究对象的每一个个体都进行调查、 研究对象的每一个个体都进行调查 观测。 观测。 全面调查 普查) (普查) 的优点是对研究对象的每一个个体都进行调查、 缺点是要花费大量的时间,人力,物力和财力。 缺点是要花费大量的时间,人力,物力和财力。 抽样调查观测 观测的 是总体的一小部分, 所以抽样调查的优点是节省资金、 抽样调查观测的只是总体的一小部分, 所以抽样调查的优点是节省资金、 节省时间。对于无限总体则只能通过抽样的方式进行调查 无限总体则只能通过抽样的方式进行调查。 节省时间。对于无限总体则只能通过抽样的方式进行调查。对于只有用破坏 性实验才能取得数据的总体也只能采取抽样调查因为抽样调查只调查总体的 性实验才能取得数据的总体也只能采取抽样调查因为抽样调查只调查总体的 一小部分,所以抽样调查的缺点是存在抽样误差 抽样调查的缺点是存在抽样误差。 一小部分,所以抽样调查的缺点是存在抽样误差。 取得样本的过程叫统计抽样,简称抽样。样本存在两重性。 (1) 取得样本的过程叫统计抽样,简称抽样。样本存在两重性。 )样本特 ( 征在某种程度上反映了总体特征。 ) 样本又不能完全精确地反映总体特征 征在某种程度上反映了总体特征。 2) ( 样本又不能完全精确地反映总体特征。 要想让样本最大限度地反映总体特征,就必须从两个方面努力。 要想让样本最大限度地反映总体特征,就必须从两个方面努力。一是抽样方 样本如何对总体的特征做出科学的推断。 如何对总体的特征做出科学的推断 法。二是统计推断,即利用样本如何对总体的特征做出科学的推断。 二是统计推断,
随机数表 1620 92027 03883 64933 38452 37867 01929 59611 72417 11900 87365 20673 72438 18148 99805 55835 2125 24670 94648 66279 87890 07936 18163 32249 60514 46743 58959 37800 01174 81386 10419 38835 2630 36665 89428 80432 94624 98710 69201 90466 69257 27860 53731 63835 42159 80431 76939 59399 3135 00770 41583 65793 69721 98539 31211 33216 12489 77940 89295 71051 11392 90628 25993 13790
0.4 chi(3) distri. 0.0 0 1 2 3 4 5 6 7 8 T=15 T=4
2.2.2 统计量 W =
(n 1) s 2
σ
2
的抽样分布
是相互独立且都 分布的 定理 1:若 U1,U2,…,Un 是相互独立且都是服从 N(0, 1)分布的随机变量 : , 分布 U1 + U2 +… +
总体特征数的点估计与区间估计 第 2 章 总体特征数的点估计与区间估计
张晓峒
(2009-8) ) 南开大学数量经济研究所所长 研究所所长、 南开大学数量经济研究所所长、博士生导师 nkeviews@yahoo.com.cn http://202.113.23.180:7050(南开大学→经济学院→数量经济研究所) (南开大学→经济学院→数量经济研究所)
n 总体框 < 0.05,则先建立总体框,利用抽签或随机数表连续抽取 n 个个体就 ,则先建立总体 N
可近似看作为一个简单随机样本。 可近似看作为一个简单随机样本。
表 2-1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 15 13284 21224 99052 00199 60578 91240 94758 35249 38980 10750 36247 70994 99638 72055 24038 610 16834 00370 47887 50993 06483 18132 14229 38646 46600 52745 27850 66986 94702 15774 65541 1115 74151 30420 81085 98603 28733 17441 12063 34475 11759 38749 73958 99744 11463 43857 85788
2.2 几种统计量的抽样分布 统计量: 称作统计量。 统计量:样本 {x1 ,x2,…, x n} 的函数 f (x1, x2, …, xn) 称作统计量。 2.2.1 样本平均数 x 的抽样分布
1 若样本用{x 表示, 计算公式是 若样本用 1 ,x2,…, x n}表示,已知样本平均数 x 的计算公式是 x = 表示 n
2 2
Un2
=
∑U i 2 χ2(n)
i =1
n
(2-5) )
分布。 分布。可见, 服从χ2(n)分布。当 n = 1 时,Ui2 服从 1 个自由度的χ2 分布。可见,χ2 分布统计 分布 量具有可加性。 量具有可加性。 的样本。 推论 2:设{x1, x2, …, xn}是取自正态总体 xi ( , σ 2 ) 的样本。则 : 是取自正态总体
∑ ( xi x ) 2
W=
i =1
n
σ
2
=
(n 1wenku.baidu.com s 2
σ
2
χ2(n-1)
(2-7) )
1 n 表示样本方差。 其中 s = ∑ ( xi x ) 2 表示样本方差。 n 1 i =1
2
2.2.3 统计量 t =
x s/ n
的抽样分布
的样本。 推论 4:设 {x1, x2, …, xn} 是取自正态总体 xi N ( , σ 2 ) 的样本。根据推论 2 : t=
)
2.2.1 样本平均数 x 的抽样分布 2.已知总体不服从正态分布 .已知总体不服从正态分布 中心极限定理:如果一个随机变量的均值是 中心极限定理:如果一个随机变量的均值是 E(xi),方差是 Var(xi) =σ2,则随着 , 样本容量 n 的增大, 的增大, 样本平均数 x 的抽样分布渐近服从均值为, 的抽样分布渐近服从均值为 方差为 σ2/n) ( ) 渐近服从 的正态分布。 的正态分布。 总体不服从正态分布的条件下,实际中当 不服从正态分布的条件下 在总体不服从正态分布的条件下,实际中当样本容量 n ≥ 30 时,依据中心极限 定理可以认为, 定理可以认为,样本平均数 x 近似服从正态分布 N(, Z=
x s/ n
t(n-1)
(2-10) )
1 n 分布。 表示样本标准差。 服从 n-1 个自由度的 t 分布。其中 s = ∑ ( xi x ) 2 表示样本标准差。 n 1 i =1
推论 5:设 {x1, x2, …, xn1 }和{y1, y2, …, yn2 }是分别取自总体 xi N(1 , σ 2 ), : 和 是分别取自总体 , yi N(2, σ2 ) 的样本且相互独立,则 的样本且相互独立, t=
资料来源:摘自《应用统计学》 于九如等编译,天津科技翻译出版公司, ,于九如等编译 资料来源:摘自《应用统计学》 于九如等编译,天津科技翻译出版公司,1991,第 , , 439 页表 C-8。 。
其他抽样方法还包括: 其他抽样方法还包括: (1)分层抽样。 2)整群抽样。 3)系统抽样。 )分层抽样。 )整群抽样。 )系统抽样。 ( (
∑ xi ) = n 2 ∑ Var( xi ) = n 2 ∑
1 1
i =1 i =1 i =1
2
σ σ2 =
2
n
2
(2-2) )
σ2
n
1.已知总体服从正态分布 N ( , σ ),均值为,方差为σ 。 x N( , .已知总体服从正态分布 , 进一步标准化 标准化, 当 n →∞时, x → 。把 x 进一步标准化, x U= N(0, 1) σ/ n 表示统计量 标准正态分布 正态分布。 其中 N(0, 1)表示统计量 U 服从均值为 0,方差为 1 的标准正态分布。 表示 ,
随机向量的一次取值对总体 最具有代表性呢? 怎样才能保证这 n 维随机向量的一次取值对总体 X 最具有代表性呢? 对于无限总体, 保证如下两点。 对于无限总体,应保证如下两点。(1) n 个随机变量与总体 X 有相同的概率分 保证每个个体有同等机会被抽中(等可能性) 随机变量之间应 之间应是 布,即保证每个个体有同等机会被抽中(等可能性) (2) 随机变量之间应是 。 相互独立的。对于无限总体也可以采用连续观测的方式获得样本。 相互独立的。对于无限总体也可以采用连续观测的方式获得样本。 简单随机抽样分有放回抽样 无放回抽样。但一般采取无放回抽样。 有放回抽样和 简单随机抽样分有放回抽样和无放回抽样。但一般采取无放回抽样。这种抽 样的特点是每个个体被抽中的概率是不同的,但每个样本作为随机变量的一 样的特点是每个个体被抽中的概率是不同的,但每个样本作为随机变量的一 组合被抽中的概率是相同的。 个组合被抽中的概率是相同的。 对于有限总体, 对于有限总体,要保证有限总体中每个可能的样本组合都有相等的概率 被抽中。这种抽样方法称作简单随机抽样 简单随机抽样。 简单随机抽样得到的样本 得到的样本, 被抽中。这种抽样方法称作简单随机抽样。用简单随机抽样得到的样本,称 简单随机样本,本书简称 样本。 简称为 作简单随机样本,本书简称为样本。 实践中怎样保证得到简单随机样本呢? 实践中怎样保证得到简单随机样本呢?只要样本容量 n 与总体容量 N 的 比值
2.2.4 统计量 F 的抽样分布 相互独立, 定理 3:若 xi χ2(n1),yi χ2(n2), 且 xi 与 yi 相互独立,则统计量 : , F=
x i / n1 F(n1, n2) yi / n2
(2-13) )
分布。 服从第 1 自由度为 n1,第 2 自由度为 n2 的 F 分布。 推论 7:设{x1, x2, …, xn1} 和 {y1, y2, …, yn2}分别取自两个相互独立的正态总体 : 分别取自两个相互独立的正态总体 N(1, σ12),N(2, σ2 2) 的样本,则统计量 的样本, , F=
∑ xi ,
i =1
n
表示样本容量, 表示样本观测值, 其中 n 表示样本容量,xi 表示样本观测值,则样本平均数 x 的期望与方差分别是
1 E( x ) = E( n

i =1
n
1 xi ) = n
n

i =1
n
1 E( xi ) = n
n
∑ =
i =1
n
(2-1) )
n
1 Var ( x ) = Var ( n
( x y ) ( 1 2 ) ( n1 1) s1 + (n 2 1) s 2 n1 + n 2 2
2 2
t(n1+ n2 –2)
(2-11) )
1 1 + n1 n 2
服从 n1+ n2–2 个自由度的 t 分布。 分布。 其中 s12, 22 分别是这两个样本{x1, x2, …, xn} s 分别是这两个样本 的样本方差。 的样本容量。 和 {y1, y2, …, yn}的样本方差。n1、n2 分别表示总体 xi 和 yi 的样本容量。 的样本方差
x
σ2
n
) 。把 x 标准化为 Z, 标准化为 ,
σ/ n
分布。 N(0, 1) , Z 渐近服从 N(0, 1)分布。 分布
2.4 2.0 1.6 1.2 T=200
总体中抽样, 从χ2(3)总体中抽样,随着样本容量加大, 0.8 总体中抽样 随着样本容量加大, T=4, 15, 200,样本平均数的分布越来 , 越近似正态分布。 越近似正态分布。 File:central-limit-1 : File: 5 central1 。 :
相关文档
最新文档