抽样方法与参数估计.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、几个基本概念 二、概率抽样方式 三、总体分布、样本分布、抽样分布 四、一个总体的抽样分布 五、两个总体的抽样分布
• 统计推断是在对样本数据进行描述的基础上,对总 体的未知数量特征作出以概率形式表述的推断。
统计推断的过程
总体
样 本
样本统计量
例如:样本均 值、比例、方 差
一、几个基本概念
㈠总体、个体、样本
⒉ 不重置抽样
• 又称不重复抽样、无放回抽样,是每次从总体中抽 取一个单位,观察记录后不放回,再抽取下一个。 因此不重复抽样的样本虽由n次连续试验所组成,而 实质等于一次同时从总体中抽n个单位组成一个样本, 每次实验不是相互独立的,在整个抽样过程中每抽 一次总体单位就少一个,各单位被抽中的机会前后 不等,越往后被抽中的机会越大。 • 若不重复抽样也不考虑各单位的顺序,则样本的可 n 能数目为 C N 。 • 在实践中当总体单位数很大,样本单位数相对较小 时,可以把不重复抽样看成重复抽样,这时的计算 比较简单。
•举例说明样本均值抽样分布的形成过程
【例】设一个总体含有4个个体 (总体单位) ,即总体 单 位 数 N=4 。 各 单 位 标 志 值 分 别 为 X1=1 、 X2=2 、 X3=3、X4=4 。总体标志值的分布律为:
X P(X) 1 0.25 2 0.25 3 0.25 4 0.25
P(X)
总体分布
N
总体均值和方差
.3 .2 .1 0 1 2 3 4
X
i 1
i
N
Biblioteka Baidu
1 2 3 4 2.5 4
2 ( X ) i i 1 N
X
N
1.25
样本均值的抽样分布(例题分析)
现从总体中抽取n=2的简单随机样本,在重复抽 样条件下,共有42=16个样本。所有样本的结果为
样 本
㈢抽样分布(sampling distribution)
1.是某一样本统计量的全部可能取值的概率分布。 2.现实中不可能抽出所有样本,因此统计量的抽样 分布实际是一种理论概率分布。统计推断中,常 用的理论概率分布:正态分布、 2分布、t分布 和F分布。 3.是样本统计量的函数。若样本是随机的,则样本 统计量就是随机变量 ,如样本均值,样本比例, 样本方差等为随机变量。 4.结果来自容量相同的所有可能样本。 5.提供了样本统计量稳定的信息,是进行推断的理 论基础,也是抽样推断科学性的重要依据。
二、概率抽样方式
• 抽样方式按是否根据已知概率抽选样本单位 (按抽样的随机性)可分为概率抽样(随机 抽样) 和非概率抽样(非随机抽样)。统计 推断主要是概率推断,下面主要介绍概率抽 样。 ㈠概率抽样(随机抽样)方式主要有:简单随 机抽样,分层抽样,整群抽样,系统抽样, 多阶段抽样。 (如第二章所述) • 本课程主要介绍简单随机抽样条件下统计推 断方法。
㈢总体参数和统计量
• 总体参数是根据总体各单位数据计算的量,又称 全及指标。常用的有总体均值、总体比例(成 数)、总体方差、总体标准差等。 • 统计量是由样本构造出的且随样本变化而变化的 量,又称样本指标或抽样指标,常用的有样本均 值、样本比例(成数)、样本方差、样本标准差 等。 • 在一个总体中,总体参数是一个确定的量,而样 本统计量因样本是随机抽取的可以有多个,因此 统计量的值不是唯一确定的,是个随机变量。
的抽样分布。
16个样本的均值(x)
第一个 观察值
第二个观察值 1 1.0 1.5 2 1.5 2.0 3 2.0 2.5 4 2.5 3.0
第九章
抽样与参数估计
统计推断是统计学研究的重要内容。 抽样是进行统计推断的基础性工作。 参数估计是统计推断的重要内容之一。
本章主要内容
第一节 抽样与抽样分布 第二节 参数估计的一般问题 第三节 一个总体的参数区间估计 第四节 两个总体的参数区间估计 第五节 样本容量的确定
第一节 抽样与抽样分布
抽样分布(sampling distribution)
总体
样 本
计算样本统计 量 例如:样本均 值、比例、方 差
四、一个总体的抽样分布
㈠样本均值的抽样分布 ㈡样本比例的抽样分布 ㈢抽样方差的抽样分布(略)
㈠样本均值的抽样分布
• 性质及特点 1) 是容量相同的所有可能样本的样本均值 的概率分布 2) 是一种理论概率分布 3) 是推断总体均值的理论基础
三、总体分布、样本分布、抽样分布
㈠总体分布(population distribution)
1. 是总体中各元素的观察值所形成的频数或 频率分布 2. 总体分布通常是未知的 3. 可以假定它服从某种分布
总体
㈡样本分布(sample distribution)
1. 是一个样本中各观察值的频数或频率分布 2. 也称经验分布 3. 当样本容量n逐渐增大时,样本分布逐渐接 近总体的分布
㈡重置抽样和不重置抽样
• 从总体抽取样本的方法有重置抽样和不重置抽样两 种。
1.重置抽样
• 又称重复抽样、有放回抽样,是每次从总体中抽取 一个单位,观察记录后又放回,再抽取下一个。因 此重复抽样的样本是由n次相互独立的连续试验所组 成的,每次实验在相同条件下进行,在整个抽样过 程中总体单位数始终不变,各单位被抽中的机会前 后相等。 • 若重置抽样并考虑各单位的排列顺序,则样本的可 能数目为Nn。
所有可能的n = 2 的样本(共16个) 第一个 观察值 1 2 3 4 1 1,1 2,1 3,1 4,1 第二个观察值 2 3 1,2 1,3 2,2 2,3 3,2 4,2 3,3 4,3 4 1,4 2,4 3,4 4,4
样本均值的抽样分布(例题分析)
计算出各样本的均值,如下表。并给出样本均值
• 总体是所要研究的事物或现象的全体,也称全及总 体、母体。 • 个体是组成总体的各个基本单位或元素。 • 样本是从总体中按一定抽样技术抽取的若干个体组 成的集合体,也称抽样总体、子样。
㈡总体容量和样本容量
• 总体容量是总体全部单位总数,用N表示。 • 样本容量是一个样本所包含的单位数,通常用n表 示。根据容量大小样本有大样本和小样本之分,一 般当n<30时为小样本,n≥30时为大样本。
• 统计推断是在对样本数据进行描述的基础上,对总 体的未知数量特征作出以概率形式表述的推断。
统计推断的过程
总体
样 本
样本统计量
例如:样本均 值、比例、方 差
一、几个基本概念
㈠总体、个体、样本
⒉ 不重置抽样
• 又称不重复抽样、无放回抽样,是每次从总体中抽 取一个单位,观察记录后不放回,再抽取下一个。 因此不重复抽样的样本虽由n次连续试验所组成,而 实质等于一次同时从总体中抽n个单位组成一个样本, 每次实验不是相互独立的,在整个抽样过程中每抽 一次总体单位就少一个,各单位被抽中的机会前后 不等,越往后被抽中的机会越大。 • 若不重复抽样也不考虑各单位的顺序,则样本的可 n 能数目为 C N 。 • 在实践中当总体单位数很大,样本单位数相对较小 时,可以把不重复抽样看成重复抽样,这时的计算 比较简单。
•举例说明样本均值抽样分布的形成过程
【例】设一个总体含有4个个体 (总体单位) ,即总体 单 位 数 N=4 。 各 单 位 标 志 值 分 别 为 X1=1 、 X2=2 、 X3=3、X4=4 。总体标志值的分布律为:
X P(X) 1 0.25 2 0.25 3 0.25 4 0.25
P(X)
总体分布
N
总体均值和方差
.3 .2 .1 0 1 2 3 4
X
i 1
i
N
Biblioteka Baidu
1 2 3 4 2.5 4
2 ( X ) i i 1 N
X
N
1.25
样本均值的抽样分布(例题分析)
现从总体中抽取n=2的简单随机样本,在重复抽 样条件下,共有42=16个样本。所有样本的结果为
样 本
㈢抽样分布(sampling distribution)
1.是某一样本统计量的全部可能取值的概率分布。 2.现实中不可能抽出所有样本,因此统计量的抽样 分布实际是一种理论概率分布。统计推断中,常 用的理论概率分布:正态分布、 2分布、t分布 和F分布。 3.是样本统计量的函数。若样本是随机的,则样本 统计量就是随机变量 ,如样本均值,样本比例, 样本方差等为随机变量。 4.结果来自容量相同的所有可能样本。 5.提供了样本统计量稳定的信息,是进行推断的理 论基础,也是抽样推断科学性的重要依据。
二、概率抽样方式
• 抽样方式按是否根据已知概率抽选样本单位 (按抽样的随机性)可分为概率抽样(随机 抽样) 和非概率抽样(非随机抽样)。统计 推断主要是概率推断,下面主要介绍概率抽 样。 ㈠概率抽样(随机抽样)方式主要有:简单随 机抽样,分层抽样,整群抽样,系统抽样, 多阶段抽样。 (如第二章所述) • 本课程主要介绍简单随机抽样条件下统计推 断方法。
㈢总体参数和统计量
• 总体参数是根据总体各单位数据计算的量,又称 全及指标。常用的有总体均值、总体比例(成 数)、总体方差、总体标准差等。 • 统计量是由样本构造出的且随样本变化而变化的 量,又称样本指标或抽样指标,常用的有样本均 值、样本比例(成数)、样本方差、样本标准差 等。 • 在一个总体中,总体参数是一个确定的量,而样 本统计量因样本是随机抽取的可以有多个,因此 统计量的值不是唯一确定的,是个随机变量。
的抽样分布。
16个样本的均值(x)
第一个 观察值
第二个观察值 1 1.0 1.5 2 1.5 2.0 3 2.0 2.5 4 2.5 3.0
第九章
抽样与参数估计
统计推断是统计学研究的重要内容。 抽样是进行统计推断的基础性工作。 参数估计是统计推断的重要内容之一。
本章主要内容
第一节 抽样与抽样分布 第二节 参数估计的一般问题 第三节 一个总体的参数区间估计 第四节 两个总体的参数区间估计 第五节 样本容量的确定
第一节 抽样与抽样分布
抽样分布(sampling distribution)
总体
样 本
计算样本统计 量 例如:样本均 值、比例、方 差
四、一个总体的抽样分布
㈠样本均值的抽样分布 ㈡样本比例的抽样分布 ㈢抽样方差的抽样分布(略)
㈠样本均值的抽样分布
• 性质及特点 1) 是容量相同的所有可能样本的样本均值 的概率分布 2) 是一种理论概率分布 3) 是推断总体均值的理论基础
三、总体分布、样本分布、抽样分布
㈠总体分布(population distribution)
1. 是总体中各元素的观察值所形成的频数或 频率分布 2. 总体分布通常是未知的 3. 可以假定它服从某种分布
总体
㈡样本分布(sample distribution)
1. 是一个样本中各观察值的频数或频率分布 2. 也称经验分布 3. 当样本容量n逐渐增大时,样本分布逐渐接 近总体的分布
㈡重置抽样和不重置抽样
• 从总体抽取样本的方法有重置抽样和不重置抽样两 种。
1.重置抽样
• 又称重复抽样、有放回抽样,是每次从总体中抽取 一个单位,观察记录后又放回,再抽取下一个。因 此重复抽样的样本是由n次相互独立的连续试验所组 成的,每次实验在相同条件下进行,在整个抽样过 程中总体单位数始终不变,各单位被抽中的机会前 后相等。 • 若重置抽样并考虑各单位的排列顺序,则样本的可 能数目为Nn。
所有可能的n = 2 的样本(共16个) 第一个 观察值 1 2 3 4 1 1,1 2,1 3,1 4,1 第二个观察值 2 3 1,2 1,3 2,2 2,3 3,2 4,2 3,3 4,3 4 1,4 2,4 3,4 4,4
样本均值的抽样分布(例题分析)
计算出各样本的均值,如下表。并给出样本均值
• 总体是所要研究的事物或现象的全体,也称全及总 体、母体。 • 个体是组成总体的各个基本单位或元素。 • 样本是从总体中按一定抽样技术抽取的若干个体组 成的集合体,也称抽样总体、子样。
㈡总体容量和样本容量
• 总体容量是总体全部单位总数,用N表示。 • 样本容量是一个样本所包含的单位数,通常用n表 示。根据容量大小样本有大样本和小样本之分,一 般当n<30时为小样本,n≥30时为大样本。