统计学--抽样与抽样分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
特点
能有效地避免主观选样带来的倾向性误差(系统偏差), 使样本资料能够用于估计和推断总体的数量特征,而且 这种估计和推断得以建立在概率论和数理统计的科学理 论之上
可以计算和控制抽样误差,说明估计的可靠程度。
作用:
在不可能或不必要进行全面调查时,利用概率抽样来推 断总体;
利用概率抽样修正或补充全面调查的不足。
样本容量。样本中所包含的个体的数量,一般用n表示。 在实际工作中,人们通常把n≥30的样本称为大样本, 而把n<30的样本称为小样本。
对于某一既定的总体,由于抽样的方式方法不同,样本 容量也可大可小,因而,样本是不确定的、可变的。
抽样的目的就是为要用样本的特征去估计总体特征,但 样本只是总体的一部分,而且样本的抽取又具有随机性, 因此,样本的内部构成与总体的内部构成总是具有一定 的差异,样本不能完全代表总体,抽样估计总是存在一 定的代表性误差。
样本和统计量(续)
统计量(statistic)。在抽样估计中,用来反映样本总 体数量特征的指标称为样本指标,也称为样本统计量或估 计量,是根据样本资料计算的、用以估计或推断相应总体 指标的综合指标。
常见的样本统计量有:
变量总体
属性总体
样本平均数 x
样本比例(样本成数)p
样本标准差s或方差s²
样本比例标准差sP或方差sP²
设x1, x2,… , xn 是相应于样本X1, X2,… , Xn的一个样本值, 则称 g(x1, x2,… , xn ) 是统计量 g(X1, X2,… , Xn) 的一个观测值。
统计量作为一个随机变量,它的分布称为抽样分布。
例2.1 设总体X : N (, 2 ), 其中未知, 2已知,
X1, X 2 ,L , X n是来自总体X的一个样本, 则
X
1 n
n i 1
Xi,
(2)
样本方差:
S2
1 n 1
n i 1
(Xi
X )2
1 n 1
n i 1
Xi2
nX 2
,
(3) 样本标准差: S
S2
1 n 1
n i 1
(Xi
X )2 ,
都是统计量,它们的观测值分别是
x
1 n
n i 1
xi ,
S2
1 n 1
n i 1
( xi
x )2
简单随机抽样
(用Excel对分类数据随机抽样)
总体与样本 抽样方法 抽样框 抽样误差
抽样基本知识
总体和参数
总体(Population),是指所要研究的对象的全体, 它是由所研究范围内具有某种共同性质的全部单 位所组成的集合体。总体单位总数用N表示。
参数(parameter)。用来反映总体数量特征的指 标称。研究目的一经确定,总体也唯一地确定了, 所以总体指标的数值是客观存在的、确定的,但 又是未知的,需要用样本资料去估计。
X1 X 2 ,
1 4
4 i 1
X
i
和
1
2
n i 1
X i2都是统计量;
而
1
n
n
(Xi
i 1
)2
和
1
2
n
(Xi
i 1
)2都不是统计量(因含
有未知参数
) o
设X1, X2,… , Xn是来自总体X 的一个样本。 x1, x2,… , xn是这个样本的一个 样本值。则
(1) 样本均值 :
概率抽样 (probability sampling) (续)
统计上所指的抽样一般都是指概率抽样 概率抽样最基本的组织形式有:简单随机抽样、
分层抽样、等距抽样和整群抽样。
概率抽样
简单随即抽样 分层抽样
等距抽样
整群抽样
简单随机抽样
(simple random sampling)
1. 从总体N个单位(元素)中随机地抽取n个单位作为 样本,使得总体中每一个元素都有相同的机会(概 率)被抽中
样本统计量不含未知参数,它是随样本不同而不同的随机变 量。
样本统计量
一、统计量
随机抽样每次抽取的结果Xi,可能是总体中任何一个个体。 因此可以看成是一个随机变量。n次抽取形成的样本X1, X2,… , Xn可 以看成是一组随机变量。
设X1, X2,… , Xn是来自总体X 的一个样本,g(X1, X2,… , Xn) 是X1, X2,… , Xn的一个函数。若 g 是连续函数,且 g 中不含任何未知参数 ,则称 g(X1, X2,… , Xn) 是一个统计量。统计量也是一个随机变量。
总体和参数(续)
通常所要估计的总体指标有
变量总体
属性总体
总体平均数 X(或记为µ) 总体比例(成数)π
总体标准差σ或方差σ² 总体比例标准差σP或方差σP²
总体标志总量 ( Baidu NhomakorabeaX)
总体中具有某一属性的单位总数 (NP)等。
样本和统计量 样本(Sample),它是从总体中抽取的部分总体单位的 集合体 。
2. 抽取元素的具体方法有重复抽样和不重复抽样 3. 特点
简单、直观,在抽样框完整时,可直接从中抽取样本 用样本统计量对目标量进行估计比较方便
4. 局限性
当N很大时,不易构造抽样框 抽出的单位很分散,给实施调查增加了困难 没有利用其他辅助信息以提高估计的效率
简单随机样本
(simple random sample)
1. 由简单随机抽样形成的样本 2. 从总体N个单位中随机地抽取n个单位作为样本,使
得每一个容量为n样本都有相同的机会(概率)被抽中 3. 参数估计和假设检验所依据的主要是简单随机样本
简单随机抽样
(用Excel对分类数据随机抽样)
【例】某 班级共有 30 名 学 生 , 他们的名 单如右表。 用 Excel 抽 出一个由5 个学生构 成的随机 样本
1 n 1
n i 1
xi 2
nx
2
,
S
1 n 1
n i 1
( xi
x)2 .
抽样方法
概率抽样
(pro概b率ab抽il样ity也s叫am随机pl抽in样g),是指按随机原则抽取样本。
随机原则,就是排除主观意识的干扰,使总体每一个单位都有 一定的概率被抽选为样本单位,每个单位能否入选是随机的。
统计学
抽样与抽样分布
(2016)
抽样与抽样分布
1 抽样基本知识 2 抽样分布 3 样本统计量的抽样分布 (一个总体参数推断时) 4 样本统计量的抽样分布 (两个总体参数推断时)
学习目标
1. 了解概率抽样方法 2. 区分总体分布、样本分布、抽样分布 3. 理解抽样分布与总体分布的关系 4. 掌握单总体参数推断时样本统计量的分布
能有效地避免主观选样带来的倾向性误差(系统偏差), 使样本资料能够用于估计和推断总体的数量特征,而且 这种估计和推断得以建立在概率论和数理统计的科学理 论之上
可以计算和控制抽样误差,说明估计的可靠程度。
作用:
在不可能或不必要进行全面调查时,利用概率抽样来推 断总体;
利用概率抽样修正或补充全面调查的不足。
样本容量。样本中所包含的个体的数量,一般用n表示。 在实际工作中,人们通常把n≥30的样本称为大样本, 而把n<30的样本称为小样本。
对于某一既定的总体,由于抽样的方式方法不同,样本 容量也可大可小,因而,样本是不确定的、可变的。
抽样的目的就是为要用样本的特征去估计总体特征,但 样本只是总体的一部分,而且样本的抽取又具有随机性, 因此,样本的内部构成与总体的内部构成总是具有一定 的差异,样本不能完全代表总体,抽样估计总是存在一 定的代表性误差。
样本和统计量(续)
统计量(statistic)。在抽样估计中,用来反映样本总 体数量特征的指标称为样本指标,也称为样本统计量或估 计量,是根据样本资料计算的、用以估计或推断相应总体 指标的综合指标。
常见的样本统计量有:
变量总体
属性总体
样本平均数 x
样本比例(样本成数)p
样本标准差s或方差s²
样本比例标准差sP或方差sP²
设x1, x2,… , xn 是相应于样本X1, X2,… , Xn的一个样本值, 则称 g(x1, x2,… , xn ) 是统计量 g(X1, X2,… , Xn) 的一个观测值。
统计量作为一个随机变量,它的分布称为抽样分布。
例2.1 设总体X : N (, 2 ), 其中未知, 2已知,
X1, X 2 ,L , X n是来自总体X的一个样本, 则
X
1 n
n i 1
Xi,
(2)
样本方差:
S2
1 n 1
n i 1
(Xi
X )2
1 n 1
n i 1
Xi2
nX 2
,
(3) 样本标准差: S
S2
1 n 1
n i 1
(Xi
X )2 ,
都是统计量,它们的观测值分别是
x
1 n
n i 1
xi ,
S2
1 n 1
n i 1
( xi
x )2
简单随机抽样
(用Excel对分类数据随机抽样)
总体与样本 抽样方法 抽样框 抽样误差
抽样基本知识
总体和参数
总体(Population),是指所要研究的对象的全体, 它是由所研究范围内具有某种共同性质的全部单 位所组成的集合体。总体单位总数用N表示。
参数(parameter)。用来反映总体数量特征的指 标称。研究目的一经确定,总体也唯一地确定了, 所以总体指标的数值是客观存在的、确定的,但 又是未知的,需要用样本资料去估计。
X1 X 2 ,
1 4
4 i 1
X
i
和
1
2
n i 1
X i2都是统计量;
而
1
n
n
(Xi
i 1
)2
和
1
2
n
(Xi
i 1
)2都不是统计量(因含
有未知参数
) o
设X1, X2,… , Xn是来自总体X 的一个样本。 x1, x2,… , xn是这个样本的一个 样本值。则
(1) 样本均值 :
概率抽样 (probability sampling) (续)
统计上所指的抽样一般都是指概率抽样 概率抽样最基本的组织形式有:简单随机抽样、
分层抽样、等距抽样和整群抽样。
概率抽样
简单随即抽样 分层抽样
等距抽样
整群抽样
简单随机抽样
(simple random sampling)
1. 从总体N个单位(元素)中随机地抽取n个单位作为 样本,使得总体中每一个元素都有相同的机会(概 率)被抽中
样本统计量不含未知参数,它是随样本不同而不同的随机变 量。
样本统计量
一、统计量
随机抽样每次抽取的结果Xi,可能是总体中任何一个个体。 因此可以看成是一个随机变量。n次抽取形成的样本X1, X2,… , Xn可 以看成是一组随机变量。
设X1, X2,… , Xn是来自总体X 的一个样本,g(X1, X2,… , Xn) 是X1, X2,… , Xn的一个函数。若 g 是连续函数,且 g 中不含任何未知参数 ,则称 g(X1, X2,… , Xn) 是一个统计量。统计量也是一个随机变量。
总体和参数(续)
通常所要估计的总体指标有
变量总体
属性总体
总体平均数 X(或记为µ) 总体比例(成数)π
总体标准差σ或方差σ² 总体比例标准差σP或方差σP²
总体标志总量 ( Baidu NhomakorabeaX)
总体中具有某一属性的单位总数 (NP)等。
样本和统计量 样本(Sample),它是从总体中抽取的部分总体单位的 集合体 。
2. 抽取元素的具体方法有重复抽样和不重复抽样 3. 特点
简单、直观,在抽样框完整时,可直接从中抽取样本 用样本统计量对目标量进行估计比较方便
4. 局限性
当N很大时,不易构造抽样框 抽出的单位很分散,给实施调查增加了困难 没有利用其他辅助信息以提高估计的效率
简单随机样本
(simple random sample)
1. 由简单随机抽样形成的样本 2. 从总体N个单位中随机地抽取n个单位作为样本,使
得每一个容量为n样本都有相同的机会(概率)被抽中 3. 参数估计和假设检验所依据的主要是简单随机样本
简单随机抽样
(用Excel对分类数据随机抽样)
【例】某 班级共有 30 名 学 生 , 他们的名 单如右表。 用 Excel 抽 出一个由5 个学生构 成的随机 样本
1 n 1
n i 1
xi 2
nx
2
,
S
1 n 1
n i 1
( xi
x)2 .
抽样方法
概率抽样
(pro概b率ab抽il样ity也s叫am随机pl抽in样g),是指按随机原则抽取样本。
随机原则,就是排除主观意识的干扰,使总体每一个单位都有 一定的概率被抽选为样本单位,每个单位能否入选是随机的。
统计学
抽样与抽样分布
(2016)
抽样与抽样分布
1 抽样基本知识 2 抽样分布 3 样本统计量的抽样分布 (一个总体参数推断时) 4 样本统计量的抽样分布 (两个总体参数推断时)
学习目标
1. 了解概率抽样方法 2. 区分总体分布、样本分布、抽样分布 3. 理解抽样分布与总体分布的关系 4. 掌握单总体参数推断时样本统计量的分布