第三章应用数理统计抽样分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.2 随机抽样
二、随机抽样的定义
1. 抽样:从总体中抽取有限个个体对总体进行观 测的过程
2. 样本:从总体中抽取一部分个体,根据获得的 数据对总体分布进行推断,被抽出的部分个 体叫总体的一个样本
3.2 随机抽样
二、随机抽样的定义
在相同的条件下我们对总体X进行n次重复的、都 独立的观测,将n次观测结果按试验的次序记 为X1,X2,…Xn,由于它们是对随机变量X观测 的结果,且每次观测是在相同的条件下独立进 行的,故可以认为X1,X2,…Xn是相互独立的, 且都是与总体X具有相同分布的随机变量。这 样得到的X1,X2,…Xn称为来自总体X的一个简 单随机样本,n称为这个样本的容量。当n次观 测结束后,我们得到一组实数x1,x2,…,xn ,它们依次是随机变量X1,X2,…,Xn的观测值, 称为样本值。
• 一个总体就是一个具有确定概率分布的随机变量 例:对某天生产的产品进行质量检验,以0表示正品,1表示次
品。假设出现次品的概率为p(常数),则总体由0和1组成 ,这一总体对应一个参数为p的(0-1)分布的随机变量,即
我们就将它看作是(0-1)分布总体,即总体中的观测值是 (0-1)分布随机变量的可能取值。
样本均值的抽样分布
样本均值的分布与总体分布的比较
总体分布
.3
.2
.1 0
1
234
= 2.5
σ2 =1.25
.3 P ( x )
抽样分布
.2
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
几个常用的抽样分布
• 正态分布 • 卡方分布 • t分布 • F分布 • 基于正态总体样本的均值与方差的分布
• 实质:一般的规律性表现在大量的事实中。它依靠大 量的观察,使个别的、偶然的差异性相互抵消,显现 出总体的、必然的规律性,揭示了大量随机变量的平 均趋势。
• 证明了抽样平均数将趋近于总体平均数,为抽样分析 提供了科学依据。
样本均值的抽样分布
1. 在重复选取容量为n的样本时,由样本均 值的所有可能取值形成的相对频数分布
•所有可能的n = 2 的样本(共16个)
•第一个
•第二个观察值
•观察值
•1
•2
•3
•4
•1
•1,1
•1,2
•1,3
•1,4
•2
•2,1
•2,2
•2,3
•2,4
•3
•3,1
•3,2
•3,3
•3,4
•4
•4,1
•4,2
•4,3
•4,4
样本均值的抽样分布
计算出各样本的均值,如下表。并给出样本均 值的抽样分布
正态分布
• 密度函数:
正态分布是一个连续分布,形状呈钟型,中心为μ,两边对称 ,两个参数μ和σ2分别表示它的均值与离散程度。
正态分布
X
中心极限定理
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数
学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)
• 统计量也是一个随机变量
3.3 抽样分布
• 最常用的统计量:样本矩
3.3 抽样分布
• 这些统计量的观测值分别为:
抽样分布的形成
(sampling distribution)
总体
计算样本统计
样
量
本
如:样本均值
、比例、方差
、矩
从抽样推断总体的依据
大数定理
• 一般意义:在随机试验过程中,虽然每次观察的结果 不同,但大量重复观察出现的结果的平均值却几乎总 是接近某个确定值。
3.2 随机抽样
二、随机抽样的定义
• 有限总体的简单随机抽样:假设总体容量为 N(有限),样本容量为n(<N),如果所 有容量为n的样本都有相同的概率可以从总 体中被抽取到,则称此方法为有限总体的简 单随机抽样
• 常用做法:利用随机数表
3.2 随机抽样
二、随机抽样的定义
系统抽样,分层抽样和整群抽样-近似随机抽样
一、基本概念
1. 总体:试验的全部可能的观测值 2. 个体:试验的每一个观测值称为个体 3. 总体的容量:总体中所包含的个体数 4. 有限总体和无限总体:总体容量为有限的称
有限总体,否则称为无限总体
3.2 随机抽样
一、基本概念
• 对某个总体而言,个体的取值是按一定规律分布的,即总对应 着一个随机变量X,对总体的研究实际上是对一个随机变量X 的研究
2. 一种理论概率分布
3. 推断总体均值的理论基础
样本均值的抽样分布
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 体的均值、方差及分布如下
总体分布
均值和方差
.3
.2
.1 0
1
ቤተ መጻሕፍቲ ባይዱ
234
样本均值的抽样分布
现从总体中抽取n=2的简单随机样本,在重复抽 样条件下,共有42=16个样本。所有样本的结果为
第三章应用数理统计抽 样分布
2020年7月25日星期六
3.1 抽样
一、抽样的概念 • 如果所获得的数据是研究对象的全部,这组数
据就构成一个总体 • 如果所获得的数据只是这一总体所构成的集合
的某一个子集,它就是一个样本
二、抽样的类别 • 判断性抽样:根据专家意见选择样本 • 随机抽样:概率抽样
3.2 随机抽样
• 系统抽样:按一定原则或规律性进行抽样,如隔n天搜集一 次数据等,适合于数据没有系统性或周期性变化的情况,在 时间和费用上较节约
• 分层抽样:将总体分成许多阶层,每个阶层都是一个团体, 要求做到每个团体内的个体差异较小,而各阶层之间的差异 较大。然后在每个阶层内进行随机抽样,其样本容量可以按 各阶层占总体比例的大小而定
• 整群抽样:总体分组后,从总体中随机抽取n组,这n组个体 组成一个样本
3.2 随机抽样
二、随机抽样的定义
• 一个样本中的每个个体必须取自同一个总体 • 取得任一个体的概率都不影响取得另外一个
个体的概率
3.3 抽样分布
一、统计量
• 设X1,X2,…,Xn是来自总体X的一个样本,g( X1,X2,…Xn)是X1,X2,…,Xn的函数(如均值, 方差),若函数g(X1,X2,…Xn)不含有任何未 知参数,则称g(X1,X2,…Xn)是一个统计量。 如果x1,x2,…,xn是相应于样本X1,X2,…,Xn的样本 值,则称g( x1,x2,…,xn)是统计量g( X1,X2,…Xn)的观测值
•16个样本的均值(x)
•第一个
•第二个观察值
•观察值 •1 •2 •3 •4
•1 •1.0 •1.5 •2.0 •2.5
•2 •1.5 •2.0 •2.5 •3.0
•3 •2.0 •2.5 •3.0 •3.5
•4 •2.5 •3.0 •3.5 •4.0
P(x) 0.3
0.2
0.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
x
中心极限定理
x 的分布趋 于正态分布 的过程
抽样分布与总体分布的关系
总体分布
正态分布 正态分布
非正态分布
大样本
小样本
正态分布 非正态分布
图3.2.1
图3.2.2
图3.2.3
图3.2.4
图3.2.5
图3.2.6
几种分布的特征一览
分布 随机变量 样本空间 参数
均值
标准正态
Z
无
0
n
n
t
n
0
F
n1,n2
方差 1 2n
形状 对称 右偏 对称 右偏
基于正态总体样本的均值与方差的分布
基于正态总体样本的均值与方差的分布
样本比例的抽样分布
• 重复抽样下样本比例的抽样分布 • 不重复抽样下样本比例的抽样分布 由样本均值的抽样分布性质类推得出。见书表3.2.1
=10
n= 4
n =16
= 50 X
总体分布
x
抽样分布
中心极限定理
中心极限定理:设从均值为,方差为 2的一个任意总
体中抽取容量为n的样本,当n充分大时,样本均值的抽 样分布近似服从均值为μ、方差为σ2/n的正态分布
一个任意分 布的总体
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布