第五章 抽样与抽样分布
抽样与抽样分布
抽样与抽样分布在统计学中,抽样是一种常用的数据收集方法,通过从总体中选择一部分样本来进行研究和分析。
抽样的目的是通过样本来推断总体的特征和性质。
在进行抽样时,我们需要了解抽样的方法和抽样分布的概念。
一、抽样方法1. 无偏抽样无偏抽样是指所有样本有相同被选中的机会。
这样可以确保样本的代表性,从而减小样本估计值和总体真值之间的误差。
常见的无偏抽样方法包括简单随机抽样、系统抽样和分层抽样等。
2. 有偏抽样有偏抽样是指样本的选择并不具有相等的机会。
这样可能导致样本的代表性不足,从而产生较大的估计误差。
有时,有偏抽样也可以用于特定的研究目的,但需要明确地说明和分析偏差带来的影响。
二、抽样分布1. 抽样分布的概念抽样分布是指统计量在各个可能样本上的取值分布。
统计量可以是样本均值、样本方差等。
抽样分布的性质对于进行统计推断和假设检验非常重要。
2. 样本均值的抽样分布样本均值的抽样分布在中心极限定理的条件下近似服从正态分布。
中心极限定理指出,当样本容量足够大时,无论总体分布如何,样本均值的抽样分布都会接近正态分布。
3. 样本比例的抽样分布样本比例的抽样分布在满足一些条件的情况下也近似服从正态分布。
这些条件包括样本容量足够大、总体比例接近0.5以及样本与总体之间的独立性等。
4. 样本方差的抽样分布样本方差的抽样分布不服从正态分布。
通常情况下,样本方差的抽样分布呈右偏态,即偏度大于0。
为了得到样本方差的抽样分布,可以使用抽样分布的近似分布,如卡方分布。
三、应用案例抽样与抽样分布的方法和理论在实际统计学中有广泛的应用。
以下是一些常见的应用案例:1. 调查研究在进行调查研究时,我们经常需要从总体中选择一部分样本进行问卷调查或面访。
通过利用抽样与抽样分布的方法,我们可以将样本的调查结果推广到总体中,从而得到总体的特征和性质。
2. 假设检验假设检验是统计学中常用的推断方法之一。
通过比较样本统计量与假设的总体参数值,我们可以判断假设的合理性。
统计学之抽样与抽样分布
的抽样分布
统计推断的过程
• 总体均值
m=?
• 从总体中抽取 • 样本容量为 n 的样本
• 用 作为m 的点估计
• 计算样本平均值
的抽样分布
的抽样分布是指所有可能的样本平均值 的概率分 布
的期望值
E( ) = = 总体平均值
的抽样分布
的标准差
•
有限总体
无限总体
• 当 n/N < .05时,可以将一个有限总体看作是无限
统计学之抽样与抽样分 布
2020年4月29日星期三
Chapter 7
抽样和抽样分布
本章主要内容
简单随机抽样 点估计 抽样分布 样本平均值 的抽样分布 样本比例 的抽样分布 抽样方法
•n = 100
•n = 30
统计推断
统计推断的目的是利用样本的信息推断总体的信息 总体是指感兴趣的所有元素的集合 样本是总体的一个子集 通过样本统计量对总体参数进行估计 只要抽样方法恰当,通过样本统计量可以对总体参数 进行很好的估计
也就是说,样本平均值在总体平均值+/-10分范围内的 概率为0.5036
•面积 = 2(.2518) = .5036
• 的抽样分布
•980 •990•1000
的抽样分布
的抽样分布是指所有可能的样本比例 的概率分布 的期望值
p = 总体比例
的抽样分布
的标准差 有限总体
无限总体
• 也称为样本比例的标准误
总体
•
称为有限总体校正因子.
• 也称为样本均值的标准误
的抽样分布
中心极限定理:只要样本容量足够大 (n > 30),不管总 体服从什么分布,样本平均值 都可以认为近似服从 正态分布。
抽样与抽样分布(试题及答案)
第五章抽样与抽样分布一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。
)1.抽样推断的主要目的是( )。
A.用统计量来推算总体参数B.对调查单位作深入研究C.计算和控制抽样误差D.广泛运用数学方法[答案] A[解析] 抽样调查是指从总体中按随机原则抽取部分单位作为样本,进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法,因此,抽样推断的主要目的是用已知的统计量来推算未知的总体参数。
2.抽样调查中,无法消除的误差是( )。
A.抽样误差B.责任心误差C.登记误差D.系统性误差[答案] A[解析] 抽样误差是指在遵循了随机原则的条件下,不包括登记误差和系统性误差在内的,用样本指标代表总体指标而产生的不可避免的误差。
3.在其他条件相同的情况下,重复抽样的抽样平均误差和不重复抽样相比,( )。
A.前者一定小于后者B.前者一定大于后者C.两者相等D.前者可能大于,也可能小于后者[答案] B[解析] 以抽样平均数的抽样平均误差为例进行说明:在重复抽样条件下,抽样平均数的平均误差的计算公式:;在不重复抽样条件下,抽样平均数的平均误差的计算公式:。
因为,故。
4.拟分别对甲、乙两个地区大学毕业生在试用期的工薪收入进行抽样调查。
据估计甲地区大学毕业生试用期月工薪的方差要比乙区高出一倍。
在样本量和抽样方法相同的情况下,甲区的抽样误差要比乙区高( )。
A.41.4% B.42.4% C.46.8% D.48.8%[答案] A[解析] 假设乙地区的大学毕业生试用期月工薪的方差为σ2,甲地区的大学毕业生试用期月工薪的方差为2σ2,则:,那么,在样本量和抽样方法相同的,情况下,甲区的抽样误差要比乙区高=41.4%。
5.对某天生产的2000件电子元件的耐用时间进行全面检测,又抽取5%进行抽样复测,资料如表5-1所示。
表5-1耐用时间(小时) 全面检测(支) 抽样复测(支)3000以下3000~4000 4000~5000 50600990230505000以上总计36020018100规定耐用时间在3000小时以下为不合格品,则该电子元件合格率的抽样平均误差为( )。
曾五一 应用统计学 第5章
(
)
(
)
2
P =
n1 n
σ 2 ( P ) = P( 1 − P )
二、样本容量与样本个数 1.样本容量。样本集合的大小称为样本容量, 一般用n表示。一般地,样本容量大于30的样 本称为大样本,不超过30的样本称为小样本。 2.样本个数。样本个数又称样本可能数目,它 是指从一个总体中可能抽取多少种样本。样本 个数的多少与抽样方法有关。
Xi = ∑ X ij
j =1 M
M 样本平均是: X=
i =1 j =1
(i = 1,2,L, r )
∑ ∑ X ij rM
r M
= i =1
∑Xi r
r
群间方差是: 2 ∑ (µ i − µ ) 2 δ = R 或者由样本数据估计: −X δ2 r 由于整群抽样都采用不重复抽样的方法,所以样本平均数的标准差是:
四、抽样组织的设计 1.简单随机抽样是基本抽样组织方式 2.类型抽样与整群抽样比较 (1)减小类型抽样中样本平均数标准差的 办法。 (2)减小整群抽样的样本平均数标准差的 办法。
第四节 大数定理与中心极限定理
大数定理:独立同分布的随机变量 X1,X2,…,Xn,…,设它们的平均数 为 µ ,方差为 σ 2 ,即, E ( X i ) = X , σ 2 ( X i ) = σ 2 ,(i=1,2,…)。则对任意的 正数 ε,有: 1 n lim p ∑ X i − µ < ε = 1 n→∞ n i =1
解:样本平均数(平均每次加油量) X = 用样本组间方差代替总体组间方差:
i =1
∑ Xi r
r
=
330 = 33 (公斤) 10
δ2
∑ (X =
第五章抽样与抽样估计
❖ 本章内容:抽样与抽样估计是推 断统计学中最基本的内容。学习本 章了解抽样调查中的基本概念;掌 握样本平均数、样本比例的抽样分 布;掌握抽样估计的基本方法;了 解其他抽样组织方式及其特点。重 点是总体均值、总体比例的区间估 计方法。
2021/3/3
第五章抽样与抽样估计
1
第五章 抽样与抽样估计
2021/3/3
第五章抽样与抽样估计
8
二、常用的抽样方法
❖ 1、简单随机抽样
❖ 其中又可以分为重复抽样和不重复抽样。
❖ (1)重复抽样:又称重置抽样,是指从总 体中抽出一个样本单位,记录其标志值后, 又将其放回总体中继续参加下一轮单位的抽 取。特点是:第一,n个单位的样本是由n次 试验的结果构成的。第二,每次试验是独立 的,即其试验的结果与前次、后次的结果无 关。
2021/3/3
第五章抽样与抽样估计
3
1总体与总体参数
构成总体的个别事物(基本单元)就是总 体单位,也称个体。总体单位的总数称为 总体容量,记作N。
❖ (2)总体参数:抽ห้องสมุดไป่ตู้估计中用来反映总体数量特 征的指标。研究目的确定后,总体确定,总体参 数存在但未知,需要估计。
❖ A、变量总体中各单位可以直接用数量表示,设 各单位变量值为:X1, X2,… XN,则总体参数 有均值,标准差或方差以及总体标志总量,即
各单位不能用数量之间表示,但可以计
算计算总体成数,如前面所学P=N1/ N, Q=N0/N,P+Q=1,则总体参数有均值, 标准差或方差以及具有某一属性的单位
总数,即:
__
X P
P(1P),NP
2021/3/3
第五章抽样与抽样估计
抽样与样本抽样分布
抽样与样本抽样分布抽样是统计学中常用的一种方法,通过从总体中选择一部分个体进行观察和测量,然后根据所得的样本数据来做出对总体的推断和判断。
在抽样的过程中,我们常常会遇到样本抽样分布,它是指当样本容量充分大时,样本统计量的分布情况。
本文将介绍抽样的概念和样本抽样分布的特点。
一、抽样的概念抽样是指从总体中选取一部分个体进行观察和测量,以便推断总体的特征。
在统计学中,总体是指我们所关心的全部个体或事物的集合,而抽样则是从总体中选择的一部分个体,这些个体被称为样本。
抽样的目的是为了在实际调查中减少资源和时间成本,同时能够保证所选样本的代表性和可靠性。
二、样本抽样分布的特点当样本容量充分大时,样本统计量的分布会呈现出一定的规律,这就是样本抽样分布的特点。
样本抽样分布可以用来推断总体参数的概率分布,其中较为常见的是均值和比例的抽样分布。
1. 均值的抽样分布在正态分布的总体中,当样本容量充分大时,样本均值的分布将近似服从正态分布。
这一规律被称为中心极限定理。
具体而言,当总体近似为正态分布时,样本均值的抽样分布也将近似为正态分布。
而当总体不服从正态分布时,样本容量足够大时,样本均值的抽样分布仍然近似服从正态分布,这是由于大样本均值的分布对总体分布的偏离具有一定的抵消作用。
2. 比例的抽样分布对于二分类总体而言,比例的抽样分布可以用二项分布进行描述。
当总体中两个分类的比例已知时,可以通过二项分布来计算样本比例的抽样分布。
当总体比例未知时,可以使用样本比例的点估计和抽样分布来对总体比例进行推断。
在样本容量充分大时,样本比例的抽样分布将近似服从正态分布,这是由于根据中心极限定理,二项分布在大样本下趋近于正态分布。
三、样本抽样分布的应用样本抽样分布是统计学中重要的理论基础,对各个领域的研究和实践具有广泛的应用价值。
以下介绍几个常见的应用场景。
1. 参数估计在进行统计推断时,我们常常需要对总体参数进行估计。
通过样本抽样分布,我们可以对总体参数进行点估计或区间估计,并借助抽样误差进行可靠性评估。
第5章抽样调查及参数估计(练习题)
第五章抽样调查及参数估计5.1 抽样与抽样分布5.2 参数估计的基本方法5.3 总体均值的区间估计5.4 总体比例的区间估计5.5 样本容量的确定一、简答题1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计?2.什么是抽样误差,影响抽样误差的主要因素有哪些?3.简述概率抽样的五种方式二、填空题1.抽样推断是在随机抽样的基础上,利用样本资料计算样本指标,并据以推算总体数量特征的一种统计分析方法。
2.从全部总体单位中随机抽选样本单位的方法有两种,即重复抽样和不重复抽样。
3.常用的抽样组织形式有简单随机抽样、类型抽样、等距抽样、整群抽样等四种。
4.影响抽样误差大小的因素有总体各单位标志值的差异程度、抽样单位数的多少、抽样方法和抽样调查的组织形式。
5.总体参数区间估计必须具备估计值、概率保证程度或概率度、抽样极限误差等三个要素。
6.从总体单位数为N的总体中抽取容量为n的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。
7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。
8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。
三、选择题1.抽样调查需要遵守的基本原则是( B )。
A.准确性原则 B.随机性原则 C.代表性原则 D.可靠性原则2.抽样调查的主要目的是( A )。
A.用样本指标推断总体指标 B.用总体指标推断样本指标C.弥补普查资料的不足 D.节约经费开支3.抽样平均误差反映了样本指标与总体指标之间的( B )。
A.实际误差 B.实际误差的平均数C.可能的误差范围 D.实际的误差范围4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D )。
A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。
黄良文《统计学》课后习题(抽样分布与抽样方法)【圣才出品】
N
5
(2)重复抽样的两两样本的平均数如表 5-1 所示。
表 5-1 两两样本的平均数
单位:元
样本值
140
160
180
200
220
140
140
150
160
170
180
160
150
160
170
180
190
180
160
170
180
190
200
200
170
180
190
200
210
220
180
190
200
210
(2)由(1)可得:
P(X a) P( X 40 a 40) 1 ( a 40) 0.05
2
2
2
即
( a 40) 0.95 2
则 a 40 1.645 ,解得:a=43.29。 2
1/8
圣才电子书 十万种考研考证电子书、题库视频学习平台
5.3 设 X~t(n),写出它的密度函数以及均值和方差。 解:t(n)的密度函数为:
220
由表 5-1 可知,样本均值的分布如表 5-2 所示。
表 5-2 样本均值的分布
样本均值 X (元)Fra bibliotek频数概率
140
1
1/25
150
2
2/25
160
3
3/25
170
4
4/25
3/8
圣才电子书
180
十万种考研考证电子书、题库视频学习平台
5
1/5
190
4
4/25
200
量 n=36 的样本。(1)求样本均值 X 的抽样分布;(2)如果 P( X a) 0.05 ,求 a 的值。
第五章 抽样
Page 18
二、系统抽样(又称机械抽样) 系统抽样的具体步骤是: (1)确定开始抽取人选的位置 (2)计算抽样间距。抽样距离是由总体大小和样 本大小决定的,假设总体所含个体数为N,样本所 含个体数为n,则抽样间距应为K=N/n。 (4)确定抽取元素的方法
Page 19
系统抽样实例 某地区有零售店110户,采用系统抽样方法抽取11户进行 调查。 第一步:将总体调查对象进行编号,即从1号到110号; 第二步:确定抽样距离。调查总体N=110户,所需样本 数n=11户,所以,抽样距离K=10户; 第三步:确定起抽号数。随机地从1-10中抽取一个数作 为抽号; 第四步:确定被抽取单位。从起抽号开始,按照抽样距 离选取样本如果随机抽取了2为起抽号,那么: 2 2+10=12 2+10*2=22 等等 即所抽的样本为编号是2,12,22,32,一直到102共11个 零售店。
Page 17
答案:
(1)确定选出的随机数的位数:由于总体人数为900, 在使用随机数表时,需要有3位数的随机数才能保证所有 人都有被选中的机会; (2)决定从5位数种选择哪几位数字:要从随机数表中从 左到右选取3位数字, (3)确定在表中选择数字的顺序:自下而上选取随机数。 (4)确定开始选择的5位数组起点 (5)处理大于总体规模或重复的随机数
2、“街头拦人”
Page 10
二、配额抽样 配额抽样,是根据某些参数值,确定不同总体类 别中的样本配额比例,然后按比例在各类别中进 行方便抽样。 配额抽样示例
年龄 所得 ¥10,000以 下 ¥10,101以 上 合计 34岁以下 21% 12% 33% 35岁以上 27% 40% 67% 合计 48% 52% 100%
概率与统计中的随机抽样与抽样分布知识点
概率与统计中的随机抽样与抽样分布知识点概率与统计是数学中重要的分支之一,它研究了随机事件和随机现象的规律。
在概率与统计的领域中,随机抽样与抽样分布是基础而重要的概念。
在本文中,我们将深入探讨随机抽样与抽样分布的相关知识点,包括其定义、性质以及在实际应用中的重要性。
1. 随机抽样的定义与性质随机抽样是指从整体中以一定的概率选择出一部分样本的过程,以便对整体的某些特征进行推断。
随机抽样应具备以下几个基本性质:a. 独立性:每个样本在抽取过程中的选中与否应该是彼此独立的,不受前一个样本的影响。
b. 随机性:每个样本在被选中的概率应该是相等且随机的,确保对整体进行推断时具有普遍性。
c. 大样本量:所抽取的样本数量足够大,可以保证对整体的推断具有较高的精确度。
2. 抽样分布的定义与性质抽样分布是指针对不同样本规模的抽样所得到的某个统计量的分布。
常见的抽样分布包括正态分布、t分布和F分布等。
a. 正态分布:当样本量趋于无穷大时,根据中心极限定理,样本均值的分布逼近于正态分布。
正态分布在统计分析中经常应用,具备对称性和稳定性等特点,受到广泛的关注和应用。
b. t分布:在样本量较小的情况下,当总体近似于正态分布时,使用t分布来进行推断更加准确。
t分布相较于正态分布而言,具有更宽的尾部,样本量较小时可提供更精确的结果。
c. F分布:F分布是一种比值分布,常用于方差分析以及回归分析等。
它是基于正态分布的样本方差比值构成的。
3. 随机抽样与抽样分布在实际应用中的重要性随机抽样与抽样分布在各个领域的实际应用中具有重要意义,例如:a. 市场调研:通过随机抽样方式,可以从总体中选取一部分样本进行调查和数据收集。
然后通过对样本数据的分析,可以推断总体市场的特征、趋势以及用户行为等。
b. 医学研究:在进行药物疗效试验时,需要通过随机抽样的方式从患者中选取一部分进行试验。
通过对试验结果的分析,可以推断药物的疗效以及副作用等情况。
《统计学原理》第5章:抽样推断
n
抽样推断的基本原理
统计推断的理论基础—样本的概率分布
按一定方法随机抽取样本时,所有可能样本的 特征值及其所对应的概率分布情况
学生 A B C D E F G 成绩 30 40 50 60 70 80 90
按随机原则考虑顺序重复抽样抽选出4名学生。
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示.
考虑顺序的不重复抽样 考虑顺序的重复抽样
M N! (N n)!
M Nn
不考虑顺序的不重复抽样 不考虑顺序的重复抽样
M N! n!(N n)!
全及指标与样本指标
•根据全及总体中各单位的标志值或标志属性计算得 来,反映总体某种特征的指标 •根据样本总体中各单位的标志值或标志属性计算得 来的综合指标.
抽样推断的一般问题
抽样方法
•重复抽样和不重复抽样
•考虑顺序的抽样和不考虑顺序的抽样
抽样推断的一般问题
抽样方法—重复抽样
从总体N个单位中随机抽取一个容量为n的样本,每 次抽取一个单位,把结果登记后再放回到总体中,重新 参加下一次的抽取.
抽出个体
登记特征
放回总体
继续抽取
抽样推断的一般问题
抽样方法—不重复抽样
从总体N个单位中随机抽取一个容量为n的样本, 每次抽取一个单位,把结果登记后不再放回到 总体参加下一次的抽取.
抽出 个体
登记 特征
继续 抽取
抽样推断的一般问题
抽样方法—考虑顺序的抽样
从总体N个单位中抽取n个单位构成样本,不但考虑样本 各单位成分的不同,而且还要考虑样本各单位的中选顺 序.
抽样与抽样分布
抽样与抽样分布抽样是统计学中一种重要的数据收集方法,通过从总体中选择一部分样本来代表整体,可以更方便、更经济地进行数据分析和推断。
而抽样分布则是与抽样密切相关的概念,指的是样本统计量的概率分布。
本文将从抽样的定义和目的、抽样方法和抽样分布的性质等方面进行探讨。
一、抽样的定义和目的抽样是统计学中利用一定的方法和技术从总体中选取一部分个体作为样本,以了解总体特征或者对总体进行推断的过程。
抽样的目的在于通过对样本的观测和研究来推断总体的特征,而无需对整个总体进行调查。
抽样可以减少调查或实验的成本、节约时间,并且在一定程度上能够保证结果的可靠性和精确度。
二、抽样方法1. 简单随机抽样:简单随机抽样是指从总体中随机选择样本,使每一个样本都有相同的概率被选中。
简单随机抽样通常需要使用随机数表、随机数发生器或者抽签等方法来实现。
2. 系统抽样:系统抽样是按照一定的规则和系统性地从总体中选择样本,例如每隔一个固定的间隔选取一个样本。
系统抽样的优点在于操作简单,但是如果总体中存在某种周期性或者规律性的分布,可能会导致抽样结果的偏差。
3. 整群抽样:整群抽样是将总体根据某些特征进行分类,然后从每个分类中随机选择一定数量的群体作为样本。
整群抽样适用于总体中存在明显的群体结构的情况,可以提高样本的代表性。
4. 分层抽样:分层抽样是按照某种特征将总体分为若干层,然后从每一层中随机选择一定数量的样本。
分层抽样可以更好地体现总体的结构和差异,提高样本的代表性和准确性。
三、抽样分布的性质抽样分布是样本统计量的概率分布,其具有以下几个重要性质:1. 无偏性:如果样本统计量的期望值等于总体参数的真值,那么称该统计量是无偏的。
即样本统计量是对总体参数的无偏估计。
无偏性是抽样分布的重要性质,保证了样本统计量的可靠性和准确性。
2. 一致性:当样本数量趋向无穷大时,样本统计量的值趋向于总体参数的真值。
即样本统计量在大样本情况下能够接近总体参数,具有一致性。
统计学之抽样与抽样分布
正确答案: d. n/N > 0.05
8. 从一个均匀分布的总体中抽取一个样本容量为45的样本, 从什么分布?
a. 指数分布 b. 正态分布 c. 均匀分布 d. 无法判断
正确答案: b. 正态分布
考察所有900个申请者
• 考试成绩
• 总体平均成绩
xi 990
900
• 总体标准差
(xi )2 80 900
考察所有900个申请者
• 无相同工作经验的申请者比例
• 总体比例
p 648 .72 900
使用随机数表随机选择30个申请者作为样本进行研 究,从书上随机数表第三列开始
统计学之抽样与抽样分 布
2021年7月19日星期一
Chapter 7
抽样和抽样分布
本章主要内容
简单随机抽样 点估计 抽样分布
样本平均值x 的抽样分布 样本比例 p 的抽样分布
抽样方法
n = 100
n = 30
统计推断
统计推断的目的是利用样本的信息推断总体的信息 总体是指感兴趣的所有元素的集合 样本是总体的一个子集 通过样本统计量对总体参数进行估计 只要抽样方法恰当,通过样本统计量可以对总体参 数进行很好的估计
点估计
• x 作为 的点估计值 x xi 29,910 997
30 30
• s 作为 的点估计值
s
(xi x )2 163,996 75.2
29
29
• p 作为p 的点估计值
p 20 30 .68
值得注意的是,不同的随机数会导致不同的抽样,也就会 数的不同的点估计值
黄良文《统计学》(第2版)笔记和课后习题(含考研真题)详解 第5章 抽样分布与抽样方法 【圣才出品
②性质
(s 1) s (s)
(n 1) n!
(2) 2 (n) 分布的密度函数和主要性质
① 2 (n) 分布的密度函数
f
(x)
2n/2
1 (n
/
2)
x
n 2
1e
x
2,x
0
0,
x 0
②主要性质
a.如果 X~ 2 (n) ,则 E(X)=n,Var (X)=2n; b.如果 X1~ 2 (n) ,X2~ 2 (n) 且相互独立,则 X1+X2~ 2 (n1 n2 ) 。
其特点是:①n 个单位的样本由 n 次抽取的结果构成;②每次抽取的结果不是独立的。 ③虽然在同次试验中每个单位被抽取到的概率相同,但在不同次的试验中被抽取到的概率是 不相等的。
如果考虑顺序,其总样本个数为 PNn N ! (N n)!。如果不考虑顺序,总样本个数为 CNn N !/[(N n)!n!] ,每个样本被抽取到的概率都为1/ CNn 1 (N n)!n / N ! 。
i
类子总体的均值和方差分别为
i
,
2 i
。那么,样本均值
样本均值的数学期望
E(
X
)
。样本均值的方差(抽样标准误差)
2 X
k i 1
(
ni n
)2
2 Xi
①重置抽样
②不重置抽样
或
(2)整群抽样 整群抽样就是将总体的所有单位分成若干群,然后从其中随机抽取部分群,接着对中选 的群进行全面调查的抽样方式。 设总体的全部 N 个单位被划分为 R 群,每群都含有 M 个单位。现在从总体的所有 R
Dn
max
1k n
Xk
min 1k n
抽样与抽样分布
N (1.0 2.5) 2 (4.0 2.5) 2 2 0.625 16 n
比较及结论:1. 样本均值的均值(数学期望) 等于总体均值 2. 样本均值的方差等于总体方差的1/n
样本均值的分布与总体分布的比较 (例题分析)
总体分布
.3 P(X)
抽样分布
.3 .2 .1 0
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。总 体的均值、方差及分布如下 总体分布
.3
均值和方差
x
i 1
N
i
.2 .1 0
1 2 3 4
N
N i 1
2.5
2
2 ( x ) i
抽样中的泰坦尼克事件
在1936年美国总统选举前一份颇有名气的 杂志的工作人员做了一次民意调查, 调查兰 顿(当时任堪萨斯州州长)和罗斯福(当时总 统)中谁将担任下一界总统, 为了了解公众意 向, 调查者通过电话簿和车辆登记簿上的名 单给一大批人发了调查表, 通过分析回收的 调查表, 发现兰顿非常受欢迎,于是此杂志预 测兰顿将在选举中获胜.
系统抽样(systematic sampling)
将总体各单位按某种顺序排列,并按某种规则确 定一个随机起点,然后,每隔一定的间隔抽取一 个单位,直至抽取n个单位形成一个样本。
整群抽样(cluster sampling)
在总体中以群(或组)为单位,将简单或系统抽 样方式,抽取若干群(或)组,然后对所有抽中 的各群(或各组)中的全部单位一一进行调查。
1. t 分布是对称分布,均值为0。 2. 样本容量大于或等于30时, t 分布接近于标准正态分布,这时可 用标准正态分布来代替t 分布。 3. t 分布是一个分布族,不同自由度对应不同的 t 分布。 4. 与标准正态分布相比,t 分布的中心部分较低,两个尾部较高。 5. 变量t 的取值范围在 与 之间。
抽样和抽样分布培训课件(PPT 49张)
0.07 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989
7
自有限总体的抽样
• 无放回抽样:一个元素一旦选入样本,就从总体中剔除, 不能再次被选入。 • 放回抽样:一个元素一旦选入样本,仍被放回总体中。
先前被选入的元素可能再次被选,并且在样本中可出现
多次(多于一次)。
8
自无限总体的抽样
• 无限总体经常被定义为一个持续进行的过程,总体的元 素由在相同条件下过程无限运行下去产生的每一项构成。 在这种情况下,对总体内所有项排列是不可能的。
14
点估计
样本均值 51814.00美元 样本标准差
3347.72美元
样本比率 0.63
点估计的 统计过程
15
由30名管理人员组成的简单随机样本的点估计值
16
由30名管理人员组成的500个简单随机样本的点估计值
17
由30名管理人员组成的500个简单随机样本的抽样分布
• 抽样分布:样本统计量所有可能值构成的概率分布。
0.04 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.9988
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 n lim P X i 1 n n i 1
定律表明:只要随机变量独立同分布,即 使不存在有限方差,其数学期望仍可由n 个随机变量的算术平均值作为其近似值。
6
end
二、中心极限定理
在统计学中,论证随机变量和的极限分 布是正态分布的一系列定理统称为中心 极限定理(central limit theorem)。
26
end
根据样本抽选的方法不同,可分为:
随机起点系统抽样
· · · · · ·
(总体单位按某一标志排序)
半距起点系统抽样
· · · · · ·
(总体单位按某一标志排序)
对称起点系统抽样
· · · · · ·
(总体单位按某一标志排序)
27
end
系统抽样的好处: 1. 可以使抽样过程大大简化,减轻抽 样的工作量; 2. 如果用有关标志排队,还可以缩小 抽样误差,提高抽样推断效果。 按有关标志排队系统抽样,实际上是 一种特殊的分层抽样。
仅适用于规模不大、内部各单位标志值差异 较小的总体
23
end
二、分层抽样
先将总体按某一标志分层,然后从各 层中按随机原则抽取样本单位组成样本。
实质上是分组法与随机原则的结合。 例如,在居民生活水平调查中,先按职业 分类,然后每种职业分别随机抽取部分居 民进行调查。
24
end
样本在各层间的分配方法:
10
end
一、分位数
设X为随机变量,对给定的概率(1>>0), 若实数F满足不等式
P{ X F }
则称F为随机变量X分布概率为的上侧分 位数。 若实数T/2满足不等式 P{| X | T 2 } 则称T/2为随机变量X分布概率为的双侧 分位数。
11
end
标准正态分布的上侧分位数
8
end
棣莫佛—拉普拉斯中心极限定理
定理表明,当n很大,np和n(1-p) (n 是试验的次数,p是试验中事件A发生 的概率)也都不太小时,二项分布可以 用正态分布去近似。
9
end
第三节 由正态分布导出的几个重要分布
由样本统计量对未知总体分布进行 推断,必须知道统计量所服从的分布。 本节介绍几个重要的常用统计量分 布:2分布,t分布, F分布。
37
end
四、样本方差的分布
1. 在重复选取容量为 n 的样本时,由样本方 差的所有可能取值形成的概率分布
2. 对于来自正态总体的简单随机样本,则比 值 ( n 1) s 2
2
的抽样分布服从自由度为 (n-1) 的 2 分布, 2 即 ( n 1) s 2
2
~ ( n 1)
南昌航空大学
1
end
第五章 抽样与抽样分布 第一节 统计量 第二节 大数定律与中心极限定理 第三节 由正态分布导出的几个重 要分布 第四节 常用的抽样方法 第五节 抽样分布
2
end
第一节 统计量
统计量(statistic):描述样本特征的 概括性数字度量,根据样本数据计算的一 个随机变量,是对总体分布特征推断的 工具。
一、抽样分布概念 样本统计量取值的概率分布,叫抽样 分布(sampling distribution)。 是推断统计中用样本推断总体时的重 要理论依据。
31
end
二、样本均值的分布
1. 在重复选取容量为n的样本时,由样本均 值的所有可能取值形成的概率分布
2. 推断总体均值的理论基础
32
end
总体服从正态分布 N(μ,σ2) ,该总体的任何容 量的样本均值 x 也服从正态分布, x 的期望 值为μ,方差为σ2/n。即x ~N(μ,σ2/n)
28
end
四、整群抽样
将总体全部单位分为若干“群”,然后以群 作为抽样单位,从总体中抽取若干群作为样 本,并对中选群的所有单位进行全面调查。 例:总体群数R=16
A E I M B F J N C G K O D H L P
样本群数r=4 样本容量
D P I H
n nd n p ni nh
对总体未作任何处理,按随机原则直接从总 体中抽出若干单位构成样本. 抽取样本的具体方法: 直接抽选法 抽签法:将总体中每个单位的编号写在外形完全 一致的签上,将其搅拌均匀,从中任意抽选, 签上的号码所对应的单位就是样本单位。 随机数表法:将总体中每个单位编上号码,然 后使用随机数表,查出所要抽取的调查单位。
设X1, X2, …Xn为总体X的样本,如果 样本的函数g(X1, X2, …Xn)是一个随机 变量,并且不包含任何未知参数,则 称g(X1, X2, …Xn)为统计量。
3
end
几个常用的统计量:
n 1 1. 样本均值: X X i n i 1
n 1 2 2. 样本方差: S 2 (Xi X ) n 1 i 1
X m F Y n
服从自由度m和n的F分布,记为
F ~ F ( m , n)
20
end
不同自由度的F分布
(1,10)
(5,10) (10,10)
F
右偏分布
21
end
第四节 常用的抽样方法
通常有以下几种抽样方法: 简单随机抽样 分层抽样 系统抽样 整群抽样 多阶段抽样
22
end
一、简单随机抽样
end
t分布的性质:
(1)与正态分布一样,是对称的,但比正 态分布要平一些。 (2)自由度充分大时,t分布近似于正态分 布。自由度趋向无穷大时,t分布就是标准 正态分布。
(3)t分布的均值为0,其方差为n/(n-2)。
19
end
F-分布 (F(n), 且X与Y相互独立, 则称
3.样本标准差:
S
1 2 ( X X ) i n 1 i 1
4
end
n
第二节
大数定律与中心极限定理
一、大数定律
大数定律(laws of large numbers) 也称大数法则,它是阐述大量同类随机现 象的平均结果稳定性的规律。
5
end
辛钦大数定理
设随机变量X1, X2, …Xn相互独立,服 从同一分布,且具有数学期望 EXi=(i=1,2,…n) 则对任意0,有
38
end
=10
x 5
n=4
x 2.5
n =16
= 50
总体分布
X
x 50
抽样分布
x
33
end
从均值为,方差为2的一个任意总体中抽取 容量为n的样本,当n(30)充分大时,样本均 值的抽样分布近似服从均值为μ、方差为σ2/n 的正态分布
任意 分布 的总 体
x n
2
14
end
不同自由度的2-分布
n=1 n=4 n=10
2
15
end
2-分布性质和特点
1. 变量值始终为正 2. 通常为不对称的右偏分布,随着自由度的 增大逐渐趋于对称 3.期望E(2)=n,方差D(2)=2n(n为自由度) 4. 可加性:若 U 和 V 为两个独立的 2 分布随机 变量,U~2(n1),V~2(n2), 则U+V服从自由度为n1+n2的2分布
0
Z
Z
12
end
标准正态分布的双侧分位数
/ 2
-Z/2
0
/ 2
Z/2
Z
13
end
2-分布 (2-distribution)
设 X1 , X2 , ……Xn 是取自标准正态总 体的样本 ,则随机变量
X
2 i 1
n
2 i
服从具有n个自由度的2分布,记为
~ ( n)
7
end
X
i 1
独立同分布中心极限定理 设X1, X2, …Xn是独立同分布的随机变量序 列,且存在有限的数学期望EXi=和方 差DXi=2 (i=1,2,…n) ,那么当n时 n,
i
~ N ( n , n ) 或X ~ N ( ,
2
2
n)
中心极限定理为均值的抽样推断奠定了理论 基础。不论总体服从何种分布,只要期 望和方差存在,对这一总体进行重复抽 样,当样本量充分大,样本均值就趋于 正态分布。
简单、方便,能节省人力、物力、财 力和时间,但其样本代表性可能较差
29
end
五、多阶段抽样 某公司要进行全国性的产品售后服务满意度 调查时,通常是先抽几个省,然后从抽中的 省中抽取若干个城市,从抽中的城市中,再 抽取若干个县、村,最后再抽到户,这种抽 样方式就是多阶段抽样。
30
end
第五节 抽样分布
等比例分配法:按各层单位的比例分配样 本单位。
类型抽样的优点: 能提高样本的代表性; 组织起来较为方便;
25
end
三、系统抽样
先将总体各单位按某一标志排队,然后按固 定的顺序和间隔抽取样本单位。又称机械抽 样或等距抽样。
系统抽样是不重复抽样,适合于对单位数不 多且能进行排序的总体抽样。 排序和所研究标志数值大小无关。 按无关标 志排队 如调查居民生活水平时,按姓氏笔 划排队。 按有关标 排序和所研究标志数值大小有密切 志排队 关系。如居民收入调查,按银行存 款多少排序。
n0 p n
n1 或 1 p n
36
end
样本比例的分布
1. 在重复选取容量为n的样本时,由样本比 例的所有可能取值形成的概率分布 2. 当样本容量很大时(np≥5和 n(1p)≥5) ,样本比例的抽样分布可用正态分 布近似,即 3.
(1 ) p ~ N , n
样本均值 的抽样分 布趋于正 态分布