第五章 抽样理论解析
抽样理论及其在统计学中的应用
抽样理论及其在统计学中的应用统计学是一门利用数学方法研究群体现象的学科。
为了更好地研究群体现象,我们需要对群体进行抽样调查。
抽样理论是判断整个群体特征的基础,也是实现精确统计的重要手段之一。
本文将介绍抽样理论的定义、分类、适用范围,以及在统计学中的应用。
一、抽样理论的定义和分类抽样理论是一种通过取样调查的结果来推断总体情况的方法。
简单来说,就是采用部分代表整体的方法,对群体的特征进行研究。
在抽样调查中,样本要求代表总体,这就需要抽样时采用一定的方法来避免样本偏差,以便保证群体的特征可以被准确地反映出来。
抽样理论可以根据抽样方法的不同,分为概率抽样和非概率抽样两种。
其中,概率抽样是指每个单位有等概率被选中的抽样方法,包括简单随机抽样、系统抽样、分层抽样和整群抽样等。
非概率抽样则是指在抽样时每个单位被选中的概率不等的抽样方法,包括方便抽样、判断抽样和双重抽样等。
根据样本集合的大小和形成方式,抽样调查可分为全面调查、定额调查和随机调查。
其中,全面调查指对调查对象全部进行调查;定额调查是在总体大小不明确的情况下,按照一定比例对总体进行抽样调查;随机调查则是指以随机的方法,对总体中的一部分进行抽样调查。
二、抽样理论的适用范围抽样理论适用于群体现象的调查与研究。
不管是经济、政治、社会、文化等各个领域,都需要运用抽样方法进行调查。
比如市场调查,为了了解顾客的需求,企业就需要对顾客进行抽样调查。
在政府决策中,也需要对社会进行抽样调查,以了解社会各个方面的情况,为政府决策提供依据。
抽样理论是群体调查的基础,只有保证了样本的代表性和准确性,才能得出让人信服的结果。
三、抽样理论在统计学中的应用抽样理论在统计学中有着非常重要的应用。
首先在数据分析中,样本的取得对分析结果至关重要。
随机抽样可以在保证样本的代表性的同时,避免人为因素对样本的影响,保证数据的可比性和可靠性。
其次,在假设检验和置信判断等方面,抽样理论也被广泛应用。
大众传播学研究方法导论第二版课件第五章抽样
第三节 概率抽样
一、简单随机抽样 ·所有随机抽样方法中最简单的一种方法 ·按照随机的原则从调查总体中不加任何分类、排序、分组 等先行工作,直接从总体中逐个抽取若干单位组成研究样本。 ①无放回的简单随机抽样 ②非常简单随机抽样 ·概率抽样是不是等概率抽样?
第三节 概率抽样
一、简单随机抽样 ·简单随机抽样的方法 1、抽签法 2、随机数表法 3、计算机模拟法 4、使用统计软件直接抽取
第一节 抽样的基本概念
五、样本规模
样本规模是指抽样单位数,在随机抽样时必须确定必要的样本数 -样本数过多,浪费人力、物力、财力和时间 -样本数过少,会影响调查结果的精确度,造成较大的误差
影响样本规模的因素
(一)对精确性的要求 ·我们经常用置信度(confidence level,也叫置信水平)来 估计抽样误差。 ·一般有90%、95%、99%置信水平 ·社会科学研究通常把置信水平定为95%
①部分是含于整体之中 ②部分与整体具有相同的特征、规律、相互关系及变化过程 ③部分能够为研究者提供一个有关整体状态、态度、意见和行 为更佳清晰的脉络
4、抽样的目的:获得具有代表性的样本。
第一节 抽样的基本概念
二、抽样的基本概念
(一)总体和元素
1、总体:总体是研究中所涉及的所有个体的集合,它可以是一群人,一批文件, 一些事件或观念 2、元素:构成总体的每一个个体就是元素
第三节 概率抽样
三、分层抽样
3、在实际操作中,使用分层随机抽样应注意以下几点: (1)分层的标志必须可以把总体分割为相互排斥的层次,而层次不能 交叉重叠 (2)各层之间差异大,但层内差异小 (3)各层单位数目和比例必须能够获得 (4)分层的层次数量不宜太多
分层抽样与配额抽样
社会研究方法,讲义第五章 抽样
第五章抽样第一节抽样的概念与程序一、为什么要抽样在社会研究中,研究者经常从一个规模很大的研究对象中,选出一部分作为研究对象,这个选取过程就是抽样。
之所以要进行抽样,主要是考虑研究成本和研究的可行性。
首先,在社会研究中,经费是一项硬约束,多增加一个研究对象,就意味着多花一份钱,故研究者无法超出预算,对过多的对象逐一进行研究;其次,对于一些太大的总体,如对全国十几亿人口中的成年人逐个进行问卷调查也不现实。
不过,被抽出的少数对象与全体对象毕竟不是一回事,因此,无论怎样精致的抽样设计,都会产生抽样误差,于是抽样得到的少数对象的情况,就不一定完全符合全体对象的情况。
也就是说,抽样方法大体可分为两类:一种是非概率抽样,主要是依据研究者的主观意愿、判断或是否方便等因素来选取对象;另一种是概率抽样,主要是按照随机原则来选取对象,完全不带有研究者的主观因素。
二、抽样的有关术语抽样是一门专业化技术,涉及许多专门的概念和术语,这里介绍抽样中常用的概念与术语。
1.总体、样本和元素如果用专业术语严格定义,则抽样是指从总体中按定方式选取一组元素的过程,由此产生的元素集合称为样本。
也就是说,在抽样的专业化表述中,每一个具体的调查对象被标为元素,全体研究对象被称为总体,样本则代表一组元素,即一部分研究对象,它可以是人、学校、组织,也可以是文章、杂志,甚至是歌曲。
但不管样本由什么构成,它必须是从总体中抽取的,换句话说,样本不能独立于总体而存在。
总体还可以进一步划分为研究总体和目标总体,其中,研究总体是在理论上明确界定的元素的集合体。
例如,在有关妇女生育率的研究中,“妇女”这个概念所代表的总体,只有被界定为15~49岁有生育能力的妇女后,才成为可用于研究的总体。
样本中元素个数与总体中元素个数的比率,即样本规模与总体规模的比率称为抽样比率。
例如,在一个5万人的总体中,研究者想要抽取150人,这时抽样比率就是150/50000=0.003或0.3%;如果总体为500人,而研究者要抽取100人,则抽样比率就是100/500=0.20或20%。
5 抽样课件内容
第五章抽样【本章内容要点】·抽样的意义与原则·概率抽样的基本原理·抽样的一般程序与设计原则·抽样的方法·样本规模与抽样误差【本章重点】·概率抽样方法·样本规模的确定【本章教学内容】第一节抽样的意义与作用一、抽样的基本概念(一)总体和样本1、总体总体是具有某种共同性质或特征的许多元素所组成的集合。
·属性总体·变量总体2、元素构成总体的每一个成员,它是收集信息的基本单位。
3、样本从总体中按一定方式抽取出来的一部元素所组成的集合。
·样本容量·样本可能数(二)抽样、抽样单位和抽样框1、抽样从调查总体中,按一定方式选择或抽取一部分元素组成样本的过程。
2、抽样单位一次直接的抽样所使用的基本单位。
3、抽样框(抽样结构)对可以选择作为样本的总体元素列出名册或排序编号,以确定总体的抽样范围和结构。
(三)参数值和统计值1、参数值(总体参数)参数值是关于总体中某一变量的综合描述。
【变量总体的参数值】【算术平均数】【简单算术平均数】【例】现有5 位老人的月退休金分别为:783 元、896 元、984 元、1 295元、1 137元,求这五位老人的平均月退休金。
【加权算术平均数】()X μ→或总体集中趋势2σσ→和总体离散趋势=总体标志总量算术平均数总体单位总量121...1n n i i xx x x x x n n n=+++===∑∑783896984129511375095101955x x n ++++====∑解:(元)11221121......ni in ni nnii x fxf x f x f x f x f f f ff==+++===+++∑∑∑∑【例】某地区100户居民按月水电费支出分组的资料如下表所示,求该地区100户居民的平均月水电费支出。
某地区100户居民月水电费支出情况统计表解: 某地区100户居民平均月水电费支出计算表【例】某班男、女生(各12人)上学期统计学考试成绩分别为: 女生:72、76、77、78、80、81、81、84、84、85、87、87; 男生:50、63、63、70、74、82、88、95、95、97、97、98。
数学中的抽样理论
数学中的抽样理论抽样是统计学中的一项重要技术,它允许我们通过对一小部分个体或事件进行研究来推断全体的特征。
抽样理论是关于如何设计和分析样本调查的一门学科,它提供了一些重要的原理和方法。
在本文中,我们将介绍数学中的抽样理论的基本概念和应用。
一、抽样的基本原则抽样理论的基本原则是随机性和代表性。
随机性是指样本选择过程中每个个体或事件都有同等的机会被选中。
代表性是指样本应该能够准确地反映全体的特征。
这两个原则确保了样本能够具有统计推断的可靠性和有效性。
二、简单随机抽样简单随机抽样是最常用的抽样方法之一,它是指从总体中以随机的方式选择样本。
这种抽样方法可以保证每个个体或事件被选中的概率相等,因此具有代表性。
在简单随机抽样中,每个个体或事件都是独立选择的,样本之间没有关联。
三、分层抽样分层抽样是一种将总体划分为几个层次,并从每个层次中进行随机抽取的方法。
这种抽样方法可以更好地保证样本的代表性,尤其是当总体具有多个特征时。
通过在每个层次中进行抽样,可以保证每个特征的代表性。
四、系统抽样系统抽样是一种按照固定的间隔选择样本的方法。
例如,在一个有100个个体的总体中,我们可以每隔10个个体选择一个样本。
这种抽样方法虽然简单易行,但要注意选择的起点应该是随机的,否则会导致样本选择的偏差。
五、整群抽样整群抽样是一种将总体划分为若干个群体,然后随机选择部分群体进行抽样的方法。
这种抽样方法适用于总体中的群体具有相似特征的情况。
通过抽取部分群体,并对每个群体内的个体进行全面调查,可以节省调查的成本和时间。
六、抽样误差抽样误差是由于样本调查引入的估计误差。
由于抽样仅涉及部分个体或事件,因此估计结果与总体的真实值之间存在差异。
抽样误差的大小取决于样本的大小和抽样方法的选择。
在进行抽样调查时,我们应该控制抽样误差在可接受的范围内。
抽样理论在统计学和实证研究中扮演着重要的角色。
通过合理地选择抽样方法,我们可以从有限的样本中获取对总体特征的准确估计。
复习资料第五章抽样.doc
第五章抽样第一节抽样的概念与程序抽样方法是选择研究对象的方法或程序。
一、为什么要抽样在社会研究中,研究者经常从一个规模很大的研究对象中,选出一部分作为研究对象,这个选取过程就是抽样。
进行抽样的原因:考虑研究成本和研究可行性二、抽样的有关术语1、总体、样本和元素每一个具体的调查对象被称为元素;全体研究对象被称为总体;样本则代表一组元素,即部分研究对象,不能独立于总体而存在。
总体可以进一步划分为研究总体和目标总体。
研究总体是在理论上明确界定的元素的集合体;目标总体有时也称为调查总体,是实际抽取样本的元素集合体,它是排除了研究总体中一些特例后的总体。
样本中元素个数与总体中元素个数的比率,即样本规模与总体规模的比率称为抽样比率。
如在总体为500人中抽取100人进行研究,则抽样比例为100/500=20%o2、抽样框和抽样单元研究者在实际抽样(特别是概论抽样)时,经常是先找到一份近似涵盖所有总体元素的名单, 然后从中抽取部分元素,这份名单被称为抽样框。
如要调查某大学本科毕业生的就业状况, 则抽样框就是该大学全体毕业生的花名册。
抽样框中的总体元素又被称为抽样单元。
有时抽样单元与分析单位是相同的,但在较大范围的抽样中,可能有多个层次的抽样单元。
3、参数值、统计值和抽样误差总体的情况或特征是未知的,由参数值来描述,如某个城市中吸烟人口的平均年龄;样本的情况或特征则是已知的,由统计值来描述,如通过样本调查资料统计所得的被调查者的平均年龄。
参数值与统计值之间的差异就是抽样误差。
差异越大,抽样误差就越大;差异越小,抽样误差就越小。
抽样误差是衡量样本代表性大小的标准,一般说来,它主要取决于总体的异质性程度和样本规模。
❶如果样本规模相同,总体异质性程度越高,抽样误差越大,样本代表性越低;❷如果总体异质性程度相同,样本规模越大,抽样误差越小,样本代表性越高。
注意:抽样中因违反抽样规则产生的人为误差,如抄写、资料录入和计算中的人为失误,并不是抽样误差。
抽样技术(第5版)课件PPT课件第5章
会正比与医院床位的数量,采用等概简单估计量
可能会有大的方差。
其次,自加权的等概率样本可能难于管理。可能
仅仅为了调查一两个病人就需要去一家医院,并
且合理分配调查人员的工作负担也是比较困难的。
第三,调查成本在调查开始的时候是未知的---一个40个医院的样本可能包括了主要的大的医院,
四个n=1的可能的不等概抽样
样本
Zi
yi
[A]
1/16
11
176
15375
[B]
2/16
20
160
19600
[C]
3/16
24
128
29584
[D]
10/16
245
392
8464
第二节 放回不等概抽样
=
= 300
总是无偏估计量,因为
第二节 放回不等概抽样
二 有放回不等概抽样
对于放回不等概抽样,对总体总量的估计是汉森
-赫维茨(Hansen-hurwitz)估计
YˆHH
n
yi M 0
1
n i 1 z i
n
n
yi
i 1 mi
例如:估计超市销售额,
m:员工人数
解释公式意义
第二节 放回不等概抽样
Y
1 N
ˆ
V (YHH ) Z i ( i Y ) 2
可能样本见下表
1 1
,
4
= ,所有的
样本
[A]
1/4
11
44
65536
[B]
1/4
社会研究方法——第五章 抽样课件
社会研究方法代码:03350讲师:欣欣老师第三节 概率抽样03第四节 样本规模04第五章 抽样第一节 抽样的概念与程序01第二节 非概率抽样02第一节 抽样的概念与程序P86. 抽样的理论基础是:数理统计学。
研究者从一个规模很大的研究对象中,选出一部分作为研究对象,这个选取过程叫做:抽样。
抽样方法分为两类:非概率抽样,不科学,主观性强,无法估算误差,出错几率大,无法推论全体。
概率抽样,科学,不带主观因素,能精确估算误差,出错概率小,可以推论总体。
二、抽样的有关术语P87.1.总体、样本、元素(1)总体:全体研究对象(2)元素:每一个具体的调查对象(3)样本:调查的对象加总。
例子:广州市高中生的学习情况。
总体:高中生元素:小明样本:小明、小李、小红2.抽样框和抽样单元P88抽样框:研究者先找到一份近似涵盖所有总体元素的名单,从中抽取部分元素, 这份名单被称为抽样框。
如,调查某大学毕业生就业情况,抽样框就是全体毕业生的花名册。
3.参数值、统计值和抽样误差P89参数值:总体情况,未知的。
统计值:样本的情况,已知的。
抽样误差:参数值与统计值之间的差异,衡量样本代表性大小的标准。
例子:参数值:某城市中吸烟人口的平均年龄(未知)统计值:通过对样本调查资料的统计所得到的被调查吸烟者的平均年龄(已知)抽样误差=参数值-统计值P90.抽样的步骤:①设计抽样方案;②抽取样本;③评估样本。
一、设计抽样方案,包括:(多选、论述题、应用题)①界定总体,即对抽样总体的范围和特征加以明确说明。
②介绍抽样框的具体内容,即给目标总体下一个操作化定义。
③确定样本所含个体数目,即样本规模的大小。
④根据不同的目标总体,选择合适的抽样方法。
二、抽取样本抽样人员按照抽样方案中选定的抽样方法,从抽样框中实际抽取总体元素,构成样本。
三、评估样本样本抽出后,对样本的代表性和各类误差情况的检验和评估,以防止由于样本偏差过大而导致对总体推断的失败。
抽样理论和抽样方法的研究
抽样理论和抽样方法的研究1. 引言在现代社会的各个领域中,数据的收集与分析已经成为了必不可少的工作内容。
为了能够更加准确地收集数据并进行统计分析,抽样理论和抽样方法这一研究方向得到了越来越广泛的关注。
因此,本文将从抽样理论和抽样方法这两个方面进行深入研究。
2. 抽样理论2.1 抽样的概念抽样是指在总体中,按规定的方式从中选取一个部分来进行研究,并且在对部分数据进行分析后,再以此来对总体作出评价和判断。
抽样理论是对抽样行为进行研究的学科,主要涉及到以下几个方面:单纯随机抽样、比率估计、方差分析等。
2.2 抽样误差在进行抽样时,难免会出现一定的抽样误差。
抽样误差又分为抽样偏差和抽样波动。
抽样偏差是指由于样本与总体之间的差异,导致样本研究结果与总体真实情况有所偏差;而抽样波动则是指同样的样本可能得到不同的研究结果,导致研究结论的不确定性。
2.3 抽样分布在进行样本研究时,需要对样本数据进行统计分析。
此时我们需要了解抽样分布这一概念。
抽样分布是指对于不同的样本大小,对相同总体的多次抽样所得到的样本统计量的取值分布情况。
抽样分布的相关知识对于我们理解抽样方法的工作原理和进行统计推断都具有重要作用。
3. 抽样方法3.1 单纯随机抽样单纯随机抽样是指在总体中所有个体出现的概率相等的情况下,每个个体都有被选取为样本的机会。
这种抽样方法的特点是能够保证样本与总体之间的差异较小,从而可靠地反映总体的情况。
3.2 分层抽样分层抽样是指将总体按照某种特定的方式分为若干层,然后从每一层中单纯随机地抽取一定数量的样本。
这种抽样方法的特点是能够充分利用总体的分层结构信息,在减小样本差异的同时,还能够精确地描述总体各层之间的差异。
3.3 系统抽样系统抽样是指按照事先规定的一定抽样比例,从总体中随机选取一个起始点,然后按照一定的跨度依次选取样本。
这种方法的特点是简单易行,但如果抽样的起始点不够随机,就有可能造成数据的偏差。
3.4 无替换抽样无替换抽样是指在一个样本中,任何一个个体只能被选取一次。
抽样分布与抽样误差PPT(51张)
按无关标志排队,其抽样效果相当于简单随机抽样; 按有关标志排队,其抽样效果相当于类型抽样。
4·整群抽样(集团抽样)
—— 将总体全部单位分为若干“群”,然后 随机抽取一部分“群”,被抽中群体的所有 单位构成样本
例:总体群数R=16 样本群数r=4
A D
E
B F G
CM N
J H
L K
P O I
LP HD
样本比例的抽样分布
(数学期望与方差)
1. 样本比例的数学期望
E(p)
2. 样本比例的方差
– 重复抽样
p2
(1)
n
–
不重复抽样
2 p
(1)Nn
n N1
第二节 抽样误差
一、抽样误差的概念 二、抽样平均误差 三、抽样极限误差
指样本估计量与总体参数之间数量抽样Biblioteka 差 上的差异,仅指由于按照随机原则
•第一个
•第二个观察值
•观察值
•1
•2
•3
•4
•1
•1,1
•1,2
•1,3
•1,4
•2
•2,1
•2,2
•2,3
•2,4
•3
•3,1
•3,2
•3,3
•3,4
•4
•4,1
•4,2
•4,3
•4,4
计算出各样本的均值,如下表。并给出样本均 值的抽样分布
•16个样本的均值(x)
•第一个 •观察值
•第二个观察值 •1 •2 •3 •4
•
值越来越接近被估计的总体参数
P(ˆ ) 较大的样本容量
B
较小的样本容量
A
ˆ
统计学第五章抽样
实现过程与步骤
3. 在各层中分别进行随机抽样,可以 采用简单随机抽样、系统抽样等方法。
4. 将各层抽取的样本组合起来,构成 总体的样本。
实现过程与步骤
2. 对总体进行分层,得到各层的 子总体。
1. 确定分层变量,即用于分层的 特征或标志。
步骤
01
03 02
实现过程与步骤
3. 确定各层的抽样方法和样本 量。
根据研究目的和实际情况选择合适的分群标准,如地理 位置、行政区划、行业类别等。
抽取样本群
采用随机抽样或系统抽样的方法从抽样框中抽取一定数 量的样本群。
ABCD
编制抽样框
将总体按照分群标准划分为若干个互不重叠的群,并编 制出包含所有群的抽样框。
实施调查
对抽中的各个样本群中所包含的所有个体进行调查,收 集所需的数据。
总体与样本关系
总体与样本的定义
总体是研究对象的全体,而样本是从 总体中随机抽取的一部分个体。
总体与样本的关系
样本是总体的一个子集,样本的统计性 质可以在一定程度上反映总体的性质。 但需要注意的是,样本并不等同于总体 ,因此在进行推断时需要谨慎处理。
02
简单随机抽样方法及应用
简单随机抽样原理
80%
对总体了解不足
如果总体存在严重的异质性或 层化现象,简单随机抽样可能 无法充分反映总体的特征和规 律。
03
分层抽样方法及应用
分层抽样原理及特点
01
02
原理:分层抽样是将总体 按照某种特征或标志划分 为若干层,然后从每一层 中随机抽取一定数量的样 本,最后将这些样本组合 起来构成总体的样本。
特点
03
统计学第五章抽样
目
CONTENCT
抽样理论讲义.doc
抽样讲义壹、导论抽样的意思顾名思义,就是从全体之中抽取一部分个体做为样本,借着对样本的观察,再对全体做出推论。
譬如说,我们想知道某个地区七岁到十二岁的小孩在除夕夜平均每人收了多少压岁钱,这些钱又跑到那里去了;或是我们的商品检验单位想要知道有一批货柜的棒球是不是每一个都符合使用标准;或是水库管理当局想要知道到底水库里有多少鱼。
在理论上,我们当然可以不厌其烦地针对母体所有成员一个一个观察以取得数据,但在实际上我们知道这很不容易做到,事实上在有些情况下我们还非得做抽样调查不可。
一、为什么要抽样?(一)因为要节省经费,(二)因为要节省时间。
这两个理由很容易了解,如果要访问全体,则所耗费的时间和经费是相当可观的,而且有许多调查性质具有时间性,如果拖得太长就会失去时效。
例如想知道学生们对某一项考试的反应如何,就非得打铁趁热,在短时间内完成调查不可。
(三)因为要提高资料的准确性,这是由于全体调查牵涉到相当大量而又繁杂的作业,动员不少人力、物力和行政管道,增加许多犯错的机会,导致取得的数据质量不佳,而抽样调查工作涉及的作业负担相对地轻松许多,参与人员因为较少,好控制,使得数据的品质也较好。
事实上联合国的专家们也发现,在一些教育较不发达的地区,人口普查的资料就不如抽样调查来得好。
(四)因为要取得较详尽的数据,譬如我们想要知道七岁到十二岁小孩的压岁钱流到那里去,如果进行全体调查的话,由于人力和物力的限制,我们只能针对每一个小孩取得一点点资料,但是如果是抽样调查,则因为调查对象不多,反而可以很从容的取得细节资料提供分析之用。
每十年一次的人口普查,除了全体都查之外,总是还要再抽取少数样本做更详尽的访问就是这个道理。
(五)因为要减轻损失,例如汽车车身的耐撞试验,罐头食品的安全检查,或是电灯泡寿命的质量管理检验。
这些调查本身就具有破坏性,总不能每部汽车都撞一撞,或是每个罐头都打开检查,这种情形非得进行抽样检验不可,而且样本数目还要控制到越少越好。
社会调查理论与方法 第五章 抽样
多阶段抽样:多级抽样,分阶段抽样
按抽样元素的隶属关系或层次关系,把抽样过程分为几 个阶段进行。
多阶段抽样,假定每一个阶段抽样时,其元素的规模
是相同的。 PPS抽样:(Sampling with probability proportional to size)概 率与元素的规模大小成比例的抽样。在第一阶段,每 个群按照其规模(其所含元素的数量)被给予大小不 等的抽取概率(群越大,其被抽中的概率也越大)。 在第二个阶段,从每个抽中的群中都抽取同样多的元 素。通过两个阶段上的不对等概率抽样,使得总体中 的每一个元素最终都具有同样的被抽中的概率。
被抽中人的
1 2 3 3 3 5
E2式选择表 如果家庭户中18岁 序号为 以上人口数为 1 2 3 4 5 6人以上
被抽中人的
1 2 2 3 5 5
F式选择表 如果家庭户中18岁 序号为 以上人口数为 1 2 3 4 5 6人以上
被抽中人的
1 2 3 4 5 6
家庭内成年人排序表 序号 1 2 年龄和性别特征 最年长的男性 次年长的男性 …… 最年幼的男性 最年长的女性
PS:分层的标准问题 依据主要变量,已经有明显层次区分的变量做为分层变 量。
分层的比例问题: 但是,有的总体中有的类型或层次的单位数目少,若以 按比例分层的方法抽样,则有的层次在样本中个体太 少,不便于了解各层次的情况,这是采取不按比例抽 样。
整群抽样:
抽样的单位不是个体,是成群的个体。从总体中随机抽 取一些小的样本,由所抽出的若干个小群体内的所有 元素构成调查的样本。 居民家庭,学校班级,工厂车间,城市居委会。
判断抽样,立意抽样,调查者根据研究的目标和自己
主观的分析,来选择和确定调查对象。一定程度上与 典型抽样类似。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 N n
n ( N 1
)
定理四:如果总体是正态分布,期望值为,方差2,则样 本均值也是正态分布,期望值为,方差为2/n。 定理五:假设总体为期望值为,方差2的一个分布(不一定是 正态分布),则样本均值标准化后的随机变量
X Z / n
有渐近正态分布。 定理五为中心极限定理的结论。
样本统计量
我们可以从总体总取随机样本,然后使用这 些样本,从而获得对总体参数进行估计或假 设检验所需的值。 为了估计总体参数,要从样本获得一个称为 样本统计量的量,简称为统计量。数学上, 一个容量为n的样本的统计量是随机变量 X1,X2,…,Xn的函数。
抽样分布
我们可以看到,从样本X1,X2,…,Xn计算的一个样本 统计量是这些随机变量的一个函数,它本身也是一 个随机变量。一个样本统计量的概率分布常称为该 统计量的抽样分布 换个角度,我们也可以考虑从总体中抽取样本容量 为n的各种可能样本。对每一个样本计算这个统计 量。用这种方法获得统计量的分布,这就是它的抽 样分布。 从抽样分布当然可以计算期望值、方差、标准差、 矩等等。标准差有时也称为标准误差。
随机样本
如何选取样本是统计推断的一个重要问题。 我们从总体中抽样所作的结论的可靠性依赖 于样本是否选取得当,是否能充分代表总 体。 从有限总体抽样保证总体的每一成员有同等 机会进入样本,这样的抽样叫随机抽样。
总体参数
当描述总体的随机变量X的概率分布f(x)(概率函数和 密度函数)已知时,我们认为总体是已知的。例如, 倘若X是正态分布,我们就说总体是正态分布的,或者说有 一个正态总体。 在f(x)中会有一些量,如正态分布中的、,或者二项式分 布中的p等等。这些量常成为总体参数。当总体已知时,这 些总体参数都是已知的。 当总体的概率分布f(x)不是完全清楚时,对f(x)虽然有一些概 念,可以做出某些假设,但f(x)的总的状况仍会是一个重要 问题。例如,我们知道某一分布是正态分布,但不知道均值 和方差,希望对它们作出统计推断。
例子
1 我们希望提取天津市25-35岁成年人(总体) 身高的信息,现仅从这个总体中选择10000 个体(样本)作考察。 2 我们希望提取某一方向来的宇宙线的动量 (总体),然后现仅选择其中10000个事例的动 量(样本)作为考察,我们根据样本的分布从而 推断出此方向宇宙线的动量期望值和方差 (统计推断)。
X ,有
E( X ) X
其中是总体的期望值。
定理二:如果总体是无限的,进行随机抽样,或者 总体是有限的,进行有放回抽样,则均值的抽样分 2 布的方差记为 X , 有
2 E (( X ) 2 ) X
2
n
定理三:如果总体容量为N,抽样是无放回的,样 本量n<=N,定理二中的式子换成则
样本均值
设X1,X2,…,Xn记样本容量为n的随机样本,它们是 独立同分布的随机变量。样本均值也是一个随机变 量,记为
X 1 X 2 ... X n X n
均值的抽样分布
设f(x)是一给定总体的概率分布,从中抽出一个容 量为n的样本,自然会寻找样本统计量样本均值的 概率分布,这个分布叫样本均值的抽样分布。 定理一:均值抽样分布的期望值记为
2
n
当n值较大时(n>=30),它很接近2,要得到无偏估计量, 这要定义 2 2 2 ( X X ) ( X X ) ... ( X X ) n 2 2 2 n ˆ S S 1 n 1 n 1 这样有E(S2)=2。
S S S S , S S
1 2 1 2 1 2
2 S1
2 S2
பைடு நூலகம்
这两个样本的选择相互无任何联系,也就是说样本是独立的
如果我们对两样本(独立的)统计量的和感兴趣,那 么S1和S2之和的抽样分布的期望值和方差为:
2 2 S S S S , S S S S
无放回抽样
如果我们从一个罐子中抽取一个物体,在下一次抽 取前,可以有将该物体放回或不放回两种选择。前 一种选择中一个特定的物体可以一次再次地被抽 中,而后一种选择中,一个物体仅能抽中一次。总 体的每一成员可以被抽中多次的抽样称为有放回抽 样,仅能抽中一次的称为无放回抽样。 对一个有限总体作有放回抽样,理论上可以考虑为 无限总体,因为任何样本量的样本均可以选择,而 不会穷尽总体。对一个非常大的有限总体抽样时, 实用上常考虑为无限总体抽样。
1 2 1 2 1 2 1 2
样本方差
设X1,X2,…,Xn是容量为n的随机样本,我们定义一个样本 方差,这个随机变量为 ( X 1 X ) 2 ( X 2 X ) 2 ... ( X n X ) 2 2 S n 当一个统计量的期望等于对应的总体参数时,我们称这个统计量 时该参数的无偏估计量,其值是一个无偏估计。然而 n 1 2 E (S 2 ) S
第五章 抽样理论
总体、样本和统计推断
在实践中,我们常想从一大群个体或实物中 提取有用的结论,所要考察的整个一大群被 称为总体。但全部考察可能是困难的,甚至 不可能,所以我们仅考察总体的一部分,这 部分称为样本。我们的目的是从样本发现的 结果推断总体的某种事实,这一过程称为统 计推断。获得样本的过程称为抽样。
比例的抽样分布
假设一个总体是无限的,具有二项式分布,其成功 概率为p。从这个总体中抽取容量为n的一切可能样 本,对每一样本可以确定一个统计量,即事件成功 的比例P,我们可以获得这样的比例抽样分布,它 的期望值P和方差P由下式给出:
P p, P
pq n
p(1 p) n
差与和的抽样分布
假设我们给定两个总体,从第一个总体抽出一个容量n1的样 本,算出一个统计量S1,S1有一个抽样分布,其期望值和 标准差分别为 S1 和 S1。类似地,从第二个总体抽出一个容 量为n2的样本,算出统计量S2,其期望值和标准差分别为 S2 和 S2 从两个总体抽取这两个样本的可能组合,可以获 得差S1-S2的分布,称之为统计量差的抽样分布,这个抽样 分布的期望值和标准差分别记为