社会统计学第5章抽样与统计推论

合集下载

抽样与参数统计

抽样与参数统计

4
4,1
4,2
4,3
4,4
19 5-
统计学
STATISTICS
样本均值旳抽样分布
(例题分析)
计算出各样本旳均值,如下表。并给出样本均 值旳抽样分布
16个样本旳均值(x)
第一种 第二个观察值
观察值 1
2
3
4
1
1.0 1.5 2.0 2.5
2
1.5 2.0 2.5 3.0
3
2.0 2.5 3.0 3.5
=10
n= 4
x 5
n =16 x 2.5
= 50 X
总体分布
x 50
x
抽样分布
22 5-
统计学
STATISTICS
中心极限定理
(central limit theorem)
中心极限定理:设从均值为 ,方差为 2旳一种任意 总体中抽取容量为n旳样本,当n充分大时,样本均值 旳抽样分布近似服从均值为μ、方差为σ2/n旳正态分布
统计学
STATISTICS
第 5 章 抽样与参数估计
1 5-
统计学 第 5 章 抽样与参数估计
STATISTICS
5.1 抽样及其分布 5.2 抽样方法 5.3 参数估计
5.4 样本容量旳拟定 5.5 Excel旳应用
2 5-
统计学
STATISTICS
学习目的
1. 了解抽样和抽样分布旳基本概

2. 了解点估计旳概念和估计量旳
30 5-
统计学
STATISTICS
样本百分比旳抽样分布
(数学期望与方差)
• 样本百分比旳数学期望
E( p)
• 样本百分比旳方差

抽样与统计推论

抽样与统计推论


p

507

100


52

975
(2) 此信赖区间的抽样误差为
2 pˆ (1 pˆ )=2 0.52(1 0.52) 3.2 %
n
975
6 p.62
抽样与统计推论 page 27/30
某民调公司对甲候选人做支持度的调查。从户籍所在地区的合 格选民中成功访问 975 人,其中有 507 人表示支持甲候选人, 试求: (3) 在95 %信心水平下,甲候选人支持度的信赖区间。
常态分布 p.50~p.54
抽样与统计推论 page 9/30
调查 50 位学生投篮 10 次的进球数,画出相对次数直 方图
进球数相对次数直方图
常态分布 p.50~p.54
抽样与统计推论 page 10/30
一般而言,当随机试验次数够多时,直方图的上缘都 会近似于一条中间高、两边渐低、类似钟形的曲线, 如下图,此曲线称为常态分布曲线。
1 p.47
抽样与统计推论 page 3/30
三年级有忠、孝两班,忠班有 40 人,孝班有 40 人。今欲从全 部 80 人中选出 2 个代表,考虑下列两种抽样方法: (1) 直接从 80 人中任意抽取 2 人。 (2) 从忠、孝两班各抽取 1 人参加。 试问 (1) 与 (2) 哪一种为简单随机抽样?
赖区间」。

(2) 2 p(1 p) 称为此信赖区间的「抽样误差」。 n
5 p.61
抽样与统计推论 page 24/30
小贤利用随机数表,模拟投掷一枚不均匀硬币 20 次,设定数 字 0~数5 代字表正8 面,2数字86~91代表6反面3,所2得的结4 果如7 下表5:
正反 - + - + - + + + - + 数字 5 8 7 4 8 0 1 1 5 3 正反 + - - + - + + + + +

社会统计学第5章抽样和与统计推论

社会统计学第5章抽样和与统计推论

05
实例分析
实例一:市场调查抽样
总结词
代表性抽样
VS
详细描述
市场调查中,通过随机或系统抽样的方法 ,从目标总体中抽取一部分个体作为样本 ,通过对样本的调查和分析,推断出总体 特征。代表性抽样要求样本具有足够的代 表性,能够反映总体的实际情况。
实例二:人口普查数据推论
总结词:无
详细描述:人口普查是对全体人口进行调查登记的一种全面调查方式。通过人口 普查,可以获得全体人口的各项指标数据。在人口普查数据的基础上,可以通过 统计分析和推论,得出有关人口特征和规律的结论。
样本误差
02
01
03
样本误差是由于样本的随机性导致的误差,是不可避 免的误差。
样本误差的大小取决于样本的随机性和总体分布情况 。
减小样本误差的方法包括增加样本规模、提高样本代 表性等。
样本误差的估计
样本误差的估计可以通过标准 误差、置信区间等方式进行。
标准误差是衡量样本变异性的 指标,其值越小,说明样本越 稳定。
单侧检验与双侧检验
根据备择假设的数量,假设检验可以分为单侧检验和双侧检验。单侧检 验是指只考虑一个方向的检验,而双侧检验则同时考虑两个方向的检验。
03
显著性水平与临界值
显著性水平是用于判断假设是否成立的概率标准,通常取值为0.05或
0.01。临界值则是用于判断检验统计量是否超过某个界限的标准值。
置信区间与置信水平
详细描述
随机抽样能够减少主观因素的影响,使样本更具代表性。在随机 抽样中,每个个体被选中的机会是均等的,因此能够较好地反映 总体情况。
系统抽样
总结词
系统抽样是一种按照固定的间隔或顺序进行抽样的方法,通常适用于具有规则分布的总体。

统计学05第五章抽样推断

统计学05第五章抽样推断

(2)
计算 p
p1 p
n
(3) 根据 F Z 查表 Z
(4) 计算 Z
(5) 写出:P : p , p
2020/11/17
第五章 抽样推断
44
2.3 区间估计
【例5-5】某工厂要估计一批总数5 000件的产品的废品率,于是随机抽 出 400 件产品进行检测,发现有32 件废品。在置信度为 90% 的要求下, 试给出该批产品的废品率的区间估 计。
总体参数和样本统 x计 量x-x2 n
总体参数和样本统计量的计算公式
总体参数
X X1 X2 XN N
样本统计量
x x1 x2 xn n
P N1 N
p n1 n
X X X 2 N
S x x-x 2 n1
P P 1 P
p p 1 p
2020/11/17
2020/11/17
第五章 抽样推断
35
2.3 区间估计
2. 给定 , 已知 X , 总体平均数的估计:
步骤


(1) 抽样,计算 x 区间的中心
(2) 计算抽样平均误差: X n
(3) 计算 Z 查表F Z
(4) 根据 x 和 : X : x ,x
2020/11/17
参数估计要求:
1. 精确性—适当的极限误差范围; 2. 可靠性—估计结果正确的概率。
参数估计—点估计和区间估计。
2020/11/17
第五章 抽样推断
16
2.2 点估计
点估计就是根据总体参数与样本统计 量之间的内在联系,直接以样本统计量 作为相应总体参数的估计值,点估计又 称为定值估计。
常用的点估计量有:
22

社会统计学第五章离中趋势测量法

社会统计学第五章离中趋势测量法

3. 偏态系数
我们在前面讨论统计图时已经对频数分布的正态和 偏态有所认识。我们又看到了算术平均数与中位数、众 数之间存在的关系:当总体呈对称分布时, 、 、 三者完全相等;当总体呈不对称的偏态分布时,它们之 间存在着数量(位置)的差异。因此,偏态可由 与 的差来表示,即
为了使不同数列的偏态值可比,同样可计算偏态的相 对数,即偏态系数,用α来表示
R =Xmax - Xmin=91 - 69=22
对分组资料,不能确小组的组中值 (2)用组值最大组的上限减去最小组的下限 (3)用组值最大组的组中值减去最小组的下限;
或最大组的上限减去最小组的组中值
运用上 述方法计 算左边数 列的全距
优点:
72
-1
1
81
8
64
86
13
169
69
-4
16
57
-16
256
365
0
506
X2
5184 6561 7395 4761 3249 27151
2. 对于分组资料
计算左
边数列的 标准差
3. 标准差的性质
标准差是反映总体各单位标志值的离散状况和差异 程度的最佳测度。
(1)以算术平均数为基准计算的标准差比以其他任 何数值为基准计算的标准差要小。“最小二乘方”性质—
计算左 边数列的 平均差
第三节 标准差(standard deviation)
各变量值对其算术平均数的离差平方的算术平均数的
平方根,均方差,又称用S表示。
即克服平均差带有绝对值的缺点,又保留其综合平 均的优点。
1. 对于未分组资科
求72、81、86、69、57这些数字的标准差。
X

社会统计学笔记

社会统计学笔记

第一章科学方法与社会研究历程1·社会学研究:就是运用科学的方法来搜集和分析社会事实,以理解社会现象之间的关系。

2·科学研究:就是运用客观的、逻辑的和系统的方法来搜集事实及分析事实。

3·社会学研究的整个历程,大致上可以分为三个阶段:(1)筹划,(2)执行,(3)总结。

4·初步探索步骤:(1)收集有关的文献,(2)咨询那些对研究的题目有经验、有知识的人,进行了解,(3)观察个案.5·假设:就是根据我们对问题的了解,假定现象与现象之间的关系。

就是假定某一现象的变化与另一种现象的变化具有某种关系.假设的方式:函数式(要求变项之数值有高低之分)、差异式(不存在高低之分)6·较为常用的研究方式:实验法、社会调查法.(皆可验证假设)①实验法的逻辑:有意的改变A变项,然后看看B变项是否随着变化;如果B变项显然是随着A变项的变化而变化,就说明A变项对B变项有影响。

②社会调查法特点:在研究过程中不改变社会现状,只求就地取材,然后以统计方法推算变项与变项之间的关系。

7·能够有效地验证假设的实验法称为典型或理想实验法8·社会调查法可以分为两大类:一是叙述性调查(重点是报道社会事实,较少分析社会事实(即变项)之间的因果关系),一是解释性调查(目的是要证明不同的变项之间是否有因果关系)。

9·全体调查:就是从所有研究对象中搜集资料。

抽样调查:就是从全体的研究对象中科学的抽出一个数目较少的样本,然后据此样本的资料推论全体的情况。

10·个案研究:就是选择一个或几个个案(即研究对象),作深入的接触和观察,目的是对所研究的问题作深入的了解.11·横剖研究:指的是在同一时期搜集资料,目的是理解各种社会现象(即变项)在某时期的相关情况的研究.纵贯研究:是指在不同时期搜集的,目的在了解社会现象(即变项)在不同时期中的变动情况的研究.12·纵贯研究分为两种:趋势研究、同组研究(指的是在不同时期调查相同的样本).同组分析的问题:遗失个案的问题。

抽样与统计推论

抽样与统计推论

抽样与统计推论政府机关制定政策,或是企业推出新产品之前,常常需要调查一般大众的意见作为决策的参考。

常见的调查方法包括普查与抽样调查:普查是调查所有对象,会得到最完整的信息,但却需要花费大量时间与金钱;抽样调查则是抽取具代表性的一部分,以其意见来推估全体对象的意见。

例如常见的县市首长的满意度、各选举候选人的支持度、电视节目的收视率等等。

本节首先介绍抽样方法中的简单随机抽样,接着介绍常态分布,并解读信赖区间的由来与信心水平,以期对于生活中的统计现象有进一步的认识。

1简单随机抽样在统计研究的调查对象中,所有个体所组成的集合称为母体。

如果希望得到母体中完整的信息,最理想的方式就是进行全面调查,或称之为普查,例如行政院主计总处每隔十年办理的人口及住宅普查。

但是进行普查往往须花费大量金钱与时间,无法及时获取讯息。

有些调查甚至需要破坏个体,例如调查轮胎使用寿命、日光灯耐用时间等等,这些都不适合普查。

因此我们会考虑从母体中抽取一部分个体作为样本来进行调查,称为抽样或抽样调查,以估计母体中所有个体的特征,如图13。

图13 抽样有些调查者为了方便,往往忽略了选取的样本是否能代表欲调查的母体,这样的抽样是没有代表性的。

例如某产品试用满意度的调查,可能在百货公司门口选择消费者来进行访问,而其选取到的样本可能偏向高消费能力群,其意见不能代表一般消费群众。

有些民意调查采取电话叩应(call-in)意见调查,所选取到的样本通常是对设定议题有强烈兴趣者,也无法代表一般客观民众。

上述的例子中,由于选取样本的方式不适当,导致统计的结果产生偏差。

因此为了确保从样本所获得的信息足以代表母体,以得到可靠的统计结论,抽样过程应该保证样本选取的随机性。

我们知道,品茗只要浅酌一口便知整壶茶的好坏,煮汤也只要浅尝一匙便知整锅汤的咸淡,这是因为它们是均匀液体,任意选取哪一部分都能代表母体。

所以当我们设计抽样的方法时,也必须注意能够让个体分布均匀并使每个个体被选取的机会相等。

统计-抽样推断PPT课件

统计-抽样推断PPT课件

➢按等价公式计算:
x
2 2.5 1.12(岁)
n
2
2 ( X X ) 2 ( 2 2 0 ) 2 ( 2 2 2 1 ) 2 ( 2 2 2 3 ) 2 ( 2 2 2 4 ) 2 2 2 . 5
N
4
.
12
• 对上述公式的验证——
例:有甲乙丙丁四个人,年龄分别为20、21、23、24岁,现随机抽 2人调查年龄,试计算抽样平均误差。
由 xt x
X
xtx,把有关数据代 结 该论 批入: 茶: 叶以达9到9.了73重%的量概规率格认。为
1. 3 5 3 0 0 . 0 8 X 7 1 5 6 0 3 0 . 0 .3 876
即15 : 0.0 4X150.5( 6 克) .
24
练习
某灯泡厂某月生产灯泡400万个,随机抽取400个进行检验, 得资料如下表:
20
-2
4
甲,乙
20,21
20.5
-1.5
2.25
甲,丙
20,23
21.5
-0.5
0.25
甲,丁
20,24
22
0
0
乙,甲
21,20
20.5
-1.5
2.25
乙,乙
21,21
21
-1
1
乙,丙
21,23
22
0
乙,丁
21,24
22.5
0.5
丙,甲
23,20
21.5
-0.5
丙,乙
23,21
22
0
丙,丙
23,23
.
4
第二节 抽样推断的相关概念
一、总体(又称全及总体)

5抽样与统计推论

5抽样与统计推论

第三节
随机与非随机抽样
随机抽样:随机抽样中每个样本被抽中的机率均相等且是独立的。只有随机 抽样可作统计推论。 简单随机抽样 系统随机抽样 分层随机抽样 集体抽样法 多段抽样 多期抽样 非随机抽样:以研究者的判断做为样本选取的控制,无法说明每一抽样单位 被抽取的机率。 立意抽样法 偶遇抽样法 定额抽样法
一、非随机抽样法 1、立意抽样法。即判定抽样法,是依据研究者的主观见解和判断,选取他认为是典型的 个案。 2、偶遇抽样法。是选取一些偶然遇见的个案作为样本,也称方便抽样法。如街头访问、 商场访问。 3、定额抽样法。是根据某些标准将总体分组,然后用立意或偶遇抽样法由每组中选取样 本个案。如按各地区人口比例分配。其代表性通常高于单纯用立意或偶遇抽样法。 非随机抽样法简便,可用较少的代价便能找到所需的样本个案,故常用于探讨性或试点性 的研究中。 然而,其短处是不能用统计方法来推测总体的情况,都是根据主观的见解或偶然的相 遇来选取个案。
样 本 大 小 样本数越多代表性越高,管理也越困难,产生抽样误差的机会也越高。 一般来说,样本数愈多愈好,精准性将大为提高,样本数大于200后边际量下降。
第四节
几率与抽样分布
统计推论是以“几率”论为基础的。 运用概率原理,就可以求出统计推论时的犯错误的可能性大小。 • 抽样分布:所有样本指标(如均值、比例、方差等)所形成的分布 • 抽样分布是根据机率的原则而成立的理论性分布,显示由同一总体中反复 不断抽取样本时,各个可能出现的样本统计值的分布情况。 1. 是一种理论概率分布 2. 随机变量是样本统计量、样本均值、样本比例等 3. 结果来自容量相同的所有可能样本 一、二项抽样分布 二项是指所研究的变项只有两个值,如是与否,高与低,男与女等。 假定见到某一个值出现,便称为成功;如果是另一个值出现,则是“失 败”。则几率计算公式: p(r)=n! P r Q nr r!(n r )! 其中n是样本大小,r是变成功的数目,p是每次的成功机会,Q是每次的 失败机会,p(r)是获得r次成功个案的几率。 在二项抽样分布中,只要P+Q=1,P与Q可以是任何数值。当P=Q时,抽 样分布是对称的。

第五章抽样与统计推论

第五章抽样与统计推论

43
• 二项分布在社会学研究中的统计推论意义。 • 书上的例子(133页):
44
• 二项分布的经典例子就是抛硬币式的P=Q=0.5的 情况,然而只要P+Q=1,P和Q可以是任何数值。 各项分布概率均可以计算出来。P ≠Q时,是不对 称分布。
45
• 例子:人群中同性恋出现的概率是5%,异性恋出 现的概率是95%。如果随机抽取十个人,那么这 十个人中出现同性恋取向个人的概率分布为:
57
58
均值抽样分布的特点
• 一、如果样本相当大,则均值的抽样分布接近于 正态分布。
• 在社会学研究中,样本量至少是30 (n≥30),才 能算是满足大样本的要求。(一般在n≥100的时候,
总是可以认为满足了大样本的要求,无论总体分布如何。 在n≥50的时候,总体分布接近正态分布时使用比较合适。)
26
• 概率,将随机事件与一个精确反映事件出现可能 大小的数量紧密联系在一起。假设试验或者观测 进行了无限多次。
• 概率分布,假设进行无数次抽样,得到那个最为 完美的样本的分布状况。将变量取值分布和一个 固定的形状联系起来。
27
两个定理: • 大数定理和中心极限定理 • 随机事件的两重性:随机性和统计规律性。 • 大量的随机现象所构成的总体,呈现的规律有稳 定性。当进行大量观察时,n趋向于无限时,得出 来的定律,叫做极限定律。
73
74
65
• 三、抽样分布中任意两个值之间的样本均值的次 数可以计算出来。
66
67
68
69
• 例子:假设某社区居民收入均值(总体)为11900元, • 在该社区进行收入调查,样本为100个家庭,得 到家庭收入均值是11500元,标准差是1500元。 • 检验该假设是否成立。

4抽样与统计推论

4抽样与统计推论

中心极限定理的应用
例:某厂商声称其生产的电瓶具有均值为 60个月、标准差为6个月的寿命分布。质检 部门为检验该厂的说法是否正确,随机抽取 50个该厂生产的电瓶进行寿命实验。
(1):假定该厂商声称是正确的,试描述50 个电瓶的平均寿命的抽样分布。
(2):假定该厂商声称是正确的,50个样本 的平均寿命不超过57个月的概率是多少?
总体方差 = s 2 x x 2 =2
n 1
• 现从总体(N=5)中,作样本容量n=2的简单随机抽样,它可 能选出的样本有5×5=25种 可能选出的全部简单随机样本
第一次
4 4 4 4 4 5 5 5 5 5 6
第二次
4 5 6 7 8 4 5 6 7 8 4
平均家庭人口数
4.0 4.5
sˆ x
s n
4.中心极限定理 (central limit theorem)
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数
学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)
s =10
n=4 sx 5
n =16 s x 2.5
(二)原总体标准差未知时的样本平均数的抽样
分布…t分布(t-distribution)
总体σ 未知时,抽样总体S估计σ
即用s n 估计 σ n (sx 估计 σx ).
μ, σ 2
标准化变量Z X
=
x— μ σn
变为Z X
=
x— μ sn
令 t = x— μ , t 变量具有的分布称为t 分布
sn
• 设有均值u,方差 的分布总体,如随机抽取 所有可能容量为n的样本,则样本平均数的抽 样分布将随着n的增大而渐渐接近于以下正态 分布 X ~ N (m, )

[社会学]应用统计学 抽样调查与推断

[社会学]应用统计学  抽样调查与推断
statistics
2012 第 10 页
第二节 抽样调查的组织方式和抽样方法
2、类型抽样
将总体按某个主要标志进行分组,再按随机原则采用简单随机抽样方式从 各组中抽取一定数目的总体单位组成样本的抽样组织方式。
描述:
N1
n1
等额抽取
样本
总体 N
N2
Nk
n2
nk
n
等比例抽取
不等比例抽取
· · ·
· · ·
成份,不问样本的构成顺序。
statistics
2012 第 22 页
第二节 抽样调查的组织方式和抽样方法
样本数量

考虑顺序的不重复抽样:
n AN N ( N 1)....( N n 1)
N! ( N n)!

考虑顺序的重复抽样:
n BN Nn

不考虑顺序的不重复抽样:
1、样本间距为K=10000/400=25。
2、然后从1-25中任意抽取一个数为样本,假定为第8台,则
第2个样本为8+25=33,即抽取第33台作为第2个样本,以
此类推,一直抽够400台为止。
statistics
2012
第 16 页
第二节 抽样调查的组织方式和抽样方法
优点:
(1)简便易行,容易确定样本单元 (2)分布比较均匀,有利于提高估计精度 例 如:对公路旁树木进行病虫害防治,确定每30棵树检查1棵,只 要确定了起点的被检查树,每隔30棵检查1棵即可。 (1)若抽样间隔与总体的某种周期性变化一致,
statistics
2012
第 4页
第一节 抽样推断概述
(1)对一些不可能或不必要进行全面调查的社会经济现象,最宜用抽样方式解 决。 举例:对有破坏性或损耗性质的商品质量检验;对一些具有无限总体的调查(如对 森林木材积蓄量的调查)等。 (2)在经费、人力、物力和时间有限的情况下,采用抽样调查方法可节省费用, 争取时效,用较少的人力物力和时间达到满意的调查效果。 (3)运用抽样调查对全面调查进行验证。全面调查涉及面广、工作量大、花费 时间和经费多,组织起来比较困难。但调查质量如何需要检查验证,这时,显然不 能用全面调查方式进行。 (4)可运用于企业质量管理。 (5)利用抽样推断的方法,可以对于某种总体的假设进行检 验,判断这种假设的真伪,以决定取舍。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
优点:简化了抽取过程 缺点:可能出现周期性偏差(抽取的个案可能 具有某种特征,与不被抽取的个案有所不同)。
3.分层抽样(类型抽样、分类 抽样)
分层抽样是先将总体按与研究内 容密切有关的主要因素分类或分 层,然后在各层中按随机原则抽 选一定单位构成样本。
分层的目的,在于减少层内差 异,增加抽样调查样本的代表性。
1、非概率抽样
立意抽样法:判定抽样法,根据研究员的主观 理解和判断,选取认为是典型的个案。是否有 代表性在于研究员的主观判断是否正确。 偶遇抽样法:选取一些偶然遇见的个案作为样 本。 定额抽样法:根据某些标准将总体分组,然后 用立意或偶遇抽样法由每组中选取个案样本。 如先按照男女年龄分组(30岁作为分界),再 分别抽样调查。
分层定比抽样 样本中各层抽取的比例是相同的。
例 如 总 体 单 位 N=20000 , 样 本 容 量 n=500,则抽样比例:
P 5002.5% 20000
设总体按老、中、青三代分层,于是根据
总体中三代人的总人数,就可确定三代人 的抽样人数:
代别
三代中抽样人数的分配 总人数
抽样人数
青年 中年
11200 6600
二、抽样调查方法
部分调查根据其抽取调查 单位的准则不同,可分非 概率抽样和概率抽样。 概率抽样(随机抽样): 可以进行统计推论
1、非概率抽样
抽取调查单位的原则是根据主观判断或 其它操作上的方便。 基本方法:立意抽样法、偶遇抽样法、 定额抽样法。 非概率抽样的优点:成本低、花时短、回 答率高。 缺点:不能做统计推论
5.阶段抽样
在多级抽样中,每一级都可看作是一次整群抽 样,每一个抽中的群体,又可看作是由若干子 群所组成,从入样的群体中,再随机抽取若干 子群组成子群。如: 第一步:从全国的省直辖市中抽取若干省和直 辖市 第二步:从入选的省和市中抽取县级单位 第三步:从县级单位中抽出乡和镇 第四步:从乡和镇中确定调查对象
总体
样本
推断
二、抽样调查方法
简单随机抽样 所谓简单随机抽样就是按照随机原则, 直接从总体N个单位中,抽取几个单位作 为样本,保证总体中每个单位在抽选时 都有同等的机会被选中。分为:
简单重复抽样 简单不重复抽样
2.等距抽样 (机械抽样,系统抽样)
先将总体按某一因素排列,然后依固定的间隔, 每间隔若干单位抽出一个构成等距抽样。 例如:总体单位为N,样本容量为n,则样本间 隔为:k=N/n,抽样时,先在第一个间隔中随机 抽取一个单位,假定为a,然后从a单位开始,每 间隔K单位都将是入选的单位。
第五章
抽样与统计推论
统计推论:就是根据局部资料(样本
资料),对总体的特征进行推断。
统计推论具有两方面的特点:
1、由于样本资料来源于总体,因此,样本 资料的特性在某种程度上能反映总体的特性。
2、由于社会资料的随机性,抽样的结果不 是唯一的,一次抽样结果不一定恰好就等于 总体的结果,而且当总体参数未知时,即便 等于,我们也不知道。
参数估计与假设检验 在逻辑上的区别
参数估计是先看样本的情况,再问总体的 情况。
假设检验则是先假设总体的情况,再以一 个随机样本的统计值来检验这个假设是否 正确。即要先构思总体情况,才进行抽样 和分析样本的资料。
第一节 抽样调查简介
一、抽样的历程
1.界定总体。即清楚地说明全部研 究对象的范围,包括时间、地点和 人物。总体的界定越清楚越好。 2.搜集全部名单。根据总体的界定, 收集一份全部个案的名单,这份名 单,称为抽样构架。抽样构架的完 整性与准确性要审核。
112002.5%=280 66002.5%=165
老年
2200
20002.5%=55
总数
20000
200002.5%=500
分层异比抽样
当总体中某一层人数过少,但又 具有较高的研究价值,这时可增 大这一层的抽样比例。但这样做 的结果,统计分析时要做适当修 正。
4.整群抽样(集体抽样)
在整群抽样中,总体被分为很多 “群”,这些群是抽样的单位。随 机抽取若干群,被选入样本的群中 的全部个案都进入样本。 整群抽样适用于群间差异小,而群 内差异大的总体,这点正好和分类 抽样相反。
抽样的5个步骤
3.决定样本大小 在决定样本的大小时,必须同时考虑抽样 误差和研究代价这两个因素。 准则:根据所能付出的研究代价的最大限 度抽取最大的样本 抽样比例:样本个案数目/总体个案数目 4.设计抽样方法 不同的抽样方法所犯的抽样误差会不同, 但所需求的研究代价也不相同。
5.评估样本的正误
一般是根据一些在总体与样本中都能容 易找到的资料来评估样本的正误,如果 总体的资料分布与样本的资料分布基本 上一致,我们对样本的代表性就有较大 的信心。如果总体的资料分布与样本的 资料分布差异很大,则要放弃样本或在 报告中特别指出样本的偏差。 非抽样误差:遗失或无回应的问题引发 (有些个案拒绝回答)
例如:某工厂有20名工人,他们 的工资如下
40,80,70,40,50,50,80,70,50,40 70,40,70,50,40,80,40,80,50,50
粗看起来,工资水平似乎很分散,但细 分起来,实际只有4档:40,50,70,80 分层抽样适用于层内差异小,层与层间 差异大的总体。
分层抽样根据各层抽取比例是否相等,可 分作分层定比抽样和分层异比抽样:
2.概率抽样
抽取调查单位的原则是随机原则 所谓随机原则就是在抽选调查对象时,规 定了一定的程序,以保证每一个单位都有 同等入选的机会,从而避免了主观因素的 影响。 特点:根据已知的几率来抽取样本个案。 优点:可以作统计推论
如图:
参数值 X, ,2相关 系数
统计量 X,s,s2 相关系
数等
N
n
随机原则
第二节 抽样分布
例:设某村有5户人家,以下是 总体家庭人口的统计表
表 1 .某 村 家 庭 人 口 统 计 表
人 口 数 户 数
4
1ห้องสมุดไป่ตู้
5
1
6
1
7
1
8
1
图1
1/5 45 6 7 8
则有:
总 体 均 值 x x 4 5 6 7 8 6 人
N5
总 体 方 差 2 1( x ) i 2 2 N 总 体 标 准 差 = 1 .4
相关文档
最新文档