第七章:问卷、测量和抽样
第七章 如何进行问卷调查
调查范围的广泛性 调查对象还是调查内容都具有广泛性 调查内容的深入性
调查过程的匿名性 调查结果的客观性
由于问卷调查大多是使用封闭型问卷, 这类问卷在编制时一般符合测量学的各 项指标要求,具有高度的标准化和结构 化,良好的信度和效度。
2、问卷调查的局限
问卷调查 的局限
调查对象的限制性 调查内容的固定性
直接决定着问卷调查的设计、调查对象的选择、调查结果的分析和调查 报告的形成。选题一旦确定,也基本上明确了问卷调查的范围、方向和目的, 对问卷调查的价值起着决定作用。所以,选题不仅是问卷调查的开端,更是 问卷调查的关键。
2、选题的原则
选题的原 则
价值性原则 可行性原则 创新性原则
二、问卷的编制
问卷的 编制
要尽量简洁明了;尽量不用否定形式的语句进行提问;避免提问带有诱 导性;不问被调查者可能不知道的问题;合理设计敏感性问题;问题的 数量要适度。 .问题排序的基本要求: (1)被调查者熟悉的、简单易懂的问题放在前面,比较生疏、较难回答 的问题放在后面。 (2)把能引起被调查者兴趣的问题放在前面,把容易引起被调查者紧张 和顾虑的问题放在后面。 (3)把开放式问题放在问卷的结尾部分。 (4)先问行为方面的问题,再问态度方面的问题,最后问有关个人的背 景资料。 (5)按照从一般到特殊的顺序进行排列。
第七章 如何进行问卷调查
讲授:鄢老师
第七章 如何进行问卷 学习目标
识记问卷调查的内涵、基本特点与主要类型;选择的意义与原则;
01
抽样的涵义及方法
02
领会问卷各组成部分内容的编制;版面设计;修订
应用根据问卷调查的需要综合运用不同的抽样方法;在问卷
03
调查实践中科学地发放和收回问卷。
统计学原理第七章 抽样调查
合
计
x A 2 x A ( d ) f ( d )f d σ f f
2
256 72 σ 50 11504 50 53.63 200 200
2
30
第三节 全及指标的推断
一、全及指标的点估计
22
不具有某一标志的单位数用N0表示。 ► 总体成数和标准差与样本成数和标准差的计 算方法相同。只是总体指标用大写字母表示, 样本指标用小写字母表示。例如: ► 具有某一标志的单位数占总体的比重:
N1 P N
总体成数
n1 p n
样本成数
不具有某一标志的单位数占总体的比重:
N0 Q 1 P N
13
► 2.
(二)中心极限定律 ► 1. 独立同分布中心极限定理:证明不论变量 总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布.
► 2.
德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
σ N n σ n μx ( ) μx (1 ) n N 1 n N
2 2
总体单位总数
样本单位总数
抽样比例
21
(一)抽样成数的抽样平均误差μp ► 属性总体的标志值是用文字表示的,且标志 只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 ► 交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 ► 交替标志仍以x表示,设:x =1表示单位具有 某一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示;
第七章 选择研究对象 –抽样
抽样是以概率论为理论基础。抽样的作用是为 了合理地减少研究对象,既可以节约人力、物 力、时间,又可使研究力量相对集中,使研究 工作深入、细致,从而提高研究的准确性和可 靠性。 一般来说,定性研究中抽取的样本很小,样本 有时仅仅是一个案例或一个个体,研究目的是 为了对所研究对象进行更深入的了解。而定量 研究的样本数较大,样本可以是一群个体,并 要考虑样本能否准确代表总体,能否对总体作 出推断。
4.合理的样本容量 4.合理的样本容量 样本容量又称样本大小,是指抽取样本的具体数量。样本数量的多少是研 究无法回避的问题,是研究设计中重要的一环,也是比较困难的一件事。 它既要符合研究目的、内容,满足教育统计的要求,又要考虑抽样的可能 性,并使误差减少到最低限度。一般来说,样本数越多,代表性越好,但 是增大样本,势必增加研究的人力、物力、财力,增加研究的难度,造成 不必要的浪费。如果样本数太小,则抽样误差较大,样本不能代表总体, 不利于统计分析,影响研究效果。样本数量究竟多少为宜,这是一个复杂 的问题。我们很难说出一个确定的数字,样本数量要从多个方面综合起来 考虑。一般来说,样本容量大小取决于以下一些因素: (1)研究的类型、范围 当研究是定量研究,研究范围较广,样本数量可适当大一些;反之,当研 究是定性研究,研究范围较狭窄,样本数量可适当少一些。 (2)研究分析的精确程度 当研究要求有较高的统计显著程度,具有较高的可信程度时,样本数量可 多些;反之,则可少些。 (3)允许误差的大小 当研究允许的误差值小,要求的可信程度高,所需样本容量相应要大;反 之,则可小些。
下表示当总体趋于无限大时, 下表示当总体趋于无限大时,不同的允许误差和可信程度要求不同的样 本数量。 本数量。 允许误差和可信程度与样本容量关系表
(4)总体的同质性 当总体的变异性比较大,变量的相关程度比较低,研究的条 件控制不严格,样本数量可适当增加些;反之,当总体同质 性比较好,变量的相关程度较高,研究条件控制严格,则可 少些。如,人的血液同质性比较好,医院化验只需抽取一点 点血。学生的智力、能力变异性比较大,因此抽取样本相对 比较大。 (5)测量工具的可靠程度 当测量工具的可靠程度即测定指标信度比较低时,测量的误 差就比较大,这时需要增大样本数量;反之,则可减少样本 数量。一般说来,有关学习能力和成就的测量工具可靠性程 度好些,有关人格特质、自我概念、态度等方面的测量工具 可靠程度差些。 (6)研究的成本 研究的成本包括经费、时间、人力、物力,抽样数量总是要 控制在研究成本允许的范围内。因此,确定样本容量时,必 须仔细分析研究的条件,量体裁衣。 (7)分析的类别 当研究的关系复杂,分析的项目较多,那么样本数量可多些; 反之,则可少些。一般应保证每一分析小类的样本数量不少 于10。 10。
《统计学原理》课件第七章抽样调查
第二节 抽样调查的基本概念
全及总体(总体) 样本总体(样本)
几组基 本概念
重复抽样 不重复抽样
大数定律 中心极限定理
4 -7
研究对象
抽 取 方 法
重复考虑顺序 不重复不考虑 顺序
研
究 原
总体分布 样本分布 抽样分布
理
一、全及总体和样本总体
全及总体:也称总体。指所要认识对象的全体。 用N表示有限总体的单位数,称总体容量。
m
lim p n
n
p
ε
1
贝努大数定律对于抽样调查的意义:
从理论上解释了用频率代替概率的理论依据, 即随着抽样单位数n的增加,事件A发生的频率接近 于事件A发生的概率。
4 - 18
大数定律特点
大数定律论证了抽样平均数趋近于总体平均 数的趋势,这为抽样推断提供了重要依据。 但是:
抽样平均数和总体平均数的离差究竟有多大? 离差的分布状况怎样? 离差不超过一定范围的概率究竟有多少?
(二)抽样成数的抽样平均误差
重复抽样: 不重复抽样:
p
p1 p
n
p
p1 p 1 n
n N
说明:实际应用中,平均数和成数的标准差一般是 未知的,通常采用如下方式解决 (1)用过去调查的资料 (2)样本方差的资料代替总体方差 (3)用小规模调查资料 (4)用估计材料
4 - 30
【进上例行者】测为试合某(1,格灯)平资品泡均料,厂使如计对用下算10时。这00按批0间个质灯:x产量泡品规的进定时x行ff,间寿灯抽命2泡样12检10使平40测0用均0,寿误随1命差0机5在和7(抽小1合0取时格002)率小%样的时本平以
按照随机原则 从调查对象中抽取一部分单位进行 观察,并运用数理统计的原理,以被抽取的那部分 单位的数量特征为代表,对总体做出数量上的推断 分析
第七章抽样
第七章抽样一、抽样与抽样调查抽样:是一种选择调查对象的程序和方法。
抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。
优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。
二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。
与整体调查(普查)比,抽样调查具有下列优越性。
第一、调查费用低。
抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。
例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。
第二、速度快。
时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。
第三、范围广。
由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。
第四、可获得内容丰富的资料。
普查通常只了解少量项目,无法进行深入分析。
例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。
第五、准确性高。
整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。
4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。
在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。
这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。
对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。
有两个因素可以减少抽样误差。
首先,大样本比小样本产生的误差小。
其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。
第七章 抽样推断
x x X x x
第七章 抽样推断
p p P p p
合适统计量 的估计值 合理的允 许误差 可接受的 置信度水平
t
概率度
5-40
• 区间估计的三要素 估计区间覆盖 总体参数真值 的概率 F(t)
• 区间估计的特点: • 不指出参数的确定数值,而是在一定的概 率保证程度下指出参数的可能范围。 • 估计的可靠程度可知,即为概率保证程度
X
区间估计的两个基本要求: 置信度 精确度
• 希望置信度尽可能大,精确度尽可能高。 • 但在样本容量n一定时,两者矛盾。
一般在给定的概率保证程度下,尽可能 提高估计的精度(通过降低标准误)。
第七章 抽样推断
抽样极限误差(精度) 与概率保证程度(可靠程度) 99.73%
95.45% 68.27%
3 x 2x x
抽样推断包括三方面的内容:
1、抽样。按照随机原则从总体中抽取部分调查 单位(样本)。
2、 构造统计量 。对样本资料进行加工计算, 获得既能反映样本特征又能用于推断总体的样本数 据。 3、推断。运用概率估计方法,以一定的可靠 性推断总体指标数值。
二、抽样推断的特点 1、按随机原则抽取样本单位 2、用部分推断总体 3、抽样推断的误差可以事先计算并加以控 制 4、运用概率估计方法
实际上就是对估计量可允许取的最高值或最 低值进行了限制
ˆ ˆ Biblioteka 例子• 要估计某乡粮食亩产,从8000亩粮食作物中,用不 重复抽样抽取400亩,求得平均亩产为450公斤。如 果确定抽样极限误差为5公斤,这就要求某乡粮食 亩产为450〒5公斤,即在445公斤到455公斤之间。
x
i 1 n
自考“社会调查原理与方法”复习资料第七章
第七章问卷法 问卷法是社会调查中最常⽤的资料收集⽅法 第⼀节问卷的类型与结构 ⼀、问卷的主要类型 1.问卷的主要⽤途:主要是⽤来测量被调查者的多种⾏为、态度和社会特征,包括2种主要类型:⾃填问卷(⼜可以分为邮寄问卷和发送问卷)和访问问卷,⼆者的关系 区别: <1>⾃填问卷即由被调查者⾃⼰填答的问卷,访问问卷是由访问员根据被调查者的⼝头回答来填写的问卷。
<2>⾃填式问卷⽤于问卷调查,⽽访问问卷⽤于访问调查。
<3>⾃填式问卷⾯对被调查者,⽽访问问卷直接⾯对访问员。
<4>⼆者的具体形式、设计要求等⽅⾯有所不同(本章第⼆节内容联系)。
联系: <1>⼆者作为社会调查收集资料的⼯具,具有相同的结构,如⼆者都由封⾯信、指导语、问题与答案、编码等内容构成。
⼆、问卷的基本结构 2.封⾯信,作⽤是项被调查者介绍和说明调查者的⾝份、调查的内容、调查的⽬的、意义等; 3.指导语,是⽤来指导被调查者填写问卷的⼀组说明,作⽤是对填表的⽅法、要求、注意事项等作⼀个总的说明。
4.问题与答案,是问卷的主体,具体分类: <1>从形式上看,分为: (1)开放式问题,就是不为回答者提供具体答案,⽽由回答者⾃由填答的问题。
(优点:被调查者可以充分⾃由地按⾃⼰的⽅式表达意见,不受限制;缺点:要求回答者具有较⾼的知识⽔平和⽂字表达能⼒;所花的时间和精⼒⽐较多;只能进⾏定性分析,难于进⾏定量的处理和分析) (2)封闭式问题,就是在提出问题的同时,还给出若⼲个答案,要求被调查者选择⼀个作为回答。
(优点:填写⽅便;对⽂字表达能⼒没有过⾼的要求,适合于进⾏定量分析,缺点:失去了开⽅式问题的丰富⽣动的回答)。
<2>从内容上看,可分成(1)有关⾏为的问题,(2)有关态度的问题和(3)有关个⼈背景的问题。
5.编码及其他资料,编码就是赋予每个问题及其答案⼀个数字作为它的代码。
《社会学研究法》讲义-问卷调查-教学版
第七章问卷调查风笑天,2001,《社会调查中的问卷设计》(第二版),天津人民出版社。
问卷调查是社会研究中一种最常见的研究方式。
一些人甚至误以为问卷调查就是整个社会研究方法的全部。
无论如何,问卷调查的确以其特定的方式满足了社会研究者探讨各种社会行为、社会现象和社会问题的需要。
同时,定量研究的诸多内容也十分集中地体现在问卷调查的方式之中。
比如抽样、操作化、测量、统计分析等等。
因此,掌握问卷调查方法对于社会研究者来说,显得更为重要。
本章也以更大一些的篇幅介绍问卷调查的方法。
第一节问卷调查及其发展一、问卷调查的概念(问卷调查--questionnaire survey)问卷调查(questionnaire survey research)指的是一种采用自填式问卷或结构式访问的方法,系统地、直接地从一个取自某种社会群体的样本那里收集资料,并通过对资料的统计分析来认识社会现象及其规律的社会研究方式。
先看看下面这个问卷调查的例子。
为了研究城市独生子女与非独生子女青少年的社会化发展状况,全国八个单位的社会学者于1998年采用问卷调查的方式在全国14个城市中开展了一项研究。
根据研究的目标,研究者确定以12-18岁的城市在校中学生作为研究的对象,他们采取多阶段、分层抽样的方法,从总体中抽取了1,800名中学生、1,800名家长作为调查的两组样本。
在经过多次设计、试用和修改之后,印制了《中学生调查问卷》和《中学生教育调查问卷》(家长问卷)。
从1998年10月到1999年3月这五个多月的时间内,八个单位的社会学者分赴全国14个大、中、小城市,采用集中填答的方法对所抽样本的中学生进行自填问卷调查,同时将家长问卷交给学生带回家,请家长填答后再由学生交给教师集中回收。
此次调查共获得了涉及两类青少年社会化发展及相关因素的经验数据80多万个。
在计算机的辅助下,研究者对这些数据资料进行了多种统计分析,得出了有关城市独生子女青少年社会化发展的总体特征、独生子女青少年与非独生子女青少年社会化发展状况的异同及原因等一系列结果,对于人们从总体上认识和理解这一代特定儿童的成长过程及其发展特征提供了重要的参考依据。
经济统计学第7章抽样调查
参数的假设检验是根据样本,对总体参数某种假设的正确性作出判断。 可以分别提出两种假设: 前一种不能轻易拒绝的假设为原假 设,后一种为备选假设。假设检验就是根据样本,检验 是否成立, 不成立就接受备选假设 。
一、基本思想: 小概率原则:认为在一次实验中 小概率事件几乎是不可能发生的,小概率事件的概率为显著性水平 。
一个总体的检验
Z 检验 (单尾和双尾)
t 检验 (单尾和双尾)
Z 检验 (单尾和双尾)
2检验 (单尾和双尾)
均值
一个总体
比例
方差
总体方差已知时的均值检验 (双尾 Z 检验)
均值的双尾 Z 检验 (2 已知)
假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 原假设为:H0: =0;备择假设为:H1: 0
单侧检验 (原假设与备择假设的确定) 例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上
除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的 建立的原假设与备择假设应为
H0: 1000 H1: < 1000
第二节
一个正态总体参数的假设检验
-10
100
20
25
-5
25
30
30
0
0
离差
40
35
5
25
50
40
10
100
10
25
-5
25
20
30
0
0
30
35
5
25
40
40
10
100
50
45
15
第七章 抽样技术测验
抽样技术测验一、填空题1、抽样调查是按照_____________从总体中抽取一部分单位进行观测,并根据这部分单位的资料推断______________的一种方法。
2、抽样调查的组织方式主要有_______________ 、_______________ 等距抽样和整群抽样等。
3、在抽样推断中,按照随机原则从总体中抽取出来的那一部分单位叫做___________4、____________是抽样调查中不可避免和误差。
5、提高估计和区间估计必须具备____________、误差范围和___________三个基本要素。
6、简单重复抽样情况下,如果其他条件不变,仅将误差范围缩小1/2,则抽样单位数目必须__________;若将误差范围扩大一倍,则抽样单位数目将__________。
二、单项选择题1、在抽样推断中,必须遵循()抽取样本。
A 随意原则B 随机原则C 可比原则D 对等原则2、能够事先加以计算和控制和误差是()A 抽样误差B 登记误差C 系统性误差D 测量误差3、抽样调查的主要目的在于()A 计算和控制抽样误差B 了解全及总体单位的情C 用样本来推断总体D 对调查单位作深的研究4、某企业连续生产,为检查产品质量,在24小时中每隔30分钟取下一分钟的产品进行全部检查,这是()A 整群抽样B 简单随机抽样C 类型抽样D 纯随机抽样5、在抽样调查中,无法避免的误差是()A 登记误差B 系统性误差C 计算误差D 抽样误差6、置信区间的大小表达了区间估计的()A 可靠性B 准确性C 显著性D 及时性7、抽样推断中的概率保证程度表达了区间估计的( )A 显著性B 准确性C 可靠性D 规律性8、样本指标和总体指标()A 前者是个确定值,后者是个随机变量B 前者是个随机变量,后者是个确定值C 两者均是确定值D 两者均是随机变量9、对标志变异程度较大的总体进行抽样调查时,宜采用()A 纯随机抽样B 等距抽样C 类型抽样D 整群抽样10、成数方差的最大值,是当P值趋近于()A 0.1B 0.9C 0.8D 0.511、计算必要抽样数目时,若总体方差末知,应当从几个可供选择的样本方差挑选出数值()A 最小的B 任意的C 最大的D 适中的12、在同等条件下,重复抽样与不重复抽样相比较,其抽样平均误差()A 前者小于后者B 前者大于后者C 两者相等D 无法确定哪一个大13、允许误差反映了样本指标与总体指标之间的()A 抽样误差的平均数B 抽样误差的标准差C 抽样误差的可靠程度D 抽样误差的可能范围14、根据组(群)间方差的资料计算抽样平均的抽样组织方式是()A 纯随机抽样B 机械抽样C 类型抽样D 整群抽样15、从1、2、3、4、5,五个数构成的总体中不重复地随机抽取两个作为样本,则对于所有可能样本的样本均值,以下说法正确的是()A 样本均值的实际抽样误差的最大值为2B 样本均值为3的概率是25%C 样本均值为3的概率为40%D 以上都不对三、多项选择题1、影响抽样误差的主要因素有()A 抽样数目的多少B 总体标志变异程度的大小C 不同的组织方式D 抽样周期的长短E 不同抽样方法2、要提高抽样推断的精确度,可采用的方法有()A 增加样本数目B 减少样本数目C 缩小总体被研究标志的变异程度D 改善抽样的组织方式E 改善抽样的方式3、要增大抽样推断的概率保证程度,可采用的方法有()A 增加抽样数目B 增大概率度C 增大抽样误差范围D 缩小抽样误差范围E 缩小概率度4、在简单重复随机抽样条件下,欲使误差范围缩小1/2,其他要求保持不变,则样本容量必须()A 增加2倍B 增加3倍C 增加到4倍D 减少2倍E 减小3倍5、在区间估计中,如果其他条件保持不变,概率保证程度与精确度之间存在下列关系()A 前者愈低,后者也愈低B 前者愈高,后者也愈高C 前者愈低,后者愈高D 前者愈高,后者愈低E 两者呈相反方向变化6、由于以下原因引起的误差中,不属于抽样误差的是()A 被调查者隐瞒了自己的非法收入,将自己的月收入填报为1000元B 由于调查员的失误,将数字1568填报为1658C 入户调查时被调查者不在家,调查根据自己的估计将户主的收入填报为1500元D 调查者按自己的主观愿望选择样本单位所造成的误差E 以上都不对7、根据抽样调查,某地区10户居民家庭月消费(元)与月收入的资料,配合了反映家庭消费收入关系的回归方程。
第七章市场调查方式(抽样技术)
具体做法: A、抽签法(有重复和不重复抽样两种选择)
先给调查总体的每个单位编号,然后将号码写在卡片上搅拌均匀, 任意从中抽选,抽到一个号码,就对上一个单位,直到抽足预先 规定的项目为止。适用于总体单位较少的情况。
B、乱数表(随机数表)法 优点:完全排除了抽样中主观因素的干扰、简单易行 缺点:在调查总体单位差异小(同质总体)情况下,调查结果 具有代表性,否则会产生较大误差 适用范围:总体单位明确、总体单位数较少、总体各单位间差 异程度较小
14
1
合 计
1 30
50
20
100
第四步:具体抽样 优点:较简单易行、准确度较高;节省费用, 能较快地获得市场信息 缺点:若调查者对调查总体不了解,会产生较 大误差 适用范围:调查者对调查总体了解
(二)随机抽样
严格按随机原则从调查总体中 抽取样本单位的调查方式。
1、简单随机抽样(纯随机抽样)
含义:在总体单位中,不进行任何有目的 的选择,完全按随机原则抽取样本单位 的方式。
具体做法:
第一步:对样本总体进行分类; 第二步:确定每类样本的分配数额; 第三步:编制样本交叉配额分配表; 第四步:具体抽样 仍以上例为例,采用相互控制配额抽样 第一步、第二步(略) 第三步:编制样本交叉配额分配表
高收入 民族 汉 族 回 族 其他民族
中收入
低收入
合计
21 8
35
14 6 0
70 28 2
2、分层随机抽样(类型随机抽样、分类 随机抽样)
( 1 )含义:将总体单位按某一标准(有关标 志)分组,然后在各个类型组中,按随机原 则抽取样本单位的方式。 (2)具体做法: 第一步:选择有关标志对总体进行划分; 第二步:确定各组的样本分配数额 方法:等比例和不等比例 等比例:ni = n× (Ni / N) 不等比例: ni = n×(Ni· Si /∑Ni· S i)
第七章 抽样
第七章抽样一、抽样与抽样调查1、抽样:是一种选择调查对象的程序和方法。
2、抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。
3、优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。
二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。
与整体调查(普查)比,抽样调查具有下列优越性。
第一、调查费用低。
抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。
例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。
第二、速度快。
时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。
第三、范围广。
由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。
第四、可获得内容丰富的资料。
普查通常只了解少量项目,无法进行深入分析。
例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。
第五、准确性高。
整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。
4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。
在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。
这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。
对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。
有两个因素可以减少抽样误差。
首先,大样本比小样本产生的误差小。
其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。
抽样与测量
抽样与测量抽样与测量第一部分:抽样一、抽样的基本概念抽样,就是从总体中抽取样本的过程。
抽样的目的和作用在于科学地挑选总体的部分作为总体的代表,以便通过对这局部的研究,取得能说明总体的足够可靠的资料,准确地推断总体的情况,从而认识总体的特征或规律性。
为了使统计推断正确可靠,抽取的样本对于总体来说必须具有代表性。
⒈概率抽样与非概率抽样抽样方法基本分两大类:概率抽样与非概率抽样。
遵循随机化原则的抽样称为概率抽样。
不是按照随机化原则进行的抽样称为非概率抽样。
概率论研究证明,要使样本在性质上对总体最有代表性,抽样时就需遵循随机化原则,即抽样完全按随机的方式进行,总体中每一个研究对象被抽取到的机会必须是均等的,即有同等被抽取到的可能性。
这样总体中原来多的部分被抽取到的机会就多,原来少的部分被抽取到的机会就少,抽取的样本就能很好地代表总体。
总体中每一个对象被抽取的概率是已知的,概率抽样的最大优点,是能用概率计算的方法,客观地评价研究结果的精确度,并且可以按照课题所要求的精确程度,去考虑样本容量和具体的抽样方法。
因此,在准备着手抽样研究时,应该理解概率抽样的意义,尽可能采用。
⒉抽样误差与抽样偏差因为在抽样研究中,只取总体中的一部分作为直接研究的对象,然后根据样本结果去推算总体的一般情况,而这样的推算与总体的实际有着偏差,这种偏差称为抽样误差。
例如,抽样调查学生利用网上资源进行学习的能力时,如果主要是抽取了在家庭里有电脑,平常上网时间较多的学生组成样本,则样本的平均能力就会高于总体的平均能力;如果主要是抽取了较少机会接触电脑和不具备上网条件的学生组成样本,则样本的平均能力就会低于总体的平均能力。
这样的误差是不能完全避免的,但是所抽样本对总体的代表性越好,抽样误差就越小。
抽样偏差则完全不同。
当一个样本未能代表它所要代表的总体时,偏差就进入了。
偏差可能是由多种原因造成的。
只要使用了非随机抽样,或者随机抽样使用的总体源有偏差时,抽样偏差就会发生。
第7章 抽样调查及答案
第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。
它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。
是一种灵活快捷的调查方式。
2.抽样调查有全及总体与样本总体之区分。
样本容量小于30时一般称为小样本。
对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。
样本可能数目与样本容量有关也与抽样的方法有关。
抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。
3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。
正态分布的密度函数有两个重要的参数(σ;x )。
它有对称性、非负性等特点。
中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。
推出了样本分布的标准差为:1--=N n N n x σμ。
4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。
无偏性、一致性和有效性是抽样估计的优良标准。
抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。
抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。
在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N nn x -=1σμ。
在通常情况下总体的方差是未知的,一般要用样本的方差来代替。
把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。
μt =∆,用抽样的平均误差来度量抽样的极限误差。
把抽样估计的把握程度称为抽样估计的置信度。
抽样的极限误差越大,抽样估计的置信度也越大。
抽样估计又可区分为点估计和区间估计。
07章抽样调查基础知识
1.14%
n
150
若按不重复抽样方式:
p(1p) n 0.98(10.98) 150
p
(1 )
(1 )1.137%4
nN
150
15000
三、抽样误差的允许范围
(一)抽样极限误差 抽样极限误差也叫允许误差,是指样本指标与
总体指标之间抽样误差的可能范围。
x x X p pP 将上式等价转换为下列不等式:
抽样误差
一、抽样误差的概念 (一)代表性误差
代表性误差是指在抽样调查中,用部分样 本推断总体时,由于样本各单位的结构情况不 足以代表总体状况而产生的误差。
代表性误差有两种:系统误差和随机误差。
1、系统误差是指破坏了抽样的随机原则而产生 的误差。例如有意识的选取好的单位或较差单 位进行调查造成的误差。
4、抽样组织方式(分层抽样误差较小,整群抽 样误差较大)。
二、抽样平均误差的计算 (一)样本平均数的抽样的平均误差
的计算 重复抽样条件下:
不重复抽样条件下:
(二)样本成数的抽样平均误差的计算 重复抽样条件下: 不重复抽样条件下:
(三)总体方差未知时的解决办法 1.用样本方差、成数代替 2.用过去的资料代替 3.用估计值代替 4.用小规模试验性调查资料代替 见书例2.
例:
某灯泡厂从一天所生产的产品10,000个 中抽取100个检查其寿命,得平均寿命为 2000小时,根据以往资料:σ =20小时, 分别按重复抽样和不重复抽样求抽样平 均误差
重复抽样平均误差为:
202 202(小时 )
x 100 100
不重复抽样平均误差为: x
400(1 100 ) 1.99(小时) 100 10000
吉珠统计学期末考试重点第7章 抽样及抽样分布
x
时, f (x) 的曲线以 x 轴为渐近线。
第七章 抽样调查
4. 标准正态分布
标准正态分布的概率密度函数为:
1 ( z) e , <z< 2
若随机变量 Z 服从标准正态分布, 则记为 Z~ (0, 1)
z2 2
1. 任何一个一般的正态分布,可通过下面的 线性变换转化为标准正态分布
总体均值的区间估计
(一) 大样本时总体均值的区间估计
第七章 抽样调查
例:某企业生产A产品的工人有1000人, 某日采用不重复抽样从中随机抽取100人调查 他们的当日产量,样本人均产量为35件,产量 的样本标准差为4.5件。请以95.45%的臵信度
估计该日人均产量的臵信区间。
解:①计算抽样平均误差
x 0
x a
第七章 抽样调查
标准差 决定密度函数曲线 f (x) 的陡缓程度.
0.5
1
2
第七章 抽样调查
3. 正态分布密度函数的特点
(1) 对称性。 (2) 非负性。
(3) f (x) 在 X x 时达到极大值 f(x ) 1 2
(4) f (x) 的曲线在 X x 处有拐点。 (5 )当
Z X
x2 2
~ N (0,1)
2. 标准正态分布的概率密度函数
1 ( x) e 2 , x
3. 标准正态分布的分布函数 t2 x x 1 -2 ( x) (t )dt e dt 2
第七章 抽样调查
标准正态分布, 具有如下性质或结论:
③计算抽样极限误差
由 1 ) 0.95 ,查t分布表得, (
t n 1 t 2.5% (9)=2.2622
学前教育研究方法,章节测试第七章
第七章如何进行问卷调查一、单项选择题1.概率抽样中运用最广泛、最简便易行的方法是A.简单随机抽样B.系统随机抽样C.整群随机抽样D.分层随机抽样【解析】:A 本题考查的知识点是简单随机抽样的方法。
简单随机抽样是概率抽样中运用最广泛、最简便易行的方法,是其他抽样方法的基础。
在简单随机抽样中,总体中的每一个个体被抽取的概率是均等的,可以通过抽签、随机数字或摇号的方式来实现。
2.问卷回收率很低会影响调查结果,可作为研究结论依据的问卷的回收率应不低于A.30%B.50%C.60%D.70%【解析】:D 本题考查的知识点是问卷的回收率。
问卷的回收率是影响问卷质量的个关键因素,回收率很低会影响调查的结果般来说,回收率在30%左右,资料只能作为参考;回收率在50%~69%时,可以采纳建议;当回收率达到70%以上时,方可作为研究结论的依据。
因此,问卷的回收率一般不应低于70%。
二、多项选择题3.问卷调查的局限主要表现为A.调查工具的统一性B.调查内容的固定性C.调查过程的匿名性D.调查设计的复杂性E.调查结果的客观性【解析】:BD 本题考查的知识点是问卷调查的局限性特点。
问卷调查的局限主要包括:(1)调查对象的限制性;(2)调查内容的固定性;(3)调查设计的复杂性;(4)调查过程的难控性。
A、C、E三项均属问卷调查的优点。
4.下列属于问卷调查的优点的是A.调查过程的匿名性B.调查设计的复杂性C.调查工具的统一性D.调查范围的广泛性E.调查内容的固定性【解析】:ACD 本题考查的知识点是问卷调查的优点。
问卷调查的优点主要包括:(1)调查工具的统一性;(2)调查方式的灵活性;(3)调查范的广泛性;(4)调查内容的深入性;(5)调查过程的匿名性;(6)调查结果的客观性。
B、E两项属于问卷调查的局限。
5.问卷修订是问卷编制一个必不可少的环节,问卷修订的方法主要有A.访谈调查B.开放式问卷调查法C.专家评价法D.小样本预试法E.配额抽样法【解析】:ABCD6.下列属于调查问卷中问题设计的基本要求的是A.问题内容要与调查主体保持一致B.把开放式问题放在问卷结尾C.避免提问带有诱导性D.合理设计敏感性问题E.问题的数量要适度【解析】:ACDE 本题考查的知识点是问卷中问题设计的基本要求。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
问卷的作用
❖ 1、将研究目标转化为特定 的问题;
❖ 2、使问题与答案范围标准 化,每人面临同样的问题环 境;
❖ 3、获得应答者的配合
❖ 4、作为调研的永久记录;
如何评价问卷
❖ 1、问题是否必要; ❖ 2、问卷是否太长; ❖ 3、是否回答了调研目标所需的信息; ❖ 4、外观设计是否符合应答者的要求; ❖ 5、开放试题是否留有足够的空间; ❖ 6、说明是否用了明显的字体。
问卷设计的技巧
❖ 1、应考虑的原则:
❖ (1)、思考调查目标 ❖ (2)、怎样完成访问 ❖ (3)、辅助信息和说明 ❖ (4)、思考设计 ❖ (5)、考虑被访者 ❖ (6)、思考问题的次序 ❖ (7)、问题的类型 ❖ (8)、问题与答案的设置(应是穷尽而无重复的) ❖ (9)、数据的处理 ❖ (10)、对访员的指导
抽样调查的特点
❖ 1、随机原则; ❖ 2、推断总体; ❖ 3、讲求节约
抽样的几个基本概念
❖ 总体:也称为母体,是指具有某种统计特征的一类事物的 全部个案。
❖ 个体:也称个案,指组成总体的每个元素。
❖ 样本:也称抽样总体或样本总体。是指从总体中抽取一部 分代表进行研究分析时,这一部分被抽中的个案所组成的 群体,叫样本。
❖ 样本的统计值:是指在实际研究中直接从样本计算得到的 各种参数。
❖ 总体的参数值:是指那些从已知统计值进行推论得到的各 种量数。
❖ 统计推论:是指用样本的统计值推论总体的参数值的统计 方法。
❖ 例:按照你的喜欢程度,给以下牙膏品牌标上分数。 (最喜欢为5分,第二喜欢为4分,第三喜欢为3分, 第四喜欢为2分,最不喜欢为1分)
黑妹
高露洁
黑人
佳洁士
中华
注:数字既不表示绝对数量,也不表示两个数字之间的差距是相 等的。只是排序用,没有实际的意义。除了统计得分而后排序 外,任何其他的统计都是无意义的。
❖ 2、问卷设计问题的措辞:
❖(1)、多用普通用语,专业用语须解释; ❖(2)、避免一句话有两个同类概念或双重否定语; ❖(3)、防止诱导性暗示性的问题; ❖(4)、敏感性问题须有技巧; ❖(5)、行文浅显; ❖(6)、适当运用方言。
问题的设计
❖ 开放式问题。
❖ 例如,对这个问题你还有什么建议?
第七讲 问卷、测量和抽样
学习目的
❖ 1、了解问卷的作用; ❖ 2、掌握问卷设计的技巧; ❖ 3、掌握问卷评价的标准; ❖ 4、了解并掌握抽样的基本
概念与基本方法; ❖ 5、掌握样本大小与调查结
果的相互关系。
一、问卷
❖ 问卷的定义:是为了达到调查目的和要收集的相 关数据而设计的一系列问题的集合本,它是定量 调查的最基本的手段,是整个调查的生产线上的 一个重要环节,调查者运用问卷这个工具可以 “生产”出调查的基础产品:原始的数据(信 息)。
❖ 2、说明 ❖ 3、主体 ❖ 4、编码号 ❖ 5、致谢语 ❖ 6、实施纪录
问卷设计的程序
❖ 1、确定调研目的; ❖ 2、确定数据收集办法; ❖ 3、确定问题回答形式; ❖ 4、决定问题的用词; ❖ 5、确定问卷的流程和编排; ❖ 6、评价问卷和编排 ❖ 7、获得认可 ❖ 8、预测与修订 ❖ 9、准备 ❖ 10、实施
❖ 定比量表:除了前述的三种量表的功能之外, 还加了绝对零点。即:数字是有实际意义。 Y=A+BX中A=0因此,Y=BX。
❖ 例:你的月收入是多少元?。 ❖ 注:所有的统计方法均适合定比量表。
三、抽样设计
❖ 抽样调查的原则是按照随机的原则从研究总 体中抽取一部分单位进行调查观察,并运用 数理统计的原理,从调查所得数值推断被研 究总体情况。
❖ 5、加快数据分析进程;
❖ 6、验证调研参与者的有效 性。
问卷在市场调查中的作用
问卷的类型
❖ 一、按问题答案分; 1、结构式;2、开放式;3、量表式 ❖ 二、按调查方式分; 1、自填问卷;2、访问问卷 ❖ 三、按问卷用途分: 1、过滤问卷;2、调查问卷;3、回访或复
核问卷
问卷的结构和内容
❖ 1、标题:应开宗明义,一目了然;切不可大 而不当;
准。
定类量表
❖ 定类量表:按照某种规则,将数据分成互相 排斥,互不相容的各种类别。
❖ 例:您的性别是:A、男性;B、女性 ❖ 注:类别量表计算平均数是无意义的,主要
计算众数与频率。
定序量表
❖ 定序量表:除了用类别量表表示特征以外,还增加了 对数字的排序功能。此量表的应用是基于可传递假设 的应用。若A>B>C,则可得A>C.
❖ 封闭式问题
❖ 二项选择题 ❖ 多项选择题 ❖ 顺位题型 ❖ 语意差别题型 ❖ 几种特殊题型
❖ 量表式问题
❖ 评比量表 ❖ 李克特量表 ❖ 配对比;B、女性
❖ 多项选择题举例:
❖ 您的年龄是:
❖ A、16岁以下 ❖ B、17-29岁 ❖ C、30-39岁 ❖ D、40-49岁 ❖ E、50-59岁 ❖ F、60岁以上
❖ 顺位题型举例:
❖ 排序题
❖ 顺位题型举例:
❖ 重要程度顺位填空
❖ 顺位题型举例:
❖ 对比顺位法
❖ 顺位题型举例:
❖ 语意差别题型
❖ 几种特殊题型
❖ 回想法:请列举您所知道的巧克力的品牌:——、 ——、— —、——。
❖ 数值分配法:
❖ 评比量表
量表式问题
❖ 李克特量表
二、 测量
测量的含义:
定距量表
❖ 定距量表:除包含定序量表的所有特征之外, 还增加了量表范围内各点之间的间距是相等 的这一维度。
❖ 注:与定序量表的区别就在于第一与第二之 间的差距到底有多少。但是零点依然是不固 定的。Y=A+BX中,A是不确定的。因而Y1: Y2是没有意义的。除比值以外的计算几乎都 是有意义的。
定比量表
测量的基本要素:
测量的四种尺度
❖ 四种类型的尺度:定类尺度、定序尺度、定距尺度、 定比尺度。
❖ 四种类型的变量:定类变量、定序变量、定距变量、 定比变量。
❖ 测量客体:被测的对象。 ❖ 数字或符号:可以用数字或符号作为测量的语言。
分配给测量的客体; ❖ 测量规则:所数字或符号分配给调查对象的统一标