选择研究对象的方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章选择研究对象的方法
任何研究首先必须要有明确研究对象,然后才能根据研究对象收集资料。在教育研究中,研究对象通常是人,如:学生、教师、家长等,当然,研究对象还可以是与教育有关的现象与问题。
选择研究对象是教育研究设计的主要内容之一,它不仅与研究目的、内容密切相关,而且还直接关系到资料的收集、整理、分析,同时它还涉及到整个研究的费用以及应用范围。一般来说,如果研究对象仅仅是个别的或少数人,通常不存在抽样问题,因为研究对象的总体差不多就是研究的直接对象。但是绝大多数研究课题设计的对象总体比较大,有时趋于无穷。要将课题规定的所有对象都拿来进行研究往往是难以做到的,也没有必要,因此需要选择部分的研究对象,这样的程序和方法,用一个专业术语表示就是“抽样”。
一、抽样的基本原理
抽样(Sampling)就是从一个总体(population)中抽取部分具有代表性的个体作为样本(sample),然后用这一样本的结果去推断总体。在这里,总体指研究对象的全体,样本是指从总体中抽取的部分个体。
例如做汤,为了知道汤的咸淡,没有必要等到一锅汤喝完后再对汤的味道下结论,只需舀一勺汤品尝一下,然后根据尝的味道推断这锅汤的味道。在这里,一锅汤就是研究的的总体,而这一勺汤则是从总体中选取得到的样本。又如,我们要了解上海市小学三年级学生的识字量是多少?由于全市小学三年级学生数量巨大,不可能给每个学生都测量一下,研究只能在上海市小学三年级学生总体中抽取部分个体对他们进行识字量测验,然后从得出的研究结果推断全市小学生的识字量。假设上海市小学三年级学生总体为100000人,从中随机抽取样本1000人,并对这1000人进行识字量测试,获得结果为平均识字量1600字,然后根据测试结果推断上海市小学三年级学生平均识字量为1600字左右。抽样的基本原理见下图:
推断
图7-1 抽样基本原理关系图
抽样是以概率论为理论基础。抽样的作用是为了合理地减少研究对象,既可以节约人力、物力、时间,又可使研究力量相对集中,使研究工作深入、细致,从而提高研究的准确性和可靠性。
一般来说,定性研究中抽取的样本很小,样本有时仅仅是一个案例或一个个体,研究目的
是为了对所研究对象进行更深入的了解。而定量研究的样本数较大,样本可以是一群个体,并要考虑样本能否准确代表总体,能否对总体作出推断。
二、抽样的基本要求
抽样是有一定规则的,抽样的基本要求是:
1.总体范围的确定
抽样,首先要明确规定抽样的总体范围,一般来说,研究课题和研究目的决定了总体的范围。如,“上海市区初中学生身体素质的调查”这个课题的总体就是上海市区全体初一至初三的中学生,不包括郊县的初中生。如果总体范围不很清楚,在抽样前应对总体做出明确的规定。否则,会对抽取样本和研究结果的推断造成麻烦。通常研究课题的确立就已基本框定了总体范围,研究者要考虑的是为什么要确定该总体的理由,以及研究的预期效果和可行性问题。2.抽样的随机化
抽样要尽可能做到随机化(random)。随机化是指总体中的每个个体被选入样本的概率(probability)不为零。也就是说,总体中的每一个个体入选的机会均等。随机是科学研究的基本原则。抽样的随机化是一种精确而科学的过程,是科学研究结果可靠性的保证,可以避免研究者自觉或不自觉的偏见。抽签、摇奖就是根据抽样的随机化原理设计的。严格的抽样必须是随机的,这样可避免研究者的主观倾向或人为因素造成的抽样偏差(sampling bias)。
3.样本的代表性
样本的代表性指样本应具备总体的性质或特征,样本能在较大程度上代表总体。样本研究的关键在于抽样和推论,抽样是推论的先决条件,样本的代表性会影响研究结论的可靠性和研究结论的推断程度。代表性越高的样本,其研究结果的普遍性就越大;反之,如果样本没有代表性往往会导致研究的失败。常为人引用的一个例子是:1936年美国的总统大选,当时美国的《文学文摘》杂志曾做了一次关于总统大选的民意调查,调查结果预测兰登将在总统选举中获胜,罗斯福落选。但事实正好相反,选举结果是罗斯福当选总统。虽然《文学文摘》杂志的民意调查样本数很大,但调查者的样本是从电话号簿和汽车登记册中抽取的。1936年正是美国经济大萧条过后,有汽车有电话的人仅代表了美国选民中的某个特定阶层,对于选民总体来说不具备代表性。这次民意调查的失败主要在于抽样偏差,样本没有代表性,抽取的样本在质上与总体特征不相吻合。
与此同时,盖洛普民意调查所也作了总统大选的调查,只发了2000份问卷,结果预测成功,罗斯福当选总统。后来盖洛普嘲笑《文学文摘》杂志说:“用两匹马来拉的车,用50匹马来拉是无用的。”
4.合理的样本容量
样本容量又称样本大小,是指抽取样本的具体数量。样本数量的多少是研究无法回避的问题,是研究设计中重要的一环,也是比较困难的一件事。它既要符合研究目的、内容,满足教育统计的要求,又要考虑抽样的可能性,并使误差减少到最低限度。一般来说,样本数越多,代表性越好,但是增大样本,势必增加研究的人力、物力、财力,增加研究的难度,造成不必要的浪费。如果样本数太小,则抽样误差较大,样本不能代表总体,不利于统计分析,影响研究效果。样本数量究竟多少为宜,这是一个复杂的问题。我们很难说出一个确定的数字,样本数量要从多个方面综合起来考虑。一般来说,样本容量大小取决于以下一些因素:
(1)研究的类型、范围
当研究是定量研究,研究范围较广,样本数量可适当大一些;反之,当研究是定性研究,研究范围较狭窄,样本数量可适当少一些。
(2)研究分析的精确程度
当研究要求有较高的统计显著程度,具有较高的可信程度时,样本数量可多些;反之,则可少些。
(3)允许误差的大小
当研究允许的误差值小,要求的可信程度高,所需样本容量相应要大;反之,则可小些。
表7-1 表示当总体趋于无限大时,不同的允许误差和可信程度要求不同的样本数量。
表7-1 允许误差和可信程度与样本容量关系表①
可信程度
允许误差95% 99%
1% 9604 16587
2% 2401 4147
3% 1067 1843
4% 600 1037
5% 384 663
6% 267 461
7% 196 339
(4)总体的同质性
当总体的变异性比较大,变量的相关程度比较低,研究的条件控制不严格,样本数量可适当增加些;反之,当总体同质性比较好,变量的相关程度较高,研究条件控制严格,则可少些。如,人的血液同质性比较好,医院化验只需抽取一点点血。学生的智力、能力变异性比较大,因此抽取样本相对比较大。
(5)测量工具的可靠程度
当测量工具的可靠程度即测定指标信度比较低时,测量的误差就比较大,这时需要增大样本数量;反之,则可减少样本数量。一般说来,有关学习能力和成就的测量工具可靠性程度好些,有关人格特质、自我概念、态度等方面的测量工具可靠程度差些。
(6)研究的成本
研究的成本包括经费、时间、人力、物力,抽样数量总是要控制在研究成本允许的范围内。因此,确定样本容量时,必须仔细分析研究的条件,量体裁衣。
(7)分析的类别
当研究的关系复杂,分析的项目较多,那么样本数量可多些;反之,则可少些。一般应保证每一分析小类的样本数量不少于10。
以上七个方面都是原则性的意见,可作为决定样本容量大小的参考依据。下面根据实际经验提供一些可参照的数据:
教育研究中的调查或描述现状的研究,样本数量最好不要少于100;
相关性研究中,样本数量最好不少于30;
实验研究中,每组样本数量最好不少于30;
全国性的调查,样本数量控制在1500—2500之间;
地区性的调查,样本数量控制在500—1000之间。
当然,以上给出的数字仅仅供参考,在研究中具体样本数为多少,还需根据实际情况作出决定。对于初学者,不妨先查看有关文献中的同类研究,别人的样本数量是多少以作为参照。另外,我们还可以根据推算样本数量的公式计算出总体数量与样本数量的参照数据,见表7-2
①转引自袁方主编:《社会研究方法教程》北京大学出版社,1997年,第225页。