研究假设的统计推断
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
研究假设的统计推断
在实际的教育科研中,我们经常遇到诸如不同类型学生的某一方面表现是否有差异之类的问题,这就涉及到统计分析中的另一个方面内容——统计推断。例如,要研究城乡学生的科普读物阅读量是否有差别,我们的研究总体是城市的学生和农村的学生,我们要比较的两个总体中学生阅读量的平均数是否相同,落实到具体的研究方法是分别从城市和农村随机选取部分学生,比较他们的阅读量是否不同,以此来推断城乡学生的阅读量是否不同。我们不可能把所有城市学生和农村学生的阅读量进行全面统计,即使能够做到也没有科研效益,我们用选出的这部分学生之间阅读量的差异推断城乡学生的阅读量是否不同,这就是统计推断的一个例子。
第一节统计推断概述
一.统计推断的概念与意义
1.统计推断的概念
什么是统计推断?简单地说,利用样本的资料,对总体的某些性质进行估计或做出推测性的判断,从而认识该总体,这就称为统计推断。例如,根据某几所中学初一学生语文期末测验的成绩分数估计该市初一学生语文期末测验成绩;根据某校男、女学生智力测验分数来推断男女学生智力水平是否有显著差异等,这些都属于统计推断的范围。
2.统计推断的意义
在教育科研中,人们不可能也不必要对所有研究对象的每一个体逐一进行观测,而只需对样本的特征加以考察分析,然后根据这些样本提供的信息去推断、认识总体的特征。所以,为了认识样本平均数对总体进行估计的可靠性;或根据两个样本平均数之差,决定总体平均数是否有本质差别等,都必须进行统计推断。
在具体的观测和实验研究的过程中,会受到各种因素的影响,如抽样方法、观察和实验条件、被试情况等,这就会使观测或测验的结果产生误差。为了正确地估计总体参数,并判断实验条件的效应,必须估计误差在观测和实验中所起到的作用。为此,也需要进行统计推断。
二.统计推断的内容
统计推断的内容主要分为两大部分:参数估计和假设检验。参数估计有点估计、区间估计两种;假设检验包括参数检验和非参数检验两大类,参数检验主要有Z检验、t检验等,非参数检 检验、符号检验等。当然,参数检验在统计准确度和分析效度等方面要比非参数检验主要有2
验高,但其应用范围却不如非参数检验广泛,因此,在参数检验的条件不满足时,非参数检验值
得应用。
三.统计推断的前提条件
在统计推断中,我们是利用样本统计量估计和推测总体参数的。那么,很重要的一点就是要保证样本的代表性。因为如果从总体中抽取出来的样本缺乏代表性,那么利用这个样本提供的信息是难以准确有效地推测总体的某些分布特征的。因此,搞好统计推断的前提条件就是要利用随机抽样,尽量减小抽样误差。
如何做好随机抽样,这是提高统计推断结果的正确性和可靠性的所必须给予重视的问题。所谓随机抽样就是指从一个总体中抽取若干个体组成样本时,每个个体被抽中的机会均等,并且每个个体的抽取相互独立,与其他个体是否被抽中无关。正因为如此,所以随机抽样可以避免样本来自总体的某个部分,以相当大的可能来保持与总体结构的相同,具有了很大的代表性。
也应注意到,样本对总体而言,它是否具有代表性,这与其容量的大小也有很大的关系。一般来说,在其它条件相同的情况下,样本容量越大,抽样误差就会越小。很显然,当样本容量增加到包含了总体所有个体时,抽样误差就减少到0。反之,如果样本容量过小,会造成抽样误差增大,进而影响到总体参数推断的精确性。所以,在条件允许的情况下,应该尽可能地增大样本的容量,以提高统计推断的有效性。
四.统计推断中涉及的几个概念
1.总体与样本
总体是我们所研究的个体的总和。包含个体数目有限的总体,称为有限总体。例如,我们要研究去年某学校的高考成绩,这是有限总体。包含个体数目无限的总体,称为无限总体。例如,我们在研究10岁女童的身高时,可以将古今中外10岁女童的身高看成是一个总体,这个总体就是一个无限总体。
总体包含个体的数目不是绝对的,要根据我们的研究目的和范围来确定。例如,我们要研究小学三年级学生的创造性能力,可以根据需要将某校、某区、某市、某省、全国或全世界的小学三年级学生作为总体。当然,作为总体,它所包含的个体数目要达到一定大的程度。
样本,顾名思义就是作为研究对象、对总体具有一定代表性的一部分个体。
样本中包含的个体数目称为样本的容量,通常用字母n来表示。样本可以分大样本与小样本,可依据研究和实验的要求与条件加以选择确定。一般把样本容量在30以上的(n>30)称为大样本,在30以下的(n<30)称为小样本。样本如果过小,则容易失去代表性,有时个别数值的变化就会对整个统计结果发生重大影响。对大样本或小样本进行统计推断,所采用的方法是不完全相同的。
2.简单随机抽样
如果总体中每个个体被抽到的机会是均等的(即抽样的随机性),并且在抽取一个个体之后总体内成分不变(抽样的独立性),这种抽样方法称为简单随机抽样。简单随机抽样是最简单的抽样方法,它简便易行,使用范围广。常用的方式有:抽签法、随机数字表法等。
抽签法:先将总体中每个个体编上号码,再将每个号码写在签上,将签充分混合后,从中抽取n个(即样本的容量)签,与被抽到的签号相应的个体就进入样本。
随机数字表法:利用随机数字表抽样是简单随机抽样中常用的一种方法。随机数字表是用电子随机编号器编成的,由许多随机数排列起来的数字表。例如,要从30人的班级中抽选出5个学生作为样本,先把这30个学生编号,然后任意从表中的一个数字作为起点,或向上、向下、向左、向右的数字,选用其头两位按顺序选取5个。凡是编号与选取的数字相同者,定为被选对象,构成样本。
除利用随机数字表产生随机数字外,还可以利用计算机编制程序,或在计算机上产生随机数,这样抽样也很方便。
3.机械随机抽样
机械随机抽样要先将总体中的所有个体按一定顺序编号,然后按确定的相等距离抽取个体(间隔距离的大小依据所需样本与总体中个体数目的比率而定)。例如,要从1000个学生中抽取10名学生作为样本,可将这1000名学生从1—1000编号后,先从1—100编号中随机抽出一个号码,假定是39,以下从39号开始,每隔100个号码抽取一个,抽到39,139,239, (939)
共10个编号,这些编号对应的学生就构成容量为10的样本。
4.分层随机抽样
分层随机抽样也称类型随机抽样。先把总体按一定标准分为同质的若干层或类型,然后在每层或类型中随机抽样。采用分层随机抽样时应遵循一个基本原则,即所分的各层内的差异要尽量小,二层与层之间的差异要尽量大。对一个总体来说,怎样分层要视具体情况而定,分层的标准可以是一个,也可以是多个。例如,研究某校高三毕业生的数学推理能力,可按文、理分层,各自取样。而要调查某省高中二年级学生的实验能力,在抽样时就应考虑性别、城乡、学校是否重点、家庭等等各种因素,以这几个标准作为分层标准,依次分层,再抽取样本。
在把总体分好层次后,如何将样本容量n合理地分到各层中去,常用的方法是根据各层人数的多少按比例抽取。
例如,对某校1000名学生的品德情况进行调查,拟采用分层随机抽样来抽取50名学生作为样本。那么,可先根据一定标准将1000名学生分成优(200人)、良(370人)、中(250人)、