实验数据的统计分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三节实验数据的统计分析
一、统计表和统计图
在心理学实验研究中,一般都是先获得一大堆原始数据和观测材料,虽然这些数据乍看起来十分凌乱,但它们却是实验所获得的最宝贵的财富。
实验做完以后的分析和立论,都将以这些数据为基础。
因此,为使实验获得成功,数据的整理十分重要。
在数据整理的过程中,第一步是对数据的特点和种类加以分析,绘制出简单的统计图和统计表。
统计图和统计表的一个共同优点在于一目了然,它所表示的信息容易被人们理解和接受。
有人曾给予一个不甚恰当的比喻,如果文字的信息量是“1”,那么统计表的信息量就是“10”,统计图的信息量则是“100”。
艾宾浩斯(Ebbinghaus Hermann,1850~1909)著名的遗忘曲线就是用一个统计图概述了他实验的全貌。
下面我们分别来介绍统计表和统计图的制作方法。
(一)统计表
1.统计表的功能和结构在心理学研究报告中免不了要用几张统计表。
这是因为,统计表(statistical table)是对被研究的心理现象和过程的数字资料加以合理叙述的形式。
它在叙述统计资料方面有着重要的作用,有人称之为统计的速记。
设计良好的统计表使统计资料表现得充分、明显而又深刻、有力,可以避免冗长的叙述。
统计表由标题、横行和纵栏、数字资料等要素组成。
统计表的构造一般包括如下几个项目:
(1)序号:序号就是表的编号,要写在表的上方,表题的左方。
序号一般以在文章中出现的先后顺序编列。
(2)名称:又称表题,是一个表的名称,应写在表的上方序号之后。
表题的用语要简洁扼要,使人一望可知表的内容。
如果用语过简,可在下面附加说明,但这种情况不宜多用。
(3)标目:又分横标目和纵标目。
横行标目写在表的左方;纵列标目写在表的上方,分别说明横行和纵栏的内容。
(4)数字:数字是统计表的语言,又称统计指标。
它占据统计表的大部分空间,书写一定要整齐,位数要上下对齐,小数点后缺位的要补零,缺数字的项要用“—”符号表示,不能空白。
(5)表注:写于表的下方。
它不是统计表的必要组成部分。
如果需要可对标目补充说明。
数据性质、数据来源、附记等都可作为表注的内容,文字可长可短,参见表 2-15。
表2-15 29名被试康复治疗前后体重差别阈值的变化
为了使统计表能对所研究的心理现象以鲜明的数字叙述,制表时应注意以下几点:
(1)每一张统计表都必须有名称,统计表的各种标题,特别是表题的表达,应十分确切明了。
内容应紧凑而富有表现力,避免过分庞大和琐碎。
(2)表的各纵列之间要用线条隔开,表的两个纵线可以省去,上下两边须有横线,标目与数字之间、数字和总计之间、两个总标目之间都须用线条隔开。
表的上下二横线条要粗些。
(3)表中各栏,通常是根据由局部到全部的原则编列的。
(4)统计表应有计量单位名称。
计量单位名称,通常加用圆括号并置于表头的右上方,或者置于标题或标目的下面。
2.统计表的种类统计表可以以形式及内容的不同来作为分类标志,将其划分成不同的类型。
不同类型的统计表的具体功能不同。
下面简述几种常用统计表:
(1)简单表:只列出调查名称、地址时序或统计指标名称的统计表。
例如表 2-15。
(2)复合表:统计分组的标志有两个或两个以上的表。
若只有两个分组指标的称两项表;若分组指标有三个的称为三项表,依此类推。
表2-16就是一个复合表,且分类的标目有五个:间隔时间、实验数、节省百分数、节省百分数的中数、中数机误。
表2-16 不同时间间隔后的记忆成绩
(采自 Ebbinghaus, 1885)
表2-16就是艾宾浩斯(Ebbinghaus, 1885)
实验研究的主要结果,这个统计表集中了他对1,300个字表,反复测定了学习和回忆间隔时间的长短同遗忘的关系,分类统计而成。
有了这个表,他就可以绘制成著名的遗忘曲线(forgetting curve)(见 70页图 2-6)。
(二)统计图
为了写好实验报告,还需要利用统计图来表明心理现象的数量关系,这样就不需要作很多解释就可以让读者看懂。
统计图有明显的优点,它不仅对统计资料和实验结果做出具体、明确的表达,易为读者所理解和获得深刻印象,而且由于统计图的表现生动活泼、醒目动人,具有很强的说服力。
所以统计图是分析统计资料的重要工具,也是实验报告的重要内容。
通过作图,可帮助我们揭示心理规律。
但是统计图也有不足之处,它不能获得确切数字,如果作图不当反而会掩盖事实真相,因而我们不能用统计图来代替统计表。
在论文中,常将统计图和统计表一并列出。
下面我们分别来讨论统计图的功用、结构和种类。
1.统计图的功用和结构统计图(statistical figure)乃是依据数字资料,应用点、线、面、体、色彩等来绘制成整齐而又规律、简明而又数量化的图形。
统计图在数据整理中占有很重要的地位。
一图知万言,一张简单的图形,就可以把一大堆数据中有用信息概括地表现出来。
统计图一般多采用直角坐标系,横坐标用来表示事物的组成或自变量X,纵坐标常用来表示事物出现的次数或因变量Y,除直角坐标外还有角度坐标等。
2.统计图的结构与制图要点
(1)图号及图题:统计图的名称为图题。
图题的文字应简要,只要求能扼要地叙述统计图的内容,使人一见就能知道图所要显示的是何事、何物,发生于何时、何地。
图号是图的序号,图题与图号一般写在图的下方。
图题的字体应是图中所用文字中最大的,但也不能过大,要与整个图形的大小相称,一般与图目文字的顺序一致,从左至右书写,放在居中的位置上。
(2)图目:是写在图形基线上的各种不同类别、名称,或时间、空间的统计数量,即坐标上所有的各种单位名称。
在统计图的横坐标和纵坐标上都要用一定的距离表示各种单位,这些单位称为图尺,有算术单位,亦有对数单位,百分单位等等,这要根据资料的情况加以选用,图尺分点要清楚,整个图尺大小要包括所有的数据值,如果数据值大小相差悬殊,图尺可用断尺或对数法,进行技术处理,减少图幅,增强图形效果。
(3)图形:是图的主要部分,图形曲线要清晰,一般除图形线外,应尽量避免书写文字。
为表示不同的结果,要用不同的图形线以示区别,各种图形线的含义用文字标明,选图中或图外一适当位置表示,目的是使整个图和谐美观且醒目。
(4)图注:凡图形或其局部或某一点,需要借助文字或数字加以补充说明的,均称为图注。
图注部分的文字要少,印刷字型一般要小,它可以帮助读者理解图形所示资料,提高统计图的使用价值,却又不破坏图的协调性。
此外,一个图形要使用各种线条,这些线条因在图中的位置不同而有不同的名称,如图形基线(横坐标)、尺度线(纵坐标)、指导线、边框线等。
3.统计图的种类常用的统计图有曲线图、条形图、直方图、点图、圆形图等等。
通常表示事物各组成部分的构成情况的资料可用圆形图;频数分布资料可用直方图;资料内容各个独立者可用直条图;表示事物数量发展过程的连续性资料可用曲线图;表示两种事物的相关性的趋势可用点图。
下面我们分别介绍这几种图。
(1)曲线图:适用于连续性资料,表示事物数量在时间上的发展变动情况。
因为借助于连续曲线,能够最恰当地描绘出心理现象在时间上的不断变化过程,见图2-6。
绘制曲线图时,以横轴尺度表示时间、年龄等等,纵轴表示频数。
纵、横轴尺度必须等距或有一定规则。
纵轴尺度一般要从零开始,图线应按实际数字绘制,切勿任意描改为光滑曲线。
若有几根曲线,应用不同形式的线条(实线、断线、点线等)区别开来,并用文字说明。
对数尺度曲线图是动态曲线图的一种特殊图式。
图形的一轴制订出对数尺度,另一轴则按原样。
图2-7是一个以分计的对数时间作横轴尺度,这样,我们从短短的横轴上看到了二年时间内的发展
趋势,同时还看到了与相对量有关的绝对量的大致变动情况。
(2)条形图:以相同宽度的条形长短来比较图形指标的大小,它是比较图中最常用的图形。
条形图绘制方法简单,同时形式明确,图示效果好。
绘图时,须先绘制一水平线作为条形的共同基线,依此基线为起点所绘制的条形的长度,视图示的指标数值的大小而定。
因此,必须定出一个比例尺度,作为绘制条形图的依据,同时各个条形的宽度要相等,各(组)条形间要有相当的间隙。
图2-8就是条形图。
条形图有好几种。
以同一水平线为基线的纵式条形图,也可制作成横式条形图。
(3)圆形图:一般用来表示事物各组成部分的构成情况。
以一个圆的总面积代表总数,把面积按比例分成若干部分,以圆心角的角度大小来表示各组成部分的数量(如百分比)。
代表圆面积中1%面积的扇形有3.6度的弧,各扇形面积中要标明百分数,并加文字说明。
图2-9是一种表示被试来源的圆形图。
不过一般被试来源用不着作图,作了图就有强调被试构成成分的含义。
(4)点图:表示两种事物相关性的趋势多采用点图。
图的纵轴尺度和横轴尺度代表一种变量值的大小。
习惯上自变量(X)的尺度放在横轴,因变量(Y)的尺度放在纵轴。
不论纵轴、横轴的尺度都不必从零点起。
在自变量与因变量的交叉点绘一个点,我们依据点的情况可以推测两种事物的相关情况。
参见图2-10。
二、实验数据的初步整理
心理学研究的结果一般都有数量记录,这些原始的数字材料往往是复杂而分散的,使人读了难得要领。
因此必须经过分析整理,把材料有系统地组织起来。
经统计处理能使复杂的材料变得简单扼要,把事实要点表示出来。
下面我们从统计学的角度,概括地介绍如何对实验所得的大量原始资料进行科学的加工整理。
使用图表概括大量实验结果,这仅仅是对数据整理的第一步。
实验所得资料只是表明每个个体的详细资料,为了能够反映综合特征,集中量和差异量是两个特别重要的参数。
在次数分布上有两个重要特征:即重心位置和分布范围。
用一定量数概括、规定重心位置的数字叫集中量,而用一定量数概括、规定分布范围的数字叫差异量。
在介绍集中量和差异量之前,我们先讨论有关误差的问题。
(一)偶然误差与系统误差
大家都有这样的经验,无论实验做得多么精密,获得的观测数据总不完全一致,表现为数据的波动。
产生数据波动的原因是因为有许多偶然因素影响着实验结果。
1.偶然误差偶然误差(fortuitous error)或机误(chance error)是指实验中无法控制的偶然因素所引起的误差。
例如测量仪器的灵敏度的有限性。
又如,在有些测量中并未把温度、湿度看成影响因素,但是,温度和湿度时刻都在变化,这些都是偶然因素。
无数的偶然因素影响着实验或观测结果,使得测出的数据范围绕真值有一些上下波动。
例如,用天平称某物体的重量,进行10次观测得到10个数据,记在表 2-17的第二列(栏)。
如果此物体重量的真值为a=150.6克,表2-17中第三列(栏)记下的是各观测值与真值之差。
设:a为某变量的真值,X1,X2,……,Xi为其各次的观测值,则数X i-a(i=1,2,3,……,n)叫做Xi的偶然误差。
表2-17 10次观测所得的原始数据
(采自华东师大数学系,1980)
从表2-17第三列看出偶然误差可正可负,可大可小,因为它是由无法控制的偶然因素引起的。
2.系统误差有时在实验中还会出现另一种类型的误差,它的观测值不是分散在真值的两侧,而是有方向性和系统性的。
所有重复实验的观测值大部分都会比真值偏高、或者偏低,其原因是存在有系统误差(systematicerror)。
产生系统误差的原因有很多,如上例中可有仪器的故障,有时也要考虑实验环境如照明、温度、压力、湿度的变化对实验结果的影响,这时照明、温度、压力、湿度的变化就不能视为偶然因素了,而是系统误差因素。
另外,在心理实验中,观测者本身的一些因素(如位置、练习、疲劳、时间等),也能产生系统误差。
排除系统误差是实验成败的关键。
(二)集中量
对数据的概括了解,在统计学上常由二种量数来表示:一为表示集中趋势(central tendency)的集中量(或集中量数)(measure of central ten- dency);一为表示离中趋势(variation)的差异量(measure of variation)。
常用的集中量有平均数、中数和众数。
下面我们分别进行讨论。
1.平均数一个物理量的真值是客观存在的,通常我们无法知道它的真值,而是通过测量或实验观测算出它的近似值。
平均数(mean)或称算术平均数(mathematic mean)就是把一组数据加起来再用次数去除。
它是刻画数据集中位置的极为重要的数。
因此,平均数有两个意义:(1)对一组数据获得一个总的印象;(2)将此组数据和另一组数据进行比较。
平均数是一个主要量数。
平均数用符号M表示,其计算公式为:
X:每一个度量
Σ:总和
n:度量的总次数
假如所测原始数据较多,可以进行归组计算,则求平均数的公式为
f:每组的次数
X':各组的均数
2.中数中数(或中位数、中点数)(median,简称 Mdn)常用符号M d表示。
中数是在按大小顺序排列的一组数据中,占中间位置的那个数。
这个数可能是数据中的某一个,也可能不是原有数。
中数是集中量数的一种,它能描述一组数据的典型情况,其特点是极少受极端数据影响。
单列数据的中数的计算方法十分简单。
如果个数为奇数,则取序列为第(n+1)/2的那个数据为中数。
如果数据为偶数,则取序列为第(n/2)或第(n/2+1)这二个数的平均数为中数。
例如有下列八个数,大小排列为: 3,5, 6,9, 10, 11, 13, 16。
序列为 n/2(即第 4个数)的数为9;序列为 n/2+1(即第5个数)的数为10,则中数为第4个和第5个二个数的平均数,即(9+10)/2=9.5。
假如数据较多,也可以进行归组计算。
则求中数的公式为:
L:含有中数那一组的真实下限
n:度量总数
F:低于含有中数那一组的度量数
i:组距
f:含中数那一组里的度量数
3.众数众数(或密集数、通常数、范数)(mode,简称Mo)通常用符号M0表示。
众数是在整个分数里次数最多的一个度量,在分组的次数分配上便是次数最多的一个组的中点。
它也是一个集中量数,也可用来代表一组数据的集中趋势。
众数计算起来很快,不论是分组的数据还是未分组的数据,都可用观察法来求众数。
例如有一组数据为4,5,6,5,7,5,3,6,不难看出5出现次数最多,因此众数为5。
在数据整理成数据分布的过程中,同一数据由于分组组距的大小可变动,因此组距中点的数值也必随之而有改变,致使众数也有相当的移动。
所以众数是不够稳定的,在比较结果时它只能用作约略的参考而已,因为众数受分组情况的不同而有所不同。
在心理学上,众数和平均数的差别能反映实验的难度。
如果平均数大于众数,说明大多数人的
度量结果低于平均数,可见在此实验中多数被试者存在低估的情况。
反之,如果平均数小于众数,说明大多数人的度量结果高于平均数,可见在此实验中多数被试存在高估的情况。
在统计学上,众数和平均数之差可作为分配偏态(skewness distribution)的指标之一,如平均数大于众数,称为正偏态(positive skewness);相反,则称为负偏态(negative skewness)。
以上我们讨论了三种集中量。
统计分析时可选择使用一种、二种或全使用。
一般而言,平均数和中数用得较多些。
当没有极端数字影响,数据分布比较对称,此后的运算需要平均数时,应使用平均数。
当数据中有极端数据,数据分布不对称时,应使用中数。
当需要很快估计出集中趋势或需要知道最多的典型情况时,应使用众数。
另外,我们在日常体育和艺术比赛中,也广泛地使用这些集中量数。
例如“去掉一个最高分,去掉一个最低分”等等,都是为了能更好地反映集中趋势。
(三)差异量
前面讲到的集中量,只描述数据的集中趋势和典型情况,它不能说明一组数据的全貌。
一组数据除典型情况之外,还有变异性的特点。
对于数据变异性即离中趋势进行度量的一组统计量,称之为差异量(或变异量数)(mea- sures of variation)。
这些差异量主要有全距、平均差、四分差、百分位差等,它们被称为低效差异量;标准差或方差被称为高效差异量。
1.低效差异量
(1)全距(或两极差)(range):常用符号R表示。
它是一组数据离散程度最简单的度量。
计算起来也十分简便,可用如下公式求得:
R=U-L〔公式 2-4〕
R:全距
U:一组数据中的最大值
L:一组数据中的最小值
全距的计算比较简单,而且能回答我们直觉地提出的关于变量范围和间距等诸如此类的问题。
但是全距与下面将介绍的其他差异量相比较,是比较不稳定的,因为,它仅仅是从分配中的两个个案的数值计算得来的,所以随机遇变化的幅度很大。
(2)四分差(quartile deviation):是指在一个次数分配中,中间 50%的次数的全距的一半。
四分差常用符号Q表示。
其计算公式为:
Q:四分差
Q3:第三个四分位数
Q1:第一个四分位数
从以上公式可见四分差的计算也很简单,然而意义却十分明了。
这就是说,在全分配上第一个四分位数与第三个四分位数之间包含着全体项数之半。
次数分配越集中,离中趋势越小,则这二者的距离也越小。
因此,根据这两个四分位数的关系,观测次数分配的离散程度,也可以得到相当高
的准确性。
可见,四分差可说明某系列数据中间部分的离散程度,并可避免两极端值的影响。
(3)百分位数(percentile):百分位数的度量在心理学中也常用以表示度量的变异性。
例如关于感受性的实验,要使刺激能被某组被试中百分之九十的人清晰的感受到,那就用到第九十个百分位数了。
百分位数的求法与中数相同。
实际上中数本身也是一个百分位数,它是第五十个百分位数。
另外,百分位数也可以相当准确地用作图法求出,就是在绘成的累积次数曲线上进行简单的内插处理。
(4)平均差(简称均差)(average deviation):一般多用符号AD来表示。
这也是一种检验离散程度通用的计算。
尤其在阅读早年的心理学研究报告时,时常遇到用此度量表示离中趋势。
它能告诉我们一组数据里所有的各量度与平均数的差数平均是多少。
其计算公式为:
Ad:平均差
M:平均数
X:每一量数
n:总量数之和
等式里两条垂直线表示两线段之间的数字只计其绝对值,而不计其正负号。
因为我们感兴趣的是各个量度距离平均数有多远,而不管各个量度是比平均数大,还是比平均数小。
从公式上可以看到,平均差的求法就是先算出各量度与平均数之差,不计正负号,加在一起,除以总次数,其商数就是平均差。
平均差有其独特的功能,下一章将讲到的平均差误法(一种心理物理法)就是由平均差引伸而出的。
但是平均差也有欠缺之处,即它易受极端数值的影响。
2.高效差异量高效差异量,顾名思义是指这些差异量能效率较高地反映分布范围。
高效差异量有二个:标准差和方差。
它们的具体优点很多。
与全距相比,标准差和方差大大减少了两极端值的影响;与四分差相比,它们在计算过程中考虑到全部的离差;与平均差相比,它们在离差测定中避免了绝对值,因而有利于代数处理,从总体上看,与低效差异量相比,它们既能用于小样组,又能用于大样组。
鉴于高效差异量的种种优点,在整理资料中常用标准差和方差。
下面我们分别讨论这两个差异量。
(1)方差(或变异数、变差、均方)(variance):方差是每个数据与此组数据的平均数之差乘方后的均值,也就是离均差X d平方后的平均数,它是度量数据分散程度的一个很重要的量数。
方差作为统计量时,常用符号S2表示。
方差的计算公式为:
(2)标准差(standard deviation)是方差的平方根,通常用S或SD来表示。
标准差的计算公式为:
S:标准差
X i:个别分数
n:总量数
当观测次数n<25时,亦即样本较小时,若除数用n算出来的数值用来估计总体标准差时往往会偏低,因此可用n-1作为除数。
上述公式2-8A就变为:
这样公式写成:
兹举一个工业心理学中的例子来说明离中趋势和平均数代表性之间的关系。
设有两个生产小组各有工人11人,生产同样数量的零件,每人每天生产零件数如下:甲组:3、4、5、8、10、15、17、18、22、30、33;乙组:10、11、12、13、14、15、16、17、18、19、20。
为计算方便,这里用公式2-8A对81页列表2-18进行运算。
两组工人平均日产零件数都为15件,它们的标准差却彼此不同。
标准差是描写数据围绕其算术平均值离散程度的一个很重要的数据,具有重要的理论意义和实际意义:(1)首先说明平均数代表性的高低。
上例告诉我们,虽然两组工人的平均日产零件数相等,但对两组工人的代表性来说,就不一样了。
对甲组的代表性较小,而对乙组的代表性则相对大多了。
可见把平均数和离中趋势结合起来应用,对反映现象的典型特征来说,具有一定的意义;(2)其次,在确定现象水平的基础上,进一步测定现象发生的节奏性或稳定程度。
例如,工业生产中就可以通过离中趋势来看该企业执行计划的节奏性,变动程度很大的,就说明生产中存在着突击现象,前松后紧,时作时辍,还可以推测工作效率。
标准差用途很多,常用的主要有:(1)表示变量频数分配的离散程度:
表2-18 甲、乙生产小组工人日产零件数及其计算标准差过程
(采自中科院心理所,1980)
在前面讨论过的例子中可以看到,在均数相同的情况下,标准差大,表示变量值分布得较散;标准差小表示变量值在平均数附近分布密集。
(2)对变量频数分配作出概括性的估计:统计学发现大多数的测量资料在数量很大时,其变量频数分配是靠中间近的比较多,离开中间远的比较少,且越远的越少,这种分配称为常态分配。
常态分配是有一定规律可循的。
这就是:总体内约有68%左右的个体变量值在平均数±1个标准差范围内;总体内约有95%左右的个体变量值在平均数±2个标准差范围内;总体内约有99.7%左右的个体变量值在平均数±3个标准差范围内。
根据这个规律,只要算出平均数和标准差之后,就可以通过一批实际样本测量资料对所要研究的总体做出概括的估计。
(3)应用标准差计算平均数的标准误。
同时它还是许多其他统计指标如正态曲线、相关系数、统计检验等的计算公式的要素。
正因为如此,它在统计分析中占有极其重要的地位。
目前,连普及型的电子计算器都可一揿按键就得出这个数据,并由此计算出其他统计量。
计算标准误常常是显著性检验的最主要参数。
标准误可用下列公式计算:。