《用到方差分析的论文》
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本科毕业论文〔设计〕〔2021届本科毕业生〕
题目:方差分析法在学习成绩中的运用
****:***
学生学号:********
学院名称:数学与系统科学学院
专业名称:统计学
****:**
二零一二年五月
摘要
方差分析用于多个样本均数差异的显著性检验。
它的根本思想是通过分析研究不同来源的变异对总变异的奉献大小,从而确定可控因素对研究结果影响力的大小。
现将方差分析法用于学生考试成绩分析,针对某大学数学学院学生成绩的上下不同其学习时间不同的问题,设计实验。
通过问卷调查获取学生平时学习时间及期末学习成绩的数据,并将其整理、分组,和用Excel直观图像表示。
运用单因素方差分析数理统计法计算出结果,通过对结果分析,说明学习成绩受学习时间的影响,并用SPSS 软件检验,判定学习时间长的同学,学习成绩普遍较高。
目的在于鼓励同学们能将精力多用于学习,成为优秀的大学生。
关键字:方差分析,单因素方差分析,学习时间,学习成绩
A Variance Analysis Method to Student s’ Examination Results
Abstract : The variance analysis method is used for multiple sample mean difference significance test. The basic idea is that it determines the size of the controllable factors to influence the findings by analyzing the contribution of different source of the total .The variance analysis method is introduced and used to analyze the examination results of the students of a university. Using the data that is collected from questionnaire investigations of the students of the school , we arrange the data and do a research .Single element variance is used to analyze the result and SPSS is used to justify the significance between five groups of the s tudents’ examination results and the time for leaning. We do the study aiming at encouraging the young to study hard and play a role in the society.
Keywords: Analysis of variance, single element variance , leaning time, Examination Results
目录
一、引言 (1)
二、方差分析预备知识 (1)
〔一〕单因素方差分析简介 (1)
〔二〕单因素方差分析前提条件 (2)
〔三〕单因素方差分析问题 (2)
〔四〕单因素方差分析计算步骤 (3)
1、计算平均值 (4)
2、计算离差平方和 (5)
3、计算自由度 (6)
4、计算平均平方 (6)
5、F检验 (6)
三、问卷调查 (7)
〔一〕调查概况 (7)
1、调查对象 (7)
2、调查方式 (7)
3、调查问卷 (7)
〔二〕试验设计 (8)
四、学习成绩方差分析 (8)
〔一〕整理数据 (8)
〔二〕进行计算 (10)
〔三〕结果分析 (10)
〔四〕SPSS法判定结果 (11)
五、结束语 (13)
参考文献 (14)
一、引言
在科学研究和生产实践中,常常需要同时研究两个以上因素对试验结果的影响,t 检验法使用于样本平均数及两个样本平均数间的差异显著性检验,但是在生产和科学研究中经常会遇到比拟多个处理优劣的问题,即需进行多个平均数间的差异显著性检验。
这时t 检验不适宜是因为〔1〕检验过程繁琐〔2〕无统一的试验误差,误差估计的精确性和检验的灵敏性低。
〔3〕判断的可靠性低。
方差分析法常用于解决此类问题。
方差分析是由英国统计学家R.A. Fisher与1923年提出的。
其用于多个样本均数差异的显著性检验。
它的根本思想是通过分析研究不同来源的变异对总变异的奉献大小,从而确定可控因素对研究结果影响力的大小。
其目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最正确水平等。
方差分析又分为单因素方差分析、双因素试验方差分析、多因素方差分析和协方差分析等。
本论文主要运用单因素方差分析解决学习时间与学习成绩的关系。
高校是教学和研究的重要基地,也是培养人才的重要场所。
学生以同等的分数被大学录取,但是升入大学后学生的成绩出现了显著的差异。
有些学生厌学,出现逃课,上网打游戏,整天无所事事。
此类学生的学习成绩普遍较低,严重者最终导致不能正常毕业。
相反的,那些学习刻苦认真,孜孜不倦的同学,普遍取得了优异学习成绩。
古语总说天道酬勤,努力学习会取得好的成绩也是一个不争的事实。
能否通过具体实验,运用客观数据表达学习时间与学习成绩的关系。
随着学校教育与管理信息程度化不断提高,学校积累了大量的学生成绩数据。
现用单因素方差分析法研究学习时间与学习成绩的关系。
二、方差分析法预备知识
〔一〕单因素方差分析简介
单因素方差分析是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。
由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。
例如,分析不同施肥量是否给农作物产量带来显著影响。
单因素方差分析的第一步是明确观测变量和控制变量。
单因素方差分析的第二步是剖析观测变量的方差。
方差分析认为:观测
变量值得变动会受控制变量和随机变量两方面的影响。
据此,单因素方差分析将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两局部,用数学形式表述为SST=SSA+SSE 。
单因素方差分析的第三步是通过比拟观测变量总离差平方和各局部所占的比例,推断控制变量是否给观测变量带来了显著影响。
在观测变量总离差平方和中,如果组间离差平方和所占比例较大,那么说明观测变量的变动主要是由控制变量引起的,可以主要由控制变量来解释,控制变量给观测变量带来了显著影响;反之,如果组间离差平方和所占比例小,那么说明观测变量的变动不是主要由控制变量引起的,不可以主要由控制变量来解释,控制变量的不同水平没有给观测变量带来显著影响,观测变量值的变动是由随机变量因素引起的。
单因素方差分析根本步骤是提出原假设, 无差异;F> a F 有显著差异。
选择检验统计量,方差分析采用的检验统计量是F 统计量,即F 值检验。
计算检验统计量的观测值和概率P 值:该步骤的目的就是计算检验统计量的观测值和相应的概率P 值。
给定显著性水平,并作出决策
〔二〕单因素方差分析前提条件
运用单因素方差分析法解决问题有以下前提
〔1〕在每一个水平上的实验结果是一个随机变量ij x 〔i 为第i 个水平,j 为j 次实验〕,且服从于正态分布1i x ,2i x ,···,in x 是第i 个水平的正态总体中抽取的一个简单随机样本,样本容量为n 。
〔2〕所有的k 个不同水平对应的k 个正太总体的方差是相等的,具有方差齐性,ij x ~N 〔i μ,2δ〕。
〔3〕k 个总体是相互独立的,样本与样本之间也是相互独立的。
要检验的假设是:0H :A μ=2μ=···=k μ;A H :不是所有的i μ ()1,2i k =都相等。
假设拒绝0H ,那么认为至少有两个水平之间的差异是显著的,因素A 对实验结果有显著影响;反之,假设接受Ho ,那么认为因素A 对实验结果无显著影响,实验结果在各水平之间的不同仅仅是由于随机因素引起的。
〔三〕单因素方差分析问题
单因素方差分析又称一元方差分析,它是讨论一种因素对试验结果有无显著影响。
设某种单因素A 有r 种水平123,,,r A A A A ,在每种水平下的试验结果服从正态分布。
如果在各水平下分别作了i n ()1,2
i r =次试验,通过单因素试验方差分析可以判断因素A 对试验结果是否有显著影响。
单因素方差分析数据如下
1A 2A
i A
r A 11x 21x
1i x
1r x 12x 22x
2i x
2r x
1j x 2j x
ij x
rj x
11n x 22n x
j in x
r rn x
(四)单因素方差分析根本步骤
为了便于理解,可以将方差分析过程划分为以下几步。
将每种水平看成一组,令i x 为第i 种水平上所有试验的算术平均值,称为组内平均值。
即:
i x =1i n 1i n ij j x =∑,〔1,2,i r =〕 (1)
所以组内和为:
i T =1i
n ij j x =∑=i n i x (2) 总平均x 为试验值得算术平均值,即
x =1n 11
i n r ij i j x ==∑∑ (3) 如果将〔2〕带入〔3〕,可以得到总平均另两种计算式
x =1n
1r i i n =∑i x 1
1r
i i x T n ==∑
其中n 表示总试验数,可以用下式计算:
n=1r
i i n =∑
在单因素试验中,各个试验结果存在差异,这种差异可用离差平方和来表示。
〔1〕离差平方和。
总离差平方和用T ss 〔sum of square for total 〕 表示,其计算式为
T ss =2
11()r a ij i j x x -==∑∑=21
()a i ij i n x x =-∑ 它表示了各个试验值与总平均值的偏差的平方和,反映了试验之间存在的总差异。
(2)组间离差平方和。
组间离差平方和可以用A ss 〔sum of square for factor A 〕表示,
A ss 计算公式如下:
A ss =2
11()i n a i i j x x ==-∑∑ =21()a
i i i n x x =-∑ 由上式可知,组间离差平方和反映了各组内平均值的差异程度,这种差异由于因素A 不同水平的不同作用造成的,所以组间离差平方和又称为水平向离差平方和。
(3)组内离差平方和。
组内离差平方和可以用e ss 〔sum of square for error 〕表示,e ss 计
算公式如下:
e ss =211()i
n r ij i i j x x ==-∑∑
由上式可知,组内离差平方和反映老了在各个水平内,各试验值之间的差异程度,这种差异是由于随机误差的作用产生的,所以组内离差平方和又称为误差项离差平方和。
可以证明T ss =A ss +e ss
说明了试验值之间的差异来自于两个方面;一方面是由因素中不同水平造成的,例如反响温度的不同导致不同的产品得率,这种差异是系统性的;另一方面是由于试验的随机误差产生的差异,例如在相同的温度下,产品得率也不一定相同。
3.计算自由度
由离差平方和的计算公式可以看出,在同样的误差程度下,测得数据越多,计算出的离差平方和就越大,因此仅用于离差平方和反映试验值间差异大小还是不够多的,还需要考虑试验数据的多少对离差平方和带来的影响,为此需要考虑自由度〔degree of freedom 〕.
总离差平方和对应的自由度分别如下。
T ss 对应的自由度称为总自由度,即:
T df =n —1
A ss 对应的自由度成为组间自由度,即:
A df =r —1
e ss 对应的自由度称作组内自由度,即:
e d
f =n —r
显然,以上3个自由度的关系为:
T df = A df + e df
利用离差平方和除以对应的自由度即可得到平均平方〔mean square 〕,简称均方。
将A SS ,e SS 分别除以A df ,d e f 就可以得到:
A MS =A SS / A df
e MS =e SS / d e f
称A MS 为组间均方〔mean square between groups 〕, e MS 为组内均方〔mean squares within group), e MS 也被称为误差的均方〔error mean square 〕。
组间〔也称水平间〕均方和组内〔也称水平内〕均方之比F 是一个统计量,即;
A F =组间均方/组内均方=
A e
MS MS
它服从自由度为〔A df ,e df 〕的F 分布〔F distribution 〕,对于给定的显著性水平α,查临界值F α〔A df ,e df 〕,如果A F >F α〔A df ,e df 〕,那
么认为因素A 对试验结果有显著影响,否那么认为因素A 对试验结果没有显著影响。
为了将方差分析主要过程表现的更清楚,将有关的计算结果列成方差分析表,如下所示。
表1 单因素计算结果
通常,假设A F >0.01F (A df , e df ),就称因素A 对试验结果有非常显著的影响,用两个〔*〕号表示;假设0.05F 〔A df ,e df 〕<A F <0.01F ( A df , e df ),那么因素A 对试验结果有显著的影响,用一个〔*〕号表示;假设A F < 0.05F 〔A df ,e df 〕,那么因素A 对试验结果不显著,不用“*〞号。
三、问卷调查
〔一〕问卷概况
1、调查对象
对某大学的数学系同学进行问卷调查,了解他们平时学习成绩及其学习时间,总共发放260份问卷,收回245份。
2、调查方式
采取以在寝室、教学楼、图书馆等学生密集区发放问卷的方式
3、调查问卷
亲爱的同学
你好!
非常感谢你对我们工作的大力支持。
本次调查的目的是了解当前在校大学学习情况。
本次调查以匿名方式填写,调查结果不计入任何教学评价,请你根据自己的实际情况填写。
谢谢!
〔二〕试验设计
设学习时间为素A ,有大致5个水平〔2 小时、4小时、6小时、8小时、10小时〕设这5个水平分别为123
,,,r A A A A ,在每种水平下,学生的
学习成绩服从正态分布。
总共做10次试验,每次试验分别从水平的同学成绩中抽出一个,把各个数据组成一组,作为一次实验的结果。
提出假设Ho: 125μμμ==
=,说明5种学习时间对学习成绩影响相
同;A H :5种学习时间对学习成绩影响不完全相同。
四、学习成绩方差分析 〔一〕整理数据
整理245名同学的问卷,每段学习时间的人数如下表所示
图1学习时间人数分布图
每次试验在每段学习时间的人数里抽取一位,做10
次试验,同一时间短内每组10人,整理如下表所示
表2 实验数据
直观图像如下
图2数据分布
〔二〕统计结果
1、根据预备知识的计算步骤进行计算
每组平均值 i x =1i n 1
i
n ij j x =∑,〔1,2,
i r =〕经计算得76.31、80.96 、
82.6 、84.42、85.01
总平均值x =1n 1
r
i i n =∑i x
2、离差总和
总离差平方和T ss =211()r
a
ij i j x x -==∑∑=1133
组间离差平方和A ss =2
11
()i n r ij i j x x -==∑∑=21
()a
i i i n x x =-∑=609.34
组内利差平方和e ss =211()i
n r
ij i i j x x ==-∑∑
整理后得出下表
〔三〕、结果分析
经计算A F >0.01F ( d A f , d e f ),说明原假设Ho: 125μμμ===不成立,
A H 成立。
因素A 对试验结果有非常显著的影响,即学习时间对学习成绩
有显著影响。
〔四〕、SPSS判定
1、数据输入
图3 SPSS数据输入
2 、SPSS结果输出
表四 SPSS结果输出
ANOVA
VAR00001
平方和df 均方 F 显著性
通过运行SPSS程序,再次证明学习时间对学习成绩有显著影响。
学习时间长的学生学习成绩普遍偏高。
总而言之,同学们在日常学习生活中应该刻苦学习,克服懒惰因素。
离开高中后不应该抛弃备战高考的那种拼搏精神,在大学时期应该继续发扬刻苦学习的精神。
升入大学后,生活变得格外自由,再也不像高中生活那样紧张,受约束。
有些同学开始不适应,对生活没有方案,不自觉地放松自己,忽略学习。
尤其是刚刚入学阶段,各种社团活动吸引眼球。
有些同学抱着锻炼自己能力,丰富课余生活的目的,盲目参加各种社团,导致无暇分身。
有些同学致力于学生会工作,并没有把学习纳入生活重点,导致工作很出色,学习成绩就很不理想。
另一些同学那么把大学时光用来荒废,整天沉迷于打游戏,上网,谈恋爱等。
大学时期是人生重要的阶段,是一个人美好的时光。
在整个四年的时光里,我们可以学习很多,不光是课本里的知识。
因为我们在大学里完成从一个从幼稚走向成熟的蜕变。
通过学习,能让我们视野更开阔,人格更加完善,为走入社会打下根底。
同学们把时间用于的同时应注意学习效率,在同样的时间里学的更好更快,这样学习能更加轻松愉快。
最后,希望每个人都要珍惜时光,好好利用。
五、结束语
通过上述分析,证明学习时间对学习有显著影响,有较长学习时间的同学普遍取得好成绩。
所以同学们在以后生活中应刻苦学习,在大学的四年时光里汲取更多知识,把自己塑造成国家社会需要的人才。
本论文也存在一些缺乏,最主要的是调查对象数量少。
希望以后能多收集一些数据,做一个更全面,更细致的实验。
方差分析还包括双因素试验方差分析、多因素方差分析和协方差分析等,日后可以用于解决相关问题。
参考文献:
[1] Cohen J.Statistical power analysis for the behavioral sciences[J].New
Yoke Psychology Press,1988,38(2):33-34
[2] 竹菁.平均数差异显著性检验统计检验力和效果大小的估计原理与方[J].心理
学探新,2021,30(1):68—73
[3] 陈魁.实验设计与分析[M].北京:清华大学出版社,2005
[4] 郑少华,姜奉华.试验设计与数据处理[M].北京:中国建材工业出版社,2004
[5] 王致和.田间试验中的双向随机区设计[J].云南农业,2000.10〔10〕:30-31
[6] 贾俊平.统计学北京清华大学出版社[M],2004
[7] 薛薇.基于SPSS的数据分析[M].中国人民大学出版社.2006,(10)
[8] 任露全.试验优化设计与分析北京高等教育出版社[M],2003
[9] Diener Roissy.The psychology of money[J],World Book Publishing
House.First edition,2007,5(4),22-23
[10] Don Salter.Consumer culture and Modernity[M],2003。