现代心理与教育统计学的复习重点
现代心理与教育统计学 笔记
概念之迟辟智美创作(1)随机变量:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量.(2)总体:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体.(3)样本:样本是从总体中抽取的一部份个体.(4)个体:构成总体的每个基本单位.(5)次数:是指某一事件在某一类别中呈现的数目,又称作频数,用f暗示.(6)频率:又称相对次数,即某一事件发生的次数除以总的事件数目,通经常使用比例或百分数来暗示.(7)概率:概率论术语,指随机事件发生的可能性年夜小怀抱指标.其描述性定义.随机事件A在所有试验中发生的可能性年夜小的量值,称为事件A的概率,记为P(A).(8)统计量:样本的特征值叫做统计量,又称作特征值.(9)参数:又称总体参数,是描述一个总体情况的统计指标.(10)观测值:随机变量的取值,一个随机变量可以有多个观测值.2何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科.具体讲,就是在心理与教育研究中,通过调查、实验、丈量等手段有意地获取一些数据,并将获得的数据按统计学原理和步伐加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法.(2)学习心理与教育统计学有重要的意义.①统计学为科学研究提供了一种科学方法.科学是一种知识体系.它的研究对象存在于现实世界各个领域的客观事实之中.它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系.要提高对客观事实观测及分析研究的能力,就必需运用科学的方法.统计学正是提供了这样一种科学方法.统计方法是从事科学研究的一种必不成少的工具.②心理与教育统计学是心理与教育科研定量分析的重要工具.凡是客观存在事物,都有数量的暗示.凡是有数量暗示的事物,都可以进行丈量.心理与教育现象是一种客观存在的事物,它也有数量的暗示.虽然心理与教育测量具有多变性而且旨起它发生变动的因素很多,难以准确丈量.可是它究竟还是可以丈量的.因此,在进行心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的.心理与教育统计就是对心理与教育问题进行定量分析的重要的科学工具.③广年夜心理与教育工作者学习心理与教育统计学的具体意义.a.可经顺利阅读国内外先进的研究功效.b.可以提高心理与教育工作的科学性和效率.c.为学习心理与教育丈量和评价打下基础.?答:一项实验研究结果要用何种统计方法去分析,需要对实验数据进行认真的分析.只有做到对数据分析正确,才华对统计方法做出正确地选用.选用统计方法可以分为以下步伐:(1)首先,要分析一下实验数据是否合理,即所或得的数据是否适合用统计方法去处置,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边缘的数据加以统计处置是毫无意义的.(2)其次,要分析实验数据的类型.分歧数据类型所使用的统计方法有很年夜差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要.(3)第三,要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件.4.什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量?答:(1)在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量.(2)心理与教育科学实验所获得的数据属于随机变量.心理与教育科学研究数据具有随机性和变异性.科学研究中因观测人员、观测工具、观测条件的变动而具有随机变动的现象.在心理和教育科学领域,研究获得的数据资料也具有一定随机性质.观测数据的这种特点,称为变异性.即便使用同一种丈量工具,观测同一事物,只要是进行多次,那么获得的数据就不会完全相同.随着丈量工具的完善和精确,数据的这种随机性变动就更明显.例如,人们对同一年级或同一年龄儿童甚至对同一个人进行同一学科的学业测试,或对同一个心理特点进行评量、观察屡次,获得的数据绝不会全然相同,这些数据总是在一定的范围内变动.造成数据变异的原因,出自观测过程中一些偶然的不成控制的因素,称随机因素.随机因素使丈量发生的误差称作随机误差.由于这种随机误差的存在,使得在相同条件下观测的结果常常不止一个,而且事前无法确定,这是客观世界存在的一种普遍现象,人们称这类现象为随机现象.在教育和心理科学的各类研究中,研究的对象是人的内在的种种心理现象,不单由客观上一些偶然因素会引起丈量误差,由实验者和被试主观上一些不成控制的偶然因素也会造成丈量误差,这些偶然因素+分复杂,因而造成的随机误差就更年夜,也就是使心理与教育科学研究中获得的数据具有更明显的变异性.5.怎样理解总体、样本与个体.答:根据其各自的界说,我们可以用下面这个图来暗示.年夜圆暗示研究对象的全体,也就是总体;年夜圆中的小圆暗示其中一个样本,年夜圆中所有的点代表的是样本.6、统计量与参数之间有何区别和关系.答:(1)参数是描述总体情况的统计指标;样本的特征值称作统计量.(2)区别:1参数是从总体中计算获得的量数,代表总体特征,一个常数.统计量是从一个样本中计算获得的量数,它描述一组数据的情况,是一个变量,随样本的变动而变动.2参数经常使用希腊字母暗示,样本统计量用英文字母暗示.(3)联系:1参数通常是通过样本特征值来预测获得,(7、谜底略)8、下述一些数据,哪些是丈量数据?哪些是计数数据?其数值意味什么?(1)17. 0千克(2 ) 89. 85厘米(3) 199. 2秒(4) 17人(5) 25本(6 ) 93. 5答:上面的数据中丈量数据有:(1) 17.0千克(2 ) 89. 85厘米(3 ) 199. 2秒(6)93. 5分计数数据有:(4) 17人(5) 25本(2) 17. 0千克、89. 85厘米、199. 2秒、93. 5分,这些数据是借助一定的重量、长度、时间或一定的丈量标准而获得数据,分别代表事物的重量、长度、时间或者分数.9符号代表的意义(课本20页)(1)总体平均数,期望值(2)样本平均数(3)总体之间的相关系数 (4)样本间的相关系数 (5)总体标准差(6)样本标准差(7)总体间的回归系数(8)有限个体数目的总体 (9)样本容量,样本年夜小1.统计分组应注意哪些问题?答:进行统计分组时需要注意下列问题:(1)分组要以被研究对象的实质特性为基础面对年夜量原始数据进行分组时,有时需要先做初步的分类,分类或分组一定是要选择与被研究现象的实质的关的特性为依据,才华确保分类或分组的正确.在心理与教育学研究方面,专业知识的了解和熟悉对分组的正确进行有重要的作用.例如在学业成果研究中按学科性质分类,在整理智力检验结果时,按言语智力、把持智力和总的智力分数分类等.(2)分类标识表记标帜要明确,要能包括所有的数据对数据进行分组时,所依据的特性称为分组或分类的标识表记标帜.整理数据时,分组标志要明确并在整理数据的过程中前后一致.这就是说,关于被研究现象实质特性的概念要明确,不能既是这个又是那个.另外,所依据的标识表记标帜必需能将全部数据包括进去,不能有遗漏,也不能中途改变.2、直条图或叫条形图:主要用于暗示离散型数据资料,即计数资料.详见课本45页.3、圆形图或叫饼图:主要用于描述间断性资料,目的是为显示多部份在整体中所占的比重年夜小,以及各部份之间的比力.:统计学的原理和数学的方法在心理学领域中的运用.描述统计和推理统计两年夜部份.3.实验数据可分为两类:准确数和近似值.4.确定组距以后,要考虑最小的一组从哪开始.显然,最小的一组应包括整个系列中的最小数值.5.在心理实验中经常使用的表格有三类:原始数据挂号表,经过分组整理的次数分布表,带有对实验结果总结性质的表6.暗示实验结果的图有:平面图和立体图.7.平面图一般分为:曲线图和直方图两类.8.平面图有两个坐标,横坐标代表心理实验中的安慰变量或自变量,纵坐标代表反应变量或因变量.当横坐标代表的数量是连续的,可画曲线图或直方图;当横坐标代表的数量不是连续的变量,而是分歧类别时,就只能画直方图,其纵坐标必需从0开始.上限.算术平均数.明显的集中趋势指标,但众数不如平均数和中数稳定.12.分组不适合会呈现双峰,可调整组距.真正的双峰呈现的原因是_有两种性质分歧的数据_.13.在偏斜的分布中,平均数总是处于偏斜的一端,而中数则永远把一个分布曲线下的面积分成相等的两部份.14. q2-q1<q3-q2时,分布向右偏斜;q2-q1=q3-q2时,分布向对称;q2-q1>q3-q2时,分布向_左(哪方年夜则朝哪方偏斜)偏斜.15.暗示两个变量之间相关性质和水平的图,叫散布图.如果图中所有的点形成一条直线,说明是一个完全正相关的散布图;如果是椭圆,这个椭圆越窄,说明相关水平越_高_____.16.从样本估计总体是以概率原则为基础的,如果样本中只包括随机误差就不致发生对总体偏性的估计;如果样本中还包括系统误差在内,就会发生偏性估计.17.当一个总体中的成份只分成两类时,根据传统,把_希望获得的结果,发生的概率叫P;不希望获得的结果发生的概率叫q.18.在一系列正态分布中,有一个标准的正态分布,其平均数为_0,标准差为_ 119.当实验数据有___二组____以上时,而且都是__不连续_____的变量时,要检验各组间的不同是否显著就需要用c2分布进行计算.20.统计结果检验时:1 ) w2为0. 14_时,实验效果较强,统计结果可信.2 ) w2为0. 16_时,实验效果中等,统计结果可信度一般.3 ) w2为0. 01_时,实验效果很差,统计结果不成信.21.用d值说明实验效果时:1) d是0.2时,实验效果较小; 2) d;是0.5时,效果中等; 3)d>>0. 8_时,效果较年夜.概念1.描述统计:是对成组数据概括的描述.描述统计的指标有三类:数据的集中趋势,数据的离中趋势,数据间的相关.2.推论统计:方法包括从样本的数量特性推测总体数量特性的一系列问题:推论假设,推论的各种方法和步伐,以及检验推测可靠性的各种方法.3.组距:每一组上限和下限的差.(组距习上经常使用2, 3, 5, 10, 204.中点:在某一组的下限和上限傍边的那一点.5.集中趋势:是代表一系列数据的典范水平的数字指标,代表集中趋势的指标有平均数,中数和众数.6.平均数(x):是一组数据总和的平均值.7.中数(mdn):一系列按年夜小顺序排列的数据中的一个点,在这个系列中有一半数据在这个点以上,有一半数据在这个点以下.8.众数(mo):在一系列数据中呈现次数最多的那个数.9.全距:一个分布中最年夜的数值的上限减去最小数值的下限,就获得全距.(全距年夜,说明这组数据分散;全距小,则较集中.使用时注意:1、无极端值;2,比力两个分布的全距时,当两个分布所包括数据的数目相等或差未几时才华使用)10.离中趋势:是暗示一组数据分散水平的指标,经常使用的指标有:全距,四分差,平均差和标准差.(如果离中趋势很小,说明数据分布都在平均数附近变动,因此平均数的代表性很年夜;如果离中趋势太年夜,说明数据分布太分散)11.四分差(q):是数据的离中趋势的指标之一,四分差说明按年夜小顺序排列的一系列数据中间50%个数据的分散水平.(如果一个分布中间部份的数据比力集中,则两个四分点q3与q1就离得近些,a的值就小些.)12.百分点:某次数分布中处于某百分品级的数值.13.百分品级:某数值在某次数分布中所处的位置.14.平均差(ad):一个分布中每个变量和平均数的差的绝对值的平均值.15.标准差:s2开方后的正值就叫标准差,是数据的离中趋势的指标之一.16.离中系数(CV):用相对量来暗示数据分散水平的数字指标. :指相关是否密切,可分为无相关;部份相关;完全相关.18.相关:是描述两种数量关系的一个指标,如果一个变量随另一个变量的增加(减小)而增加(减小),则两个变量之间存在着相关.19. z分数(标准分数):是以标准差为单位所暗示的原始分数(x)与平均数的偏离,也可以说是一个以标准差为单位来暗示的偏离分数.20.总体;某类事物的全部称为总体.21.样本:从全部抽出的部份叫样本.22.推论统计:从局部推测全部,从样本推测总体的统计法式.23.随机抽选样本:指总体中每个成份都有同等的机会被抽选.24.分层抽样:用分层抽样的方法,必需对总体有一定的了解,事先对影响所研究问题的诸因素做适当安插.25.样天职布:从很多个样本中算出的很多个平均数的次数分配叫样天职布.26.正态分布:是一个中间高,两侧逐渐下降,两端永远不与横轴相交,两侧完全对称的钟形曲线.27.平均数的标准误(sx):为了和单个样本的标准差有所区别,把样天职布的标准差称做平均数的标准误.28.自由度(df):能够自力变动的数据的数目.29.平均数差的标准误(sxd ):分别从两个总体中抽取出的多个样本平均数的差(xd)的分布,这个分布的标准差叫做平均数差的标准误. 30.虚无假设(ha):除概率以外不加任何其它假定,即假设二总体的平均数不同为O31.备则假设(ha):假设两个总体平均数之间不同中除抽样误差外,还包括有两个总体平均数之间的不同,即备则假设是个总体平均数之间不同不为O32.显著性生水平(P):我们所选择的推翻虚无假设的概率叫做检验的显著性水平.33.第一类毛病:当虚无假设不应推翻时而被推翻了,这意味着把样本的平均数分歧认为是代表了总体平均数的不同.34.第二类毛病:当应该推翻虚无假设时而不推翻,这意味着把样本的平均数分歧是代表总体平均数的分歧这一事实给否认了.35.显著性检验:通过样本平均数的分歧来推论总体平均数是否真正存在分歧,并确定存在何种水平.36.回归:当两种变量间存在着一定水平的相关时,一种变量有向另一种变量的平均数趋近的现象,这种现象叫回归.37.回归方程式:从一变量的数值预测另一变量的相应数值的直线方程式,当两个变量部份相关时,有两个回归方程式.38.回归系数(byx):由x变量预测Y变量的回归方程式的斜率.39.c2检验:是实际观察次数与假设次数偏离水平的指标.40.方差分析:根据组间和组内方差的比值,来比力两组或多组数据的不同是否到达显著.41.组间变异:在两组之间所发生的因变量的变异,就是系统变异,也就是由自变量引起的变异.因为这种变异发生在两组之间,所以又叫组间变异.42.组内变异:同一组内的因变量的变异,就不是由于自变量的情况分歧引起的,而只是由于未加控制的变量引起的.因为这种变异发生在同一组内,所以叫做组内变异.43.组间设计:每个被试只介入1个水平的实验44.组内实际:每个被试介入所有水平的实验.45.主效应:自变量所引起的平均数不同46.交互作用:一个自变量对反应变量的影响因另一个自变量的变动而发生1,伽利略提出了概率论的基本理论;法国数学家帕斯卡和费马创建了概率论,未统计学的发展奠基了重要基础;贝奴里定理的发生,为发现正态概率分布缔造了条件;棣莫弗推导出“正态曲线方程”;皮尔逊发表了频率曲线理论和积差相关;斯皮尔曼提出品级相关;肯德尔W系数和U系数;格赛特T分布理论;费舍是推论统计真正的开创者,最先提出F分布理论,使方差分析系统化;凯特勒他将统计方法应用于教育学和社会学的研究;斯内德克提出方差分析;克一瓦氏H检验是一种非参数方差分析方法,它与参数方法中的完全随机资料方差分析相对应;费里德曼双向品级方差分析可解决随机区组实验设计的非参数检验问题2:从数据的观测方法和来源划分,研究数据可分为计数数据和丈量数据两年夜类;根据数据反映的丈量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型;按照数据是否具有连续性,把数据分为离散数据和连续数据3:统计表的儿个组成要素:表号、名称、标目、数字、表注. 4:统计图的组成部份:图号及图题、图目、图尺、图形、图例、图注5:次数分布显示初步整理后一组数据的分布情况主要暗示数据在各个分组区问内的散布情况,可分为简单次数分布、分组次数分布、相对次数分布、累计次数分布.6:经常使用的次数分布图有直方图、次数多边形图及累加次数分布图.7:其它经常使用的统计图的类别:直方图、条形图、圆形图、线形图、散点图:条形图又分为简单条形图、分组条形图、分段条形图8:其它经常使用统计表类型:简单表、分组表、复合表9:用来描述数据集中趋势和离中趋势的统计量分别称为集中量数和不同量数.10:集中量数包括:算数平均数、中数、众数、加权平均数、儿何平均数、调和平均数等.12:平均数的优缺点:优点:反应灵敏、计算严密、计算简单、简明易解、适合于进一步用代数方法演算、较少受抽样变动的影响;缺点:易受极端数据的影响、若呈现模糊不清的数据时,无法计算平均数.13:计算和应用平均数的原则:同质性原则、平均数与个体数值相结合的原则、平均数与标准差、发差相结合的原则14:不同量数就是对一组数据的变异性,即离中趋势特点进行怀抱和描述的统计量.15:不同量数有:全距、四分位差、白一分位差、平均差、标准差与方差16:相关类别为:正相关、负相关、零相关17:质量相关分为:点二列相关、二列相关及多系列相关18:品质相关:主要分为四分相关、C相关、列联表相关19:概率:是标明随机事件呈现可能性年夜小的客观指标就是概率,概率的界说有两种即后验概率和先验概率20:概率分布类型:160页离散分布与连续分布、经验分布与理论分布、基本随机变量分布与抽样分布21“概率分布:是指对随机变量取值的概率分布情况用数学方法(函数)进行描述22:连续分布:是指连续随机变量的概率分布,即丈量数据的概率分布,它用连续随机变量的分布函数描述它的分布规律23:离散分布:离散随机变量的分布又称作离散分布24:经验分布:是指根据观察或实验所获得的数据而编制的次数分布或相对频率分布25:理论分布:一是随机变量概率分布的函数一数学模型,二是按某种数学模型计算出的总体的次数分布26:抽样分布:是样本统计量的理论分布,样本统计量有:平均数、两平均数之差、方差、标准差、相关系数、回归系数、白一分比率等.27:正态分布:也称常态分布或常态分配,是连续随机变量概率分布的一种,正态分布N C0,1)称为标准正态分布,它的平均值是0,标准差是1.28:二项分布:是指试验仅有两种分歧性质结果的概率分布,具体界说是:设有N次试验,各次试验是彼此自力的,每次试验某事件呈现的概率都是P,某事件不呈现的概率都是q(即是1-P).则对某事件呈现X次(0,1,2,3.0 0 o n)的概率分布为为29:除标准正态Z分布外,儿种罕见的抽样分布包括X的平方分布,T分布,F分布.30:点估计:是用样本统计量来估计总体参数,因为样本统计量为数值上某一点值,估计的结果也以一个点的数值暗示,所以称为点估计.31:良好估计量的特性:无偏性、有效性、一致性、充沛性犯:区问估计:就是根据估量值以一定可靠水平推断总体参数所在的区问范围,它是用数轴上的一段距离暗示未知参数可能落入的范围,他虽不具体指出总体参数即是什么,但能指出未知总体参数落入某一区问的概率有多年夜33:置信区问:也称置信问距,是指在某一置信度时,总体参数所在的区域距离或区域长度.置信区问的上下两端点值称为置信界限.34:显著性水平是指估计总体参数落在某一区问时,可能犯毛病的概率,用符号a暗示35:假设检验:通过样本统计量得出的不同做出一般性结论,判断总体参数之问是否存在差异,这种推论过程称作假设检验,它的基本任务就是事先对总体参数或总体分布形态做出一个假设,然后利用样本信息来判断原假设是否合理,从而决定是否接收原假设.假设检验包括“参数检验”和“非参数检验”.36:参数假设检验:若进行假设检验时总体的分布形式已知,需要对总体的未知参数进行假设检验;非参数假设检验:若对总体分布形式37:方差分析:主要功能在于分析实验数据中分歧来源的变异对总变异的贡献年夜小,从而确定实验中的白变量是否对因变量有重要影响38:方差分析的基来源根基理:综合虚无假设和部份虚无假设、方差的可分解性39:平方和:指观测数据与平均数离差的平方总和40:总变异被分解为“组问变异”和“组内变异"41:组问变异:主要指由于接受分歧的2而造成的各组之问的变异,可以用两个平均数之问的不同暗示42:组内变异:是由组内各被试因变量的不同范围决定的,主要指由实验误差、或组内被试之问的不同造成的变异.43:发差分析的基本假定:总体正态分布、变异的相互自力性、各实验处置内的方差要一致44:组内设计:又称被试内设计,是指每个被试都要接受所有白变量水平的实验处置45:完全随机设计的方差分析:就是对单因素组问设计的方差分析,在这种实验研究设计中,各种处置的分类仅以单个实验变量为基础,因而把它称为单因素方差分析或单向方差分析46:随机区组设计的方差分析:根据被试特点把被试划分为儿。
现代心理与教育统计学 笔记
概念之杨若古兰创作(1)随机变量:在统计学上把取值之前,不克不及精确意料取到什么值的变量,称为随机变量.(2)整体:整体(population)又称为母全体或全域,是具有某种特征的一类事物的整体,是研讨对象的全体.(3)样本:样本是从整体中抽取的一部分个体.(4)个体:构成整体的每个基本单元.(5)次数:是指某一事件在某一类别中出现的数目,又称作频数,用f暗示.(6)频率:又称绝对次数,即某一事件发生的次数除以总的事件数目,通经常使用比例或百分数来暗示.(7)概率:概率论术语,指随机事件发生的可能性大小度量目标.其描述性定义.随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A).(8)统计量:样本的特征值叫做统计量,又称作特征值.(9)参数:又称整体参数,是描述一个整体情况的统计目标.(10)观测值:随机变量的取值,一个随机变量可以有多个观测值.2何谓心思与教育统计学?进修它有何意义?答:(1)心思与教育统计学是专门研讨如何应用统计学道理和方法,搜集、整理、分析心思与教育科学研讨中获得的随机性数据材料,并根据这些数据材料传递的信息,进行科学推论找出心思与教育统计活动规律的一门学科.具体讲,就是在心思与教育研讨中,通过调查、实验、测量等手段成心地获取一些数据,并将得到的数据按统计学道理和步调加以清算、计算、绘制图表、分析、判断、推理,最初得出结论的一种研讨方法.(2)进修心思与教育统计学有次要的意义.①统计学为科学研讨提供了一种科学方法.科学是一种常识体系.它的研讨对象存在于理想世界各个领域的客观事实当中.它的次要任务是对客观事实进行猜测和分类,从而揭示储藏于其中的各种因果关系.要提高对客观事实观测及分析研讨的能力,就必须应用科学的方法.统计学恰是提供了如许一种科学方法.统计方法是从事科学研讨的一种必不成少的工具.②心思与教育统计学是心思与教育科研定量分析的次要工具.凡是客观存在事物,都无数量的表示.凡是无数量表示的事物,都可以进行测量.心思与教育景象是一种客观存在的事物,它也无数量的表示.虽然心思与教育测量具有多变性而且旨起它发生变更的身分很多,难以精确测量.但是它究竟还是可以测量的.是以,在进行心思与教育科学研讨时,在必定条件下,是可以对心理与教育景象进行定量分析的.心思与教育统计就是对心思与教育成绩进行定量分析的次要的科学工具.③广大心思与教育工作者进修心思与教育统计学的具体意义.a.可经顺利浏览国内外进步前辈的研讨成果.b.可以提高心思与教育工作的科学性和效力.c.为进修心思与教育测量和评价打下基础.?答:一项实验研讨结果要用何种统计方法去分析,须要对实验数据进行认真的分析.只要做到对数据分析精确,才干对统计方法做出精确地选用.选用统计方法可以分为以下步调:(1)首先,要分析一下实验数据是否合理,即所或得的数据是否适合用统计方法去处理,精确的数量化是利用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边沿的数据加以统计处理是毫成心义的.(2)其次,要分析实验数据的类型.分歧数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法相当次要.(3)第三,要分析数据的分布规律,如整体方差的情况,确定其是否满足所选用的统计方法的前提条件.4.什么叫随机变量?心思与教育科学实验所获得的数据是否属于随机变量?答:(1)在统计学上把取值之前,不克不及精确意料取到什么值的变量,称为随机变量.(2)心思与教育科学实验所获得的数据属于随机变量.心思与教育科学研讨数据具有随机性和变异性.科学研讨中因观测人员、观测工具、观测条件的变更而具有随机变更的景象.在心思和教育科学领域,研讨获得的数据材料也具有必定随机性质.观测数据的这种特点,称为变异性.即便使用同一种测量工具,观测同一事物,只如果进行多次,那么获得的数据就不会完整不异.随着测量工具的完美和精确,数据的这类随机性变更就更明显.例如,人们对同一年级或同一年龄儿童甚至对同一个人进行同一学科的学业测试,或对同一个心思特点进行评量、观察多次,得到的数据绝不会全然不异,这些数据老是在必定的范围内变更.形成数据变异的缘由,出自观测过程中一些偶然的不成控制的身分,称随机身分.随机身分使测量发生的误差称作随机误差.因为这类随机误差的存在,使得在不异条件下观测的结果常常不止一个,而且事前没法确定,这是客观世界存在的一种普遍景象,人们称这类景象为随机景象.在教育和心思科学的各类研讨中,研讨的对象是人的内在的各种心思景象,不但由客观上一些偶然身分会惹起测量误差,由实验者和被试主观上一些不成控制的偶然身分也会形成测量误差,这些偶然身分+分复杂,因此形成的随机误差就更大,也就是使心思与教育科学研讨中得到的数据具有更明显的变异性.5.如何理解整体、样本与个体.答:根据其各自的定义,我们可以用上面这个图来暗示.大圆暗示研讨对象的全体,也就是整体;大圆中的小圆暗示其中一个样本,大圆中所有的点代表的是样本.6、统计量与参数之间有何区别和关系.答:(1)参数是描述整体情况的统计目标;样本的特征值称作统计量.(2)区别:1参数是从整体入彀算得到的量数,代表整体特征,一个常数.统计量是从一个样本入彀算得到的量数,它描述一组数据的情况,是一个变量,随样本的变更而变更.2参数经常使用希腊字母暗示,样本统计量用英文字母暗示.(3)联系:1参数通常是通过样本特征值来猜测得到,(7、答案略)8、下述一些数据,哪些是测量数据?哪些是计数数据?其数值意味什么?(1)17. 0千克(2 ) 89. 85厘米(3) 199. 2秒(4) 17人(5) 25本(6 ) 93. 5答:上面的数据中测量数据有:(1) 17.0千克(2 ) 89. 85厘米(3 ) 199. 2秒(6)93. 5分计数数据有:(4) 17人(5) 25本(2) 17. 0千克、89. 85厘米、199. 2秒、93. 5分,这些数据是借助必定的分量、长度、时间或必定的测量尺度而获得数据,分别代表事物的分量、长度、时间或者分数.9符号代表的意义(课本20页)(1)整体平均数,期望值(2)样本平均数(3)整体之间的相干系数 (4)样本间的相干系数 (5)整体尺度差 (6)样本尺度差 (7)整体间的回归系数 (8)无限个体数目的整体 (9)样本容量,样本大小1.统计分组应留意哪些成绩?答:进行统计分组时须要留意以下成绩:(1)分组要以被研讨对象的实质特性为基础面对大量原始数据进行分组时,有时须要先做初步的分类,分类或分组必定是要选择与被研讨景象的实质的关的特性为根据,才干确保分类或分组的精确.在心理与教育学研讨方面,专业常识的了解和熟悉对分组的精确进行有次要的感化.例如在学业成绩研讨中按学科性质分类,在清算智力检验结果时,按言语智力、操纵智力和总的智力分数分类等.(2)分类标记要明确,要能包含所有的数据对数据进行分组时,所根据的特性称为分组或分类的标记.清算数据时,分组标志要明确并在清算数据的过程中前后分歧.这就是说,关于被研讨景象实质特性的概念要明确,不克不及既是这个又是那个.另外,所根据的标记必须能将全部数据包含进去,不克不及有漏掉,也不克不及半途改变.2、直条图或叫条形图:次要用于暗示离散型数据材料,即计数材料.详见课本45页.3、圆形图或叫饼图:次要用于描述间断性材料,目的是为显示多部分在全体中所占的比严重小,和各部分之间的比较.:统计学的道理和数学的方法在心思学领域中的应用.描述统计和推理统计两大部分.3.实验数据可分为两类:精确数和近似值.4.确定组距当前,要考虑最小的一组从哪开始.明显,最小的一组应包含全部系列中的最小数值.5.在心思实验中经常使用的表格有三类:原始数据登记表,经过分组清算的次数分布表,带有对实验结果总结性质的表6.暗示实验结果的图有:平面图和立体图.7.平面图普通分为:曲线图和直方图两类.8.平面图有两个坐标,横坐标代表心思实验中的刺激变量或自变量,纵坐标代表反应变量或因变量.当横坐标代表的数量是连续的,可画曲线图或直方图;当横坐标代表的数量不是连续的变量,而是分歧类别时,就只能画直方图,其纵坐标必须从0开始.上限.算术平均数.明显的集中趋势目标,但众数不如平均数和中数波动. 12.分组不适合会出现双峰,可调整组距.真实的双峰出现的缘由是_有两种性质分歧的数据_.13.在偏斜的分布中,平均数老是处于偏斜的一端,而中数则永久把一个分布曲线下的面积分成相等的两部分.14. q2-q1<q3-q2时,分布向右偏斜;q2-q1=q3-q2时,分布向对称;q2-q1>q3-q2时,分布向_左(哪方大则朝哪方偏斜)偏斜.15.暗示两个变量之间相干性质和程度的图,叫散布图.如果图中所有的点构成一条直线,说明是一个完整正相干的散布图;如果是椭圆,这个椭圆越窄,说明相干程度越_高_____.16.从样本估计整体是以概率准绳为基础的,如果样本中只包含随机误差就不致发生对整体偏性的估计;如果样本中还包含零碎误差在内,就会发生偏性估计.17.当一个整体中的成分只分成两类时,根据传统,把_但愿得到的结果,发生的概率叫P;不但愿得到的结果发生的概率叫q.18.在一系列正态分布中,有一个尺度的正态分布,其平均数为_0,尺度差为_ 119.当实验数据有___二组____以上时,而且都是__不连续_____的变量时,要检验各组间的差别是否明显就须要用c2分布进行计算.20.统计结果检验时:1 ) w2为0. 14_时,实验后果较强,统计结果可信.2 ) w2为0. 16_时,实验后果中等,统计结果可信度普通.3 ) w2为0. 01_时,实验后果很差,统计结果不成信.21.用d值说明实验后果时:1) d是0.2时,实验后果较小; 2) d;是0.5时,后果中等; 3)d>>0. 8_时,后果较大.概念1.描述统计:是对成组数据概括的描述.描述统计的目标有三类:数据的集中趋势,数据的离中趋势,数据间的相干.2.推论统计:方法包含从样本的数量特性推测整体数量特性的一系列成绩:推论假设,推论的各种方法和步调,和检验推测可靠性的各种方法.3.组距:每一组上限和上限的差.(组距习上经常使用2, 3, 5, 10, 204.中点:在某一组的上限和上限当中的那一点.5.集中趋势:是代表一系列数据的典型水平的数字目标,代表集中趋势的目标有平均数,中数和众数.6.平均数(x):是一组数据总和的平均值.7.中数(mdn):一系列按大小顺序排列的数据中的一个点,在这个系列中有一对折据在这个点以上,有一对折据在这个点以下.8.众数(mo):在一系列数据中出现次数最多的那个数.9.全距:一个分布中最大的数值的上限减去最小数值的上限,就得到全距.(全距大,说明这组数据分散;全距小,则较集中.使用时留意:1、无极端值;2,比较两个分布的全距时,当两个分布所包含数据的数目相等或差不多时才干使用)10.离中趋势:是暗示一组数据分散程度的目标,经常使用的目标有:全距,四分差,平均差和尺度差.(如果离中趋势很小,说明数据分布都在平均数附近变动,是以平均数的代表性很大;如果离中趋势太大,说明数据分布太分散)11.四分差(q):是数据的离中趋势的目标之一,四分差说明按大小顺序排列的一系列数据两头50%个数据的分散程度.(如果一个分布两头部分的数据比较集中,则两个四分点q3与q1就离得近些,a的值就小些.)12.百分点:某次数分布中处于某百分等级的数值.13.百分等级:某数值在某次数分布中所处的地位.14.平均差(ad):一个分布中每个变量和平均数的差的绝对值的平均值.15.尺度差:s2开方后的正值就叫尺度差,是数据的离中趋势的目标之一.16.离中系数(CV):用绝对量来暗示数据分散程度的数字目标. :指相干是否密切,可分为无相干;部分相干;完整相干.18.相干:是描述两种数量关系的一个目标,如果一个变量随另一个变量的增加(减小)而添加(减小),则两个变量之间存在着相干.19. z分数(尺度分数):是以尺度差为单位所暗示的原始分数(x)与平均数的偏离,也能够说是一个以尺度差为单位来暗示的偏离分数.20.整体;某类事物的全部称为整体.21.样本:从全部抽出的部分叫样本.22.推论统计:从局部推测全部,从样本推测整体的统计程序.23.随机抽选样本:指整体中每个成分都有同等的机会被抽选.24.分层抽样:用分层抽样的方法,必须对整体有必定的了解,事先对于影响所研讨成绩的诸身分做适当安插.25.样天职布:从很多个样本中算出的很多个平均数的次数分配叫样天职布.26.正态分布:是一个两头高,两侧逐步降低,两端永久不与横轴订交,两侧完整对称的钟形曲线.27.平均数的尺度误(sx):为了和单个样本的尺度差有所区别,把样天职布的尺度差称做平均数的尺度误.28.自在度(df):能够独立变更的数据的数目.29.平均数差的尺度误(sxd ):分别从两个整体中抽取出的多个样本平均数的差(xd)的分布,这个分布的尺度差叫做平均数差的尺度误. 30.虚无假设(ha):除概率之外不加任何其它假定,即假设二整体的平均数差别为O31.备则假设(ha):假设两个整体平均数之间差别中除了抽样误差外,还包含有两个整体平均数之间的差别,即备则假设是个整体平均数之间差别不为O32.明显性生水平(P):我们所选择的推翻虚无假设的概率叫做检验的明显性水平.33.第一类错误:当虚无假设不该推翻时而被推翻了,这意味着把样本的平均数不同认为是代表了整体平均数的差别.34.第二类错误:当应当推翻虚无假设时而不推翻,这意味着把样本的平均数不同是代表整体平均数的不同这一事实给否认了.35.明显性检验:通过样本平均数的不同来推论整体平均数是否真正存在不同,并确定存在何种水平.36.回归:当两种变量间存在着必定程度的相干时,一种变量有向另一种变量的平均数趋近的景象,这类景象叫回归.37.回归方程式:从一变量的数值猜测另一变量的响应数值的直线方程式,当两个变量部分相干时,有两个回归方程式.38.回归系数(byx):由x变量猜测Y变量的回归方程式的斜率.39.c2检验:是实际观察次数与假设次数偏离程度的目标.40.方差分析:根据组间和组内方差的比值,来比较两组或多组数据的差别是否达到明显.41.组间变异:在两组之间所发生的因变量的变异,就是零碎变异,也就是由自变量惹起的变异.因为这类变异发生在两组之间,所以又叫组间变异.42.组内变异:同一组内的因变量的变异,就不是因为自变量的情况分歧惹起的,而只是因为未加控制的变量惹起的.因为这类变异发生在同一组内,所以叫做组内变异.43.组间设计:每个被试只介入1个水平的实验44.组内实际:每个被试介入所有水平的实验.45.主效应:自变量所惹起的平均数差别46.交互感化:一个自变量对反应变量的影响因另一个自变量的变更而发生1,伽利略提出了概率论的基本理论;法国数学家帕斯卡和费马创立了概率论,未统计学的发展奠定了次要基础;贝奴里定理的发生,为发现正态概率分布创造了条件;棣莫弗推导出“正态曲线方程”;皮尔逊发表了频率曲线理论和积差相干;斯皮尔曼提出等级相干;肯德尔W系数和U系数;格赛特T分布理论;费舍是推论统计真实的创始者,最早提出F分布理论,使方差分析零碎化;凯特勒他将统计方法利用于教育学和社会学的研讨;斯内德克提出方差分析;克一瓦氏H检验是一种非参数方差分析方法,它与参数方法中的完整随机材料方差分析绝对应;费里德曼双向等级方差分析可解决随机区组实验设计的非参数检验成绩2:从数据的观测方法和来源划分,研讨数据可分为计数数据和测量数据两大类;根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四品种型;按照数据是否具有连续性,把数据分为离散数据和连续数据3:统计表的儿个构成要素:表号、名称、标目、数字、表注. 4:统计图的构成部分:图号及图题、图目、图尺、图形、图例、图注5:次数分布显示初步清算后一组数据的分布情况次要暗示数据在各个分组区问内的散布情况,可分为简单次数分布、分组次数分布、绝对次数分布、累计次数分布.6:经常使用的次数分布图有直方图、次数多边形图及累加次数分布图.7:其它经常使用的统计图的类别:直方图、条形图、圆形图、线形图、散点图:条形图又分为简单条形图、分组条形图、分段条形图8:其它经常使用统计表类型:简单表、分组表、复合表9:用来描述数据集中趋势和离中趋势的统计量分别称为集中量数和差别量数.10:集中量数包含:算数平均数、中数、众数、加权平均数、儿何平均数、调和平均数等.12:平均数的优缺点:长处:反应灵敏、计算紧密、计算简单、简明易解、适合于进一步用代数方法演算、较少受抽样变动的影响;缺点:易受极端数据的影响、若出现模糊不清的数据时,没法计算平均数.13:计算和利用平均数的准绳:同质性准绳、平均数与个体数值相结合的准绳、平均数与尺度差、发差相结合的准绳14:差别量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量.15:差别量数有:全距、四分位差、白一分位差、平均差、尺度差与方差16:相干类别为:正相干、负相干、零相干17:质量相干分为:点二列相干、二列相干及多系列相干18:品质相干:次要分为四分相干、C相干、列联表相干19:概率:是标明随机事件出现可能性大小的客观目标就是概率,概率的定义有两种即后验概率和先验概率20:概率分布类型:160页离散分布与连续分布、经验分布与理论分布、基本随机变量分布与抽样分布21“概率分布:是指对随机变量取值的概率分布情况用数学方法(函数)进行描述22:连续分布:是指连续随机变量的概率分布,即测量数据的概率分布,它用连续随机变量的分布函数描述它的分布规律23:离散分布:离散随机变量的分布又称作离散分布24:经验分布:是指根据观察或实验所获得的数据而编制的次数分布或绝对频率分布25:理论分布:一是随机变量概率分布的函数一数学模型,二是按某种数学模型计算出的整体的次数分布26:抽样分布:是样本统计量的理论分布,样本统计量有:平均数、两平均数之差、方差、尺度差、相干系数、回归系数、白一分比率等.27:正态分布:也称常态分布或常态分配,是连续随机变量概率分布的一种,正态分布N C0,1)称为尺度正态分布,它的平均值是0,尺度差是1.28:二项分布:是指试验仅有两种分歧性质结果的概率分布,具体定义是:设有N次试验,各次试验是彼此独立的,每次试验某事件出现的概率都是P,某事件不出现的概率都是q(等于1-P).则对于某事件出现X次(0,1,2,3.0 0 o n)的概率分布为为29:除了尺度正态Z分布外,儿种罕见的抽样分布包含X的平方分布,T分布,F分布.30:点估计:是用样本统计量来估计整体参数,因为样本统计量为数值上某一点值,估计的结果也以一个点的数值暗示,所以称为点估计.31:良好估计量的特性:无偏性、无效性、分歧性、充分性犯:区问估计:就是根据估量值以必定可靠程度推断整体参数所在的区问范围,它是用数轴上的一段距离暗示未知参数可能落入的范围,他虽不具体指出整体参数等于什么,但能指出未知整体参数落入某一区问的概率有多大33:相信区问:也称相信问距,是指在某一相信度时,整体参数所在的区域距离或区域长度.相信区问的上下两端点值称为相信界限.34:明显性水平是指估计整体参数落在某一区问时,可能犯错误的概率,用符号a暗示35:假设检验:通过样本统计量得出的差别做出普通性结论,判断整体参数之问是否存在差异,这类推论过程称作假设检验,它的基本任务就是事先对整体参数或整体分布外形做出一个假设,然后利用样本信息来判断原假设是否合理,从而决定是否接收原假设.假设检验包括“参数检验”和“非参数检验”.36:参数假设检验:若进行假设检验时整体的分布方式已知,须要对整体的未知参数进行假设检验;非参数假设检验:若对整体分布方式37:方差分析:次要功能在于分析实验数据平分歧来源的变异对总变异的贡献大小,从而确定实验中的白变量是否对因变量有次要影响38:方差分析的基来源根基理:综合虚无假设和部分虚无假设、方差的可分解性39:平方和:指观测数据与平均数离差的平方总和40:总变异被分解为“组问变异”和“组内变异"41:组问变异:次要指因为接受分歧的2而形成的各组之问的变异,可以用两个平均数之问的差别暗示42:组内变异:是由组内各被试因变量的差别范围决定的,次要指由实验误差、或组内被试之问的差别形成的变异. 43:发差分析的基本假定:整体正态分布、变异的彼此独立性、各实验处理内的方差要分歧44:组内设计:又称被试内设计,是指每个被试都要接受所有白变量水平的实验处理45:完整随机设计的方差分析:就是对单身分组问设计的方差分析,在这类实验研讨设计中,各种处理的分类仅以单个实验变量为基础,因此把它称为单身分方差分析或单向方差分析46:随机区组设计的方差分析:根据被试特点把被试划分为儿。
张厚粲现代心理与教育统计学第4版知识点总结课后答案
第1 章绪论1.1 复习笔记本章重点✓心理与教育统计的研究内容✓选择使用统计方法的基本步骤✓统计数据的基本类型✓心理与教育统计的基本概念一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现。
2.心理与教育科学研究数据具有随机性和变异性。
3.心理与教育科学研究数据具有规律性。
4.心理与教育科学研究的目标是通过部分数据来推测总体特征。
(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题:(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
二、心理与教育统计学的内容心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别:(一)分类一依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。
现代心理与教育统计学整理版复习版名词解释
答:正态分布的应用主要牵涉到通过查标准正态分布表进行Z分数和概率之间的转换。其主 要应用可以分为已知录取率求解分数线问题及其反问题, 即已知原始分数或根据特定界限求 解录取率或考生人数。分数线问题主要是根据录取率确定合适的查表概率(中央概率) ,查 得Z分数并转换为原始分数;后者则主要是通过将原始分数或界限标准化,查表得到概率然 后求解录取率或考生人数。此外,这种关系在测量中等级分数或难度的等距化、测验分数的 标准化等程序中也有应用。 3. 简述T检验和方差分析法在进行组间比较上的区别和联系
答:方差分析法的步骤是:①和一般的假设检验一样设立零假设和研究假设;②根据实验设 计的类型确定各变异源, 进行相应的平方和分解, 即有几个变异源就从总平方和中分解出几 个平方和;③根据平方和分解得到各变异源对应的自由度,即进行总自由度的分解;④根据 研究的目的和实验设计考虑要检验什么效应, 从而将其对应的平方和比上相应的自由度得到 该效应的均方,其中误差均方必须计算;⑤将各待检验效应的均方比上误差的均方,构造各 F统计量;⑥将计算来的各F统计量值和F检验的临界值进行比较得出统计结论,其中临界值 的分子自由度和分母自由度分别是待检验效应的自由度和误差自由度;⑦(可不答)如果效 应检验结果显著, 可以进入事后检验, 即对多水平的自变量进行多重比较考察各水平间的具 体差异,如果是多因素方差分析,交互作用效应检验显著,也可以进入简单效应检验具体考 察交互作用的情况。 7. 简述方差和差异系数在反映数据离散程度上的区别和联系
23标准分数:又称基分数或z分数,是以标准差为单位表示一个原始分数在团体中所处位置 的相对位置量数 24假设检验:在统计学中不能对H1的真实性直接检验,需要建立与之对立的假设,称作虚无 假设,或叫无差假设,零假设,记作H0.在假设检验中H0总是作为直接被检验的假设,而H1 与H0对立,二者择一,因而H1有时又叫做对立假设或备择假设。 25两类错误:虚无假设H0本来是正确的,但是拒绝了H0,这类错误成为弃真错误,即I型错 误。虚无假设本来不是正确的但却接受了H0,这类型错误成为取伪错误,即II类型错误。 26统计量:统计量是从一个样本中计算出来的一些量数,他可以描述一组数据的情况。 27虚无假设:虚无假设常常是根据历史资料,或根据周密考虑后确定的,若没有充分依据, 虚无假设不能被轻易否定的。 28X2检验:对心理和教育研究中收集到的计数数据进行统计分析,一般应用属性统计方法, 因为这类数据时按照事物属性进行多项分类的。另外,对这些计数数据分析是根据X2分布, 故称这类统计分析方法为X2检验 29.描述统计: 主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数 据的全貌,表达一件失误的性质 30.推论统计:主要研究如何通过局部数据所提供 的信息,推论总体的情形。 31.单侧检验:强调某一方向的检验叫做单侧检验 32.双侧检验:只强调差异而不强调方向性的检验称为双侧检验 33.参数:总体的那些特性称为参数。又称为丛悌参数,是描述一个总体情况的统计指标。 34.统计检验力:其他条件不变的情况下,u1与u0的距离改变,引起1-β的改变,所以称1-β 为统计检验力 35.F分布:设有两个正太分布的总体,其平均数与方差分别为 两个总体分别随机抽取容量 及 的样本每个样本都可计算出 , 及 , 从这
现代心理教育与统计学 第三版复习资料(张厚粲)
第一章绪论1.描述统计(descriptive statistics)主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。
2.描述统计只限于对试验样本所得观测数据的统计分析,不考察其总体的特性。
3.推论统计(inferential statistics)是以描述统计为基础,从而解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特性。
4.变量(variables):一个可以取不同数值的物体属性/事件。
5.事前无法预期结果的变量——随机变量6.观测值(原始取值):事后测定的某一结果。
7.概念理解:[涉及“实验”] 自变量(及其各水平)& 因变量(及相应的反应指标);[涉及“调查”,粗略对应于] 属性变量& 反应变量8.计数资料(count data):计算个数的数据,(如人口数,学校数,男女数等)9.计量资料(measurement data):借助于一定的测量工具或一定的测量标准而获得的数据(如分数,身高,体重,IQ)10.称名数据(nominal data):只区分属性或类别上的不同,只可计数,不能排序(性别,学科,职业)11.等级/顺序数据(ordinal data):可排序,但无相等单位,不能加减。
(等级评定,受教育程度,职称)12.等距数据(interval data):具有相等单位,无绝对零的数据,能加减不能乘除。
13.比率数据(ratio data):既表明量的大小,又具有相等单位,可以加减乘除,具有绝对零点。
14.称名数据和顺序数据合称为离散数据。
15.等距数据和比率数据合称为连续数据。
16.离散数据(discrete data)又称为不连续数据,这类数据在任何两个数据点之间所取的数据的个数是有限的。
17.连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。
现代心理与教育统计学
• 应用统计学是与研究对象密切结合的专门统计
学
第4页/共32页
二、统计学的起源
• Statistics(统计学)起源于法语status(状态),自中世纪 以来逐渐演变成含政治意味的state(国家、状态)。
• 统计学的原意是指对国家状态的调查研究。 • 古代中国和埃及都有过对国家大事统计调查的历史。 • Aristotle所著的《国家论》中,对很多国家的政治、学问、宗
• Fisher对数理统计方法进行了深入地研究提出了 方差分析法及各种检验法。
第12页/共32页
八、推断统计的应用
• 推断统计在自然科学、管理、工农业生产、社会科学、医学、心理学、行为科学、商业、气象……等几乎 任何领域推断统计学都是适用的
• 大量生产过程中的质量管理 • 在社会调查中的应用
第13页/共32页
教、艺术和风俗等进行了详细的论述,该书被认为是后来发展 起来的所谓“国势学”的先驱之作。
第5页/共32页
三、统计学的古老称谓
• 1.国势学
• 创立国势学体系的是德国的H.Conring(16061681)
• G.Achenwall(1719-1772)把统计学定义为: “把国家的重大事项全部记Байду номын сангаас下来的学科”
• 根据研究问题的实质将其内容划分为:描述一 件事物的性质;比较两件事物的差异;分析影 响事物变化的因素;一件事物两种不同属性之 间的相互关系;取样方法等。
第19页/共32页
• 1.描述统计: 主要研究如何整理心理与教育科 学实验或调查得来的大量数据,描述一组数据的 全貌,表达一件事物的性质。
• 具体内容有:数据如何分组,如何使用统计表与 统计图的方法去描述一组数据的分组及分布情况, 如何通过一组数据计算一些特征数,简缩数据进 一步显示和描述一组数据的全貌。例如计算算术 平均数、中数、众数、几何平均数、调和平均数; 计算平均差、标准差、变易系数与标准分数;相
《现代教育与心理统计学》期末考试复习要点
2013级《现代教育与心理统计学》期末考试复习要点一、题型(一)单项选择题(每题2分,共30分)(二)填空题(每空1分,共10分)(三)名词解释(每题3分,共12分)(四)简答题(每题6分,共24分)(五)计算题(第1题6分,第2题8分,第3题10分,共24分)第一章绪论第二节:心理与教育统计的内容(描述统计、推论统计、实验设计的定义及地位)第四节:心理与教育统计基础概念(数据类型、随机变量的概念及特点、样本、参数与统计量)第二章统计图表第二节:次数分布表(组距、组中值的计算,分组次数分布表编制的步骤)第三节:次数分布图(直方图、条形图、圆形图、散点图适合的数据资料)第三章集中量数第一节:算数平均数(平均数的计算、性质、优缺点及计算和应用的原则)第二节:中数与众数(二者的计算、优缺点及应用)第三节:其他集中量数(总平均数的计算)--平均数、众数、中数的关系第四章差异量数第二节:平均差、方差与标准差(计算公式、使用条件、方差和标准差的意义)第三节:标准差的应用(差异系数、标准分数的计算公式及具体应用)第四节:差异量数的选用(各种差异量数优缺点比较、如何选用差异量数)第五章差异量数第一节:相关关系与散点图(相关系数的定义、取值范围、类型、散点图)第二节:积差相关(适用资料、计算公式)第三节:斯皮尔曼等级和肯德尔等级相关(适用资料、计算公式)第四节:点二列相关和二列相关(适用资料)第六章:概率分布第一节:概率的基本概念(概率的取值范围、加法和乘法定理、分布类型)第二节:正态分布(正态分布的特征、正态分布理论在测验中的应用)第四节:抽样分布(样本平均数的分布、t分布的特点、F 分布的特点)第七章参数估计第一节:点估计、区间估计与标准误(良好估计量的标准、置信区间与显著性水平的概念、区间估计与标准误的计算)第二节:总体平均数的估计(估计总体平均数的步骤及计算)第八章假设检验第一节假设检验的原理(虚无假设和备择假设、假设检验中的两类错误、单侧检验和双侧检验、假设检验的步骤)第二节平均数的显著性检验第三节平均数差异的显著性检验第十四章抽样原理及方法第一节抽样的基本原则(随机化原则)第二节几种重要的随机抽样法第二节。
《张厚粲《现代心理与教育统计学》(第4版)笔记和课后习题(含考》读书笔记PPT模板思维导图下载
11.2 课后习题 详解
11.1 复习笔记
11.3 考研真题 和强化习题详解
第12章 线性回归
12.2 课后习题 详解
12.1 复习笔记
12.3 考研真题 和强化习题详解
第13章 多变量统计分析简介
13.2 课后习题 详解
13.1 复习笔记
13.3 考研真题 和强化习题详解
第14章 抽样原理及方法
08 第8章 假设检验 010 第10章 χ2检验
目录
011 第11章 非参数检验
013
第13章 多变量统计 分析简介
012 第12章 线性回归
014
第14章 抽样原理及 方法
本书特别适用于参加研究生入学考试指定考研参考书目为张厚粲《现代心理与教育统计学》的考生,也可供 各大院校学习张厚粲《现代心理与教育统计学》的师生参考。本书是张厚粲主编的《现代心理与教育统计学》 (第4版)的配套辅导书(电子书),主要具有以下几个方面的特点:(1)梳理知识脉络,浓缩学科精华。本书 每章的复习笔记均对该章的重难点进行了整理,并参考了国内名校名师讲授该教材的课堂笔记。因此,本书的内 容几乎浓缩了该教材的所有知识精华。(2)详解课后习题,巩固重点难点。本书参考大量相关辅导资料,对该教 材的课后思考题进行了详细的分析和解答,并对相关重要知识点进行了延伸和归纳。(3)精编考研真题,培养解 题思路。本书精选部分参考价值较高的考研真题(含全国统考和高校自主命题),及该学科相关经典习题,并提 供详细解答。这些题目基本体现了各个章节的考点和难点。(4)免费更新内容,获取最新信息。本书定期会进行 修订完善,补充最新的考研真题和答案。用户均可升级电子书免费获得。
14.2 课后习题 详解
14.1 复习笔记
现代心理与教育统计学复习资料
第一章 心理与教育统计学基础知识1、数据类型称名数据 计数数据 离散型数据 顺序数据等距数据测量数据 连续型数据比率数据2、变量、随机变量、观测值变量就是可以取不同值得量。
统计观察得指标都就是具有变异得指标。
当我们用一个量表示这个指标得观察结果时,这个指标就是一个变量。
用来表示随机现象得变量,称为随机变量。
一般用大写得X或Y表示随机变量。
随机变量所取得得值,称为观测值。
一个随机变量可以有许多个观测值。
3、总体、个体与样本需要研究得同质对象得全体,称为总体。
每一个具体研究对象,称为一个个体。
从总体中抽出得用以推测总体得部分对象得集合称为样本。
样本中包含得个体数,称为样本得容量n 。
一般把容量n ≥30得样本称为大样本;而n <30得样本称为小样本。
4、统计量与参数5、统计误差误差就是测得值与真值之间得差值。
测得值=真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。
由于使用得仪器、测量方法、读数方法等问题造成得测得值与真值之间得误差,称为测量误差。
由于随机抽样造成得样本统计量与总体参数间得差别,称为抽样误差第二章 统计图表一、数据得整理在进行整理时,如果没有充足得理由证明某数据就是由实验中得过失造成得,就不能轻易将其排除。
对于个别极端数据就是否该剔除,应遵循三个标准差法则。
二、次数分布表(一)简单次(频)数分布表(二)相对次数分布表将次数分布表中各组得实际次数转化为相对次数,即用频数比率(f /N)或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表(四)双列次数分布表双列次数分布表又称相关次数分布表,就是对有联系得两列变量用同一个表表示其次数%100 N f分布。
所谓有联系得两列变量,一般就是指同一组被试中每个被试两种心理能力得分数或两种心理特点得指标,或同一组被试在两种实验条件下获得得结果。
三、次数分布图使一组数据特征更加直观与概括,而且还可以对数据得分布情况与变动趋势作粗略得分析。
张厚粲《现代心理与教育统计学》(第4版)重点笔记及真题汇编
张厚粲《现代心理与教育统计学》(第4版)重点笔记及考研真题汇编节选自识库学习网,如需转载请注明出处1.1复习笔记本章重点*心理与教育统计的研究内容*选择使用统计方法的基本步骤*统计数据的基本类型*心理与教育统计的基本概念一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现。
2.心理与教育科学研究数据具有随机性和变异性。
3.心理与教育科学研究数据具有规律性。
4.心理与教育科学研究的目标是通过部分数据来推测总体特征。
(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题:(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
《现代心理与教育统计学》第4版笔记和课后习题详解
《现代心理与教育统计学》(第4版)笔记和课后习题详解第1章绪论1.1复习笔记本章重点ü心理与教育统计的研究内容ü选择使用统计方法的基本步骤ü统计数据的基本类型ü心理与教育统计的基本概念一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现。
2.心理与教育科学研究数据具有随机性和变异性。
3.心理与教育科学研究数据具有规律性。
4.心理与教育科学研究的目标是通过部分数据来推测总体特征。
(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题:(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
张厚粲《现代心理与教育统计学》(第3版)笔记和课后习题(含考研真题)详解
张厚粲《现代心理与教育统计学》(第3版)笔记和课后习题详解第1章绪论一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(applied statistics)两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现2.心理与教育科学研究数据具有随机性和变异性3.心理与教育科学研究数据具有规律性4.心理与教育科学研究的目标是通过部分数据来推测总体特征(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
二、心理与教育统计学的内容心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别。
(一)依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。
现代心理与教育统计学复习资料.docx
第一章1、数据类型厂称名数据?计数数据Y A离散型数据'顺序数据-厂等距数据-X测量数据彳,连续型数据J等比数据/2、变量:是可以取不同值的量。
统计观察的指标都是具有变异的指标。
当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。
用来表示随机现象的变量,称为随机变量。
一般用大写的X或Y表示随机变量。
随机变量所取得的值,称为观测值。
二个随机变量可以有许多个观测值。
3、需要研究的同质对象的全体,称为总体_每一个具体研究对象,称为一个个—从总体中抽出的用以推测总体的部分对象的集合称为样本。
—样本中包含的个体数,称为样本的容量n。
般把容量n ≥30的样本称为大样本;而n V 30的样本称为小样本。
4、统计量和参数统计指标统计量参数平均数Mμ标准差Sσ相关系数r P回归系数bβ5、统计误差误差是测得值与真值之间的差值。
测得值=真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。
由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。
由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误_________________第二章一、数据的整理在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。
对于个别极端数据是否该剔除,应遵循三个标准差法则。
二、次数分布表(一)简单次(频)数分布表(二)相对次数分布表将次数分布表中各组的实际次数转化为相对次数,即用频数比率( f / N )或百分比f100 % )来表示次数,就可以制成相对次数分布表N(三)累加次数分布表(四)双列次数分布表双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。
所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。
三、次数分布图使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。
现代心理与教育统计学的复习重点
一二章、绪论现代统计学之父:皮尔逊描述统计与推断统计描述统计主要研究如何整理、描述数据的特征。
推断统计主要研究如何通过局部数据所提供的信息推论总体特征。
变量类型定类变量:如,性别、学号、颜色类别、教学方法。
特征:没有绝对零点,没有测量单位。
变量值之间有“相等”和“不等”的关系,但没有大小之分,不能比较大小,更不能进行加、减、乘、除四则运算。
定序变量:程度、等级和水平。
如,比赛名次、品质等级、喜爱程度特征:既无零点、又无测量单位。
变量的值之间具有“等于”或“不等于”关系、序关系(优于、先于、劣于、后于等),四则运算没有意义。
定比变量:除了可以说出名称和排出大小,还能算出差异大小量的变量。
如温度、测验成绩、智商。
特征:有相等的测量单位,无绝对零点。
考试成绩为零不表示没有一点知识。
可进行加减运算,乘除运算则无意义。
定距变量:如身高、重量、学生人数。
既有测量单位,又有绝对零点,可进行计算。
降低偏差:利用随机抽样降低变异性:用大一点的样本三、描述统计一、频数:某一事件在某一类别中出现的次数。
频数分布类型:正态,正(负)偏态,正(反)J 形,U 形分布。
分布性质;集中(分散)程度,偏度和峰度不同。
偏态系数:数据的对称性峰态系数:数据的峰度二、集中量数:包括算术平均数M 、中位数d M 、众数0M (用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便)、加权平均数W M 、几何平均数g M 、调和平均数H M 。
组数据中有少数数据偏大或偏小,数据的分布呈偏态时,应用几何平均数。
算数平均数的性质(算法必须会):(1)每一个变量加减或乘除一个数之后,均值也相应增加。
(2)变量值与均值的离均差之和为零。
(3)变量值与均值的离均差平方和为最小值。
三、离散量数:全距R 、四分位差Q 、平均差A.D 、方差(样本统计量,2S 总体参数2)、标准差(s 或者SD)、百分位差全距:全部数据中的最大值与最小值的差,描述了数据分布的范围。
现代心理与教育统计学 笔记
概念(1)随机变量:在统计学上把取值之前,不克不及精确预感取到什么值的变量,称为随机变量.(2)总体:总体(population)又称为母全部或全域,是具有某种特点的一类事物的总体,是研讨对象的全部.(3)样本:样本是从总体中抽取的一部分个别.(4)个别:构成总体的每个根本单元.(5)次数:是指某一事宜在某一类别中消失的数量,又称作频数,用f暗示.(6)频率:又称相对次数,即某一事宜产生的次数除以总的事宜数量,通经常应用比例或百分数来暗示.(7)概率:概率论术语,指随机事宜产生的可能性大小器量指标.其描写性定义.随机事宜A在所有实验中产生的可能性大小的量值,称为事宜A的概率,记为P(A).(8)统计量:样本的特点值叫做统计量,又称作特点值.(9)参数:又称总体参数,是描写一个总体情形的统计指标.(10)不雅测值:随机变量的取值,一个随机变量可以有多个不雅测值.2何谓心理与教导统计学?进修它有何意义?答:(1)心理与教导统计学是专门研讨若何应用统计学道理和办法,汇集.整理.剖析心理与教导科学研讨中获得的随机性数据材料,并根据这些数据材料传递的信息,进行科学推论找出心理与教导统计运动纪律的一门学科.具体讲,就是在心理与教导研讨中,经由过程查询拜访.实验.测量等手腕有意地获取一些数据,并将得到的数据按统计学道理和步调加以整顿.盘算.绘制图表.剖析.断定.推理,最后得出结论的一种研讨办法.(2)进修心理与教导统计学有重要的意义.①统计学为科学研讨供给了一种科学办法.科学是一种常识体系.它的研讨对象消失于实际世界各个范畴的客不雅事实之中.它的重要义务是对客不雅事实进行猜测和分类,从而揭示储藏于个中的各种因果关系.要进步对客不雅事实不雅测及剖析研讨的才能,就必须应用科学的办法.统计学恰是供给了如许一种科学办法.统计办法是从事科学研讨的一种必不成少的工具.②心理与教导统计学是心理与教导科研定量剖析的重要对象.凡是客不雅消失事物,都稀有量的表示.凡是稀有量表示的事物,都可以进行测量.心理与教导现象是一种客不雅消失的事物,它也稀有量的表示.固然心理与教导测量具有多变性并且旨起它产生变更的身分许多,难以精确测量.但是它毕竟照样可以测量的.是以,在进行心理与教导科学研讨时,在必定前提下,是可以对心理与教导现象进行定量剖析的.心理与教导统计就是对心理与教导问题进行定量剖析的重要的科学对象.③宽大心理与教导工作者进修心理与教导统计学的具体意义.a.可经顺遂浏览国表里先辈的研讨成果.b.可以进步心理与教导工作的科学性和效力.c.为进修心理与教导测量和评价打下基本.?答:一项实验研讨成果要用何种统计办法去剖析,须要对实验数据进行卖力的分析.只有做到对数据剖析精确,才干对统计办法做出精确地选用.选用统计办法可以分为以下步调:(1)起首,要剖析一下实验数据是否合理,即所或得的数据是否合实用统计方法行止理,精确的数量化是应用统计办法的起步,假如对数量化的进程及其意义没有懂得,将一些不着边沿的数据加以统计处理是毫无意义的.(2)其次,要剖析实验数据的类型.不合数据类型所应用的统计办法有很大差别,懂得实验数据的类型和程度,对选用恰当的统计办法至关重要.(3)第三,要剖析数据的分布纪律,如总体方差的情形,肯定其是否知足所选用的统计办法的前提前提.4.什么叫随机变量?心理与教导科学实验所获得的数据是否属于随机变量?答:(1)在统计学上把取值之前,不克不及精确预感取到什么值的变量,称为随机变量.(2)心理与教导科学实验所获得的数据属于随机变量.心理与教导科学研讨数据具有随机性和变异性.科学研讨中因不雅测人员.不雅测对象.不雅测前提的变更而具有随机变更的现象.在心理和教导科学范畴,研讨获得的数据材料也具有必定随机性质.不雅测数据的这种特色,称为变异性.即便应用统一种测量对象,不雅测统一事物,只如果进行多次,那么获得的数据就不会完整雷同.跟着测量对象的完美和精确,数据的这种随机性变更就更明显.例如,人们对统一年级或统一年纪儿童甚至对统一小我进行统一学科的学业测试,或对统一个心理特色进行评量.不雅察多次,得到的数据毫不会全然雷同,这些数据老是在必定的规模内变更.造成数据变异的原因,出自不雅测进程中一些有时的不成掌握的身分,称随机身分.随机身分使测量产生的误差称作随机误差.因为这种随机误差的消失,使得在雷同前提下不雅测的成果常常不止一个,并且事前无法肯定,这是客不雅世界消失的一种广泛现象,人们称这类现象为随机现象.在教导和心理科学的各类研讨中,研讨的对象是人的内涵的各种心理现象,不但由客不雅上一些有时身分会引起测量误差,由实验者和被试主不雅上一些不成掌握的有时身分也会造成测量误差,这些有时身分+分庞杂,因而造成的随机误差就更大,也就是使心理与教导科学研讨中得到的数据具有更明显的变异性.5.如何懂得总体.样本与个别.答:根据其各自的界说,我们可以用下面这个图来暗示.大圆暗示研讨对象的全体,也就是总体;大圆中的小圆暗示个中一个样本,大圆中所有的点代表的是样本.6.统计量与参数之间有何差别和关系.答:(1)参数是描写总体情形的统计指标;样本的特点值称作统计量.(2)差别:1参数是从总体中盘算得到的量数,代表总体特点,一个常数.统计量是从一个样本中盘算得到的量数,它描写一组数据的情形,是一个变量,随样本的变更而变更.2参数经常应用希腊字母暗示,样本统计量用英文字母暗示.(3)接洽:1参数平日是经由过程样本特点值来猜测得到,(7.答案略)8.下述一些数据,哪些是测量数据?哪些是计数数据?其数值意味什么?(1)17. 0千克(2 ) 89. 85厘米(3) 199. 2秒(4) 17人(5) 25本(6 ) 93. 5答:上面的数据中测量数据有:(1) 17.0千克(2 ) 89. 85厘米(3 ) 199. 2秒(6)93. 5分计数数据有:(4) 17人(5) 25本(2) 17. 0千克.89. 85厘米.199. 2秒.93. 5分,这些数据是借助必定的重量.长度.时光或必定的测量尺度而获得数据,分别代表事物的重量.长度.时光或者分数.9符号代表的意义(教材20页)(1)总体平均数,期望值 (2)样本平均数 (3)总体之间的相干系数 (4)样本间的相干系数 (5)总体尺度差 (6)样本尺度差 (7)总体间的回归系数 (8)有限个别数量标总体 (9)样本容量,样本大小1.统计分组应留意哪些问题?答:进行统计分组时须要留意下列问题:(1)分组要以被研讨对象的本质特点为基本面对大量原始数据进行分组时,有时须要先做初步的分类,分类或分组必定是要选择与被研讨现象的本质的关的特点为根据,才干确保分类或分组的精确.在心理与教导学研讨方面,专业常识的懂得和熟习对分组的精确进行有重要的感化.例如在学业成绩研讨中按学科性质分类,在整顿智力磨练成果时,按言语智力.操纵智力和总的智力分数分类等.(2)分类标记要明白,要能包含所有的数据对数据进行分组时,所根据的特点称为分组或分类的标记.整顿数据时,分组标志要明白并在整顿数据的进程中前后一致.这就是说,关于被研讨现象本质特点的概念要明白,不克不及既是这个又是谁人.别的,所根据的标记必须能将全部数据包含进去,不克不及有漏掉,也不克不及半途转变.2.直条图或叫条形图:重要用于暗示离散型数据材料,即计数材料.详见教材45页.3.圆形图或叫饼图:重要用于描写间断性材料,目标是为显示多部分在整体中所占的比重大小,以及各部分之间的比较.:统计学的道理和数学的办法在心理学范畴中的应用.描写统计和推理统计两大部分.3.实验数据可分为两类:精确数和近似值.4.肯定组距今后,要斟酌最小的一组从哪开端.显然,最小的一组应包含全部系列中的最小数值.5.在心理实验中经常应用的表格有三类:原始数据登记表,经由火组整顿的次数分布表,带有对实验成果总结性质的表6.暗示实验成果的图有:平面图和立体图.7.平面图一般分为:曲线图和直方图两类.8.平面图有两个坐标,横坐标代表心理实验中的刺激变量或自变量,纵坐标代表反响变量或因变量.当横坐标代表的数量是持续的,可画曲线图或直方图;当横坐标代表的数量不是持续的变量,而是不合类别时,就只能画直方图,其纵坐标必须从0开端.上限.算术平均数.明显的分散趋向指标,但众数不如平均数和中数稳固.12.分组不合适会消失双峰,可调剂组距.真正的双峰消失的原因是_有两种性质不合的数据_.13.在偏斜的分布中,平均数老是处于偏斜的一端,而中数则永久把一个分布曲线下的面积分成相等的两部分.14. q2-q1<q3-q2时,分布向右偏斜;q2-q1=q3-q2时,分布向对称;q2-q1>q3-q2时,分布向_左(哪方大则朝哪方偏斜)偏斜.15.暗示两个变量之间相干性质和程度的图,叫分布图.假如图中所有的点形成一条直线,解释是一个完整正相干的分布图;假如是椭圆,这个椭圆越窄,解释相干程度越_高_____.16.从样本估计总体是以概率原则为基本的,假如样本中只包含随机误差就不致产生对总体偏性的估计;假如样本中还包含体系误差在内,就会产生偏性估计.17.当一个总体中的成分只分成两类时,根据传统,把_愿望得到的成果,产生的概率叫P;不愿望得到的成果产生的概率叫q.18.在一系列正态分布中,有一个尺度的正态分布,其平均数为_0,尺度差为_ 119.当实验数据有___二组____以上时,并且都是__不持续_____的变量时,要检验各组间的差别是否明显就须要用c2分布进行盘算.20.统计成果磨练时:1 ) w2为0. 14_时,实验后果较强,统计成果可托.2 ) w2为0. 16_时,实验后果中等,统计成果可托度一般.3 ) w2为0. 01_时,实验后果很差,统计成果不成信.21.用d值解释实验后果时:1) d是0.2时,实验后果较小; 2) d;是0.5时,后果中等; 3)d>>0. 8_时,后果较大.概念1.描写统计:是对成组数据归纳分解的描写.描写统计的指标有三类:数据的分散趋向,数据的离中趋向,数据间的相干.2.推论统计:办法包含从样本的数量特点推想总体数量特点的一系列问题:推论假设,推论的各类办法和步调,以及磨练推想靠得住性的各类办法.3.组距:每一组上限和下限的差.(组距习上经常应用2, 3, 5, 10, 204.中点:在某一组的下限和上限当中的那一点.5.分散趋向:是代表一系列数据的典范程度的数字指标,代表分散趋向的指标有平均数,中数和众数.6.平均数(x):是一组数据总和的平均值.7.中数(mdn):一系列按大小次序分列的数据中的一个点,在这个系列中有一半数据在这个点以上,有一半数据在这个点以下.8.众数(mo):在一系列数据中消失次数最多的谁人数.9.全距:一个分布中最大的数值的上限减去最小数值的下限,就得到全距.(全距大,解释这组数据疏散;全距小,则较分散.应用时留意:1.无极端值;2,比较两个分布的全距时,当两个分布所包含数据的数量相等或差不久不多时才干使用)10.离中趋向:是暗示一组数据疏散程度的指标,经常应用的指标有:全距,四分差,平均差和尺度差.(假如离中趋向很小,解释数据分布都在平均数邻近变动,是以平均数的代表性很大;假如离中趋向太大,解释数据分布太疏散)11.四分差(q):是数据的离中趋向的指标之一,四分差解释按大小次序分列的一系列数据中心50%个数据的疏散程度.(假如一个分布中心部分的数据比较分散,则两个四分点q3与q1就离得近些,a的值就小些.)12.百分点:某次数分布中处于某百分等级的数值.13.百分等级:某数值在某次数分布中所处的地位.14.平均差(ad):一个分布中每个变量和平均数的差的绝对值的平均值.15.尺度差:s2开方后的正值就叫尺度差,是数据的离中趋向的指标之一.16.离中系数(CV):用相对量来暗示数据疏散程度的数字指标.:指相干是否亲密,可分为无相干;部分相干;完整相干.18.相干:是描写两种数量关系的一个指标,假如一个变量随另一个变量的增加(减小)而增长(减小),则两个变量之间消失着相干.19. z分数(尺度分数):是以尺度差为单位所暗示的原始分数(x)与平均数的偏离,也可以说是一个以尺度差为单位来暗示的偏离分数.20.总体;某类事物的全部称为总体.21.样本:从全部抽出的部分叫样本.22.推论统计:从局部推想全部,从样本推想总体的统计程序.23.随机抽选样本:指总体中每个成分都有一致的机遇被抽选.24.分层抽样:用分层抽样的办法,必须对总体有必定的懂得,事先对于影响所研讨问题的诸身分做恰当安插.25.样本分布:从许多个样本中算出的许多个平均数的次数分派叫样本分布.26.正态分布:是一个中心高,两侧逐渐降低,两头永久不与横轴订交,两侧完整对称的钟形曲线.27.平均数的尺度误(sx):为了和单个样本的尺度差有所差别,把样本分布的尺度差称做平均数的尺度误.28.自由度(df):可以或许自力变更的数据的数量.29.平均数差的尺度误(sxd ):分别从两个总体中抽掏出的多个样本平均数的差(xd)的分布,这个分布的尺度差叫做平均数差的尺度误.30.虚无假设(ha):除概率以外不加任何其它假定,即假设二总体的平均数差别为O31.备则假设(ha):假设两个总体平均数之间差别中除了抽样误差外,还包含有两个总体平均数之间的差别,即备则假设是个总体平均数之间差别不为O32.明显性生程度(P):我们所选择的颠覆虚无假设的概率叫做磨练的明显性程度.33.第一类错误:当虚无假设不该颠覆时而被颠覆了,这意味着把样本的平均数不同以为是代表了总体平均数的差别.34.第二类错误:当应当颠覆虚无假设时而不颠覆,这意味着把样本的平均数不同是代表总体平均数的不同这一事实给否定了.35.明显性磨练:经由过程样本平均数的不同来推论总体平均数是否真正消失不同,并肯定消失何种程度.36.回归:当两种变量间消失着必定程度的相干时,一种变量有向另一种变量的平均数趋近的现象,这种现象叫回归.37.回归方程式:从一变量的数值猜测另一变量的响应数值的直线方程式,当两个变量部分相干时,有两个回归方程式.38.回归系数(byx):由x变量猜测Y变量的回归方程式的斜率.39.c2磨练:是实际不雅察次数与假设次数偏离程度的指标.40.方差剖析:根据组间和组内方差的比值,来比较两组或多组数据的差别是否达到明显.41.组间变异:在两组之间所产生的因变量的变异,就是体系变异,也就是由自变量引起的变异.因为这种变异产生在两组之间,所以又叫组间变异.42.组内变异:统一组内的因变量的变异,就不是因为自变量的情形不合引起的,而只是因为未加掌握的变量引起的.因为这种变异产生在统一组内,所以叫做组内变异.43.组间设计:每个被试只介入1个程度的实验44.组内实际:每个被试介入所有程度的实验.45.主效应:自变量所引起的平均数差别46.交互感化:一个自变量对反响变量的影响因另一个自变量的变更而产生1,伽利略提出了概率论的根本理论;法国数学家帕斯卡和费马创立了概率论,未统计学的成长奠基了重要基本;贝奴里定理的产生,为发明正态概率分布创造了前提;棣莫弗推导出“正态曲线方程”;皮尔逊揭橥了频率曲线理论和积差相干;斯皮尔曼提出等级相干;肯德尔W系数和U系数;格赛特T分布理论;费舍是推论统计真正的创始者,最先提出F分布理论,使方差剖析体系化;凯特勒他将统计办法应用于教导学和社会学的研讨;斯内德克提出方差剖析;克一瓦氏H磨练是一种非参数方差剖析办法,它与参数办法中的完整随机材料方差剖析相对应;费里德曼双向等级方差剖析可解决随机区组实验设计的非参数磨练问题2:从数据的不雅测办法和起源划分,研讨数据可分为计数数据和测量数据两大类;根据数据反应的测量程度,可把数据区分为称名数据.次序数据.等距数据和比率数据四种类型;按照数据是否具有持续性,把数据分为离散数据和持续数据3:统计表的儿个构成要素:表号.名称.标目.数字.表注.4:统计图的构成部分:图号及图题.图目.图尺.图形.图例.图注5:次数分布显示初步整顿后一组数据的分布情形重要暗示数据在各个分组区问内的散布情形,可分为简略次数分布.分组次数分布.相对次数分布.累计次数分布.6:经常应用的次数分布图有直方图.次数多边形图及累加次数分布图.7:其它经常应用的统计图的类别:直方图.条形图.圆形图.线形图.散点图:条形图又分为简略条形图.分组条形图.分段条形图8:其它经常应用统计表类型:简略表.分组表.复合表9:用来描写数据分散趋向和离中趋向的统计量分别称为分散量数和差别量数.10:分散量数包含:算数平均数.中数.众数.加权平均数.儿何平均数.折衷平均数等.12:平均数的优缺陷:长处:反响敏锐.盘算周密.盘算简略.简明易解.合适于进一步用代数办法演算.较少受抽样变动的影响;缺陷:易受极端数据的影响.若消失隐约不清的数据时,无法盘算平均数.13:盘算和应用平均数的原则:同质性原则.平均数与个别数值相联合的原则.平均数与尺度差.发差相联合的原则14:差别量数就是对一组数据的变异性,即离中趋向特色进行器量和描写的统计量.15:差别量数有:全距.四分位差.白一分位差.平均差.尺度差与方差16:相干类别为:正相干.负相干.零相干17:质量相干分为:点二列相干.二列相干及多系列相干18:品德相干:重要分为四分相干.C相干.列联表相干19:概率:是标明随机事宜消失可能性大小的客不雅指标就是概率,概率的界说有两种即后验概率和先验概率20:概率分布类型:160页离散分布与持续分布.经验分布与理论分布.根本随机变量分布与抽样分布21“概率分布:是指对随机变量取值的概率分布情形用数学办法(函数)进行描写22:持续分布:是指持续随机变量的概率分布,即测量数据的概率分布,它用持续随机变量的分布函数描写它的分布纪律23:离散分布:离散随机变量的分布又称作离散分布24:经验分布:是指根据不雅察或实验所获得的数据而编制的次数分布或相对频率分布25:理论分布:一是随机变量概率分布的函数一数学模子,二是按某种数学模子盘算出的总体的次数分布26:抽样分布:是样本统计量的理论分布,样本统计量有:平均数.两平均数之差.方差.尺度差.相干系数.回归系数.白一分比率等. 27:正态分布:也称常态分布或常态分派,是持续随机变量概率分布的一种,正态分布N C0,1)称为尺度正态分布,它的平均值是0,尺度差是1.28:二项分布:是指实验仅有两种不合性质成果的概率分布,具体界说是:设有N次实验,各次实验是彼此自力的,每次实验某事宜消失的概率都是P,某事宜不消失的概率都是q(等于1-P).则对于某事宜消失X次(0,1,2,3.0 0 o n)的概率分布为为29:除了尺度正态Z分布外,儿种罕有的抽样分布包含X的平方分布,T分布,F分布.30:点估计:是用样本统计量来估计总体参数,因为样本统计量为数值上某一点值,估计的成果也以一个点的数值暗示,所以称为点估计.31:优越估计量的特点:无偏性.有用性.一致性.充分性犯:区问估计:就是根据估计值以必定靠得住程度揣摸总体参数地点的区问规模,它是用数轴上的一段距离暗示未知参数可能落入的规模,他虽不具体指出总体参数等于什么,但能指出未知总体参数落入某一区问的概率有多大33:置信区问:也称置信问距,是指在某一置信度时,总体参数地点的区域距离或区域长度.置信区问的高低两头点值称为置信界线.34:明显性程度是指估计总体参数落在某一区问时,可能犯错误的概率,用符号a暗示35:假设磨练:经由过程样本统计量得出的差别做出一般性结论,断定总体参数之问是否消失差异,这种推论进程称作假设磨练,它的根本义务就是事先对总体参数或总体分布形态做出一个假设,然后应用样本信息来断定原假设是否合理,从而决议是否吸收原假设.假设磨练包括“参数磨练”和“非参数磨练”.36:参数假设磨练:若进行假设磨练时总体的分布情势已知,须要对总体的未知参数进行假设磨练;非参数假设磨练:若对总体分布情势37:方差剖析:重要功效在于剖析实验数据中不合起源的变异对总变异的进献大小,从而肯定实验中的白变量是否对因变量有重要影响38:方差剖析的基起源基本理:分解虚无假设和部分虚无假设.方差的可分化性39:平方和:指不雅测数据与平均数离差的平方总和40:总变异被分化为“组问变异”和“组内变异"41:组问变异:重要指因为接收不合的2而造成的各组之问的变异,可以用两个平均数之问的差别暗示42:组内变异:是由组内各被试因变量的差别规模决议的,重要指由实验误差.或组内被试之问的差别造成的变异.43:发差剖析的根本假定:总体正态分布.变异的互相自力性.各实验处理内的方差要一致44:组内设计:又称被试内设计,是指每个被试都要接收所有白变量程度的实验处理45:完整随机设计的方差剖析:就是对单身分组问设计的方差剖析,在这种实验研讨设计中,各类处理的分类仅以单个实验变量为基本,因而把它称为单身分方差剖析或单向方差剖析46:随机区组设计的方差剖析:根据被试特色把被试划分为儿个区组,再根据实验变量的程度数在每一个区组内划分为若干个小区,统一区组随机吸收不合的处理.这类实验设计的原则是统一区组内的被试应尽量同质47:试比较完整随机设计与随机区组设计的优.缺陷?随机区组设计因为统一区组接收所有实验处理,使实验处理之问有相干组设计,或称被试内设计.与完整随机设计比拟,其最大长处是斟酌到个别差别的影响.这种因为被试之问性质不合导致产生的差别就称为区组效应.随机区组设计可以将这种影响从组内变异平分别出来,从而进步效力.但是这种设计也出缺少,重要表示为划分区组艰苦,假如不克不及包管统一区组内尽量同质,则有消失更大误差的可能. 48:当全部实验中的个别差别知道后,就可以算出个别差别造成的变异,即区组变异.这时总平方和被分化为三部分:被试问平方和.区组平方和.误差项平方和。
现代心理与教育统计学知识点
现代心理与教育统计学知识点心理统计学第一章概述描述统计定义:研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理概括和表述作用:使杂乱无章的数字更好的显示出事物的某些特征,有助于说明问题的实质。
具体内容:1数据分组:采用图与表的形式。
2计算数据的特征值:集中量数(平均数中数)离散量数(方差)3计算量事物间的相关关系:积差相关(2列 3列多列)推断统计定义:主要研究如何利用局部数据(样本数据)所提供的信息,依据数理统计提供的理论和方法,推论总体情形。
作用:用样本推论总体。
具体内容:1如何对假设进行检验。
2如何对总体参数特征值进行估计。
3各种非参数的统计方法。
心理与教育统计基础概念数据类型一从数据来来划分 1计数数据:计算个数或次数而获得的数据。
(都是离散数据)2测量数据:借助一定测量工具或测量标准而获得的数据。
(连续数据)二根据数据所反映的测量水平 1称名数据(分类)定义:指用数字代表事物或数字对事物进行分类的数据。
特点:数字只是事物的符号,而没有任何数量意义。
统计方法:百分数次数众数列联相关卡方检验等。
(非参检验)2顺序数据(分类排序)定义:指代事物类别,能够表明不同食物的大小等级或事物具有的某种特征的程度的数据。
(年级)特点:没有相等单位没有绝对零点。
不表示事物特征的真正数量。
统计方法:中位数百分位数等级相关肯德尔和谐系数以及常规的非参数检验方法。
3等距数据(分类排序加减(相等单位))(真正应用最广泛的数据)定义:不仅能够指代物体的类别等级,而且具有相等的单位的数据。
(成绩温度)特点:真正的数量,能进行加减运算,没有绝对零点,不能进行乘除计算。
统计方法:平均数标准差积差相关 Z检验 t检验 F检验等。
4比率数据(分类排序加减法乘除法(绝对零点))定义:表明量的大小,也具有相等单位,同时具有绝对零点。
(身高反应时)特点:真正的数字,有绝对零点,可以进行加减乘除运算。
在统计中处理的数据大多是顺序数据和等距数据。
现代心理与教育统计学-笔记
概念(1)随机变量:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。
(2)总体:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体.(3)样本:样本是从总体中抽取的一部分个体。
(4)个体:构成总体的每个基本单元。
(5)次数:是指某一事件在某一类别中出现的数目,又称作频数,用f表示。
(6)频率:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。
(7)概率:概率论术语,指随机事件发生的可能性大小度量指标.其描述性定义.随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A).(8)统计量:样本的特征值叫做统计量,又称作特征值.(9)参数:又称总体参数,是描述一个总体情况的统计指标。
(10)观测值:随机变量的取值,一个随机变量可以有多个观测值。
2何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。
具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法.(2)学习心理与教育统计学有重要的意义.①统计学为科学研究提供了一种科学方法。
科学是一种知识体系。
它的研究对象存在于现实世界各个领域的客观事实之中。
它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。
要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。
统计学正是提供了这样一种科学方法。
统计方法是从事科学研究的一种必不可少的工具.②心理与教育统计学是心理与教育科研定量分析的重要工具。
凡是客观存在事物,都有数量的表现。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一二章、绪论现代统计学之父:皮尔逊描述统计与推断统计描述统计主要研究如何整理、描述数据的特征。
推断统计主要研究如何通过局部数据所提供的信息推论总体特征。
变量类型定类变量:如,性别、学号、颜色类别、教学方法。
特征:没有绝对零点,没有测量单位。
变量值之间有“相等”和“不等”的关系,但没有大小之分,不能比较大小,更不能进行加、减、乘、除四则运算。
定序变量:程度、等级和水平。
如,比赛名次、品质等级、喜爱程度特征:既无零点、又无测量单位。
变量的值之间具有“等于”或“不等于”关系、序关系(优于、先于、劣于、后于等),四则运算没有意义。
定比变量:除了可以说出名称和排出大小,还能算出差异大小量的变量。
如温度、测验成绩、智商。
特征:有相等的测量单位,无绝对零点。
考试成绩为零不表示没有一点知识。
可进行加减运算,乘除运算则无意义。
定距变量:如身高、重量、学生人数。
既有测量单位,又有绝对零点,可进行计算。
降低偏差:利用随机抽样 降低变异性:用大一点的样本三、描述统计一、频数:某一事件在某一类别中出现的次数。
频数分布类型:正态,正(负)偏态,正(反)J 形,U 形分布。
分布性质;集中(分散)程度,偏度和峰度不同。
偏态系数:数据的对称性 峰态系数:数据的峰度二、集中量数:包括算术平均数M 、中位数d M 、众数0M (用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便)、加权平均数W M 、几何平均数g M 、调和平均数H M 。
组数据中有少数数据偏大或偏小,数据的分布呈偏态时,应用几何平均数。
算数平均数的性质(算法必须会):(1)每一个变量加减或乘除一个数之后,均值也相应增加。
(2)变量值与均值的离均差之和为零。
(3)变量值与均值的离均差平方和为最小值。
三、离散量数:全距R 、四分位差Q 、平均差A.D 、方差(样本统计量,2S 总体参数2σ)、标准差(s 或者SD)、百分位差全距:全部数据中的最大值与最小值的差 ,描述了数据分布的范围 。
四分位差(Q ):样本中间50%的人的全距的一半。
是一个距离,Q 越大,表示样本中各样品越不整齐.平均差:全部数据与均值绝对离均差的均值。
方差:各个数据偏离中心的程度。
方差越大,数据波动越大。
标准差:方差的算术平方根。
自由度:自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数。
标准分数:以标准差为单位表示一个原始分数在团体中所处的相对位置,即原始分数在均值以上或以下几个标准差的位置。
性质:标准分数的均值为0,标准差为1。
没有实际单位。
应用: (1)、比较不同性质的观测值在各自数据分布中相对位置的高低。
如身高与体重。
(2)计算不同质的观测值的总和或者均值,以表示在团体中的相对位置。
如高考的标准分。
(3)做线性转换后,表示标准测验分数。
如IQ 。
图表条形图,用于定性数据。
直方图与多边图:用于定量数据 时序图:反映事物变化趋势饼图:定性数据的多少或构成比例散点图:两个变量的变化关系和变化方向。
茎叶图:保留小样本连续变量的原貌。
三线表的组成要素包括:表序、表题、项目栏、表体、表注五、随机变量分布正态分布),(2σμN X ≈------------------样本均值的分布正态分布曲线下的面积:曲线高度是频数(Y ),曲线下面积则是累积频数P (也视作随机变量出现的概率)。
X 轴上的截距为Z 。
其中,μ决定曲线的位置,σ决定曲线的“胖瘦”。
无论各分布的均值与标准差的值是多少,x 取值以下特定区域的概率(面积)是确定的,即:正负一个标准差,占68.27%,两个95.45% ,三个99.73% 标准正态分布:均值为0,标准差为1.总体服从正态分布N ~ (μ,2σ )时,来自该总体的所有容量为n 的样本的均值X 也服从正态分布,X 的期望为μ,方差为σ2/n 。
即X ~N(μ,n2σ)平均数的标准误NX σσ=标准误衡量了抽样误差(sampling error)的大小。
所谓抽样误差是指由抽样引起的样本统计量与总体参数间的差异。
标准误越小,统计量与参数越接近,样本对总体越有代表性,用统计量推断参数的可靠度越大,所以,标准误是推断统计可靠性的重要指标。
卡方分布:变量相互独立,且服从)1,0(N 分布的随机变量。
称随机变量服从自由度为为n 的卡方分布。
记做)(22n x x ≅,∑==ni i x x 122卡方分布:样本方差的分布(样本方差的分布)T 分布:随机变量X 服从N(0,1),Y 服从)(2n x ,且相互独立,则随机变量服从自由度为n 的t 分布,记做t t(n).nY Xt =.来自一个正态总体:1)(),1()(2--=-≈-=∑N X X S N t NS X t 其中,μ来自两个正态总体2)1()1(),2()()(212222112121212121-+-+-=-+≈+---=N N SN S N S N N t N N N N S X X t P P其中,μμP S 为两样本的混合标准差。
T 分布的均值为0,方差为n/(n-2).t 统计量是参数估计与假设检验的基础。
特点:当样本容量趋于∞,t 分布为正态分布,方差为1,随自由度的减少,离散程度(方差)增大,分布中间变低,尾部变高。
F 分布:)1,1(212221--≈=N N F S S F ----------两样本方差的比F 统计量主要用于方差分析、协方差分析、回归分析等。
六、参数估计参数估计:当在研究中从样本获得一组数据后,如何通过这组信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,称为总体参数估计。
总体参数估计问题可以分为点估计与区间估计。
点估计:用某一样本统计量的值来估计相应总体参数的值。
优良的估计量具有的性质:无偏性、有效性、一致性。
区间估计:按一定概率要求,由样本统计量的值估计总体参数值的所在范围。
原理:抽样分布理论。
抽样分布的标准误的大小决定置信区间的长度。
置信区间:指在某一置信度时,总体参数所在的区域长度。
置信度:是作出某种推断时正确的可能性(概率)。
通常用(1-a)表示。
显著性水平:即 a ,是指估计总体参数落在某一区间时可能犯错误的概率。
两个要素:可靠性(置信水平的高低)和精确度(区间长度)。
置信水平为95%的置信区间的确切含义:重复抽样N 次,所得到的N 个置信区间中有95%个包含了总体参数。
影响区间估计精确度的因素: (1)置信度(1-a)(反比) (2)样本容量(正比)(3)总体数据的变异程度(反比)0.95的置信区间:个标准误96.1±X单总体均值的区间估计:方差已知,正态分布;)1,0(N nX Z ≈-=σμ方差未知,t 分布。
两总体均值差异的区间估计:T 分布。
相关样本与独立样本都为T 分布。
其中,独立样本时用很长很长的那个公式。
总体均值的区间估计:卡方分布)1(1222-≈-N x S N σ七、假设检验假设检验(显著性检验):事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立。
类型:参数检验和非参数检验(包括分布检验和独立性检验)。
假设检验的原理:(1)逻辑上为反证法(假设检验首先假定虚无假设0H 为真,通过否定0H ,来检验备择假设1H 的真实性)(2)统计上为小概率事件(小概率事件在一次实验或观测中,几乎是不可能发生的。
在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设。
小概率由研究者事先确定,如0.05, 0.01, 0.001等)。
假设检验的步骤:(1)提出原假设和备择假设(2)确定适当的检验统计量,检验统计量(方差已知)的基本形式为:nx z σμ0-=(3)规定显著性水平(0.05或0.01) (4)计算检验统计量的值 (5)作出统计决策拒绝域:拒绝原假设的概率。
两类错误:拒真错误α型错误;取伪错误β型错误。
统计效力(统计检验力)β-1。
两类错误的关系: (1)βα+不一定等于1.(2)其他条件不变,两者不能同时增大或者减小。
(3)两者地位不一样。
我们应尽量避免第一类错误。
(4)影响β错误的因素有总体标准差(正比)和样本容量(反比)。
单侧检验与双侧检验单侧检验:强调方向性。
双侧检验:只强调差异,不强调方向性。
单总体均值的假设检验: 方差已知,正态分布;)1,0(N nX Z ≈-=σμ。
用这个统计公式,然后查表。
方差未知,t 分布。
1)(),1()(2--=-≈-=∑N X X S N t NS X t 其中,μ两总体均值差异的显著性检验: (1)相关样本,使用 t 分布统计量(2)独立样本,方差已知,使用正态分布统计量;2221212121)()(N N X X Z σσμμ+---=(3)独立样本,方差未知,但是齐性,使用 t 分布统计量2)1()1(),2()()(212222112121212121-+-+-=-+≈+---=N N S N S N S N N t N N N N S X X t P P 其中,μμ总体分布的假设检验(属于非参数检验):卡方检验 设有N 个被试,按变量X 的取值可以分成k 类,第i 类有Oi 个观测值,则检验统计量为:)1()(2122-≈-=∑=K x E E O x ki i i i八、方差分析方差分析的逻辑:把观察值的总变异分解为两个或多个部分,除随机误差外,其余各部分变异可由某个或某几个因素或它们的交互作用来解释。
F 分布的统计推断可阐明某一或某些因素或因素间交互作用是否对观察值有影响。
单因素方差分析的逻辑与步骤: (1)模型与假设(2)平方和的分解与F 检验 (3)关联强度与效应值 (4)多重比较(5)前提假设方差分析的前提条件:总体服从正态分布;变异可加性;方差齐性;独立性。
单因素完全随机设计的方差分析:关联强度与效应值:实验处理引致的效应的大小或者数据的变异有多少部分是由实验处理造成的。
关联强度:因变量的变异被自变量解释的百分比。
事后比较:F检验显著说明各组均值并不相同(至少两组不同),但不能回答到底哪几组不同。
通过对各组均值之间的配对比较来进一步检验到底哪些均值之间存在差异。
事后比较的方法:(1)费舍最小显著差异法:对检验两总体均值是否相等的t检验方法的总体方差估计加以修正(用MSE代替)。
(2)S-N-K,q检验:把各组均值排序,用每一比较的两个均值在排序序列种相差的等级数来确定不同的q 临界值。
(3)HSD检验:与SNK法类似,不同之处在于不论各组均值的大小次序,均使用同一临界值。
(4)Bonferroni校正(以t 分布作为检验分布,对检验水准进行调整),不适用于比较的次数很多的情况。
方差分析结果的解释与报告:单因素方差分析结果(范例):方差分析的结果(见表2)显示,教学方法对阅读理解的成绩有显著影响,2=0.37。