现代心理与教育统计学复习资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
现代心理与教育统计学复习资料
第一章心理与教育统计学基础知识1、数据类型
称名数据计数数据离散型数据顺序数据
等距数据测量数据连续型数据比率数据
2、变量、随机变量、观测值
变量就是可以挑相同值的量。统计数据观测的指标都就是具备变异的指标。当我们用一个量则表示这个指标的观测结果时,这个指标就是一个变量。
用来表示随机现象的变量,称为随机变量。一般用大写的x或y表示随机变量。随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。3、总体、个体和样本
须要研究的同质对象的全体,称作总体。每一个具体内容研究对象,称作一个个体。
从总体中抽出的用以推测总体的部分对象的集合称为样本。样本中包含的个体数,称为样本的容量n。
通常把容量n≥30的样本称作大样本;而n<30的样本称作大样本。4、统计数据量和参数统计数据指标平均数标准差相关系数回归系数统计数据量srb参数μσρβ
5、统计误差
误差就是测量得值与真值之间的差值。测出数值=真值+误差
统计误差归纳起来可分为两类:测量误差与抽样误差。
由于采用的仪器、测量方法、读数方法等问题导致的测出值与真值之间的误差,称作测量误差。
由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差
第二章统计图表
一、数据的整理
在展开整理时,如果没充裕的理由证明某数据就是由实验中的过错导致的,就无法轻而易举将其确定。对于个别极端数据与否该剔出,应当遵从三个标准差法则。二、次数原产表中
(一)简单次(频)数分布表(二)相对次数分布表
将次数原产表各组的实际次数转变为相对次数,即为用频数比率(f/n)或百分比f)去则表示次数,就可以做成相对次数原产表中(?100%n
(三)累加次数分布表(四)双列次数分布表
双列次数原产表中又称有关次数原产表中,就是对存有联系的两列变量用同一个表中
则表示其次数原产。
所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种
心理特点的指标,或同一组被试在两种实验条件下获得的结果。三、次数分布图
并使一组数据特征更加直观和归纳,而且还可以对数据的原产情况和变动趋势并作粗
略的分析。
简单次(频)数分布图――直方图、次数多边形图累加次数分布图――累加直方图、
累加曲线(一)简单次数分布图--直方图(二)简单次数分布图-次数多边图
次数原产多边形图(frequencypolygon)就是一种则表示连续性随机变量次数原产的
线形图,属次数分布图。凡是等距分组的可以用直方图则表示的数据,都需用次数多边图
去则表示。
绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点
以直线连接即构成多边图形。
(三)递增次数分布图―递增直方图(四)递增次数分布图――递增曲线四、其他统
计图表
条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的
间断型资料。
圆形图:就是用作则表示间断型资料比例的图形。圆形的面积则表示一组数据的整体,圆中扇形的面积则表示各组成部分所占到的比例。各部分的比例通常用百分比则表示。
线形图用来表示连续型资料。它能表示两个变量之间的函数关系;一种事物随另一种
事物变化的情况;某种事物随时间推移的发展趋势等。基于线形图,既可对有关统计变量
进行数量比较,又可分析发展的趋势。
图表就是用相同小小圆点的多少或梳密则表示统计资料量大小以及变化趋势的图。
第三章集中量数
集中量数用以整体表现数据资料的典型水平或分散趋势(centraltendency)。常用
的分散量包含算术平均数、加权平均数、中位数和众数等等。一、算术平均数
算术平均数(arithmeticaverage)一般简称为平均数(average)或均数、均值(mean)。一般用m,或者用x表示。算术平均数是最常用的集中量(一)算术平均数的计算公式
1x1?x2xn1nx??xx???xinnni?1
(二)算术平均数的意义
算术平均数就是应用领域最广泛的一种分散量。它就是“真值”(truescore)的最佳估计值。真值就是充分反映某种现象的真实水平的分数。由于测量过程中的各种偶然因素的影响,真值往往很难获得。
在实际测量中,往往采用“多次测量,取平均数”的方法,用平均数去估计真值。(三)算术平均数的优缺点
优点:反应灵敏、存有公式严格确认、通俗易懂易懂、适宜代数运算
缺点:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。(四)计算和应用算术平均数的原则
同质性原则:算术平均数就可以用作则表示同类数据的分散趋势。
平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个体的数据。
平均数与标准差、方差结合原则:叙述一组数据时既要分析其分散趋势,也必须分析线性程度。二、中位数
中位数(median)又称为中数,是按顺序排列的一组数据中位于中间位置的数。中位数是常用集中量的一种。一般用md或mdn表示(一)中位数的计算方法1、原始数据计算法
一组数据中并无重复数值的情况首先将一组数据按顺序排列
xn?xn
1n122若n为奇数,则md为第个数;若n为偶数,则md?222、次数原产表中计算法
nimdlbfb2fmd
公式中:lb为中位数所在组的准确上限
fb为中位数所在组下限以下的累积频数n为数据总和
fmd为中位数所在组的频数i为组距
(二)中位数的特点及应用
中位数就是根据全部数据的个数去确认其边线的,意义通俗易懂,对按顺序排列的数
据来说,排序中位数也比较难。中位数不受到两端极端数据的影响,但反应不灵敏,也不
适宜进一步代数运算的建议。通常用作以下情况:
1、一组数据中有极端数据时;
2、一组数据中存有个别数据不清楚、不确切时;
3、资料属等级性质时。三.众数
众数(mode)用mo表示,有两种定义:
理论众数就是所指与频数原产曲线最高点相对应当的横坐标上的一点;粗略众数就是
一组数据中发生次数最少的那个数。
众数也是一种集中量,也可用来表示一组数据的集中趋势。众数的计算方法(观察法
寻找粗略众数)未分组数据中出现次数最多的数即为众数。
次数原产表,频数最多那一组数据的组中值,即为为众数。四、算术平均数、中位数、众数三者的关系
在正态分布中:x?md?mo在正偏态分布中:x?md?mo在负偏态分布中:x?md?mo五、其它集中量数(一)加权平均数
加权平均数就是相同比重数据(或平均数)的平均数,通常用则表示。其计算公式存
有两xw种:?wi?xi?ni?xxw?xw??wi?ni
(二)几何平均数
几何平均数(geometricmean)就是n个数值连乘积的n次方根,用mg或xg则表示。计算公式为:mg?nx1?x2xn
当数据的分布呈偏态时,可用几何平均数表示该组数据的集中趋势。几何平均数的变
式xnxnx2x3n?1n?1mgx1x2xn?1x1两边取对数,得
1
lgxnlgx1lgmgn1注意:几何平均数计算的是平均的变化情况,如果要计算平均
增长率,需要从几何平均数中减去基数1。
几何平均数的应用领域:
1.直接应用基本公式计算几何平均数
存有少数极端数据,数据呈圆形偏态原产;心理物理学中的等距与等比量表实验中.
(基准[3-8]p72)