现代心理与教育统计学复习资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
现代心理与教育统计学
复习资料
Revised as of 23 November 2020
1、数据类型
称名数据
计数数据离散型数据
顺序数据
等距数据
测量数据连续型数据
等比数据
2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。
用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。
随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。
3、需要研究的同质对象的全体,称为总体。
每一个具体研究对象,称为一个个体。
从总体中抽出的用以推测总体的部分对象的集合称为样本。
样本中包含的个体数,称为样本的容量n。
一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。
4、统计量和参数
5、统计误差
误差是测得值与真值之间的差值。
统计误差归纳起来可分为两类:测量误差与抽样误差。
由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差
第二章
一、数据的整理
在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表
(一)简单次(频)数分布表 (二)相对次数分布表
将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表
双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图
使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。
简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图
%100 N
f
次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。
绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。
(三)累加次数分布图—累加直方图
(四)累加次数分布图——累加曲线
四、其他统计图表
条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。
圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。
线形图用来表示连续型资料。它能表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。基于线形图,既可对有关统计变量进行数量比较,又可分析发展的趋势。
散点图是用相同大小圆点的多少或梳密表示统计资料量大小以及变化趋势的图。
第三章
集中量数用来表现数据资料的典型水平或集中趋势。
常用的集中量包括算术平均数、加权平均数、中位数和众数等等。
一、算术平均数
算术平均数一般简称为平均数或均数、均值。
一般用M,或者用表示。
X
算术平均数是最常用的集中量
(一)算术平均数的计算公式
(二)算术平均数的意义
算术平均数是应用最普遍的一种集中量。它是“真值”(true score )的最佳估计值。 真值是反映某种现象的真实水平的分数。由于测量过程中的各种偶然因素的影响,真值往往很难得到。
在实际测量中,往往采用“多次测量,取平均数”的方法,用平均数去估计真值。 (三)算术平均数的优缺点
优点:反应灵敏、有公式严密确定、简明易懂、适合代数运算
缺点:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。 (四)计算和应用算术平均数的原则
同质性原则:算术平均数只能用于表示同类数据的集中趋势。
平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个体的数据。 平均数与标准差、方差相结合原则:描述一组数据时既要分析其集中趋势,也要分析离散程度。 二、中位数
中位数 又称为中数,是按顺序排列的一组数据中位于中间位置的数。中位数是常用集中量的一种。一般用Md 或Mdn 表示 (一)中位数的计算方法 1、原始数据计算法
一组数据中无重复数值的情况 首先将一组数据按顺序排列 2、次数分布表计算法
公式中:Lb 为中位数所在组的精确下限
fb 为中位数所在组下限以下的累积频数 n 为数据总和
2
,1
2
2
++=n
n X X Md n 则为偶数若Md b b f i
f n L Md ⎪⎭⎫ ⎝⎛-+=2
fMd 为中位数所在组的频数 i 为组距 三.众数
众数 用Mo 表示,有两种定义:
次数分布表中,频数最多那一组数据的组中值,即为众数。 四、算术平均数、中位数、众数三者的关系
在正态分布中: 在正偏态分布中: 在负偏态分布中: 五、其它集中量数 (一)加权平均数
加权平均数是不同比重数据(或平均数)的平均数,一般用 表示。其计算公式有两种:
(二)几何平均数
几何平均数(geometric mean )是n 个数值连乘积的n 次方根,用 或 表示。计
算公式为:
当数据的分布呈偏态时,可用几何平均数表示该组数据的集中趋势。
几何平均数的变式 两边取对数,得
注意:几何平均数计算的是平均的变化情况,如果要计算平均增长率,需要从几何平均数中减去基数1。
2.应用几何平均数的变式计算
按一定 比例变化 的一列数据,一般用来求 平均变化率 如 平均增长率. (三)调和平均数
O
M Md X
==O
M Md X >>O
M Md X < i i w W X W X ∑⋅∑=i i w n X n X ∑⋅∑= g M g X n n g X X X M ⋅⋅⋅⋅=2111 1 123 12---=⋅⋅⋅⋅=n n n n n g X X X X X X X X M () 1 lg lg 1 1 lg X X n M n g --=