统计名词解释
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计
第一章
一、心理与教育统计的定义与性质
定义:在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按照统计学的原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得到结论的一种研究方法。性质:应用统计学。
二、心理与教育科学研究数据的特点
(1)数据与结果多用数字呈现
(2)数据具有一定的随机性和变异性
(3)数据具有一定的规律性
(4)通过部分数据来推测总体的特征
三、心理与教育统计学的内容
1、描述统计(descriptive stastics)主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。
包括:A、数据如何分组、使用统计图表描述一组数据的分布情况;
B、计算一组数据的特征值(集中量数和差异量数),进而描述一组数据的全貌;
C、表示一事物两种或两种以上属性间的相互关系(相关分析)。
2、推论统计(inferential statistics)主要研究如何通过局部数据所提供的信息,推论总体的情形。
包括:A、如何进行假设检验,如z检验、t检验、卡方检验、F检验、回归分析等;
B、总体参数特征值的估计方法;
C、各种非参数检验的统计方法。
3、实验设计(experimental design)主要目的在于研究如何科学地、经济地以及有效地进行实验,它是统计学近几十年发展起来的一部分内容。
四、心理与教育的基础概念
数据类型
1、从数据的观测方法和来源来划分
计数数据(count data)是指计算个数的数据,如人口数、学校数、男女数等等。一般取整数形式;
测量数据(measurement data)是指借用一定的测量工具或具有一定
的测量标准而获得的数据,如身高、考试成绩、金钱数额、智力测验等。
2、根据数据的测量水平划分:
称名数据(nominal data)
顺序数据(ordinal data)
等距数据(interval data)
比率数据(ratio data)
3、根据数据是否具有连续性划分:
离散数据(discrete data)
连续数据(continuous data)
五、变量、观测值、随机变量
变量(variables)是指实验、观察、调查中想要获得的数据;
而一旦确定某个值,就称这个值为某一变量的观测值(observation),即为具体的数据;
在统计学中,把取值之前不能预料取到什么值的变量,称之为随机变量。
与变量相反的是常量,它在一定范围内其数值不会随意改变。六、总体、样本与个体
总体(population)又称母全体、全域,指具体有某种特征的一类事物的全体;
构成总体的每个基本单元称为个体(individual);
从总体中抽取一部分个体,称之为总体的一个样本(sample)。
七、次数、比率、频率与概率
在一项研究中,我们对随机现象进行观察试验,在一定条件下,本质不同的事物可能出现,也可能不出现,这种事情称为随机事件;次数是指某一事件在某一类别中出现的数目,又称为频数(frequency),用f表示;
两个数的比例称为比率;
频率又称相对次数,即某一事件发生的次数被总的事件数目除,通常用比例或百分数表示;
概率又称机率、或然率(probability)用p表示,表示一事件在无限的观测中所能预料的相对出现的次数,也就是某一事件在总体中出现的比率,通常用比例表示。
八、参数与统计量
在科学研究中,我们探寻的是关于所有事物的说明和解释。能说明和解释总体特征的那些特性称之为参数(parameter),又称为总体参数;与之相对的是,样本的那些特征值称为统计量(statistics)。
参数是从总体中计算得到;一般是个常量;一般用希腊字母表示;统计量是从样本中得到;一般随样本的变化而变化,是个变量;一般用英文字母(斜体)表示。
第二章
一、统计图表
统计表和统计图是对数据进行初步整理,以简化的形式加以表现的
两种最简单的方式。
统计表具有简明、清晰、准确的特点,数据易于比较分析;统计图具有简明、直观、可视化等特点。
在制定统计图表时首先要完成最基本的两步:
a、数据排序(sort or order)是指按照某种标准,对收集到的杂乱无章的数据按照一定的顺序标准进行排序。
升序(ascending)
降序(descending)
b、统计分组是指根据被研究对象的特征,将所得的数据划分到各个组别中去。
步骤:
1)统计分组前的准备(进一步地核对和校检数据、删除受过失影响数据、删除3个标准差之外的数据)
2)统计分组应注意事项(分组要以被研究对象的本质特性为基础;分类标志要明确,既要包含数据的所有范围,同时分类不能重合)3)分组的标志(性质类别和数量类别)
二、次数分布表
次数分布(frequency distribution)显示初步整理后一组数据的分布情况。它主要表示数据在各个分组区间内的散布情况。
简单次数分布表(适用于计数数据)(simple frequency table)就是依据每一个分值在一列数据中出现的次数或总计数资料编制成的统计表。
分组次数分布表(重点)(适用于测量数据)当数据量很大时,应该把所有的数据划分若干区间,然后再按数据按其值大小划分到相应的区组内,分别统计各个组别中的个数,再用列表形式呈现出来,就构成了分组次数分布表(grouped frequency table)。具体步骤如下:
A、求全距
全距(range)是指最大值和最小值两个数据之间的差距。
B、决定组距和组数
组距(interval)是指任意一组的起点和终点之间的举例,用符号i 表示。
全距除以组距即为组数。
C、列出分组区间
分组区间即一个组的起点值和终点值之间的距离,又叫组限。起点值称为组下限,终点值称为组上限,组限又可以分为表述组限和精确组限。
D、登记次数
E、计算次数
相对次数分布表
累加次数分布表