现代心理与教育统计学的复习资料
现代心理教育与统计学_第三版复习资料(张厚粲)
第一章绪论1.描述统计(descriptive statistics)主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。
2.描述统计只限于对试验样本所得观测数据的统计分析,不考察其总体的特性。
3.推论统计(inferential statistics)是以描述统计为基础,从而解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特性。
4.变量(variables):一个可以取不同数值的物体属性/事件。
5.事前无法预期结果的变量——随机变量6.观测值(原始取值):事后测定的某一结果。
7.概念理解:[涉及“实验”] 自变量(及其各水平)& 因变量(及相应的反应指标);[涉及“调查”,粗略对应于] 属性变量& 反应变量8.计数资料(count data):计算个数的数据,(如人口数,学校数,男女数等)9.计量资料(measurement data):借助于一定的测量工具或一定的测量标准而获得的数据(如分数,身高,体重,IQ)10.称名数据(nominal data):只区分属性或类别上的不同,只可计数,不能排序(性别,学科,职业)11.等级/顺序数据(ordinal data):可排序,但无相等单位,不能加减。
(等级评定,受教育程度,职称)12.等距数据(interval data):具有相等单位,无绝对零的数据,能加减不能乘除。
13.比率数据(ratio data):既表明量的大小,又具有相等单位,可以加减乘除,具有绝对零点。
14.称名数据和顺序数据合称为离散数据。
15.等距数据和比率数据合称为连续数据。
16.离散数据(discrete data)又称为不连续数据,这类数据在任何两个数据点之间所取的数据的个数是有限的。
17.连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。
现代心理与教育统计学复习资料覃瑞
现代心理与教育统计学复习资料赵晨鹰老师覃瑞整理(21267529)徐建平和张厚粲主编第三版第一章绪论课程简介:先行课程为数学、普通心理学,后续课程为实验心理学、心理测量学、心理学研究方法、(研究型)毕业论文等。
心理统计可分为三种类别(最常见的分类方法P8):第一部分是“描述统计”,包括数据整理、集中&离中&相关量数的计算等。
第二部分是“推论统计”,包括统计估计、假设检验等(以概率分布为基础)。
第三部分是“实验设计”,包括样本抽取、被试分组等。
描述统计 : 1统计图表 2集中量数3差异量数 4相关关系概率分布(推论统计的基础)推论统计 :1参数估计 2假设检验 3方差分析(涉及部分“实验设计”) 4 χ2检验 5非参数检验线性回归(进而建立“数学模型”)多变量统计分析简介实验设计 :抽样原理及方法心理统计学(Psychological Statistics)是研究在心理实验或调查中如何收集、整理、分析数字资料,以及如何根据这些资料所传递的信息作出科学推论的应用统计学分支。
随机性数据资料~随机现象P3 (vs. 确定现象)①试验之前已知存在多种可能结果,但不能预料哪种结果会出现;②在相同条件下可以重复该试验。
理论统计学 vs. 应用统计学心理科学研究数据的特点 P2 1、分散性:数据结果均以一个个分散的数字形式呈现。
2、变异性/随机性:观测数据总在一定范围内随机波动变化。
3、规律性:通过重复观测可发现其变化具有一定的特征与规律。
心理科学研究的目标就是在分析部分数据的基础上来推测其相应总体的特征。
一、描述统计(descriptive statistics) P8描述统计主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。
据分组、图表制作。
②统计量/特征值P21的计算。
现代心理与教育统计学笔记全解
概念(1)随机变量:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量.(2)总体:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体.(3)样本:样本是从总体中抽取的一部分个体。
(4)个体:构成总体的每个基本单元。
(5)次数:是指某一事件在某一类别中出现的数目,又称作频数,用f表示. (6)频率:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。
(7)概率:概率论术语,指随机事件发生的可能性大小度量指标.其描述性定义。
随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A).(8)统计量:样本的特征值叫做统计量,又称作特征值。
(9)参数:又称总体参数,是描述一个总体情况的统计指标。
(10)观测值:随机变量的取值,一个随机变量可以有多个观测值。
2何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。
具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义。
①统计学为科学研究提供了一种科学方法。
科学是一种知识体系。
它的研究对象存在于现实世界各个领域的客观事实之中。
它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系.要提高对客观事实观测及分析研究的能力,就必须运用科学的方法.统计学正是提供了这样一种科学方法.统计方法是从事科学研究的一种必不可少的工具。
②心理与教育统计学是心理与教育科研定量分析的重要工具。
凡是客观存在事物,都有数量的表现。
现代心理教育与统计学 第三版复习资料(张厚粲)
第一章绪论1.描述统计(descriptive statistics)主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。
2.描述统计只限于对试验样本所得观测数据的统计分析,不考察其总体的特性。
3.推论统计(inferential statistics)是以描述统计为基础,从而解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特性。
4.变量(variables):一个可以取不同数值的物体属性/事件。
5.事前无法预期结果的变量——随机变量6.观测值(原始取值):事后测定的某一结果。
7.概念理解:[涉及“实验”] 自变量(及其各水平)& 因变量(及相应的反应指标);[涉及“调查”,粗略对应于] 属性变量& 反应变量8.计数资料(count data):计算个数的数据,(如人口数,学校数,男女数等)9.计量资料(measurement data):借助于一定的测量工具或一定的测量标准而获得的数据(如分数,身高,体重,IQ)10.称名数据(nominal data):只区分属性或类别上的不同,只可计数,不能排序(性别,学科,职业)11.等级/顺序数据(ordinal data):可排序,但无相等单位,不能加减。
(等级评定,受教育程度,职称)12.等距数据(interval data):具有相等单位,无绝对零的数据,能加减不能乘除。
13.比率数据(ratio data):既表明量的大小,又具有相等单位,可以加减乘除,具有绝对零点。
14.称名数据和顺序数据合称为离散数据。
15.等距数据和比率数据合称为连续数据。
16.离散数据(discrete data)又称为不连续数据,这类数据在任何两个数据点之间所取的数据的个数是有限的。
17.连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。
(完整版)现代心理与教育统计学
心理统计学第一章概述描述统计定义:研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理概括和表述作用:使杂乱无章的数字更好的显示出事物的某些特征,有助于说明问题的实质。
具体内容:1数据分组:采用图与表的形式。
2计算数据的特征值:集中量数(平均数中数)离散量数(方差)3计算量事物间的相关关系:积差相关(2列3列多列)推断统计定义:主要研究如何利用局部数据(样本数据)所提供的信息,依据数理统计提供的理论和方法,推论总体情形。
作用:用样本推论总体。
具体内容:1如何对假设进行检验。
2如何对总体参数特征值进行估计。
3各种非参数的统计方法。
心理与教育统计基础概念数据类型一从数据来源来划分1计数数据:计算个数或次数而获得的数据。
(都是离散数据)2测量数据:借助一定测量工具或测量标准而获得的数据。
(连续数据)二根据数据所反映的测量水平1称名数据(分类)定义:指用数字代表事物或数字对事物进行分类的数据。
特点:数字只是事物的符号,而没有任何数量意义。
统计方法:百分数次数众数列联相关卡方检验等。
(非参检验)2顺序数据(分类排序)定义:指代事物类别,能够表明不同食物的大小等级或事物具有的某种特征的程度的数据。
(年级)特点:没有相等单位没有绝对零点。
不表示事物特征的真正数量。
统计方法:中位数百分位数等级相关肯德尔和谐系数以及常规的非参数检验方法。
3等距数据(分类排序加减(相等单位))(真正应用最广泛的数据)定义:不仅能够指代物体的类别等级,而且具有相等的单位的数据。
(成绩温度)特点:真正的数量,能进行加减运算,没有绝对零点,不能进行乘除计算。
统计方法:平均数标准差积差相关Z检验t检验F检验等。
4比率数据(分类排序加减法乘除法(绝对零点))定义:表明量的大小,也具有相等单位,同时具有绝对零点。
(身高反应时)特点:真正的数字,有绝对零点,可以进行加减乘除运算。
在统计中处理的数据大多是顺序数据和等距数据。
三按照数据是否具有连续性离散数据连续数据变量观测值随机变量变量:指心理与教育实验观察调查种想要获得的数据。
张厚粲现代心理与教育统计学第3版笔记和课后习题含考研真题
张厚粲《现代心理与教育统计学》(第3版)笔记和课后习题(含考研真题)第一部分复习笔记本章重点ü心理与教育统计的研究内容ü选择使用统计方法的基本步骤ü统计数据的基本类型ü心理与教育统计的基本概念一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(applied statistics)两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现2.心理与教育科学研究数据具有随机性和变异性3.心理与教育科学研究数据具有规律性4.心理与教育科学研究的目标是通过部分数据来推测总体特征(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
现代心理与教育统计学
概念(1)随机变量:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。
(2)总体:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。
(3)样本:样本是从总体中抽取的一部分个体。
(4)个体:构成总体的每个基本单元。
(5)次数:是指某一事件在某一类别中出现的数目,又称作频数,用f表示。
(6)频率:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。
(7)概率:概率论术语,指随机事件发生的可能性大小度量指标。
其描述性定义。
随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。
(8)统计量:样本的特征值叫做统计量,又称作特征值。
(9)参数:又称总体参数,是描述一个总体情况的统计指标。
(10)观测值:随机变量的取值,一个随机变量可以有多个观测值。
2何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。
具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义。
①统计学为科学研究提供了一种科学方法。
科学是一种知识体系。
它的研究对象存在于现实世界各个领域的客观事实之中。
它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。
要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。
统计学正是提供了这样一种科学方法。
统计方法是从事科学研究的一种必不可少的工具。
②心理与教育统计学是心理与教育科研定量分析的重要工具。
凡是客观存在事物,都有数量的表现。
张厚粲《现代心理与教育统计学》(第3版)笔记和课后习题(含考研真题)详解
张厚粲《现代心理与教育统计学》(第3版)笔记和课后习题详解第1章绪论一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(applied statistics)两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现2.心理与教育科学研究数据具有随机性和变异性3.心理与教育科学研究数据具有规律性4.心理与教育科学研究的目标是通过部分数据来推测总体特征(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
二、心理与教育统计学的内容心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别。
(一)依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。
现代心理与教育统计学的复习重点
一二章、绪论现代统计学之父:皮尔逊描述统计与推断统计描述统计主要研究如何整理、描述数据的特征。
推断统计主要研究如何通过局部数据所提供的信息推论总体特征。
变量类型定类变量:如,性别、学号、颜色类别、教学方法。
特征:没有绝对零点,没有测量单位。
变量值之间有“相等”和“不等”的关系,但没有大小之分,不能比较大小,更不能进行加、减、乘、除四则运算。
定序变量:程度、等级和水平。
如,比赛名次、品质等级、喜爱程度特征:既无零点、又无测量单位。
变量的值之间具有“等于”或“不等于”关系、序关系(优于、先于、劣于、后于等),四则运算没有意义。
定比变量:除了可以说出名称和排出大小,还能算出差异大小量的变量。
如温度、测验成绩、智商。
特征:有相等的测量单位,无绝对零点。
考试成绩为零不表示没有一点知识。
可进行加减运算,乘除运算则无意义。
定距变量:如身高、重量、学生人数。
既有测量单位,又有绝对零点,可进行计算。
降低偏差:利用随机抽样降低变异性:用大一点的样本三、描述统计一、频数:某一事件在某一类别中出现的次数。
频数分布类型:正态,正(负)偏态,正(反)J 形,U 形分布。
分布性质;集中(分散)程度,偏度和峰度不同。
偏态系数:数据的对称性峰态系数:数据的峰度二、集中量数:包括算术平均数M 、中位数d M 、众数0M (用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便)、加权平均数W M 、几何平均数g M 、调和平均数H M 。
组数据中有少数数据偏大或偏小,数据的分布呈偏态时,应用几何平均数。
算数平均数的性质(算法必须会):(1)每一个变量加减或乘除一个数之后,均值也相应增加。
(2)变量值与均值的离均差之和为零。
(3)变量值与均值的离均差平方和为最小值。
三、离散量数:全距R 、四分位差Q 、平均差A.D 、方差(样本统计量,2S 总体参数2)、标准差(s 或者SD)、百分位差全距:全部数据中的最大值与最小值的差,描述了数据分布的范围。
现代心理与教育统计学03506
心理统计学第一章概述描述统计定义:研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理概括和表述作用:使杂乱无章的数字更好的显示出事物的某些特征,有助于说明问题的实质。
具体内容:1数据分组:采用图与表的形式。
2计算数据的特征值:集中量数(平均数中数)离散量数(方差)3计算量事物间的相关关系:积差相关(2列3列多列)推断统计定义:主要研究如何利用局部数据(样本数据)所提供的信息,依据数理统计提供的理论和方法,推论总体情形。
作用:用样本推论总体。
具体内容:1如何对假设进行检验。
2如何对总体参数特征值进行估计。
3各种非参数的统计方法。
心理与教育统计基础概念数据类型一从数据来源来划分1计数数据:计算个数或次数而获得的数据。
(都是离散数据)2测量数据:借助一定测量工具或测量标准而获得的数据。
(连续数据)二根据数据所反映的测量水平1称名数据(分类)定义:指用数字代表事物或数字对事物进行分类的数据。
特点:数字只是事物的符号,而没有任何数量意义。
统计方法:百分数次数众数列联相关卡方检验等。
(非参检验)2顺序数据(分类排序)定义:指代事物类别,能够表明不同食物的大小等级或事物具有的某种特征的程度的数据。
(年级)特点:没有相等单位没有绝对零点。
不表示事物特征的真正数量。
统计方法:中位数百分位数等级相关肯德尔和谐系数以及常规的非参数检验方法。
3等距数据(分类排序加减(相等单位))(真正应用最广泛的数据)定义:不仅能够指代物体的类别等级,而且具有相等的单位的数据。
(成绩温度)特点:真正的数量,能进行加减运算,没有绝对零点,不能进行乘除计算。
统计方法:平均数标准差积差相关Z检验t检验F检验等。
4比率数据(分类排序加减法乘除法(绝对零点))定义:表明量的大小,也具有相等单位,同时具有绝对零点。
(身高反应时)特点:真正的数字,有绝对零点,可以进行加减乘除运算。
在统计中处理的数据大多是顺序数据和等距数据。
三按照数据是否具有连续性离散数据连续数据变量观测值随机变量变量:指心理与教育实验观察调查种想要获得的数据。
现代心理与教育统计学课后题完整版10441资料讲解
现代心理与教育统计学课后题完整版10441第一章绪论1.名词解释随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量总体:又称为母全体、全域,指据有某种特征的一类事物的全体样本:从总体中抽取的一部分个体,称为总体的一个样本个体:构成总体的每个基本单元称为个体次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。
频率通畅用比例或百分数表示概率:又称机率。
或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率统计量:样本的特征值叫做统计量,又叫做特征值参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据2.何谓心理与教育统计学?学习它有何意义心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。
整理。
分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
3.选用统计方法有哪几个步骤?首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件4.什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量5.怎样理解总体、样本与个体?总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N 表示,其构成的基本单元为个体。
现代心理与教育统计学
• 应用统计学是与研究对象密切结合的专门统计
学
第4页/共32页
二、统计学的起源
• Statistics(统计学)起源于法语status(状态),自中世纪 以来逐渐演变成含政治意味的state(国家、状态)。
• 统计学的原意是指对国家状态的调查研究。 • 古代中国和埃及都有过对国家大事统计调查的历史。 • Aristotle所著的《国家论》中,对很多国家的政治、学问、宗
• Fisher对数理统计方法进行了深入地研究提出了 方差分析法及各种检验法。
第12页/共32页
八、推断统计的应用
• 推断统计在自然科学、管理、工农业生产、社会科学、医学、心理学、行为科学、商业、气象……等几乎 任何领域推断统计学都是适用的
• 大量生产过程中的质量管理 • 在社会调查中的应用
第13页/共32页
教、艺术和风俗等进行了详细的论述,该书被认为是后来发展 起来的所谓“国势学”的先驱之作。
第5页/共32页
三、统计学的古老称谓
• 1.国势学
• 创立国势学体系的是德国的H.Conring(16061681)
• G.Achenwall(1719-1772)把统计学定义为: “把国家的重大事项全部记Байду номын сангаас下来的学科”
• 根据研究问题的实质将其内容划分为:描述一 件事物的性质;比较两件事物的差异;分析影 响事物变化的因素;一件事物两种不同属性之 间的相互关系;取样方法等。
第19页/共32页
• 1.描述统计: 主要研究如何整理心理与教育科 学实验或调查得来的大量数据,描述一组数据的 全貌,表达一件事物的性质。
• 具体内容有:数据如何分组,如何使用统计表与 统计图的方法去描述一组数据的分组及分布情况, 如何通过一组数据计算一些特征数,简缩数据进 一步显示和描述一组数据的全貌。例如计算算术 平均数、中数、众数、几何平均数、调和平均数; 计算平均差、标准差、变易系数与标准分数;相
现代心理与教育统计学复习资料.docx
第一章1、数据类型厂称名数据?计数数据Y A离散型数据'顺序数据-厂等距数据-X测量数据彳,连续型数据J等比数据/2、变量:是可以取不同值的量。
统计观察的指标都是具有变异的指标。
当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。
用来表示随机现象的变量,称为随机变量。
一般用大写的X或Y表示随机变量。
随机变量所取得的值,称为观测值。
二个随机变量可以有许多个观测值。
3、需要研究的同质对象的全体,称为总体_每一个具体研究对象,称为一个个—从总体中抽出的用以推测总体的部分对象的集合称为样本。
—样本中包含的个体数,称为样本的容量n。
般把容量n ≥30的样本称为大样本;而n V 30的样本称为小样本。
4、统计量和参数统计指标统计量参数平均数Mμ标准差Sσ相关系数r P回归系数bβ5、统计误差误差是测得值与真值之间的差值。
测得值=真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。
由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。
由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误_________________第二章一、数据的整理在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。
对于个别极端数据是否该剔除,应遵循三个标准差法则。
二、次数分布表(一)简单次(频)数分布表(二)相对次数分布表将次数分布表中各组的实际次数转化为相对次数,即用频数比率( f / N )或百分比f100 % )来表示次数,就可以制成相对次数分布表N(三)累加次数分布表(四)双列次数分布表双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。
所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。
三、次数分布图使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。
2021级《现代教育与心理统计学》期末考试复习要点
2021级《现代教育与心理统计学》期末考试复习要点一、题型(一)多项选择题(每题2分,共30分)(II)填空题(每题1分,共10分)(III)名词释义(每题3分,共12分)(IV)简短回答题(每题6分,共24分)(五)计算题(第1题6分,第2题8分,第3题10分,共24分)第一章为绪论第二节:心理与教育统计的内容(描述统计、推论统计、实验设计的定义及地位)第四节:心理学和教育统计学的基本概念(随机变量、样本、参数和统计学的数据类型、概念和特征)第二章统计图表第二节频率分布表(计算分组距离和分组中值,编制分组频率分布表的步骤)第三节频率分布图(直方图、条形图、圆形图、散点图、适用数据)第三章集中量数第一节:算术平均值(计算、性质、平均值的优缺点以及计算和应用原则)第二节:中值和模式(计算、优缺点和两者的应用)第三节:其他集中量数(总平均数的计算)--平均数、众数、中数的关系第四章差异数量第二节:平均差、方差与标准差(计算公式、使用条件、方差和标准差的意义)第三节:标准差的应用(差异系数、标准分数的计算公式及具体应用)第四节差异量的选择(比较各种差异量的优缺点,如何选择差异量)第五章差异量数第一节:相关性和散点图(相关系数的定义、取值范围、类型和散点图)第二节:产品差异相关性(适用数据和计算公式)第三节:斯皮尔曼等级和肯德尔等级相关(适用资料、计算公式)第四节:点二列相关和二列相关(适用资料)第六章:概率分布第一节:概率的基本概念(概率的取值范围、加法和乘法定理、分布类型)第二节:正态分布(正态分布的特征、正态分布理论在测验中的应用)第四节:抽样分布(样本平均数的分布、t分布的特点、f分布的特点)第七章参数估计第一节:点估计、区间估计与标准误(良好估计量的标准、置信区间与显著性水平的概念、区间估计与标准误的计算)第二节:总平均值的估算(估算总平均值的步骤和计算)第八章假设检验第一节假设检验的原则(无效假设和替代假设,假设检验中的两种错误,一边)检验和双侧检验、假设检验的步骤)第二节均值的显著性检验第三节平均数差异的显著性检验第1四章抽样原则和方法第一节抽样的基本原则(随机化原则)第二节几种重要的随机抽样法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章心理与教育统计学基础知识1、数据类型称名数据计数数据离散型数据顺序数据等距数据测量数据连续型数据比率数据2、变量、随机变量、观测值变量是可以取不同值的量。
统计观察的指标都是具有变异的指标。
当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。
用来表示随机现象的变量,称为随机变量。
一般用大写的X或Y表示随机变量。
随机变量所取得的值,称为观测值。
一个随机变量可以有许多个观测值。
3、总体、个体和样本需要研究的同质对象的全体,称为总体。
每一个具体研究对象,称为一个个体。
从总体中抽出的用以推测总体的部分对象的集合称为样本。
样本中包含的个体数,称为样本的容量n。
一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。
4、统计量和参数5、统计误差误差是测得值与真值之间的差值。
测得值=真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。
由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。
由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差第二章统计图表一、数据的整理在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。
对于个别极端数据是否该剔除,应遵循三个标准差法则。
二、次数分布表(一)简单次(频)数分布表(二)相对次数分布表将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表(三)累加次数分布表 (四)双列次数分布表双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。
所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。
三、次数分布图使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。
简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图次数分布多边形图(frequency polygon )是一种表示连续性随机变量次数分布的线形图,属于次数分布图。
凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。
绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。
(三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线%100 Nf四、其他统计图表条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。
圆形图:是用于表示间断型资料比例的图形。
圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。
各部分的比例一般用百分比表示。
线形图用来表示连续型资料。
它能表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。
基于线形图,既可对有关统计变量进行数量比较,又可分析发展的趋势。
散点图是用相同大小圆点的多少或梳密表示统计资料量大小以及变化趋势的图。
第三章 集中量数集中量数用来表现数据资料的典型水平或集中趋势(central tendency )。
常用的集中量包括算术平均数、加权平均数、中位数和众数等等。
一、算术平均数算术平均数(arithmetic average )一般简称为平均数(average )或均数、均值(mean )。
一般用M,或者用 表示。
算术平均数是最常用的集中量 (一)算术平均数的计算公式Xin i n X n n X X X X ∑=∑=+++=1211ΛΛX nX ∑=1(二)算术平均数的意义算术平均数是应用最普遍的一种集中量。
它是“真值”(true score)的最佳估计值。
真值是反映某种现象的真实水平的分数。
由于测量过程中的各种偶然因素的影响,真值往往很难得到。
在实际测量中,往往采用“多次测量,取平均数”的方法,用平均数去估计真值。
(三)算术平均数的优缺点优点:反应灵敏、有公式严密确定、简明易懂、适合代数运算缺点:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。
(四)计算和应用算术平均数的原则同质性原则:算术平均数只能用于表示同类数据的集中趋势。
平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个体的数据。
平均数与标准差、方差相结合原则:描述一组数据时既要分析其集中趋势,也要分析离散程度。
二、中位数中位数(median)又称为中数,是按顺序排列的一组数据中位于中间位置的数。
中位数是常用集中量的一种。
一般用Md或Mdn表示(一)中位数的计算方法1、原始数据计算法一组数据中无重复数值的情况首先将一组数据按顺序排列; 2、次数分布表计算法公式中:Lb 为中位数所在组的精确下限fb 为中位数所在组下限以下的累积频数 n 为数据总和fMd 为中位数所在组的频数 i 为组距(二)中位数的特点及应用中位数是根据全部数据的个数来确定其位置的,意义简明,对按顺序排列的数据来讲,计算中位数也比较容易。
中位数不受两端极端数据的影响,但反应不灵敏,也不适合进一步代数运算的要求。
一般用于下列情况:1、一组数据中有极端数据时;2、一组数据中有个别数据不确切、不清楚时;3、资料属于等级性质时。
三.众数众数(mode )用Mo 表示,有两种定义:理论众数是指与频数分布曲线最高点相对应的横坐标上的一点;个数为第则为奇数若21,+n Md n 2,122++=nn X X Md n 则为偶数若Mdb b f i f n L Md ⎪⎭⎫ ⎝⎛-+=2粗略众数是一组数据中出现次数最多的那个数。
众数也是一种集中量,也可用来表示一组数据的集中趋势。
众数的计算方法(观察法寻找粗略众数 ) 未分组数据中出现次数最多的数即为众数。
次数分布表中,频数最多那一组数据的组中值,即为众数。
四、算术平均数、中位数、众数三者的关系在正态分布中: 在正偏态分布中:在负偏态分布中: 五、其它集中量数 (一)加权平均数加权平均数是不同比重数据(或平均数)的平均数,一般用 表示。
其计算公式有两种:(二)几何平均数几何平均数(geometric mean )是n 个数值连乘积的n 次方根,用 或 表示。
计算公式为:当数据的分布呈偏态时,可用几何平均数表示该组数据的集中趋势。
O M Md X ==O M Md X >>OM Md X <<wX iii w W X W X ∑⋅∑=ii w n X n X ∑⋅∑=g MgX n ng X X X M ⋅⋅⋅⋅=21几何平均数的变式两边取对数,得注意:几何平均数计算的是平均的变化情况,如果要计算平均增长率,需要从几何平均数中减去基数1。
几何平均数的应用:1.直接应用基本公式计算几何平均数有少数极端数据,数据呈偏态分布;心理物理学中的等距与等比量表实验中.(例[3-8]P72)2.应用几何平均数的变式计算按一定比例变化的一列数据,一般用来求平均变化率如平均增长率. 例[3-9][3-10][3-11]P73 (三)调和平均数调和平均数(harmonic mean),用符号MH 表示.也叫倒数平均数.公式为: 调和平均数的应用学习速度方面的问题.调和平均数在描述速度方面的集中趋势时,优于其他集中量 在有关研究学习速度的实验设计中,反应指标一般常取两种形式;1、工作量固定,记录各被试完成相同工作所用的时间.例[3-13][3-14]P762、学习时间一定,记录一定时间内各被试完成的工作量,例[3-15]11112312---=⋅⋅⋅⋅=n n n n n g X X X X X X X X M ()1lg lg 11lg X X n M n g --=∑=iH XNM 1第四章差异量数♦描述数据离散程度的统计量称为差异量。
差异量越大,表明数据越分散、不集中;差异量越小,表明数据越集中,变动范围越小。
♦一组数据的离散程度,常常通过数据的离中趋势特点进行分析。
一、全距、四分位距和百分位距(一)全距R (range)全距是一组数据中的最大值(maximum)与该组数据中最小值(minimum)之差,又称极差。
R=Xmax-Xmin(二)百分位差(百分位距)百分位差是指两个百分位数(percentile)之差。
常用的百分位距有两种:用几个百分位距能较好地反映一组数据的差异程度。
对于任何一组观察值,只要任意指定一个位置,就可以求出这个位置的数应该是多少;----百分位数相反,如果给出一个数,也可以求出它应该在哪个位置.---百分等级百分位数--频数分布中相对于某个特定百分点的原始分数,它表明在分布中低于该分数的个案占总频数的百分比。
百分等级分数--频数分布中低于特定原始分数的频数百分比。
(三)四分位距213QQ Q -=四分位距是第一个四分位数与第三个四分位数之差的一半,计算公式为 (四)平均差平均差(average deviation 或者 mean deviation )是指一组数据中,每一个数据与该组数据的平均数离差的绝对值的算术平均数,通常用AD 或MD 表示。
原始数据计算公式(五)方差和标准差方差(又称为变异数、均方)。
是表示一组数据离散程度的统计指标。
一般样本的方差用 表示,总体的方差用 表示。
标准差(standard deviation )是方差的算术平方根。
一般样本的标准差用 S 表示,总体的标准差用 表示。
标准差和方差是描述数据离散程度的最常用的差异量。
1、样本方差及标准差定义公式2、总体方差及标准差的定义公式nX X AD -∑=()nXX S 22-∑=()nXX S 2-∑=()NX 22μσ-∑=()NX 2μσ-∑=()12--∑=n X X S 2S 2σσ是总体σ的无偏估计3、原始数据的方差与标准差计算4、总标准差的合成方差具有可加性的特点。
当已知几个小组数据的方差或标准差时,可以计算几个小组联合在一起的总的方差或标准差。
需要注意的是,只有在应用同一种观测手段,测量的是同一种特质,只是样本不同的数据时,才能计算合成方差或标准差。
计算公式公式中: 为总方差, 为总标准差Si 为各小组标准差ni 为各小组数据个数5、方差和标准差的性质方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。
222⎪⎭⎫ ⎝⎛∑-∑=n X n X S 22⎪⎭⎫ ⎝⎛∑-∑=n X n X S ()i i T i i i T n X X n S n S ∑-∑+⋅∑=222()i i T i i i T n X X n S n S ∑-∑+⋅∑=222T S T S iT i X X d -=标准差是一组数据方差的算术平方根,它不可以进行代数计算,但有以下特性:如果 则如果 则6、方差和标准差的意义方差与标准差是表示一组数据离散程度的最好指标,是统计分析中最常用的差异量。