心理教育统计学上半学期重点
心理统计知识点完整版整理
心理统计知识点完整版整理1、描述统计:主要研究如何让整理心理与教育科学实验或调查得来的大量数据。
描述一组数据的全貌,表达一件事物的性质。
2、推论统计:主要研究如何通过局部数据提供的信息,推论总体的情形。
3、根据数据反映的测量水平,将数据分类:称名数据、顺序数据、等距数据、比率数据(书P16概念、举例)是否具有连续性离散数据、连续性数据。
4、连续数据:任意两个数据点之间都可以细分出无限个大小不同的数值。
5、统计量:样本的那些特征值,代表样本的特性。
6、参数:描述一个总体情况的统计指标,代表总体特性是一个常数。
7、组限:分组区间即一个组的起点值和终点值之间的距离;组下限:起点值;组下限:终点值。
组限分类:表述组限,精确组限8、散点图:用相同大小圆点的多少或疏密表示统计资料数量大小以及变化趋势的图。
9、算数平均数的使用原则:同质性原则,平均数与个体数值相结合的原则,平均数与标准差、方差相结合的原则。
10、中数:按顺序排列在一起的一组数据中居于中间位置的数。
11、众数:指在次数分布中出现次数最多的那个数的数值。
12、皮尔逊平均数、中数和众数三者间的关系:Mo=3Md-2M0(M平均数Md中数Mo众数)13、平均差:次数分布中所有原始数据平均数绝对离差的平均值。
14、方差、标准差公式:15、标准差:方差的平方根…..16、差异系数的使用情况:1、标准差的单位不同;2、虽然标注差的单位相同,但两样本的水平不同。
17、标准分数:又称基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。
优点:标准分数从分数对平均数的相对低位。
该分组的离中趋势两个方面来表示原始分数的地位。
18、事物之间的相互关系:因果关系,共变关系,相关关系19、积差相关的公式:20、肯德尔W系数:适用于两列以上的等级变量;使用情况:A、原始数据资料的获得一半采用等级评定法,让K个被试对N件事物或N种作品进行等级评定,每个评价者都能对N件事物(或作品)的好坏、优劣、喜好、大小、高低登排出一个等级顺序。
心理统计学知识点完整版资料整理
心理统计学知识点完整版资料整理1.数据的概念:在心理统计学中,数据是指信息的收集和组织形式。
数据可以是数字,也可以是文字或符号。
数据的收集可以通过实验、调查、观察等方式进行。
2.数据的分布:在心理统计学中,数据的分布是指通过统计方法和图表来展示数据的特征和规律。
常用的数据分布包括正态分布、偏态分布、均匀分布等。
3.描述性统计:描述性统计是用来描述和总结数据的方法。
常见的描述性统计包括均值、中位数、众数、标准差、变异系数等。
4.推论统计:推论统计是根据样本数据来对总体进行推断的方法。
推论统计主要包括参数估计和假设检验两个方面。
5.参数估计:参数估计是用样本数据来估计总体参数的值。
常见的参数估计方法包括点估计和区间估计。
6.假设检验:假设检验是用来判断总体参数是否满足一些假设的方法。
其中包括设置原假设和备择假设、选择显著性水平、计算统计量、确定拒绝域等步骤。
7.相关分析:相关分析用来研究两个或多个变量之间的关系。
其中最常用的是皮尔逊相关系数,可以用来衡量变量之间的线性相关程度。
8.回归分析:回归分析用来研究一个或多个自变量和因变量之间的关系。
通过回归分析可以得到回归方程,进而预测因变量的值。
9.方差分析:方差分析是一种用来研究多个样本之间差异的方法。
方差分析可以判断不同组之间的均值是否存在显著差异。
10.非参数统计:非参数统计是一种不依赖于总体参数的方法。
非参数统计主要包括秩次统计和分布自由度较小的统计方法。
11.实验设计:实验设计在心理统计学中扮演着重要的角色。
良好的实验设计可以保证实验的可靠性和有效性,并排除干扰因素。
12.抽样方法:抽样方法是指如何从总体中选取样本的方法。
常见的抽样方法包括随机抽样、系统抽样、整群抽样等。
以上是心理统计学的一些主要知识点的简要整理。
了解这些知识点可以帮助我们更好地理解和应用统计方法来分析心理学中的数据。
当然,心理统计学的内容还非常广泛,还有更多的知识点值得深入学习和研究。
广东省05951心理与教育统计重点归纳(自己整理)
第1章:P24,散点图的适用情况,容易考单选题。
第2章:第1节,集中量数有哪些;计算平均数,中数,众数;算术平均数的性质。第2节,差异量数有哪些;计算平均差,方差,标准差;标准差的性质(特别注意要掌握方差及标准差的公式,后面章节使用这两个知识点内容的频率非常高。);差异系数的计算。第3节,P56,相关系数的解释;P58,积差相关系数要求变量符合的条件有3点。
第3章:第1节,P75-77,概来自的两个基本定理,一般考单选题;P77开始,二项式定理的举例。第2节,二项分布。第3节,P86-88,正态分布的基本性质;P94-99,正态分布的应用(标准分数/Z分数)。
第4章:第2节,几种抽样方法及其概念。第3节的抽样分布知识与后面的章节联系紧密,但是在这一节重点掌握:P108-110,卡方分布及T分布的性质特点。第4点,简单了解P115关于样本容量的计算。第5节,P117,判断估计量优劣的标准;P122-124,区间估计的计算,掌握例4-11、4-12;P124,置信区间大小受两个因素影响(曾考简答)。
研究了几套历年试题,也看了考试大纲,只要求掌握至第8章,后面的9和10没考,但有些同学说9-10章也考。这两章我没有看。
第7章:第1节,P198,回归分析的主要内容考过简答。第2节,掌握P208的表7-2,掌握例题7-2。掌握例题7-3,计算决定系数,解释系数的意义。第3节,直接过掉,不看。
第8章:叫卡方检验。第1节,不重要。第2节,列联表的知识要掌握,P241页的表8-10要看懂,计算2*2的卡方值要看懂,看一下例题8-3。P247的表8-15要看,例8-6要理解。
第6章:第1节,P167,这一页的内容要理解。P168,方差分析的基本条件考过简答。第2节是本章重点,要记得P171表6-1,掌握例6-1。第3节也是本章重点,P176的原则要掌握,也考过简答。P179的表6-2要掌握,要掌握例6-3。第4节,直接过,不看。第5节,考得很少,如果要看就看P189的表6-3。
教育统计学重点
1.心理与教育统计学的内容,①描述统计:差异量数,统计图表,集中量数,相关分析。
②推论统计:统计估计(参数估计(点估计,区间估计),非参数估计),假设检验(参数检验,非参数检验)③实验设计:样本选择与分配,实验误差分析,方差分析,协方差分析分析,回归分析,因子分析。
描述统计主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。
推论统计主要研究如何通过局部数据所提供的信息,推论总体的情形。
实验设计主要目的在于研究如何科学地,经济地以及有效地进行实验。
2.心理与教育统计基础概念,(1)数据类型:①从数据观测方法和来源划分,研究数据可区分为计数数据(计算个数的数据,具有独立的分类单位)和测量数据(借助一定的测量工具或者一定的测量标准获得的数据)两大类②根据数据反应的测量水平,可以把数据分为称名数据(只说明一事物与其他事物在属性上的不同或者类别上的差异),顺序数据(即无相等单位,也无绝对零的数据,是按事物某种属性的多少和大小,按次序将各个事物排列后获得的数据资料),等距数据(有相等单位,无绝对零的数据,如温度),比例数据(既表明量的大小,也有相等的单位,同时还有绝对零点,如身高)四类。
③按照数据是否具有连续性,把数据划分为离散型数据(又称不连续数据,在任何两个据点之间所取的数值个数都是有限的)连续性数据(任意两个数据点之间都可以细分出无限个大小不同的数值)。
(2)变量(心理与教育实验,观察,调查中想要获得的数据)观测值(一旦确定了某个值,就称这个值为某一变量的观测值)随机变量(取值之前不能预料取到什么值的变量)(3)总体(指具有某种特征的一类事物的全体)样本(从总体中抽取一部分个体)个体(构成总体的每个基本单元)(4)次数(某一事件在某一类别中出现的数目)比率(两个数的比)频率(某一事件发生的次数被总的事件数目除)概率(某一事件在无限的观测中所能预料的相对出现的次数)(5)参数(描述总体情况的统计指标)与统计量(样本的特征值)参数用希腊字母表示,统计量用英文字母表示1.数据的初步整理,(1)数据排序,按照某种标准,对收集到的杂乱无章的数据按照一定的标准进行排列(2)统计分组,根据被研究对象的特征,将所得的数据划分到各个组别中,统计分组应该注意的问题:分组要以被研究对象的本质特征为基础;分类标志要明确,要能包括所有的数据。
心理统计学重难点考点归纳整理
心理统计学重难点考点归纳整理一、描述统计(一)统计图表 1)统计图 次数分布图:①直方图:用以矩阵的面积表示连续性随即变量次数分布的图形。
②次数多边形图:一种表示连续性随机变量次数分布的线形图,属于次数分布图。
③累加次数分布图:分为:累加直方图和累加曲线图;其中累加曲线的形状大约有三种:一种是曲线的上枝长于下枝(正偏态),另一种是下枝长于上枝(负偏态),第三种是上枝,下枝长度相当(正态分布)。
其他统计图:条形图:用于离散型数据资料;圆形图:用于间断性资料;线形图:更多用于连续性资料,凡预表示两个变量之间的函数关系,或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的情况,用这种方法比较好。
散点图: 2)统计表①简单次数分布表 ②分组次数分布表③相对次数分布表:将次数分布表中各组的实际次数转化为相对次数,即用频数比率表示。
④累加次数分布表⑤双列次数分布表:对有联系的两列变量用同一个表来表示其次数分布。
(二)集中量数 1)算术平均数M1nii XX N==∑优点:反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少受抽样变动的影响;缺点:受极端数据的影响;若出现模糊不清的数据时,无法计算平均数; 计算和运用平均数的原则:同质性原则;平均数与个体数值相结合的原则;平均数与标准差。
方差相结合原则; 性质:①在一组数据中每个变量与平均数之差的总和等于零②在一组数据中,每一个数都加上一个常数C ,所得的平均数为原来的平均数加常数C ③在一组数据中,每一个数都乘以一个常数C ,所得的平均数为原来的平均数乘以常数C2)中数:Md 按顺序排列在一起的一组数据中居于中间位置的数,即这组数据中,一般数据比它大,一般数据比它小。
注意计算方法;3)众数:Mo 是指在次数分布中出现次数最多的那个数值; 三者的关系:正偏态分布中,M>Md>Mo负偏态分布中,M<Md<Mo Mo=3Md-2M (自己推导一下) (三)差异量数差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。
教育统计学重点
1.心理与教育统计学的内容,①描述统计:差异量数,统计图表,集中量数,相关分析。
②推论统计:统计估计(参数估计(点估计,区间估计),非参数估计),假设检验(参数检验,非参数检验)③实验设计:样本选择与分配,实验误差分析,方差分析,协方差分析分析,回归分析,因子分析。
描述统计主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。
推论统计主要研究如何通过局部数据所提供的信息,推论总体的情形。
实验设计主要目的在于研究如何科学地,经济地以及有效地进行实验。
2.心理与教育统计基础概念,(1)数据类型:①从数据观测方法和来源划分,研究数据可区分为计数数据(计算个数的数据,具有独立的分类单位)和测量数据(借助一定的测量工具或者一定的测量标准获得的数据)两大类②根据数据反应的测量水平,可以把数据分为称名数据(只说明一事物与其他事物在属性上的不同或者类别上的差异),顺序数据(即无相等单位,也无绝对零的数据,是按事物某种属性的多少和大小,按次序将各个事物排列后获得的数据资料),等距数据(有相等单位,无绝对零的数据,如温度),比例数据(既表明量的大小,也有相等的单位,同时还有绝对零点,如身高)四类。
③按照数据是否具有连续性,把数据划分为离散型数据(又称不连续数据,在任何两个据点之间所取的数值个数都是有限的)连续性数据(任意两个数据点之间都可以细分出无限个大小不同的数值)。
(2)变量(心理与教育实验,观察,调查中想要获得的数据)观测值(一旦确定了某个值,就称这个值为某一变量的观测值)随机变量(取值之前不能预料取到什么值的变量)(3)总体(指具有某种特征的一类事物的全体)样本(从总体中抽取一部分个体)个体(构成总体的每个基本单元)(4)次数(某一事件在某一类别中出现的数目)比率(两个数的比)频率(某一事件发生的次数被总的事件数目除)概率(某一事件在无限的观测中所能预料的相对出现的次数)(5)参数(描述总体情况的统计指标)与统计量(样本的特征值)参数用希腊字母表示,统计量用英文字母表示1.数据的初步整理,(1)数据排序,按照某种标准,对收集到的杂乱无章的数据按照一定的标准进行排列(2)统计分组,根据被研究对象的特征,将所得的数据划分到各个组别中,统计分组应该注意的问题:分组要以被研究对象的本质特征为基础;分类标志要明确,要能包括所有的数据。
大一心理统计学知识点
大一心理统计学知识点心理统计学是心理学的一个重要分支,它研究了与心理学相关的统计方法和技术。
在大一的学习中,我们需要了解一些基本的心理统计学知识点,以帮助我们更好地理解心理学研究中所用到的数据和分析方法。
本文将介绍一些大一心理统计学的重要知识点。
一、数据类型在心理统计学中,数据可以分为两种类型:定性数据和定量数据。
定性数据是指在不进行数值化处理的情况下,仅仅根据属性进行分类的数据。
例如,性别、民族和学历等信息都属于定性数据。
定量数据则是用具体的数值表示的数据,可以进行数值计算和比较。
例如,身高、体重和考试成绩等数据都属于定量数据。
二、测量尺度根据数据的性质和可操作性,心理统计学中通常使用四种测量尺度:名义尺度、顺序尺度、间隔尺度和比率尺度。
名义尺度仅仅对数据进行分类,没有数值上的意义。
顺序尺度除了可以分类,还可以表示数据的大小顺序。
间隔尺度不仅可以分类和顺序排列,还可以比较数据之间的差距。
比率尺度是最完备的测量尺度,除了具备间隔尺度的特点外,还可以进行比率运算。
三、描述统计描述统计是对收集到的数据进行总结和描绘的方法。
常用的描述统计方法包括中心趋势和离散程度的度量。
中心趋势是用来反映一组数据的平均水平的指标,常用的有均值、中位数和众数。
离散程度则是用来反映一组数据的分散程度和差异性的指标,常用的有极差、方差和标准差。
四、正态分布正态分布是心理统计学中最重要的一种分布,也被称为高斯分布或钟形曲线。
它具有对称、单峰和连续的特点。
在心理学研究中,许多变量都呈现出正态分布的特性,因此,对正态分布的了解是非常重要的。
正态分布可以通过计算均值和标准差来描述,均值决定了曲线的中心位置,标准差决定了曲线的宽窄程度。
五、假设检验假设检验是统计推断的一种方法,用于检验对总体或群体特征作出的假设是否成立。
在心理学研究中,我们常常需要根据样本数据对总体特征进行推断和判断。
常见的假设检验方法有单样本t检验、独立样本t检验和相关样本t检验等。
《心理统计学》重要知识点
《心理统计学》重要知识点第二章 统计图表简单次数分布表的编制:Excel 数据透视表列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。
条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。
简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。
复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。
圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。
线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势;第三章 集中量数● 集中趋势和离中趋势是数据分布的两个基本特征。
● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。
● 集中量数:描述数据分布集中趋势的统计量数。
● 离中趋势:是指数据分布中数据分散的程度。
● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):nx X i∑= Excel 统计函数AVERAGE算术平均数的重要特性:(1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i(2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后,那么,变量Y 2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。
中位数上下的数据出现次数各占50%。
3.众数(mode ,M O ):一组数据中出现次数最多的数据。
4.算术平均数、中数、众数之间的关系。
统计心理学主要知识点归纳
统计心理学主要知识点归纳统计心理学是一门综合应用统计方法于心理学研究中的学科,通过收集、整理和分析大量的数据,旨在揭示心理学现象的规律和关联性。
本文将对统计心理学的主要知识点进行归纳和总结。
一、概率与统计基础概率与统计是统计心理学的基石。
研究者需要了解概率理论和统计学基本概念,如随机变量、概率分布、假设检验等。
概率理论提供了对事件发生概率的量化描述,统计学则提供了对数据的分析和解释的方法。
二、标准化和测量在统计心理学中,测量是一个核心概念。
研究者需要了解不同测量尺度(如名义尺度、顺序尺度、间隔尺度、比例尺度)的特点及其应用。
此外,标准化也是一项重要技术,它可以将原始分数转化为具有标准分布特征的分数,以便进行比较和分析。
三、相关性分析相关性分析用于研究变量之间的关联程度。
研究者经常使用皮尔逊相关系数或斯皮尔曼等级相关系数来度量变量之间的相关性。
这项分析可以帮助研究者确定变量之间的关系,并进一步推断其之间可能存在的因果关系。
四、假设检验假设检验是统计心理学中最常用的方法之一。
它用于检验研究者对事物的某种假设是否成立。
在进行假设检验时,研究者需要明确研究假设、选择适当的统计检验方法,并进行显著性检验以确定结果的可靠性。
五、方差分析方差分析用于比较两个或更多组之间的均值差异,常用于处理实验数据。
研究者需要选择适当的方差分析方法,并进行后续的事后比较分析以确定组间差异是否显著。
六、回归分析回归分析是研究变量之间关系及其影响程度的重要方法。
通过回归分析,研究者可以确定自变量对因变量的解释程度,并进行预测。
常见的回归方法包括线性回归、多元回归和逐步回归等。
七、因子分析因子分析是一种用于研究多个变量之间共同性的方法。
通过因子分析,研究者可以探索变量之间的内在结构,并将其归纳为几个共同的因子,以简化变量的复杂性。
八、统计软件的应用在统计心理学研究中,统计软件的应用非常广泛。
研究者可以使用SPSS、R、Python等工具进行数据分析和处理。
统计心理学主要知识点总结
统计心理学主要知识点总结统计心理学是心理学的一个重要分支领域,它通过运用统计学的方法和技术,研究人类心理现象及其规律。
本文将对统计心理学的主要知识点进行总结,旨在帮助读者更好地理解和应用统计心理学的理论和方法。
一、概述统计心理学是一门应用性较强的学科,它利用统计学的概念和方法,对心理学中的数据进行分析和解释。
统计心理学的主要任务是帮助心理学研究者进行数据处理和统计推断,从而揭示心理现象背后的规律和原因。
二、描述性统计描述性统计是统计心理学的基础,用于对心理学数据进行描述和概括。
描述性统计主要包括以下几个方面:1. 集中趋势:用于描述数据的集中程度,常用的指标包括均值、中位数和众数。
2. 离散程度:用于描述数据的离散程度,主要有标准差、方差和极差等指标。
3. 分布形态:用于描述数据的分布形态,例如正态分布、偏态分布和峰态分布。
三、概率与统计推断概率与统计推断是统计心理学的核心内容,它涉及到从样本数据中推断总体特征和进行假设检验等内容。
1. 概率原理:概率是描述事件发生可能性的数值,统计心理学利用概率理论解释和推断心理学现象。
2. 抽样与总体推断:从总体中随机选择样本,并利用样本数据推断总体特征。
3. 假设检验:用于检验研究假设的有效性,常见的方法包括t检验、方差分析和卡方检验等。
四、相关与回归分析相关与回归分析是统计心理学中用于研究变量间关系的重要方法。
1. 相关分析:用于衡量两个变量之间的相关程度,常用的指标有皮尔逊相关系数和斯皮尔曼相关系数。
2. 线性回归分析:用于建立一个或多个自变量与一个因变量之间的关系模型,通过回归方程进行预测和解释。
五、实验设计与数据分析实验设计与数据分析是统计心理学研究中关键的一环,它包括实验设计和数据分析方法的选择。
1. 随机分组与控制:在实验中使用随机分组和控制变量的方法,以降低其他因素对实验结果的影响。
2. 方差分析:用于比较两个或多个组之间的差异,并确定差异是否显著。
《心理统计学》总复习要点1-7章[4]
《心理统计学》总复习要点1-7章[4]《心理统计学》总复习要点第一章、第二章基本概念及次数分布表第一节基本概念一、基本概念1.连续变量与离散变量(不连续变量)变量分为连续变量与离散变量(不连续变量)。
连续变量则可以在量表上的任何两点加以细分,可以取得无限多个大小不同的数值。
不连续变量又称离散变量或间断变量,则在量表上的任何两点中只能取得有限个数值。
是一种只能取特殊值而不能取任何值的变量,它代表一个点,而不是一段距离。
2.总体、样本、个体总体是指具有某一种特征的一类事物的全体,构成总体的每一个基本元素称为个体,在总体中按一定规则抽取的一部分个体,称为总体的一个样本。
二、测量水平心理测量的工具一般可以分为四种水平,它们是由测量工具——量尺的水平决定的,量尺也称为尺度。
(一)量尺(Ratio Measurement)用这样的量尺测量出的数据,可以进行加、减、乘和除运算。
这种测量水平的数据特征是有相等单位和绝对零点。
用这种量尺测量得到的数据变量为比率(或等比)变量。
(二)等距量尺(Interval Measurement)只有相等单位,没有绝对零点,这种测量工具称为等距量尺。
等距量尺测出的数据可以进行加和减的运算,而不能进行乘和除的运算。
但是,等距数据的差值可以进行乘、除运算,因为等距数据的差值有一个绝对零点,两个数值相等,差值即为零。
用这种量尺测量得到的数据变量为等距变量。
(三)顺序量尺(Ordinal Measurement)顺序量尺又叫等级量尺,它的特点是:既无绝对零点,又无相等单位。
用这种量尺对研究对象进行测量,只能给对象排个顺序。
顺序量尺的测量结果原则上不能进行加、减、乘、除四则运算。
如有必要的话,只能进行不等式运算。
用这种量尺测量得到的数据变量为顺序变量。
(四)分类量尺(Nominal Measurement)分类测量不包含任何类间数量关系的假定,仅仅是把测量对象分为相同或相异,但在性质上没有哪一类较大,哪一类较小之分。
《心理统计学》重要知识点
《心理统计学》重要知识点《心理统计学》重要知识点第二章统计图表简单次数分布表的编制:Excel数据透视表列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel数据透视表直方图(histogram):直观描述连续变量分组次数分布情况,可用Excel图表向导的柱形图来绘制散点图(Scatter plot):主要用于直观描述两个连续性变量的关系状况和变化趋向。
条形图(Bar chart):用于直观描述称名数据、类别数据、等级数据的次数分布情况。
简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。
复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。
圆形图(circle graph)、饼图(pie graph):用于直观描述类别数据或等级数据的分布情况。
线形图(line graph):用于直观描述不同时期的发展成就的变化趋势;第三章集中量数● 集中趋势和离中趋势是数据分布的两个基本特征。
● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。
● 集中量数:描述数据分布集中趋势的统计量数。
● 离中趋势:是指数据分布中数据分散的程度。
● 差异量数:描述数据分布离中趋势(离散程度)的统计量数● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d )1.算术平均数(简称平均数,M 、X 、Y ):n x X i∑= Excel 统计函数AVERAGE算术平均数的重要特性:(1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i(2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后,那么,变量Y 的平均数X b a Y +=2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。
中位数上下的数据出现次数各占50%。
3.众数(mode ,M O ):一组数据中出现次数最多的数据。
4.算术平均数、中数、众数之间的关系。
教育统计与测量学 心理统计与测量学 复习笔记 课程重点
集中量数和差异量数一、数据的集中量数:要描述存在于组别之间的普遍差异的方法,就是要找出典型的或平均水平的数据代表。
二、集中趋势定义:反映频数分布中大量数据向某一点集中的情况,描述这种特点的统计量称为集中量数。
1.测度集中趋势就是寻找数据水平的代表值或中心值2.确定集中趋势并没有统一的、标准化的方法。
因为没有一种测量集中趋势的代表性数值可以适用于所有情况。
集中趋势的一般性目的是找出单一的最具有代表性的数值。
3. 低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据;三、集中量数包括:1.算术平均数Mean:集中趋势的测度值之一;最常用的测度值;一组数据的均衡点所在【天平】;易受极端值的影响;用于数值型数据,不能用于定类数据和定序数据。
算术平均数是“真值”的最佳估计值优点a)反应灵敏。
观测数据中任何一个数值或大或小的变化,甚至细微的变化,在计算平均数时,都能反应出来;b)计算严密。
计算平均数有确定的公式,不管何人在何种场合,只要是同一组观测数据,计算的平均数都相同;c)计算简单。
计算过程知识应用简单的四则运算;d)简明易解。
平均数概念简单明了,较少数学抽象容易理解;e)适合于进一步用代数方法演算。
在求解其他统计特征值,如离均差、方差、标准差的计算时,都要应用平均数;f)较少受抽样变动的影响。
观测样本的大小或个体的变化,对计算平均数影响很小。
在来自同一总体逐个样本的集中量数中,平均数的波动同样小于其他量数的波动,因此它总是最可靠、最正确的量数。
缺点1.易受极端数据的影响;2.因为计算平均数是需要每一个数据都加入计算。
在次数分布中只要有一个数据含糊不清,都无法计算平均数。
在这种情况下,一般采用中数作为该组数据的代表值,描述其集中趋势计算和应用算术平均数的原则•同质性原则:算术平均数只能用于表示同类数据的集中趋势。
•平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个体的数据。
心理统计重点
1、心理统计学以大量的心理随机现象的数量表现和数量关系作为自身的研究对象,包括统计设计、统
计描述和统计推断。
2、统计资料分为称名资料(不能加减乘除)、等级资料(归类)、等距资料(加减)、比率资料(加
减乘除)
3、资料的来源:原始记录、统计报表、抽样调查、实际观察
4、审查资料的程序:初步检查、逻辑检查、抽样复核
5、集中量数是用来描述暑假分布规律的集中趋势或集中程度的特征量数,分为平均数、中位数、众数、
百分数和几何平均数
6、强度(率)、结构相对数(构成比)、比较相对数(相对比)、动态相对数(发展率)五种相对数。
【注意构成比和率的区别:构成比只能说明比重或分布,不能说明发生的频率或强度】
7、以均数为中心,中间频数众多,两侧逐渐减少左右基本对称频数或频率分布,称之为(近似)正态
分布
8、σ越小,曲线就越“高而瘦”,σ越大,曲线就越“矮而胖”;μ越小,曲线沿横轴越向左平行
移动;μ越大,曲线沿横轴越向右平行移动
9、差度的概念Z=X-μ/σ
10、标准差与标准误的区别(由于符号难打,请参考课本P183)
11、回归分析和相关分析的异同:都是研究两个或两个以上变量的统计分析方法,但相关分析是研究变量之间是否存在相关关系及其关系的变化方向和密切程度,而回归分析则是研究变量之间依存变化的数量关系,解决以下问题:建立数学表达式;进行预测或控制;进行因素分析。
12、统计设计的原则(科学设计的原则也差不多):目的性、再现性、可行性、经济性
13、非参数检验都有:符号检验(检验相关样本差异)、秩和检验(两总体或多总体的观测值有无倾向性不同)、等级方差分析(多组计量资料的差异比较)。
《心理与教育统计学》复习提纲
2012年春季期《心理与教育统计学》复习提纲1.心理与教育统计学的内容。
p82.心理与教育统计基础概念。
p163.集中量数的种类。
算术平均数的算法(原始数据)。
p544.平均数的特点。
p575.平均数的优缺点(主要是当数据中有极端值的时候不宜使用平均数作为集中量数,以及当数据不同质的时候不能将数据相加或比较大小)。
p586.中数的概念及求法(未分组原始数据)。
p617.众数的概念及求法(未分组原始数据)。
p648.平均数、中数和众数的关系。
p669.加权平均数的计算。
p6810.差异量数的种类。
全距的概念及求法。
p8011.方差的含义:描述一组数据的分散程度的差异量,方差越大,数据越分散;方差越小,数据越集中。
公式。
标准差及标准误。
p8712.方差和标准差的性质。
p9213.差异系数。
p9414.标准分数。
p95-9915.相关系数、散点图。
p10816.积差相关的公式与适用条件。
p11217.斯皮尔曼等级相关的公式与适用条件。
p12318.肯德尔和谐系数的适用资料。
p12819.点二列相关的公式、适用资料、用途(计算客观题的区分度)。
p13420.二列相关的公式、适用资料、用途(计算客观题的区分度)。
p13721.正态分布的特征。
p16222.二项分布的性质、平均数与标准差。
p17823.样本平均数的分布。
Z分布,t分布,F分布,卡方分布。
24.点估计(样本平均数估计总体平均数、样本标准差估计总体标准差)及良好点估计的标准。
p19625.置信区间与显著性水平。
p19826.总体平均数的估计。
p201-20527.假设检验(两种假设、两类错误、两种类型)、统计检验力1-β。
p22328.平均数的显著性检验。
p231-23329.平均数差异的显著性检验。
p236,例8-630.平均数差异的显著性检验。
两总体都是正态分布、两总体方差未知、独立样本,要先做方差齐性检验。
31.方差齐性检验。
p246,例8-1332.方差分析(自由度、组间方差、组内方差、F值如何计算);方差分析表(完全随机实验设计的方差分析表和随机区组实验设计的方差分析表。
现代心理与教育统计学复习资料(1)
第一章心理与教育统计学基础知识1、数据类型称名数据离散型数据顺序数据等距数据连续型数据比率数据2、变量、随机变量、观测值变量是可以取不同值的量。
统计观察的指标都是具有变异的指标。
当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。
用来表示随机现象的变量,称为随机变量。
一般用大写的X或Y表示随机变量。
随机变量所取得的值,称为观测值。
一个随机变量可以有许多个观测值。
3、总体、个体和样本需要研究的同质对象的全体,称为总体。
每一个具体研究对象,称为一个个体。
从总体中抽出的用以推测总体的部分对象的集合称为样本。
样本中包含的个体数,称为样本的容量n。
一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。
4、统计量和参数5、统计误差误差是测得值与真值之间的差值。
测得值=真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。
由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。
由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差第二章 统计图表一、数据的整理在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。
对于个别极端数据是否该剔除,应遵循三个标准差法则。
二、 次数分布表(一)简单次(频)数分布表(二)相对次数分布表将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表(三)累加次数分布表(四)双列次数分布表双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。
所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。
三、次数分布图使一组数据特征更加直观和概括,而且还可以对数据的分布%100 N f情况和变动趋势作粗略的分析。
简单次(频)数分布图——直方图、次数多边形图累加次数分布图——累加直方图、累加曲线(一)简单次数分布图--直方图(二)简单次数分布图-次数多边图次数分布多边形图()是一种表示连续性随机变量次数分布的线形图,属于次数分布图。
心理健康教育-心理与教育统计-重点分析
学习目标1、次数分布表与图2、几种常用的统计分析图(一)次数分布及其表述方式概述次数分布:一批数据中各个不同数值所出现的次数情况,或者是指一批数据在量尺上各等距区组内出现的次数情况。
对数据进行分组归类,考察这批数据在量尺上各等距区组内的次数分布情况,并把这种情况用规范的表格形式加以体现,这就是次数分布表。
若用图形来表达,就叫做次数分布图。
(一)简单次数分布表简单次数分布表,通常简称为次数分布表,其实质是反映一批数据在各等距区组内的次数分布结构。
(二)分组次数分布表分组次数分布表:主要用来表示连续数据在各个分组区间内的散布情况。
编制次数分布表的步骤:1.求全距。
全距是一批数据中最大值与最小值之间的差距。
用R表示。
2.定组数。
定组数就是要确定把整批数据划分为多少个等距的区组。
组数用K表示。
一般来说,当一批数据的个数在200以内时,组数可取8-18组。
(二)分组次数分布表编制次数分布表的步骤:3.定组距。
用符号i表示。
一般是取奇数或5的倍数。
4.写出组限。
组限是每个组的起始点界限,组限的表述方法有很多,所以要弄清楚每组的实上限和实下限实际组限采取左闭右开取数比如60~70 这一组的实下限为59.5,实上限为69.5.它是左闭右开的区间:[59.5,69.5)(二)分组次数分布表编制次数分布表的步骤:5.求组中值。
组中值是各组的中点在量尺上的数值。
6.归类划记。
7.登记组数。
全距1、定义最大值与最小值之间的差距。
2 计算公式R= X max-X min(公式1)组数1、定义确定把整批数据划分为几个等距的区组2、注意点(1)若数据个数在100以上,习惯上取10-20组,一般取12-16组。
(2)若数据服从正态分布(如学习成绩、智力测验的分数等),则使用下列公式:(公式2)K:组数;N:数据个数组距1、定义任意一组的起点和终点之间的距离。
2 、注意点(1)组距的大小,需以全距为参照。
(2)一般是取奇数或5的倍数,如1,3,5,7,9,10等(3)若组数(K)已定,则组距(i)为:i=R/k (公式3)组限1、定义一个组的起点值和终点值之间的距离,又叫组限。
心理教育统计学上半学期重点要点
2、差异系数 反映了一个次数分布的离散程度。 (一)测量的数据要保证等距 (二)有绝对零点 (三)只能用来描述,不能进行推断
3、标准分数 又称基分数或 Z 分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置 量数。
4、标准差的性质 (一)每一个观测值都加一个相同常数 C 之后,计算得到的标准差等于原标准差。 (二)每一个观测值都乘以一个相同的常数 C,则所得的标准差等于原标准差乘以这个常 数。
第二章 统计图表 1、统计图及统计图的构成 一般采用指教坐标系,通常横坐标或横轴表示事物的组别或自变量 x,称为分类轴;纵坐标 或纵轴表示事物出现的次数或因变量 y,称为数值轴。 组成:图号及图标、图尺、图形、图例、图注。
2、统计表及统计表的构成 组成:表号、名称、标目、数字、表注、三线格。
3、统计分组应该注意哪些问题 (一)分组要以被研究对象的本质特性为基础 (二)分类标志要明确,要能包括所有的数据
N
MH
1 Xi
第四章 差异量数 1、差异量数 表示一组数据的差异情况或离散程度的量数,反映数据分布的离中趋势。描述事物差异性的 表现。差异量越小,平均数的代表性越好。差异量越大,平均数的代表性则差。 种类: 绝对差异量:全距、百分位差、四分位差、平均差、标准差、方差。 相对差异量:常见的有差异系数。
1.总体与样本 总体是我们所研究的具有共同特性的个体的总和。总体中的每个 单位称为个体。样本是从总体中抽取的作为观察对象的一部分个体。 2.参数与统计量 根据实得的数据所计算出的能够描述一组数据各种特征的数 量是统计量,反映样本数据特征的是统计量,反映总体各种特征的数量是参数。 3.顺序数据 顺序数据是指既无相等单位,也无绝对零点的数据,是按照事物某 种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。如等级评 定、考试名次等。 4 等距数据 等距数据是有相等单位,而无绝对零点的数据,它不仅能提供数据 之间顺序,还可以准确指出数据之间差距。如学生的智商、入学考试的分数等。 (3 分) 5 描述统计学 阐述搜集资料以及提炼和描述这些资料的方法,是推断统计学的 基础。主要有集中量数、差异量数、相关分析和统计图表等内容。 6 集中量数 是代表一组数据典型水平或集中趋势的量。它能反映频数分布中 大量数据向某一点集中的情况。经常用的有平均数、众数、中位数等。 7 标准分数 是以标准差为单位的一种量数。表示的是一个原始分数在团体中所 处的相对位置,也叫做 Z 分数。 8 差异系数 所谓差异系数是指标准差与其算术平均数的百分比,它是没有单 位的相对数。用公式可表示为:CV=S/M。其值越小,表示离散程度越小。 9 点计数据和度量数据 按照数据来源对数据类型的划分。前者是指计算个数所 获得的数据,后者是指用一定的工具或一定的标准测量获得的数据。 10. 随机现象就是在一定条件下,可能出现也可能不出现的一类现象。 11. 差异量数 表示一组数据的差异情况或离散程度的量数,反映数据分布的离中 趋势。经常用的有标准差、全距、四分位距等。
现代心理与教育统计学知识点
现代心理与教育统计学知识点心理统计学第一章概述描述统计定义:研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理概括和表述作用:使杂乱无章的数字更好的显示出事物的某些特征,有助于说明问题的实质。
具体内容:1数据分组:采用图与表的形式。
2计算数据的特征值:集中量数(平均数中数)离散量数(方差)3计算量事物间的相关关系:积差相关(2列 3列多列)推断统计定义:主要研究如何利用局部数据(样本数据)所提供的信息,依据数理统计提供的理论和方法,推论总体情形。
作用:用样本推论总体。
具体内容:1如何对假设进行检验。
2如何对总体参数特征值进行估计。
3各种非参数的统计方法。
心理与教育统计基础概念数据类型一从数据来源来划分1计数数据:计算个数或次数而获得的数据。
(都是离散数据) 2测量数据:借助一定测量工具或测量标准而获得的数据。
(连续数据)二根据数据所反映的测量水平 1称名数据(分类)定义:指用数字代表事物或数字对事物进行分类的数据。
特点:数字只是事物的符号,而没有任何数量意义。
统计方法:百分数次数众数列联相关卡方检验等。
(非参检验)2顺序数据(分类排序)定义:指代事物类别,能够表明不同食物的大小等级或事物具有的某种特征的程度的数据。
(年级)特点:没有相等单位没有绝对零点。
不表示事物特征的真正数量。
统计方法:中位数百分位数等级相关肯德尔和谐系数以及常规的非参数检验方法。
3等距数据(分类排序加减(相等单位))(真正应用最广泛的数据)定义:不仅能够指代物体的类别等级,而且具有相等的单位的数据。
(成绩温度)特点:真正的数量,能进行加减运算,没有绝对零点,不能进行乘除计算。
统计方法:平均数标准差积差相关 Z检验t检验 F检验等。
4比率数据(分类排序加减法乘除法(绝对零点))定义:表明量的大小,也具有相等单位,同时具有绝对零点。
(身高反应时)特点:真正的数字,有绝对零点,可以进行加减乘除运算。
在统计中处理的数据大多是顺序数据和等距数据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章绪论1心理与教育研究数据特征(一)心理与教育科学研究数据与结果多用数字形式呈现(二)心理与教育科学研究数据具有随机性何变异性(三)心理与教育科学研究数据具有规律性(四)心理与教育科学研究的目标是通过部分数据来推测总体特征2学习心理与教育统计需要注意的几个问题(一)必须克服畏难情绪(二)要注意重点掌握各种统计方法使用的条件(三)要做一定的练习3如何作到正确选用统计方法,防止误用乱用统计首先要分析一下实验设计是否合理,其次要分析实验数据的类型,最后要分许数据的分布规律。
4按照数据反映的测量水平,如何对数据进行划分称名数据、顺序数据、等距数据、比率数据5数据类型:记录数据:人口数;测量数据:身高体重;称名数据:性别颜色;顺序数据:能力等级喜爱程度;等距数据:温度能力分数智商;比率数据:身高体重感觉阈值;连续数据:年龄长度重量自信心分数;离散数据取整数,两个单位之间不能划分细小单位:从事某一职业人数,球赛比分。
6变量、观测值、随机变量、总体、样本、个体、参数、统计量、次数、频率、概率变量:指心理与教育实验、观察、调查中想要获得的数据。
观测值:变量确定下来的某个值。
随机变量:在统计学上,把取值之前不能预料取到什么值的变量,称为随机变量。
总体:又称母全体。
全域,指具有某种特征的一类事物的总体。
样本:总体中抽取一部分个体,称为总体的一个样本。
个体:构成总体的每个基本单元,有时候又称为一个随机事件或样本点。
参数:总体的那些特征称为参数,又称总体参数,是描述一个总体情况的统计指标。
常数统计量:(英文字母)代表样本的特征,是一个变量,随着样本的变化而变化。
次数:指某一事件在某一类别中出现的数目,又称频数。
用ƒ表示。
比率:两个数的比成为比率。
又称比例,百分数或百分率是一种表现形式。
频率:相对次数,总的事件数目除某一事件发生的次数、一组数据总个数出某一时间次数。
概率:又称几率或然率,用P表示,指某一观测钟所能预料的相对出现的次数。
第二章统计图表1、统计图及统计图的构成一般采用指教坐标系,通常横坐标或横轴表示事物的组别或自变量x,称为分类轴;纵坐标或纵轴表示事物出现的次数或因变量y,称为数值轴。
组成:图号及图标、图尺、图形、图例、图注。
2、统计表及统计表的构成组成:表号、名称、标目、数字、表注、三线格。
3、统计分组应该注意哪些问题(一)分组要以被研究对象的本质特性为基础(二)分类标志要明确,要能包括所有的数据4、条形图与直方图的区别(一)条形统计图横轴上的数值是一个单个具体数字,而直方图上是连续的数字,是范围。
(二)条形统计图上的方块是独立的,而频数直方图上是方块是粘在一起的,你可以找一个条形统计图和频数直方图比较一下。
(三)频数直方图是用面积来表示数据多少,而条形统计图是用高度来表示数据多少。
第三章集中量数1、集中量数对一组数据集中趋势的度量,就是确定描述一组数据这种特点的代表性的统计量。
用于描述数据集中程度的统计量叫做集中量数。
2、平均数的特点(一)在一组数据中每个变量与平均数之差(称为离均速)的总和的能够与0。
(二)在一组数据中。
每个数都加上一个常数C,则所得的平均数为原来的平均数加常数C。
(三)在一组数据中,每一个数都乘以一个常数C,则所得的平均数为原来的平均数乘以常数C。
3、平均数的应用原则(一)同质性原则:总体是又同类数据所组成。
(二)平均数与个体数值相结合的原则。
(三)平均数和标准差、方差相结合原则。
<平均数表现反映集中数据的集中趋势,标准差和方差表现总体的离中趋势。
>4、平均数的优缺点优点:反映灵敏、计算严密、计算简单、简明易解、适合于进一步用代数方法演算、较少收抽样变动的影响。
缺点:易受极端数据的影响、若出现模糊不清的数据时,无法计算平均数。
5、中位数(Md、Mdn)优缺点优点:根据观测数据而来不能凭主观意定、计算简单、容易理解、概念简单明白。
缺点:大小不受制于全体数据、反映不够灵敏、极端数据变化对中数不产生影响、受抽样影响大不如平均数稳定、计算先要排大小、中数乘以总数会与数据总和不相等、中数不能做进一步代数运算。
6、众数(M )优缺点优点:概念简单明了、容易理解、可快速粗略估计一组数据的代表值缺点:不稳定受分组影响、受样本变动影响、较少受极端数目的影响、不能做进一步代数运算。
7、平均数、众数、中位数三者关系与数据分布关系8、加权平均数公式(P69例3-7)适合解决各个平均数求整体总平均数之类的问题。
9、 调和平均数公式(p75例3-14)调和平均数(H)是被研究对象中各数据值倒数的算术平均数的倒数。
适合于计算平均速率的问题。
∑∑=+⋯⋯++⋯⋯++=Wi WiXi Wn W W WnXn X W X W Mw 212211∑=Xi N M H 1第四章 差异量数1、差异量数表示一组数据的差异情况或离散程度的量数,反映数据分布的离中趋势。
描述事物差异性的表现。
差异量越小,平均数的代表性越好。
差异量越大,平均数的代表性则差。
种类:绝对差异量:全距、百分位差、四分位差、平均差、标准差、方差。
相对差异量:常见的有差异系数。
2、差异系数反映了一个次数分布的离散程度。
(一)测量的数据要保证等距(二)有绝对零点(三)只能用来描述,不能进行推断3、标准分数又称基分数或Z 分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。
4、标准差的性质(一)每一个观测值都加一个相同常数C 之后,计算得到的标准差等于原标准差。
(二)每一个观测值都乘以一个相同的常数C ,则所得的标准差等于原标准差乘以这个常数。
5、标准分数的性质(一)没有实际单位(二)有正有负(三)一组原始数据中,各个Z 分数的标准差为1(四)原始分数正态分布的时候,转换得到的Z 分数是标准正态分布,均值是0,标准差是1。
6、标准分数的优点(一)可比(二)可加:不受原始分数单位的影响,使不同性质的原始分数具有相同的参照点(三)明确:知道了某一数据的标准分数,就知道了该被试在全体中的百分等级,也就是知道了他在全体中的地位(四)稳定:规定标准差为1,保证了不同性质的分数在总分数中的权重是一样的7、差异系数的计算公式CV=样本标准差s/平均数 * 100%8、标准分数的计算公式Z=(原始数据-平均数)/标准差s9、N s xs ∑==22标准差的计算公式()N N X X x s ∑∑=-=22了算术平均数)基本的计算公式(利用第五章相关关系1、相关系数(相互关系r、总体参数)的性质(一)相关系数r的取值范围介于-1.00至+1.00之间,它是一个比率,常用效属性是表示。
(二)相关系数的“+、-”(正、负)号表示双变量数列之间相关的方向,正值表示正相关,负值表示负相关。
(三)相关系数r=+1.00是表示完全正相关,r=-1.00时表示完全负相关,这两者都是完全相关。
r=0时表示完全独立,也就是零相关,即无任何相关性。
(四)相关系数取值的大小表示相关的强弱程度。
如果相关系数的绝对值在1.00与0之间,则表示不同程度的相关。
绝对值接近1.00端,一般为相关程度密切,接近0值端一般为关系不够密切。
2、积差相关需要满足的条件(一)要求成对的数据,即若干个体中每个个体都有两种不同的观测值。
(二)两列变量各自总体的分布都是正态,即正态双变量,至少两个变量服从的分布应是接近正态的单峰分布。
(三)两个相关的变量是连续变量,也即两列数据都是测量数据。
(四)两列变量之间的关系应是直线型的,如果是非直线型的双列变量,不能计算线性相关。
3、斯皮尔曼等级相关的计算(P124例5-3)当两个变量值以等级次序排列或以等级次序表示时,两个相应总体并不一定呈正态分布,样本容量也不一定大于30,表示这两个变量之间的相关,称为斯皮尔曼等级相关。
N为等级个数,D指二列成对变量的等级差数4、点二列相关(P135例5-9)点二列相关多用于评价由是非类测试题目组成的测试的内部一致性等问题。
p与q是二分称名变量两个值各自所占的比率,p+q=1。
St是连续变量的标准差。
第六章概率分布1、随机事件在一定条件下可能出现也可能不出现的。
2、概率随机事件出现可能性大小的客观指标旧时概率。
3、互不相容事件与独立事件4、正态分布特征(一)正态分布的形式是对称的(但对称的不一定是正态的),它的对称轴是经过平均数点的垂线。
(二)正态分布的中央点(即平均数点)最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯,拐点位于正负1个标准差处,曲线两端向靠近基线处无限延伸,但终不能与基线相交。
(三)正态曲线下的面积为1,正态曲线下的面积可视作概率。
(四)正态分布是一族分布,它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。
(五)正态分布曲线下,标准差与概率(面积)有一定的数量关系。
5、正态分布应用(一)化等级评定为测量数据(二)确定测验题目的难易程度(三)在能力分组或等级评定时确定人数(四)测验分数的正态化6、二项实验的条件(一)任何一次实验恰好有两个结果(二)共有n次试验,并且n是预先给定的任一正整数(三)每次试验各自独立,个次试验之间无相互影响(四)某种结果出现的概率在任何一次试验中都是固定的7、样本平均数的分布(一)总体分布为正态,方差已知,样本平技能书的分布为正态分布。
(二)总体分布非正态,但方差已知,这是当样本大于30时,其样本平均数的分布为渐近正态分布。
8、t分布的特点(一)平均值为0。
(二)以平均值0左右对称的分布,左侧t为负值,右侧t为正值。
(三)变量取值为-∞~+∞之间。
(四)当样本容量区域∞时,t分布为正态分布,方差为1;当n-1>30以上时,t分布接近正态分布,方差大于1,随n-1的增大而方差渐趋于1;当n-1<30时,t分布于正态分布关系相差较大,随n-1减少,离散程度(方差)越大,分布图的中间变低但尾部变高。
9、样本平均数的分布(一)总体分布为正态,方差未知时,样本平均数的分布为t分布。
(二)当总体分布为非镇泰而其方差又未知时,若满足n>30这一条件,样本平均数的分布近似为t分布。
10、x²分布的特点(一)x²是一个偏正态分布。
n或n-1越小,分布越偏斜,是一族分布,正态分布是特例。
(二)x²值都是正值。
(三)x²分布的和也是x²分布,即x²分布具有可加性。
(四)如果df>2,这是x²分布的平均数:μx²=df,方差s²x²=2df。
(五)x²分布是连续型分布,但有些离散型的分布也近似x²分布。
11、f分布的特点(一)F分布形态是一个正偏态分布,它的分布曲线随分子、分母的自由度不同而不同,随df1与df2的增加而渐趋正态分布。