心理统计学》重要知识点

合集下载

心理统计学知识点完整版资料整理

心理统计学知识点完整版资料整理

心理统计学知识点完整版资料整理1.数据的概念:在心理统计学中,数据是指信息的收集和组织形式。

数据可以是数字,也可以是文字或符号。

数据的收集可以通过实验、调查、观察等方式进行。

2.数据的分布:在心理统计学中,数据的分布是指通过统计方法和图表来展示数据的特征和规律。

常用的数据分布包括正态分布、偏态分布、均匀分布等。

3.描述性统计:描述性统计是用来描述和总结数据的方法。

常见的描述性统计包括均值、中位数、众数、标准差、变异系数等。

4.推论统计:推论统计是根据样本数据来对总体进行推断的方法。

推论统计主要包括参数估计和假设检验两个方面。

5.参数估计:参数估计是用样本数据来估计总体参数的值。

常见的参数估计方法包括点估计和区间估计。

6.假设检验:假设检验是用来判断总体参数是否满足一些假设的方法。

其中包括设置原假设和备择假设、选择显著性水平、计算统计量、确定拒绝域等步骤。

7.相关分析:相关分析用来研究两个或多个变量之间的关系。

其中最常用的是皮尔逊相关系数,可以用来衡量变量之间的线性相关程度。

8.回归分析:回归分析用来研究一个或多个自变量和因变量之间的关系。

通过回归分析可以得到回归方程,进而预测因变量的值。

9.方差分析:方差分析是一种用来研究多个样本之间差异的方法。

方差分析可以判断不同组之间的均值是否存在显著差异。

10.非参数统计:非参数统计是一种不依赖于总体参数的方法。

非参数统计主要包括秩次统计和分布自由度较小的统计方法。

11.实验设计:实验设计在心理统计学中扮演着重要的角色。

良好的实验设计可以保证实验的可靠性和有效性,并排除干扰因素。

12.抽样方法:抽样方法是指如何从总体中选取样本的方法。

常见的抽样方法包括随机抽样、系统抽样、整群抽样等。

以上是心理统计学的一些主要知识点的简要整理。

了解这些知识点可以帮助我们更好地理解和应用统计方法来分析心理学中的数据。

当然,心理统计学的内容还非常广泛,还有更多的知识点值得深入学习和研究。

大一心理统计学知识点总结

大一心理统计学知识点总结

大一心理统计学知识点总结心理统计学作为一门重要的学科,为心理学研究提供了有力的工具和方法。

在大一的学习过程中,我们接触到了一些基本的心理统计学知识点,这些知识点对我们理解和分析心理学实验数据具有重要的意义。

本文将对这些知识点进行总结和归纳。

一、数据的基本概念在心理统计学中,数据是研究的基础。

我们首先要了解数据的基本概念。

数据可以分为定量数据和定性数据。

定量数据是以数字或者数字形式表示的数据,例如身高、年龄等;而定性数据则是以描述性的文字形式表示的数据,例如性别、性格等。

在心理研究中,我们常常需要收集和分析这两种类型的数据。

二、描述统计学描述统计学是心理统计学中的一大分支,它帮助我们对数据进行整理、概括和描述。

常用的描述统计学方法有集中趋势和离散程度的度量。

集中趋势包括均值、中位数和众数,它们反映了数据的平均水平;而离散程度包括极差、方差和标准差,它们描述了数据的变异程度。

通过描述统计学的分析,我们可以更好地了解和概括数据的特征。

三、概率与抽样分布概率与抽样分布是进行统计推断的基础。

概率是描述随机事件发生可能性的数值,它帮助我们对事件发生的概率进行估计。

抽样分布是从总体中抽取样本后得到的分布,它帮助我们对样本统计量的分布进行推断。

通过理解概率与抽样分布的知识,我们可以进行样本数据的统计推断,从而对总体的性质进行估计和推测。

四、假设检验与参数估计假设检验是心理统计学中非常重要的方法之一,它用于判断总体特性的假设是否可被接受。

我们首先提出原假设和备择假设,然后通过收集样本数据,计算样本统计量,从而得到一个用于决策的统计量,最后来判断是否接受或拒绝原假设。

参数估计是对总体参数的估计,通过采用样本统计量,根据抽样分布推断总体参数的范围。

假设检验与参数估计相互联系,共同用于对总体特性进行推断和研究。

五、相关与回归分析相关分析与回归分析是心理统计学中用于分析变量关联关系的方法。

相关分析用于研究两个变量之间的线性关系,通过相关系数来衡量两个变量的相关程度。

大一心理统计学知识点

大一心理统计学知识点

大一心理统计学知识点心理统计学是心理学的一个重要分支,它研究了与心理学相关的统计方法和技术。

在大一的学习中,我们需要了解一些基本的心理统计学知识点,以帮助我们更好地理解心理学研究中所用到的数据和分析方法。

本文将介绍一些大一心理统计学的重要知识点。

一、数据类型在心理统计学中,数据可以分为两种类型:定性数据和定量数据。

定性数据是指在不进行数值化处理的情况下,仅仅根据属性进行分类的数据。

例如,性别、民族和学历等信息都属于定性数据。

定量数据则是用具体的数值表示的数据,可以进行数值计算和比较。

例如,身高、体重和考试成绩等数据都属于定量数据。

二、测量尺度根据数据的性质和可操作性,心理统计学中通常使用四种测量尺度:名义尺度、顺序尺度、间隔尺度和比率尺度。

名义尺度仅仅对数据进行分类,没有数值上的意义。

顺序尺度除了可以分类,还可以表示数据的大小顺序。

间隔尺度不仅可以分类和顺序排列,还可以比较数据之间的差距。

比率尺度是最完备的测量尺度,除了具备间隔尺度的特点外,还可以进行比率运算。

三、描述统计描述统计是对收集到的数据进行总结和描绘的方法。

常用的描述统计方法包括中心趋势和离散程度的度量。

中心趋势是用来反映一组数据的平均水平的指标,常用的有均值、中位数和众数。

离散程度则是用来反映一组数据的分散程度和差异性的指标,常用的有极差、方差和标准差。

四、正态分布正态分布是心理统计学中最重要的一种分布,也被称为高斯分布或钟形曲线。

它具有对称、单峰和连续的特点。

在心理学研究中,许多变量都呈现出正态分布的特性,因此,对正态分布的了解是非常重要的。

正态分布可以通过计算均值和标准差来描述,均值决定了曲线的中心位置,标准差决定了曲线的宽窄程度。

五、假设检验假设检验是统计推断的一种方法,用于检验对总体或群体特征作出的假设是否成立。

在心理学研究中,我们常常需要根据样本数据对总体特征进行推断和判断。

常见的假设检验方法有单样本t检验、独立样本t检验和相关样本t检验等。

《心理统计学》总复习要点[]

《心理统计学》总复习要点[]

《心理统计学》总复习要点第一章、第二章基本概念及次数分布表第一节基本概念一、基本概念1.连续变量与离散变量(不连续变量)变量分为连续变量与离散变量(不连续变量)。

连续变量则可以在量表上的任何两点加以细分,可以取得无限多个大小不同的数值。

不连续变量又称离散变量或间断变量,则在量表上的任何两点中只能取得有限个数值。

是一种只能取特殊值而不能取任何值的变量,它代表一个点,而不是一段距离。

2.总体、样本、个体总体是指具有某一种特征的一类事物的全体,构成总体的每一个基本元素称为个体,在总体中按一定规则抽取的一部分个体,称为总体的一个样本。

二、测量水平心理测量的工具一般可以分为四种水平,它们是由测量工具——量尺的水平决定的,量尺也称为尺度。

(一)量尺(Ratio Measurement)用这样的量尺测量出的数据,可以进行加、减、乘和除运算。

这种测量水平的数据特征是有相等单位和绝对零点。

用这种量尺测量得到的数据变量为比率(或等比)变量。

(二)等距量尺(Interval Measurement)只有相等单位,没有绝对零点,这种测量工具称为等距量尺。

等距量尺测出的数据可以进行加和减的运算,而不能进行乘和除的运算。

但是,等距数据的差值可以进行乘、除运算,因为等距数据的差值有一个绝对零点,两个数值相等,差值即为零。

用这种量尺测量得到的数据变量为等距变量。

(三)顺序量尺(Ordinal Measurement)顺序量尺又叫等级量尺,它的特点是:既无绝对零点,又无相等单位。

用这种量尺对研究对象进行测量,只能给对象排个顺序。

顺序量尺的测量结果原则上不能进行加、减、乘、除四则运算。

如有必要的话,只能进行不等式运算。

用这种量尺测量得到的数据变量为顺序变量。

(四)分类量尺(Nominal Measurement)分类测量不包含任何类间数量关系的假定,仅仅是把测量对象分为相同或相异,但在性质上没有哪一类较大,哪一类较小之分。

即无大小之分,也无等级之分。

心理统计学重点知识

心理统计学重点知识

心理统计学一.描述统计(一)统计图表 1、统计图次数分布图——①直方图:用以矩阵的面积表示连续性随即变量次数分布的图形。

②次数多边形图:一种表示连续性随机变量次数分布的线形图,属于次数分布图。

③累加次数分布图:分为累加直方图和累加曲线图;其中累加曲线的形状大约有三种:一种是曲线的上枝长于下枝(正偏态),另一种是下枝长于上枝(负偏态),第三种是上枝,下枝长度相当(正态分布)。

其他统计图:条形图:用于离散型数据资料; 圆形图:用于间断性资料;线形图:更多用于连续性资料,凡预表示两个变量之间的函数关系,或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的情况,用这种方法比较好。

散点图: 2、统计表①简单次数分布表 ②分组次数分布表③相对次数分布表:将次数分布表中各组的实际次数转化为相对次数,即用频数比率表示。

④累加次数分布表⑤双列次数分布表:对有联系的两列变量用同一个表来表示其次数分布。

(二)集中量数 1、算术平均数M1nii XX N==∑优点:反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少受抽样变动的影响;缺点:受极端数据的影响;若出现模糊不清的数据时,无法计算平均数; 计算和运用平均数的原则: 同质性原则;平均数与个体数值相结合的原则; 平均数与标准差、方差相结合原则; 性质:①在一组数据中每个变量与平均数之差的总和等于零②在一组数据中,每一个数都加上一个常数C ,所得的平均数为原来的平均数加常数C ③在一组数据中,每一个数都乘以一个常数C ,所得的平均数为原来的平均数乘以常数C 2、中数:Md 按顺序排列在一起的一组数据中居于中间位置的数,即这组数据中,一般数据比它大,一般数据比它小。

注意计算方法;3、众数:Mo 是指在次数分布中出现次数最多的那个数值;三者的关系:正偏态分布中,M>Md>Mo 负偏态分布中,M<Md<MoMo=3Md-2M (自己推导一下)(三)差异量数差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。

统计心理学主要知识点归纳

统计心理学主要知识点归纳

统计心理学主要知识点归纳统计心理学是一门综合应用统计方法于心理学研究中的学科,通过收集、整理和分析大量的数据,旨在揭示心理学现象的规律和关联性。

本文将对统计心理学的主要知识点进行归纳和总结。

一、概率与统计基础概率与统计是统计心理学的基石。

研究者需要了解概率理论和统计学基本概念,如随机变量、概率分布、假设检验等。

概率理论提供了对事件发生概率的量化描述,统计学则提供了对数据的分析和解释的方法。

二、标准化和测量在统计心理学中,测量是一个核心概念。

研究者需要了解不同测量尺度(如名义尺度、顺序尺度、间隔尺度、比例尺度)的特点及其应用。

此外,标准化也是一项重要技术,它可以将原始分数转化为具有标准分布特征的分数,以便进行比较和分析。

三、相关性分析相关性分析用于研究变量之间的关联程度。

研究者经常使用皮尔逊相关系数或斯皮尔曼等级相关系数来度量变量之间的相关性。

这项分析可以帮助研究者确定变量之间的关系,并进一步推断其之间可能存在的因果关系。

四、假设检验假设检验是统计心理学中最常用的方法之一。

它用于检验研究者对事物的某种假设是否成立。

在进行假设检验时,研究者需要明确研究假设、选择适当的统计检验方法,并进行显著性检验以确定结果的可靠性。

五、方差分析方差分析用于比较两个或更多组之间的均值差异,常用于处理实验数据。

研究者需要选择适当的方差分析方法,并进行后续的事后比较分析以确定组间差异是否显著。

六、回归分析回归分析是研究变量之间关系及其影响程度的重要方法。

通过回归分析,研究者可以确定自变量对因变量的解释程度,并进行预测。

常见的回归方法包括线性回归、多元回归和逐步回归等。

七、因子分析因子分析是一种用于研究多个变量之间共同性的方法。

通过因子分析,研究者可以探索变量之间的内在结构,并将其归纳为几个共同的因子,以简化变量的复杂性。

八、统计软件的应用在统计心理学研究中,统计软件的应用非常广泛。

研究者可以使用SPSS、R、Python等工具进行数据分析和处理。

统计心理学主要知识点总结

统计心理学主要知识点总结

统计心理学主要知识点总结统计心理学是心理学的一个重要分支领域,它通过运用统计学的方法和技术,研究人类心理现象及其规律。

本文将对统计心理学的主要知识点进行总结,旨在帮助读者更好地理解和应用统计心理学的理论和方法。

一、概述统计心理学是一门应用性较强的学科,它利用统计学的概念和方法,对心理学中的数据进行分析和解释。

统计心理学的主要任务是帮助心理学研究者进行数据处理和统计推断,从而揭示心理现象背后的规律和原因。

二、描述性统计描述性统计是统计心理学的基础,用于对心理学数据进行描述和概括。

描述性统计主要包括以下几个方面:1. 集中趋势:用于描述数据的集中程度,常用的指标包括均值、中位数和众数。

2. 离散程度:用于描述数据的离散程度,主要有标准差、方差和极差等指标。

3. 分布形态:用于描述数据的分布形态,例如正态分布、偏态分布和峰态分布。

三、概率与统计推断概率与统计推断是统计心理学的核心内容,它涉及到从样本数据中推断总体特征和进行假设检验等内容。

1. 概率原理:概率是描述事件发生可能性的数值,统计心理学利用概率理论解释和推断心理学现象。

2. 抽样与总体推断:从总体中随机选择样本,并利用样本数据推断总体特征。

3. 假设检验:用于检验研究假设的有效性,常见的方法包括t检验、方差分析和卡方检验等。

四、相关与回归分析相关与回归分析是统计心理学中用于研究变量间关系的重要方法。

1. 相关分析:用于衡量两个变量之间的相关程度,常用的指标有皮尔逊相关系数和斯皮尔曼相关系数。

2. 线性回归分析:用于建立一个或多个自变量与一个因变量之间的关系模型,通过回归方程进行预测和解释。

五、实验设计与数据分析实验设计与数据分析是统计心理学研究中关键的一环,它包括实验设计和数据分析方法的选择。

1. 随机分组与控制:在实验中使用随机分组和控制变量的方法,以降低其他因素对实验结果的影响。

2. 方差分析:用于比较两个或多个组之间的差异,并确定差异是否显著。

现代心理与教育统计学知识点

现代心理与教育统计学知识点

现代心理与教育统计学知识点心理统计学第一章概述描述统计定义:研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理概括和表述作用:使杂乱无章的数字更好的显示出事物的某些特征,有助于说明问题的实质。

具体内容:1数据分组:采用图与表的形式。

2计算数据的特征值:集中量数(平均数中数)离散量数(方差)3计算量事物间的相关关系:积差相关(2列 3列多列)推断统计定义:主要研究如何利用局部数据(样本数据)所提供的信息,依据数理统计提供的理论和方法,推论总体情形。

作用:用样本推论总体。

具体内容:1如何对假设进行检验。

2如何对总体参数特征值进行估计。

3各种非参数的统计方法。

心理与教育统计基础概念数据类型一从数据来源来划分1计数数据:计算个数或次数而获得的数据。

(都是离散数据) 2测量数据:借助一定测量工具或测量标准而获得的数据。

(连续数据)二根据数据所反映的测量水平 1称名数据(分类)定义:指用数字代表事物或数字对事物进行分类的数据。

特点:数字只是事物的符号,而没有任何数量意义。

统计方法:百分数次数众数列联相关卡方检验等。

(非参检验)2顺序数据(分类排序)定义:指代事物类别,能够表明不同食物的大小等级或事物具有的某种特征的程度的数据。

(年级)特点:没有相等单位没有绝对零点。

不表示事物特征的真正数量。

统计方法:中位数百分位数等级相关肯德尔和谐系数以及常规的非参数检验方法。

3等距数据(分类排序加减(相等单位))(真正应用最广泛的数据)定义:不仅能够指代物体的类别等级,而且具有相等的单位的数据。

(成绩温度)特点:真正的数量,能进行加减运算,没有绝对零点,不能进行乘除计算。

统计方法:平均数标准差积差相关 Z检验t检验 F检验等。

4比率数据(分类排序加减法乘除法(绝对零点))定义:表明量的大小,也具有相等单位,同时具有绝对零点。

(身高反应时)特点:真正的数字,有绝对零点,可以进行加减乘除运算。

在统计中处理的数据大多是顺序数据和等距数据。

心理统计知识点总结

心理统计知识点总结

心理统计知识点总结一、概率论基础1. 概率的概念概率是描述不确定事件发生的可能性大小的数学工具。

在心理统计学中,概率的概念是最为基础的,它是研究随机事件发生规律的重要工具。

对于心理学研究中的一些数据,比如随机实验结果、样本分布等,都可以用概率论的方法来进行研究和分析。

2. 随机变量和概率分布随机变量是描述随机试验结果的一种数学抽象,它是对可能的试验结果的一种量化描述。

概率分布则是用来描述随机变量可能取值的规律。

心理学研究中常见的随机变量有多种类型,比如二项分布、正态分布等,它们都可以用来描述心理学中一些随机试验的结果。

3. 样本空间和事件空间在概率论中,样本空间是指随机试验中所有可能结果的集合,而事件空间则是样本空间中的一个子集,表示某一特定事件发生的可能性。

在心理学研究中,样本空间和事件空间的概念是用来描述研究对象的各种可能结果和事件的可能发生的空间。

4. 条件概率和贝叶斯定理条件概率是指在某一事件发生的条件下,另一事件发生的概率。

贝叶斯定理则是用来描述两个事件之间的相互关系的定理。

在心理学研究中,条件概率和贝叶斯定理可以用来分析一些复杂的事件之间的概率关系,从而揭示心理学中一些复杂事件之间的规律。

二、描述统计学1. 中心趋势的度量中心趋势是用来描述一组数据集中趋向于集中的程度。

心理学研究中,常用的中心趋势度量有均值、中位数、众数等。

这些度量方法可以用来描述一组数据的集中趋势,从而揭示一组数据的集中程度。

2. 离散程度的度量离散程度是用来描述一组数据分散程度的度量。

心理学研究中,常用的离散程度度量有标准差、方差、极差等。

这些度量方法可以用来度量一组数据的分散程度,从而揭示一组数据的分散程度。

3. 正态分布和假设检验正态分布是一种最为常见的概率分布,它在心理学研究中有着重要的应用。

假设检验则是用来检验一组数据是否符合某种特定分布的方法。

在心理学研究中,正态分布和假设检验可以用来判断一组数据是否符合正态分布,从而进行后续的统计分析。

心理学考研之心理统计学笔记

心理学考研之心理统计学笔记

心理学考研之心理统计学笔记The document was prepared on January 2, 2021心理统计学笔记1基本概念总体:具有某些共同的、可观测特征的一类事物的全体,构成总体的每个基本单元称为个体样本:由于不能或没必要对整个总体进行研究,我们只能从总体中选择出一些个体代表总体,这些个体的集合叫样本变量:本身是变化的或者对于不同个体有不同值得特征或条件常量:本身不变且对不同的个体的值也相同参数:描述总体的数值,它可以从一次测量中获得,也可以从总体的一系列测量中推论得到比例:全组中取值为X的比例,p=f/N插值法:一种求两个已知数值之间中间值的方法,其假设所求解点附近数据呈线性变化统计量:描述样本的数值,与参数的获得方式相同随机取样:从总体抽取样本的一种策略,要求总体中的每一个个体被抽到的机会均等取样误差:样本统计量与相应的总体参数之间的差距偏态分布:分数堆积在分布的一端,而另一端成为比较尖细的尾端,其与对称分布对应次数分布:一批数据在某一量度的每一个类目所出现的次数情况离散型变量:由分离的、不可分割的范畴组成,临近范畴之间没有值存在连续型变量:在任何两个观测值之间都存在无限多个可能值,它可被分割成无限多个组成部分2学习建议①将注意放在概念上,心理统计应该是一门概念性的科学,而非纯数学.②一定要将统计方法与心理学研究的情景结合起来学习.③弄懂一个概念再开始学习下一个,心理统计中的概念应用性较差却是之后做题的基础.④做题按照推荐格式能避免出错几率.3统计检验总表数据类型单样本问题独立样本比较相关样本比较多组样本的比较相关问题独立样本重复测量等距型总体正态分布单样本t/z检验独立样本t/z检验相关样本t检验独立样本方差分析重复测量方差分析Pearson积差相关分布形态未知大样本下的相应的t/z检验大样本下的相应的t/z检验大样本下的相应的t检验转化为顺序型转化为顺序型顺序型符号检验法曼-惠特尼维尔克松克-瓦氏单向弗里德曼双向等级SpearmanU检验T检验方差分析方差分析等级相关命名型χ2匹配度检验χ2独立性检验符号检验法χ2独立性检验χ2独立性检验一、描述统计描述统计是指用来整理、概括、简化数据的统计方法,侧重于描述一组数据的全貌,表达一件事物的性质.一统计图表统计表和统计图简单明确、生动直观地表达数量关系,具有一目了然、整洁美观、容易理解等特点.它们是对数据进行初步整理,以简化的形式加以表现的两种最简单的方式.在制定统计图表之前,一般首先要对数据进行以下两种初步整理:①数据排序:按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列②统计分组:根据被研究对象的特征,将所得到数据划分到各个组别中去1.统计图统计图:用点、线、面的位置、升降或大小来表达统计资料数量关系的一种陈列形式组成:坐标轴、图号、图题、图目、图尺、图形、图例、图注分类:条形图、圆图、线性图、直方图、散点图、茎叶图2.统计表统计表:将要统计分析的事物或指标以表格的形式列出来,以代替烦琐文字描述的一种表现形式组成:隔开线、表号、名称、标目、数字、表注分类:简单表、分组表、复合表二集中量数集中量数又叫集中趋势,是体现一组数据一般水平的统计量.它能反映频数分布中大量数据向某一点集中的情况.1.算数平均数1定义算数平均数:即所有观察值的总和与总频数之商,简称为平均数或均数平均数一般与标准差、方差相结合使用.2特点①在一组数据中每个变量与平均数之差的总和等于零②在一组数据中,每一个数都加上一个常数C,所得的平均数为原来的平均数加常数C③在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C3意义算数平均数是应用最普遍的一种集中量数,它在大多情况下是真值最好的估计值.4优缺点优点:反应灵敏、计算严密、计算简单、简明易解、适合于进一步用代数方法盐酸、较少受抽样变动的影响缺点:易受极端数据的影响、不能在出现模糊数据时计算2.中数1定义中数:按顺序排列在一起的一组数据中居于中间位置的数,在这组数据中,有一半数据比它大,一般数据比它小,等价于百分位数是50的那个数.2算法①数列总个数为奇数时,第 n+1/2 个数就是中数②数列总个数为偶数时,可取位于中间的两个数的平均数作为中数③分布中有相等的数时,将重复的数字看成一个连续体,利用中间分数的精确上下限使用插值法3优缺点优点:计算简单、容易理解、不受极端值影响、能在有模糊数据情况下使用、可在顺序型数据时使用缺点:代表性低、不够灵敏、稳定性低、需要排序、不能进一步做代数运算3.众数1定义众数:在次数分布中出现次数最多的那个数的数值众数可能不只一个.在正偏态分布时,平均数最靠近尾端,中数位于其与众数之间. 2优缺点优点:能在数据不同质的情况使用,能避免极端值干扰缺点:不稳定、代表性差、不够灵敏、不能做进一步的代数运算三差异量数差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数.1.离差与平均差离差:分布中的某点到均值得距离,其符号表示了某分属于均值之间的位置关系而数值表示了它们之间的绝对距离离差之和始终为零.平均差:次数分布中所有原始数据与平均数绝对离差的平均值2.方差与标准差和方:每一个离差值平房求和由于离差正负值互相抵消无法代表离中趋势我们引入和方的概念1总体的方差和标准差方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平房后的均数作为样本统计量用符号s2表示,作为总体参数用符号σ2表示,也叫均方.标准差:方差的平方根作为样本统计量用符号s表示,作为总体参数用符号σ表示.2样本的方差和标准差样本的变异性往往比它来自的总体的变异性要小.为了校正样本数据带来的偏差,在计算样本方差时,我们用自由度来矫正样本误差,从而有利于对总体参数更好的无偏差估计:3性质①每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原来的标准差②每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数4意义方差与标准差是表示一组数据离散程度的最好指标,它们是统计描述与统计推断分析中最常用的差异量数,它们的优点有:反应灵敏、计算严谨、计算容易、适合代数运算、受抽样变动影响小、意义简单明了3.变异系数当遇到下列情况时,不能用绝对差异量来比较不同样本的离散程度,而应当使用相对差异量数,最常用的就是差异系数.①两个或两个以上样本所使用的观测工具不同,所测的特质相同②两个或两个以上样本使用的是同种观测工具,所测的特质相同,但样本间水平差异较大差异系数:一种最常用的相对差异量,为标准差对平均数的百分比四相对量数1.百分位数百分位数:在整个分布中,在某一值之下或等于该值的分数的百分比,所对应的分数百分位数和百分等级是同一操作定义的两端.当我们求累计次数占总体的百分比是,所对应的分数和百分比的值分别为百分位数和百分等级.2.百分等级百分等级:常模团体中低于该分数的人所占总体的百分比百分等级一定要对应分数区间的精确上限.百分等级和百分位数都可以由已知数据用差值法求解.3.标准分数1定义标准分数:以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,也叫Z 分数离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置.2性质①Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量②一组原始分数转换得到的Z分数可正可负,所有原始分数的Z分数之和为零③原始数据的Z分数的标准差为1④若原始分数呈正态分布,则转换得到的所有Z分数均值为0,标准差为1的标准正态分布3优点①可比性——不同性质的成绩,一经转换为标准分数,就可在同一背景下比较②可加性——不同性质的原始数据具有相同的参照点,因此可相加③明确性——知道了标准分数,利用分布寒暑表就能知道其百分等级④稳定性——转换成标准分数之后,规定了标准差为1,保证了不同性质分数在总分数中权重一样4应用①比较几个分属性质不同的观测值在各自数据分布中相对位置的高低②计算不同质的观测值得总合或平均值,以表示在团体中的相对位置③若标准分数中有小数、负数等不易被人接受的问题,可通过 Z'=aZ+b 的线性公式将其转化成新的分数如韦氏成人智力量表五相关量数由于实验法适用范围的限制,有的时候我们只能对变量间进行相关研究,也就是看两者是否有互相跟随的变化关系.相关研究所得到的是一种描述统计,我们仅仅能用其描述两个变量互相跟随的程度大小,至于他们之间是否有因果关系或者是共变关系则不可妄下定论.相关系数:两列变量间相关程度的数字表现形式作为样本的统计量用r表示,作为总体参数一般用ρ表示.正相关:两列变量变动方向相同负相关:两列变量中有一列变量变动时,另一列变量呈现出与前一列变量方向相反的变动零相关:两列变量之间没有关系,各自按照自己的规律或无规律变化1.积差相关也就是Pearson相关.1前提①数据要成对出现,即若干个体中每个个体都有两种不同的观测值,并且每队数据与其它对子相互独立②两列变量各自总体的分布都是正态的,至少接近正态③两个相关的变量是连续变量,也即两列数据都是测量数据④两列变量之间的关系应是直线性的2公式r也就等于X和Y共同变化的程度除以X和Y各自变化的程度.2.等级相关也就是Spearman相关1适用范围①当研究考察的变量为顺序型数据时,若原始数据为等比货等距,则先转化为顺序型数据②当研究考察的变量为非线性数据时2公式将原始数据转化为顺序型数据,仍然用Pearson相关公式计算即可.3.肯德尔等级相关1肯德尔W系数也叫肯德尔和谐系数,原始数据资料的获得一般采用等级评定法,即让K个被试对N件实物进行等级评定.其原理是评价者评价的一致性除以最大变异可能性.代表评价对象获得的K个等级之和RiN代表等级评定的对象的树木K代表等级评定者的数目2肯德尔U系数其与肯德尔W系数所处理的问题相同,但评价者采用对偶比较法,即将N件事物两两配对分别进行比较为对偶比较记录表中i>j格中的择优分数rij4.点二列相关与二列相关1点二列相关适用于一列数据为等距正态变量,另一列为离散型二分变量.X是与二分称名变量的一个值对应的连续变量的平均数pX是与二分称名变量的另一个值对应的连续变量的平均数qp与q是二分称名变量两个值各自所占的比率s是连续变量的标准差t2二列相关适用于两列变量都是正态等距变量,但其中一列变量被人为地分成两类.y为标准正态曲线中p值对应的高度,查正态分布表能得到5.Ф相关适用于两个变量都是只有两个点值或只表示某些质的属性.其中a、b、c、d分别为四格表中左上、右上、左下、右下的数据二、推断统计推论统计就是指运用一系列的数学方法,将从样本数据中获得的结果推广到样本所在的总体.进行推论统计的关键在于所抽取的样本要能够尽量接近所要研究的总体.一推断统计的数学基础1.概率概率:表明随即时间出现可能性大小的客观指标概率的定义包含以下两种,当观测次数够多时他们是相等的.后验概率:对随机事件进行n次观察,某一事件A出现的次数m与观测次数n的比值在n趋近无穷时所稳定在的常数p先验概率:在满足试验可能结果数有限且每一种结果出现的可能性相等的条件下,随机事件包含的结果数除以结果总数2.正态分布当样本量足够大时,我们会发现生活中许多变量的分布都近似于正态曲线,因此有“上帝偏爱正态分布”一说.1特点①正态曲线的形状就像一口挂钟,呈对称分布,其均值、中数、众数实际上对应于同一个数值②大部分的原始分数都集中分布在均值附近,极端值相对而言比较少③曲线两端向靠近横轴处不断延伸,但始终不会与横轴向交④正态分布曲线转化为z分数后人以z分数与零点对应曲线下面积固定2用法①依据Z分数求概率,即已知标准分数求面积②从概率求Z分数,即从面积求标准分数值③已知概率或Z值,求概率密度,即正态曲线的高3.二项分布二项分布:对于一个事件有两种可能A和B,但我们对这一事件观察n次,事件A发生的总次数的概率分布就是二项分布μ=二项分布的均值为pnσ=方差公式为2npq标准差的公式为σ=4.抽样原理与抽样方法1抽样原理抽样的基本原则是随机性原则,所谓随机性原则,是指在进行抽样时,总体中每一个个体是否被抽选的概率完全均等.由于随机抽样使每个个体有同等机会被抽取,因而有相当大的可能使样本保持和总体有相同的结构,或者说,具有最大的可能使总体的某些特征在样本中得以发现,从而保证由样本推论总体.2抽样方法①简单随机取样法②系统随机取样法③分层随机取样法④多段随机取样法5.抽样分布样本分布:样本统计量的分布,是统计推论的重要依据1正态分布及渐近正态分布样本统计量为正态分布或者接近正态分布的情况都可根据正态分布的概率进行统计推论.总体分为正态或接近正态,方差已知,样本平均数和方差的分布为正态分布①样本平均数分布的平均数和方差与母体的平均数和方差有如下关系:②样本的方差及标准差的分布也渐趋于正态分布,其分布的平均数与标准差和总体有如下关系:2t 分布t 分布是一种与方差无关而与自由度有关的分布,很类似正态分布,我们可以将正态分布看作t 分布当自由度为正无穷时的特例.总体分布为正态,方差未知时,样本平均数的分布为t 分布:X σ= 其中1n s -= 3χ2分布χ2分布的构造是从一个服从正态分布的总体中每次抽去n 个随机变量,计算其平方和之后标准化的一个分布.分布曲线下的面积都是1,但伴随着n 取值的不同,自由度改变,曲线分布形状不同,而当自由度趋近于正无穷时χ2分布即为正态分布,因此其于t 分布一样都是一族分布,而正态分布都是其中的特例.4F 分布如果有两个正态分布的总体,我们从其中各自取出两个样本,各自计算出χ2,则: 更多情况下,我们所计算的F 两样本取自相同总体,此时可将上式化简为:二参数估计当在研究中从样本获得一组数据后,如何通过这组信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,称为总体参数估计.总体参数估计问题可以分为点估计与区间估计.1.点估计、区间估计与标准误良好估计量的标准①无偏性——用多个样本的统计量估计总体参数的估计值,其偏差的平均数为零②有效性——当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好③一致性——当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数④充分性——样本的统计量是否充分地反映了全部n个数据所反映总体的信息点估计:用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计结果也以一个点的数值表示区间估计:根据估计量以一定可靠程度推断总体参数所在的区间范围,这个区间就叫做置信区间,相应的概率成为置信度,这两个量是共通变化的,置信区间越大,置信度越高;区间估计是用数轴上的一段距离表示未知参数可能落入的范围及落入该范围的概率.标准误:样本平均数分布的标准差总体方差未知时用估算的总体方差计算标准误.2.总体平均数的估计当总体方差未知时,则使用t分布对应置信度3.标准差与方差的区间估计1标准差的区间估计2方差的区间估计三假设检验可以说,每一个实验的存在,仅仅是为了给事实一个反驳虚无假设的机会. ——1.假设检验的原理假设检验:统计学中的一种推论过程,通过样本统计量得出的差异作为一般性结论,判断总体参数之间是否存在差异假设检验的实质是对可置信性的评价,是对一个不确定问题的决策过程,其结果在一定概率上正确的,而不是全部.1两类假设对于任何一种研究而言,其结果无外乎有两种可能,即是否符合我们预期.一般来说证伪一件事情比证实一件事容易,在行为科学的研究中,由于我们无法了解总体中除样本以外的个体情况,因此尝试拒绝虚无假设的方法优于证明备择假设.备则假设:因变量的变化、差异却是是由于自变量的作用往往是我们对研究结果的预期,用H1表示.虚无假设:实际上什么也没有发生,我们所预计的改变、差异、处理效果都不存在观察到的差异只是随机误差在起作用,用H0表示.2小概率原理小概率原理:小概率事件在一次试验中几乎是不可能发生的至于什么就算小概率事件,那就是我们在计算前明确的决策标准,也就是显着性水平α.在检验过程中,我们假设虚无假设是真实的,同时计算出观测到的差异完全是由于随机误差所致的概率.之后将其与我们实现界定好的显着性水平比较,从而考虑是否依据小概率原理来拒绝虚无假设.3两类错误本部分内容请参照实心信号检测论对照来看. ——MJ注Ⅰ型错误:当虚无假设正确时,我们拒绝了它所犯的错误,也叫α错误研究者得出了处理有效果的结论,而实际上并没有效果,即所谓“无中生有”Ⅱ型错误:当虚无假设是错误的时候,我们没有拒绝所犯的错误,也叫β错误假设检验未能侦查到实际存在的处理效应,即所谓“失之交臂”两类检验的关系①α+β不一定等于1②在其他条件不变的情况下,α与β不可能同时减小或增大4检验的方向性单侧检验:强调某一方向的检验,显着性的百分等级为α双侧检验:只强调差异不强调方向性的检验,显着性百分等级为α/2对于同样的显着性标准,在某一方向上,单侧检验的临界区域要大于双侧检验,因此如果差异发生在该方向,单侧检验犯β错误的概率较小,我们也说它的检验效力更高.5假设检验的步骤①根据问题要求,提出虚无假设和备择假设②选择适当的检验统计量③确定检验的方向性并规定显着性水平④计算检验统计量的值⑤将统计量的值与临界值对比做出决策2.样本与总体平均数差异的检验1总体正态分布且方差已知obs X X z μσ-=其中X σ=0μ和0σ分别为总体的平均数和方差2总体正态分布而方差未知0obs X X t s μ-=其中X s =S =S 为用样本和方估算出的总体方差3.两样本平均数差异的检验12obs obs D X X X Z t σ-==这是两样本平均数检验的通用公式,所不同的仅在于标准误的计算1总体方差已知①独立样本②相关样本D X σ=r 为两组变量之间的相关系数2总体方差未知①独立样本方差差异不显着时②相关样本a.相关系数未知:D X σ=其中d 为每一对对应数据之差b.相关系数已知:D X σ=4.方差齐性检验1样本方差与总体方差当从正态分布的总体中随机抽取容量为n 的样本时,其样本方差与总体方差比值服从χ2分布:2220ns χσ=由自由度1df n =-查χ2表,依据显着性水平判断2两个样本方差之间①独立样本22s F s =大小其中当两样本自由度相差不大时可用n s 代替n-1s查表时11221,1df n df n =-=-②相关样本22t =其中2df n =-5.相关系数的显着性检验①积差相关a.当ρ=0时:t =其中2df n =-b.当ρ≠0时:先通过查表将r 和ρ转化为费舍Z r 和Z ρ然后进行Z 检验②等级相关和肯德尔W 系数在总体相关系数为零时:查各自的相关系数表,判定样本相关显着四方差分析1.方差分析的原理与基本过程1方差分析的概念方差分析的目的是推断多组资料的总体均数是否相同,也即检验多组数据之间的均数差异是否有统计意义.当我们用多个t 检验来完成这一过程时,相当于从t 分布中随机抽取多个t 值,这样落在临界范围之外的可能大大增加,从而增加了Ⅰ型错误的概率.我们可以把方差分析看作t 检验的增强版.2方差的可分解性方差分析依据的基本原理就是方差的可加性原则.作为一种统计方法,方差分析把实验数据的总变异分解为若干个不同来源的分量.数据的变异由两部分组成:组内变异:由于实验中一些希望加以控制的非实验因素和一些未被有效控制的未知因素造成的变异,如个体差异、随机误差组内变异是具体某一个处理水平之内的,因此在对总体变异进行估计的时候不涉及研究的处理效应.组间差异:不仅包括组内变异的误差因素,还包括了是不同组所接受的实验处理不同造成的影响如果研究数据的总变异是由处理效应造成的,那么组间变异在总变异中应该占较大比例.B MS 表示组间方差,B B B SS MS df =,1B df k =-,k 表示实验条件的个数 W MS 表示组内方差,W W WSS MS df =,()1W df k n =-,n 表示每种实验条件中的被试个数 3方差分析的基本假定①样本必须来自正态分布的总体②每次观察得到的几组数据必须彼此独立③各实验处理内的方差应彼此无显着差异为了满足这一假定,我们可采用最大F 比率法2max max2min s F s =,求出各样本中方差最大值与最小值的比,通过查表判断.4方差分析的基本步骤Ⅰ 求平方和①总平方和是所有观测值与总平均数的离差的平方总和 ()22T G SS X N =-∑其中G 表示所有数据的总合,N 表示总共的数据个数。

心理统计学精髓知识点

心理统计学精髓知识点

第一节 正态分布1 正态分布的特点 首先,钟形对称分布其次, 1.96X μσ-≤的概率是95%; 2.58X μσ-≤的概率是99%;将1.96X μσ-≥称为决策水平0.05上的小概率事件,将2.58X μσ-≥称为决策水平0.01上的小概率事件。

其中,X 是总体中的随机抽取的一个数值;μ为总体平均值,第三,曲线两端无限靠近横轴。

2 应用(1)某学校三年级学生的平均智商是100,其标准差为15.那么,从中随机抽取一个学生,其智商大于等于130的概率是多少?其智商小于等于85的概率是多少?(2)某企业生产的产品重量均值为100,标准差为15。

质检人员从市场上随机抽取一件,发现其重量为115,仅从质量上看,如何用统计学视角来判断此产品是否属于这一企业(决策水平为0.05)。

(3)在上题中,如果质检人员从市场上发现一个产品的重量为140,那么,仅从质量上判断,此产品是否属于这一企业(决策水平为0.01)。

3 数据处理一让学生报告自己的身高、体重以及自己的肥胖感知(我认为自己很肥胖)、以及自己的性别。

数据处理任务包括:报告三个变量的茎叶图,并大致判断其分布形态;报告三个变量的平均值、中数以及中位数、标准差。

第二节 标准正态分布将总体的平均值记为μ,标准差记为σ,将其中的数据或个案记为X 。

那么,使用公式X z μσ-=,就可以将正态分布转化为标准正态分布。

标准正态分布是正态分布的一个特例,因此,第一节的内容皆可以标准正态分布进行直译。

思考题:标准正态分布的标准差是多少?其平均值又是多少?对于标准正态分布而言, 1.96Z ≥为决策水平0.05上的小概率事件,将 2.58Z ≥为决策水平0.01上的小概率事件思考题:某地三年级学生的身高是一个总体,并且是正态分布,均值为160厘米,标准差为5厘米。

研究者随机抽取一个学生,其身高为170厘米。

那么,此生在标准正态分布中的身高数值应该为多少?这次抽到他是一个小概率事件吗?为什么?练习:将“数据处理一”中三个变量转化为标准正态分布,并报告其茎叶图。

心理统计学

心理统计学

第四章重点知识本章核心概念:1、差异量数分为:绝对差异量数和相对差异量数2、绝对差异量数:标准差:标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。

方差:标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数四分差:四分差通常用符号Q来表示,指在一个次数分配中,中间50%的次数的全距之半,也就是上四分点与下四分点之差的一半。

3、相对差异量数:差异系数:差异系数,又称变异系数、相对标准差等,使一组数据标准差与平均数的比率。

通常用符号CV表示。

4、另外,本章还讲到相对地位量数:标准分数,百分等级。

标准分数:它是一个数与平均数之差除以标准差所得的商数,它无实际单位。

百分等级:指任意分数在整个分数分布中所处的百分位置。

本章重点难点:差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。

知识要点详情:一、标准差1、概念及计算公式方差的平方根,用s或SD表示,若用σ表示,是指总体的标准差。

方差与标准差是最常用的描述次数分布离散程度的差异量数。

2、标准差的适用条件(1)与算术平均数配合使用,与算术平均数的适用条件相同。

即一组数据的一般水平适合(2)用算术平均数描述时,其离散程度宜用标准差描述;(3)计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;(4)在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。

3、标准差的计算方法(1)基本公式法(2)原始数据法(3)分组资料标准差的计算方法(4)由各部分的标准差合成总标准差的计算方法4、方差和标准差的意义方差与标准差是表示一组数据离散程度的最好的指标。

其值越大,说明离散程度大,其值小说明数据比较集中,它是统计描述与统计分析中最常应用的差异量数。

它基本具备一个良好的差异量数应具备的条件:①反应灵敏;②有一定的计算公式严密确定;③容易计算;④适合代数运算;⑤受抽样变动的影响小;⑥简单明了。

《心理统计学》重要知识点

《心理统计学》重要知识点

《心理统计学》重要知识点《心理统计学》重要知识点第二章统计图表简单次数分布表的编制:Excel数据透视表列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel数据透视表直方图(histogram):直观描述连续变量分组次数分布情况,可用Excel图表向导的柱形图来绘制散点图(Scatter plot):主要用于直观描述两个连续性变量的关系状况和变化趋向。

条形图(Bar chart):用于直观描述称名数据、类别数据、等级数据的次数分布情况。

简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。

复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。

圆形图(circle graph)、饼图(pie graph):用于直观描述类别数据或等级数据的分布情况。

线形图(line graph):用于直观描述不同时期的发展成就的变化趋势;第三章集中量数● 集中趋势和离中趋势是数据分布的两个基本特征。

● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。

● 集中量数:描述数据分布集中趋势的统计量数。

● 离中趋势:是指数据分布中数据分散的程度。

● 差异量数:描述数据分布离中趋势(离散程度)的统计量数● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d )1.算术平均数(简称平均数,M 、X 、Y ):n x X i∑= Excel 统计函数AVERAGE算术平均数的重要特性:(1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i(2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后,那么,变量Y 的平均数X b a Y +=2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。

中位数上下的数据出现次数各占50%。

3.众数(mode ,M O ):一组数据中出现次数最多的数据。

4.算术平均数、中数、众数之间的关系。

《心理学统计学》精讲sukr

《心理学统计学》精讲sukr

总体(population)研究对象的全体,由个体构成
个体(elements)构成总体的基本单位,是搜集数据的直接对象
样本(sample)总体的一个子集 数据(data)被搜集、分析和解释的事实与数字 统计量(statistic)从样本数据中计算出来的数 参数(parameter)对应于总体的常数
93-98
98-103 103-108 108-113 113-118
10
6 2 0 1
二 百 只 灯 泡 使 用 小 时 数 组 距 频 数 分 布 表
数值型数据的图表描述
某地一星期申请结婚女性年龄频数盒形图(box plot)
下四分 位 数
上四分 位 数
1.5S
盒形图与点线 图的刻度相同
最 小 数 值
《心理学统计学》精讲sukr
统计方法
描述统计 推断统计
参数估计
假设检验
一、描述统计基础
总体、样本与个体
⒈在一个特定的研究中,通常研究对象包括大量 的个体,这些个体的集合就是总体(Populition)。 ⒉出于经费、时间等方面的考虑,通常只能从研 究对象中的一小部分个体中收集数据,这一小部分个 体的集合就是样本( Sample )。样本是总体的一个 子集,也称为子样。 ⒊构成总体和样本的个体( Elements )是我们 要从中收集数据的实体,也称为总体单位或样本单位。
定序变量
数值型变量
定类型与 数值型
定类型与 定类型
定序型与 定序型
数值型与 数值型
数值型与 定序型
方差 分析
列联 分析
秩的 方法
回归 分析
逻辑斯 蒂分析
多变量:主成分分析、因子分析等
16

统计心理学知识点

统计心理学知识点

统计心理学知识点统计心理学是研究心理学中统计分析方法的应用和心理学实验设计的领域。

它不仅在心理学研究中扮演重要角色,也在其他社会科学领域中发挥着关键作用。

本文将介绍统计心理学的几个重要知识点,包括样本与总体、描述统计学、推论统计学、假设检验和效应量。

一、样本与总体在统计心理学中,样本和总体是非常重要的概念。

样本是从总体中抽取的一部分个体或观察对象,而总体则代表着研究者所关注的整体群体。

研究者通过对样本的研究来推断总体的特征。

样本的选择要具有代表性,以确保研究结果的泛化性。

二、描述统计学描述统计学是统计心理学中的一个分支,用于对数据进行整理、总结和描述。

通过平均数、标准差、频率分布等统计指标,可以对数据的中心趋势、离散程度和分布形状进行描述。

常用的描述统计学方法包括频数分析、描述性统计量和图表分析。

三、推论统计学推论统计学是利用样本数据推断总体特征的统计方法。

它基于概率理论,通过对样本数据的分析来进行统计推断。

推论统计学可以帮助研究者判断研究结果的可靠性和统计显著性,从而做出更准确的结论。

四、假设检验假设检验是推论统计学中的一个重要方法,用于检验研究假设的有效性。

研究者会提出原假设和备择假设,然后基于样本数据进行统计推断,判断原假设是否应该被接受或拒绝。

常用的假设检验方法包括t 检验、方差分析和卡方检验等。

五、效应量效应量是衡量研究中效果大小或关联强度的指标。

它可以帮助研究者判断实验结果的实际重要性。

常用的效应量指标包括Cohen's d、相关系数和回归系数等。

理解和解释效应量有助于更全面地评价研究结果和实验设计的合理性。

总结:统计心理学是研究心理学中统计分析方法的应用和心理学实验设计的领域。

对于从样本到总体的推断、数据的整理和总结、假设的检验以及效应量的评价,都是统计心理学中重要的知识点。

熟练掌握这些知识点可以帮助研究者更准确地分析和解读研究结果,提高心理学研究的科学性和可靠性。

心理统计学(全套课件)

心理统计学(全套课件)

心理统计学(全套课件)第一部分:心理统计学导论一、引言心理统计学是心理学研究中的重要工具,它帮助我们从大量数据中提取有意义的信息,以便更好地理解人类行为和心理过程。

本课程将介绍心理统计学的基本概念、原理和方法,以及如何运用这些工具来分析心理学数据。

二、心理统计学的基本概念1. 变量:在心理学研究中,变量是指可以被测量的特征或属性。

变量可以分为连续变量和离散变量,以及自变量和因变量。

2. 数据:数据是变量的具体值,可以是数值型数据或非数值型数据。

3. 样本与总体:样本是从总体中抽取的一部分个体,而总体是所有可能个体的集合。

4. 随机抽样:随机抽样是从总体中随机抽取样本的过程,以确保样本能够代表总体。

三、描述性统计1. 频数分布:频数分布是描述数据分布情况的一种方法,它显示了每个数值或数值区间出现的次数。

2. 集中趋势:集中趋势是指数据分布的中心位置,常用的指标有均值、中位数和众数。

3. 离散程度:离散程度是指数据分布的分散程度,常用的指标有方差、标准差和变异系数。

四、推断性统计1. 概率与概率分布:概率是描述事件发生可能性大小的数值,概率分布是描述随机变量取值的概率分布情况。

2. 假设检验:假设检验是通过对样本数据进行统计分析,来判断总体参数是否符合某种假设的方法。

3. 参数估计:参数估计是通过对样本数据进行统计分析,来估计总体参数的方法。

五、心理统计学软件1. SPSS:SPSS是一种常用的心理统计学软件,它提供了丰富的数据分析功能,包括描述性统计、推断性统计、数据管理等功能。

2. R语言:R语言是一种开源的统计编程语言,它提供了强大的数据分析功能,包括数据可视化、机器学习等功能。

心理统计学是心理学研究中的重要工具,它帮助我们从大量数据中提取有意义的信息,以便更好地理解人类行为和心理过程。

本课程将介绍心理统计学的基本概念、原理和方法,以及如何运用这些工具来分析心理学数据。

通过学习本课程,学生将能够掌握心理统计学的基本知识和技能,为今后的心理学研究打下坚实的基础。

心理统计学知识点完整版资料整理

心理统计学知识点完整版资料整理

1描述统计:主要研究如何让整理心理与教育科学实验或调查得来的大量数据。

描述一组数据的全貌表达一件事物的性质。

2推论统计:主要研究如何通过局部数据提供的信息,推论总体的情形。

3连续数据:任意两个数据点之间都可以细分出无限个大小不同的数值。

4统计量:样本的那些特征值,代表样本的特性。

5参数:描述一个总体情况的统计指标,代表总体特性是一个常数。

6组限:分组区间即一个组的起点值和终点值之间的距离;组下限起点值;组下限终点值。

组限分类表述组限,精确组限散7点图:用相同大小圆点的多少或疏密表示统计资料数量大小以及变化趋势的图。

8中数:按顺序排列在一起的一组数据中居于中间位置的数。

9众数:指在次数分布中出现次数最多的那个数的数值。

10平均差:次数分布中所有原始数据平均数绝对离差的平均值。

11方差:每个数据与该组数据平均数之差乘方后的均值12标准差:方差的平方根,反应一个次数分布的离散程度13概率:用一个比值来概括某事件出现可能性大小14置信区间:指在某一置信度时,总体参数所在的区域距离或区域长度。

置信区间的上下二端点值称为置信界限。

15组内变异:由组内各被试因变量的差异范围决定的,主要指由实验误差,或组内被试之间的莪差异造成的变异。

16组间变异:由于接受不同的实验处理而造成的各组之间的变异,可以用两个平均数之间的离差表示。

两组平均差异越大,组建变异也就越大17二项分布:试验仅有两种不同性质结果的概率分布。

18样本分布:指样本统计量的分布,它是统计推论的重要依据。

19回归模型:用来表达变量之间规律的数学模型20标准分数:又称基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。

优点:可比性可加性明确性稳定性21符号检验:是以正负符号作为资料的一种非参数检验程序他是一种简单的非参数检验方法适用于检验两个配对样本分布的差异,与参数检验中配对样本差异显著性t检验相对性22事物之间的相互关系:因果关系,共变关系,相关关系r取值范围-1到123根据数据反映的测量水平将数据分类称名数据、顺序数据、等距数据、比率数据是否具有连续性离散数据、连续性数据24算数平均数的使用原则:同质性原则,平均数与个体数值相结合的原则,平均数与标准差、方差相结合的原则。

心理统计学常用概念总结

心理统计学常用概念总结

1.描述统计:是对成组数据概括的描述。

描述统计的指标有三类:数据的集中趋势,数据的离中趋势,数据间的相关。

2.推论统计:方法包括从样本的数量特性推测总体数量特性的一系列问题:推论假设,推论的各种方法和步骤,以及检验推测可靠性的各种方法。

3.组距:每一组上限和下限的差。

(组距习惯上常用2,3,5,10,20)4.中点:在某一组的下限和上限当中的那一点。

5.集中趋势:是代表一系列数据的典型水平的数字指标,代表集中趋势的指标有平均数,中数和众数。

6.平均数(x):是一组数据总和的平均值。

7.中数(mdn):一系列按大小顺序排列的数据中的一个点,在这个系列中有一半数据在这个点以上,有一半数据在这个点以下。

8.众数(mo):在一系列数据中出现次数最多的那个数。

9.全距:一个分布中最大的数值的上限减去最小数值的下限,就得到全距。

(全距大,说明这组数据分散;全距小,则较集中。

使用时注意:1、无极端值;2、比较两个分布的全距时,当两个分布所包含数据的数目相等或差不多时才能使用)10.离中趋势:是表示一组数据分散程度的指标,常用的指标有:全距,四分差,平均差和标准差。

(如果离中趋势很小,说明数据分布都在平均数附近变动,因此平均数的代表性很大;如果离中趋势太大,说明数据分布太分散)11.四分差(q):是数据的离中趋势的指标之一,四分差说明按大小顺序排列的一系列数据中间50%个数据的分散程度。

(如果一个分布中间部分的数据比较集中,则两个四分点q3与q1就离得近些,q的值就小些。

)12.百分点:某次数分布中处于某百分等级的数值。

13.百分等级:某数值在某次数分布中所处的位置。

14.平均差(ad):一个分布中每个变量和平均数的差的绝对值的平均值。

15.标准差:s2开方后的正值就叫标准差,是数据的离中趋势的指标之一。

16.离中系数(cv):用相对量来表示数据分散程度的数字指标。

17.相关程度:指相关是否密切,可分为无相关;部分相关;完全相关。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《心理统计学》重要知识点第二章 统计图表简单次数分布表的编制:Excel 数据透视表列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。

条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。

简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。

复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。

圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。

线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势;第三章 集中量数● 集中趋势和离中趋势是数据分布的两个基本特征。

● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。

● 集中量数:描述数据分布集中趋势的统计量数。

● 离中趋势:是指数据分布中数据分散的程度。

● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):nx X i∑= Excel 统计函数AVERAGE算术平均数的重要特性:(1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i(2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后,那么,变量Y 2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。

中位数上下的数据出现次数各占50%。

3.众数(mode ,M O ):一组数据中出现次数最多的数据。

4.算术平均数、中数、众数之间的关系。

5.加权平均数:iii n n n w w w x w w w w x w x w x M ∑∑=++++++=2122116.调和平均数(harmonic mean ,M H ):一组数值倒数的平均数的倒数。

∑=+⋅⋅⋅++=inH xnn x x x M 1)111(121 Excel 统计函数HARMEAN (1)用于描述同一个体(或一组个体)不同时间段的平均学习速度、平均工作效率。

(2)用于描述不同能力水平个体的平均学习速度、平均工作效率。

7.几何平均数(geometric mean ,Mg )是指n 个观察值连乘积的n 次方根.(1)一组数据中少部分偏大(或偏小),数据分布呈偏态时,几何平均数比算术平均数更能反映数据的集中趋势。

n n g x x x M ⨯⨯= 21 Excel 统计函数GEOMEAN(2)用于计算平均学习进步速度、平均发展速度(平均发展倍数),即环比的几何平均数。

1111342312---=⨯⨯⨯=n n n n n g x x x x x x x x x x M (n x x x 、、、 21为各个时间段的成果数据) 平均增长率:1-g M第四章 差异量数● 差异量数:描述一组数据离散程度(离中趋势)的统计量数。

差异量数较大,说明数据分布得比较分散,数据之间的差异较大;差异量数较小,说明数据分布的比较集中,数据间的差异较小。

● 差异量数还能反映平均数对一组数据的代表性。

差异量数越小,平均数的代表性越好;差异量数越大,平均数的代表性越差。

● 常用的差异量数是标准差、方差、差异系数标准差s :n X X s i 2)(∑-=Excel 统计函数STDEVP (给定样本总体的标准偏差)标准差s n-1:1)(21--=∑-n X X s i n Excel 统计函数STDEV (给定样本的标准偏差)方差2s :nX X s i 22)(∑-=Excel 统计函数VARP (给定样本总体的方差)方差21-n s:1)(221--=∑-n X X s i n Excel 统计函数VAR (给定样本的方差) 差异系数(又称变异系数、离散系数、相对标准差):XSCV =(1)用于比较不同观测工具测量结果(数据单位不同)的离散程度,例如,身高离散程度大,还是体重离散程度大?(2)用于比较用同一观测工具测得的、均数差异较大的不同样本数据的离散程度。

例如:7岁组儿童和13组岁儿童的体重离散程度,哪个较大?● 标准差的重要特性:如果变量X 的标准差为X S ,将变量X 按照公式bx a y +=转换为Y 变量后,那么,变量Y 的标准差X Y bS S =● 相对位置量数:反映个体(数据)在团体中相对位置的统计量数。

主要有标准分数及其线性转换分数(Z 分数、T 分数)、百分等级(PR)、正态化标准分数等。

1.标准分数的计算与应用:S X X Z i -=或:σμ-=i X Z , 5010+=Z T ,500100+=Z CEEBZ 分数的特点:Z 分数的平均数为0,即0=Z μ,标准差为1,即1Z =σ T 分数的平均数50T =μ,标准差为10T =σCEEB 分数的平均数=___________?,标准差=__________?(1)可用于比较个体各方面水平高低(横向比较,个体内差异评价)。

(2)对被试多方面的测量结果进行综合,如对高考各科成绩的综合,各分测验分数的综合。

(3)可用于对个体或样组某方面水平进行前后比较(纵向比较),判断其水平是提高了,退步了,还是没有变化。

2.原始分数X 的百分等级的含义与计算根据简单次数分布表计算:1005.0⨯+=NF f PR bX 根据分组次数分布表计算:100⨯+∙-=NF f i L X PR b bX第五章 相关关系● 相关关系的描述方法(1)相关散点图:适用于直观描述两个连续性数值变量(等距数据、比率数据)之间的关系。

可用Excel 图表向导中的“XY 散点图”绘制。

(2)双向次数分布表(交叉表、列联表):适用于描述两个等级变量(或称名变量、类别变量)之间的关系。

可用Excel 数据透视表编制列联表)。

(3)相关系数(相关关系的特征值)。

● 相关系数:描述两个变量相关关系的统计量数,在-1.00~1.00之间取值,绝对值越大,越接近1,说明两个变量之间的关系程度越密切;绝对值越小,越接近0,说明两个变量的关系程度越低。

● 常用的相关系数: 1.积差相关:yx i i s ns y y x x r ∑--=))(( Excel 统计函数CORREL适用条件:(1)X 、Y 两个变量都是连续性变量(等距数据或比率数据);(2)X 、Y 两个变量总体上为正态分布或接近正态分布。

2.斯皮尔曼等级相关:是一对(两列)名次变量的积差相关。

对数据变量的分布形态没有要求。

(1)等级积差相关法(名次积差相关法)。

YX R R Y Y X X R S NS R R R R r ))((--∑=Excel 统计函数CORREL公式中的R X 和R Y 是分别代表两变量中每个数据在变量中的名次。

(2)等级差数法(名次差数法)。

如果每个等级(即名次)变量中没有相同的等级名次,可用下面公式计算:等级差数法简化公式:)1(6122-∑-=N N D r R 如果等级(即名次)变量中有相同的等级名次,需用下面校正公式计算: 等级差数法校正公式:))((222222y x D y x r RC ∑∑∙∑-∑+∑=,2x ∑、2y ∑计算方法参见教材125页3.肯德尔W 系数(肯德尔和谐系数):描述多个名次变量一致性程度的统计量数。

适用于描述和分析不同评价者(如主考、阅卷者)对同一组个体(考生或答卷)评价结果(名次)的一致性程度,在心理测量与教育评价中称为评分信度。

例如,5位阅卷老师对10篇论文评分排名的一致性。

如果评价者给出的不是个体的水平名次,而是分数(或等第、符号),可先将其转换成名次,然后再计算W 系数。

)(121)(3222N N K N R R W i i --=∑∑ 校正公式:∑∑∑---=T N N K N R R W i i )(121)(3222∑∑-=12)1(2n n T 公式中:n 为每个名次变量中相同名次的数目。

4.点二列相关(point-biserial correlation ):用于描述一列续性变量和一列真正二分变量(或非正态二分变量)之间的相关。

真正二变量:指按某种性质或标准将个体划分为两种结果的变量,如对、错,男、女等。

pq s X X r tqp pb ∙-=Excel 统计函数CORREL5.二列相关(biserial correlation):用于描述由一个正态连续变量人为划分成的二分变量与另外一个正态连续变量之间的相关。

或者说,用于描述一正态二分变量与一正态连续变量之间的相关。

人为二分变量?是指由连续变量转换而来的二分变量,例如,将测验或考试分数区分为及格和不及格,80分以上和80分以下;按中考(或高考)成绩,将考生区分为录取、未录取。

正态二分变量?如果二分变量是根据正态连续变量转换而来,那么,可称之为正态二分变量。

y 为将正态分布面积画分为p 、q 两部分的纵线的高度。

y 的计算方法:利用Excel 统计函数计算标准正态分布区间点函数NORMSINV(p 值) →区间点Z 值 正态分布函数NORMDIST(区间点Z 值,0,1,0) →Z 值的概率密度y 6.Φ相关(Φ系数):))()()((||d b c a d c b a bc ad r ++++-=Φ用于描述两个真正二分变量的相关程度,也用于描述一个人为二分变量和真正二分变量的相关。

注意:Φ相关计算公式是由皮尔逊积差相关计算公式转换来的。

因此,如果两列二分变量转换为0、1(或1、2)的数值变量时,可以用Excel 统计函数CORREL 计算Φ系数。

第六章 概率分布1.正态分布的特征(见教材)2.Excel 软件中正态分布函数和正态分布区间点函数的应用◆标准正态分布函数NORMSDIST 的应用:(1)P(Z <1.96)=? =NORMSDIST(1.96)=0.9750 (2)P(Z >1.96)=? =1-NORMSDIST(1.96)=0.0250(3)P(-1.5<X <2.5)=? =NORMSDIST(2.5)-NORMSDIST(-1.5)=0.9270 ◆正态分布函数NORMDIST 的应用例如:已知某次测验的分数呈正态分布,平均分为75分,标准差为10分,试计算: (1)低于80分的考生占多大比例,P(X <80分)=? (2)80分以上的考生占多大比例,P(X ≥80分)=?(3)80分以上,低于90分的考生占多大比例,P(80≤X <90)=? P(X <80分):“=NORMDIST (79.5,75,10,1)”=0.6736 P(X ≥80分):“=1-NORMDIST (79.5,75,10,1)”=0.3264P(80≤X <90):“=NORMDIST (89.5,75,10,1)-NORMDIST (79.5,75,10,1)”=0.2528 ◆标准正态分布区间点函数NORMSINV 的应用根据给定的向上累积概率P(Z<a),标准正态分布的临界值a=? a=NORMSINV(p 值) 例如:P(Z<a)=0.90 =NORMSINV(0.90)= 1.28,a= 1.28,P(Z >1.28)=0.10 ◆正态分布区间点函数NORMINV 的应用根据正态变量X 的平均数、标准差和向上累积概率P(X<a),计算临界值a=?例:已知某次大规模招聘考试分数呈正态分布,平均分为55分,标准差为12分。

相关文档
最新文档