心理统计学名词解释
现代心理与教育统计学名词解释
1参数估计:指对参数模型下的估计。
2统计误差:误差是测得值与真值之间的差值,统计误差归纳起来可分为两类:测量误差与抽样误差。
3 抽样分布:是从同一总体内抽取的不同样本的统计量的概率分布。
4 二项分布:是指试验仅有两种不同性质结果的概率分布。
5 区间估计:以样本统计量的抽样分布(概率分布)为理论依据,按一定概率的要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。
6 无偏估计:如果一切可能个样本统计量的值与总体参数值偏差的平均值为0,这种统计量就是总体参数的无偏估计量。
7 标准误:标准偏差反映的是个体观察值的变异,标准误反映的是样本均数之间的变异,标准误不是标准差,是样本平均数的标准差。
8 符号检验:是以正负符号作为资料的一种非参数检验程序。
适用于检验两个配对样本分布的差异。
9 符号等级检验(符号秩和检验) :是比符号检验法精确度高一些的另一种非参数检验方法⑴.小样本情况当样本容量n≤25时,用查表法进行符号等级检验: ①.提出假设:H0:P (X1>X2)=P(X1<X2) ②.求差数的绝对值③.编秩次(赋予每一对数据差数的绝对值等级数)。
④.添符号(给每一对数据差数的等级分数添符号)⑤.求等级和(分正、负求等级和,将小的记为T)⑥.查符号等级检验表,做出统计决断。
⑵.大样本情况(n>25) 当样本容量n>25时,二项分布接近于正态分布。
10 秩和检验:是通过数字大小依次排列秩次,求秩次之和来进行假设检验的方法。
11方差分析:方差分析作为一种统计方法,是把实验数据的总变异分解为若干个不同来源的分量。
因而它所依据的基本原理是变异的可加性。
12 等级方差分析:在进行非参数的方差分析时,针对不同的设计也有不同的方法,而大多数都需要将原始数据转换成等级,因此非参数方差分析又统称等级方差分析。
13 非参数检验:是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。
心理统计学知识点完整版资料整理
心理统计学知识点完整版资料整理1.数据的概念:在心理统计学中,数据是指信息的收集和组织形式。
数据可以是数字,也可以是文字或符号。
数据的收集可以通过实验、调查、观察等方式进行。
2.数据的分布:在心理统计学中,数据的分布是指通过统计方法和图表来展示数据的特征和规律。
常用的数据分布包括正态分布、偏态分布、均匀分布等。
3.描述性统计:描述性统计是用来描述和总结数据的方法。
常见的描述性统计包括均值、中位数、众数、标准差、变异系数等。
4.推论统计:推论统计是根据样本数据来对总体进行推断的方法。
推论统计主要包括参数估计和假设检验两个方面。
5.参数估计:参数估计是用样本数据来估计总体参数的值。
常见的参数估计方法包括点估计和区间估计。
6.假设检验:假设检验是用来判断总体参数是否满足一些假设的方法。
其中包括设置原假设和备择假设、选择显著性水平、计算统计量、确定拒绝域等步骤。
7.相关分析:相关分析用来研究两个或多个变量之间的关系。
其中最常用的是皮尔逊相关系数,可以用来衡量变量之间的线性相关程度。
8.回归分析:回归分析用来研究一个或多个自变量和因变量之间的关系。
通过回归分析可以得到回归方程,进而预测因变量的值。
9.方差分析:方差分析是一种用来研究多个样本之间差异的方法。
方差分析可以判断不同组之间的均值是否存在显著差异。
10.非参数统计:非参数统计是一种不依赖于总体参数的方法。
非参数统计主要包括秩次统计和分布自由度较小的统计方法。
11.实验设计:实验设计在心理统计学中扮演着重要的角色。
良好的实验设计可以保证实验的可靠性和有效性,并排除干扰因素。
12.抽样方法:抽样方法是指如何从总体中选取样本的方法。
常见的抽样方法包括随机抽样、系统抽样、整群抽样等。
以上是心理统计学的一些主要知识点的简要整理。
了解这些知识点可以帮助我们更好地理解和应用统计方法来分析心理学中的数据。
当然,心理统计学的内容还非常广泛,还有更多的知识点值得深入学习和研究。
心理统计学概述
心理统计学概述心理统计学是统计学方法在心理学以及教育学测量领域的应用统计学分支。
它的目的是测量人的能力、知识、态度、性格特征等,并且发展相应的工具心理统计学是心理学研究的有效工具之一。
心理学发展的历史证明,科学心理学离不开科学实验或调查,而心理实验或调查又必然要面临处理数字资料的问题。
例如:怎样收集资料才能使数字最有意义、最能反映所研究的课题;采用什么方法整理和分析所得数据,才能最大限度地显现这些数据所反映的信息,从而对实验或调查结果作出科学的解释;怎样才能从所得局部结果推论到总体,作出一般规律性的科学结论等等。
要解决这些问题就必须依靠科学的统计方法。
心理统计学与教育统计学、生物统计学、医学统计学等相似,都是数理统计学在某一学科的具体应用。
数理统计学提供了许多处理数字资料的一般方法,心理统计学则针对心理学的特点,研究如何应用这些方法去解决心理实验或调查中的数据问题,两者既有密切联系又不等同。
随着心理学的发展,必然会有更多的数理统计方法被引进心理统计学中来,这样也会促进心理统计学的发展。
心理统计学的起源与背景在心理统计学早期的理论和应用之中,重点集中在测量人的智力。
Francis Galton经常被认为是心理统计学之父。
他设计和应用了一系列的心理测试。
但是,心理统计学的起源经常和心理物理学联系到一起。
心理统计学的先驱Charles Spearman曾经从师于心理物理学家Wilhelm Wundt。
Spearman设计了测量智力的早期方法之一。
著名的心理统计学家L.L.Thurstone曾经发展了后来被称为比较判断法则的测量方法,这个方法被认为和由Ernst Heinrich Weber与Gustav Fechner这两位心理物理学家所发明的测量方法有紧密联系。
他们所发展的统计测量方法现在也在心理统计学界广泛应用。
近几十年,心理统计学被广泛应用于测量人的性格、态度和信仰、教育产出、以及健康相关的领域。
心理统计学各定义
标准差应用于投资上,可作为量度回报稳定性的指标。
标准差数值越大,代表回报远离过去平均数值,回报较不稳定故风险越高。
相反,标准差数值越小,代表回报较为稳定,风险亦较小。
标准差的定义及简易计算公式标准计算公式假设有一组数值(皆为实数),其平均值为:.此组数值的标准差为:.简化计算公式上述公式可以变换为一个较简单的公式:上述代数变换的过程如下:随机变量的标准差计算公式一随机变量X的标准差定义为:.须注意并非所有随机变量都具有标准差,因为有些随机变量不存在期望值。
如果随机变量X 为具有相同机率,则可用上述公式计算标准差。
样本标准差在真实世界中,除非在某些特殊情况下,找到一个总体的真实的标准差是不现实的。
大多数情况下,总体标准差是通过随机抽取一定量的样本并计算样本标准差估计的。
从一大组数值当中取出一样本数值组合,常定义其样本标准差:样本方差s2是对总体方差σ2的无偏估计。
s中分母为n - 1 是因为的自由度为n− 1 ,这是由于存在约束条件。
连续随机变量的标准差计算公式概率密度为p(x) 的连续随机变量x的标准差是:其中标准差的性质对于常数c和随机变量X和Y:σ(X + c) = σ(X)其中:cov(X,Y) 表示随机变量X和Y的协方差。
范例这里示范如何计算一组数的标准差。
例如一群孩童年龄的数值为 { 5, 6, 8, 9 } :第一步,计算平均值︰n = 4 (因为集合里有 4 个数),分别设为:用4 取代N此为平均值。
第二步,计算标准差︰用4 取代N用7 取代此为标准差。
正态分布的规则深蓝区域是距平均值小于一个标准差之内的数值范围。
在正态分布中,此范围所占比率为全部数值之 68% 。
根据正态分布,两个标准差之内(深蓝,蓝)的比率合起来为 95% 。
根据正态分布,三个标准差之内(深蓝,蓝,浅蓝)的比率合起来为 99% 。
在实际应用上,常考虑一组数据具有近似于正态分布的机率分布。
若其假设正确,则约 68% 数值分布在距离平均值有 1 个标准差之内的范围,约 95% 数值分布在距离平均值有 2 个标准差之内的范围,以及约 99.7% 数值分布在距离平均值有 3 个标准差之内的范围。
心理与统计学名词,概念(按首字母顺序排序)
B比例数据——既表明量的大小,也有相等的单位,同时还具有绝对零点。
如身高、体重、反应时等。
可进行加减乘除运算。
变量:是试验、观察、调查中想要获得的数据,是一种特征或条件,其本身是变化的或对不同的个体有不同的值。
统计观察的指标都是具有变异的指标。
当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。
标准差:方差的平方根.作为样本统计量用符号s表示,作为总体参数用符号σ表示。
性质①每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原来的标准差②每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数意义:方差与标准差是表示一组数据离散程度的最好指标,它们是统计描述与统计推断分析中最常用的差异量数优点有:反应灵敏、计算严谨、计算容易、适合代数运算、受抽样变动影响小、意义简单明了变异系数:当遇到下列情况时,不能用绝对差异量来比较不同样本的离散程度,而应当使用相对差异量数,最常用的就是差异系数。
①两个或两个以上样本所使用的观测工具不同,所测的特质相同②两个或两个以上样本使用的是同种观测工具,所测的特质相同,但样本间水平差异较大百分位差:指量尺上的一个点,再次点以下数据的个数占全部数据个数的百分比百分位数:在整个分布中,在某一值之下或等于该值的分数的百分比,所对应的分数.百分位数和百分等级是同一操作定义的两端。
当我们求累计次数占总体的百分比是,所对应的分数和百分比的值分别为百分位数和百分等级。
百分等级:常模团体中低于该分数的人所占总体的百分比.百分等级一定要对应分数区间的精确上限。
百分等级和百分位数都可以由已知数据用差值法求解。
标准分数:以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,也叫Z 分数.离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置。
性质①Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量②一组原始分数转换得到的Z分数可正可负,所有原始分数的Z分数之和为零③原始数据的Z分数的标准差为1④若原始分数呈正态分布,则转换得到的所有Z分数均值为0,标准差为1的标准正态分布优点①可比性——不同性质的成绩,一经转换为标准分数,就可在同一背景下比较②可加性——不同性质的原始数据具有相同的参照点,因此可相加③明确性——知道了标准分数,利用分布寒暑表就能知道其百分等级④稳定性——转换成标准分数之后,规定了标准差为1,保证了不同性质分数在总分数中权重一样应用①比较几个分属性质不同的观测值在各自数据分布中相对位置的高低②计算不同质的观测值得总合或平均值,以表示在团体中的相对位置③若标准分数中有小数、负数等不易被人接受的问题,可通过 Z'=aZ+b 的线性公式将其转化成新的分数(如韦氏成人智力量表)标准误:样本平均数分布的标准差。
教育与心理统计的名词解释
教育与心理统计的名词解释引言:教育是社会的基石,而心理统计则是揭示人类心理状态和行为规律的科学方法。
在教育领域中,借助心理统计的工具和理论,我们能够更好地了解学习者的特点和需求,为他们提供有针对性的教育服务。
本文将对教育与心理统计这两个领域中的重要名词进行解释,并探讨它们在教育实践中的应用。
一、教育统计教育统计是研究教育现象和问题的统计方法和技巧。
它广泛应用于学校管理、教育政策制定和教学评估等方面。
其中,三个关键概念是教育统计的基础:指标、样本和数据分析。
1.1 指标指标是衡量和评估教育现象的定量标准。
常见的教育指标包括学校的师生比、学生的平均成绩、教师的绩效评估等。
通过对这些指标的统计分析,我们可以客观地了解教育的质量和效果,并为决策者提供参考。
1.2 样本样本是从整体中取出的一部分个体或事物,用于代表整体进行统计推断。
在教育统计中,样本常用于代表学生群体、教师群体或学校群体,从而更好地了解整体的情况。
在确定样本时,需要考虑抽样方法、样本容量和样本的代表性等因素。
1.3 数据分析数据分析是教育统计的核心环节,通过对数据的整理、揭示和解读,我们可以发现教育问题的规律和趋势。
常用的数据分析方法包括描述统计、推论统计和相关分析等。
借助这些方法,我们可以对教育现象进行客观的量化描述,并为教育改革和决策提供科学依据。
二、心理统计心理统计是研究心理学现象和问题的统计方法和技巧。
它帮助心理学家和研究者从大量数据中提炼出有意义的信息,并得出科学的结论。
心理统计的核心概念包括测量、分布和假设检验。
2.1 测量测量是心理统计中的重要步骤,用于将心理现象转化为可度量的指标。
常用的心理测量方法包括问卷调查、实验测量和观察测量等。
通过测量,我们可以获取心理现象的具体表现,如学生的学习动机、情绪状态或心理健康水平等。
2.2 分布分布是描述心理现象数据的统计特征和规律的方法。
常见的心理分布形式包括正态分布、偏态分布和离散型分布等。
心理统计学
心理统计学——名词解释【1】1随机现象:在一定条件下,可能出现也可能不出现,或者可能这样出现也可能那样出现的一类现象。
2统计学:研究随机现象的数量规律性的应用数学分支。
3大数定理:虽然每次观察结果可能都不同(偶然性),但是大量重复观察的结果可以形成稳定的数量特征(必然性)。
4统计学科学:以统计学方法为主要定量分析手段的科学。
心理学就是一门统计性科学。
5数理统计学:以概率论为基础,阐明统计学的数学原理,推导和证明有关的数学公式的数学分支。
6应用统计学:数理统计学理论在各个学科领域中的应用产生的统计学分支。
7心理统计学:心理学领域的应用统计学分支。
8描述统计学:阐述搜集、提炼和描述资料的方法,是推断统计学的基础。
9推断统计学:运用概率论研究如何根据样变的信息推断出样本来自的总体的相应信息,包括参数估计和假设检验两种形式。
10随机变量:表示随机现象的各种可能结果的变量。
11个体:所研究的随机现象的载体,具有某种共同特性,是组成总体的基本单位。
12总体:具有某(些)共同特性的个体的总和。
13样本:从总体中抽取的作为观测对象的一部分个体。
14样本容量:样本包含的个体数n。
n>=30的样本称为大样本,n<30的样本称为小样本。
15参数:根据总体中所有个体的观察值计算出来的数量指标,即总体上的数字特征。
16统计量:根据样本中所有个体的观察值计算出来的数量指标,即样本上的数字特征。
【2】1间断变量:其可能取值在数轴上不连续的变量。
2连续变量:其可能取值在数轴上连续地充满某一区间的变量。
3称名量表:各个数字表示的是观察值的不同质别,起到的是名称的作用,数据之间不可以进行任何数学运算。
4顺序量表:各个数字表示的是个体某方面特征所对应的名次或等级;数据之间可以进行比较运算。
5等距量表:表示测量上具有相等单位的观察值,而且有一个相对零点;数据之间可以进行加减运算。
6比率量表:表示测量上具有相等单位的观察值,而且有一个绝对零点;等距量表的数据之间可以进行乘除法运算。
心理统计学知识点完整版资料整理
心理统计学知识点完整版资料整理1描述统计:主要研究如何让整理心理与教育科学实验或调查得来的大量数据。
描述一组数据的全貌表达一件事物的性质。
2推论统计:主要研究如何通过局部数据提供的信息,推论总体的情形。
3连续数据:任意两个数据点之间都可以细分出无限个大小不同的数值。
4统计量:样本的那些特征值,代表样本的特性。
5参数:描述总体情况的统计指标。
它代表了整体特征,是一个常数。
6组限:分组区间即一个组的起点值和终点值之间的距离;组下限起点值;组下限终点值。
组限分类表述组限,精确组限散7点图:用相同大小圆点的多少或疏密表示统计资料数量大小以及变化趋势的图。
8中数:按顺序排列在一起的一组数据中居于中间位置的数。
9众数:指在次数分布中出现次数最多的那个数的数值。
10平均差:次数分布中所有原始数据平均数绝对离差的平均值。
11方差:每个数据与该组数据平均数之差乘方后的均值12标准差:方差的平方根,反应一个次数分布的离散程度13概率:用一个比值来概括某事件出现可能性大小14置信区间:指总参数在一定置信度下的面积距离或面积长度。
置信区间的上下端点值称为置信限。
15组内变异:由组内各受试者因变量的差异范围决定,主要指实验误差引起的变异或组内受试者之间的差异。
16组间差异:不同实验处理引起的组间差异可以用两个平均值之间的偏差来表示。
两组之间的平均差异越大,地层变化越大17二项分布:试验仅有两种不同性质结果的概率分布。
样本分布:指样本统计的分布,是统计推断的重要依据。
19回归模型:用来表示变量之间规律的数学模型20标准分数:又称基分数或z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。
优点:可比性可加性明确性稳定性21符号测试:这是一种以正负符号为数据的非参数测试程序。
这是一种简单的非参数检验方法,适用于检验两个配对样本分布之间的差异,并与参数检验中配对样本之间差异显著性的t检验相对应22事物之间的相互关系:因果关系,共变关系,相关关系r取值范围-1到123根据数据所反映的测量水平对数据进行分类,名称数据、序列数据、等距数据和比率数据是否具有连续性、离散数据和连续数据24。
心理统计笔记—名词解释
心理统计笔记—名词解释第一章:描述性统计统计:描述性统计descriptive statistics推断性统计inferential statistics#描述性统计主要是对一组给定的测量数据进行总结的方法,而推断性统计是把对给定数据的测量结果推广到更大的潜在数据集的方法。
变量variable和常量constant变量:连续变量continuous variable & 离散变量discrete variable一个具有有限水平但相邻水平之间不再可能赋值的变量被称为离散变量。
一个可以无穷小精确度来测量的变量(至少在理论上,可是求两个任意小的测量水平之间的中间值)被称为连续变量。
自变量indepentent variable & 因变量dependent variable称名/类别量尺(nominal/categorical scale):数字是强制定义的,不可计算。
顺序/等级量尺(ordinal scale):不是简单分类,而是有一定顺序。
然而,这些排名数字并不能看作真正的数值,因为等级之间不是等距的。
研究者在对这类的数据进行数学运算时,已经假设它们是等距数据了。
等距和等比量尺(interval and ratio scales):不但具有等距特征,而且还兼具等比特征的量尺被称之为等比量尺。
尽管所有等比量尺都有等距特征,但有些量尺只有等距特征而不具备等比特征。
这些量尺被称为等距量尺。
等距量尺是没有真正零点的。
E.g. 摄氏和华氏温度,IQ值等。
#不能混淆变量和用来测量变量的量尺。
同一个变量可以用多种量尺来测量,例如:测量温度可以用顺序量尺(第一热,第二热),也可以用等距量尺(摄氏/华氏度),还可以用等比量尺(开尔文,有绝对零度)。
尽管在终极意义上,所有量尺都是离散的,但是具有很多水平的量尺通常被认为是连续的,而水平相对少的量尺则当作离散处理。
而用于测量离散变量的量尺总是离散的。
参数统计(parameter statistics)和非参数统计:基于分布及其参数的统计方法叫参数统计。
心理统计学名词解释
心统名词解释:统计学:是研究如何搜集、整理、分析反映事物总体的数字资料,并以此为依据,对总体特征进行推断的原理和方法。
教育统计学:是运用数理统计的原理和方法研究教育问题的一门应用科学。
它提供各种统计方法的应用条件,对统计计算结果进行解释。
随机变量:表示随机现象各种结果的变量。
总体:是具有某(些)共同特征的总和。
样本:是从总体中抽取的作为观测对象的一部分个体。
描述性统计(Descriptive Statistics):研究如何整理实验或调查得到的大量数据,找出这些数据的分布特征。
集中量(CENTRAL TENDENCY):是代表一组数据典型水平或集中趋势的量。
(种类:平均数(MEAN) ; 中位数(MEDIAN) ; 众数(MODE)等)中位数:是位于依一定大小顺序排列的一组数据中央位置的数值,大于及小于这一数值各有一半数据分布着。
众数:是集中量的一种指标,用Mo表示,它有理论众数和粗略众数两种。
理论众数是指与频数分布曲线最高点相对应的横坐标上的一点。
粗略众数是指一组数据中频数出现最多的那个数。
差异量:表示一组数据变异程度或离散程度的量称为差异量。
四分位数:将一组已排序的数据按个数四等分的百分数,分别是位于25%,50%,75%的百分位数。
相关量:相关系数?相关:两个变量之间不精确、不稳定的变化关系。
推断统计(Inferential Statistics):根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测。
二项分布:重复进行n次二项试验后不同成功次数x所对应的概率分布。
正态分布:如果随机变量X的概率密度函数为f(x)=(自己写公式),则称X服从正态分布。
t分布:又称“学生分布”,如果随机变量t的概率密度函数为f(t)=(自己写公式),则称t服从t分布。
自由度:总体参数估计量中变量值独立自由变化的个数。
简单随机抽样:从总体中完全以随机形式抽取若干个个体组成一个样本。
心理学考研之心理统计学笔记
心理学考研之心理统计学笔记The document was prepared on January 2, 2021心理统计学笔记1基本概念总体:具有某些共同的、可观测特征的一类事物的全体,构成总体的每个基本单元称为个体样本:由于不能或没必要对整个总体进行研究,我们只能从总体中选择出一些个体代表总体,这些个体的集合叫样本变量:本身是变化的或者对于不同个体有不同值得特征或条件常量:本身不变且对不同的个体的值也相同参数:描述总体的数值,它可以从一次测量中获得,也可以从总体的一系列测量中推论得到比例:全组中取值为X的比例,p=f/N插值法:一种求两个已知数值之间中间值的方法,其假设所求解点附近数据呈线性变化统计量:描述样本的数值,与参数的获得方式相同随机取样:从总体抽取样本的一种策略,要求总体中的每一个个体被抽到的机会均等取样误差:样本统计量与相应的总体参数之间的差距偏态分布:分数堆积在分布的一端,而另一端成为比较尖细的尾端,其与对称分布对应次数分布:一批数据在某一量度的每一个类目所出现的次数情况离散型变量:由分离的、不可分割的范畴组成,临近范畴之间没有值存在连续型变量:在任何两个观测值之间都存在无限多个可能值,它可被分割成无限多个组成部分2学习建议①将注意放在概念上,心理统计应该是一门概念性的科学,而非纯数学.②一定要将统计方法与心理学研究的情景结合起来学习.③弄懂一个概念再开始学习下一个,心理统计中的概念应用性较差却是之后做题的基础.④做题按照推荐格式能避免出错几率.3统计检验总表数据类型单样本问题独立样本比较相关样本比较多组样本的比较相关问题独立样本重复测量等距型总体正态分布单样本t/z检验独立样本t/z检验相关样本t检验独立样本方差分析重复测量方差分析Pearson积差相关分布形态未知大样本下的相应的t/z检验大样本下的相应的t/z检验大样本下的相应的t检验转化为顺序型转化为顺序型顺序型符号检验法曼-惠特尼维尔克松克-瓦氏单向弗里德曼双向等级SpearmanU检验T检验方差分析方差分析等级相关命名型χ2匹配度检验χ2独立性检验符号检验法χ2独立性检验χ2独立性检验一、描述统计描述统计是指用来整理、概括、简化数据的统计方法,侧重于描述一组数据的全貌,表达一件事物的性质.一统计图表统计表和统计图简单明确、生动直观地表达数量关系,具有一目了然、整洁美观、容易理解等特点.它们是对数据进行初步整理,以简化的形式加以表现的两种最简单的方式.在制定统计图表之前,一般首先要对数据进行以下两种初步整理:①数据排序:按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列②统计分组:根据被研究对象的特征,将所得到数据划分到各个组别中去1.统计图统计图:用点、线、面的位置、升降或大小来表达统计资料数量关系的一种陈列形式组成:坐标轴、图号、图题、图目、图尺、图形、图例、图注分类:条形图、圆图、线性图、直方图、散点图、茎叶图2.统计表统计表:将要统计分析的事物或指标以表格的形式列出来,以代替烦琐文字描述的一种表现形式组成:隔开线、表号、名称、标目、数字、表注分类:简单表、分组表、复合表二集中量数集中量数又叫集中趋势,是体现一组数据一般水平的统计量.它能反映频数分布中大量数据向某一点集中的情况.1.算数平均数1定义算数平均数:即所有观察值的总和与总频数之商,简称为平均数或均数平均数一般与标准差、方差相结合使用.2特点①在一组数据中每个变量与平均数之差的总和等于零②在一组数据中,每一个数都加上一个常数C,所得的平均数为原来的平均数加常数C③在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C3意义算数平均数是应用最普遍的一种集中量数,它在大多情况下是真值最好的估计值.4优缺点优点:反应灵敏、计算严密、计算简单、简明易解、适合于进一步用代数方法盐酸、较少受抽样变动的影响缺点:易受极端数据的影响、不能在出现模糊数据时计算2.中数1定义中数:按顺序排列在一起的一组数据中居于中间位置的数,在这组数据中,有一半数据比它大,一般数据比它小,等价于百分位数是50的那个数.2算法①数列总个数为奇数时,第 n+1/2 个数就是中数②数列总个数为偶数时,可取位于中间的两个数的平均数作为中数③分布中有相等的数时,将重复的数字看成一个连续体,利用中间分数的精确上下限使用插值法3优缺点优点:计算简单、容易理解、不受极端值影响、能在有模糊数据情况下使用、可在顺序型数据时使用缺点:代表性低、不够灵敏、稳定性低、需要排序、不能进一步做代数运算3.众数1定义众数:在次数分布中出现次数最多的那个数的数值众数可能不只一个.在正偏态分布时,平均数最靠近尾端,中数位于其与众数之间. 2优缺点优点:能在数据不同质的情况使用,能避免极端值干扰缺点:不稳定、代表性差、不够灵敏、不能做进一步的代数运算三差异量数差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数.1.离差与平均差离差:分布中的某点到均值得距离,其符号表示了某分属于均值之间的位置关系而数值表示了它们之间的绝对距离离差之和始终为零.平均差:次数分布中所有原始数据与平均数绝对离差的平均值2.方差与标准差和方:每一个离差值平房求和由于离差正负值互相抵消无法代表离中趋势我们引入和方的概念1总体的方差和标准差方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平房后的均数作为样本统计量用符号s2表示,作为总体参数用符号σ2表示,也叫均方.标准差:方差的平方根作为样本统计量用符号s表示,作为总体参数用符号σ表示.2样本的方差和标准差样本的变异性往往比它来自的总体的变异性要小.为了校正样本数据带来的偏差,在计算样本方差时,我们用自由度来矫正样本误差,从而有利于对总体参数更好的无偏差估计:3性质①每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原来的标准差②每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数4意义方差与标准差是表示一组数据离散程度的最好指标,它们是统计描述与统计推断分析中最常用的差异量数,它们的优点有:反应灵敏、计算严谨、计算容易、适合代数运算、受抽样变动影响小、意义简单明了3.变异系数当遇到下列情况时,不能用绝对差异量来比较不同样本的离散程度,而应当使用相对差异量数,最常用的就是差异系数.①两个或两个以上样本所使用的观测工具不同,所测的特质相同②两个或两个以上样本使用的是同种观测工具,所测的特质相同,但样本间水平差异较大差异系数:一种最常用的相对差异量,为标准差对平均数的百分比四相对量数1.百分位数百分位数:在整个分布中,在某一值之下或等于该值的分数的百分比,所对应的分数百分位数和百分等级是同一操作定义的两端.当我们求累计次数占总体的百分比是,所对应的分数和百分比的值分别为百分位数和百分等级.2.百分等级百分等级:常模团体中低于该分数的人所占总体的百分比百分等级一定要对应分数区间的精确上限.百分等级和百分位数都可以由已知数据用差值法求解.3.标准分数1定义标准分数:以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,也叫Z 分数离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置.2性质①Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量②一组原始分数转换得到的Z分数可正可负,所有原始分数的Z分数之和为零③原始数据的Z分数的标准差为1④若原始分数呈正态分布,则转换得到的所有Z分数均值为0,标准差为1的标准正态分布3优点①可比性——不同性质的成绩,一经转换为标准分数,就可在同一背景下比较②可加性——不同性质的原始数据具有相同的参照点,因此可相加③明确性——知道了标准分数,利用分布寒暑表就能知道其百分等级④稳定性——转换成标准分数之后,规定了标准差为1,保证了不同性质分数在总分数中权重一样4应用①比较几个分属性质不同的观测值在各自数据分布中相对位置的高低②计算不同质的观测值得总合或平均值,以表示在团体中的相对位置③若标准分数中有小数、负数等不易被人接受的问题,可通过 Z'=aZ+b 的线性公式将其转化成新的分数如韦氏成人智力量表五相关量数由于实验法适用范围的限制,有的时候我们只能对变量间进行相关研究,也就是看两者是否有互相跟随的变化关系.相关研究所得到的是一种描述统计,我们仅仅能用其描述两个变量互相跟随的程度大小,至于他们之间是否有因果关系或者是共变关系则不可妄下定论.相关系数:两列变量间相关程度的数字表现形式作为样本的统计量用r表示,作为总体参数一般用ρ表示.正相关:两列变量变动方向相同负相关:两列变量中有一列变量变动时,另一列变量呈现出与前一列变量方向相反的变动零相关:两列变量之间没有关系,各自按照自己的规律或无规律变化1.积差相关也就是Pearson相关.1前提①数据要成对出现,即若干个体中每个个体都有两种不同的观测值,并且每队数据与其它对子相互独立②两列变量各自总体的分布都是正态的,至少接近正态③两个相关的变量是连续变量,也即两列数据都是测量数据④两列变量之间的关系应是直线性的2公式r也就等于X和Y共同变化的程度除以X和Y各自变化的程度.2.等级相关也就是Spearman相关1适用范围①当研究考察的变量为顺序型数据时,若原始数据为等比货等距,则先转化为顺序型数据②当研究考察的变量为非线性数据时2公式将原始数据转化为顺序型数据,仍然用Pearson相关公式计算即可.3.肯德尔等级相关1肯德尔W系数也叫肯德尔和谐系数,原始数据资料的获得一般采用等级评定法,即让K个被试对N件实物进行等级评定.其原理是评价者评价的一致性除以最大变异可能性.代表评价对象获得的K个等级之和RiN代表等级评定的对象的树木K代表等级评定者的数目2肯德尔U系数其与肯德尔W系数所处理的问题相同,但评价者采用对偶比较法,即将N件事物两两配对分别进行比较为对偶比较记录表中i>j格中的择优分数rij4.点二列相关与二列相关1点二列相关适用于一列数据为等距正态变量,另一列为离散型二分变量.X是与二分称名变量的一个值对应的连续变量的平均数pX是与二分称名变量的另一个值对应的连续变量的平均数qp与q是二分称名变量两个值各自所占的比率s是连续变量的标准差t2二列相关适用于两列变量都是正态等距变量,但其中一列变量被人为地分成两类.y为标准正态曲线中p值对应的高度,查正态分布表能得到5.Ф相关适用于两个变量都是只有两个点值或只表示某些质的属性.其中a、b、c、d分别为四格表中左上、右上、左下、右下的数据二、推断统计推论统计就是指运用一系列的数学方法,将从样本数据中获得的结果推广到样本所在的总体.进行推论统计的关键在于所抽取的样本要能够尽量接近所要研究的总体.一推断统计的数学基础1.概率概率:表明随即时间出现可能性大小的客观指标概率的定义包含以下两种,当观测次数够多时他们是相等的.后验概率:对随机事件进行n次观察,某一事件A出现的次数m与观测次数n的比值在n趋近无穷时所稳定在的常数p先验概率:在满足试验可能结果数有限且每一种结果出现的可能性相等的条件下,随机事件包含的结果数除以结果总数2.正态分布当样本量足够大时,我们会发现生活中许多变量的分布都近似于正态曲线,因此有“上帝偏爱正态分布”一说.1特点①正态曲线的形状就像一口挂钟,呈对称分布,其均值、中数、众数实际上对应于同一个数值②大部分的原始分数都集中分布在均值附近,极端值相对而言比较少③曲线两端向靠近横轴处不断延伸,但始终不会与横轴向交④正态分布曲线转化为z分数后人以z分数与零点对应曲线下面积固定2用法①依据Z分数求概率,即已知标准分数求面积②从概率求Z分数,即从面积求标准分数值③已知概率或Z值,求概率密度,即正态曲线的高3.二项分布二项分布:对于一个事件有两种可能A和B,但我们对这一事件观察n次,事件A发生的总次数的概率分布就是二项分布μ=二项分布的均值为pnσ=方差公式为2npq标准差的公式为σ=4.抽样原理与抽样方法1抽样原理抽样的基本原则是随机性原则,所谓随机性原则,是指在进行抽样时,总体中每一个个体是否被抽选的概率完全均等.由于随机抽样使每个个体有同等机会被抽取,因而有相当大的可能使样本保持和总体有相同的结构,或者说,具有最大的可能使总体的某些特征在样本中得以发现,从而保证由样本推论总体.2抽样方法①简单随机取样法②系统随机取样法③分层随机取样法④多段随机取样法5.抽样分布样本分布:样本统计量的分布,是统计推论的重要依据1正态分布及渐近正态分布样本统计量为正态分布或者接近正态分布的情况都可根据正态分布的概率进行统计推论.总体分为正态或接近正态,方差已知,样本平均数和方差的分布为正态分布①样本平均数分布的平均数和方差与母体的平均数和方差有如下关系:②样本的方差及标准差的分布也渐趋于正态分布,其分布的平均数与标准差和总体有如下关系:2t 分布t 分布是一种与方差无关而与自由度有关的分布,很类似正态分布,我们可以将正态分布看作t 分布当自由度为正无穷时的特例.总体分布为正态,方差未知时,样本平均数的分布为t 分布:X σ= 其中1n s -= 3χ2分布χ2分布的构造是从一个服从正态分布的总体中每次抽去n 个随机变量,计算其平方和之后标准化的一个分布.分布曲线下的面积都是1,但伴随着n 取值的不同,自由度改变,曲线分布形状不同,而当自由度趋近于正无穷时χ2分布即为正态分布,因此其于t 分布一样都是一族分布,而正态分布都是其中的特例.4F 分布如果有两个正态分布的总体,我们从其中各自取出两个样本,各自计算出χ2,则: 更多情况下,我们所计算的F 两样本取自相同总体,此时可将上式化简为:二参数估计当在研究中从样本获得一组数据后,如何通过这组信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,称为总体参数估计.总体参数估计问题可以分为点估计与区间估计.1.点估计、区间估计与标准误良好估计量的标准①无偏性——用多个样本的统计量估计总体参数的估计值,其偏差的平均数为零②有效性——当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好③一致性——当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数④充分性——样本的统计量是否充分地反映了全部n个数据所反映总体的信息点估计:用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计结果也以一个点的数值表示区间估计:根据估计量以一定可靠程度推断总体参数所在的区间范围,这个区间就叫做置信区间,相应的概率成为置信度,这两个量是共通变化的,置信区间越大,置信度越高;区间估计是用数轴上的一段距离表示未知参数可能落入的范围及落入该范围的概率.标准误:样本平均数分布的标准差总体方差未知时用估算的总体方差计算标准误.2.总体平均数的估计当总体方差未知时,则使用t分布对应置信度3.标准差与方差的区间估计1标准差的区间估计2方差的区间估计三假设检验可以说,每一个实验的存在,仅仅是为了给事实一个反驳虚无假设的机会. ——1.假设检验的原理假设检验:统计学中的一种推论过程,通过样本统计量得出的差异作为一般性结论,判断总体参数之间是否存在差异假设检验的实质是对可置信性的评价,是对一个不确定问题的决策过程,其结果在一定概率上正确的,而不是全部.1两类假设对于任何一种研究而言,其结果无外乎有两种可能,即是否符合我们预期.一般来说证伪一件事情比证实一件事容易,在行为科学的研究中,由于我们无法了解总体中除样本以外的个体情况,因此尝试拒绝虚无假设的方法优于证明备择假设.备则假设:因变量的变化、差异却是是由于自变量的作用往往是我们对研究结果的预期,用H1表示.虚无假设:实际上什么也没有发生,我们所预计的改变、差异、处理效果都不存在观察到的差异只是随机误差在起作用,用H0表示.2小概率原理小概率原理:小概率事件在一次试验中几乎是不可能发生的至于什么就算小概率事件,那就是我们在计算前明确的决策标准,也就是显着性水平α.在检验过程中,我们假设虚无假设是真实的,同时计算出观测到的差异完全是由于随机误差所致的概率.之后将其与我们实现界定好的显着性水平比较,从而考虑是否依据小概率原理来拒绝虚无假设.3两类错误本部分内容请参照实心信号检测论对照来看. ——MJ注Ⅰ型错误:当虚无假设正确时,我们拒绝了它所犯的错误,也叫α错误研究者得出了处理有效果的结论,而实际上并没有效果,即所谓“无中生有”Ⅱ型错误:当虚无假设是错误的时候,我们没有拒绝所犯的错误,也叫β错误假设检验未能侦查到实际存在的处理效应,即所谓“失之交臂”两类检验的关系①α+β不一定等于1②在其他条件不变的情况下,α与β不可能同时减小或增大4检验的方向性单侧检验:强调某一方向的检验,显着性的百分等级为α双侧检验:只强调差异不强调方向性的检验,显着性百分等级为α/2对于同样的显着性标准,在某一方向上,单侧检验的临界区域要大于双侧检验,因此如果差异发生在该方向,单侧检验犯β错误的概率较小,我们也说它的检验效力更高.5假设检验的步骤①根据问题要求,提出虚无假设和备择假设②选择适当的检验统计量③确定检验的方向性并规定显着性水平④计算检验统计量的值⑤将统计量的值与临界值对比做出决策2.样本与总体平均数差异的检验1总体正态分布且方差已知obs X X z μσ-=其中X σ=0μ和0σ分别为总体的平均数和方差2总体正态分布而方差未知0obs X X t s μ-=其中X s =S =S 为用样本和方估算出的总体方差3.两样本平均数差异的检验12obs obs D X X X Z t σ-==这是两样本平均数检验的通用公式,所不同的仅在于标准误的计算1总体方差已知①独立样本②相关样本D X σ=r 为两组变量之间的相关系数2总体方差未知①独立样本方差差异不显着时②相关样本a.相关系数未知:D X σ=其中d 为每一对对应数据之差b.相关系数已知:D X σ=4.方差齐性检验1样本方差与总体方差当从正态分布的总体中随机抽取容量为n 的样本时,其样本方差与总体方差比值服从χ2分布:2220ns χσ=由自由度1df n =-查χ2表,依据显着性水平判断2两个样本方差之间①独立样本22s F s =大小其中当两样本自由度相差不大时可用n s 代替n-1s查表时11221,1df n df n =-=-②相关样本22t =其中2df n =-5.相关系数的显着性检验①积差相关a.当ρ=0时:t =其中2df n =-b.当ρ≠0时:先通过查表将r 和ρ转化为费舍Z r 和Z ρ然后进行Z 检验②等级相关和肯德尔W 系数在总体相关系数为零时:查各自的相关系数表,判定样本相关显着四方差分析1.方差分析的原理与基本过程1方差分析的概念方差分析的目的是推断多组资料的总体均数是否相同,也即检验多组数据之间的均数差异是否有统计意义.当我们用多个t 检验来完成这一过程时,相当于从t 分布中随机抽取多个t 值,这样落在临界范围之外的可能大大增加,从而增加了Ⅰ型错误的概率.我们可以把方差分析看作t 检验的增强版.2方差的可分解性方差分析依据的基本原理就是方差的可加性原则.作为一种统计方法,方差分析把实验数据的总变异分解为若干个不同来源的分量.数据的变异由两部分组成:组内变异:由于实验中一些希望加以控制的非实验因素和一些未被有效控制的未知因素造成的变异,如个体差异、随机误差组内变异是具体某一个处理水平之内的,因此在对总体变异进行估计的时候不涉及研究的处理效应.组间差异:不仅包括组内变异的误差因素,还包括了是不同组所接受的实验处理不同造成的影响如果研究数据的总变异是由处理效应造成的,那么组间变异在总变异中应该占较大比例.B MS 表示组间方差,B B B SS MS df =,1B df k =-,k 表示实验条件的个数 W MS 表示组内方差,W W WSS MS df =,()1W df k n =-,n 表示每种实验条件中的被试个数 3方差分析的基本假定①样本必须来自正态分布的总体②每次观察得到的几组数据必须彼此独立③各实验处理内的方差应彼此无显着差异为了满足这一假定,我们可采用最大F 比率法2max max2min s F s =,求出各样本中方差最大值与最小值的比,通过查表判断.4方差分析的基本步骤Ⅰ 求平方和①总平方和是所有观测值与总平均数的离差的平方总和 ()22T G SS X N =-∑其中G 表示所有数据的总合,N 表示总共的数据个数。
心理统计学总结
心理统计学总结(皖南医学院适用)(人民卫生出版社第二版姚应水)1、心理统计学:应用统计学的分支,是运用统计学的原理和方法,专门研究如何整理与分析由实验和测试所获得的数据资料,找出客观规律,进行科学推论的一门应用学科,是心理学研究的科学方法和工具学科。
2、同质:是指观察单位或观察指标受共同因素制约的部分。
变异:个体间的差异。
总体:是指根据研究目的所确定的同质观察单位的全体,是同质的所有观察单位某项观察值的集合。
样本:是指从总体中随机抽取部分观察单位其某项观察值的集合。
3、参数:又称总体参数,是反映总体特征或情况的统计指标,由各种方式得到的表示总体特征的量数称为参数。
统计量:对样本观察测量数据进行统计分析所获得的统计指标值称为统计量。
4、误差(1)系统误差(2)随机测量误差(3)抽样误差:由抽样引起的样本统计量与总体参数之间的差异称为抽样误差。
5、概率:描述某一事件发生的可能性大小的指标。
小概率事件:p<=0.05或p<=0.01称为小概率事件,表示事件发生的可能性很小,在实际的一次抽样中可以认为不会发生。
6、心理统计资料的类型(1)数值变量资料-----计量资料(2)分类变量资料无序分类变量-----计数资料有序分类变量-----等级资料7、心理统计工作的基本步骤(1)研究设计(2)收集资料资料来源:统计报表,医疗卫生工作记录,专题调查或实验研究(3)整理资料1)分析资料2)统计描述(集中趋势,离散趋势)3)统计推断(总体参数的估计方法、假设检验的各种方法)(4)统计分析8、频数:是指变量值出现的次数或人数9、频数分布表的编制(1)求极差(2)确定组距(3)列表划记并统计频数10、频数分布表和图的用途(1)揭示计量资料的分布类型(2)揭示计量资料的资料分布的重要特征(3)便于发现某些特大或特小的可疑值(4)作为陈述资料的形式(5)提供分组数据,便于进一步计算统计描述指标的统计分析。
11、集中趋势:描述一组数据的观察水平或平均水平(1)算术平均数:适用于对称分布尤其是正态分布(2)几何均数使用条件:原始数据呈倍数关系变化,且经一定形式转化后呈正态分布或近似正态分布(3)中位数:一组观察值从小到大排列位置居中的值适用条件:a偏态分布b一端或两端资料分布不明确c资料分布类型不明确d等级资料12、离散趋势:描述数据的离散水平(1)极差(全距)任何分布(2)四分位数间距偏态分布(3)方差和标准差正态分布作用:描述一组观察值的离散程度,S结合样本均数用来描述正态分布,S结合n用来描述标准误,制定一些参考值范围(4)变异系数适用条件:变量单位不同时,均数相差很大13、正态分布的特点(1)曲线在横轴上方,均数所在处最高(2)以均数为中心,左右对称(3)两个参数,形态参数和位置参数(4)曲线下面积有一定规律14、均数的抽样误差:由个体变异产生的,抽样造成的样本均数与总体均数之间的差异以及各样本之间的差异。
张厚粲心理统计所有名词解释
标准正态分布:P162标准正态分布又称为u分布,是以0为均数、以1为标准差的正态分布,记为N(0,1)F分布:P189基于正态分布建立起来的,:设X、Y为两个独立的随机变量,X服从自由度为m的卡方分布,Y服从自由度为n的卡方分布,这2 个独立的卡方分布被各自的自由度除以后的比率这一统计量的分布即F=(x/m)/(y/n)服从自由度为(m,n)的F-分布,上式F 服从第一自由度为m,第二自由度为n的F分布。
品质相关:用于表示R*C(行*列)表的两个变量之间的关联程度。
包括:四分相关、fai 相关、列联表相关。
相对位置量数:是通过描述一个数据在其总体中所处位置的情况来反映其差异程度。
集中量数:主要用来描述一组数据的集中趋势。
四分位数:把所有数值由小到大排列并分成四等份,处于三个分割点位置的得分就是四分位数。
百分位数:将一组数据从大到小排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。
可表示为:一组n个观测值按数值大小排列如,处于p%位置的值称第p百分位数。
标准分数:又称基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。
Z=(X-μ)/σ 其中X-μ为离均差,σ表示标准差假设检验:假设检验有Z检验、T检验、配对检验、比例检验、秩和检验、卡方检验等假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。
两类错误:当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的可能性预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。
统计量:样本的特征值。
虚无假设:(想要拒绝之假设)按事实推论相反方向所陈述的假设,其叙述变项间没有差异,没有影响,没有关系,但若经统计考验方法证实推翻虚无假设,则可获得与事实相符的结论。
心理统计学与spss应用 名词解释
统计学(statistics)在我们看来,统计学是研究随机现象的方法论,是心理学研究设计和资料分析的技术。
是心理学实证研究结果表达的有效语言;是心理学专业学生应该熟练掌握的应用技术.测量(measure)就是依据一定的法则、程序,借助于一定的工具,以数字形式对事物或事物的属性进行描述的过程,它由事物、法则和数字三个基本元素组成。
称名量表(nominal scale)称名量表是测量水平最低的一种量表形式。
既无参照点和单位.也没有等级或位次性。
只是用不同的数字作为代码区分事物在某种性质上的差异,其数字已经失去了自然数的意义。
顺序量表(ordinal scale)顺序量表也叫做等级量表,该类量表可以用一组数字将事物规定为不同的类别,其测量的水平高于称名量表.因为它的数字不仅可以具有标记类别的功能.同时也含有类别的大小或某种属性的程度高低的比较关系。
等距量表(interval scale)当规定了相对零点和相等单位后,对事物的测量就可做到更为精细一些,不仅可以获得被测量对象在这一属性上的顺序关系,而且可以得到对象之间在某种程度上的差距有多少个单位。
等比量表(ratio scale)等比量表是具有绝对零点和相等单位的量表,其对事物属性的测量最为精细。
量化水平最高。
等比量表是参照一个零点来确定一系列类,而且这里的零点不是随意规定的一个位置,它是一个意义丰富的点,代表被测变量的绝对缺失。
变量(variable)就是可以在数量或性质上发生变化的事物的属性。
根据其来源.心理学研究中的变量可以分为三类:刺激变量、机体变量和反应变量:根据测量结果的数值类型.可以分为离散变量、连续变量;根据研究过程中的处理方式.可以分为自变量、因变量和控制变量。
总体(population)是指具有某一特征的一类事物或人的全体。
简单地说,它是包含某一研究课题涉及的所有可能的研究对象。
样本(sample)是按一定规则从总体中抽取出来的部分个体组成的集合,该集合中的个体数叫做样本容量,一般用n表示。
邓铸《心理统计学与SPSS应用》笔记和课后习题详解
邓铸《心理统计学与SPSS应用》笔记和课后习题详解第1章引论一、学习统计学的原因(一)统计学是研究随机现象的方法论统计学研究的是随机现象,是帮助人们发现随机现象运动规律的科学。
其基本技术就是分析随机现象的各种表现,认识随机事件发生的概率及分布规律。
(二)统计学是心理学研究设计的技术1.心理统计学的概念心理统计学是应用统计学的一个分支,它既是对已有数据资料进行分析的技术,也是根据研究目的和研究对象的特点,确定搜集何种资料、如何搜集、整理、分析以及如何根据这些数字资料所传递的信息,进行科学推论,找出客观规律的一门科学。
2.心理统计学的意义(1)心理统计学是心理学研究设计的基本方法学基础;(2)心理统计学是对心理学研究的全程进行管理的科学;(3)心理统计学是心理学研究不可缺少的科学工具。
(三)统计学是心理学研究资料分析的技术心理学的实验研究和调查研究要解决的问题主要有三类:1.特征描述(1)含义是指对研究对象进行多方面的测量,此类测量一般不是为了描述个体或少数人,而是为了描述一个大的群体,即“总体”。
(2)重要性描述性统计分析是统计学中数据分析的最基础的部分。
2.进行差异比较(1)目的考察不同人群之间的某些差异,以及实验干预是否造成了某种心理品质或心理状态的明显改变。
(2)常用方法主要是依赖于心理统计学中的t检验和F检验方法。
3.相关性分析相关性研究是指尽量在较为自然的情况下,搜集研究对象的一系列心理体验、行为倾向或行动指标,利用统计学方法来考察各方面变量对应的数据资料之间是否具有某种共变关系。
(四)统计学为心理学研究提供了有效的表达语言1.意义统计学的语言已经在相当程度上成为心理学研究报告撰写的“行话”,。
2.要求(1)要借助统计学的知识阅读心理学的研究报告;(2)在撰写研究报告的时候,要使用统计学的概念与符号说“内行”话。
(五)统计学成为心理学专业的应用技术1.学习心理统计学,可以借助于各种测评工具对各个不同实践领域中的人群进行心理测评与支持;2.可以将一个理论的假设转变为一项实证研究的方案;3.可以帮助企事业单位进行人力资源的开发与管理等。
心理统计学常用概念总结
心理统计学常用概念总结心理统计学是心理学中的一个分支,主要研究心理学中的数据分析和统计方法。
以下是心理统计学常用的概念总结:1. 总体和样本:总体指研究对象的全体,样本指从总体中抽取的一部分。
心理研究通常无法对整个总体进行观察和统计,因此需要从总体中抽取一个样本来进行研究。
2. 变量:心理研究中要研究的对象称为变量。
变量可以是人的特征,也可以是心理过程或行为的指标。
常见的变量包括性别、年龄、情绪状态、智力水平等。
3. 测量:测量是指将抽象的概念转化为具体的可观察和可计量的指标。
心理研究中的测量可以采用调查问卷、实验任务和观察等方法。
4. 中心趋势:中心趋势是描述数据集中位置的统计指标,常用的包括平均数、中位数和众数。
平均数是所有观察值的总和除以观察值的数量,中位数是将所有观察值按大小排列后的中间值,众数则是出现次数最多的观察值。
5. 变异度:变异度是描述数据分散程度的统计指标,常用的包括标准差和方差。
标准差是观察值与平均值之间的差异的平均水平,方差则是标准差的平方。
6. 正态分布:正态分布是指符合高斯分布曲线的数据分布。
在心理研究中,很多变量的分布都服从正态分布,这可以方便我们进行统计推断和参数估计。
7. 相关分析:相关分析是用来研究两个变量之间关系的统计方法。
常用的相关分析方法包括皮尔逊相关系数和斯皮尔曼相关系数,用来度量两个连续变量之间的线性和非线性关系。
8. t检验和方差分析:t检验和方差分析是用来比较两个或多个组别之间均值差异的统计方法。
t检验适用于比较两个组别之间的均值差异,方差分析则适用于比较两个或多个组别之间的均值差异。
9. 回归分析:回归分析用于研究自变量对因变量的影响程度和方式。
常用的回归分析方法包括线性回归和多元回归。
10. 统计显著性:统计显著性是指在给定样本下,观察到的差异是否由于随机因素引起的概率。
通常以p值来表示,p值小于设定的显著性水平(通常为0.05)时,可以认为观察到的差异是真实存在的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
心统名词解释:
统计学:是研究如何搜集、整理、分析反映事物总体的数字资料,并以此为依据,对总体特征进行推断的原理和方法。
教育统计学:是运用数理统计的原理和方法研究教育问题的一门应用科学。
它提供各种统计方法的应用条件,对统计计算结果进行解释。
随机变量:表示随机现象各种结果的变量。
总体:是具有某(些)共同特征的总和。
样本:是从总体中抽取的作为观测对象的一部分个体。
描述性统计(Descriptive Statistics):研究如何整理实验或调查得到的大量数据,找出这些数据的分布特征。
集中量(CENTRAL TENDENCY):是代表一组数据典型水平或集中趋势的量。
(种类:平均数(MEAN) ; 中位数(MEDIAN) ; 众数(MODE)等)
中位数:是位于依一定大小顺序排列的一组数据中央位置的数值,大于及小于这一数值各有一半数据分布着。
众数:是集中量的一种指标,用Mo表示,它有理论众数和粗略众数两种。
理论众数是指与频数分布曲线最高点相对应的横坐标上的一点。
粗略众数是指一组数据中频数出现最多的那个数。
差异量:表示一组数据变异程度或离散程度的量称为差异量。
四分位数:将一组已排序的数据按个数四等分的百分数,分别是位于25%,50%,75%的百分位数。
相关量:相关系数?
相关:两个变量之间不精确、不稳定的变化关系。
推断统计(Inferential Statistics):根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测。
二项分布:重复进行n次二项试验后不同成功次数x所对应的概率分布。
正态分布:如果随机变量X的概率密度函数为f(x)=(自己写公式),则称X服从正态分布。
t分布:又称“学生分布”,如果随机变量t的概率密度函数为f(t)=(自己写公式),则称t服从t分布。
自由度:总体参数估计量中变量值独立自由变化的个数。
简单随机抽样:从总体中完全以随机形式抽取若干个个体组成一个样本。
在抽取过程中,总体中每个个体被抽到的概率是均等的,并且在任何一个个体被抽取之后总体内成分不变。
分层随机抽样:按有关的因素或指标经总体划分为互不重叠的几个层,再从各层中独立地抽取一定数量的个体,最后将从各层中抽取的个体合在一起,组成一个样本。
机械抽样:先将总体中的所有个体按顺序编号,然后每隔一定的间隔抽取个体,组成样本。
整群抽样:以整群为单位的抽样方法,即从总体中抽取的个体同属于某个群体。
标准误:样本统计量的标准差,例如:样本平均数的标准差。
点估计:根据样本的观察值计算出一个与θ相应的估计值,用这个估计值直接作为对参数θ的估计。
区间估计:根据样本的观察值计算出两个估计值θ1^和θ2^,,用区间(θ1^,θ2^)作为参数θ可能的取值范围,并指出参数θ落在这一区间的概率。
无偏性:若E(θ^)=θ,则θ^为θ的无偏估计量。
(意思到了就OK)
有效性:多个无偏估计量中方差最小的最有效。
(同上)
一致性:若limθ^(n→+∞)=θ,则称θ^为θ的一致估计量。
(lim式子格式自己理一下)
相关样本:在样本之间有互相影响的条件下抽取的到的样本,两个样本内个体之间存在着一一对应的关系。
独立样本:分别独立抽取的样本,抽取其中任何一个样本都不会对抽取另一个样本产生任何影响,两个样本内个体之间不存在对应关系。
积差相关系数:表示两个呈线性关系的正态连续变量之间的相关程度的特征量,它是协方差除以两个变量的标准差所得的值。
等级相关系数:表示顺序水平的变量之间的相关程度的特征量。
肯德尔和谐/一致性系数:用来表示多个顺序水平的变量之间的相关程度的等级相关系数。
常用于分析多个评定者对同一组个体进行等级评定的一致性程度,或同一个评定者对同一组个体进行多次等级评定的一致性程度。
回归分析:利用一个变量或一组变量的变化来估计或预测另一个变量或一组变量的变化情况。
非参数检验:不涉及总体参数的假设检验。
非参数检验的特点:①无须假定总体的分布形态,对资料的计量水平要求不高;
②适用于小样本;③方法简单易掌握。
X²(卡方)检验:是一种用途很广的计数资料的假设检验方法,属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。
其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。
X²(卡方)检验的特点:?
X²(卡方)值的特点:具有可加性、永远为正、大小随实际频数与理论频数差的大小而变化
X²(卡方)分布的特点:1.呈正偏态,右侧无限延伸,但永不与基线相交;
2.随自由度的变化而形成一簇分布形态;
3.自由度越小,卡方分布偏斜度越大,自由度越大,卡方分布形态越趋于对称。
先验概率(prior probability):是指根据以往经验和分析得到的概率,如全概率公式。
后验概率:是指在得到“结果”的信息后重新修正的概率,如贝叶斯公式。