华东师范大学心理统计笔记

合集下载

心理统计学学习笔记数据整理

心理统计学学习笔记数据整理
E(#)=μ, σx2 =σ2 /n
即#~N(μ, σ2 /n)
Z=(#-μ)σ/n1/2
Eg:一次测验,μ=100 σ=5
从该总体中抽样一个容量为25的简单随机样本,求这一样本均值间于99到101的概率?
解:已知X~N(100,52)
n=25.
则#~N(100,12)
Z=(#-100)/1~N(0,1)
4.定各组限
5.求组值 X=(上限+下限)/2上限——指最高值加或取10的倍数等)
6.归类划记
7.登记次数
例题:99 96 92 90 90(I) R=99-57+1=43
87 86 84 83 83
8282 80 79 78 (II)K=1.87(50-1)。。。≈9
7878 78 77 77
7776 76 76 76
简单平均数:(70+80)/2
三.中(位)数。(Md)
1.原始数据计算法
分:奇、偶。
2.频数分布表计算法(不要求)
3.优点,缺点,适用情况(p42)
四.众数(Mo)
1.理论众数
粗略众数
2.计算方法:Mo=3Md-2#
Mo=Lmo+fa/(fa+fb)*I
计算不要求
3.优缺点
平均数,中位数,众数三者关系。
W(A)=m/n (频率/相对频数)
后验概率:
P(A)=lim m/n
先验概率:不用做试验的
二.概率的性质和运算
1.性质:o≤P≤1
p=1必然可能事件
p=0不可能事件
2.加法。
P(a+b)=P(a)+P(b)
“或”:两互不相克事件和。
推广:“有限个” P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)

《心理统计学》重要知识点

《心理统计学》重要知识点

《⼼理统计学》重要知识点《⼼理统计学》重要知识点第⼆章统计图表简单次数分布表得编制:Excel 数据透视表列联表(交叉表):两个类别变量或等级变量得交叉次数分布,Excel 数据透视表直⽅图(histogram):直观描述连续变量分组次数分布情况,可⽤Excel 图表向导得柱形图来绘制散点图(Scatter plot):主要⽤于直观描述两个连续性变量得关系状况与变化趋向。

条形图(Bar chart):⽤于直观描述称名数据、类别数据、等级数据得次数分布情况。

简单条形图:⽤于描述⼀个样组得类别(或等级)数据变量次数分布。

复式条形图:⽤于描述与⽐较两个或多个样组得类别(或等级)数据得次数分布。

圆形图(circle graph)、饼图(pie graph):⽤于直观描述类别数据或等级数据得分布情况。

线形图(line graph):⽤于直观描述不同时期得发展成就得变化趋势;第三章集中量数●集中趋势与离中趋势就是数据分布得两个基本特征。

●集中趋势:就就是数据分布中⼤量数据向某个数据点集中得趋势。

●集中量数:描述数据分布集中趋势得统计量数。

●离中趋势:就是指数据分布中数据分散得程度。

●差异量数:描述数据分布离中趋势(离散程度)得统计量数●常⽤得集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):nx X i∑= Excel 统计函数AVERAGE算术平均数得重要特性:(1)⼀组数据得离均差(离差)总与为0,即0)(=-∑x x i(2)如果变量X 得平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后,那么,变量Y 得平均数X b a Y +=2.中位数(median,M d ):在⼀组有序排列得数据中,处于中间位置得数值。

中位数上下得数据出现次数各占50%。

3.众数(mode,M O ):⼀组数据中出现次数最多得数据。

4.算术平均数、中数、众数之间得关系。

心理统计学知识点完整版资料整理

心理统计学知识点完整版资料整理

心理统计学知识点完整版资料整理1.数据的概念:在心理统计学中,数据是指信息的收集和组织形式。

数据可以是数字,也可以是文字或符号。

数据的收集可以通过实验、调查、观察等方式进行。

2.数据的分布:在心理统计学中,数据的分布是指通过统计方法和图表来展示数据的特征和规律。

常用的数据分布包括正态分布、偏态分布、均匀分布等。

3.描述性统计:描述性统计是用来描述和总结数据的方法。

常见的描述性统计包括均值、中位数、众数、标准差、变异系数等。

4.推论统计:推论统计是根据样本数据来对总体进行推断的方法。

推论统计主要包括参数估计和假设检验两个方面。

5.参数估计:参数估计是用样本数据来估计总体参数的值。

常见的参数估计方法包括点估计和区间估计。

6.假设检验:假设检验是用来判断总体参数是否满足一些假设的方法。

其中包括设置原假设和备择假设、选择显著性水平、计算统计量、确定拒绝域等步骤。

7.相关分析:相关分析用来研究两个或多个变量之间的关系。

其中最常用的是皮尔逊相关系数,可以用来衡量变量之间的线性相关程度。

8.回归分析:回归分析用来研究一个或多个自变量和因变量之间的关系。

通过回归分析可以得到回归方程,进而预测因变量的值。

9.方差分析:方差分析是一种用来研究多个样本之间差异的方法。

方差分析可以判断不同组之间的均值是否存在显著差异。

10.非参数统计:非参数统计是一种不依赖于总体参数的方法。

非参数统计主要包括秩次统计和分布自由度较小的统计方法。

11.实验设计:实验设计在心理统计学中扮演着重要的角色。

良好的实验设计可以保证实验的可靠性和有效性,并排除干扰因素。

12.抽样方法:抽样方法是指如何从总体中选取样本的方法。

常见的抽样方法包括随机抽样、系统抽样、整群抽样等。

以上是心理统计学的一些主要知识点的简要整理。

了解这些知识点可以帮助我们更好地理解和应用统计方法来分析心理学中的数据。

当然,心理统计学的内容还非常广泛,还有更多的知识点值得深入学习和研究。

华东师大实验心理学复习笔记

华东师大实验心理学复习笔记

华东师大实验心理学笔记第一章绪论&1.观察与实验一.实验的意义以精密的控制获得正确的结果eg:下落物体的重量与下落时间的关系。

物体高度,初速大小,重量,形状质地,etc时间为因变量,其他均为控制变量二.心理学研究涉及的变量1.自变量——可操纵〔对一个事物〕,选择〔男女,被试年龄。

〕刺激变量〔一般都可操纵〕被试变量〔一般是用选择的方法〕2.因变量——测量〔包括计数〕3.干扰变量〔或称控制变量〕也包括刺激变量,被试变量。

三.思考1.学习以后,再现之前,插入学习材料的多少与原来学习材料的遗忘情况之间的关系。

2.对外语单词每次记多少个〔自变量〕比较合适,测验做对的题数〔因变量〕。

3.视力〔自变量〕对字词再认〔因变量〕再认的影响4.男女生〔性别自~〕对电脑爱好差异〔程度因~〕5.小学生可否学代数年龄〔小学生/中学生自~〕〔学会/学不会因~〕6.培养自学能力,提高教学质量。

〔培养/不培养自~〕〔成绩因~〕7.说出变量控制上的问题(i) 一学校用电脑辅助教学,一组用PC机,一组用Apple机结论:用电脑好。

X.因为是在比较不同的机型。

(ii) 一老是用电脑辅助口算数学。

一节课后测验,发现用电脑的学生的成绩高于不用电脑的学生。

〔智商,水平,性别,年龄都一样〕结论:用电脑好 X.〔因为情绪变量设有控制〕用CIA,兴奋。

&2.心理学实验设计的基本问题一.问题的选定从某理论,从生活经验二.选定实验目的检验何种自变量与何种因变量之间的关系三.实验方法〔程序〕eg:(I)A~B 对照〔两组〕(ii)ANA (一组)方法一——N(新方法)——方法——(iii)ANNAAN…随机〔一组〕四.〔被试〕选择对象五.时间,地点,人员,材料&3.实验报告的写法一.题目二.关键词 3~5个三.引言。

从前的实验。

引用的话。

自己的目的,原实验有何矛盾,问题。

四.方法五.结果〔不下结论〕统计检验,有无显著性差异〔也可能有引用,要注明〕六.讨论〔自由发挥〕七.结论强调结果八.参考文献九.附录〔原始数据,资料〕带有统计编号意义的用阿拉伯数字〔年月日,时间也是〕约数用中文〔不要顿号〕,个位数也常用中文,文献中,古籍——中文,现代——数字万,亿,兆可压缩—— 3千”X”第二章反应时&1一般问题一.人差方程 A-B=0.5二.反应时没有反应的时间〔又叫反应潜伏期〕三.唐德斯,反应时A,B,C 图〔略〕四.反应时的测定&2.减法反应时一.减法反应时的定义任务一与任务二只差一个要研究的环节,两反应时相减得到的结果即要研究的环节的反应时。

心理统计笔记—名词解释

心理统计笔记—名词解释

心理统计笔记—名词解释第一章:描述性统计统计:描述性统计descriptive statistics推断性统计inferential statistics#描述性统计主要是对一组给定的测量数据进行总结的方法,而推断性统计是把对给定数据的测量结果推广到更大的潜在数据集的方法。

变量variable和常量constant变量:连续变量continuous variable & 离散变量discrete variable一个具有有限水平但相邻水平之间不再可能赋值的变量被称为离散变量。

一个可以无穷小精确度来测量的变量(至少在理论上,可是求两个任意小的测量水平之间的中间值)被称为连续变量。

自变量indepentent variable & 因变量dependent variable称名/类别量尺(nominal/categorical scale):数字是强制定义的,不可计算。

顺序/等级量尺(ordinal scale):不是简单分类,而是有一定顺序。

然而,这些排名数字并不能看作真正的数值,因为等级之间不是等距的。

研究者在对这类的数据进行数学运算时,已经假设它们是等距数据了。

等距和等比量尺(interval and ratio scales):不但具有等距特征,而且还兼具等比特征的量尺被称之为等比量尺。

尽管所有等比量尺都有等距特征,但有些量尺只有等距特征而不具备等比特征。

这些量尺被称为等距量尺。

等距量尺是没有真正零点的。

E.g. 摄氏和华氏温度,IQ值等。

#不能混淆变量和用来测量变量的量尺。

同一个变量可以用多种量尺来测量,例如:测量温度可以用顺序量尺(第一热,第二热),也可以用等距量尺(摄氏/华氏度),还可以用等比量尺(开尔文,有绝对零度)。

尽管在终极意义上,所有量尺都是离散的,但是具有很多水平的量尺通常被认为是连续的,而水平相对少的量尺则当作离散处理。

而用于测量离散变量的量尺总是离散的。

参数统计(parameter statistics)和非参数统计:基于分布及其参数的统计方法叫参数统计。

《教育统计学》(王孝玲版)超详细知识点及重点笔记

《教育统计学》(王孝玲版)超详细知识点及重点笔记

华东师大心理统计学大纲教材:《教育统计学》(王孝玲编著,修订版)华东师范大学出版社 1993年6月第一版第一章绪论第一节什么是统计学和心理统计学一、什么是统计学 统计学是研究统计原理和方法的科学。

具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。

统计学分为两大类。

一类是数理统计学。

它主要是以概率论为基础,对统计数据数量关系的模式加以解释,对统计原理和方法给予数学的证明。

它是数学的一个分支。

另一类是应用统计学。

它是数理统计原理和方法在各个领域中的应用,如数理统计的原理和方法应用到工业领域,称为工业统计学;应用到医学领域,称为医学统计学;应用到心理学领域,称为心理统计学,等等。

应用统计学是与研究对象密切结合的各科专门统计学。

二、统计学和心理统计学的内容 统计学和心理统计学的研究内容,从不同角度来分,可以分为不同的类型。

从具体应用的角度来分,可以分成描述统计,推断统计和实验设计三部分。

1.描述统计 对已获得的数据进行整理、概括,显示其分布特征的统计方法,称为描述统计。

2.推断统计 根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推断统计。

推断统计的内容包括总体参数估计和假设检验两部分。

3.实验设计 实验者为了揭示试验中自变量和因变量的关系,在实验之前所制定的实验计划,称为实验设计。

其中包括选择怎样的抽样方式;如何计算样本容量;确定怎样的实验对照形式;如何实现实验组和对照组的等组化;如何安排实验因素和如何控制无关因素;用什么统计方法处理及分析实验结果,等等。

以上三部分内容,不是截然分开,而是相互联系的。

第二节统计学中的几个基本概念 一、随机变量 具有以下三个特性的现象,成为随机变量。

第一,一次试验有多中可能结果,其所有可能结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复试验。

心理统计知识点总结

心理统计知识点总结

心理统计知识点总结一、概率论基础1. 概率的概念概率是描述不确定事件发生的可能性大小的数学工具。

在心理统计学中,概率的概念是最为基础的,它是研究随机事件发生规律的重要工具。

对于心理学研究中的一些数据,比如随机实验结果、样本分布等,都可以用概率论的方法来进行研究和分析。

2. 随机变量和概率分布随机变量是描述随机试验结果的一种数学抽象,它是对可能的试验结果的一种量化描述。

概率分布则是用来描述随机变量可能取值的规律。

心理学研究中常见的随机变量有多种类型,比如二项分布、正态分布等,它们都可以用来描述心理学中一些随机试验的结果。

3. 样本空间和事件空间在概率论中,样本空间是指随机试验中所有可能结果的集合,而事件空间则是样本空间中的一个子集,表示某一特定事件发生的可能性。

在心理学研究中,样本空间和事件空间的概念是用来描述研究对象的各种可能结果和事件的可能发生的空间。

4. 条件概率和贝叶斯定理条件概率是指在某一事件发生的条件下,另一事件发生的概率。

贝叶斯定理则是用来描述两个事件之间的相互关系的定理。

在心理学研究中,条件概率和贝叶斯定理可以用来分析一些复杂的事件之间的概率关系,从而揭示心理学中一些复杂事件之间的规律。

二、描述统计学1. 中心趋势的度量中心趋势是用来描述一组数据集中趋向于集中的程度。

心理学研究中,常用的中心趋势度量有均值、中位数、众数等。

这些度量方法可以用来描述一组数据的集中趋势,从而揭示一组数据的集中程度。

2. 离散程度的度量离散程度是用来描述一组数据分散程度的度量。

心理学研究中,常用的离散程度度量有标准差、方差、极差等。

这些度量方法可以用来度量一组数据的分散程度,从而揭示一组数据的分散程度。

3. 正态分布和假设检验正态分布是一种最为常见的概率分布,它在心理学研究中有着重要的应用。

假设检验则是用来检验一组数据是否符合某种特定分布的方法。

在心理学研究中,正态分布和假设检验可以用来判断一组数据是否符合正态分布,从而进行后续的统计分析。

心理学考研之心理统计学笔记

心理学考研之心理统计学笔记

心理学考研之心理统计学笔记The document was prepared on January 2, 2021心理统计学笔记1基本概念总体:具有某些共同的、可观测特征的一类事物的全体,构成总体的每个基本单元称为个体样本:由于不能或没必要对整个总体进行研究,我们只能从总体中选择出一些个体代表总体,这些个体的集合叫样本变量:本身是变化的或者对于不同个体有不同值得特征或条件常量:本身不变且对不同的个体的值也相同参数:描述总体的数值,它可以从一次测量中获得,也可以从总体的一系列测量中推论得到比例:全组中取值为X的比例,p=f/N插值法:一种求两个已知数值之间中间值的方法,其假设所求解点附近数据呈线性变化统计量:描述样本的数值,与参数的获得方式相同随机取样:从总体抽取样本的一种策略,要求总体中的每一个个体被抽到的机会均等取样误差:样本统计量与相应的总体参数之间的差距偏态分布:分数堆积在分布的一端,而另一端成为比较尖细的尾端,其与对称分布对应次数分布:一批数据在某一量度的每一个类目所出现的次数情况离散型变量:由分离的、不可分割的范畴组成,临近范畴之间没有值存在连续型变量:在任何两个观测值之间都存在无限多个可能值,它可被分割成无限多个组成部分2学习建议①将注意放在概念上,心理统计应该是一门概念性的科学,而非纯数学.②一定要将统计方法与心理学研究的情景结合起来学习.③弄懂一个概念再开始学习下一个,心理统计中的概念应用性较差却是之后做题的基础.④做题按照推荐格式能避免出错几率.3统计检验总表数据类型单样本问题独立样本比较相关样本比较多组样本的比较相关问题独立样本重复测量等距型总体正态分布单样本t/z检验独立样本t/z检验相关样本t检验独立样本方差分析重复测量方差分析Pearson积差相关分布形态未知大样本下的相应的t/z检验大样本下的相应的t/z检验大样本下的相应的t检验转化为顺序型转化为顺序型顺序型符号检验法曼-惠特尼维尔克松克-瓦氏单向弗里德曼双向等级SpearmanU检验T检验方差分析方差分析等级相关命名型χ2匹配度检验χ2独立性检验符号检验法χ2独立性检验χ2独立性检验一、描述统计描述统计是指用来整理、概括、简化数据的统计方法,侧重于描述一组数据的全貌,表达一件事物的性质.一统计图表统计表和统计图简单明确、生动直观地表达数量关系,具有一目了然、整洁美观、容易理解等特点.它们是对数据进行初步整理,以简化的形式加以表现的两种最简单的方式.在制定统计图表之前,一般首先要对数据进行以下两种初步整理:①数据排序:按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列②统计分组:根据被研究对象的特征,将所得到数据划分到各个组别中去1.统计图统计图:用点、线、面的位置、升降或大小来表达统计资料数量关系的一种陈列形式组成:坐标轴、图号、图题、图目、图尺、图形、图例、图注分类:条形图、圆图、线性图、直方图、散点图、茎叶图2.统计表统计表:将要统计分析的事物或指标以表格的形式列出来,以代替烦琐文字描述的一种表现形式组成:隔开线、表号、名称、标目、数字、表注分类:简单表、分组表、复合表二集中量数集中量数又叫集中趋势,是体现一组数据一般水平的统计量.它能反映频数分布中大量数据向某一点集中的情况.1.算数平均数1定义算数平均数:即所有观察值的总和与总频数之商,简称为平均数或均数平均数一般与标准差、方差相结合使用.2特点①在一组数据中每个变量与平均数之差的总和等于零②在一组数据中,每一个数都加上一个常数C,所得的平均数为原来的平均数加常数C③在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C3意义算数平均数是应用最普遍的一种集中量数,它在大多情况下是真值最好的估计值.4优缺点优点:反应灵敏、计算严密、计算简单、简明易解、适合于进一步用代数方法盐酸、较少受抽样变动的影响缺点:易受极端数据的影响、不能在出现模糊数据时计算2.中数1定义中数:按顺序排列在一起的一组数据中居于中间位置的数,在这组数据中,有一半数据比它大,一般数据比它小,等价于百分位数是50的那个数.2算法①数列总个数为奇数时,第 n+1/2 个数就是中数②数列总个数为偶数时,可取位于中间的两个数的平均数作为中数③分布中有相等的数时,将重复的数字看成一个连续体,利用中间分数的精确上下限使用插值法3优缺点优点:计算简单、容易理解、不受极端值影响、能在有模糊数据情况下使用、可在顺序型数据时使用缺点:代表性低、不够灵敏、稳定性低、需要排序、不能进一步做代数运算3.众数1定义众数:在次数分布中出现次数最多的那个数的数值众数可能不只一个.在正偏态分布时,平均数最靠近尾端,中数位于其与众数之间. 2优缺点优点:能在数据不同质的情况使用,能避免极端值干扰缺点:不稳定、代表性差、不够灵敏、不能做进一步的代数运算三差异量数差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数.1.离差与平均差离差:分布中的某点到均值得距离,其符号表示了某分属于均值之间的位置关系而数值表示了它们之间的绝对距离离差之和始终为零.平均差:次数分布中所有原始数据与平均数绝对离差的平均值2.方差与标准差和方:每一个离差值平房求和由于离差正负值互相抵消无法代表离中趋势我们引入和方的概念1总体的方差和标准差方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平房后的均数作为样本统计量用符号s2表示,作为总体参数用符号σ2表示,也叫均方.标准差:方差的平方根作为样本统计量用符号s表示,作为总体参数用符号σ表示.2样本的方差和标准差样本的变异性往往比它来自的总体的变异性要小.为了校正样本数据带来的偏差,在计算样本方差时,我们用自由度来矫正样本误差,从而有利于对总体参数更好的无偏差估计:3性质①每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原来的标准差②每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数4意义方差与标准差是表示一组数据离散程度的最好指标,它们是统计描述与统计推断分析中最常用的差异量数,它们的优点有:反应灵敏、计算严谨、计算容易、适合代数运算、受抽样变动影响小、意义简单明了3.变异系数当遇到下列情况时,不能用绝对差异量来比较不同样本的离散程度,而应当使用相对差异量数,最常用的就是差异系数.①两个或两个以上样本所使用的观测工具不同,所测的特质相同②两个或两个以上样本使用的是同种观测工具,所测的特质相同,但样本间水平差异较大差异系数:一种最常用的相对差异量,为标准差对平均数的百分比四相对量数1.百分位数百分位数:在整个分布中,在某一值之下或等于该值的分数的百分比,所对应的分数百分位数和百分等级是同一操作定义的两端.当我们求累计次数占总体的百分比是,所对应的分数和百分比的值分别为百分位数和百分等级.2.百分等级百分等级:常模团体中低于该分数的人所占总体的百分比百分等级一定要对应分数区间的精确上限.百分等级和百分位数都可以由已知数据用差值法求解.3.标准分数1定义标准分数:以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,也叫Z 分数离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置.2性质①Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量②一组原始分数转换得到的Z分数可正可负,所有原始分数的Z分数之和为零③原始数据的Z分数的标准差为1④若原始分数呈正态分布,则转换得到的所有Z分数均值为0,标准差为1的标准正态分布3优点①可比性——不同性质的成绩,一经转换为标准分数,就可在同一背景下比较②可加性——不同性质的原始数据具有相同的参照点,因此可相加③明确性——知道了标准分数,利用分布寒暑表就能知道其百分等级④稳定性——转换成标准分数之后,规定了标准差为1,保证了不同性质分数在总分数中权重一样4应用①比较几个分属性质不同的观测值在各自数据分布中相对位置的高低②计算不同质的观测值得总合或平均值,以表示在团体中的相对位置③若标准分数中有小数、负数等不易被人接受的问题,可通过 Z'=aZ+b 的线性公式将其转化成新的分数如韦氏成人智力量表五相关量数由于实验法适用范围的限制,有的时候我们只能对变量间进行相关研究,也就是看两者是否有互相跟随的变化关系.相关研究所得到的是一种描述统计,我们仅仅能用其描述两个变量互相跟随的程度大小,至于他们之间是否有因果关系或者是共变关系则不可妄下定论.相关系数:两列变量间相关程度的数字表现形式作为样本的统计量用r表示,作为总体参数一般用ρ表示.正相关:两列变量变动方向相同负相关:两列变量中有一列变量变动时,另一列变量呈现出与前一列变量方向相反的变动零相关:两列变量之间没有关系,各自按照自己的规律或无规律变化1.积差相关也就是Pearson相关.1前提①数据要成对出现,即若干个体中每个个体都有两种不同的观测值,并且每队数据与其它对子相互独立②两列变量各自总体的分布都是正态的,至少接近正态③两个相关的变量是连续变量,也即两列数据都是测量数据④两列变量之间的关系应是直线性的2公式r也就等于X和Y共同变化的程度除以X和Y各自变化的程度.2.等级相关也就是Spearman相关1适用范围①当研究考察的变量为顺序型数据时,若原始数据为等比货等距,则先转化为顺序型数据②当研究考察的变量为非线性数据时2公式将原始数据转化为顺序型数据,仍然用Pearson相关公式计算即可.3.肯德尔等级相关1肯德尔W系数也叫肯德尔和谐系数,原始数据资料的获得一般采用等级评定法,即让K个被试对N件实物进行等级评定.其原理是评价者评价的一致性除以最大变异可能性.代表评价对象获得的K个等级之和RiN代表等级评定的对象的树木K代表等级评定者的数目2肯德尔U系数其与肯德尔W系数所处理的问题相同,但评价者采用对偶比较法,即将N件事物两两配对分别进行比较为对偶比较记录表中i>j格中的择优分数rij4.点二列相关与二列相关1点二列相关适用于一列数据为等距正态变量,另一列为离散型二分变量.X是与二分称名变量的一个值对应的连续变量的平均数pX是与二分称名变量的另一个值对应的连续变量的平均数qp与q是二分称名变量两个值各自所占的比率s是连续变量的标准差t2二列相关适用于两列变量都是正态等距变量,但其中一列变量被人为地分成两类.y为标准正态曲线中p值对应的高度,查正态分布表能得到5.Ф相关适用于两个变量都是只有两个点值或只表示某些质的属性.其中a、b、c、d分别为四格表中左上、右上、左下、右下的数据二、推断统计推论统计就是指运用一系列的数学方法,将从样本数据中获得的结果推广到样本所在的总体.进行推论统计的关键在于所抽取的样本要能够尽量接近所要研究的总体.一推断统计的数学基础1.概率概率:表明随即时间出现可能性大小的客观指标概率的定义包含以下两种,当观测次数够多时他们是相等的.后验概率:对随机事件进行n次观察,某一事件A出现的次数m与观测次数n的比值在n趋近无穷时所稳定在的常数p先验概率:在满足试验可能结果数有限且每一种结果出现的可能性相等的条件下,随机事件包含的结果数除以结果总数2.正态分布当样本量足够大时,我们会发现生活中许多变量的分布都近似于正态曲线,因此有“上帝偏爱正态分布”一说.1特点①正态曲线的形状就像一口挂钟,呈对称分布,其均值、中数、众数实际上对应于同一个数值②大部分的原始分数都集中分布在均值附近,极端值相对而言比较少③曲线两端向靠近横轴处不断延伸,但始终不会与横轴向交④正态分布曲线转化为z分数后人以z分数与零点对应曲线下面积固定2用法①依据Z分数求概率,即已知标准分数求面积②从概率求Z分数,即从面积求标准分数值③已知概率或Z值,求概率密度,即正态曲线的高3.二项分布二项分布:对于一个事件有两种可能A和B,但我们对这一事件观察n次,事件A发生的总次数的概率分布就是二项分布μ=二项分布的均值为pnσ=方差公式为2npq标准差的公式为σ=4.抽样原理与抽样方法1抽样原理抽样的基本原则是随机性原则,所谓随机性原则,是指在进行抽样时,总体中每一个个体是否被抽选的概率完全均等.由于随机抽样使每个个体有同等机会被抽取,因而有相当大的可能使样本保持和总体有相同的结构,或者说,具有最大的可能使总体的某些特征在样本中得以发现,从而保证由样本推论总体.2抽样方法①简单随机取样法②系统随机取样法③分层随机取样法④多段随机取样法5.抽样分布样本分布:样本统计量的分布,是统计推论的重要依据1正态分布及渐近正态分布样本统计量为正态分布或者接近正态分布的情况都可根据正态分布的概率进行统计推论.总体分为正态或接近正态,方差已知,样本平均数和方差的分布为正态分布①样本平均数分布的平均数和方差与母体的平均数和方差有如下关系:②样本的方差及标准差的分布也渐趋于正态分布,其分布的平均数与标准差和总体有如下关系:2t 分布t 分布是一种与方差无关而与自由度有关的分布,很类似正态分布,我们可以将正态分布看作t 分布当自由度为正无穷时的特例.总体分布为正态,方差未知时,样本平均数的分布为t 分布:X σ= 其中1n s -= 3χ2分布χ2分布的构造是从一个服从正态分布的总体中每次抽去n 个随机变量,计算其平方和之后标准化的一个分布.分布曲线下的面积都是1,但伴随着n 取值的不同,自由度改变,曲线分布形状不同,而当自由度趋近于正无穷时χ2分布即为正态分布,因此其于t 分布一样都是一族分布,而正态分布都是其中的特例.4F 分布如果有两个正态分布的总体,我们从其中各自取出两个样本,各自计算出χ2,则: 更多情况下,我们所计算的F 两样本取自相同总体,此时可将上式化简为:二参数估计当在研究中从样本获得一组数据后,如何通过这组信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,称为总体参数估计.总体参数估计问题可以分为点估计与区间估计.1.点估计、区间估计与标准误良好估计量的标准①无偏性——用多个样本的统计量估计总体参数的估计值,其偏差的平均数为零②有效性——当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好③一致性——当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数④充分性——样本的统计量是否充分地反映了全部n个数据所反映总体的信息点估计:用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计结果也以一个点的数值表示区间估计:根据估计量以一定可靠程度推断总体参数所在的区间范围,这个区间就叫做置信区间,相应的概率成为置信度,这两个量是共通变化的,置信区间越大,置信度越高;区间估计是用数轴上的一段距离表示未知参数可能落入的范围及落入该范围的概率.标准误:样本平均数分布的标准差总体方差未知时用估算的总体方差计算标准误.2.总体平均数的估计当总体方差未知时,则使用t分布对应置信度3.标准差与方差的区间估计1标准差的区间估计2方差的区间估计三假设检验可以说,每一个实验的存在,仅仅是为了给事实一个反驳虚无假设的机会. ——1.假设检验的原理假设检验:统计学中的一种推论过程,通过样本统计量得出的差异作为一般性结论,判断总体参数之间是否存在差异假设检验的实质是对可置信性的评价,是对一个不确定问题的决策过程,其结果在一定概率上正确的,而不是全部.1两类假设对于任何一种研究而言,其结果无外乎有两种可能,即是否符合我们预期.一般来说证伪一件事情比证实一件事容易,在行为科学的研究中,由于我们无法了解总体中除样本以外的个体情况,因此尝试拒绝虚无假设的方法优于证明备择假设.备则假设:因变量的变化、差异却是是由于自变量的作用往往是我们对研究结果的预期,用H1表示.虚无假设:实际上什么也没有发生,我们所预计的改变、差异、处理效果都不存在观察到的差异只是随机误差在起作用,用H0表示.2小概率原理小概率原理:小概率事件在一次试验中几乎是不可能发生的至于什么就算小概率事件,那就是我们在计算前明确的决策标准,也就是显着性水平α.在检验过程中,我们假设虚无假设是真实的,同时计算出观测到的差异完全是由于随机误差所致的概率.之后将其与我们实现界定好的显着性水平比较,从而考虑是否依据小概率原理来拒绝虚无假设.3两类错误本部分内容请参照实心信号检测论对照来看. ——MJ注Ⅰ型错误:当虚无假设正确时,我们拒绝了它所犯的错误,也叫α错误研究者得出了处理有效果的结论,而实际上并没有效果,即所谓“无中生有”Ⅱ型错误:当虚无假设是错误的时候,我们没有拒绝所犯的错误,也叫β错误假设检验未能侦查到实际存在的处理效应,即所谓“失之交臂”两类检验的关系①α+β不一定等于1②在其他条件不变的情况下,α与β不可能同时减小或增大4检验的方向性单侧检验:强调某一方向的检验,显着性的百分等级为α双侧检验:只强调差异不强调方向性的检验,显着性百分等级为α/2对于同样的显着性标准,在某一方向上,单侧检验的临界区域要大于双侧检验,因此如果差异发生在该方向,单侧检验犯β错误的概率较小,我们也说它的检验效力更高.5假设检验的步骤①根据问题要求,提出虚无假设和备择假设②选择适当的检验统计量③确定检验的方向性并规定显着性水平④计算检验统计量的值⑤将统计量的值与临界值对比做出决策2.样本与总体平均数差异的检验1总体正态分布且方差已知obs X X z μσ-=其中X σ=0μ和0σ分别为总体的平均数和方差2总体正态分布而方差未知0obs X X t s μ-=其中X s =S =S 为用样本和方估算出的总体方差3.两样本平均数差异的检验12obs obs D X X X Z t σ-==这是两样本平均数检验的通用公式,所不同的仅在于标准误的计算1总体方差已知①独立样本②相关样本D X σ=r 为两组变量之间的相关系数2总体方差未知①独立样本方差差异不显着时②相关样本a.相关系数未知:D X σ=其中d 为每一对对应数据之差b.相关系数已知:D X σ=4.方差齐性检验1样本方差与总体方差当从正态分布的总体中随机抽取容量为n 的样本时,其样本方差与总体方差比值服从χ2分布:2220ns χσ=由自由度1df n =-查χ2表,依据显着性水平判断2两个样本方差之间①独立样本22s F s =大小其中当两样本自由度相差不大时可用n s 代替n-1s查表时11221,1df n df n =-=-②相关样本22t =其中2df n =-5.相关系数的显着性检验①积差相关a.当ρ=0时:t =其中2df n =-b.当ρ≠0时:先通过查表将r 和ρ转化为费舍Z r 和Z ρ然后进行Z 检验②等级相关和肯德尔W 系数在总体相关系数为零时:查各自的相关系数表,判定样本相关显着四方差分析1.方差分析的原理与基本过程1方差分析的概念方差分析的目的是推断多组资料的总体均数是否相同,也即检验多组数据之间的均数差异是否有统计意义.当我们用多个t 检验来完成这一过程时,相当于从t 分布中随机抽取多个t 值,这样落在临界范围之外的可能大大增加,从而增加了Ⅰ型错误的概率.我们可以把方差分析看作t 检验的增强版.2方差的可分解性方差分析依据的基本原理就是方差的可加性原则.作为一种统计方法,方差分析把实验数据的总变异分解为若干个不同来源的分量.数据的变异由两部分组成:组内变异:由于实验中一些希望加以控制的非实验因素和一些未被有效控制的未知因素造成的变异,如个体差异、随机误差组内变异是具体某一个处理水平之内的,因此在对总体变异进行估计的时候不涉及研究的处理效应.组间差异:不仅包括组内变异的误差因素,还包括了是不同组所接受的实验处理不同造成的影响如果研究数据的总变异是由处理效应造成的,那么组间变异在总变异中应该占较大比例.B MS 表示组间方差,B B B SS MS df =,1B df k =-,k 表示实验条件的个数 W MS 表示组内方差,W W WSS MS df =,()1W df k n =-,n 表示每种实验条件中的被试个数 3方差分析的基本假定①样本必须来自正态分布的总体②每次观察得到的几组数据必须彼此独立③各实验处理内的方差应彼此无显着差异为了满足这一假定,我们可采用最大F 比率法2max max2min s F s =,求出各样本中方差最大值与最小值的比,通过查表判断.4方差分析的基本步骤Ⅰ 求平方和①总平方和是所有观测值与总平均数的离差的平方总和 ()22T G SS X N =-∑其中G 表示所有数据的总合,N 表示总共的数据个数。

心理学考研笔记心理统计篇

心理学考研笔记心理统计篇

第一章绪论统计学内容(凑字数):(1)描述统计(整理数据):第二章图表第三章集中量数第四章差异量数第五章相关(2)推论统计(推断总体):第七章参数估计;第八第十第十一章假设检验。

(3)实验设计(取样,实验条件控制,结果分析):第九章方差第十二章回归第十三章因子分析第十四章样本选择数据类型:(1)观测方法:计数数据:能数出来的计量数据:用工具量的(2)测量水平:称名数据:类别顺序数据:类别、次序--------心理测验的原始数据是这个等距数据:类别、次序、相差程度-------心理测验数据都会转换成这个等比数据:类别、次序、相差程度、相差比例(3)是否连续:离散数据:非连续,有个数能数出来连续数据:中间可以无限细分出无数个值第二章图表统计表:(1)次数表:简单次数分布表:无论什么类型数据只要用来记录次数就可,数据少时使用分组次数分布表:同样只要记录次数就能用,数据多时使用相对次数分布表:用比率和百分数表示次数。

累加次数分布表:需知道某个数据以下和以上人数时使用。

双列次数分布表:两列变量的次数用同一个表来表示。

不等距次数分布:无法等距分组时使用。

(2)其他表:简单表:无分类分组表:一个分类复合表:多个分类统计图:(1)次数图:直方图(表分布):横坐标连续数据,纵坐标频次次数多边图:直方图条条去掉连成线就是这个。

比直方图轮廓好易看出规律。

累加次数分布图:横坐标(等距数据以上)分组区间;纵坐标(任何记录次数的数据)累加次数累加曲线:累加次数分布图曲线化。

可更好的看出数据的形态(正态,偏态)(2)其他图:条形图(表内容):对计数或离散数据进行描述圆形图(表内容):不连续的数据-----------可以按比例分的数据线形图(表变化):连续型数据进行描述散点图(表相关):横坐标可计数可离散,纵坐标必须连续数据茎叶图(表分布和保留具体数值):两位数的数据次数箱型图(表数据离散状况)第三章集中量数:一组数据的最佳代表值算数平均数:最好的集中量数,能用就用这个(1)何时不能使用:有极端数值时,有模糊数据时。

心理统计-录音笔记

心理统计-录音笔记

1、黄底的是听录音自己加上去的(因看不到,无法知道所加是否正确)。

第一章绪论心理统计:心理统计是研究心理学科的科学方法和工具,是统计学的原理和数学方法在心理学领域中的应用。

心理统计分为描述统计和推论统计两大部分。

描述统计:是把实验中所得到的数据进行概括的整理,得出实验者可利用的信息,用表和图将实验数据形象地表示出来,描述统计的指标有三类,即集中量数、离中量数和数据间的相关。

集中量数,是指一组数据具有代表性的指标,如,平均数、中数、众数。

离中量数,表示一组数据分散程度的指标,如,四分差,标准差,方差。

数据间的相关,是表示成对的两组数据之间的关系的指标。

进行心理实验是为了发现心理现象的客观规律。

心理统计将研究对象的全部称为总体,从总体中抽出的参与实验的部分称为样本。

推论统计就是从样本的数量特征去推论总体的数量特征。

它包括一系列的统计程序:推论的假设、推论的方法步骤和检验推论的可靠性的各种方法等。

描述统计和推论统计是相辅相成,描述统计是推论统计的基础,只有描述统计准确无误,推论统计才具有意义。

第二章数据的初步整理实验数据的类型:计数数据:是准确数,它是一个一个数出来的。

数据形式为计数数据的变量称为离散型变量。

测量数据:是近似数。

测量数据是通过测量工具得到的。

数据形式为测量数据的变量,称为连续性变量。

上限:就是一个数的最末位加上半个单位。

下限:就是一个数的最末位减去半个单位。

用表整理实验数据常用的表格有三种:原始数据表(原始记录表)、次数分布表、实验结果表 全距:就是数据中最大数值的上限与最小数值下限的差。

组距:就是某一组数据上限与下限的差。

中点:符号X’。

假设数据均匀地分布在组距之间,这一组数值的代表点叫中点。

它是这一组数值的上限与下限中间一点的数值。

(计算中点的简单方法是两个数相加,除以2)组距组距=组上限=组下限下限上限中点=21212-++比例:符号小写p 。

部份比全部的比值就是比例。

比例是将全部数据作为一个整体。

《心理统计学》总复习要点1-7章[4]

《心理统计学》总复习要点1-7章[4]

《心理统计学》总复习要点1-7章[4]《心理统计学》总复习要点第一章、第二章基本概念及次数分布表第一节基本概念一、基本概念1.连续变量与离散变量(不连续变量)变量分为连续变量与离散变量(不连续变量)。

连续变量则可以在量表上的任何两点加以细分,可以取得无限多个大小不同的数值。

不连续变量又称离散变量或间断变量,则在量表上的任何两点中只能取得有限个数值。

是一种只能取特殊值而不能取任何值的变量,它代表一个点,而不是一段距离。

2.总体、样本、个体总体是指具有某一种特征的一类事物的全体,构成总体的每一个基本元素称为个体,在总体中按一定规则抽取的一部分个体,称为总体的一个样本。

二、测量水平心理测量的工具一般可以分为四种水平,它们是由测量工具——量尺的水平决定的,量尺也称为尺度。

(一)量尺(Ratio Measurement)用这样的量尺测量出的数据,可以进行加、减、乘和除运算。

这种测量水平的数据特征是有相等单位和绝对零点。

用这种量尺测量得到的数据变量为比率(或等比)变量。

(二)等距量尺(Interval Measurement)只有相等单位,没有绝对零点,这种测量工具称为等距量尺。

等距量尺测出的数据可以进行加和减的运算,而不能进行乘和除的运算。

但是,等距数据的差值可以进行乘、除运算,因为等距数据的差值有一个绝对零点,两个数值相等,差值即为零。

用这种量尺测量得到的数据变量为等距变量。

(三)顺序量尺(Ordinal Measurement)顺序量尺又叫等级量尺,它的特点是:既无绝对零点,又无相等单位。

用这种量尺对研究对象进行测量,只能给对象排个顺序。

顺序量尺的测量结果原则上不能进行加、减、乘、除四则运算。

如有必要的话,只能进行不等式运算。

用这种量尺测量得到的数据变量为顺序变量。

(四)分类量尺(Nominal Measurement)分类测量不包含任何类间数量关系的假定,仅仅是把测量对象分为相同或相异,但在性质上没有哪一类较大,哪一类较小之分。

华东师大心理测量和量表操作笔记

华东师大心理测量和量表操作笔记

提供者:s9076心理测量和量表操作大概的介绍。

凡是客观存在的事物都是有数量的。

――桑代克凡是有数量的东西都是可以测量的。

――麦克尔心理用间接测量。

测量行为,来推测心理。

心理测量的结果不绝对。

I.心理测量的发展史一.中国古代的心理测量思想与实践1905 法国――科学心理测量.孔子――心理测量的思想“中人以上,可以语上也;中人以下,不可以语上也。

”孟子“权,然后知轻重;度,然后知长短;物皆然,心为甚。

”刘劭《人物志》,“观其感变,以审常度。

”翻译后,名为《人类能力之研究》韩非一手画圆,一手画方。

到现在,用于测注意力民间,周岁试儿到现在,婴幼儿的动作测量古代的问答法到现在,临床谈话法,问卷法庄子:九征到现在,情景法博弈(棋)、九连环、七巧板――古代测智力水平的器具八阵图。

二.心理测量早期探索及尝试英国高尔顿最早想通过测量人的证明他的“遗传论”。

美国卞特尔心理学只有立足于实验与测量之上,才会有自然科学的准确度。

德国冯特心理测量的思想。

三.科学心理测量的诞生与发展1905 法国比纳(Binet)1895创办第一本心理学杂志《心理学年报》心理测量的原理:把结果与他人比较,以求概括。

1905:比纳-西蒙量表(的标志)-标志着科学心理测量的诞生。

30题,从易到难。

1908、1911两次修订,制订了“智龄”之后,有斯坦福”-比纳量表(推孟修订,1916)[现在的所谓“比纳量表]引入了斯腾(德国)的心理商数概念,变化为:智龄IQ=_____ *100使不同年龄层次间儿童的智力水平比较成为可能。

也叫比率智商实龄后来量表的特点I.操作性量表(比纳的量表是语言性量表)II.团体测验(比纳的量表是个别的测验)III.教育测验(学习测验,eg桑代克,斯坦福成就测验)IV.人格的测验V.特殊能力测验(eg音乐,绘画能力etc)四.心理测验在中国的发展1916 樊炳清介绍比纳的量表1920 南京高等师范学校(现南大),廖世承、陈鹤琴开设心理测量课。

心理学考研之心理统计学笔记分析

心理学考研之心理统计学笔记分析

1. 取样误差:样本统计量与相应的总体参数之间的差距2. 偏态分布:分数堆积在分布的一端,而另一端成为比较尖细的尾端,其与对称分布对应3. 离散型变量:由分离的、不可分割的范畴组成,临近范畴之间没有值存在4. 连续型变量:在任何两个观测值之间都存在无限多个可能值,它可被分割成无限多个组成部分5. 集中量数:集中量数又叫集中趋势,是体现一组数据一般水平的统计量。

它能反映频数分布中大量数据向某一点集中的情况。

1.算数平均数 1nii X X N ==∑特点 ①在一组数据中每个变量与平均数之差的总和等于零 ②在一组数据中,每一个数都加上一个常数C ,所得的平均数为原来的平均数加常数C ③在一组数据中,每一个数都乘以一个常数C ,所得的平均数为原来的平均数乘以常数C 优点:反应灵敏、计算严密、计算简单、简明易解、适合于进一步用代数方法盐酸、较少受抽样变动的影响缺点:易受极端数据的影响、不能在出现模糊数据时计算差异量数:差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。

1.离差与平均差X μ=-x平均差:次数分布中所有原始数据与平均数绝对离差的平均值..i X XA D n -=∑2.方差与标准差()()222X SS X XN μ=-=-∑∑∑(1)总体的方差和标准差 方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平房后的均数作为样本统计量用符号s 2表示,作为总体参数用符号σ2表示,也叫均方。

2SS N σ=标准差:方差的平方根作为样本统计量用符号s 表示,作为总体参数用符号σ表示。

σ=(2)样本的方差和标准差样本的变异性往往比它来自的总体的变异性要小。

为了校正样本数据带来的偏差,在计算样本方差时,我们用自由度来矫正样本误差,从而有利于对总体参数更好的无偏差估计:21SS S n =-S =①每一个观测值都加一个相同的常数C 之后,计算得到的标准差等于原来的标准差 ②每一个观测值都乘以一个相同的常数C ,所得到的标准差等于原标准差乘以这个常数3.变异系数差异系数:一种最常用的相对差异量,为标准差对平均数的百分比100%s CV X=⨯(四)相对量数1. 百分位数:在整个分布中,在某一值之下或等于该值的分数的百分比,所对应的分数。

心理统计笔记汇总

心理统计笔记汇总

心理统计笔记汇总:定义理解:1,总体(population):感兴趣事件的全部;样本(sample):总体的一小部分。

2,推断统计学(inferential statistics):使用样本归纳总体的一种统计方法。

3,原假设(零假设null hypothesis):陈述处理没有效果。

(如:锻炼的人和不锻炼的人,生病的日子一样多。

)4,对立假设(alternative hypothesis):陈述处理有效果。

5,双侧检验(two-tailed test):评估处理要看是否对任一方向有影响。

(如:了解得分更高还是更低时)。

研究中经常使用。

单侧检验(one-tailed test):目的仅仅调查一个方向。

(如:仅仅是更高或者是更低)。

优势在于有更大的机会证明目标。

6,一类错误(Type 1 error):原假设为真时,拒绝了原假设。

二类错误(Type2 error):原假设为假时,接受了原假设.。

7,功效(Power):等于原假设错误时拒绝原假设的概率。

取值范围在0-1,数值越大,功效越大。

如:功效为0.9意味着有90%的机会决绝原假设——正确的决策。

8,p值:如果p小于或等于0.05(a水平),拒绝原假设。

Sig.结果显著。

如果p大于0.05,不能拒绝原假设。

Sig.结果不显著。

备注:a水平可以采取0.01或0.001进行比较。

9,效应量(d):表明研究结果的大小。

在单样本T检验中,程度分为:0.2为小,0.5为中,0.8为大。

10,频数(frequency):变量在每一类中的观测次数。

均值(mean):算数平均数。

中位数(median):位于中间的分数。

众数(mode):数据集中出现最多的得分数数。

推断统计学:使用SPSS软件4,可靠性(用a系数度量):指某些感兴趣的测量结果的一致性或可重复性。

(如:对一组参与者者在两周内进行两次信心的10个项目的测量,如果参与者对这些项目的反应相同或相近,这个测量的可靠性就很高;反之,可靠性就很低。

教育与心理统计学 第一章 常用的统计表与图考研笔记-精品

教育与心理统计学  第一章 常用的统计表与图考研笔记-精品
次数分布表、双列次数分布表、不等距次数分布表等。其他类型的统计表主要有:简单表、分组表、复合表。
一、次数分布表
次数分布:指的是一批数据中各个不同数值所出现的次数情况,或者是一批数据在量尺上各等距区组内所出现的次数情况。次数分布主要
表小数据在各个分组区间内的散布情况,依据它所显小的次数如何产生,次数分布可区分为简单次数分布、分组次数分布、相对次数分布、
正态的总体,则可以利用经验公式来确定组数,即:K=1.87(N-l)2/5°公式中的N为数据个数,K取近似整数。
③定组距:在知道全距R和组数K之后,就可以确定分组的组距组距用符号i来表小。i=R/K
④写出组限:组限是每个组的起始点界限。
⑤求组中值:组中值是各组的组中点在量尺上的数值,其计算公式为:组中值=(组实上限+组实下限)/2=精确下限+组距/2;精确上限-
第三节统计图
统计图是以几何图形和形象图形表示统计资料数量关系的工具。
统计图一般由下面几个部分组成:图号及图题:图目;图尺;图形;例;图注。
统计图一般米用直角坐标系,通常横轴表小自变量(类别),称为分类轴。纵轴表示因变量(次数),称为数值轴
注:统计图包括:次数分布图和一些其他类型的常用统计图。
(四)累积相对次数分布表和累积百分数分布表
前面介绍的累积次数分布表是对简单次数进行累积的结果。与此相对应,累积相对次数是对相对次数进行累积的结果。因此,由累积相对
次数制作的统计表便称为累积相对次数分布表。由于累积相对次数仍然是小数,所以把这些小数乘以100,便得到〃百分数〃,从而可把累积
相对次数分布表等价地转换为"累积百分数分布表"。
第一章常用的统计表与图
第一章常用的统计表与图

华东师大实验心理学笔记

华东师大实验心理学笔记

华东师大实验心理学笔记第一章绪论冯特可称为实验心理学的创始人。

实验心理学在研究内容、研究方法、研究技术以及器材方面都发生了巨大变化。

研究内容研究方法研究技术与仪器。

第一节实验心理学的性质一、实验心理学的含义采用实验控制的方法研究心理现象的科学。

1心理学的一个分支,2研究心理学的一种方法学。

实验法或实验:人为地去干预、控制所研究的对象。

不同于观察法。

实验是实验者人为地使现象发生,对产生现象的情景或影响现象的条件加以操纵、变化以及控制的观察。

1实验的优点:a主要优点是可以更好地控制额外变量。

b另一个优点是经济。

2实验的三大特点a随意性b可重复性、或可验证性c系统化的控制3做实验的理由:4实验的种类(第二节详谈)5实验心理学与其它心理学分支学科的关系(见书中的图)二、变量(实验的重要元素,以后无论讲解实验,还是我们自己设计实验都是要分析实验的基本变量)变量是指在数量上或质量上可变的事物的属性。

是我们可以变化、操纵和测量的条件、现象和特性。

包括质的变量和量的变量变量的种类(一)自变量1定义:在实验中实验者所操纵的、对被试的反应产生影响的变量。

(由主试选择、控制的变量,它决定着心理或行为的变化。

例如,光的明度,声音的响度、房间的温度、动物的饮食量,比如研究反应时,想了解声音的强弱对反应时间的影响。

则声音的强弱就成了自变量2种类:作业自变量:环境自变量:被试自变量:相关变量自变量额外变量(控制变量)无关变量(二)因变量1定义:自变量的变化而产生的现象变化或结果。

因变量即被试的反应变量,它时自变量造成的结果,是主试观察或测量的行为变量。

因变量的一个标准是稳定性。

敏感性:天花板效应:ceiling effect地板效应:floor effec2种类作为因变量的反应指标:1)反应速度2)反应的正确性3)反应难度4)反应的次数或机率5)反应的强度口语记录(三)额外变量(许多书称为无关变量,与研究目的无关的变量)1定义:1)除了自变量之外,能够影响实验结果,需要加以控制的变量2)与所研究的条件和行为无关,但又影响反应变量(行为或实验结果)(例如,要研究男女生学习同一门课程的学业成绩的差异自变量:性别因变量:学业成绩额外变量:使两组在年龄、年级、智力水平、原有基础、任课教师其它变量:如身高、体重、衣着、发型等则无需考虑)操纵自变量观察因变量控制额外变量2控制1)排除法:把额外变量从实验中排除出去。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

华东师大心理统计笔记第一章绪论&1.随机现象与统计学确定现象随机现象本人性别生男生女光的速度学习成绩种豆得豆(人的)反应速度随机现象:具有以下三个特性的现象称为随机现象(i)一次试验有多种可能结果,其所有可能结果是已知的。

(ii)试验之前不能预料哪一种结果会出现(iii)在相同条件下可以重复试验随机事件:随机现象的每一种结果叫做一个随机事件。

随机变量:把能表示随机现象各种结果的变量称为随机变量统计学的研究对象是随机现象规律性随机变量的分布:(i)正态分布eg:学习成绩图(略)(ii)双峰分布eg::汽车拥挤程度图(略)(iii)另一种分布eg:如下图(略)&2.总体和样本总体:是我们所研究的具有某种共同特性的个体的总和样本:是从总体中抽取的作为观察对象的一部分个体。

(i)总体:有限总体:总体所包含的个体数目有限时无限总体:总体所包含的个体数目无限时→参数:总体上的(ii)总体→抽样→样本:大样本:>30 >50小样本:≤30 ≤50(更精神)(样本容量:样本中包含的个体数目)→统计量:样本上的数字特征根据统计量来估计参数&3.心理统计学的内容1.描述统计:对已获得的数据进行整理,概括,显现其分布特征的统计方法。

集中量平均数#描述差异量标准差S: S大:差异大/不稳定对个别S小:差异小/稳定对个别统计相关量:相关系数(表示两件事情的相互关系)r.r↔[-1,1](r表示从无关道完全相关,相关:正相关,相关,负相关)2.推断统计参数估计:#→µs→σ推断r→р统计假设检验:参数检验非参数检验3.实验设计↓前程:相同符号的一串→非参数检验中的一种第二章数据整理&1.数据种类一.间断变量与连续变量eg:人数~间断二.四种量表。

1.称名量表。

Eg:307室,学好,电话好吗不能进行数学运算(也包括不能大小比较2.顺序量表。

Eg:名次。

能力大小,不能运算3.等距量表。

可以运算(做加减法),不能乘除要求:没有绝对0年龄有绝对0时间(年代,日历。

)位移无绝对0,可能有相对0,即有正负4.等比量表。

可做乘除法。

要有绝对零。

成绩中的,0分不是绝对0(因为并不说明此人一窍不通)分数代表的意义。

Eg:0~10分与90~100分。

每一分的“距离”不一样因为严格来说,成绩是顺序量表。

但为了实际运用中的各种统计,把它作为等距量表&2.次数分布表一.简单次数分布表eg: 组别次数(人次)100 290~99 580~89 1470~79 1560~69 760分以下 31.求全距R=Max – Min(连续变量)(间断变量)——R=Max-Min+12.定组数K(组数)=1.87(N-1)。

→取整N-总数3.定组距I=R/K。

一般,取奇数或5的倍数(此种更多)。

4.定各组限5.求组值X=(上限+下限)/2 上限——指最高值加或取10的倍数等)6.归类划记7.登记次数例题:99 96 92 90 90 (I)R=99-57+1=4387 86 84 83 838282 80 79 78 (II)K=1.87(50-1)。

≈97878 78 77 777776 76 76 767575 74 74 73 (III)I=R/K =43/9≈57272 72 71 717170 70 69 696867 67 67 65 (iu)组别组值次数64 62 62 61 57 95~99 97 290~94 92 385~89 87 280~84 82 675~79 77 1470~74 72 1165~69 67 760~64 62 455~59 57 1总和50 二.相对(比值)次数分布表。

累积次数分布表相对(比值)累积次数:累积次数值/总数N注:一般避免不等距组(“以上”“以下”称为开口组)相对次数累积次数(此处意为“每组上限以下的人次)”小于制“.04 50.06 48.04 45.12 43.28 37.22 23.14 12.08 5.02 11.00&3.次数分布图一.直方图1.标出横轴,纵轴(5:3)标刻度2.直方图的宽度(一个或半个组距)3.编号,题目4.必要时,顶端标数)图二.次数多边图1.画点,组距正中2.连接各点3.向下延伸到左右各自一个组距的中央最大值即y轴最大值相对次数分布图,只需将纵坐标改为比率。

(累积次数,累积百分比也同样改纵坐标即可)‖S形‖曲线是正态分布图的累积次数分布图图(第三章常用统计量数&1.集中量一.算术平均数公式算术平均数的优缺点。

P36~37算术平均数的特征。

Σ(X-#)=0 离(均数)差Σ(X-#)(X-#)取#时,得最小值即:离差平方和是一最小值二.几何平均数#g= 略long#g=1/NσlogXi根据按一定比例变化时,多用几何平均数eg: 91年92 93 94 95 9612%10%11%9%9%8%求平均增长率xg=加权平均数甲:600人#=70分乙:100人#=80分加权平均数:#=(70*600+80*100)/(600+100) (总平均数)eg:600人,100人简单平均数:(70+80)/2三.中(位)数。

(Md)1.原始数据计算法分:奇、偶。

2.频数分布表计算法(不要求)3.优点,缺点,适用情况(p42)四.众数(Mo)1.理论众数粗略众数2.计算方法:Mo=3Md-2#Mo=Lmo+fa/(fa+fb)*I计算不要求3.优缺点平均数,中位数,众数三者关系。

&2.差异量数一.全距R=Max-Min二.平均差(MD或AD)MD={Σ|x-#(或Md)|}/N三.方差总体方差的估计值S2 =Σ(X -#)2 反编样本的方差:σ 2 x有编N很小时,用S2 估计总体N>30时,用S2 或σ 2 x 都可以计算方法:σ 2 x=Σx2 /N -(ΣX/N) 2标准差σx=σ 2 x2/1四.差异系数(CV)CV=σx/# *100% CV↔[5%,35%]3个用途五.偏态量与锋态量(SK)1.偏态量:sk=(#-Mo)/σx动差(一级~四级)a3= Σ(x-#)3 、/ N/σx3 三级动差计算偏态系数)2.峰态量:高狭峰a4>0 (a4=0 ——正态峰)低调峰。

A4<0用四级动差a4=Σ(X - #)4/N/σx4-3&3.地位量数一.百分位数eg:P30=60(分) ―60分以下的还有30%的人‖二.百分等级30→60(在30%的人的位置上,相应分数为60)So→Md第四章概率与分布&1.概率一.概率的定义W(A)=m/n (频率/相对频数)后验概率:P(A)=lim m/n先验概率:不用做试验的二.概率的性质和运算1.性质:o≤P≤1p=1 必然可能事件p=0 不可能事件2.加法。

P(a+b)=P(a)+P(b)“或”:两互不相克事件和。

推广:“有限个”P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)eg:(1)A=出现点数不超过4(x≤4)P(A)=P(x=1)+P(x=2)+P(x=3)+P(x=4)=1/6+…1/6=4/6=2/3(2)完全凭猜测做判断题,(共2道),做对1题的概率为:A={T.Ti B={F.Ti C={T.Fi D={F.FiP=P(B)+P(C)=1/4+1/4=0.53.乘法:P(A1,A2…An)=P(A1),P(A2)…P(An)Eg:(1)四选1。

(十道)完全凭猜测得满分得概率:(1/4)*(1/4)…*(1/4)=1/410&2.二项分布一.二项分布P(x)=Cn x p x g n-x做对的概率p x :做错的概率g n-x:X:对的数量p x g n-x ——每一分情况的概率。

一种情况:p x g n-x 再乘上系数。

Eg:产品合格率为90%取n=3(个)TTT的情况90 * 90*90=P30.729TFT 90*0.10*90=P2g10.081两个合格的情况→TTFFTT其概率C32P2g1=3p2g1.Cn0P0g n+CnP1g n-1+…+CnP n g0=1注:二项分布可能的结果只有两种。

F 0r T合格Or 不合格选对Or 选错例:(1)10道是非题,凭猜测答对5,6,7,8,9,10题的概率?至少答对5题的概率P(x=5)=C510P5g5=C510(1/2)51/2)5=.24609P(x=6)=C610P6g4=C610(1/2)6(1/2)4=.20508P(x=7)=C710P7g3=C710(1/2)7(1/2)3=.11719=.04395=.00977+P(x=10)=C1010P10g0=(1/2)10=.000098至少答对5题:P(X≥5) = 0.62306(2)四选一,猜中8,9,10题的概率?P(x=8)=C819P8g2=C819(1/4)8(3/4)2=.0039二.二项分布图(P84~85)三.二项分布的平均数与标准差(前提np≥5且ng≥5)平均数——M=np 标准差——r=npg1/2&3.正态分布一.正态分布曲线二.标准正态分布。

(P387附表可查面积P)Z=(x-ц)/r (x:原始分数)标准分数(有正有负)ΣZ=0三.正态分布表的使用查表P(0≤Z≤1)=0.34134——Z的范围中的人数比例(百分数)P(0≤Z≤1.645)=0.45001.64 -.44950=0.451.65 -.45053=0.45之上,标准分数高于2个标准差,则非常聪明。

Eg:1. μ=70(分) σ=10P(70≤x≤80)=p(o≤z≤1)P(60≤x≤70)=P(-1≤z≤0)2.μP(0≤z≤1)=P(μ≤x≤μ+σ)P(-1≤z≤0)=P(μ-σ≤x≤μ)图(略)例:某地区高考,物理成绩μ=57。

08(分)σ=18。

04(分)总共47000人。

(1)成绩在90分以上多少人?(2)成绩在(80,90)多少人?(3)成绩在60分以下多少人?解: X~N(57.08,18.042) ——参数(μ,σ2)Normal 表示符合正态分布令Z= (x-57.08)/18.04),则Z~N(0,12)标准分数平均数一定为0,标准差一定为1。

(1)Z1=(90-57。

08)/18.04=1.82P(Z>1.82)=.0344N1=np=47000*0.0344=1616(人)(2)Zz=(80-57.08)/18.04=1.27P(1.27<Z<1,82)=.46562-.39796=0.677N2=NP=3177(人)(3)Z3=(60-57.08)/18.04=0.16P(Z<0.16)=.56356N3=26487(人)四.正态分布的应用T=KZ+C T~N(C,K2)IQ=15Z+100 IQ=100 一般IQ≥130 ——超常(30=2x*15)IQ<70 ——弱智70几——bndenlineeg:1.某市参加一考试2800人,录取150人,平均分数75分,标准差为8。

相关文档
最新文档