现代心理教育与统计学_第三版复习资料(张厚粲)
张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](差异量数)
](https://img.taocdn.com/s3/m/446b814cb7360b4c2e3f64f4.png)
第4章差异量数1.度量离中趋势的差异量数有哪些?为什么要度量离中趋势?答:(1)度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差。
差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称离散量数(measures of dispersion)。
(2)度量离中趋势的必要性在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。
这些特殊性常表现为数据的变异性。
因此,只用集中量数不可能真实地反映出它们的分布情形。
为了全面反映数据的总体情况,除了必须求出集中量数外,这时还需要使用差异量数。
2.各种差异量数各有什么特点?答:(1)标准差计算最严密,它根据全部数据求得,考虑到了每一个样本数据,测量具有代表性,适合代数法处理,受抽样变动的影响较小,反应灵敏。
缺点是较难理解,运算较繁琐,易受极端值的影响。
(2)方差的描述作用不大,但是由于它具有可加性,是对一组数据中造成各种变异的总和的测量,通常采用方差的可加性分解并确定属于不同来源的变异性,并进一步说明各种变异对总结果的影响。
因此,方差是推论统计中最常用的统计量数。
(3)全距计算简便,容易理解,适用于所有类型的数据,但它易受极值影响,测量也太粗糙,只能反映分布两极端值的差值,不能显示全部数据的差异情况,仅作为辅助量数使用。
(4)平均差容易理解,容易计算,能说明分布中全部数值的差异情况,缺点是会受两极数值的影响,但当数据较多时,这种影响较小,因有绝对值也不适合代数方法处理。
(5)百分位差易理解,易计算,不易受极值影响,但不能反映出分布的中间数值的差异情况,也仅用作补助量数。
(6)四分位差意义明确,计算方便容易,对极端值不敏感,较不受极端值影响。
当组距不确定,其他差异量数都无法计算时,可以计算四分位差。
但是,四分位差无法反映分布中所有数据的离散状况,不适合使用代数方法处理,受抽样变动影响较标准差大。
张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](线性回归)
](https://img.taocdn.com/s3/m/3625fe45ad51f01dc281f1e5.png)
dfR 1
MSR
SSR dfR
=118.95
dfE N 2 =8
MSE
SSE dfE
8.08
F MSR =14.72 MSE
查 F 表, F0.01(1,8) 5.32 , F F0.05(1,8)
5.某研究所 10 名学生研习某教授的高级统计课程,期中与期末考试成绩见下表。请 问该教授是否可以利用期中考试成绩来预测期末考试成绩?
4/6
圣才电子书 十万种考研考证电子书、题库视频学习平台
解:(1)建立回归方程
经计算 X 79.2, Y 84.2, sX 8.75, sY =4.52
dfE N 2 =8
MSE
SSE dfE
230.5
F MSR =9.15 MSE
查 F 表, F0.05(1,8) 5.32 , F F0.05(1,8)
3/6
圣才电子书
方差分析表如下
十万种考研考证电子书、题库视频学习平台
变异来源
自由度
平方和
均方
F
F0.05(1,8)
bYX
Y Y
2
=0.57
X X
a Y bX 23.13
则回归方程为 Yˆ 23.13 0.57X 。
(2)对回归方程进行检验
SST
Y2
Y 2
N
=3952.5
SSR
b2
X
2
X
N
2
=2108.6
SSE SST SSR =1843.9
dfR 1
MSR
SSR dfR
=2108.6
SST SSR N 2
MSE =15.18
2
张厚粲《现代心理与教育统计学》(第3版)配套题库【章节题库】第1章~第3章 【圣才出品】

第三部分章节题库第1章绪论一、单选题1.三位研究者评价人们对四种速食面品牌的喜好程度。
研究者甲让评定者先挑出最喜欢的品牌,然后挑出剩下三种品牌中最喜欢的,最后再挑出剩下两种品牌中比较喜欢的。
研究者乙让评定者将四种品牌分别给予1—5的等级评定,(1表示非常不喜欢,5表示非常喜欢),研究者丙只是让评定者挑出自己最喜欢的品牌。
研究者甲,乙,丙所使用的数据类型分别是:()A.类目型---顺序型---计数型B.顺序型---等距型---类目型C.顺序型---等距型---顺序型D.顺序型---等比型---计数型【答案】B2.调查了n=200个不同年龄组的被试对手表显示偏好程度偏好程度年龄组数字显示钟面显示不确定30岁或以下90401030岁以上104010该题自变量与因变量的数据类型分别是:()A.类目型-顺序型B.计数型-等比型C.顺序型-等距型D.顺序型-命名型【答案】D3.157.5这个数的上限是()。
A.157.75B.157.65C.157.55D.158.5【答案】C4.随机现象的数量化表示称为()。
A.自变量B.随机变量C.因变量D.相关变量【答案】B5.实验或研究对象的全体被称之为()。
A.总体B.样本点C.个体D.元素【答案】A6.下列数据中,哪个数据是顺序变量?()A.父亲的月工资为1300元B.小明的语文成绩为80分C.小强100米跑得第2名D.小红某项技能测试得5分【答案】C二、概念题1.描述统计(吉林大学2002研)答:描述统计指研究如何整理心理教育科学实验或调查的数据,描述一组数据的全貌,表达一件事物的性质的统计方法。
比如整理实验或调查来的大量数据,找出这些数据分布的特征,计算集中趋势、离中趋势或相关系数等,将大量数据简缩,找出其中所传递的信息。
2.推论统计(中国政法大学2005研,浙大2000研)答:推论统计又称推断统计,主要研究如何通过局部数据所提供的信息,推论总体或全局的情形;如何对假设进行检验和估计;如何对影响事物变化的因素进行分析;如何对两件事物或多种事物之间的差异进行比较等。
张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](多变量统计分析简介)
](https://img.taocdn.com/s3/m/2df4574c49649b6649d7470b.png)
第13章多变量统计分析简介1.探索性因素分析与验证性因素分析有什么区别?答:(1)探索性因素分析(exploratory factor analysis,简写为EFA)就是指传统的因素分析。
这种因素分析方法对于观察变量因子结构的寻找,并未有任何事前的预设假定。
对于因子的抽取、因子的数目、因子的内容以及变量的分类,研究者也没有事前的预期,而是由因素分析的程序去决定。
在典型的EFA中,研究者通过共变关系的分解,找出最低限度的主要成分(principal component)或共同因子(common factor),然后进一步探讨这些主成分或共同因子与个别变量的关系,找出观察变量与其相对应因子之间的强度,也就是因子负荷值(factor loading),以说明因子与所属的观察变量的关系,决定因子的内容,为因子取一个合适的名字。
由于传统的因素分析企图找出最少的因子来代表所有的观察变量,因此研究者必须在因子数目与可解释变异量(explained variance)两者间寻找平衡点。
因为因素分析至多可以抽取出相等于观察变量总数的因子数目,这样,虽然可以解释全部百分之百的变异,但失去因素分析找寻因子结构的目的,但如果研究者企图以少数几个较明显的因子来代表所有的项目,势必然将损失部分可解释变异来作为代价。
因而在EFA中,研究者相当一部分工作是在决定因子数目与提高因子解释的变异(即R square)。
(2)验证性因素分析(confirmatory factor analysis,简写为CFA)是在研究人员积极改善传统因素分析的限制,扩大其应用范围的基础上产生的。
这类因素分析要求,研究者对于潜在变量的内容与性质,在测量之初就必须有非常明确的说明,或有具体的理论基础,并已先期决定相对应的观察变量的组成模式,进行因素分析的目的是为了检验这一先期提出的因子结构的适合性。
这种因素分析方法也可用于理论架构的检验,它在结构方程模型中占有相当重要的地位,有着重要的应用价值,也是近年来心理测量与测验发展中相当重视的内容。
现代心理与教育统计学复习资料覃瑞

现代心理与教育统计学复习资料赵晨鹰老师覃瑞整理(21267529)徐建平和张厚粲主编第三版第一章绪论课程简介:先行课程为数学、普通心理学,后续课程为实验心理学、心理测量学、心理学研究方法、(研究型)毕业论文等。
心理统计可分为三种类别(最常见的分类方法P8):第一部分是“描述统计”,包括数据整理、集中&离中&相关量数的计算等。
第二部分是“推论统计”,包括统计估计、假设检验等(以概率分布为基础)。
第三部分是“实验设计”,包括样本抽取、被试分组等。
描述统计 : 1统计图表 2集中量数3差异量数 4相关关系概率分布(推论统计的基础)推论统计 :1参数估计 2假设检验 3方差分析(涉及部分“实验设计”) 4 χ2检验 5非参数检验线性回归(进而建立“数学模型”)多变量统计分析简介实验设计 :抽样原理及方法心理统计学(Psychological Statistics)是研究在心理实验或调查中如何收集、整理、分析数字资料,以及如何根据这些资料所传递的信息作出科学推论的应用统计学分支。
随机性数据资料~随机现象P3 (vs. 确定现象)①试验之前已知存在多种可能结果,但不能预料哪种结果会出现;②在相同条件下可以重复该试验。
理论统计学 vs. 应用统计学心理科学研究数据的特点 P2 1、分散性:数据结果均以一个个分散的数字形式呈现。
2、变异性/随机性:观测数据总在一定范围内随机波动变化。
3、规律性:通过重复观测可发现其变化具有一定的特征与规律。
心理科学研究的目标就是在分析部分数据的基础上来推测其相应总体的特征。
一、描述统计(descriptive statistics) P8描述统计主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。
据分组、图表制作。
②统计量/特征值P21的计算。
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(5-7章)【圣才出品】

(三)散点图 1.在相关研究中,常用相关散点图表示两个变量之间的关系。在直角坐标系中,以 X、 Y 二列变量中的一列变量(如 X 变量)为横坐标,以另一列变量(如 Y 变量)为纵坐标, 把每对数据 Xi、Yi 当作同一个平面上的 N 个点(Xi、Yi),一一描绘在 XOY 坐标系中,产生 的图形就称为散点图或相关图。 2.散点图通过点的散布形状和疏密程度来显示两个变量的相关趋势和相关程度,能够 对原始数据间的关系做出直观而有效的预测和解释。成对观测值愈多,散点图提供的信息就 越准确。因此,散点图是确定变量之间是否存在相关关系及关系紧密程度的简单而又直观的 方法。 3.不同形状的散点图形显示了两个变量间不同程度的相关关系。假设在直角坐标系中,
1 / 157
圣才电子书 十万种考研考证电子书、题库视频学习平台
哪个是果;也有理由认为这两者并不同时受第三因素的影响,即不存在共变关系。具有相关 关系的两种现象之间的关系是比较复杂的,甚至可能包含有暂时尚未认识的因果关系以及共 变关系在内。
2.相关的类别 统计学中所讲的相关是指具有相关关系的不同现象之间的关系程度,前提是事物之间的 这种联系又不能直接做出因果关系的解释。有时,相关被解释为两种特征相伴随的变化。相 关有以下三种: (1)正相关,两列变量变动方向相同,即一种变量变动时,另一种变量亦同时发生或 大或小与前一种变量同方向的变动。 (2)负相关,两列变量中有一列变量变动时,另一列变量呈现出或大或小但与前一列 变量方向相反的变动。 (3)零相关,两列变量之间没有关系,即一列变量变动时,coefficient of correlation)是两列变量间相关程度的数字表现形式,或者 说是用来表示相关关系强度的指标。作为样本间相互关系程度的统计特征数,常用 r 表示, 作为总体参数,一般用 表示,并且是就线性相关而言。相关系数与 X 、s 一样,也是应用 比较广泛的一个有代表性的统计量。r 的取值范围如下: -1.00≤r≤+1.00 上式表明: 1.相关系数 r 的取值范围介于-1.00 至+1.00 之间,它是一个比率,常用小数形式表 示。
现代心理教育与统计学 第三版复习资料(张厚粲)

第一章绪论1.描述统计(descriptive statistics)主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。
2.描述统计只限于对试验样本所得观测数据的统计分析,不考察其总体的特性。
3.推论统计(inferential statistics)是以描述统计为基础,从而解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特性。
4.变量(variables):一个可以取不同数值的物体属性/事件。
5.事前无法预期结果的变量——随机变量6.观测值(原始取值):事后测定的某一结果。
7.概念理解:[涉及“实验”] 自变量(及其各水平)& 因变量(及相应的反应指标);[涉及“调查”,粗略对应于] 属性变量& 反应变量8.计数资料(count data):计算个数的数据,(如人口数,学校数,男女数等)9.计量资料(measurement data):借助于一定的测量工具或一定的测量标准而获得的数据(如分数,身高,体重,IQ)10.称名数据(nominal data):只区分属性或类别上的不同,只可计数,不能排序(性别,学科,职业)11.等级/顺序数据(ordinal data):可排序,但无相等单位,不能加减。
(等级评定,受教育程度,职称)12.等距数据(interval data):具有相等单位,无绝对零的数据,能加减不能乘除。
13.比率数据(ratio data):既表明量的大小,又具有相等单位,可以加减乘除,具有绝对零点。
14.称名数据和顺序数据合称为离散数据。
15.等距数据和比率数据合称为连续数据。
16.离散数据(discrete data)又称为不连续数据,这类数据在任何两个数据点之间所取的数据的个数是有限的。
17.连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(1-4章)【圣才出品】

统计图表
1.描述统计
差异量数 集中量数 相关分析
点估计
心理与教育统计
2.推断统计 统计估计
参数估计
区间估计
非参数估计
假设检验
参数检验 非参数检验
样本选择与分配
实验误差分析
3.实验设计
方差分析 协方差分析
回归分析
因子分析 ... ...
1 / 107
圣才电子书 十万种考研考证电子书、题库视频学习平台
(二)心理与教育科学研究数据的特点 1.心理与教育科学研究数据与结果多用数字形式呈现 2.心理与教育科学研究数据具有随机性和变异性 3.心理与教育科学研究数据具有规律性 4.心理与教育科学研究的目标是通过部分数据来推测总体特征 (三)学习心理与教育统计应注意的事项 1.学习心理与教育统计学要注意的几个问题 (1)学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用, 只要有中学数学知识就具备了学好心理与教育统计学的前提。 (2)在学习时要注意重点掌握各种统计方法使用的条件。 (3)要做一定的练习。 2.应用心理与教育统计方法时要做到: (1)克服“统计无用”与“统计万能”的思想,注意科研道德。 (2)正确选用统计方法,防止误用和乱用统计。
圣才电子书
第1章 绪 论
十万种考研考证电子书、题库视频学习平台
1.1 复习笔记
本章重点 心理与教育统计的研究内容 选择使用统计方法的基本步骤 统计数据的基本类型 心理与教育统计的基本概念
一、统计方法在心理和教育科学研究中的作用 (一)心理与教育统计的定义与性质 1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理 与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论 找出心理与教育活动规律的一门学科。 2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些 数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理, 最后得出结论的一种研究方法。 3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(applied statistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各 个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。 类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
张厚粲《现代心理与教育统计学》(第3版)【章节题库】(方差分析)

5.在随机区组实验设计中,总平方和可以被分解为( )。 A.被试间平方和 B.被试内平方和区组平方和 C.误差项平方和 D.区组平方和 【答案】ACD
6.事后检验常用的方法有( )。 A.F 检验 B.N—K 法 C.HSD 法 D.t 检验
8 / 38
圣才电子书
【答案】BC
8.方差分析中,F(2,24)=0.90。F 检验的结果( )。 A.不显著 B.显著 C.查表才能确定 D.此结果是不可能的 【答案】A
9.如果用方差分析检验一个双组设计的平均数差异,将会得到一个与( )同样的 结果。
3 / 38
圣才电子书
A.F 检验
十万种考研考证电子书、题库视频学习平台
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 9 章 第 9 章 方差分析
一、单选题 1.假设 80 个被试被分配到 5 个不同的实验条件组,那么要考虑各组被试在某症状测 量上的差异,F 比率的 df 各为( )。 A.5,79 B.5,78 C.4,79 D.4,75 【答案】D
15.某研究选取容量均为 5 的三个独立样本,进行方差分析,其总自由度为( )。 A.15 B.12
5 / 38
圣才电子书
C.2
十万种考研考证电子书、题库视频学习平台
D.14
【答案】B
16.当一个实验( )时,我们才能得到交互作用。 A.因变量多于 1 个 B.自变量多于 1 个 C.因变量多于 1 个的水平 D.自变量多于 2 个的水平 【答案】B
17.某研究选取容量均为 5 的三个独立样本,进行方差分析,其总自由度为( )。 A.15 B.12 C.2 D.14 【答案】B
18.完全随机设计的方差分析适用于( )。 A.三个及其以上独立样本平均数差异的显著性检验 B.方差齐性检验 C.三个及其以上相关样本平均数差异的显著性检验
张厚粲《现代心理与教育统计学》(第3版)【章节题库】(非参数检验)

第11章非参数检验一、单选题1.秩和检验法首先由()提出。
A.弗里德曼B.维尔克松C.惠特尼D.克—瓦氏【答案】B2.秩和检验与参数检验中的()相对应。
A.两独立样本平均数之差t检验B.相关样本的t检验C.独立样本的t检验D.配对样本差异显著性t检验【答案】C3.符号检验法与参数检验中的()相对应。
A.两独立样本平均数之差t检验B.相关样本的t检验C.独立样本的t检验D.配对样本差异显著性t检验【答案】D4.在秩和检验中,当两个样本容量都大于10时,秩和分布为()。
A.T分布B.接近t分布C.接近正态分布D.接近F分布【答案】C5.参数检验中两独立样本的平均数之差的t检验,对应着非参数检验中的()。
A.秩和检验法B.中数检验法C.符号检验法D.符号等级检验法【答案】B6.运用非参数分析时,要求处理的数据是()。
A.十分精确的B.自由分布的C.大量的D.等级形式的【答案】A二、多选题1.非参数检验包括()A.秩和检验法B.中数检验法C.符号检验法D.等级方差分析【答案】ABCD2.两个独立样本的非参数检验方法有()A.秩和检验法B.中数检验法C.符号检验法D.等级方差分析【答案】AB3.配对样本的非参数检验方法有()A.秩和检验法B.中数检验法C.符号检验法D.等级方差分析【答案】CD三、概念题1.非参数检验(华东师大2002研,西北师大2002研,苏州大学2002研)答:非参数检验指对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验。
常见的非参数检验有符号检验、秩和检验、中数检验等。
其优点:(1)不需要对被检验的总体作出关于正态性或其他特定分布的假定;(2)容易理解、容易操作、应用范围广。
缺点是功效较低,因为它常会丢失数据中的信息。
经常属于大样本检验。
2.参数检验(parametric test)答:参数检验是统计假设检验的一种。
与“非参数检验”相对。
适用于总体分布形式已知。
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(参数估计)【圣才出品】

一、点估计、区间估计与标准误 参数估计分为点估计和区间估计。 (一)点估计的定义 点估计(point estimation)是用样本统计量来估计总体参数,因为样本统计量为数轴 上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。
1 / 39
圣才电子书 十万种考研考证电子书、题库子书、题库视频学习平台
3.区间估计的原理与标准误 区间估计是根据样本分布理论,用样本分布的标准误(SE)计算区间长度,解释总体 参数落入某置信区间可能的概率。 区间估计存在成功估计的概率大小及估计范围大小两个问题。人们在解决实际问题时, 总希望估计值的范围小一点,成功的概率大一些。但在样本容量一定的情况下,这两个要求 是一对矛盾。如果想使估计正确的概率加大,势必要将置信区间加长,就像在百分制的测验 中,估计一个人的得分可能为 0 至 100 分之间就绝对正确一样。反之,如果要使估计的区 间变小,那就会降低正确估计的概率。 统计分析中一般采取一种妥协办法:在保证置信度的前提下,尽可能提高精确度。规定 正确估计的概率,即置信度为 0.95 或 0.99,那么显著性水平则为 0.05 或 0.01,这是依据 0.05 或 0.01 属于小概率事件,而小概率事件在一次抽样中是不可能出现的原理规定的。α =0.01 表示反复抽样 1000 次,则得到的 1000 个区间中不包含参数真值的仅为 10 个左右。 0.05 水平和 0.01 水平也是人们习惯上常用的两个显著性水平。 区间估计的原理是样本分布理论。在计算区间估计值,解释估计的正确概率时,依据的 是该样本统计量的分布规律及样本分布的标准误(SE)。也就是说,只有知道了样本统计量 的分布规律和样本统计量分布的标准误才能计算总体参数可能落入的区间长度,并对区间估 计的概率进行解释,可见标准误及样本分布对于总体参数的区间估计是十分重要的。样本分 布可提供概率解释,而标准误的大小决定区间估计的长度。一般情况下,加大样本容量可使 标准误变小。
张厚粲《现代心理与教育统计学》(第3版)笔记和课后习题(含考研真题)详解

张厚粲《现代心理与教育统计学》(第 3 版)笔记和课后习题详解第 1 章绪论一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3 .统计学大致分为理论统计学(theoretical statistics )和应用统计学(applied statistics )两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现2.心理与教育科学研究数据具有随机性和变异性3.心理与教育科学研究数据具有规律性4.心理与教育科学研究的目标是通过部分数据来推测总体特征(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
二、心理与教育统计学的内容心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别。
(一)依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。
张厚粲《现代心理与教育统计学》(第3版)笔记和课后习题(含考研真题)详解

张厚粲《现代心理与教育统计学》(第3版)笔记和课后习题详解第1章绪论一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(applied statistics)两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现2.心理与教育科学研究数据具有随机性和变异性3.心理与教育科学研究数据具有规律性4.心理与教育科学研究的目标是通过部分数据来推测总体特征(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
二、心理与教育统计学的内容心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别。
(一)依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。
张厚粲《现代心理与教育统计学》(第3版)【章节题库】(差异量数)

第4章差异量数一、单选题1.测得某班学生的物理成绩(平均分78分)和英语成绩(平均分70分),若的比较两者的离中趋势,应计算()。
A.方差B.标准差C.四分差D.差异系数【答案】D2.研究者决定通过每一个分数除以10来对原始分数进行转换。
原始分数分布的平均数为40,标准差为15。
那么转换以后的平均数和标准差将会是()。
A.4,1.5B.0.4,0.15C.40,1.5D.0.4,1.5【答案】A3.已知平均数=4.0,S=1.2,当X=6.4 时,其相应的标准分数为()。
A.2.4B.2.0C.5.2D.1.3【答案】B4.求数据16,18,20,22,17的平均差()。
A.18.6B.1.92C.2.41D.5【答案】B5.测得某班学生的物理成绩(平均78分)和英语成绩(平均70分),若要比较两者的离中趋势,应计算()。
A.方差B.标准差C.四分差D.差异系数【答案】D6.某学生某次数学测验的标准分为2.58,这说明全班同学中成绩在他以下的人数百分比是(),如果是-2.58,则全班同学中成绩在他以上的人数百分比是()。
()A.99%,99%B.99%,1%C.95%,99%D.95%,95%【答案】A7.已知一组数据6,5,7,4,6,8的标准差是1.29,把这组中的每一个数据都加上5,然后再乘以2,那么得到的新数据组的标准差是()。
A.1.29B.6.29C.2.58D.12.58【答案】C8.标准分数是以()为单位表示一个分数在团体中所处位置的相对位置量数。
A.方差B.标准差C.百分位差D.平均差【答案】B9.在一组原始数据中,各个Z分数的标准差为()。
A.1B.0C.根据具体数据而定D.无法确定【答案】A10.已知某小学一年级学生的平均体重为26千克,体重的标准差是3.2千克,平均身高110厘米,标准差为6.0厘米,问体重与身高的离散程度哪个大()?A.体重离散程度大B.身高离散程度大C.离散程度一样D.无法比较【答案】A11.已知一组数据服从正态分布,平均数为80,标准差为10。
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(抽样原理及方法)【圣才出品】

张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解第14章抽样原理及方法14.1复习笔记本章重点✓各类抽样方法的概念✓抽样原理✓抽样方法的应用✓确定样本容量的方法在心理、教育以及其他领域的调查研究中,绝大部分不可能也没有必要对研究总体中的每个个体逐一进行调研。
一般是从中抽取一部分个体作为研究样本,应用参数估计或假设检验等统计方法,从样本的研究结果对总体特征进行推论。
这种推论的可靠性,一方面依赖于研究过程中无关变量的控制和数据处理的准确性,另一方面则依赖于样本的代表性。
一、抽样的意义和原则(一)抽样调查研究的意义1.抽样调查的概念(1)从总体中抽取部分个体组成样本,对样本进行观察或实验,获得样本信息,进而推断未知总体情况,称为抽样调查。
(2)抽样调查分为非概率抽样调查和概率抽样调查两大类。
①非概率抽样调查是依据调查者的经验有目的地挑选一部分个体组成样本,然后根据对样本的观察来推断总体的基本情况。
典型调查和重点调查就是常见的非概率抽样。
它常常不能作为推断未知总体参数的依据,而且不能计算调查结果的理论精确度和可靠程度。
②概率抽样调查则要求总体中每个个体被抽中的概率是已知的。
这样,研究者就可以根据概率论的原理,随机地抽取部分个体组成样本,然后利用各种推断统计的方法进行参数估计和假设检验,并能计算出调查结果的理论精确度和可靠程度。
(3)任何一个抽样调查都可能产生误差。
调查的总误差可以分为两部分:非抽样误差和抽样误差。
非抽样误差指漏报、错报、测量误差以及在调查结果的登录、汇总等环节上产生的误差,其误差大小很大程度上取决于调查的组织工作是否完善;抽样误差则是根据样本信息来推断总体信息时产生的随机误差。
2.抽样调查的作用(1)节省人力及费用(2)节省时间,提高调查研究的时效性(3)保证研究结果的准确性(二)抽样的基本原则1.随机化(randomization)是抽样研究的基本原则。
随机化原则,是指在进行抽样时,总体中每一个体是否被抽取,并不由研究者主观决定,而是每一个体按照概率原理被抽取的可能性是相等的。
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(假设检验)【圣才出品】

想的希望证实的假设。这种假设称为科学假设,用统计术语表示时称为研究假设,记作 H1 。 3.在统计学中不能对 H1 的真实性直接检验,需要建立与之对立的假设,称作虚无假设
(null hypothesis),或称为无差假设、零假设、原假设,记为 H0 。在假设检验中 H0 总是 作为直接被检验的假设,而 H1 与 H0 对立,二者择一,因而 H1 有时又称为对立假设或备择 假设(alternative hypotheses),它的意思是一旦有充分理由否定虚无假设 H0,则 H1 这 个假设备你选择。假设检验的问题,就是要判断虚无假设 H0 是否正确,决定接受还是拒绝 (reject)虚无假设 H0。若拒绝虚无假设 H0,则接受备择假设 H1。运用统计方法若证明 H0 为真,则 H1 为假;反之 H0 为假,则 H1 为真。虚无假设与备择假设互相排斥并且只有一 个正确。因而虚无假设是统计推论的出发点。虚无假设常常是根据历史资料,或根据周密考
1 / 54
圣才电子书
一、假设检验的原理
十万种考研考证电子书、题库视频学习平台
(一)假设与假设检验
1.假设是科学研究中广泛应用的方法,它是根据已知理论与事实对研究对象所做的假
定性说明。统计学中的假设一般专指用统计学术语对总体参数所做的假定性说明。
2.在进行任何一项研究时,都需要根据已有的理论和经验事先对研究结果做出一种预
导致逻辑上的矛盾从而否定原来的假设条件。假设检验中的“不合理现象”是指小概率事件
在一次试验中发生了,它是基于人们在实践中广泛采用的小概率事件原理,该原发生的”。假设推断的依据就是小概率事件原理。通常
情况下,将概率不超过 0.05 的事件当作“小概率事件”,有时也定为概率不超过 0.01 或者
张厚粲《现代心理与教育统计学》(第3版)【章节题库】(假设检验)

第8章假设检验一、单选题1.理论预期实验处理能提高某种实验的成绩。
一位研究者对某一研究样本进行了该种实验处理,结果未发现处理显著的改变实验结果,下列哪一种说法是正确的?()A.本次实验中发生了I类错误B.本次实验中发生了II类错误C.需要多次重复实验,严格设定统计决策的标准,以减少I类错误发生的机会D.需要改进实验设计,提高统计效力,以减少II类错误发生的机会【答案】D2.以下关于假设检验的命题,哪一个是正确的?()A.如果H0在α=0.05的单侧检验中被接受,那么H0在α=0.05的双侧检验中一定会被接受B.如果t的观测值大于t的临界值,一定可以拒绝H0C.如果H0在α=0.05的水平上被拒绝,那么H0在α=0.01的水平上一定会被拒绝D.在某一次实验中,如果实验者甲用α=0.05的标准,实验者乙用α=0.01的标准。
实验者甲犯II类错误的概率一定会大于实验者乙。
【答案】A3.假设检验中的第二类错误是()。
A.原假设为真而被接受B.原假设为真而被拒绝C.原假设为假而被接受D.原假设为假而被拒绝【答案】C4.实际工作中,两均数作差别的统计检验时要求数据近似正态分布,以及()。
A.两样本均数相差不太大B.两组例数不能相差太多C.两样本方差相近D.两组数据标准误相近【答案】C5.在假设检验中,α取值越大,称此假设检验的显著性水平()。
A.越高B.越低C.越明显D.越不明显【答案】B6.假设检验中两类错误的关系是()。
A.α=βB.α+β=1C.α+β=1/2D.α+β不一定等于1【答案】D7.单侧检验与双侧检验的区别不包括()。
A.问题的提法不同B.建立假设的形式不同C.结论不同D.否定域不同【答案】C8.在统计假设检验中,同时减少α和β错误的最好办法是()。
A.控制α水平,使其尽量小B.控制β值,使其尽量小C.适当加大样本容量D.完全随机取样【答案】C9.统计学中称()为统计检验力。
A.αB.βC.1-αD.1-β【答案】D10.假设检验一般有两个相互对立的假设,即()。
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(线性回归)【圣才出品】

Yˆ1 a bX1 Yˆ3 a bX3 Yˆ2n1 a bX 2n1 Yˆ奇数 a bX奇数 (1) (3)将偶数组数据代入方程 Yˆ a bX ,将各组方程对应系数求和。即
4 / 33
圣才电子书
一、线性回归模型的建立方法 通过大量的观测数据,可以发现变量之间存在的统计规律,并用一定的数学模型表示出 来,这种用一定模型来表述变量相关关系的方法就称为回归分析。一次函数是变量之间存在 的各种各样的关系模型中最简单的形式。对于这种线性关系(1inear relationship)的回归 分析称作线性回归(1inear regression)。只有一个自变量的线性回归称作简单线性回归 (simple linear regression)。 (一)回归分析与相关分析的关系 1.联系
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(非参数检验)【圣才出品】

圣才电子书 十万种考研考证电子书、题库视频学习平台
相关、 2 检验都属于非参数方法。 一、非参数检验的基本概念与特点 (一)非参数概念 1.“非参数”概念可以从不同的角度理解。它首先指非参数模型。当总体或样本的分
布能够由有限的几个参数来确定时,就是参数模型;否则就是非参数模型。从统计学的观点 出发,参数模型,是指分布的模式(pattern)已经知道(比如说已经知道总体分布为正态 分布),而其中的一些具体的细节(参数)是未知的,这种对分布模式的知识可以解释为在 观察样本之前所掌握的信息,利用这种事先掌握的信息,可以使研究者更有效地提炼样本中 的(关于参数的)信息。
二、单样本游程检验 在进行推断统计时,往往要求是随机样本。单样本游程检验就是用来检验样本随机性的 非参数检验。
3 / 3统计中,两个相同符号的连续串称为游程。根据游程数来判断样本的随机性的方法就
是单样本游程检验。
圣才电子书 十万种考研考证电子书、题库视频学习平台
张厚粲《现代心理与教育统计学》第 3 版笔记和课后习题含考研真题详解 第 11 章 非参数检验
11.1 复习笔记
本章重点 非参数检验的特点与原理 秩和检验法 中数检验法 符号检验法 等级方差分析。
统计推断问题有两个共同特点:一方面它们都是在给定或假定总体的分布形式基础上, 对总体的未知参数进行估计或者检验,以明确的总体分布为前提;另一方面需要满足某些总 体参数的假定条件。这一类假设检验一般都称之为参数检验(parametric test)。在实践中, 研究人员对所研究的总体可能知之不多,有时对参数检验中的诸多要求和假定很难完全满 足,这样,在不符合参数检验的条件下,参数检验就不适用了。此时,应当使用统计学中的 另一类检验方法,即非参数检验(non-parametric test)。
张厚粲《现代心理与教育统计学》(第3版)【章节题库】(统计图表)

第2章统计图表一、单选题1.统计图中的y轴一般代表()。
A.因变量B.自变量C.数据D.被试变量【答案】A2.上限与下限之差为()。
A.极限B.组距C.组数D.全距【答案】B3.直方图一般适用于自变量的是()。
A.称名变量B.顺序变量C.等距变量D.等比变量【答案】C4.小李认为实验获得的数据有一定的偏斜,他想通过一种迅速有效的方式描述这种偏斜。
下列各种统计图中能描述这种偏斜的是()。
A.直条图B.直方图C.圆形图D.线形图【答案】C5.次数分布曲线图的横坐标代表各组数据的()。
A.上限B.中点C.下限D.平均值【答案】B6.特别适用于描述具有百分比结构的分类数据的统计图是()。
A.散点图B.圆形图C.条形图D.线形图【答案】B7.特别适用于描述具有相关结构的分类数据的统计分析图是()。
A.散点图B.圆形图C.条形图D.线形图【答案】A8.为了解某个数值以下的数据数目是多少,需要制作()。
A.次数分布表B.次数分布图C.累积次数分布表D.累积次数百分数的分布表【答案】C9.在一个统计图中y轴适用于表示()。
A.实验条件,即被试所在的组别B.每个组中被试的人数C.被试解决所有问题所花费的时间D.被试解决第三个问题所花费的时间【答案】D10.在一个统计图中X轴适用于表示()。
A.实验条件,即被试所在的组别B.每个组中被试的人数C.被试解决所有问题所花费的时间D.被试解决第三个问题所花费的时间【答案】A11.以下各种图形中,表示间断性资料频数分布的是()。
A.圆形图B.直方图C.散点图D.线形图【答案】A12.适用于描述某种事物在时间上的变化趋势,及一种事物随另一种事物发展变化的趋势模式,还适用于比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系的统计分析图是()。
A.散点图B.圆形图C.条形图D.线形图【答案】D二、多选题:1.次数分布可分为()。
A.简单次数分布B.分组次数分布C.相对次数分布D.累积次数分布【答案】ABCD2.以下各种图形中,表示连续性资料频数分布的是()。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章绪论1.描述统计(descriptive statistics)主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。
2.描述统计只限于对试验样本所得观测数据的统计分析,不考察其总体的特性。
3.推论统计(inferential statistics)是以描述统计为基础,从而解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特性。
4.变量(variables):一个可以取不同数值的物体属性/事件。
5.事前无法预期结果的变量——随机变量6.观测值(原始取值):事后测定的某一结果。
7.概念理解:[涉及“实验”] 自变量(及其各水平)& 因变量(及相应的反应指标);[涉及“调查”,粗略对应于] 属性变量& 反应变量8.计数资料(count data):计算个数的数据,(如人口数,学校数,男女数等)9.计量资料(measurement data):借助于一定的测量工具或一定的测量标准而获得的数据(如分数,身高,体重,IQ)10.称名数据(nominal data):只区分属性或类别上的不同,只可计数,不能排序(性别,学科,职业)11.等级/顺序数据(ordinal data):可排序,但无相等单位,不能加减。
(等级评定,受教育程度,职称)12.等距数据(interval data):具有相等单位,无绝对零的数据,能加减不能乘除。
13.比率数据(ratio data):既表明量的大小,又具有相等单位,可以加减乘除,具有绝对零点。
14.称名数据和顺序数据合称为离散数据。
15.等距数据和比率数据合称为连续数据。
16.离散数据(discrete data)又称为不连续数据,这类数据在任何两个数据点之间所取的数据的个数是有限的。
17.连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。
18.总体(population):具有某种特征的一类事物的全体。
用N表示。
19.个体(individual):构成总体的每个基本单元。
20.样本(sample):从总体中抽取的一部分个体。
21.频数(frequency):某一时间在某一类别中出现的数目22.频率:某一事件数目与此类别所有事件数目之比。
23.概率:用P。
某一事件在无限的观测中所能预料的相对出现的次数。
24.参数(parameter):描述总体特征的统计指标25.样本统计量/特征值:描述样本特征的统计指标。
26.统计量(statistics):样本的特征值第二章统计图表1.统计分组是根据被研究对象的特征,将所得数据划分到时各个级别中去。
2.统计分组应注意的问题:①分组要以被研究对象的本质特性为基础。
②分类标志的确立必须坚持穷尽性和互斥性原则。
3.分组次数分布表编制步骤:①求全距(最大值与最小值之差)②决定组距与组数③列出分组区间(精确组限、组中值):注意核实是否满足穷尽和互斥原则。
④登记并计算次数⑤编制次数分布表。
4.条形图适用资料为离散数据,饼图适用资料是间断性(离散性)资料,线形图、散点图用于连续性资料5.条形图与直方图的区别:①适用资料不同;②横轴标尺不同;③图形形状不同。
6.累加折线图 → 累加曲线图(如,图2-8):分正偏态、正态、负偏态三种(如,图2-9)P.437.第三章 集中量数1.集中趋势:数据向某方向的集中程度。
离中趋势:数据彼此的分散程度。
用来描述一组数据这两种特点的统计量即为集中量数和差异量数。
2.平均数的计算:N fX X c∑=,i N fd AM X ⨯+=∑其中,∑f 为各组数据的总次数(等于N ),X c 为各分组区间的组中值,f 为各组次数,AM 为估计平均数,i 为组距。
p.563.平均数的特点①离均差总和为0。
②每个数加上C ,则所得平均数为原平均数加上C。
③每个数乘以C,则所得平均数为原平均数乘以C。
4.平均数的优缺点1、优点:①反应灵敏。
②计算严密。
③计算简单。
④简明易解。
⑤适合于进一步代数演算。
⑥较少受抽样变动的影响。
2、缺点:①易受极值的影响。
“修剪平均数”②若有数据不够确切,则无法计算该样本平均数。
5.中数又称中位数/中点数,符号为Md(Median),是指一组数据中位于较大一半与较小一半中间位置的那个数。
适用资料:顺序数据及以上6.中数计算方法,p.617.中数优点:计算严密;计算简单;简明易解。
缺点:反应不灵敏;不适合进一步代数演算;受抽样变动影响较大。
8.众数又称范数/密集数/通常数,符号Mo(Mode),是指一组数据中出现次数最多那个数。
适用资料:称名数据及以上9.众数一般计算方法:直接观察10.众数优点:简明易解。
缺点:反应不灵敏;不适合进一步代数演算;受抽样变动影响较大。
11.正态分布中三者相等,正偏态中M > Md > Mo,负偏态中M < Md < Mo。
P.66第四章差异量数1.全距又称两极差,用最大值与最小值之差来表示离中趋势,符号R (range),R=X max-X min适用于等距数据及以上(将就也会用于顺序数据),计算所得数值越大,表明数据越离散/分散。
2.百分位差:用百分位数之间的差值来表示离中趋势,常用的有P90-P10、P93-P7。
3.四分位差(及四分位数)可视为百分位差的一种,符号Q(quartile deviation),公式Q =(P75 - P25)/2(即第三个四分位数与第一个四分位数之差的一半)4.平均差:离均差绝对值的均值,符号A.D.,公式5.平均差优缺点:描述离中趋势/离散程度最为直观,计算简单严密易懂、反应灵敏、受抽样变动影响小;但受限于取绝对值不利于进一步代数运算,因此仍属低效,应用不多。
(与平均数差不多)6.方差:离均差平方的均值,符号S2,公式7.标准差:符号S、s或SD,公式8.方差性质:①方差的可加性和可分解性②每个数加上C,则所得标准差等于原标准差。
③每个数乘以C,则所得标准差为原标准差乘以C。
9.优势①反应灵敏。
②计算严密。
③(还算)计算简单。
④(还算)简明易懂。
⑤适合于进一步代数演算。
⑥较少受抽样变动的影响。
缺点:①受极端数据影响大,若有缺失值,则计算不出标准差10.差异系数(coefficient of variation)用以比较多组数据之间离散程度的大小。
常用于:①同一团体不同观测值离散程度的比较(如,身高vs. 体重);②(各均值相差较大时)不同团体同种观测值离散程度的比较(如,成人体重vs. 小孩体重)11.差异系数计算公式:①适用资料至少是等距,理论要求为比率数据;②尚不能进行统计推论。
12.标准分数(standard score,又称Z分数)是以标准差为单位来表示一个原始分数在团体中所处的相对位置量数。
可用以比较多个数在其所在数组分布中的相对位置的高低(Z分数越大,表明该数据在其分布中取值越大、相对位置越靠前)。
计算公式:13.标准分数的优缺点优点:可比性;可加性;明确性;稳定性。
缺点:计算相对繁琐;常为负数或带有小数,难理解标准分数的应用(适用前提:正态变量)⑴(利用Z分数具有可比性)用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。
⑵(再利用Z分数具有可加性)计算不同质的观测值的总和,以表示在团体中的相对位置。
[自习例4-9、4-10]⑶表示标准测验分数。
(如,“离差智商”,自习)⑷极端数据的取舍:M±2S或M±3S标准(即“正负两个或三个标准差原则”)第五章相关关系1.相关关系:变量之间存在相互联系,但不能直接做因果判断。
2.相关系数(coefficient of correlation):变量间相关程度的数字表现形式,即表示相关强度的指标(相关量数)。
符号:样本r ,总体ρ3.取值范围:-1≤r≤1该式表明:①相关系数的取值范围介于-1.00至+1.00之间,他是一个比率,常用小数形式表示。
②正负只表示方向,取值大小表示相关的强弱程度(值越大,相关越高)。
③相关系数r=+1.00时表示完全正相关。
④它只是顺序数据;4.散点图(scatter plot)以点的散布形状和疏密程度来显示两个变量的相关趋势和相关程度。
5.皮尔逊积差相关(Pearson’s product-moment correlation)适用资料适用资料[诸多条件缺一不可!]①(大样本的)成对数据(表现为两组数据存在一一对应关系),每对数据相互独立。
②正态双变量(即两总体服从正态分布或渐近正态的单峰分布)。
[样本咋样就不管了]③两数据类型均为连续数据(即等距/比率数据)。
④两变量呈直线相关(先用散点图预测)6.皮尔逊积差相关计算公式:7.斯皮尔曼等级相关(Spearman’s rank correlation)符号:rR或rS适用资料①两列变量,成对数据,各对数据相互独立;②均为顺序数据(及以上);③直线相关。
8.斯皮尔曼相关(较之积差相关)优点:适用范围大;缺点:精确度低。
因此,凡符合计算积差相关的资料,不要用等级相关计算。
9.斯皮尔曼等级相关计算公式:10.肯德尔W系数(和谐系数,Kendall’s concordance coefficient)P128适用资料:多列等级变量。
采用等级评定法或排序评定法所获得的资料。
(评分者信度)11.肯德尔U系数(一致性系数,Kendall’s consistency coefficient)适用资料:多列等级变量。
采用对偶比较法所获得的资料。
12.点二列相关分为:真正的vs. 人为的二分变量;后者可降级为前者。
13.点二列相关适用资料:连续变量与真正的二分变量,常用以评价是非题之类测验的内部一致性等。
连续数据与人为二分变量常用二列相关.14.求连续变量与顺序变量之间相关系数的降级方法通常为:①连续↘顺序求斯皮尔曼等级相关;②顺序↘称名求质量相关。
(前者居多)15.多列相关适用资料:两列正态变量,连续+人为地分成多组。
16.四分相关适用资料:两个都是人为的二分变量(本来是连续数据),其R ×C表为四格表。
17.Φ相关(系数)适用资料:两个都是真正的二分变量,其R×C表为四格表。
第六章概率分布1.频率:在对随机事件进行n次观测中,事件A出现m次,则m/n称为n 次试验中A出现的频率。
2.后验概率:当n→∞时,m/n将稳定于某个常数P上,P即为概率。
特点:试验之前无法预计,只有借助试验结果来估计。
3.先验概率:如果基本事件的总数为n,事件A包括m个基本事件,则事件A出现的概率记作P(A)=m/n。