《现代心理与教育统计学》张厚粲 期末考点梳理
张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](差异量数)
第4章差异量数1.度量离中趋势的差异量数有哪些?为什么要度量离中趋势?答:(1)度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差。
差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称离散量数(measures of dispersion)。
(2)度量离中趋势的必要性在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。
这些特殊性常表现为数据的变异性。
因此,只用集中量数不可能真实地反映出它们的分布情形。
为了全面反映数据的总体情况,除了必须求出集中量数外,这时还需要使用差异量数。
2.各种差异量数各有什么特点?答:(1)标准差计算最严密,它根据全部数据求得,考虑到了每一个样本数据,测量具有代表性,适合代数法处理,受抽样变动的影响较小,反应灵敏。
缺点是较难理解,运算较繁琐,易受极端值的影响。
(2)方差的描述作用不大,但是由于它具有可加性,是对一组数据中造成各种变异的总和的测量,通常采用方差的可加性分解并确定属于不同来源的变异性,并进一步说明各种变异对总结果的影响。
因此,方差是推论统计中最常用的统计量数。
(3)全距计算简便,容易理解,适用于所有类型的数据,但它易受极值影响,测量也太粗糙,只能反映分布两极端值的差值,不能显示全部数据的差异情况,仅作为辅助量数使用。
(4)平均差容易理解,容易计算,能说明分布中全部数值的差异情况,缺点是会受两极数值的影响,但当数据较多时,这种影响较小,因有绝对值也不适合代数方法处理。
(5)百分位差易理解,易计算,不易受极值影响,但不能反映出分布的中间数值的差异情况,也仅用作补助量数。
(6)四分位差意义明确,计算方便容易,对极端值不敏感,较不受极端值影响。
当组距不确定,其他差异量数都无法计算时,可以计算四分位差。
但是,四分位差无法反映分布中所有数据的离散状况,不适合使用代数方法处理,受抽样变动影响较标准差大。
张厚粲《现代心理与教育统计学》配套题库【课后习题】(参数估计)【圣才出品】
第7章参数估计1.何谓点估计与区间估计,它们各有哪些优缺点?答:(1)点估计①定义点估计是指用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示。
②优缺点a.优点它能够提供总体参数的估计值。
b.缺点点估计以随机变量中的某一个值来做估计,很显然会产生一定的误差。
若误差较小,这个点估计值还是一个好的估计值,若误差较大,这个点估计便失去了意义。
(2)区间估计①定义区间估计是指根据估计量以一定可靠程度推断总体参数所在的区间范围,它是用数轴上的一段距离表示未知参数可能落入的范围。
②优缺点a.优点不仅给出一个估计的范围,使总体参数包含在这个范围之内,而且还能给出估计精度并说明估计结果的有把握的程度。
b .缺点 无法具体指出总体参数等于什么。
2.试以方差的区间估计为例说明区间估计的原理。
答:区间估计的原理是样本分布理论。
在计算区间估计值,解释估计的正确概率时,依据的是该样本统计量的分布规律及样本分布的标准误(SE )。
也就是说,只有知道了样本统计量的分布规律和样本统计量分布的标准误才能计算总体参数可能落入的区间长度,并对区间估计的概率进行解释,可见标准误及样本分布对于总体参数的区间估计是十分重要的。
样本分布可提供概率解释,而标准误的大小决定区间估计的长度。
一般情况下,加大样本容量可使标准误变小。
自正态分布的总体中,随机抽取容量为n 的样本,其样本方差与总体方差比值的分布为χ2分布。
根据χ2分布,可以说:σ2有1-α的概率落在与之间。
3.总体平均数估计的具体方法有哪些?答:总体平均数估计的具体方法有两种:(1)总体方差σ2已知时,用Z 分数对总体平均数μ的估计①当总体分布为正态时,不论样本n 的大小,其标准误X σ都是,这时样本的方差S 2在计算中没有用处。
依据上面所讲的步骤,查正态表,确定Z α/2,一般情况下显著性水平α确定为0.05或0.01。
()212/21n n s αχ--()()2121/21n n s αχ---②当总体为非正态分布时,只有当样本容量n >30以上,才能根据样本分布对总体平均数μ进行估计,否则不能进行估计。
张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](多变量统计分析简介)
第13章多变量统计分析简介1.探索性因素分析与验证性因素分析有什么区别?答:(1)探索性因素分析(exploratory factor analysis,简写为EFA)就是指传统的因素分析。
这种因素分析方法对于观察变量因子结构的寻找,并未有任何事前的预设假定。
对于因子的抽取、因子的数目、因子的内容以及变量的分类,研究者也没有事前的预期,而是由因素分析的程序去决定。
在典型的EFA中,研究者通过共变关系的分解,找出最低限度的主要成分(principal component)或共同因子(common factor),然后进一步探讨这些主成分或共同因子与个别变量的关系,找出观察变量与其相对应因子之间的强度,也就是因子负荷值(factor loading),以说明因子与所属的观察变量的关系,决定因子的内容,为因子取一个合适的名字。
由于传统的因素分析企图找出最少的因子来代表所有的观察变量,因此研究者必须在因子数目与可解释变异量(explained variance)两者间寻找平衡点。
因为因素分析至多可以抽取出相等于观察变量总数的因子数目,这样,虽然可以解释全部百分之百的变异,但失去因素分析找寻因子结构的目的,但如果研究者企图以少数几个较明显的因子来代表所有的项目,势必然将损失部分可解释变异来作为代价。
因而在EFA中,研究者相当一部分工作是在决定因子数目与提高因子解释的变异(即R square)。
(2)验证性因素分析(confirmatory factor analysis,简写为CFA)是在研究人员积极改善传统因素分析的限制,扩大其应用范围的基础上产生的。
这类因素分析要求,研究者对于潜在变量的内容与性质,在测量之初就必须有非常明确的说明,或有具体的理论基础,并已先期决定相对应的观察变量的组成模式,进行因素分析的目的是为了检验这一先期提出的因子结构的适合性。
这种因素分析方法也可用于理论架构的检验,它在结构方程模型中占有相当重要的地位,有着重要的应用价值,也是近年来心理测量与测验发展中相当重视的内容。
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(概率分布)【圣才出品】
圣才电子书 十万种考研考证电子书、题库视频学习平台
1.离散分布与连续分布 这是依随机变量是否具有连续性来划分的概率分布类型。当随机变量只取孤立的数值 时,这种随机变量称做离散随机变量,即计数数据。离散随机变量的概率分布又称作离散分 布,可用分布函数加以数量化描述。在心理与教育统计中最常用的离散分布为二项分布,除 此 之 外 还 有 泊 松 分 布 ( Poisson distribution ) 和 超 几 何 分 布 ( hypergeometric distribution)等。 连续分布是指连续随机变量的概率分布,即测量数据的概率分布,它用连续随机变量的 分布函数描述它的分布规律。统计中最常用的连续随机变量的分布为正态分布,其他连续分 布如负指数分布、威布尔分布等。 2.经验分布与理论分布 这是依分布函数的来源而划分的分布类型。经验性分布(empirical distribution)是 指根据观察或实验所获得的数据而编制的次数分布或相对频率分布。经验分布往往是总体的 一个样本,它可对所研究的对象给以初步描述,并作为推论总体的依据。理论性分布 (theoretical distribution)有两个含义,一是随机变量概率分布的函数——数学模型, 二是指按某种数学模型计算出的总体的次数分布。 随机变量概率分布的性质,由它的特征数来表达。这些特征数主要有期望值,即理论平 均数;方差,即理论的标准差的平方。因此,在统计推论部分通常只用平均数和标准差,而 不采用其他集中量数与差异量数。 3.基本随机变量分布与抽样分布 这是依概率分布所描述的数据特征而划分的概率分布类型。心理与教现代心理与教育统 对 学 育 统 计 中 常 用 的 基 本 随 机 变 量 分 布 有 二 项 分 布 与 正 态 分 布 。 抽 样 分 布 ( sampling distribution)是样本统计量的理论分布。样本统计量有:平均数、两平均数之差、方差、
张厚粲现代心理与教育统计学第4版知识点总结课后答案
第1 章绪论1.1 复习笔记本章重点✓心理与教育统计的研究内容✓选择使用统计方法的基本步骤✓统计数据的基本类型✓心理与教育统计的基本概念一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现。
2.心理与教育科学研究数据具有随机性和变异性。
3.心理与教育科学研究数据具有规律性。
4.心理与教育科学研究的目标是通过部分数据来推测总体特征。
(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题:(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
二、心理与教育统计学的内容心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别:(一)分类一依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。
1 现代心理与教育统计学 课后答案(张厚粲 徐建平著 著) 北京师范大学出版社
第一章1名词概念(1)随机变量答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。
(2)总体答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。
(3)样本答:样本是从总体中抽取的一部分个体。
(4)个体答:构成总体的每个基本单元。
(5)次数是指某一事件在某一类别中出现的数目,又称作频数,用f表示。
(6)频率答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。
(7)概率答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。
其描述性定义。
随机事件A在所有试验中发生的可能性大小的量值,称为事件A 的概率,记为P(A)。
(8)统计量答:样本的特征值叫做统计量,又称作特征值。
(9)参数答:又称总体参数,是描述一个总体情况的统计指标。
(10)观测值答:随机变量的取值,一个随机变量可以有多个观测值。
2何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。
具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义。
①统计学为科学研究提供了一种科学方法。
科学是一种知识体系。
它的研究对象存在于现实世界各个领域的客观事实之中。
它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。
要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。
统计学正是提供了这样一种科学方法。
统计方法是从事科学研究的一种必不可少的工具。
②心理与教育统计学是心理与教育科研定量分析的重要工具。
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(5-7章)【圣才出品】
(三)散点图 1.在相关研究中,常用相关散点图表示两个变量之间的关系。在直角坐标系中,以 X、 Y 二列变量中的一列变量(如 X 变量)为横坐标,以另一列变量(如 Y 变量)为纵坐标, 把每对数据 Xi、Yi 当作同一个平面上的 N 个点(Xi、Yi),一一描绘在 XOY 坐标系中,产生 的图形就称为散点图或相关图。 2.散点图通过点的散布形状和疏密程度来显示两个变量的相关趋势和相关程度,能够 对原始数据间的关系做出直观而有效的预测和解释。成对观测值愈多,散点图提供的信息就 越准确。因此,散点图是确定变量之间是否存在相关关系及关系紧密程度的简单而又直观的 方法。 3.不同形状的散点图形显示了两个变量间不同程度的相关关系。假设在直角坐标系中,
1 / 157
圣才电子书 十万种考研考证电子书、题库视频学习平台
哪个是果;也有理由认为这两者并不同时受第三因素的影响,即不存在共变关系。具有相关 关系的两种现象之间的关系是比较复杂的,甚至可能包含有暂时尚未认识的因果关系以及共 变关系在内。
2.相关的类别 统计学中所讲的相关是指具有相关关系的不同现象之间的关系程度,前提是事物之间的 这种联系又不能直接做出因果关系的解释。有时,相关被解释为两种特征相伴随的变化。相 关有以下三种: (1)正相关,两列变量变动方向相同,即一种变量变动时,另一种变量亦同时发生或 大或小与前一种变量同方向的变动。 (2)负相关,两列变量中有一列变量变动时,另一列变量呈现出或大或小但与前一列 变量方向相反的变动。 (3)零相关,两列变量之间没有关系,即一列变量变动时,coefficient of correlation)是两列变量间相关程度的数字表现形式,或者 说是用来表示相关关系强度的指标。作为样本间相互关系程度的统计特征数,常用 r 表示, 作为总体参数,一般用 表示,并且是就线性相关而言。相关系数与 X 、s 一样,也是应用 比较广泛的一个有代表性的统计量。r 的取值范围如下: -1.00≤r≤+1.00 上式表明: 1.相关系数 r 的取值范围介于-1.00 至+1.00 之间,它是一个比率,常用小数形式表 示。
现代心理教育与统计学 第三版复习资料(张厚粲)
第一章绪论1.描述统计(descriptive statistics)主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。
2.描述统计只限于对试验样本所得观测数据的统计分析,不考察其总体的特性。
3.推论统计(inferential statistics)是以描述统计为基础,从而解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特性。
4.变量(variables):一个可以取不同数值的物体属性/事件。
5.事前无法预期结果的变量——随机变量6.观测值(原始取值):事后测定的某一结果。
7.概念理解:[涉及“实验”] 自变量(及其各水平)& 因变量(及相应的反应指标);[涉及“调查”,粗略对应于] 属性变量& 反应变量8.计数资料(count data):计算个数的数据,(如人口数,学校数,男女数等)9.计量资料(measurement data):借助于一定的测量工具或一定的测量标准而获得的数据(如分数,身高,体重,IQ)10.称名数据(nominal data):只区分属性或类别上的不同,只可计数,不能排序(性别,学科,职业)11.等级/顺序数据(ordinal data):可排序,但无相等单位,不能加减。
(等级评定,受教育程度,职称)12.等距数据(interval data):具有相等单位,无绝对零的数据,能加减不能乘除。
13.比率数据(ratio data):既表明量的大小,又具有相等单位,可以加减乘除,具有绝对零点。
14.称名数据和顺序数据合称为离散数据。
15.等距数据和比率数据合称为连续数据。
16.离散数据(discrete data)又称为不连续数据,这类数据在任何两个数据点之间所取的数据的个数是有限的。
17.连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(1-4章)【圣才出品】
统计图表
1.描述统计
差异量数 集中量数 相关分析
点估计
心理与教育统计
2.推断统计 统计估计
参数估计
区间估计
非参数估计
假设检验
参数检验 非参数检验
样本选择与分配
实验误差分析
3.实验设计
方差分析 协方差分析
回归分析
因子分析 ... ...
1 / 107
圣才电子书 十万种考研考证电子书、题库视频学习平台
(二)心理与教育科学研究数据的特点 1.心理与教育科学研究数据与结果多用数字形式呈现 2.心理与教育科学研究数据具有随机性和变异性 3.心理与教育科学研究数据具有规律性 4.心理与教育科学研究的目标是通过部分数据来推测总体特征 (三)学习心理与教育统计应注意的事项 1.学习心理与教育统计学要注意的几个问题 (1)学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用, 只要有中学数学知识就具备了学好心理与教育统计学的前提。 (2)在学习时要注意重点掌握各种统计方法使用的条件。 (3)要做一定的练习。 2.应用心理与教育统计方法时要做到: (1)克服“统计无用”与“统计万能”的思想,注意科研道德。 (2)正确选用统计方法,防止误用和乱用统计。
圣才电子书
第1章 绪 论
十万种考研考证电子书、题库视频学习平台
1.1 复习笔记
本章重点 心理与教育统计的研究内容 选择使用统计方法的基本步骤 统计数据的基本类型 心理与教育统计的基本概念
一、统计方法在心理和教育科学研究中的作用 (一)心理与教育统计的定义与性质 1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理 与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论 找出心理与教育活动规律的一门学科。 2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些 数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理, 最后得出结论的一种研究方法。 3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(applied statistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各 个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。 类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
张厚璨《现代心理与教育统计学》书后习题详...
有多少。 1978 1979 1980 1981 1982 1983 1984 1985
毕业人数
542
601
750
760
810
930
1050
1120
解:该题是关于平均增加率的,应运用几何平均数计算。 N =8 X1=542 X8=1120
Mg= 8 1
1120 =1.10925 542
10
1.10925-1=0.10925=10.925% 10 年后的毕业人数为 1120* 1.10925 =3158(人)
2
16.93 1.37 9 11.0 11.1 13.0 11.1 10.5 11.1
i
N 9 答 : 这列数据的标准差是1.37, 平均数是1.19。
1.19
7/107 今有一画线实验,标准线分别为 5 厘米与 7 厘米。实验结果 5 厘米组的误差平均数 为 1.3 厘米,标准差为 0.7 厘米。10 厘米组的误差平均数为 4.3 厘米,标准差为 1.2 厘米。 请问用什么方法比较其离散程度的大小?并具体比较之。
i
x
2
( 1 ) 2 ( 2 ) 2 ( 9 )
(11.0 11.1) 2 (13.0 11.1) 2 (10.5 11.1) 2 16.93 (3)求标准差 N (4)求平均差 A.D. s
x
1
心理学统考专业资料店:/
QQ:382895420
次数分布表 分组区间 233~ 220~ 207~ 194~ 181~ 168~ 155~ 142~ 129~ 116~ 合计 由次数分布表可得累积次数分布表直方图,次数多边形图,如下: 累计次数分布表 分组区间 233~ 220~ 207~ 194~ 181~ 168~ 155~ 142~ 129~ c16~ 次数 2 1 7 5 11 18 6 11 3 1 向上累加次数 实际累加次数 65 63 62 55 50 39 21 15 4 1 相对累加次数 1 63/65 62/65 55/65 50/65 39/65 21/65 15/65 4/65 1/65 组中值(Xc) 239 226 213 200 187 174 161 148 135 122 次数(f) 2 1 7 5 11 18 6 11 3 1 65
《张厚粲《现代心理与教育统计学》(第4版)笔记和课后习题(含考》读书笔记PPT模板思维导图下载
11.2 课后习题 详解
11.1 复习笔记
11.3 考研真题 和强化习题详解
第12章 线性回归
12.2 课后习题 详解
12.1 复习笔记
12.3 考研真题 和强化习题详解
第13章 多变量统计分析简介
13.2 课后习题 详解
13.1 复习笔记
13.3 考研真题 和强化习题详解
第14章 抽样原理及方法
08 第8章 假设检验 010 第10章 χ2检验
目录
011 第11章 非参数检验
013
第13章 多变量统计 分析简介
012 第12章 线性回归
014
第14章 抽样原理及 方法
本书特别适用于参加研究生入学考试指定考研参考书目为张厚粲《现代心理与教育统计学》的考生,也可供 各大院校学习张厚粲《现代心理与教育统计学》的师生参考。本书是张厚粲主编的《现代心理与教育统计学》 (第4版)的配套辅导书(电子书),主要具有以下几个方面的特点:(1)梳理知识脉络,浓缩学科精华。本书 每章的复习笔记均对该章的重难点进行了整理,并参考了国内名校名师讲授该教材的课堂笔记。因此,本书的内 容几乎浓缩了该教材的所有知识精华。(2)详解课后习题,巩固重点难点。本书参考大量相关辅导资料,对该教 材的课后思考题进行了详细的分析和解答,并对相关重要知识点进行了延伸和归纳。(3)精编考研真题,培养解 题思路。本书精选部分参考价值较高的考研真题(含全国统考和高校自主命题),及该学科相关经典习题,并提 供详细解答。这些题目基本体现了各个章节的考点和难点。(4)免费更新内容,获取最新信息。本书定期会进行 修订完善,补充最新的考研真题和答案。用户均可升级电子书免费获得。
14.2 课后习题 详解
14.1 复习笔记
张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](概率分布)
圣才电子书 十万种考研考证电子书、题库视频学习平台
个标准差之间,包含总面积的 99%;-3 到+3s 范围之间,包含总面积的 99.74%;取值 在±4s 之间的概率为 0.9999,即包含总面积 99.99%。
(2)二项分布,
其特点有: ①二项分布是离散型分布,概率直方图是跃阶式。因为 x 为不连续变量,用概率条图表 示更合适,用直方图表示只是为了更形象 a 当 p=q 时图形是对称的。 b 当 p≠q 时,直方图呈偏态,p<q 与 p>q 的偏斜方向相反。如果 n 很大,即使 p≠q, 偏态逐渐降低,最终成正态分布,二项分布的极限分布为正态分布。当 p<q 且 np≥5,或 p>q 且 nq≥5,这时,二项分布就可以当做一个正态分布的近似形,二项分布的概率可用 正态分布的概率作为近似值。 ②二项分布的平均数与标准差 如果二项分布满足 p<q,np≥5(或 p>q,nq≥5)时,二项分布接近正态分布。这时, 二项分布的 X 变量(即成功的次数)具有如下性质: np , npq ,即 X 变量为 np , npq 的正态分布。公式中 n 为独立试验的次数,p 为成功事件的概率,q=1-p。 由于 n 很大时二项分布逼近正态分布,其平均数、标准差是根据理论推导而来,故用μ 和σ而不用 X 和 s 表示。它们的含义是指在二项试验中,成功次数的平均数 np ,成功次 数的离散程度 npq 。
1 / 19
圣才电子书 十万种考研考证电子书、题库视频学习平台
2.概率分布的类型有哪些?简述心理与教育统计中常用的概率分布及其特点。 答:概率分布(probability distribution)是指对随机变量取值的概率分布情况用数学 方法(函数)进行描述。只有了解随机变量的概率分布,才能使统计分析与推论有可能,为 统计分析提供依据,因此它在对数据进行统计处理时具有十分重要的意义。 概率分布依不同的标准可以分为不同的类型。 (1)离散分布与连续分布; (2)经验分布与理论分布; (3)基本随机变量分布与抽样分布。 常用的概率分布图有 (1)正态分布图,其特点有: ①正态分布的形式是对称的(但对称的不一定是正态的),它的对称轴是经过平均数点 的垂线。正态分布中,平均数、中数、众数三者相等,此点 y 值最大(0.3989)。左右不 同间距的 y 值不同,各相当间距的面积相等,y 值也相等。 ②正态分布的中央点(即平均数点)最高,然后逐渐向两侧下降,曲线的形式是先向内 弯,然后向外弯,拐点位于正负 1 个标准差处,曲线两端向靠近基线处无限延伸,但终不 能与基线相交。 ③正态曲线下的面积为 1,由于它在平均数处左右对称,故过平均数点的垂线将正态曲 线下的面积划分为相等的两部分,即各为 0.50。正态曲线下各对应的横坐标(即标准差) 处与平均数之间的面积可用积分公式计算:
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(参数估计)【圣才出品】
一、点估计、区间估计与标准误 参数估计分为点估计和区间估计。 (一)点估计的定义 点估计(point estimation)是用样本统计量来估计总体参数,因为样本统计量为数轴 上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。
1 / 39
圣才电子书 十万种考研考证电子书、题库子书、题库视频学习平台
3.区间估计的原理与标准误 区间估计是根据样本分布理论,用样本分布的标准误(SE)计算区间长度,解释总体 参数落入某置信区间可能的概率。 区间估计存在成功估计的概率大小及估计范围大小两个问题。人们在解决实际问题时, 总希望估计值的范围小一点,成功的概率大一些。但在样本容量一定的情况下,这两个要求 是一对矛盾。如果想使估计正确的概率加大,势必要将置信区间加长,就像在百分制的测验 中,估计一个人的得分可能为 0 至 100 分之间就绝对正确一样。反之,如果要使估计的区 间变小,那就会降低正确估计的概率。 统计分析中一般采取一种妥协办法:在保证置信度的前提下,尽可能提高精确度。规定 正确估计的概率,即置信度为 0.95 或 0.99,那么显著性水平则为 0.05 或 0.01,这是依据 0.05 或 0.01 属于小概率事件,而小概率事件在一次抽样中是不可能出现的原理规定的。α =0.01 表示反复抽样 1000 次,则得到的 1000 个区间中不包含参数真值的仅为 10 个左右。 0.05 水平和 0.01 水平也是人们习惯上常用的两个显著性水平。 区间估计的原理是样本分布理论。在计算区间估计值,解释估计的正确概率时,依据的 是该样本统计量的分布规律及样本分布的标准误(SE)。也就是说,只有知道了样本统计量 的分布规律和样本统计量分布的标准误才能计算总体参数可能落入的区间长度,并对区间估 计的概率进行解释,可见标准误及样本分布对于总体参数的区间估计是十分重要的。样本分 布可提供概率解释,而标准误的大小决定区间估计的长度。一般情况下,加大样本容量可使 标准误变小。
张厚粲《现代心理与教育统计学》(第3版)笔记和课后习题(含考研真题)详解
张厚粲《现代心理与教育统计学》(第3版)笔记和课后习题详解第1章绪论一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(applied statistics)两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现2.心理与教育科学研究数据具有随机性和变异性3.心理与教育科学研究数据具有规律性4.心理与教育科学研究的目标是通过部分数据来推测总体特征(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
二、心理与教育统计学的内容心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别。
(一)依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(抽样原理及方法)【圣才出品】
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解第14章抽样原理及方法14.1复习笔记本章重点✓各类抽样方法的概念✓抽样原理✓抽样方法的应用✓确定样本容量的方法在心理、教育以及其他领域的调查研究中,绝大部分不可能也没有必要对研究总体中的每个个体逐一进行调研。
一般是从中抽取一部分个体作为研究样本,应用参数估计或假设检验等统计方法,从样本的研究结果对总体特征进行推论。
这种推论的可靠性,一方面依赖于研究过程中无关变量的控制和数据处理的准确性,另一方面则依赖于样本的代表性。
一、抽样的意义和原则(一)抽样调查研究的意义1.抽样调查的概念(1)从总体中抽取部分个体组成样本,对样本进行观察或实验,获得样本信息,进而推断未知总体情况,称为抽样调查。
(2)抽样调查分为非概率抽样调查和概率抽样调查两大类。
①非概率抽样调查是依据调查者的经验有目的地挑选一部分个体组成样本,然后根据对样本的观察来推断总体的基本情况。
典型调查和重点调查就是常见的非概率抽样。
它常常不能作为推断未知总体参数的依据,而且不能计算调查结果的理论精确度和可靠程度。
②概率抽样调查则要求总体中每个个体被抽中的概率是已知的。
这样,研究者就可以根据概率论的原理,随机地抽取部分个体组成样本,然后利用各种推断统计的方法进行参数估计和假设检验,并能计算出调查结果的理论精确度和可靠程度。
(3)任何一个抽样调查都可能产生误差。
调查的总误差可以分为两部分:非抽样误差和抽样误差。
非抽样误差指漏报、错报、测量误差以及在调查结果的登录、汇总等环节上产生的误差,其误差大小很大程度上取决于调查的组织工作是否完善;抽样误差则是根据样本信息来推断总体信息时产生的随机误差。
2.抽样调查的作用(1)节省人力及费用(2)节省时间,提高调查研究的时效性(3)保证研究结果的准确性(二)抽样的基本原则1.随机化(randomization)是抽样研究的基本原则。
随机化原则,是指在进行抽样时,总体中每一个体是否被抽取,并不由研究者主观决定,而是每一个体按照概率原理被抽取的可能性是相等的。
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(假设检验)【圣才出品】
想的希望证实的假设。这种假设称为科学假设,用统计术语表示时称为研究假设,记作 H1 。 3.在统计学中不能对 H1 的真实性直接检验,需要建立与之对立的假设,称作虚无假设
(null hypothesis),或称为无差假设、零假设、原假设,记为 H0 。在假设检验中 H0 总是 作为直接被检验的假设,而 H1 与 H0 对立,二者择一,因而 H1 有时又称为对立假设或备择 假设(alternative hypotheses),它的意思是一旦有充分理由否定虚无假设 H0,则 H1 这 个假设备你选择。假设检验的问题,就是要判断虚无假设 H0 是否正确,决定接受还是拒绝 (reject)虚无假设 H0。若拒绝虚无假设 H0,则接受备择假设 H1。运用统计方法若证明 H0 为真,则 H1 为假;反之 H0 为假,则 H1 为真。虚无假设与备择假设互相排斥并且只有一 个正确。因而虚无假设是统计推论的出发点。虚无假设常常是根据历史资料,或根据周密考
1 / 54
圣才电子书
一、假设检验的原理
十万种考研考证电子书、题库视频学习平台
(一)假设与假设检验
1.假设是科学研究中广泛应用的方法,它是根据已知理论与事实对研究对象所做的假
定性说明。统计学中的假设一般专指用统计学术语对总体参数所做的假定性说明。
2.在进行任何一项研究时,都需要根据已有的理论和经验事先对研究结果做出一种预
导致逻辑上的矛盾从而否定原来的假设条件。假设检验中的“不合理现象”是指小概率事件
在一次试验中发生了,它是基于人们在实践中广泛采用的小概率事件原理,该原发生的”。假设推断的依据就是小概率事件原理。通常
情况下,将概率不超过 0.05 的事件当作“小概率事件”,有时也定为概率不超过 0.01 或者
张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](集中量数)
第3章集中量数1.应用算术平均数表示集中趋势要注意什么问题?答:在应用算术平均数表示几种趋势时,要注意:①算术平均数易受两极端数值(极大或极小)的影响。
②一组数据中某个数值的大小不够确切时就无法计算其算术平均数。
如果不处理好这两个问题,那么算术平均数将无法表示集中趋势。
2.中数,众数,几何平均数,调和平均数各适用于心理与教育研究中的哪些资料?答:中数的适用条件:①当一组观测结果中出现两个极端数目时;②当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值;③当需要快速估计一组数据的代表值时,也常用中数。
众数的适用条件:①当需要快速而粗略地寻求一组数现代心理与教育统计学据的代表值时;②当一组数据出现不同质的情况时,可用众数表示典型情况,如工资收入、学生成绩等常以次数最多者为代表值;③当次数分布中有两极端的数目时,除了一般用中数外,有时也用众数;④当粗略估计次数分布的形态时,有时用平均数与众数之差,作为表示次数分布是否偏态的指标;⑤当一组数据中同时有两个数值的次数都比较多时,即次数分布中出现双众数时,也多用众数来表示数据分布形态。
几何平均数的适用资料:当要计算教育经费增加率、学习方面的进步率和学生或人口增加率的估计时,可使用几何平均数。
调和平均数的适用资料:在心理与教育研究方面的应用,主要是用来描述学习速度方面的问题。
调和平均数作为一种集中量数,在描述速度方面的集中趋势时,优于其他集中量数。
在有关研究学习速度的实验设计中,反应指标一般常取两种形式:一是工作量固定,记录各被试完成相同工作所用的时间。
二是学习时间一定,记录一定时间内各被试完成的工作量。
由于反应指标不同,在计算学习速度时也不一样,这是应用调和平均数要特别注意的地方。
3.对于下列数据,使用何种集中量数表示集中趋势其代表性更好?并计算它们的值。
(1)4 5 6 6 7 29(2)3 4 5 5 7 5(3)2 3 5 6 7 8 9答:(1)中数6,因为题目中有极端数据,不适合用算术平均数。
现代心理与教育统计学 第八章-假设检验(张厚粲)
第一节 假设检验的原理
在统计学中,通过样本统计量得出的差异做出一般性 结论,判断总体参数之间是否存在差异,这种推论过 程称作假设检验(hypothesis testing)
假设检验分为参数检验和非参数检验。前者指的是总 体分布已知,需要对总体的未知参数做假设检验。后 者指的是总体分布知之甚少,对总体的函数形式和特 征进行假设检验。
这里取=0.05,因为是Z检验,所以临界值是-1.96
4. 利用显著性水平,建立拒绝H0的规则
0.05时, Z 2 Z0.025 1.96,
接受假设的区域为 : Z 1.96, 拒绝区域为 : 或Z 1.96,或Z 1.96
拒绝H0
0.025
拒绝H0
正解:
1、提出零假设和备择假设 备择假设:用H1表示,即研究假设,希望证实的假设。 H1 : 1 0 (该班智力水平确实与常模有差异) 1100 零假设:用H0表示,即虚无假设、原假设、无差异假 设。 H0: 1=0 1 =100
2、确定适当的检验统计量
用于假设检验问题的统计量称为检验统计量。与参数 估计相同,需要考虑:
Ⅱ型错误
α错误 正确
β 错误
(二)两类错误的关系
1. + ≠ 1 原因:与是两个前提下的概率。 即是拒绝原假设H0时犯错误的概率,这时前提是
H0为真; 是接受原假设H0时犯错误的概率,这时前提是H0
为伪。
H0为真, 即 μ 0=μ 1 的分布
+ ≠ 1
H1为真, 即 μ 0≠μ 1 的分布
总体是否正态分布; 大样本还是小样本; 总体方差已知还是未知。
Z=
X-0 0
n
本例中总体正态,样本容量大于等于30,检验统计量 为Z分布。
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(线性回归)【圣才出品】
Yˆ1 a bX1 Yˆ3 a bX3 Yˆ2n1 a bX 2n1 Yˆ奇数 a bX奇数 (1) (3)将偶数组数据代入方程 Yˆ a bX ,将各组方程对应系数求和。即
4 / 33
圣才电子书
一、线性回归模型的建立方法 通过大量的观测数据,可以发现变量之间存在的统计规律,并用一定的数学模型表示出 来,这种用一定模型来表述变量相关关系的方法就称为回归分析。一次函数是变量之间存在 的各种各样的关系模型中最简单的形式。对于这种线性关系(1inear relationship)的回归 分析称作线性回归(1inear regression)。只有一个自变量的线性回归称作简单线性回归 (simple linear regression)。 (一)回归分析与相关分析的关系 1.联系
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解(非参数检验)【圣才出品】
圣才电子书 十万种考研考证电子书、题库视频学习平台
相关、 2 检验都属于非参数方法。 一、非参数检验的基本概念与特点 (一)非参数概念 1.“非参数”概念可以从不同的角度理解。它首先指非参数模型。当总体或样本的分
布能够由有限的几个参数来确定时,就是参数模型;否则就是非参数模型。从统计学的观点 出发,参数模型,是指分布的模式(pattern)已经知道(比如说已经知道总体分布为正态 分布),而其中的一些具体的细节(参数)是未知的,这种对分布模式的知识可以解释为在 观察样本之前所掌握的信息,利用这种事先掌握的信息,可以使研究者更有效地提炼样本中 的(关于参数的)信息。
二、单样本游程检验 在进行推断统计时,往往要求是随机样本。单样本游程检验就是用来检验样本随机性的 非参数检验。
3 / 3统计中,两个相同符号的连续串称为游程。根据游程数来判断样本的随机性的方法就
是单样本游程检验。
圣才电子书 十万种考研考证电子书、题库视频学习平台
张厚粲《现代心理与教育统计学》第 3 版笔记和课后习题含考研真题详解 第 11 章 非参数检验
11.1 复习笔记
本章重点 非参数检验的特点与原理 秩和检验法 中数检验法 符号检验法 等级方差分析。
统计推断问题有两个共同特点:一方面它们都是在给定或假定总体的分布形式基础上, 对总体的未知参数进行估计或者检验,以明确的总体分布为前提;另一方面需要满足某些总 体参数的假定条件。这一类假设检验一般都称之为参数检验(parametric test)。在实践中, 研究人员对所研究的总体可能知之不多,有时对参数检验中的诸多要求和假定很难完全满 足,这样,在不符合参数检验的条件下,参数检验就不适用了。此时,应当使用统计学中的 另一类检验方法,即非参数检验(non-parametric test)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、统计图表p24
(1)表
1、简单次数表
适用于态度、兴趣、偏好等测验或调查的结果
2、分组次数
分数的分布范围较大时,用分组
3、相对次数分布表
4、累加次数分布表
5、双列次数分布表(相关次数分布表)
对有联系的两列变量用同一表表示其次数分布
(2)次数分布图
1、直方图——以面积表示连续性数据的次数分布
2、次数多边形图——以面积表示连续性数据的次数分布
凡是等距分组的可以用直方图都可以用次数多边形图,还可以对多个同质的次数分布的比较3、累加次数分布图
(3)其他常见的统计表类型
1、条形图(直条图)——主要表示离散型数据资料即计数资料
2、圆形图(饼图)——主要用于描述间断性资料,目的是显示各部分在整体中所占的比重大小,以及各部分之间的比较
3、线性图——用于连续性资料,凡欲表示两个变量之间的函数关系,或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的情形
4、散点图——表示统计资料数量大小以及变化趋势的图
二、数据类型p16
三、集中量数
(一)算术平均数p54
1、未分组数据计算平均数的方法
条件:未分组
公式:p54 公式(3-1)
2、用估计平均数计算平均数
条件:数据的数目或者数值很大时
公式:p55公式(3-2)
3、分组数据的计算方法
条件:分组数据
公式:p56
4、优缺点
a算术平均数的优点
反应灵敏;
严密确定,简明易懂,计算方便;
适合代数运算;
受抽样变动的影响较小;
样本算术平均数是总体平均数的最好估计值
b算术平均数的缺点
易受两极端数值(极大或极小)的影响;一组数据中某个数值的大小不够确切时就无法计算其算术平均数。
(二)中数
1、未分组求中数
①一组数据中无重复数据的情况(奇数/偶数)P61
②一组数据中有重复数据的情况(重复数据未列于中间/重复数据列于中间且数据个数奇数/重复数据列于中间且数据个数偶数)p62—p63
2、分组求中数
其中:
b L :中数所在组的实下限
b F :中数所在组以下各组次数之和(以下累积次数)
Mdn f :中数所在组的次数 i :组距
3、中数的优缺点
1)概念简单明白;
2)反应不够灵敏,极端值的变化对中数不产生影响;
3)受抽样影响大,不如平均数稳定;
4)计算时需要对数据排序;
5)中数乘以总数与数据总和不相等;
6)不能作进一步代数运算。
(三)众数
1、定义p64
2、计算方法
①直接观察
②皮尔逊经验法p65
金氏插补法p65
(四)加权平均数
1、条件:测量数据,其单位权重并不相等时
2、公式:一般算法(p68公式3-4),各小组平均数计算总平均数特例(p69公式3-5)
(五)几何平均数p70(不懂)
(六)调和平均数p73(不懂)
四、差异量数
1、标准差p87
定义/计算
2、方差p87
定义/计算
3、差异系数(变异系数/相对标准差)
五、相关系数
1、极差相关(皮尔逊相关)
条件:①成对的数据,例如学生智力分数与学术成绩,每对数据分数与其他对子没有关系,相互独立,成对数目不宜小于30对
②两列变量各自总体的分布是正态
③两列变量是连续变量即两列数据是测量数据
④两列变量之间的关系应是直线性的
2、等级相关
斯皮尔曼等级相关
条件:①成对的数据,两列变量,而且是属于等级变量性质的具有线性关系的资料
②主要解决名称数据和顺序数据的相关问题
③不必考虑是否为正态分布,正态条件不明或非正态时,转为等级求r
3、肯德尔等级相关
条件①有符合两列等级变量资料的交错系列和相关系数
肯德尔W系数:用于三个或三个以上变量等级的相关系数,即求几个变量的一致性或和谐性
比较复杂需要可以看p128
4、点二列相关p134
条件:①两个变量或两组数据
②一个连续,一个是真正的二分变量(例如男女,是否,生死)
5、二列相关
条件:①两列数据符合正态分布
②其中一列为等距或等比的测量数据,另一个变量为人为划分的二分变量(例如及格不及格,健康不健康,成人儿童,身高高与矮)
6、多列相关
条件:适合处理两列正态变量资料,其中一列为等距或等比变量的测量数据,另一列被人为分为多种类别,称为名义变量。
分为三类就叫作三列相关,四类就叫做四类相关。