张敏强《教育与心理统计学》【章节题库】(常用统计参数)【圣才出品】
张敏强《教育与心理统计学》【课后习题】(抽样理论与参数估计)【圣才出品】
第4章抽样理论与参数估计
1.试述点估计和区间估计的定义,并叙述其优缺点。
答:(1)点估计
①定义
点估计是指用一个样本值来估计总体参数值的过程。
判断估计量优劣的标准是无偏性、有效性和一致性。
如:通常用样本平均数来作为总体平均数的估计,而总体标准差的估计则要用n-1的标准差来估计。
②优缺点
a.优点:计算简单,容易理解。
b.缺点:因为点估计值是由样本数据计算出的一个单一数值,由于是随机抽样的,因此由计算样本统计量而得到的点估计值,就有可能不是总体参数的真正值。
且当用点估计去估计总体参数的真值时,其误差大小及可靠程度如何都不知道。
(2)区间估计
①定义
区间估计是指在一定的置信度水平下,用置信区间来对总体参数进行估计的过程。
②优缺点
a.优点:克服了点估计的缺点,它不仅告诉了总体参数估计的值范围,而且还给出了可靠程度。
b.缺点:点估计是一个精确的值,但区间估计是一个大致的范围。
2.已知某中学一次数学考试成绩的分布为正态分布,总体标准差为σ=5,从这个总体中抽取n=16,并计算得到81X =,6S =,试问该次考试中全体考生成绩均值μ的95%的置信区间。
解:因为成绩的分布为正态分布,总体标准差已知,置信度为95%, 且题目已知:σ=5,0.052
1.96Z =,n=16,81X =
1.96/81 1.96 1.2578.55X n σ-=-⨯=
1.96/81 1.96 1.2583.45X n σ+=+⨯=
故μ的置信度为0.95时,置信区间是[78.55,83.45]。
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(聚类分析)【圣才出品】
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解第13章聚类分析【本章重点】☆Q型与R型聚类☆聚类分析中距离的六种定义13.1复习笔记一、聚类分析的基本原理(一)聚类分析1.聚类分析的概念聚类分析是分类学与多元统计分析相结合的一种方法。
它将分类对象置于一个多维空间中,按照它们空间关系的亲疏程度进行分类。
其与一般分类方法的不同之处在于:(1)一般分类法往往从专业知识出发进行分析归类,而聚类分析先是仅凭变量指标进行定量分析,整理出分类的谱系追踪图,然后再据专业知识确定最终类型数目和类型命名;(2)一般的分类允许在不同层次上有不同的分类依据或分类准则,而聚类分析在所有层次上的分类依据和分类准则都是一样的;(3)一般分类不要求被分对象一次性完备,允许分类后继续补充样品甚至建立新类,而聚类分析要求被分类对象一次性完备,不允许中间插入新样品,否则要重复聚类分析的全过程。
2.聚类分析的分类依据(1)聚类分析作为一种数值分类法,分类依据是数据指标,要进行聚类分析必须建起一个描写事物本质属性的指标体系,或者一个变量组合。
(2)入选的指标需满足的要求:①指标必须能刻画事物属性的某个侧面,所有指标组合起来形成一个完备的指标体系,互相配合共同刻画事物的本质特征。
②要求每一个入选指标都与所研究的问题紧密联系,并且都有较强的分辨能力。
③指标本身还必须可测和稳定,可测是分类得以进行的先决条件,稳定是分类准确的前提。
如果分类指标间还具有直交性,那么还可提高聚类的效率。
若有N个样品、有M个指标,称为M维空间上N个样本点,测值X ik表示第i个样本点在第k维指标上的测量值。
空间N个样本点的所有测值可以矩阵X记之:(13.1)④在聚类分析中,要求入选的所有指标变量有统一的量纲。
(3)常用的整理原始数据的方法有以下几种:①数据中心化变换。
如果一批数据指标由于各自的分布中心有显著差异而导致量纲不一致,可以对数据作中心化变换,新的指标中心皆为0。
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解 第7章~第9章【圣才出品】
(5)列出回归方程:y=a+bx。
(三)一元线性回归方程的有效性检验 1.建立假设:H0:所建回归方程无效;
H1:所建回归方程有效。 2.计算离差平方和
总离差平方和:
n
回归平方和:U =b2 (xi x )2 i 1
剩余平方和: Q lyy U
3.计算自由度
df总 n 1, dfU 1, dfQ n 2 。
4.计算均方
回归均方: MSU U dfU
剩余均方: MSQ Q dfQ
5.检验统计量: F MSU MSQ
6.将所求数据填入方差分析表
(7.5)
5 / 75
圣才电子书 十万种考研考证电子书、题库视频学习平台
7.查表,做出统计决断。
(四)回归方程有效性高低的指标 一元线性回归分析所建立的回归方程经方差分析后被判定为具有有效性,仅能说明这个 回归方程有别于无使用价值的方程,但是并未指出这个方程有效性高到什么程度。在回归分 析中衡量回归方程有效性高低的指标称为决定系数,记作 R2,其值为:R2=U/ 。即决 定系数是回归平方和在总离差平方和中所占的比例。 此外,在一元线性回归中决定系数 R2 是因变量与自变量积差相关系数的平方,即
张敏强《教育与心理统计学》【章节题库】(假设检验)【圣才出品】
第5章 假设检验一、单项选择题1.在假设检验中,β值是( )。
A .犯Ⅰ型错误的概率B .犯Ⅱ型错误的概率C .犯Ⅰ型与Ⅱ型错误的概率之和D .犯Ⅰ型与Ⅱ型错误的概率之差【答案】B【解析】在进行假设检验时,有可能犯两类错误:①弃真错误,指虚无假设H 。
本来是正确的,但拒绝了H 。
的错误,即Ⅰ型错误。
由于这类错误的概率用α表示,故又称为α型错误。
②取伪错误,指虚无假设H 本来是不正确的,但却接受了H 的错误,即Ⅱ型错误,这类错误的概率以β表示,因此又称β型错误。
2.假设检验中的双侧检验是( )。
A .强调方向的检验B .强调差异大小的检验C .强调方向不强调差异的检验D .强调差异不强调方向性的检验【答案】D【解析】当只关心1μ和0μ是否有差异,而不关心到底1μ与0μ哪个更大,即只强调差异而不强调方向性的检验称为双侧检验。
当不仅关心1μ和0μ是否有差异,而且关心到底1μ与0μ哪个更大,即不仅强调差异性而且强调方向性的检验称为单侧检验。
3.应该使用单侧检验的问题进行了双侧检验,会导致( )。
A .α值减少,β值增加B .α值不变,β值增加C .α值增加,β值越小D .α值不变,β值减少【答案】A【解析】以显著性水平α=0.05为例,当使用单侧检验时,0.05的犯α错误概率只分布在一侧;而使用双侧检验时,0.05的犯α错误概率平均分配在两侧,一侧有0.025的犯α错误概率。
由于该检验本来应该是单侧检验,其中一侧的0.025的犯α错误的概率是不存在的,因此α值会减少。
α和β是此消彼长的关系,当α值减少时,β值会增加。
4.有研究者以韦氏儿童智力测验考察孤儿院中的儿童的智力水平是否比正常儿童低。
已知韦氏儿童智力测验常模的平均分是l00,标准差是15。
从孤儿院中随机抽取81个儿童进行韦氏儿童智力测验,得到的智商的平均分数是97。
那么从上述数据可知( )。
A .孤儿院长大的儿童与正常儿童在智商上没有统计学意义上的差距B .在0.05显著性水平上,孤儿院长大的儿童的智商低于正常儿童的智商C .在0.01显著性水平上,孤儿院长大的儿童的智商低于正常儿童的智商D .无法比较孤儿院长大的儿童的智商和正常儿童的智商【答案】B【解析】当总体是正态分布、总体方差已知时,样本平均数的分布为正态分布,需要检验的统计量为0X X CR Z SE μ-==,其中X SE =CR=1.8。
张敏强《教育与心理统计学》(第3版)章节题库(回归分析)【圣才出品】
第7章回归分析一、单项选择题1.如果要建立两个变量之间的数学模型,下列统计方法中,最恰当的是()。
[统考2009研]A.方差分析法B.因素分析法C.回归分析法D.聚类分析法【答案】C【解析】回归分析是用数学模型来表示变量之间的关系;方差分析法是两个及两个以上样本均数差别的显著性检验;因素分析法是对问卷的结构等进行分析;聚类分析也是适合对结构进行分类等。
2.在回归分析中,考察回归效果使用的指标是()。
[统考2008研]A.内部一致性系数B.决定系数C.概化系数D.列联系数【答案】B【解析】回归分析中的决定系数表示因变量的变异中有多少是由自变量的变异引起,是用来考察回归效果的指标;内部一致性系数即同质性信度是信度的一种;概化系数是概化理论的指标;列联系数是表示相关的指标。
3.回归分析的主要功能是()。
A.量化描述事物之间的关系B.根据一个变量预测另一个变量C.使变量关系中不确定的部分给予严格确定D.确定变量关系的方向【答案】B【解析】回归分析的基本思想是试图对不确定的关系进行确定,然后依据所能得到的最大程度的确定关系,由已知变量预测未知变量。
4.在回归分析中,决定系数等于()。
A.相关系数B.相关系数的平方C.相关系数的平方根D.回归系数的平方【答案】B【解析】相关系数的平方等于回归平方和在总平方和中的比例,因此相关系数的平方能够说明一个变量对另一个变量解释的比例,称为决定系数。
5.如果要研究两个自变量对因变量的解释量,应选用的统计方法是()。
A.方差分析法B.因素分析法C.回归分析法D.聚类分析法【答案】C【解析】当研究两个或两个以上的自变量对因变量的预测时,采用的研究方法是回归分析中的多元线性回归分析法,可以计算多个自变量对因变量的解释量,指标就是多元决定系数(R2)。
6.对一元线性回归方程回归系数进行显著性检验通常采用的方法是()。
A.2χ检验B.F检验C.t检验D.Z检验【答案】C【解析】对回归系数b进行显著性检验,实则就是假设总体回归系数β=0,考察b是否也为0。
张敏强《教育与心理统计学》【课后习题】(常用教育与心理实验设计)【圣才出品】
第10章常用教育与心理实验设计1.试述教育实验设计的意义及作用。
答:教育实验或心理实验是一种计划好的有控制的教育研究,其目的是为了解答问题,检验假设和估计效果。
(1)教育实验设计的意义教育实验设计的意义主要表现为如下几个方面。
①教育实验设计是教育科学研究计划内关于研究方法与步骤的一项重要内容。
②在教育科研工作中,在制订研究计划时,都应根据实验的目的和条例,结合统计学的要求,针对实验的全过程,认真考虑实验设计问题。
③在教育科研工作中,一个周密而完善的实验设计,能合理地安排各种实验因素,严格地控制实验误差,最大限度地获得丰富而可靠的资料。
总之,教育实验设计是教育研究中实验过程的依据、实验数据处理的前提,也是提高科研成果质量的一个重要保证。
(2)教育实验设计的作用教育实验设计的作用主要包括如下几个方面。
①能够回答教育研究心理研究的某些问题;②安排教育与心理实验,获得实验数据;③节省人力和物力;④获得科学结论。
2.教育实验设计要遵循哪些原则?答:费希尔首先提出实验设计应遵循三个原则:重复、局部控制和随机化。
它们是提高实验精度的最有效的方法。
(1)重复重复是指每一因素的水平(或因素的水平组合)的实验次数不少于2。
重复的作用是为了估计实验误差和减少实验误差。
(2)局部控制局部控制是力求使得非实验的影响尽可能减少的一种做法。
即让非实验条件在多次重复的实验中具有同质性。
(3)随机化随机化是实验设计中能够应用统计方法的保证。
它是指实验对象或实验材料的分配,以及各次实验中的先后次序,等等,都是随机选择和安排的。
其目的是使实验结果尽量避免受到主客观系统因素的影响而出现偏倚性,其作用是正确地估计误差。
3.比较随机区组实验设计和析因实验设计的异同。
答:(1)相同点随机区组实验设计和析因实验设计都是用来考查各实验处理对因变量的影响的实验设计;都可以用在多因素的实验设计中。
(2)不同点①概念不同随机区组设计是指将实验对象按一定的标准划分为数个区组,使得区组内的实验对象的个别差异尽可能小,既保证区组内的同质性,并使每个区组均接受所有实验处理,且各个区组内每个处理仅有一次观测,其顺序是随机决定的。
张敏强《教育与心理统计学》(第3版)章节题库(1-4章)【圣才出品】
第 1 章 常用的统计表与图
一、单项选择题 1.运用相对累加次数分布曲线,可以快速计算出与学生原始分数相对应的统计量是 ( )。[统考 2010 研] A.百分等级 B.Z 分数 C.T 分数 D.频次 【答案】A 【解析】运用相对累加次数分布曲线,可以根据横坐标的原始分数,从纵坐标上读出对 应的百分等级。
2.适用于描述某种心理属性在时间上变化趋势的统计分析图是( )。[统考 2010 研]
A.茎叶图 B.箱形图 C.散点图 D.线形图 【答案】D 【解析】茎叶图是将数据中的数按位数进行比较,将数的大小基本不变或变化不大的位 作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚
4.用于描述两个变量之间相关关系的统计图是( )。[统考 2007 研] A.直方图 B.线形图 C.条形图 D.散点图 【答案】D
2 / 45
【解析】散点图是用来表示两种事物之间的相关性及联系模式的点散布的图形,适用于 描述二元变量的观测数据;直方图是由若干宽度相等、高度不等的直方条紧密排列在同一基 线上构成的图形;线形图是以起伏的折线来表示某种事物的发展变化趋势及演变趋势的统计 图,适用于描述某种事物在时间序列上的变化趋势,也适用于描述一种事物随另一事物发展 变化的趋势模式,还可以适用于比较不同的人物团体在同一心理或教育现象上的变化特征及 相互联系;条形图是用宽度相同的长条来表示各个统计事项之间的数量关系,通常应用描述 离散性变量的统计事项。
6 坐标代表各组数据的( )。 A.上限 B.中点 C.下限 D.平均值 【答案】B 【解析】在次数分布曲线中,横坐标代表各组数据的中点。直方图中,横坐标代表各组 数据的精确下限和精确上限。
15.特别适用于描述具有百分比结构的分类数据的统计图是( )。 A.散点图 B.圆形图 C.条形图 D.线形图 【答案】B 【解析】圆形图主要用于描述间断性资料,目的是为显示各部分在整体中所占的比重大 小,以及各部分之间的比较。又称饼图,迅速直观有效的反映数据情况。
张敏强《教育与心理统计学》【名校考研真题】(多项选择题)【圣才出品】
二、多项选择题1.描述数据离中趋势的统计量有()。
[统考2007年研]A.方差B.标准差C.平均差D.四分位差【答案】ABCD【解析】描述数据离中趋势的统计量称为差异量数,差异量数包括平均差、方差与标准差、四分位差、全距、百分位差等。
2.方差分析需要满足的前提条件有()。
[统考2008年研]A.总体正态分布B.各处理方差齐性C.总体方差已知D.各组样本容量相同【答案】AB【解析】方差分析的前提是总体正态、方差齐性、变异可加。
3.某次高考分数呈正态分布,以此为基础可以()。
[统考2009年研]A.计算考生的标准分数B.由P值,计算Z值C.确定某一分数界限内的考生比例D.知道计划录取人数后确定录取分数线【答案】ABCD【解析】正态分布的应用主要有四方面:①计算标准分数;②根据概率计算Z;③确定某一分数范围内的人数比率;④根据计划录取人数来确定录取分数线。
4.散点图的形状为一条直线,且两个变量方差均不为0,它们之间的相关系数可能为()。
[统考2010年研]A.1B.0.5C.OD.-l【答案】AD【解析】散点图的形状为一条直线,它们之间的相关系数可能为1或者-1。
5.线性回归分析的前提假设有()。
[统考2011年研]A.变量总体服从正态分布B.个体间随机误差相互独立C.自变量的个数多于因变量的个数D.因变量和自变量之间存在线性关系【答案】ABD【解析】线性回归的基本假设有四点:线性关系假设,X与Y在总体上存在线性关系,正态性假设,回归分析中的Y服从正态分布。
独立性假设,一是指与某一个X值对应的一组Y值和与另一个X值对应的一组Y值间没有关系,二是误差项独立,不同的X所产生的误差之间应相互独立。
误差等分散性假设。
6.下列关于χ2分布的特点描述,正确的有()。
[统考2012年研]A.χ2取值均为正值B.χ2分布是正偏态分布C.χ2分布为非连续性分布D.χ2分布的标准差与自由度相同【答案】AB【解析】卡方分布的特点:①χ2值是正值;②χ2分布呈正偏态,随着参数n 的增大,χ2分布趋近于正态分布;③χ2分布具有可加性,χ2分布的和也是χ2分布;④χ2分布是连续分布,但有些离散分布也服从χ2分布,尤其在次数统计上非常广泛。
张敏强《教育与心理统计学》(第3版)课后习题(常用统计参数)【圣才出品】
第2章 常用统计参数1.某班学生的心理学平均成绩为75分,标准差为l0分,学生总数为43人。
根据这些信息,无法计算出的统计量有( )。
A .差异系数B .分数总和C .中数D .方差【答案】C【解析】中数计算方法:①首先确定中数在数据序列中的位置:dn M n =12n ,式中:dn M n 表示中数在数列中的位置;n 表示数列数据个数。
②然后再求数列中位于dn M n 位置上的那个数Mdn 。
题中没有具体数据序列,因此无法计算得到中数。
2.已知一组数据为2,5,13,10,8,21,则它们的中位数为( )。
A .8B .9C .10D .不存在【答案】B【解析】中位数又称中数,符号记为Mdn ,计算方法:①确定中数在数据序列中的位置:dn M n =12n +,式中,nMdn 表示中数在数列中的位置;n 表示数列数据个数。
②求数列中位于dn M n 位置上的那个数Mdn 。
由题可知,数据排序后为:2,5,8,10,13,21。
因为数据个数为偶数,则其中数为第(6+1)/2=3.5个数,即Mdn 应在8、10之间,因此答案为9。
3.某班30名学生的平均成绩是75分,其中10名女生的平均成绩是85分,那么该班男生的平均成绩是多少分?( ) A .65分B .70分C .75分D .68分【答案】B【解析】此题为加权平均数的变形,加权平均数的计算公式为:。
由公式可知,75=10852030X ⨯+⨯,X=70。
4.在教育与心理研究中,求平均增长率或对心理物理学中的等距与等比量表实验的数据处理,应当使用的统计量是( )。
A .算术平均数B .加权平均数C .几何平均数D.方差或标准差【答案】C【解析】几何平均数的应用:①心理物理学中等距与等比量表实验的数据处理;②教育与心理研究中平均增长率的计算。
5.如果把某班所有学生的分数都减少5分,则该班成绩的均值和方差会如何变化?()A.均值变小,方差不变B.均值不变,方差变小C.均值方差同时变小D.均值变小,方差变大【答案】A【解析】由方差的性质可知,每一个观测值都加或减一个相同常数c后,计算得到的方差等于原方差;由平均数的性质可知,每一个观测值都加上或减去一个相同常数c后,计算得到的平均数等于原平均数加上或减去这个常数c。
张敏强《教育与心理统计学》笔记和课后习题(含考研真题)详解-常用的统计表与图【圣才出品】
圣才电子书 十万种考研考证电子书、题库视频学习平台
全距也称为极差,是指一批数据中最大值与最小值之间的差距。观察全部数据,找出其 中的最大值(Max)和最小值(Min),以符号 R 表示全距,则全距的计算公式为:
R Max Min
(2)定组数 定组数就是要确定把整批数据划分为多少个等距的区组。组数用符号 K 表示。 ①组数大小依据数据的多少而定 组数太多,往往会削弱对数据分组整理的功用;太少,又可能会湮没数据内含的重要信 息。一般来说,当一批数据的个数在 200 个以内时,组数可取 8~18 组。如果数据来自一个 正态的总体,则可利用下述经验公式来确定组数,即:
4 / 22
圣才电子书 十万种考研考证电子书、题库视频学习平台
构成一个累积百分数分布表。 (3)说明 累积相对次数分布和累积百分数分布均有“以下”分布和“以上”分布两种。在应用时,应
根据具体情况决定选用其中的一种。 (三)次数分布图的绘制 次数分布图通常有两种表达方式,包括次数直方图和次数多边图两种。 1.次数直方图 (1)含义 次数直方图是由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。 (2)制作步骤 ①以细线条标出横轴和纵轴(取正半轴即可),使其垂直相交 a.为使图形美观,通常使横轴与纵轴的长度比为 5:3。 b.以纵轴为次数的量尺,按比例等间隔地标出刻度。 c.横轴代表测验分数的量尺,也按适当的比例等间隔地标出次数分布中各组的组中值。 d.一般说来,纵轴和横轴的尺度比例不一样。纵轴刻度往往从 0 开始,而横轴刻度则
2
K 1.87(N1)5
公式中的 N 为数据个数。 ②注意 事先计划的组数可能与实际分组时因考虑组距取整以及最低一组的起点位置不同而略 有差异,这种差异是正常的,最终结果应以实际划归的组数为准。 (3)定组距 组距用符号 i 表示,其一般原则是取奇数或 5 的倍数,如 1,3,5,7,9,10……等等。 具体的取值过程可通过全距 R 与组数 K 的比值来取整确定。 (4)写出组限 组限是每个组的起始点界限。例如,表 1-1 中列出的就是关于组限的几种不同表述方式。
张敏强《教育与心理统计学》笔记和课后习题(含考研真题)详解-聚类分析【圣才出品】
第11章聚类分析【学习目标】1.了解聚类分析的原理法。
2.了解聚类分析的数据整理方法。
3.识记聚类分析中距离的六种定义。
4.识记相关系数相关概念。
5.掌握聚类分析的三种方法。
11.1复习笔记一、聚类分析的基本原理(一)聚类分析1.聚类分析的概念聚类分析是指将分类对象置于一个多维空间中,按照它们空间关系的亲疏程度进行分类的统计方法。
其与一般分类方法的不同之处在于:(1)一般分类法往往从专业知识出发进行分析归类,而聚类分析先是仅凭变量指标进行定量分析,整理出分类的谱系追踪图,然后再据专业知识确定最终类型数目和类型命名;(2)一般的分类允许在不同层次上有不同的分类依据或分类准则,而聚类分析在所有层次上的分类依据和分类准则都是一样的;(3)一般分类不要求被分对象一次性完备,允许分类后继续补充样品甚至建立新类,而聚类分析要求被分类对象一次性完备,不允许中间插入新样品,否则要重复聚类分析的全过程。
2.聚类分析的分类依据(1)聚类分析作为一种数值分类法,分类依据是数据指标,要进行聚类分析必须建起一个描写事物本质属性的指标体系,或者一个变量组合。
(2)入选的指标需满足的要求①必须能刻画事物属性的某个侧面,所有指标组合起来形成一个完备的指标体系,互相配合共同刻画事物的本质特征。
②要求每一个入选指标都与所研究的问题紧密联系,并且都有较强的分辨能力。
③对于指标本身还必须可测和稳定,可测是分类得以进行的先决条件,稳定是分类准确的前提。
如果分类指标间还具有直交性,那么还可提高聚类的效率。
若有N个样品、有M个指标,称为M维空间上N个样本点,测值X ik表示第i个样本点在第k维指标上的测量值。
空间N个样本点的所有测值可以矩阵X记之:④在聚类分析中,要求入选的所有指标变量有统一的量纲。
⑤常用的整理原始数据的方法有以下几种:a.数据中心化变换如果一批数据指标由于各自的分布中心有显著差异而导致量纲不一致,可以对数据作中心化变换,新的指标中心皆为0。
张敏强《教育与心理统计学》课后习题集详解(1-5章)【圣才出品】
第1章常用的统计表与图1.对组限的规范写法本书有何规定?答:组限是每个组的起始点界限。
可以用几种不同的表述方式,见下表。
表1 组限的五种表述方法(i=5)对于连续变量,尽管表中的五种表述方法形式不同,但它们所包含的意义与传统“教育与心理统计学”中的规定却是一致的。
为了避免这种人为造成的误解并统一与规范关于组限的表述方法,本书建议并一贯采用表中的第三种、第四种或第五种这三种表述方法。
对此,作几点说明如下:(1)表述组限与实际组限是两个不同的概念,但它们之间有规律性的联系。
(2)当各相邻组的组限已经相互承接而没有间断时,便认为已把表述的组限与实际的组限统一起来,且不管这里表述组限中的实下限与实上限是整数还是小数。
(3)按照本书上述规定的组限表述方法即可形成规范的组限表述方式,并与其他学科中的区间表达法统一起来。
2.列举次数直方图或多边图的一些应用。
答:次数直方图是由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形,而次数多边图是利用闭合的折线构成多边形以反映次数变化的情况的一种图示方法。
他们都适合连续性的数据。
应用举例:如学生考试成绩的分布,商场一年12个月的销售额情况,学生去学校所花费的时间,某班学生的身高情况,某班学生的体重情况,体育课上学生一分钟内跳绳的次数,居民月平均用水量的情况等。
3.试比较简单条形图与简单次数直方图在制作和应用方面的异同点。
答:简单条形图是以若干平行而等宽的长条来表示离散型数据的对比关系的图形;次数直方图是指由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。
(1)相同点①简单条形图与简单次数直方图都是统计学中常用的分布图。
②简单条形图与简单次数直方图都含有长条。
(2)不同点①简单条形图的长条是紧密相连的,而简单次数直方图的长条是分开的。
②简单条形图适合用来描述离散型变量(如属性变量)的统计数据,而简单次数直方图则是用来刻划连续性变量的观测数据。
4.简述散点图、折线图、条形图和圆形图这四种统计分析图的应用特点。
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(因素分析)【圣才出品】
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解第12章因素分析【本章重点】☆因素分析的基本原理☆因素分析的基本过程☆正交旋转与斜交旋转12.1复习笔记一、因素分析的基本原理因素分析是确定主要因素的重要工具之一。
因素分析的基本思想是首先将多个描述事物性质的变量综合为较少的几个“因素”,然后依据一定的方式对所获得的“因素”作出较为合理的解释。
主成分分析可以看成是因素分析的一个特例,它本身往往不是目的,而是达到目的的一种手段,常用于因素分析的中间环节。
因素分析方法在1904年首先被英国心理学家斯皮尔曼应用于他的一篇论文中。
(一)因素分析的数学模型1.因素分析的数学模型可表示成如下形式:,该式写成矩阵形式为:Z=AF+DY(12.2)其中;;式中,F j(j=1,2,…,m)表示某被试第j个共同因素的标准分数;Y i表示某被试只和测验i有关的特殊因素;a ij表示第i个测验在第j个共同因素上的系数,通常称为因素负荷;d i表示与第i个测验有关的特殊因素Y i的系数,称为特殊因素负荷。
Z表示标准分数。
由上式可看出因素负荷a ij绝对值的大小反映了Z i与共同因素F j关系的密切程度,即表明了共同因素F j对Z i的负荷程度,所以a ij称为因素负荷,由其构成的矩阵A便称为因素负荷矩阵。
2.因素分析的数学模型要求满足的假设(1)各共同因素之间、特殊因素之间及共同因素与特殊因素之间均相互独立。
(2)各共同因素都是均值为0,方差为1的独立正态分布的随机变量,其协方差矩阵为m阶单位阵。
(二)因素负荷的统计意义因素分析的基本任务之一就是求因素负荷矩阵A。
因素负荷a ij就是变量Z j与共同因素F j的相关系数,它反映了Z i依赖F j的程序。
(三)变量共同度的统计意义记因素负荷矩阵A第i行元素的平方和为:(12.4)2h称之为变量Z i的共同度或者共同因素方差。
可以推导得出:i(12.5)从上式可知,变量Z i的方差由两部分构成。
张敏强《教育与心理统计学》笔记和课后习题(含考研真题)详解-常用统计参数【圣才出品】
第2章常用统计参数【学习目标】1.了解各种集中量数、差异量数和地位量数的概念、性质和作用,理解各种量数的适用条件及特点。
2.识记相关、散点图及相关系数的概念与彼此之间的关系。
3.掌握各种量数的计算方法,并能够熟练使用各种量数对测量数据的数据特征进行描述。
4.掌握各种常见相关分析方法的适用条件及计算方法。
2.1复习笔记一组变量的次数分布,一般至少有以下两个方面的基本特征:中心位置:用以度量一组数据的集中趋势,描述它们的中心位于何处,故对其数量化描述称为位置度量数或集中量数。
离散性:反映一组数据的分散程度,即次数分布的离散程度。
对其数量化描述称为次数分布变异特性的度量或差异量数。
中心位置相同的次数分布,其离散程度不一定相同。
对任何一个已知的次数分布,均可以计算出反映上述统计特征的量数。
在教育与心理统计中,总体统计特征的量数称为参数,用希腊字母表示,如μ,σ2,ρ等;样本统计特征的量数称为统计量,用英文字母表示,如X,S2,r等。
一、集中量数集中量数是指描述数据集中趋势的统计量,包括算术平均数、加权平均数、几何平均数、中数,等等,其作用都是用于度量次数分布的集中趋势。
(一)算术平均数算术平均数(简称平均数、均数)是用以度量连续变量次数分布集中趋势的最常用的集中量数。
1.总体平均数与样本平均数(1)总体平均数如果一个总体X 包含N 个元素,x i 是这个总体中的第i 个元素,则称x i 为第i 次观测值,那么对x 来讲,该总体的算术平均数被定义为:11=Nii x N μ=∑式中:μ——总体算术平均数;N——总体容量;i x ——第i 次观测值。
(2)样本平均数当无法对总体进行全面观测时,对于样本X ,其算术平均数被定义为:11n i i X x n =∑式中:X ——样本平均数;n ——样本容量。
2.加权平均数若已知各组平均数和各组人数,要求总的平均数时,则要用加权平均数的方法,其计算公式为:式中:——总平均数(或加权平均数);12,,,k n n n …——各组人数;12,k ,X X X …,——各组平均数;12t k n n n n =+++…——总人数。
张敏强《教育与心理统计学》【章节题库】(抽样理论与参数估计)【圣才出品】
第4章抽样理论与参数估计一、单项选择题1.下列关于F分布的表述,错误的是()。
A.负偏态分布B.随着分子和分母的自由度的变化而变化的一簇曲线C.F总为正值D.分母和分子的自由度越大,F分布越接近正态分布【答案】A【解析】F分布形态是一个正偏态分布,其分布曲线随分子和分母自由度的不同而不同,随分子和分母的自由度的增加而渐趋正态分布。
F总为正值,因为F是两个方差的比率。
2.在抽样时,将要抽取的对象进行编号排序,然后每隔若干个抽取一个,这种方法是()。
A.简单随机抽样B.系统抽样C.分层随机抽样D.两阶段随机抽样【答案】B【解析】系统抽样,也称机械抽样或等距抽样,首先将个体编号排序,之后每隔若干个号码抽取一个。
3.用统计量估计参数时,当多个样本的统计量与参数的差值的平均数是0时,说明该统计量具有()。
A.无偏性B.有效性C.一致性D.充分性【答案】A【解析】用统计量估计总体参数一定会有误差,不可能恰恰相等。
因此,好的估计量应该是一个无偏估计量,即用多个样本的统计量作为总体参数的估计值,其偏差的平均数为0。
4.当一个统计量是总体参数的无偏估计量时,其方差越小越好,这种估计量的特性是()。
A.无偏性B.有效性C.一致性D.充分性【答案】B【解析】当总体参数的无偏估计的参数不止一个时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好。
5.充分性最高的总体平均数的估计量是()。
A.样本平均数B.样本众数C.样本中位数D.样本平均差【答案】A【解析】样本统计量的充分性指一个容量为n的样本统计量是否充分地反映了全部n 个数据所反映总体的信息。
样本平均数的充分性高,因为样本平均数能够反映所有数据所代表的总体信息。
6.根据估计量以一定可靠程度推断总体参数所在的区间范围时,总体参数所在的区域距离是()。
A.置信界限B.置信区间C.置信水平D.显著性水平【答案】B【解析】区间估计是指根据估计量以一定可靠程度推断总体参数所在的区间范围,这一区间范围就是置信区间,或称置信间距。
张敏强《教育与心理统计学》【课后习题】(常用统计参数)【圣才出品】
年度 1985 1986 1987 1988 1989
人数 730
760
840
980
1150
解:以 1985 年为基数,求 5 年后的平均增长率,因此,参不计算的年数为 n-1=4,
先求平均增长率,用变式来计算:
=
4 1150 730 1.120
若照此增长的速度,5 年后该校的毕业生人数将是:1150×(1.120)5≈2027
答:本次考试中 P80百分位分数为 65.10,而 86 分的百分等级分数为 98.18,即有 98.18% 的应试者分数低亍 86 分。
7.解释相关系数时应注意什么? 答:参见本章复习笔记。
8.假设两变量为线性关系,对下列各种情况各应使用什么方法计算相关系数? ①两列变量是等距或等比变量,且均为正态分布; ②两列变量是等距或等比变量,但丌为正态分布; ③一列变量为正态连续变量,另一列变量为正态连续变量但被人为地分为两类; ④一列变量为正态连续变量,另一列变量为二分称名变量; 答:(1)“两列变量是等距或等比变量,且均为正态分布”应使用皮尔逊积差相关计算 相关系数。 (2)“两列变量是等距或等比变量,但丌为正态分布”应使用斯皮尔曼等级相关计算 相关系数。 (3)“一列变量为正态连续变量,另一列变量为正态连续变量但被人为地分为两类” 应使用二列相关计算相关系数。 (4)“一列变量为正态连续变量,另一列变量为二分称名变量”应使用点二列相关计 算相关系数。
9.教育测量学中试题的区分度以题目得分不试卷总分的相关系数表示。下表是一次测 验的有关数据。(试卷总分为正态分布)
4/7
圣才电子书 十万种考研考证电子书、题库视频学习平台
(1)第一题为选择题,试求其区分度。
答:因为试题的总分为正态分布,而题目为选择题,所以应该采用点二列相关:
张敏强《教育与心理统计学》(第3版)课后习题(常用的统计表与图)【圣才出品】
第1章常用的统计表与图1.落在某一特定类别或组中的数据个数称为()。
A.次数B.频率C.次数分布表D.累积次数【答案】A【解析】A项,次数是指某一特定类别或组中的数据个数;B项,频率又称相对次数,是各组的次数f与总次数N之间的比值;C项,次数分布表是将数据进行分组归类,考察这批数据在量尺上各等距区组内的次数分布情况,并把这种情况用规范的表格形式加以体现;D项,累积次数是指某个数值以下或以上的数据的次数。
2.把各个类别及落在其中的相应次数全部列出,并用表格形式表现出来,称为()。
A.次数B.次数分布表C.频率D.累积频率【答案】B【解析】次数分布表是将数据进行分组归类,考察这批数据在量尺上各等距区组内的次数分布情况,并把这种情况用规范的表格形式加以体现。
3.下面哪一个图形最适合描述结构性问题()。
A.条形图B.饼图C.直方图D.多边图【答案】B【解析】饼图又称为圆形图,是以单位圆内各扇形面积所占整个圆形面积百分比来表示各统计事项在其总体中所占相应比例的一种图示方法,特别适用于描述具有百分比结构的分类数据。
A项,条形图一般用于统计各种数量的多少;C项,直方图用于表达一个次数分布的结构形态及特征;D项,多变图是利用闭合的折线构成多边形以反映次数变化情况。
4.下面图形中最适合描述一组数据分布的图形是()。
A.散点图B.直方图C.条形图D.圆形图【答案】B【解析】直方图可以用来描述数据分布的结构形态及特征。
A项,散点图是用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。
散点图适合于描述二元变量的观测数据,对于探究两种事物、两种现象之间的关系起着重要作用。
5.为描述身高与体重之间是否有某种关系,适合采用的图形是()。
A.条形图B.线形图C.散点图D.直方图【答案】C【解析】散点图适用于描述二元变量的观测数据,可以探究两种事物、两种现象之间的关系。
用散点图描述身高与体重,可以看出这两种身体特征之间存在的某种相关趋势。
张敏强《教育与心理统计学》章节题库(6-10章)【圣才出品】
第6章方差分析一、单项选择题1.现要考察三个教学班的平均成绩的差异是否具有统计学意义,应使用的最恰当的统计方法是()。
A.回归分析B.相关分析C.t检验D.方差分析【答案】D【解析】t检验和方差分析都可以用于检验组间差异,但是t检验只能用于检验两组之间的差异,而方差分析可以用于多组比较。
本题涉及的教学班有三个,因此方差分析是最恰当的统计方法。
2.经过31题所进行的检验之后,结果显示在0.05显著性水平上存在差异,下面还需要进行的检验是()。
A.交互作用分析B.事后检验C.t检验D.无需检验【答案】B【解析】本题涉及的是单因素方差分析,因此无需进行交互作用分析。
在进行方差分析之后,若结果表明在相应的显著性水平上存在差异,就要进行事后检验(也称事后多重比较)来进一步分析差异发生在哪两个组之间。
3.方差分析的首先进行检验的是()。
A.综合虚无假设B.部分虚无假设C.综合对立假设D.部分对立假设【答案】A【解析】进行方差分析时,设定的虚无假设为样本所归属的所有总体的平均数都相等,一般把这一假设称为“综合的虚无假设”。
4.在单因素重复测量的方差分析中,有8名被试参加了实验,实验共有四种处理,那么误差的自由度是()。
A.7B.24C.21D.28【答案】C【解析】在单因素重复测量的方差分析中,总变异包括组间变异、区组变异和误差变异。
总变异的自由度为被试数减1,本题中为31。
组间变异为实验处理数减l,本题中为3。
区组变异为区组数减1,本题中为7,剩余的自由度为误差变异的自由度,本题中为21。
5.在两个班级的学生学习基础不同的情况下(实验前测验的平均分有一定差距),若要以这两个班级为实验班研究两种教学方法的差异,下列统计方法中,最恰当的是()。
A.方差分析法B.因素分析法C.回归分析法D.协方差分析法【答案】D【解析】协方差分析是关于如何调节协变量对因变量的影响效应,从而更有效地分析实验处理效应的一种统计分析技术。
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(概率与分布)【圣才出品】
5 / 23
圣才电子书 十万种考研考证电子书、题库视频学习平台
何值均由它顶上左右两个值相加而得。按这种方法可为更大的 n 值求得二项式的各项系数。 它的优点在于能简捷地确定二项展开式的各项系数。
表 3-1 杨辉三角(n=10)
二、二项分布 (一)二项分布 1.二项分布所讨论的概率问题 对于随机变量 x 进行 n 次独立试验,若每次试验结果只出现对立事件 A 与 之一,在 每次试验中出现 A 的概率是 p,则出现 的概率为 1-p,记为 q=1-p,求在 n 次独立试验 下,A 出现次数为 x 的概率分布(其中 x=0,1,2,…,n)。 2.二项分布的计算公式 (二)二项分布的均值、方差和标准差 二项分布的均值μ、方差σ2 和标准差σ分别为:
圣才电子书 十万种考研考证电子书、题库视频学习平台
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解 第 3 章 概率与分布
【本章重点】 ☆ 概率的统计定义与古典定义 ☆ 概率的两个基本定理 ☆ 二项分布的定理与计算 ☆ 正态分布曲线的性质 ☆ 正态分布在教育教学中的应用
为: (二)二项分布 1.排列与组合 (1)排列 ①定义 从 n 个不同的元素中,任取 m 个(m≤n)元素,按一定的顺序排成一列,称为从 n 个 不同元素中取出 m 个元素的一个排列。 a.当 m<n 时,所得排列称为选排列,记作 。 b.当 m=n 时,所得排列称全排列,记作 。 ②计算公式:
(2)组合 ①定义 从 n 个不同元素中,任取 m 个(m≤n)元素,不管顺序,并成一组,称为从 n 个不同 的元素中取出 m 个元素的一个组合,记作
4 / 23
圣才电子书
②计算公式:
十万种考研考证电子书、题库视频学习平台
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第2章常用统计参数
一、单项选择题
1.数据11、11、11、11、14、14、14、17、17的中位数是()。
A.14.0
B.12.5
C.13.66
D.13.83
【答案】C
【解析】当一组数据的中间的数与它附近的数重复时,要根据重复的个数将其均等地分开。
在本题中,数据个数是奇数,位于中间的数是第一个14,而l4有三个,此时要将l4均等的分为三部分,即第一个14是l3.5~l3.83(就是l3.66);第二个14是13.83~14.16(就是l3.99);第三个14是14.16~13.49(就是l4.32)。
因为位于这组数据中间的数是第一个14,所以该组数据的中位数就是l3.66。
2.数据11、11、11、ll、14、14、14、17、17、18的中位数是()。
A.15.0
B.15.5
C.13.83
D.14.0
【答案】C
【解析】当一组数据的中间的数与它附近的数重复时,要根据重复的个数将其均等地分开。
在本题中,数据个数是偶数,中位数应位于第一个l4和第二个14之间,而l4有三个,此时要将l4均等的分为三部分,即第一个14是l3.5~l3.83(就是l3.66);第二个14是13.83~14.16(就是l3.99);第三个14是14.16~13.49(就是l4.32)。
因为第一个14和第二个l4的中间是13.83,所以该组数据的中位数就是l3.83。
3.现有一列数据,它们是3,3,5,3,5,5。
这列数据的平均数、标准差和全距依次是( )。
A .4,1,2
B .4,6,2
C .4,6,1
D .4,1,1
【答案】A
【解析】根据平均数的公式i X X N
∑=,标准差的公式S ==(其中22X X ∑=∑(X-)),可以计算出平均数为4,标准差为1。
根据全距的求法(最大值减最小值),该组数据的全距是2。
4.有一组数据:3,6,2,6,32,4,8,6,5。
在进行计算这组数据的平均数之前,剔除了极端值,剔除极端值之后,该组数据的平均数是( )。
A .9
B .4.44
C.5
D.8
【答案】C
【解析】在本题中极值是32,将它剔除后剩余8个数之和为40,40除以8等于5。
5.关于平均数的描述错误的是()。
A.在一组数据中离均差的总和等于0
B.若出现模糊不清的数据时,无法计算平均数
C.容易受到抽样变动的影响
D.一组数据的每一个数都加上常数C,则所得平均数与原来平均数之差等于C
【答案】C
【解析】离均差是一组数据中的数据与平均数之差。
离均差之和必定等于0。
平均数是一组数据之和除以数据的个数,因此出现模糊数据时,无法计算平均数。
和其他的集中量数相比,平均数较少受到抽样变动的影响,观测样本的大小或个体的变化,都对计算平均数影响很小。
一组数据的每一个数都加上常数C,那么总和就增加了NC,所得的平均数就增加了C。
6.在次数分布中出现次数最多的那个数的数值是()。
A.中数
B.范数
C.平均数
D.几何平均数
【答案】B
【解析】在次数分布中出现次数最多的那个数的数值是众数,又称范数、密集数、通常数。
7.通常情况下,真值最好的估计值是()。
A.平均数
B.中数
C.众数
D.百分位数
【答案】A
【解析】算术平均数是应用最普遍的一种集中量数。
它是真值渐近、最佳的估计值。
8.在正偏态分布中,下列各数值最大的是()。
A.平均数
B.中数
C.众数
D.Q1
【答案】A
【解析】在正偏态分布中,平均数大于中数,中数大于众数。
第一四分位数(Q1)小于中数(中数即第二四分位数Q2),因此肯定也小于平均数。
所以,平均数最大。
9.已知变量x与变量Y之间存在着正相关,下列回归方程中哪个肯定是错的?()
A.Y=2+6X
B.Y=6+2X
C.Y=-8+2X
D.Y=8-8X
【答案】D
【解析】如果x和Y存在正相关,那么回归方程里x前面的系数肯定为正数。
10.下列数据类型属于顺序数据的是()。
A.智商分数
B.反应时
C.年级
D.数学成绩
【答案】C
【解析】顺序数据指既无相等单位,也无绝对零点的数据,是按事物某种属性的多少或大小按次序将各个事物加以排列后获得的数据资料,年级表示学生在校学习等级的高低,没有相等单位(不能认为一年级与二年级、二年级与三年级之间的差距是相等的),也没有绝对零点,因此属于顺序数据。
11.一个人的性别和体重这两个变量的数据类型分别属于()。
A.称名数据和等距数据
B.等距数据和比率数据
C.等距数据和等距数据
D.称名数据和比率数据
【答案】D
【解析】称名数据只说明某一事物与其他事物在属性上的不同或类别上的差异。
性别有男和女两种类别,男和女只表示属性不同,没有量上和顺序上的差别,因此属于称名数据。
比率数据既表明量的大小,也有相等单位,同时还有绝对零点的数据。
体重就是个体身体的重量,重量有绝对零点,也有相等单位,因此属于比率数据。
12.下列数据类型属于离散数据的是()。
A.智商分数
B.反应时
C.班级个数
D.数学成绩
【答案】C
【解析】按照数据是否具有连续性,可以把数据分为:①离散数据,又称为不连续数据,指数据在任何两个数据点之间所取的数值的个数是有限的,本题中,班级个数的取值个数有限,是离散数据;②连续数据,指在任意两个数据点之间都可以细分出无限多个不同的数值,本题中,智商分数、反应时和数学成绩取值个数无限,属于连续数据。
二、简答题
1.简述平均数、中数与众数的含义及三者的关系。
答:集中量数是描述数据集中程度的统计量,主要有算术平均数、中数、众数等。
(1)平均数、中数与众数的含义。