张敏强《教育与心理统计学》【章节题库】(概率与分布)【圣才出品】

合集下载

张敏强《教育与心理统计学》【课后习题】(抽样理论与参数估计)【圣才出品】

张敏强《教育与心理统计学》【课后习题】(抽样理论与参数估计)【圣才出品】

第4章抽样理论与参数估计
1.试述点估计和区间估计的定义,并叙述其优缺点。

答:(1)点估计
①定义
点估计是指用一个样本值来估计总体参数值的过程。

判断估计量优劣的标准是无偏性、有效性和一致性。

如:通常用样本平均数来作为总体平均数的估计,而总体标准差的估计则要用n-1的标准差来估计。

②优缺点
a.优点:计算简单,容易理解。

b.缺点:因为点估计值是由样本数据计算出的一个单一数值,由于是随机抽样的,因此由计算样本统计量而得到的点估计值,就有可能不是总体参数的真正值。

且当用点估计去估计总体参数的真值时,其误差大小及可靠程度如何都不知道。

(2)区间估计
①定义
区间估计是指在一定的置信度水平下,用置信区间来对总体参数进行估计的过程。

②优缺点
a.优点:克服了点估计的缺点,它不仅告诉了总体参数估计的值范围,而且还给出了可靠程度。

b.缺点:点估计是一个精确的值,但区间估计是一个大致的范围。

2.已知某中学一次数学考试成绩的分布为正态分布,总体标准差为σ=5,从这个总体中抽取n=16,并计算得到81X =,6S =,试问该次考试中全体考生成绩均值μ的95%的置信区间。

解:因为成绩的分布为正态分布,总体标准差已知,置信度为95%, 且题目已知:σ=5,0.052
1.96Z =,n=16,81X =
1.96/81 1.96 1.2578.55X n σ-=-⨯=
1.96/81 1.96 1.2583.45X n σ+=+⨯=
故μ的置信度为0.95时,置信区间是[78.55,83.45]。

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(聚类分析)【圣才出品】

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(聚类分析)【圣才出品】

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解第13章聚类分析【本章重点】☆Q型与R型聚类☆聚类分析中距离的六种定义13.1复习笔记一、聚类分析的基本原理(一)聚类分析1.聚类分析的概念聚类分析是分类学与多元统计分析相结合的一种方法。

它将分类对象置于一个多维空间中,按照它们空间关系的亲疏程度进行分类。

其与一般分类方法的不同之处在于:(1)一般分类法往往从专业知识出发进行分析归类,而聚类分析先是仅凭变量指标进行定量分析,整理出分类的谱系追踪图,然后再据专业知识确定最终类型数目和类型命名;(2)一般的分类允许在不同层次上有不同的分类依据或分类准则,而聚类分析在所有层次上的分类依据和分类准则都是一样的;(3)一般分类不要求被分对象一次性完备,允许分类后继续补充样品甚至建立新类,而聚类分析要求被分类对象一次性完备,不允许中间插入新样品,否则要重复聚类分析的全过程。

2.聚类分析的分类依据(1)聚类分析作为一种数值分类法,分类依据是数据指标,要进行聚类分析必须建起一个描写事物本质属性的指标体系,或者一个变量组合。

(2)入选的指标需满足的要求:①指标必须能刻画事物属性的某个侧面,所有指标组合起来形成一个完备的指标体系,互相配合共同刻画事物的本质特征。

②要求每一个入选指标都与所研究的问题紧密联系,并且都有较强的分辨能力。

③指标本身还必须可测和稳定,可测是分类得以进行的先决条件,稳定是分类准确的前提。

如果分类指标间还具有直交性,那么还可提高聚类的效率。

若有N个样品、有M个指标,称为M维空间上N个样本点,测值X ik表示第i个样本点在第k维指标上的测量值。

空间N个样本点的所有测值可以矩阵X记之:(13.1)④在聚类分析中,要求入选的所有指标变量有统一的量纲。

(3)常用的整理原始数据的方法有以下几种:①数据中心化变换。

如果一批数据指标由于各自的分布中心有显著差异而导致量纲不一致,可以对数据作中心化变换,新的指标中心皆为0。

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解 第7章~第9章【圣才出品】

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解  第7章~第9章【圣才出品】
一、回归分析的基本原理 (一)意义 1.回归分析是借助于数学模型对客观世界所存在的事物间的不确定关系的一种数量化 描写,其目的在于为不确定现象的研究提供更为科学、精细的手段,以应用于相关随机变量 的估计、预测和控制。 2.回归分析是统计分析中的一种重要手段,首先发现回归现象的是英国生物学家高尔 顿和皮尔逊,其根本目的是要借助于因变量和自变量的分类,在概率统计的意义上,把变量 间的相关关系用精确的数学公式伴以其他手段加以进一步的定量刻画。在回归分析中,自变
(5)列出回归方程:y=a+bx。
(三)一元线性回归方程的有效性检验 1.建立假设:H0:所建回归方程无效;
H1:所建回归方程有效。 2.计算离差平方和
总离差平方和:
n
回归平方和:U =b2 (xi x )2 i 1
剩余平方和: Q lyy U
3.计算自由度
df总 n 1, dfU 1, dfQ n 2 。
4.计算均方
回归均方: MSU U dfU
剩余均方: MSQ Q dfQ
5.检验统计量: F MSU MSQ
6.将所求数据填入方差分析表
(7.5)
5 / 75
圣才电子书 十万种考研考证电子书、题库视频学习平台

7.查表,做出统计决断。
(四)回归方程有效性高低的指标 一元线性回归分析所建立的回归方程经方差分析后被判定为具有有效性,仅能说明这个 回归方程有别于无使用价值的方程,但是并未指出这个方程有效性高到什么程度。在回归分 析中衡量回归方程有效性高低的指标称为决定系数,记作 R2,其值为:R2=U/ 。即决 定系数是回归平方和在总离差平方和中所占的比例。 此外,在一元线性回归中决定系数 R2 是因变量与自变量积差相关系数的平方,即

张敏强《教育与心理统计学》【名校考研真题】(简答题)【圣才出品】

张敏强《教育与心理统计学》【名校考研真题】(简答题)【圣才出品】

三、简答题1.在一项研究中,让幼儿在自由活动的条件下自己选择游戏类型。

游戏类型分为安静型和运动型,50名幼儿做出的选择如下表。

请检验不同性别的幼儿选择游戏方式的差异是否具有统计学意义。

(t(24)0.05=2.06,t(48)0.05=2.02,t(49)0.05=2.01,X2(1)0.05=3.84,X2(2)0.05=5.99,X2(3)0.05=7.81)[统考2011年研]幼儿游戏方式选择的数据表答:因为为小样本,所以采用χ2检验(1)建立假设H0:不同性别的幼儿选择游戏方式的差异不具有统计学意义H1:不同性别的幼儿选择游戏方式的差异具有统计学意义(2)整理数据并计算χ2值整理数据如下表所示:(3)自由度为df=(2-1)×(2-1)=1,比较计算得到的χ2值与临界值的大小χ2>χ2=3.84,拒绝H0。

(1)0.05因此,不同性别的幼儿选择游戏方式的差异在0.05水平上具有统计学意义。

2.根据下列方差分析表回答问题(1)计算交互作用AxB的自由度和它的均方值。

(2)检验因素B及AxB的显著性。

[统考2012年研]答:(1)计算A x B 的自由度、均方A x B的自由度为71-66-1-2=2,均方值为SS AXB/[(a一1)(b一1)]=26/2=13(2)检验B以及A x B的显著性。

求出B以及AxB的F值、自由度,F (B )=B MS F MS =残差=12/2.91= 4.12 F (AxB_)=A BMS MS ⨯残差=13/2.91= 4.47查表可以得出结论,F<F 0.05(1.120)=5.15,所以因素B 在0.05水平上不显著;F A ×B >F 0.05(2.120)=3.8,所以A ×B 在0.05水平上显著。

3.研究者欲研究某城市居民环境保护的动机类型(A 因素:短暂动机、长远动机)和环保行为(B 因素:宣传、批评、治理)对所在社区环境质量的影响。

张敏强《教育与心理统计学》(第3版)章节题库(回归分析)【圣才出品】

张敏强《教育与心理统计学》(第3版)章节题库(回归分析)【圣才出品】

第7章回归分析一、单项选择题1.如果要建立两个变量之间的数学模型,下列统计方法中,最恰当的是()。

[统考2009研]A.方差分析法B.因素分析法C.回归分析法D.聚类分析法【答案】C【解析】回归分析是用数学模型来表示变量之间的关系;方差分析法是两个及两个以上样本均数差别的显著性检验;因素分析法是对问卷的结构等进行分析;聚类分析也是适合对结构进行分类等。

2.在回归分析中,考察回归效果使用的指标是()。

[统考2008研]A.内部一致性系数B.决定系数C.概化系数D.列联系数【答案】B【解析】回归分析中的决定系数表示因变量的变异中有多少是由自变量的变异引起,是用来考察回归效果的指标;内部一致性系数即同质性信度是信度的一种;概化系数是概化理论的指标;列联系数是表示相关的指标。

3.回归分析的主要功能是()。

A.量化描述事物之间的关系B.根据一个变量预测另一个变量C.使变量关系中不确定的部分给予严格确定D.确定变量关系的方向【答案】B【解析】回归分析的基本思想是试图对不确定的关系进行确定,然后依据所能得到的最大程度的确定关系,由已知变量预测未知变量。

4.在回归分析中,决定系数等于()。

A.相关系数B.相关系数的平方C.相关系数的平方根D.回归系数的平方【答案】B【解析】相关系数的平方等于回归平方和在总平方和中的比例,因此相关系数的平方能够说明一个变量对另一个变量解释的比例,称为决定系数。

5.如果要研究两个自变量对因变量的解释量,应选用的统计方法是()。

A.方差分析法B.因素分析法C.回归分析法D.聚类分析法【答案】C【解析】当研究两个或两个以上的自变量对因变量的预测时,采用的研究方法是回归分析中的多元线性回归分析法,可以计算多个自变量对因变量的解释量,指标就是多元决定系数(R2)。

6.对一元线性回归方程回归系数进行显著性检验通常采用的方法是()。

A.2χ检验B.F检验C.t检验D.Z检验【答案】C【解析】对回归系数b进行显著性检验,实则就是假设总体回归系数β=0,考察b是否也为0。

张敏强《教育与心理统计学》【课后习题】(常用教育与心理实验设计)【圣才出品】

张敏强《教育与心理统计学》【课后习题】(常用教育与心理实验设计)【圣才出品】

第10章常用教育与心理实验设计1.试述教育实验设计的意义及作用。

答:教育实验或心理实验是一种计划好的有控制的教育研究,其目的是为了解答问题,检验假设和估计效果。

(1)教育实验设计的意义教育实验设计的意义主要表现为如下几个方面。

①教育实验设计是教育科学研究计划内关于研究方法与步骤的一项重要内容。

②在教育科研工作中,在制订研究计划时,都应根据实验的目的和条例,结合统计学的要求,针对实验的全过程,认真考虑实验设计问题。

③在教育科研工作中,一个周密而完善的实验设计,能合理地安排各种实验因素,严格地控制实验误差,最大限度地获得丰富而可靠的资料。

总之,教育实验设计是教育研究中实验过程的依据、实验数据处理的前提,也是提高科研成果质量的一个重要保证。

(2)教育实验设计的作用教育实验设计的作用主要包括如下几个方面。

①能够回答教育研究心理研究的某些问题;②安排教育与心理实验,获得实验数据;③节省人力和物力;④获得科学结论。

2.教育实验设计要遵循哪些原则?答:费希尔首先提出实验设计应遵循三个原则:重复、局部控制和随机化。

它们是提高实验精度的最有效的方法。

(1)重复重复是指每一因素的水平(或因素的水平组合)的实验次数不少于2。

重复的作用是为了估计实验误差和减少实验误差。

(2)局部控制局部控制是力求使得非实验的影响尽可能减少的一种做法。

即让非实验条件在多次重复的实验中具有同质性。

(3)随机化随机化是实验设计中能够应用统计方法的保证。

它是指实验对象或实验材料的分配,以及各次实验中的先后次序,等等,都是随机选择和安排的。

其目的是使实验结果尽量避免受到主客观系统因素的影响而出现偏倚性,其作用是正确地估计误差。

3.比较随机区组实验设计和析因实验设计的异同。

答:(1)相同点随机区组实验设计和析因实验设计都是用来考查各实验处理对因变量的影响的实验设计;都可以用在多因素的实验设计中。

(2)不同点①概念不同随机区组设计是指将实验对象按一定的标准划分为数个区组,使得区组内的实验对象的个别差异尽可能小,既保证区组内的同质性,并使每个区组均接受所有实验处理,且各个区组内每个处理仅有一次观测,其顺序是随机决定的。

张敏强《教育与心理统计学》(第3版)章节题库(1-4章)【圣才出品】

张敏强《教育与心理统计学》(第3版)章节题库(1-4章)【圣才出品】

第 1 章 常用的统计表与图
一、单项选择题 1.运用相对累加次数分布曲线,可以快速计算出与学生原始分数相对应的统计量是 ( )。[统考 2010 研] A.百分等级 B.Z 分数 C.T 分数 D.频次 【答案】A 【解析】运用相对累加次数分布曲线,可以根据横坐标的原始分数,从纵坐标上读出对 应的百分等级。
2.适用于描述某种心理属性在时间上变化趋势的统计分析图是( )。[统考 2010 研]
A.茎叶图 B.箱形图 C.散点图 D.线形图 【答案】D 【解析】茎叶图是将数据中的数按位数进行比较,将数的大小基本不变或变化不大的位 作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚
4.用于描述两个变量之间相关关系的统计图是( )。[统考 2007 研] A.直方图 B.线形图 C.条形图 D.散点图 【答案】D
2 / 45

【解析】散点图是用来表示两种事物之间的相关性及联系模式的点散布的图形,适用于 描述二元变量的观测数据;直方图是由若干宽度相等、高度不等的直方条紧密排列在同一基 线上构成的图形;线形图是以起伏的折线来表示某种事物的发展变化趋势及演变趋势的统计 图,适用于描述某种事物在时间序列上的变化趋势,也适用于描述一种事物随另一事物发展 变化的趋势模式,还可以适用于比较不同的人物团体在同一心理或教育现象上的变化特征及 相互联系;条形图是用宽度相同的长条来表示各个统计事项之间的数量关系,通常应用描述 离散性变量的统计事项。
6 坐标代表各组数据的( )。 A.上限 B.中点 C.下限 D.平均值 【答案】B 【解析】在次数分布曲线中,横坐标代表各组数据的中点。直方图中,横坐标代表各组 数据的精确下限和精确上限。
15.特别适用于描述具有百分比结构的分类数据的统计图是( )。 A.散点图 B.圆形图 C.条形图 D.线形图 【答案】B 【解析】圆形图主要用于描述间断性资料,目的是为显示各部分在整体中所占的比重大 小,以及各部分之间的比较。又称饼图,迅速直观有效的反映数据情况。

张敏强《教育与心理统计学》【名校考研真题】(多项选择题)【圣才出品】

张敏强《教育与心理统计学》【名校考研真题】(多项选择题)【圣才出品】

二、多项选择题1.描述数据离中趋势的统计量有()。

[统考2007年研]A.方差B.标准差C.平均差D.四分位差【答案】ABCD【解析】描述数据离中趋势的统计量称为差异量数,差异量数包括平均差、方差与标准差、四分位差、全距、百分位差等。

2.方差分析需要满足的前提条件有()。

[统考2008年研]A.总体正态分布B.各处理方差齐性C.总体方差已知D.各组样本容量相同【答案】AB【解析】方差分析的前提是总体正态、方差齐性、变异可加。

3.某次高考分数呈正态分布,以此为基础可以()。

[统考2009年研]A.计算考生的标准分数B.由P值,计算Z值C.确定某一分数界限内的考生比例D.知道计划录取人数后确定录取分数线【答案】ABCD【解析】正态分布的应用主要有四方面:①计算标准分数;②根据概率计算Z;③确定某一分数范围内的人数比率;④根据计划录取人数来确定录取分数线。

4.散点图的形状为一条直线,且两个变量方差均不为0,它们之间的相关系数可能为()。

[统考2010年研]A.1B.0.5C.OD.-l【答案】AD【解析】散点图的形状为一条直线,它们之间的相关系数可能为1或者-1。

5.线性回归分析的前提假设有()。

[统考2011年研]A.变量总体服从正态分布B.个体间随机误差相互独立C.自变量的个数多于因变量的个数D.因变量和自变量之间存在线性关系【答案】ABD【解析】线性回归的基本假设有四点:线性关系假设,X与Y在总体上存在线性关系,正态性假设,回归分析中的Y服从正态分布。

独立性假设,一是指与某一个X值对应的一组Y值和与另一个X值对应的一组Y值间没有关系,二是误差项独立,不同的X所产生的误差之间应相互独立。

误差等分散性假设。

6.下列关于χ2分布的特点描述,正确的有()。

[统考2012年研]A.χ2取值均为正值B.χ2分布是正偏态分布C.χ2分布为非连续性分布D.χ2分布的标准差与自由度相同【答案】AB【解析】卡方分布的特点:①χ2值是正值;②χ2分布呈正偏态,随着参数n 的增大,χ2分布趋近于正态分布;③χ2分布具有可加性,χ2分布的和也是χ2分布;④χ2分布是连续分布,但有些离散分布也服从χ2分布,尤其在次数统计上非常广泛。

张敏强《教育与心理统计学》(第3版)课后习题(常用统计参数)【圣才出品】

张敏强《教育与心理统计学》(第3版)课后习题(常用统计参数)【圣才出品】

第2章 常用统计参数1.某班学生的心理学平均成绩为75分,标准差为l0分,学生总数为43人。

根据这些信息,无法计算出的统计量有( )。

A .差异系数B .分数总和C .中数D .方差【答案】C【解析】中数计算方法:①首先确定中数在数据序列中的位置:dn M n =12n ,式中:dn M n 表示中数在数列中的位置;n 表示数列数据个数。

②然后再求数列中位于dn M n 位置上的那个数Mdn 。

题中没有具体数据序列,因此无法计算得到中数。

2.已知一组数据为2,5,13,10,8,21,则它们的中位数为( )。

A .8B .9C .10D .不存在【答案】B【解析】中位数又称中数,符号记为Mdn ,计算方法:①确定中数在数据序列中的位置:dn M n =12n +,式中,nMdn 表示中数在数列中的位置;n 表示数列数据个数。

②求数列中位于dn M n 位置上的那个数Mdn 。

由题可知,数据排序后为:2,5,8,10,13,21。

因为数据个数为偶数,则其中数为第(6+1)/2=3.5个数,即Mdn 应在8、10之间,因此答案为9。

3.某班30名学生的平均成绩是75分,其中10名女生的平均成绩是85分,那么该班男生的平均成绩是多少分?( ) A .65分B .70分C .75分D .68分【答案】B【解析】此题为加权平均数的变形,加权平均数的计算公式为:。

由公式可知,75=10852030X ⨯+⨯,X=70。

4.在教育与心理研究中,求平均增长率或对心理物理学中的等距与等比量表实验的数据处理,应当使用的统计量是( )。

A .算术平均数B .加权平均数C .几何平均数D.方差或标准差【答案】C【解析】几何平均数的应用:①心理物理学中等距与等比量表实验的数据处理;②教育与心理研究中平均增长率的计算。

5.如果把某班所有学生的分数都减少5分,则该班成绩的均值和方差会如何变化?()A.均值变小,方差不变B.均值不变,方差变小C.均值方差同时变小D.均值变小,方差变大【答案】A【解析】由方差的性质可知,每一个观测值都加或减一个相同常数c后,计算得到的方差等于原方差;由平均数的性质可知,每一个观测值都加上或减去一个相同常数c后,计算得到的平均数等于原平均数加上或减去这个常数c。

张敏强《教育与心理统计学》笔记和课后习题(含考研真题)详解-常用的统计表与图【圣才出品】

张敏强《教育与心理统计学》笔记和课后习题(含考研真题)详解-常用的统计表与图【圣才出品】
1 / 22
圣才电子书 十万种考研考证电子书、题库视频学习平台

全距也称为极差,是指一批数据中最大值与最小值之间的差距。观察全部数据,找出其 中的最大值(Max)和最小值(Min),以符号 R 表示全距,则全距的计算公式为:
R Max Min
(2)定组数 定组数就是要确定把整批数据划分为多少个等距的区组。组数用符号 K 表示。 ①组数大小依据数据的多少而定 组数太多,往往会削弱对数据分组整理的功用;太少,又可能会湮没数据内含的重要信 息。一般来说,当一批数据的个数在 200 个以内时,组数可取 8~18 组。如果数据来自一个 正态的总体,则可利用下述经验公式来确定组数,即:
4 / 22
圣才电子书 十万种考研考证电子书、题库视频学习平台

构成一个累积百分数分布表。 (3)说明 累积相对次数分布和累积百分数分布均有“以下”分布和“以上”分布两种。在应用时,应
根据具体情况决定选用其中的一种。 (三)次数分布图的绘制 次数分布图通常有两种表达方式,包括次数直方图和次数多边图两种。 1.次数直方图 (1)含义 次数直方图是由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。 (2)制作步骤 ①以细线条标出横轴和纵轴(取正半轴即可),使其垂直相交 a.为使图形美观,通常使横轴与纵轴的长度比为 5:3。 b.以纵轴为次数的量尺,按比例等间隔地标出刻度。 c.横轴代表测验分数的量尺,也按适当的比例等间隔地标出次数分布中各组的组中值。 d.一般说来,纵轴和横轴的尺度比例不一样。纵轴刻度往往从 0 开始,而横轴刻度则
2
K 1.87(N1)5
公式中的 N 为数据个数。 ②注意 事先计划的组数可能与实际分组时因考虑组距取整以及最低一组的起点位置不同而略 有差异,这种差异是正常的,最终结果应以实际划归的组数为准。 (3)定组距 组距用符号 i 表示,其一般原则是取奇数或 5 的倍数,如 1,3,5,7,9,10……等等。 具体的取值过程可通过全距 R 与组数 K 的比值来取整确定。 (4)写出组限 组限是每个组的起始点界限。例如,表 1-1 中列出的就是关于组限的几种不同表述方式。

《教育与心理统计学》考研张敏强版配套名校考研真题库

《教育与心理统计学》考研张敏强版配套名校考研真题库

《教育与心理统计学》张敏强版配套名校考研真题库第一部分名校考研真题说明:从指定张敏强《教育与心理统计学》(第3版)为考研参考书目的名校历年考研真题以及心理学专业基础综合历年统考真题中挑选具有代表性的考研真题,并对其进行了详细的解答。

通过这一部分的练习,可以帮助学员巩固基础知识、夯实专业基础,从而做到全方位备考。

一、单项选择题1.关于分层随机抽样的特点,表述正确的是()。

[统考2011年研] A.总体中的个体被抽取的概率相同B.所有被试在一个层内抽取C.层间异质,层内同质D.层间变异小于层内变异【答案】C查看答案【解析】分层随机抽样是按照总体已有的某些特征,将总体分成几个不同的部分(每一部分叫一个层),再分别在每一部分中随机抽样。

层间变异大于层内变异。

2.一组服从正态分布的分数,平均数是27,方差是9。

将这组数据转化为Z分数后,Z分数的标准差为()。

[统考2011年研]A.OB.1C.3D.9【答案】B查看答案【解析】根据标准分数的性质,若原始分数呈正态分布,则转换得到的所有Z分数的均值为0,标准差为1的标准正态分布。

3.下列关于样本量的描述,正确的是()。

[统考2011年研]A.样本量需要等于或大于总体的30%B.样本量大小不是产生误差的原因C.总体差异越大,所需样本量就越小D.已知置信区间和置信水平可以计算出样本量【答案】D查看答案【解析】一般最小样本量为30个,样本越大,真实情况越接近总体,误差越小。

总体差异越大,所需样本量越大。

4.已知r1=-0.7,r2=0.7。

下列表述正确的是()。

[统考2011年研]A.r1和r2代表的意义相同B.r2代表的相关程度高于r1C.r1和r2代表的相关程度相同D.r1和r2的散点图相同【答案】D查看答案【解析】相关系数中,“+”表示正相关,“-”表示负相关。

相关系数取值的大小表示相关的强弱程度。

r1和r2的相关强弱程度相等,但方向不同,r1为负相关,r2为正相关。

张敏强《教育与心理统计学》笔记和课后习题(含考研真题)详解-聚类分析【圣才出品】

张敏强《教育与心理统计学》笔记和课后习题(含考研真题)详解-聚类分析【圣才出品】

第11章聚类分析【学习目标】1.了解聚类分析的原理法。

2.了解聚类分析的数据整理方法。

3.识记聚类分析中距离的六种定义。

4.识记相关系数相关概念。

5.掌握聚类分析的三种方法。

11.1复习笔记一、聚类分析的基本原理(一)聚类分析1.聚类分析的概念聚类分析是指将分类对象置于一个多维空间中,按照它们空间关系的亲疏程度进行分类的统计方法。

其与一般分类方法的不同之处在于:(1)一般分类法往往从专业知识出发进行分析归类,而聚类分析先是仅凭变量指标进行定量分析,整理出分类的谱系追踪图,然后再据专业知识确定最终类型数目和类型命名;(2)一般的分类允许在不同层次上有不同的分类依据或分类准则,而聚类分析在所有层次上的分类依据和分类准则都是一样的;(3)一般分类不要求被分对象一次性完备,允许分类后继续补充样品甚至建立新类,而聚类分析要求被分类对象一次性完备,不允许中间插入新样品,否则要重复聚类分析的全过程。

2.聚类分析的分类依据(1)聚类分析作为一种数值分类法,分类依据是数据指标,要进行聚类分析必须建起一个描写事物本质属性的指标体系,或者一个变量组合。

(2)入选的指标需满足的要求①必须能刻画事物属性的某个侧面,所有指标组合起来形成一个完备的指标体系,互相配合共同刻画事物的本质特征。

②要求每一个入选指标都与所研究的问题紧密联系,并且都有较强的分辨能力。

③对于指标本身还必须可测和稳定,可测是分类得以进行的先决条件,稳定是分类准确的前提。

如果分类指标间还具有直交性,那么还可提高聚类的效率。

若有N个样品、有M个指标,称为M维空间上N个样本点,测值X ik表示第i个样本点在第k维指标上的测量值。

空间N个样本点的所有测值可以矩阵X记之:④在聚类分析中,要求入选的所有指标变量有统一的量纲。

⑤常用的整理原始数据的方法有以下几种:a.数据中心化变换如果一批数据指标由于各自的分布中心有显著差异而导致量纲不一致,可以对数据作中心化变换,新的指标中心皆为0。

张敏强《教育与心理统计学》课后习题集详解(1-5章)【圣才出品】

张敏强《教育与心理统计学》课后习题集详解(1-5章)【圣才出品】

第1章常用的统计表与图1.对组限的规范写法本书有何规定?答:组限是每个组的起始点界限。

可以用几种不同的表述方式,见下表。

表1 组限的五种表述方法(i=5)对于连续变量,尽管表中的五种表述方法形式不同,但它们所包含的意义与传统“教育与心理统计学”中的规定却是一致的。

为了避免这种人为造成的误解并统一与规范关于组限的表述方法,本书建议并一贯采用表中的第三种、第四种或第五种这三种表述方法。

对此,作几点说明如下:(1)表述组限与实际组限是两个不同的概念,但它们之间有规律性的联系。

(2)当各相邻组的组限已经相互承接而没有间断时,便认为已把表述的组限与实际的组限统一起来,且不管这里表述组限中的实下限与实上限是整数还是小数。

(3)按照本书上述规定的组限表述方法即可形成规范的组限表述方式,并与其他学科中的区间表达法统一起来。

2.列举次数直方图或多边图的一些应用。

答:次数直方图是由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形,而次数多边图是利用闭合的折线构成多边形以反映次数变化的情况的一种图示方法。

他们都适合连续性的数据。

应用举例:如学生考试成绩的分布,商场一年12个月的销售额情况,学生去学校所花费的时间,某班学生的身高情况,某班学生的体重情况,体育课上学生一分钟内跳绳的次数,居民月平均用水量的情况等。

3.试比较简单条形图与简单次数直方图在制作和应用方面的异同点。

答:简单条形图是以若干平行而等宽的长条来表示离散型数据的对比关系的图形;次数直方图是指由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。

(1)相同点①简单条形图与简单次数直方图都是统计学中常用的分布图。

②简单条形图与简单次数直方图都含有长条。

(2)不同点①简单条形图的长条是紧密相连的,而简单次数直方图的长条是分开的。

②简单条形图适合用来描述离散型变量(如属性变量)的统计数据,而简单次数直方图则是用来刻划连续性变量的观测数据。

4.简述散点图、折线图、条形图和圆形图这四种统计分析图的应用特点。

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(因素分析)【圣才出品】

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(因素分析)【圣才出品】

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解第12章因素分析【本章重点】☆因素分析的基本原理☆因素分析的基本过程☆正交旋转与斜交旋转12.1复习笔记一、因素分析的基本原理因素分析是确定主要因素的重要工具之一。

因素分析的基本思想是首先将多个描述事物性质的变量综合为较少的几个“因素”,然后依据一定的方式对所获得的“因素”作出较为合理的解释。

主成分分析可以看成是因素分析的一个特例,它本身往往不是目的,而是达到目的的一种手段,常用于因素分析的中间环节。

因素分析方法在1904年首先被英国心理学家斯皮尔曼应用于他的一篇论文中。

(一)因素分析的数学模型1.因素分析的数学模型可表示成如下形式:,该式写成矩阵形式为:Z=AF+DY(12.2)其中;;式中,F j(j=1,2,…,m)表示某被试第j个共同因素的标准分数;Y i表示某被试只和测验i有关的特殊因素;a ij表示第i个测验在第j个共同因素上的系数,通常称为因素负荷;d i表示与第i个测验有关的特殊因素Y i的系数,称为特殊因素负荷。

Z表示标准分数。

由上式可看出因素负荷a ij绝对值的大小反映了Z i与共同因素F j关系的密切程度,即表明了共同因素F j对Z i的负荷程度,所以a ij称为因素负荷,由其构成的矩阵A便称为因素负荷矩阵。

2.因素分析的数学模型要求满足的假设(1)各共同因素之间、特殊因素之间及共同因素与特殊因素之间均相互独立。

(2)各共同因素都是均值为0,方差为1的独立正态分布的随机变量,其协方差矩阵为m阶单位阵。

(二)因素负荷的统计意义因素分析的基本任务之一就是求因素负荷矩阵A。

因素负荷a ij就是变量Z j与共同因素F j的相关系数,它反映了Z i依赖F j的程序。

(三)变量共同度的统计意义记因素负荷矩阵A第i行元素的平方和为:(12.4)2h称之为变量Z i的共同度或者共同因素方差。

可以推导得出:i(12.5)从上式可知,变量Z i的方差由两部分构成。

张敏强《教育与心理统计学》笔记和课后习题(含考研真题)详解-常用统计参数【圣才出品】

张敏强《教育与心理统计学》笔记和课后习题(含考研真题)详解-常用统计参数【圣才出品】

第2章常用统计参数【学习目标】1.了解各种集中量数、差异量数和地位量数的概念、性质和作用,理解各种量数的适用条件及特点。

2.识记相关、散点图及相关系数的概念与彼此之间的关系。

3.掌握各种量数的计算方法,并能够熟练使用各种量数对测量数据的数据特征进行描述。

4.掌握各种常见相关分析方法的适用条件及计算方法。

2.1复习笔记一组变量的次数分布,一般至少有以下两个方面的基本特征:中心位置:用以度量一组数据的集中趋势,描述它们的中心位于何处,故对其数量化描述称为位置度量数或集中量数。

离散性:反映一组数据的分散程度,即次数分布的离散程度。

对其数量化描述称为次数分布变异特性的度量或差异量数。

中心位置相同的次数分布,其离散程度不一定相同。

对任何一个已知的次数分布,均可以计算出反映上述统计特征的量数。

在教育与心理统计中,总体统计特征的量数称为参数,用希腊字母表示,如μ,σ2,ρ等;样本统计特征的量数称为统计量,用英文字母表示,如X,S2,r等。

一、集中量数集中量数是指描述数据集中趋势的统计量,包括算术平均数、加权平均数、几何平均数、中数,等等,其作用都是用于度量次数分布的集中趋势。

(一)算术平均数算术平均数(简称平均数、均数)是用以度量连续变量次数分布集中趋势的最常用的集中量数。

1.总体平均数与样本平均数(1)总体平均数如果一个总体X 包含N 个元素,x i 是这个总体中的第i 个元素,则称x i 为第i 次观测值,那么对x 来讲,该总体的算术平均数被定义为:11=Nii x N μ=∑式中:μ——总体算术平均数;N——总体容量;i x ——第i 次观测值。

(2)样本平均数当无法对总体进行全面观测时,对于样本X ,其算术平均数被定义为:11n i i X x n =∑式中:X ——样本平均数;n ——样本容量。

2.加权平均数若已知各组平均数和各组人数,要求总的平均数时,则要用加权平均数的方法,其计算公式为:式中:——总平均数(或加权平均数);12,,,k n n n …——各组人数;12,k ,X X X …,——各组平均数;12t k n n n n =+++…——总人数。

张敏强《教育与心理统计学》(第3版)课后习题(概率与分布)【圣才出品】

张敏强《教育与心理统计学》(第3版)课后习题(概率与分布)【圣才出品】

第3章概率与分布1.下面描述的现象是随机现象的是()。

A.股市在休息日的变化情况B.花粉随溪水流动时,沿溪水流动方向的轨迹C.小明某次语文期中考试的成绩D.导体通电时发热【答案】C【解析】随机现象是指在一定条件下,事先不能断言会出现哪种结果的现象。

小明的某次语文考试成绩不能断言会出现什么结果,因此为随机现象。

2.某学校对其200名高三应届生做摸底测试,根据成绩推算这200名学生能上重点线的概率为0.8,能上清华大学分数线的概率为0.03,从该学生团体随机抽取一名学生,该生能上重点并考上清华大学的概率是多少?()A.0.8×0.03B.0.03C.(1/200)×0.03D.(1/200)×0.8×0.03【答案】B【解析】当且仅当B⊃A时,P(AB)=P(A)。

题中,上重点线⊃上清华大学分数线,所以P(上重点线的概率上清华大学分数线的概率)=P(上清华大学分数线的概率)=0.03。

3.某生下定决心考公务员,打算拼搏3次。

3次都不行则不再言考,问该考生如愿的机会有多大?(假定公务员录取率在未来10年内都稳定在1:50)()【答案】D【解析】由题干可知,公务员录取率在未来10年内都稳定在1:50,因此第一次考上的概率为1/50,第一次未考上第二次考上的概率为49/50×1/50,前两次未考上第三次考上的概率为49/50×49/50×1/50,该生考试3次,这3次是相互独立的,用加法定率,所以该生如愿的概率为1/50+49/50×1/50+49/50×49/50×1/50。

4.在某随机样本中有10名被试,现需从中选择一人做实验A,若每人被选机会均等,选择被试l或被试2的概率是多少?()A.1/10+1/10B.(1/10)×(9/10)+(9/10)×(1/10)C.1/10+1/10-(1/10)×(1/10)D.1/10+1/10-(9/10)×(9/10)【答案】A【解析】因为每人被选机会均等,从10人中选一个,所以被选中概率为1/10,又因为选择被试l或被试2为两个相互独立的事件,因此用加法定理,答案为1/10+1/10。

张敏强《教育与心理统计学》(第3版)课后习题(常用的统计表与图)【圣才出品】

张敏强《教育与心理统计学》(第3版)课后习题(常用的统计表与图)【圣才出品】

第1章常用的统计表与图1.落在某一特定类别或组中的数据个数称为()。

A.次数B.频率C.次数分布表D.累积次数【答案】A【解析】A项,次数是指某一特定类别或组中的数据个数;B项,频率又称相对次数,是各组的次数f与总次数N之间的比值;C项,次数分布表是将数据进行分组归类,考察这批数据在量尺上各等距区组内的次数分布情况,并把这种情况用规范的表格形式加以体现;D项,累积次数是指某个数值以下或以上的数据的次数。

2.把各个类别及落在其中的相应次数全部列出,并用表格形式表现出来,称为()。

A.次数B.次数分布表C.频率D.累积频率【答案】B【解析】次数分布表是将数据进行分组归类,考察这批数据在量尺上各等距区组内的次数分布情况,并把这种情况用规范的表格形式加以体现。

3.下面哪一个图形最适合描述结构性问题()。

A.条形图B.饼图C.直方图D.多边图【答案】B【解析】饼图又称为圆形图,是以单位圆内各扇形面积所占整个圆形面积百分比来表示各统计事项在其总体中所占相应比例的一种图示方法,特别适用于描述具有百分比结构的分类数据。

A项,条形图一般用于统计各种数量的多少;C项,直方图用于表达一个次数分布的结构形态及特征;D项,多变图是利用闭合的折线构成多边形以反映次数变化情况。

4.下面图形中最适合描述一组数据分布的图形是()。

A.散点图B.直方图C.条形图D.圆形图【答案】B【解析】直方图可以用来描述数据分布的结构形态及特征。

A项,散点图是用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。

散点图适合于描述二元变量的观测数据,对于探究两种事物、两种现象之间的关系起着重要作用。

5.为描述身高与体重之间是否有某种关系,适合采用的图形是()。

A.条形图B.线形图C.散点图D.直方图【答案】C【解析】散点图适用于描述二元变量的观测数据,可以探究两种事物、两种现象之间的关系。

用散点图描述身高与体重,可以看出这两种身体特征之间存在的某种相关趋势。

张敏强《教育与心理统计学》章节题库(6-10章)【圣才出品】

张敏强《教育与心理统计学》章节题库(6-10章)【圣才出品】

第6章方差分析一、单项选择题1.现要考察三个教学班的平均成绩的差异是否具有统计学意义,应使用的最恰当的统计方法是()。

A.回归分析B.相关分析C.t检验D.方差分析【答案】D【解析】t检验和方差分析都可以用于检验组间差异,但是t检验只能用于检验两组之间的差异,而方差分析可以用于多组比较。

本题涉及的教学班有三个,因此方差分析是最恰当的统计方法。

2.经过31题所进行的检验之后,结果显示在0.05显著性水平上存在差异,下面还需要进行的检验是()。

A.交互作用分析B.事后检验C.t检验D.无需检验【答案】B【解析】本题涉及的是单因素方差分析,因此无需进行交互作用分析。

在进行方差分析之后,若结果表明在相应的显著性水平上存在差异,就要进行事后检验(也称事后多重比较)来进一步分析差异发生在哪两个组之间。

3.方差分析的首先进行检验的是()。

A.综合虚无假设B.部分虚无假设C.综合对立假设D.部分对立假设【答案】A【解析】进行方差分析时,设定的虚无假设为样本所归属的所有总体的平均数都相等,一般把这一假设称为“综合的虚无假设”。

4.在单因素重复测量的方差分析中,有8名被试参加了实验,实验共有四种处理,那么误差的自由度是()。

A.7B.24C.21D.28【答案】C【解析】在单因素重复测量的方差分析中,总变异包括组间变异、区组变异和误差变异。

总变异的自由度为被试数减1,本题中为31。

组间变异为实验处理数减l,本题中为3。

区组变异为区组数减1,本题中为7,剩余的自由度为误差变异的自由度,本题中为21。

5.在两个班级的学生学习基础不同的情况下(实验前测验的平均分有一定差距),若要以这两个班级为实验班研究两种教学方法的差异,下列统计方法中,最恰当的是()。

A.方差分析法B.因素分析法C.回归分析法D.协方差分析法【答案】D【解析】协方差分析是关于如何调节协变量对因变量的影响效应,从而更有效地分析实验处理效应的一种统计分析技术。

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(概率与分布)【圣才出品】

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(概率与分布)【圣才出品】

5 / 23
圣才电子书 十万种考研考证电子书、题库视频学习平台

何值均由它顶上左右两个值相加而得。按这种方法可为更大的 n 值求得二项式的各项系数。 它的优点在于能简捷地确定二项展开式的各项系数。
表 3-1 杨辉三角(n=10)
二、二项分布 (一)二项分布 1.二项分布所讨论的概率问题 对于随机变量 x 进行 n 次独立试验,若每次试验结果只出现对立事件 A 与 之一,在 每次试验中出现 A 的概率是 p,则出现 的概率为 1-p,记为 q=1-p,求在 n 次独立试验 下,A 出现次数为 x 的概率分布(其中 x=0,1,2,…,n)。 2.二项分布的计算公式 (二)二项分布的均值、方差和标准差 二项分布的均值μ、方差σ2 和标准差σ分别为:
圣才电子书 十万种考研考证电子书、题库视频学习平台

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解 第 3 章 概率与分布
【本章重点】 ☆ 概率的统计定义与古典定义 ☆ 概率的两个基本定理 ☆ 二项分布的定理与计算 ☆ 正态分布曲线的性质 ☆ 正态分布在教育教学中的应用
为: (二)二项分布 1.排列与组合 (1)排列 ①定义 从 n 个不同的元素中,任取 m 个(m≤n)元素,按一定的顺序排成一列,称为从 n 个 不同元素中取出 m 个元素的一个排列。 a.当 m<n 时,所得排列称为选排列,记作 。 b.当 m=n 时,所得排列称全排列,记作 。 ②计算公式:
(2)组合 ①定义 从 n 个不同元素中,任取 m 个(m≤n)元素,不管顺序,并成一组,称为从 n 个不同 的元素中取出 m 个元素的一个组合,记作
4 / 23
圣才电子书

②计算公式:
十万种考研考证电子书、题库视频学习平台
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
σ=μ/ n =5。即如果考生随机猜测作答,答对的平均题数是 50,标准差为 5。据正态分布
概率,当 Z=2.33 时,该点以下包含了全体的 99%(注意这是单侧检验),如果用原始分数 表示,则为 x=μ+2.33σ=50+2.33×5=61.65。
2.单样本 t 检验对亍数据分布的前提要求是( )。 A.所有的差异分数是从正态分布的差异总体中随机抽取的 B.所有的样本都从正态分布的总体中随机抽取 C.所有的样本都从正态分布的总体中随机抽取,且方差同质 D.样本从二项分布的总体中随机抽取
圣才电子书 十万种考研考证电子书、题库视频学习平台

第 3 章 概率与分布
一、单项选择题 1.某学业成就测验由 100 道正误题组成,每题 1 分。如果要从统计上(99%的把握) 排除猜测作答的情形,考生正确回答的题目数量至少应该是( )。 A.59 题 B.60 题 C.62 题 D.63 题 【答案】C 【解析】此题 n=100,p=0.5,q=0.5,p=q,np=50>5,故此二项分布接近正态分 布,这时二项分布的 x 变量(即成功的次数)具有如下性质,μ=np,σ 经过计算本题中 μ=50,
C. X Za/2
s <<X n 1
Za/2
s n 1
D. X ta/2
s <<X n 1
ta/2
s n 1
【答案】D
【解析】总体方差
2
未知时,用样本的无偏方差(
S2 n1
)作为总体方差的估计值,实
现对总体平均数 的估计。因为在总体方差未知时,样本平均数的分布为 t 分布,故应查 t
值表。有两种情况:①总体的分布为正态时,可丌考虑 n 的大小;②总体分布为非正态时,
A.6 B.7 C.8 D.9 【答案】D
【解析】当二项分布的 np≥5(p<q)分布,此时 =np, = npq 。则 =20×0.25=5,
= 20 0.5 0.5 =1.94,由公式 Z X / ,有 1.96=(X-5)/1.94,解得 X=9。
4.有 20 项正误判断题,答对( )题才能说丌是猜测的结果。 A.14 B.15 C.16 D.17 【答案】B
只有 n>30,才能用概率对其样本分布迚行解释,否则丌能推论。
10.总体分布正态,总体方差 2 已知,从总体中随即抽取容量为 25 的小样本。用样
本平均数估计总体平均数的置信区间为( )。
A. X Za/2
<<X n 1
Za/2
n 1
B. X ta/2
<<X n 1
ta/2
n 1
C. X Za/2
n
<< X
Za/2
n
D. X ta/2
n
<< X
ta/2
n
【答案】D
【解析】总体正态分布,总体方差已知。此时丌论样本 n 的大小,其标准误
x 都是
n

因为样本小亍 30,其分布为 t 分布,故应查 t 值表。此时,可用 X ta/2
n
<<X
ta/2
n
估计总体平均数的置信区间。
5 / 13
1 / 13
圣才电子书

【答案】C
十万种考研考证电子书、题库视频学习平台
【解析】t 检验、Z 检验和 F 检验都要求数据是来自正态分布的总体,而且要求数据方
差同质。
3.有 20 项选择题,每题有 4 个答案,其中只有 1 个是正确的,那么答对( )题 才能说丌是猜测的结果。
6.在正态分布下,Z=-1.96 到 Z=1.96 乊间的概率为( )。 A.0.475 B.0.525 C.0.95 D.0.05 【答案】C 【解析】±1 个标准差乊间包含所有数据的 68.2%;±1.96 个标准差包含所有数据的 95%;士 2.58 个标准差包含所有数据的 99%。
7.在正态分布下,Z=1 到 Z=1.96 乊间的概率为( )。
圣才电子书 十万种考研考证电子书、题库视频学习平台

11.总体服从正态分布,方差未知时,其样本平均数的分布是( )。 A.x 分布 B.t 分布 C.F 分布 D.正态分布 【答案】B 【解析】总体分布为正态,方差未知,样本平均数的分布为 t 分布。
3 / 13
圣才电子书

A.0.05
十万种考研考证电子书、题库视频学习平台
B.0.15
C.0.01
D.0.25
【答案】B
【解析】介亍均值和标准差乊间的概率为 34.1%;介亍均值和 1.96 标准差乊间的概率
为 47.5%;介亍均值和 2.58 标准差乊间的概率为 49.5%。根据以上知识点可知,介亍 1
个标准差和 1.96 个标准差的概率为 0.495-0.341≈0.15。
8.从 n=200 的学生样本中随机抽样,已知女生为 132 人,问每次抽取 1 人,抽到男 生的概率是( )。
A.0.66 B.0.34 C.0.33 D.0.17 【答案】B 【解析】根据题意可知,男生人数为 200-132=68,则抽到男生的概率为 68/200=0.34。
【解析】当二项分布的 np≥5(p<q)分布,此时 =np, = npq = 20 0.5 0.5 ,
则 =20×0.5=10, =2.34。由公式 Z X / ,有 1.96=(X-10)/2.34,解得
2 / 13
圣才电子书

X≈15。
十万种考研考证电子书、题库视频学习平台
9.总体分布正态,总体方差 2 未知,从总体中随即抽取容量为 25 的小样本,此样本
的标准差为 s。用样本平均数估计总体平均数的置信区间为( )。
A.
X
Z a / 2s
<< X
X
sa / 2
X
B.
X
t a
/
2s
<< X
X
t a/
2
X
4 / 13
圣才电子书 十万种考研考证电概率是( )。 A.0.34 B.0.16 C.0.68 D.O.32 【答案】C 【解析】±1 个标准差乊间包含所有数据的 68.2%;±1.96 个标准差包含所有数据的 95%;±2.58 个标准差包含所有数据的 99%。由亍均值和一个标准差乊间的概率为 0.32, 则高亍一个标准差以上的概率为 1-0.32=0.68。
相关文档
最新文档