张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(回归分析)【圣才出品】
张敏强《教育与心理统计学》【课后习题】(抽样理论与参数估计)【圣才出品】

第4章抽样理论与参数估计
1.试述点估计和区间估计的定义,并叙述其优缺点。
答:(1)点估计
①定义
点估计是指用一个样本值来估计总体参数值的过程。
判断估计量优劣的标准是无偏性、有效性和一致性。
如:通常用样本平均数来作为总体平均数的估计,而总体标准差的估计则要用n-1的标准差来估计。
②优缺点
a.优点:计算简单,容易理解。
b.缺点:因为点估计值是由样本数据计算出的一个单一数值,由于是随机抽样的,因此由计算样本统计量而得到的点估计值,就有可能不是总体参数的真正值。
且当用点估计去估计总体参数的真值时,其误差大小及可靠程度如何都不知道。
(2)区间估计
①定义
区间估计是指在一定的置信度水平下,用置信区间来对总体参数进行估计的过程。
②优缺点
a.优点:克服了点估计的缺点,它不仅告诉了总体参数估计的值范围,而且还给出了可靠程度。
b.缺点:点估计是一个精确的值,但区间估计是一个大致的范围。
2.已知某中学一次数学考试成绩的分布为正态分布,总体标准差为σ=5,从这个总体中抽取n=16,并计算得到81X =,6S =,试问该次考试中全体考生成绩均值μ的95%的置信区间。
解:因为成绩的分布为正态分布,总体标准差已知,置信度为95%, 且题目已知:σ=5,0.052
1.96Z =,n=16,81X =
1.96/81 1.96 1.2578.55X n σ-=-⨯=
1.96/81 1.96 1.2583.45X n σ+=+⨯=
故μ的置信度为0.95时,置信区间是[78.55,83.45]。
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(聚类分析)【圣才出品】

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解第13章聚类分析【本章重点】☆Q型与R型聚类☆聚类分析中距离的六种定义13.1复习笔记一、聚类分析的基本原理(一)聚类分析1.聚类分析的概念聚类分析是分类学与多元统计分析相结合的一种方法。
它将分类对象置于一个多维空间中,按照它们空间关系的亲疏程度进行分类。
其与一般分类方法的不同之处在于:(1)一般分类法往往从专业知识出发进行分析归类,而聚类分析先是仅凭变量指标进行定量分析,整理出分类的谱系追踪图,然后再据专业知识确定最终类型数目和类型命名;(2)一般的分类允许在不同层次上有不同的分类依据或分类准则,而聚类分析在所有层次上的分类依据和分类准则都是一样的;(3)一般分类不要求被分对象一次性完备,允许分类后继续补充样品甚至建立新类,而聚类分析要求被分类对象一次性完备,不允许中间插入新样品,否则要重复聚类分析的全过程。
2.聚类分析的分类依据(1)聚类分析作为一种数值分类法,分类依据是数据指标,要进行聚类分析必须建起一个描写事物本质属性的指标体系,或者一个变量组合。
(2)入选的指标需满足的要求:①指标必须能刻画事物属性的某个侧面,所有指标组合起来形成一个完备的指标体系,互相配合共同刻画事物的本质特征。
②要求每一个入选指标都与所研究的问题紧密联系,并且都有较强的分辨能力。
③指标本身还必须可测和稳定,可测是分类得以进行的先决条件,稳定是分类准确的前提。
如果分类指标间还具有直交性,那么还可提高聚类的效率。
若有N个样品、有M个指标,称为M维空间上N个样本点,测值X ik表示第i个样本点在第k维指标上的测量值。
空间N个样本点的所有测值可以矩阵X记之:(13.1)④在聚类分析中,要求入选的所有指标变量有统一的量纲。
(3)常用的整理原始数据的方法有以下几种:①数据中心化变换。
如果一批数据指标由于各自的分布中心有显著差异而导致量纲不一致,可以对数据作中心化变换,新的指标中心皆为0。
张敏强《教育与心理统计学》【课后习题】(x2检验)【圣才出品】

第 8 章 x2 检验
1.就本章所述的每一 2 检验,你认为是作单尾检验还是双尾检验?为什么? 答:本章所述的每一 2 检验都是双尾检验。判断的依据是单尾检验和双尾检验的区别。 (1)问题的提法。本章所述的每一 2 检验主要处理以下两类问题,一是通过实际调 查不观测所得的一批数据,检验其次数分布是否服从理论上所假定的某一概率分布;二是对 一批观测数据迚行双向多项分类后,检验这两个分类特征之间是独立无关的还是具有相关关 系。这种问题的提法满足双侧检验的问题提法。 (2)提出假设的形式。本章所述的每一 2 检验的原假设包括两种,一是观测数据和理 论次数无显著差异,二是 A 特征和 B 特征之间是独立无关的。这满足双侧检验的假设形式。 (3)否定域。 2 检验法查 2 表得到的概率是双尾概率。这满足双尾检验的否定域形 式。
H1:226 名智力落后的学生他们在三种性格类型上的人数分布存在显著差异。
②计算 统计量的实得指标
因为虚无假设为三者没有差异,因此理论次数为
fe
226 3
75.33
由公式
可得,
2
(46-75.33)2 (92-75.33)2 (88-75.33)2
17.24
75.33
75.33
75.33
③叏 α=0.01,查附表 2 值;自由度 df 3 1 2 ,故 02.0(1 2) 9.210
—6 所示,现在需要迚一步研究的问题有以下一些。其中第二个问题是:从表 8—5 中的双
向分类数据来看,智力水平不学校区域是否有连带关系?)
试问:在日常化妆问题上,年龄不态度之间是否具有连带关系? 解:由题意可知判断年龄不态度在化妆问题上的态度差异检验属亍独立性检验,检验过 程: ①建立假设 H0:性别不态度之间是独立无关的; H1:性别不态度之间具有显著的连带关系。 ②根据 2×2 列联表 2 检验的公式直接计算 2 值
张敏强《教育与心理统计学》(第3版)章节题库(1-4章)【圣才出品】

第 1 章 常用的统计表与图
一、单项选择题 1.运用相对累加次数分布曲线,可以快速计算出与学生原始分数相对应的统计量是 ( )。[统考 2010 研] A.百分等级 B.Z 分数 C.T 分数 D.频次 【答案】A 【解析】运用相对累加次数分布曲线,可以根据横坐标的原始分数,从纵坐标上读出对 应的百分等级。
2.适用于描述某种心理属性在时间上变化趋势的统计分析图是( )。[统考 2010 研]
A.茎叶图 B.箱形图 C.散点图 D.线形图 【答案】D 【解析】茎叶图是将数据中的数按位数进行比较,将数的大小基本不变或变化不大的位 作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚
4.用于描述两个变量之间相关关系的统计图是( )。[统考 2007 研] A.直方图 B.线形图 C.条形图 D.散点图 【答案】D
2 / 45
【解析】散点图是用来表示两种事物之间的相关性及联系模式的点散布的图形,适用于 描述二元变量的观测数据;直方图是由若干宽度相等、高度不等的直方条紧密排列在同一基 线上构成的图形;线形图是以起伏的折线来表示某种事物的发展变化趋势及演变趋势的统计 图,适用于描述某种事物在时间序列上的变化趋势,也适用于描述一种事物随另一事物发展 变化的趋势模式,还可以适用于比较不同的人物团体在同一心理或教育现象上的变化特征及 相互联系;条形图是用宽度相同的长条来表示各个统计事项之间的数量关系,通常应用描述 离散性变量的统计事项。
6 坐标代表各组数据的( )。 A.上限 B.中点 C.下限 D.平均值 【答案】B 【解析】在次数分布曲线中,横坐标代表各组数据的中点。直方图中,横坐标代表各组 数据的精确下限和精确上限。
15.特别适用于描述具有百分比结构的分类数据的统计图是( )。 A.散点图 B.圆形图 C.条形图 D.线形图 【答案】B 【解析】圆形图主要用于描述间断性资料,目的是为显示各部分在整体中所占的比重大 小,以及各部分之间的比较。又称饼图,迅速直观有效的反映数据情况。
张敏强《教育与心理统计学》(第3版)课后习题(回归分析)【圣才出品】

第7章回归分析1.线性回归分析中,下列哪个表述是不正确的?()A.自变量是可控制量,因变量是随机的B.两个变量不是对等的关系C.利用一个回归方程,两个变量可以互相推算D.根据回归系数可判定相关的方向【答案】C【解析】回归分析主要是通过自变量的值去估计和预测因变量的发展变化,因此不能互相推算。
2.进行回归分析,因变量y和自变量X()。
A.X是连续变量,y是称名变量B.X是称名变量,y是连续变量C.X是连续变量,y也是连续变量D.X是连续变量,y是顺序变量【答案】C【解析】回归分析是借助数学模型对事物间不确定关系的一种数量化描述,是相关关系的延伸,因此,自变量和因变量都为连续变量。
3.在回归直线,表示()。
A.当X增加一个单位时,Y增加中的数量B.当Y增加一个单位时,X增加的数量C.当X增加一个单位时,Y的平均增加量D.当Y增加一个单位时,X的平均增加量【答案】C【解析】一元线性回归方程记为y=α+βx,称为变量y对变量x的一元线性回归方程,α是这条直线在y轴上的截距,系数β是这条直线的斜率,实际上也是y的变化率,它表示当x增加1个单位时y的平均增加或减少的数量,即当x变化一个单位时,y将变化b 个单位。
4.估计标准误差说明回归直线的代表性,因此()。
A.估计标准误差数值越大,说明回归直线的代表性越大B.估计标准误差数值越大,说明回归直线的代表性越小C.估计标准误差数值越小,说明回归直线的代表性越小D.估计标准误差数值越小,说明回归直线的实用价值越小【答案】B【解析】估计标准误差是说明实际值与其估计值之间相对偏离的程度的指标,主要用来衡量回归方程的代表性。
估计标准误差的值越大,则估计量与其真实值的近似误差越大,回归直线的代表性就越小。
5.回归估计的估计标准误差的计算单位与()。
A.自变量相同B.因变量相同C.自变量及因变量相同D.相关系数相同【答案】C【解析】回归分析中称为回归估计标准误差,简记为:,由公式可看出,回归估计的估计标准误差的计算单位与自变量及因变量相同。
张敏强《教育与心理统计学》笔记和课后习题(含考研真题)详解-常用的统计表与图【圣才出品】

圣才电子书 十万种考研考证电子书、题库视频学习平台
全距也称为极差,是指一批数据中最大值与最小值之间的差距。观察全部数据,找出其 中的最大值(Max)和最小值(Min),以符号 R 表示全距,则全距的计算公式为:
R Max Min
(2)定组数 定组数就是要确定把整批数据划分为多少个等距的区组。组数用符号 K 表示。 ①组数大小依据数据的多少而定 组数太多,往往会削弱对数据分组整理的功用;太少,又可能会湮没数据内含的重要信 息。一般来说,当一批数据的个数在 200 个以内时,组数可取 8~18 组。如果数据来自一个 正态的总体,则可利用下述经验公式来确定组数,即:
4 / 22
圣才电子书 十万种考研考证电子书、题库视频学习平台
构成一个累积百分数分布表。 (3)说明 累积相对次数分布和累积百分数分布均有“以下”分布和“以上”分布两种。在应用时,应
根据具体情况决定选用其中的一种。 (三)次数分布图的绘制 次数分布图通常有两种表达方式,包括次数直方图和次数多边图两种。 1.次数直方图 (1)含义 次数直方图是由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。 (2)制作步骤 ①以细线条标出横轴和纵轴(取正半轴即可),使其垂直相交 a.为使图形美观,通常使横轴与纵轴的长度比为 5:3。 b.以纵轴为次数的量尺,按比例等间隔地标出刻度。 c.横轴代表测验分数的量尺,也按适当的比例等间隔地标出次数分布中各组的组中值。 d.一般说来,纵轴和横轴的尺度比例不一样。纵轴刻度往往从 0 开始,而横轴刻度则
2
K 1.87(N1)5
公式中的 N 为数据个数。 ②注意 事先计划的组数可能与实际分组时因考虑组距取整以及最低一组的起点位置不同而略 有差异,这种差异是正常的,最终结果应以实际划归的组数为准。 (3)定组距 组距用符号 i 表示,其一般原则是取奇数或 5 的倍数,如 1,3,5,7,9,10……等等。 具体的取值过程可通过全距 R 与组数 K 的比值来取整确定。 (4)写出组限 组限是每个组的起始点界限。例如,表 1-1 中列出的就是关于组限的几种不同表述方式。
张敏强《教育与心理统计学》(第3版)配套模拟试题及详解(一)

张敏强《教育与心理统计学》(第3版)配套模拟试题及详解(一)一、单项选择题1.笔为剑做的一个方差分析,F (12,760)=0.415。
F 检验的结果( )A .不显著B .显著C .查表才能确定D .此结果是不可能的【答案】A【解析】这是笔为剑的硕士学位论文里的一个数据。
F 小于l ,所以不显著。
2.对某中学初中一年级学生实施了标准化的数学考试,全体学生成绩的平均分为83分,某一学生得了80分,他数学成绩的z 值为-0.5,问全体考生数学成绩的标准差为( )。
A .12B .6C .8D .10【答案】B【解析】z X /μσ-=(),其中X μ-为离均差,σ表示标准差。
则有0.5(8083)/σ-=-,6σ=。
3.格林夫妇先后生了两个孩子,已知第一个是男孩,那么第二个孩子也是男孩的概率(不考虑双胞胎因素)为()。
A.1/2B.1/3C.2/3D.无法计算【答案】A【解析】两个事件属于独立事件,所以概率无关。
4.格林夫妇先后生了两个孩子,已知有一个是男孩,那么另一个孩子也是男孩的概率(不考虑双胞胎因素)为()。
A.1/2B.1/3C.2/3D.无法计算【答案】B【解析】当一对夫妇先后生了两个孩子的时候,存在以下四种等可能性事件:(1)第一个是男孩,第二个也是男孩;(2)第一个是男孩,第二个是女孩;(3)第一个是女孩,第二个是男孩;(4)第一个是女孩,第二个也是女孩。
已知“有一个是男孩”,那么第四种情况排除,只剩下前三种情况。
前三种情况中,只有(1)使得“另一个也是男孩”成立。
5.下列属于等距变量数据的是()A.笔为剑身高l.63米B.笔为剑的考研成绩为全省第2名C.今日气温25摄氏度D.笔为剑是男性,这用数字“1”表示【答案】C【解析】C项,等距变量可以比较大小,可以进行加减运算,有相同的测量单位。
但只有相对参照点,没有绝对参照点(绝对零点),所以不能进行乘除运算。
A项,有绝对零点,可以进行乘除运算,因此为比率变量。
《教育与心理统计学》考研张敏强版配套名校考研真题库

《教育与心理统计学》张敏强版配套名校考研真题库第一部分名校考研真题说明:从指定张敏强《教育与心理统计学》(第3版)为考研参考书目的名校历年考研真题以及心理学专业基础综合历年统考真题中挑选具有代表性的考研真题,并对其进行了详细的解答。
通过这一部分的练习,可以帮助学员巩固基础知识、夯实专业基础,从而做到全方位备考。
一、单项选择题1.关于分层随机抽样的特点,表述正确的是()。
[统考2011年研] A.总体中的个体被抽取的概率相同B.所有被试在一个层内抽取C.层间异质,层内同质D.层间变异小于层内变异【答案】C查看答案【解析】分层随机抽样是按照总体已有的某些特征,将总体分成几个不同的部分(每一部分叫一个层),再分别在每一部分中随机抽样。
层间变异大于层内变异。
2.一组服从正态分布的分数,平均数是27,方差是9。
将这组数据转化为Z分数后,Z分数的标准差为()。
[统考2011年研]A.OB.1C.3D.9【答案】B查看答案【解析】根据标准分数的性质,若原始分数呈正态分布,则转换得到的所有Z分数的均值为0,标准差为1的标准正态分布。
3.下列关于样本量的描述,正确的是()。
[统考2011年研]A.样本量需要等于或大于总体的30%B.样本量大小不是产生误差的原因C.总体差异越大,所需样本量就越小D.已知置信区间和置信水平可以计算出样本量【答案】D查看答案【解析】一般最小样本量为30个,样本越大,真实情况越接近总体,误差越小。
总体差异越大,所需样本量越大。
4.已知r1=-0.7,r2=0.7。
下列表述正确的是()。
[统考2011年研]A.r1和r2代表的意义相同B.r2代表的相关程度高于r1C.r1和r2代表的相关程度相同D.r1和r2的散点图相同【答案】D查看答案【解析】相关系数中,“+”表示正相关,“-”表示负相关。
相关系数取值的大小表示相关的强弱程度。
r1和r2的相关强弱程度相等,但方向不同,r1为负相关,r2为正相关。
张敏强《教育与心理统计学》课后习题集详解(1-5章)【圣才出品】

第1章常用的统计表与图1.对组限的规范写法本书有何规定?答:组限是每个组的起始点界限。
可以用几种不同的表述方式,见下表。
表1 组限的五种表述方法(i=5)对于连续变量,尽管表中的五种表述方法形式不同,但它们所包含的意义与传统“教育与心理统计学”中的规定却是一致的。
为了避免这种人为造成的误解并统一与规范关于组限的表述方法,本书建议并一贯采用表中的第三种、第四种或第五种这三种表述方法。
对此,作几点说明如下:(1)表述组限与实际组限是两个不同的概念,但它们之间有规律性的联系。
(2)当各相邻组的组限已经相互承接而没有间断时,便认为已把表述的组限与实际的组限统一起来,且不管这里表述组限中的实下限与实上限是整数还是小数。
(3)按照本书上述规定的组限表述方法即可形成规范的组限表述方式,并与其他学科中的区间表达法统一起来。
2.列举次数直方图或多边图的一些应用。
答:次数直方图是由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形,而次数多边图是利用闭合的折线构成多边形以反映次数变化的情况的一种图示方法。
他们都适合连续性的数据。
应用举例:如学生考试成绩的分布,商场一年12个月的销售额情况,学生去学校所花费的时间,某班学生的身高情况,某班学生的体重情况,体育课上学生一分钟内跳绳的次数,居民月平均用水量的情况等。
3.试比较简单条形图与简单次数直方图在制作和应用方面的异同点。
答:简单条形图是以若干平行而等宽的长条来表示离散型数据的对比关系的图形;次数直方图是指由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。
(1)相同点①简单条形图与简单次数直方图都是统计学中常用的分布图。
②简单条形图与简单次数直方图都含有长条。
(2)不同点①简单条形图的长条是紧密相连的,而简单次数直方图的长条是分开的。
②简单条形图适合用来描述离散型变量(如属性变量)的统计数据,而简单次数直方图则是用来刻划连续性变量的观测数据。
4.简述散点图、折线图、条形图和圆形图这四种统计分析图的应用特点。
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(主成分分析)【圣才出品】

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解第11章主成分分析【本章重点】☆主成分分析的基本原理☆主成分分析的步骤11.1复习笔记一、主成分分析的基本原理主成分分析主要是用来寻找判断某种事物或现象的主要综合指标,它是在不损失或很小损失原有信息的前提下,将原来多个彼此相关的指标转换为新的少数几个彼此独立的综合指标的一种多元统计分析方法。
实际上,主成分分析是一个数据降维的过程,即将反映复杂现象的相关变量用综合变量来代表。
主成分的分析原理是:设有n个观测点(x il,x i2),i=1,2,…,n。
这n个观测点的分布如图11-2。
主成分分析的原理是先对n个观测点(x il,x i2)求出第一条“最佳”拟合直线,使得这n个观测点到该直线的垂直距离的平方和最小,这时称此直线为第一主成分,然后再求与第一主成分相互独立(在此表现为相互垂直)的且与n个观测点(x i1,x i2)的垂直距离平方和最小的第二主成分。
如图11-2所示。
图11-2主成分分析示意图假如有P个变量,共得到n个点(x i1,x i2,x ip),此时,若要求第k个主成分,就必须使它与前k-1个主成分不相关,且使它与n个观测点的垂直距离平方和为最小。
如此继续,直至求出P个主成分。
注意:只有变量间存在一定相关才可以降维,原有的变量数和主成分数相等,并且具体选取几个主成分,应视具体情况而定。
二、主分量的导出主分量的导出是对主成分分析数学模型的讨论。
由主成分分析的基本原理可知,主成分分析,实际上就是分解相关矩阵,从而使P个相关的变量分解成P个独立的分量。
(一)主成分的定义及满足条件设X=(x1,x2,…,x P)'是一个p维随机向量。
并假设X的数学期望E(X)=0,记X的协方差矩阵为E(XX')=∑,令U=(u1,u2,…,u P)'是-P维向量,且满足W'=U'U=I,则X的第i主成分定义为:(11.1)且满足条件:1.第一主成分F1是一切形如中使F的方差达到最大者。
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(因素分析)【圣才出品】

张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解第12章因素分析【本章重点】☆因素分析的基本原理☆因素分析的基本过程☆正交旋转与斜交旋转12.1复习笔记一、因素分析的基本原理因素分析是确定主要因素的重要工具之一。
因素分析的基本思想是首先将多个描述事物性质的变量综合为较少的几个“因素”,然后依据一定的方式对所获得的“因素”作出较为合理的解释。
主成分分析可以看成是因素分析的一个特例,它本身往往不是目的,而是达到目的的一种手段,常用于因素分析的中间环节。
因素分析方法在1904年首先被英国心理学家斯皮尔曼应用于他的一篇论文中。
(一)因素分析的数学模型1.因素分析的数学模型可表示成如下形式:,该式写成矩阵形式为:Z=AF+DY(12.2)其中;;式中,F j(j=1,2,…,m)表示某被试第j个共同因素的标准分数;Y i表示某被试只和测验i有关的特殊因素;a ij表示第i个测验在第j个共同因素上的系数,通常称为因素负荷;d i表示与第i个测验有关的特殊因素Y i的系数,称为特殊因素负荷。
Z表示标准分数。
由上式可看出因素负荷a ij绝对值的大小反映了Z i与共同因素F j关系的密切程度,即表明了共同因素F j对Z i的负荷程度,所以a ij称为因素负荷,由其构成的矩阵A便称为因素负荷矩阵。
2.因素分析的数学模型要求满足的假设(1)各共同因素之间、特殊因素之间及共同因素与特殊因素之间均相互独立。
(2)各共同因素都是均值为0,方差为1的独立正态分布的随机变量,其协方差矩阵为m阶单位阵。
(二)因素负荷的统计意义因素分析的基本任务之一就是求因素负荷矩阵A。
因素负荷a ij就是变量Z j与共同因素F j的相关系数,它反映了Z i依赖F j的程序。
(三)变量共同度的统计意义记因素负荷矩阵A第i行元素的平方和为:(12.4)2h称之为变量Z i的共同度或者共同因素方差。
可以推导得出:i(12.5)从上式可知,变量Z i的方差由两部分构成。
张敏强《教育与心理统计学》笔记和课后习题(含考研真题)详解-常用统计参数【圣才出品】

第2章常用统计参数【学习目标】1.了解各种集中量数、差异量数和地位量数的概念、性质和作用,理解各种量数的适用条件及特点。
2.识记相关、散点图及相关系数的概念与彼此之间的关系。
3.掌握各种量数的计算方法,并能够熟练使用各种量数对测量数据的数据特征进行描述。
4.掌握各种常见相关分析方法的适用条件及计算方法。
2.1复习笔记一组变量的次数分布,一般至少有以下两个方面的基本特征:中心位置:用以度量一组数据的集中趋势,描述它们的中心位于何处,故对其数量化描述称为位置度量数或集中量数。
离散性:反映一组数据的分散程度,即次数分布的离散程度。
对其数量化描述称为次数分布变异特性的度量或差异量数。
中心位置相同的次数分布,其离散程度不一定相同。
对任何一个已知的次数分布,均可以计算出反映上述统计特征的量数。
在教育与心理统计中,总体统计特征的量数称为参数,用希腊字母表示,如μ,σ2,ρ等;样本统计特征的量数称为统计量,用英文字母表示,如X,S2,r等。
一、集中量数集中量数是指描述数据集中趋势的统计量,包括算术平均数、加权平均数、几何平均数、中数,等等,其作用都是用于度量次数分布的集中趋势。
(一)算术平均数算术平均数(简称平均数、均数)是用以度量连续变量次数分布集中趋势的最常用的集中量数。
1.总体平均数与样本平均数(1)总体平均数如果一个总体X 包含N 个元素,x i 是这个总体中的第i 个元素,则称x i 为第i 次观测值,那么对x 来讲,该总体的算术平均数被定义为:11=Nii x N μ=∑式中:μ——总体算术平均数;N——总体容量;i x ——第i 次观测值。
(2)样本平均数当无法对总体进行全面观测时,对于样本X ,其算术平均数被定义为:11n i i X x n =∑式中:X ——样本平均数;n ——样本容量。
2.加权平均数若已知各组平均数和各组人数,要求总的平均数时,则要用加权平均数的方法,其计算公式为:式中:——总平均数(或加权平均数);12,,,k n n n …——各组人数;12,k ,X X X …,——各组平均数;12t k n n n n =+++…——总人数。
张敏强《教育与心理统计学》(第3版)课后习题(主成分分析与因素分析)【圣才出品】

第10章主成分分析与因素分析1.主成分分析的主要作用有哪些?答:主成分分析是用以寻找判断某种事物或现象的主要综合指标,它是在不损失或很小损失原有信息的前提下,将原来多个彼此相关的指标转换为新的少数几个彼此独立的综合指标的一种多元统计分析方法。
主成分分析的作用主要有:(1)主成分分析能降低所研究的数据空间的维数。
(2)可通过因子负荷的结论,弄清X变量间的某些关系。
(3)它是多维数据的一种图形表示方法。
经过主成分分析后,可以选取前两个主成分或其中某两个主成分,根据主成分的得分,画出n个样本在二维平面上的分布情况,由图形可直观地看出各样本在主分量中的地位,进而还可以对样本进行分类处理,可以由图形发现远离大多数样本点的离群点。
(4)可以用来构造回归模型。
(5)可筛选回归变量。
可以用较少的计算量来选择变量,获得选择最佳变量子集合的效果。
2.什么是贡献率和累计贡献率?其意义何在?答:(1)贡献率和累计贡献率的含义主成分的贡献率和累计贡献率度量了F1、F2,…,Fm分别从原始变量x1,x2,…,x p 中提取了多少信息。
①贡献率第i个主成分方差在全部方差中所占的比重称为贡献率,在主成分分析中,比值为。
②累积贡献率累积贡献率是指前k个主成分所代表的原始变量信息的百分比。
公式为,k≤p。
(2)两者的意义①贡献率第i个共因素对变量x提供的方差总和,反映第i个共因素的相对重要程度。
这个值越i大表明第i个主成分综合信息的能力较强。
②累积贡献率累计贡献率反映了前k个主成分共有多大的综合能力,用这k个主成分的方差和全部方差中所占的比重来描述,表明取前几个成分基本包含了全部测量指标所具有信息的百分率。
实际应用中,根据问题的需要选取主成分的个数,一般要求累积贡献率不小于85%。
也可依据问题的需要适当提高或降低累计贡献率。
由于主成分的方差λj一般下降较快,所以只要取为数不多的主成分,就足以反映p个原始变量的变化情况,从而达到主成分分析的目的。
张敏强《教育与心理统计学》笔记和课后习题(含考研真题)详解-非参数检验【圣才出品】

第9章非参数检验【学习目标】1.识记参数检验与非参数检验的区别。
2.识记各种非参数检验方法的适应条件。
3.掌握符号检验与符号秩次检验。
4.掌握中位数检验。
5.掌握秩和检验。
6.掌握按变量类型、检验假设、样本容量选择非参数检验的方法。
9.1复习笔记一、非参数检验的特点1.不需要严格的前提假设。
2.特别适用于顺序资料(等级变量)。
3.非常适用于小样本,且计算简明、迅速。
4.最大的不足是未能充分利用资料的全部信息。
二、符号检验(一)符号检验的介绍1.含义符号检验是通过对两个相关样本的每对数据差数的符号(正号或负号)的检验,来比较这两个样本差异的显著性。
2.过程(1)用符号检验来比较两个相关样本的差异,先将两个样本中每对数据的差数用正负号表示。
(2)如果两个样本无显著性差异,正号与负号的数量应相等,或接近相等。
(3)如果绝大部分是正号(或负号),两个样本有显著性差异的可能性较大。
(二)小样本情况1.适用情况当样本容量较小,n<25时,可用查表法进行符号检验。
2.检验的步骤(1)提出假设(2)求差数符号计算对应的各个差值的正值与负值的个数,分别记为n+和n-;将n+和n-中较小的一个记为r,r=min(n+,n-)。
(3)确定检验形式根据题意确定是采用双侧检验还是单侧检验。
(4)统计决断:根据及显著性水平,查符号检验表确定r的临界值,并作出统计决断。
(三)大样本情况1.适用情况当样本容量较大,即n>25时,二项分布接近于正态分布,因此可以用正态分布近似处理。
2.检验的步骤(1)提出假设(2)选择检验统计量并计算其值样本容量较大,二项分布近似于正态分布,可用Z比率作为检验统计量。
其中,r表示n+(正号的数目)与n-(负号的数目)中数值较小的一个;n表示n+与n之和。
-(3)确定检验形式根据题意确定是采用双侧检验还是单侧检验。
(4)统计决断根据实际计算出的Z值及显著性水平,作出统计决断。
三、符号秩次检验符号秩次检验法由威尔科克逊提出,也称为符号等级检验法或添号秩次检验法。
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解(概率与分布)【圣才出品】

5 / 23
圣才电子书 十万种考研考证电子书、题库视频学习平台
何值均由它顶上左右两个值相加而得。按这种方法可为更大的 n 值求得二项式的各项系数。 它的优点在于能简捷地确定二项展开式的各项系数。
表 3-1 杨辉三角(n=10)
二、二项分布 (一)二项分布 1.二项分布所讨论的概率问题 对于随机变量 x 进行 n 次独立试验,若每次试验结果只出现对立事件 A 与 之一,在 每次试验中出现 A 的概率是 p,则出现 的概率为 1-p,记为 q=1-p,求在 n 次独立试验 下,A 出现次数为 x 的概率分布(其中 x=0,1,2,…,n)。 2.二项分布的计算公式 (二)二项分布的均值、方差和标准差 二项分布的均值μ、方差σ2 和标准差σ分别为:
圣才电子书 十万种考研考证电子书、题库视频学习平台
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解 第 3 章 概率与分布
【本章重点】 ☆ 概率的统计定义与古典定义 ☆ 概率的两个基本定理 ☆ 二项分布的定理与计算 ☆ 正态分布曲线的性质 ☆ 正态分布在教育教学中的应用
为: (二)二项分布 1.排列与组合 (1)排列 ①定义 从 n 个不同的元素中,任取 m 个(m≤n)元素,按一定的顺序排成一列,称为从 n 个 不同元素中取出 m 个元素的一个排列。 a.当 m<n 时,所得排列称为选排列,记作 。 b.当 m=n 时,所得排列称全排列,记作 。 ②计算公式:
(2)组合 ①定义 从 n 个不同元素中,任取 m 个(m≤n)元素,不管顺序,并成一组,称为从 n 个不同 的元素中取出 m 个元素的一个组合,记作
4 / 23
圣才电子书
②计算公式:
十万种考研考证电子书、题库视频学习平台
张敏强《教育与心理统计学》笔记和课后习题(含考研真题)详解-聚类分析【圣才出品】

第11章聚类分析【学习目标】1.了解聚类分析的原理法。
2.了解聚类分析的数据整理方法。
3.识记聚类分析中距离的六种定义。
4.识记相关系数相关概念。
5.掌握聚类分析的三种方法。
11.1复习笔记一、聚类分析的基本原理(一)聚类分析1.聚类分析的概念聚类分析是指将分类对象置于一个多维空间中,按照它们空间关系的亲疏程度进行分类的统计方法。
其与一般分类方法的不同之处在于:(1)一般分类法往往从专业知识出发进行分析归类,而聚类分析先是仅凭变量指标进行定量分析,整理出分类的谱系追踪图,然后再据专业知识确定最终类型数目和类型命名;(2)一般的分类允许在不同层次上有不同的分类依据或分类准则,而聚类分析在所有层次上的分类依据和分类准则都是一样的;(3)一般分类不要求被分对象一次性完备,允许分类后继续补充样品甚至建立新类,而聚类分析要求被分类对象一次性完备,不允许中间插入新样品,否则要重复聚类分析的全过程。
2.聚类分析的分类依据(1)聚类分析作为一种数值分类法,分类依据是数据指标,要进行聚类分析必须建起一个描写事物本质属性的指标体系,或者一个变量组合。
(2)入选的指标需满足的要求①必须能刻画事物属性的某个侧面,所有指标组合起来形成一个完备的指标体系,互相配合共同刻画事物的本质特征。
②要求每一个入选指标都与所研究的问题紧密联系,并且都有较强的分辨能力。
③对于指标本身还必须可测和稳定,可测是分类得以进行的先决条件,稳定是分类准确的前提。
如果分类指标间还具有直交性,那么还可提高聚类的效率。
若有N个样品、有M个指标,称为M维空间上N个样本点,测值X ik表示第i个样本点在第k维指标上的测量值。
空间N个样本点的所有测值可以矩阵X记之:④在聚类分析中,要求入选的所有指标变量有统一的量纲。
⑤常用的整理原始数据的方法有以下几种:a.数据中心化变换如果一批数据指标由于各自的分布中心有显著差异而导致量纲不一致,可以对数据作中心化变换,新的指标中心皆为0。
张敏强版《教育及心理统计学》1到3章读书笔记

《绪论》1.什么是教育与心理统计学教育与心理统计学是应用统计学的一个分支,是数理统计学与教育学、心理学的一门交叉学科,它把统计学的理论方法应用于教育实际工作和各种心理实验、心理测验等科学研究中,通过对所得数据的分析和处理,达到更为准确地掌握情况、探索规律、制订方案、目的,为教育与心理的科学研究提供了一种科学的方法。
2.教育与心理统计学的基本内容及本书体系。
1)描述统计学:这一部分主要是研究和简缩数据和描述这些数据。
例如:计算平均数、中位数、众数等,以这些参数来反映观测数据的集中趋势。
计算标准差、方差等,以这些参数来反映观测数据的离散趋势。
描述统计学主要是描述事务的典型性、波动范围以及相互关系,提示事物的内部规律。
2)推断统计学:这部分内容主要是研究如何利用数据去作出决策的方法。
推断统计学则是一种依据部份数剧去推论全体的一种科学方法,它是进行教育与心理实验、对教育与心理研究或实验作出预测和规划的有力工具。
推断统计学的主要内容有:统计检验、统计分析和非参数统计法。
3)多元统计分析:这部分内容主要是研究超过两个因素的教育与心理的研究和实验。
多元统计分析的主要任务就是寻找出主要的因素,相近或相关的因素合并或归类。
多元统计分析的主要内容有:主成分分析、因素分析、聚类分析、多元方差分析、多元回归分析等。
3.教育与心理统计学的昨天、今天和明天1)与心理统计学的昨天:1904年美国人桑代克写的《心理与社会测量导论》2)教育与心理统计学的今天:叶佩华主编的《教育统计学》,张厚粲主编的《心理与教育统计》等。
4.预备知识1)概念与术语<1> 随机变量:教育与心理实验或观测,在相同的条件下,其结果可能不止一个,同实验或观测所得到的数据,事先无法确定,这类现象称为随机现象。
因为可以用数字来表现,则称这些数字为随机变量。
它的特点是:离散性、变异性和规律性。
依其性质可分为:称名变量、顺序变量、等距变量、比率变量四种称名变量:用于说明一事物与其它事物在属性上的不同或类别上的差异,但不说明事物与事物之间差异的大小。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(7.1)
其中,ε指的是随机误差。
称为回归的主值,称(7.2)式为回归方程。
(7.2)
2.回归分析的任务
回归分析的一个重要任务是求出回归方程右边的函数表达式。实际求回归方程的步骤
为:首先进行试验与调查;其次在大量试验与调查的数据资料基础上,按照对实际数据作最
佳拟合的原则求取具体的回归方程。
3.回归分析的种类
一、回归分析的基本原理 (一)意义 1.回归分析是借助于数学模型对客观世界所存在的事物间的不确定关系的一种数量化 描写,其目的在于为不确定现象的研究提供更为科学、精细的手段,以应用于相关随机变量 的估计、预测和控制。 2.回归分析是统计分析中的一种重要手段,首先发现回归现象的是英国生物学家高尔 顿和皮尔逊,其根本目的是要借助于因变量和自变量的分类,在概率统计的意义上,把变量
若把观测数据描成散点图,则其形状基本组成一个椭圆,也就是说这些点基本上是围绕一根 直线振动,这根直线就是椭圆的长轴所在位置。必须注意的是,一般来说所求一元线性回归 方程并不是椭圆的长轴,要求这条直线方程,必须按照最佳拟合的原则用最小二乘法。
1.一元线性回归的模型
Hale Waihona Puke 其中的一元线性回归方程记为: y=α+βx
4.计算均方
回归均方: MSU U dfU
剩余均方: MSQ Q dfQ
5.检验统计量: F MSU MSQ
6.将所求数据填入方差分析表
(7.5)
5 / 29
圣才电子书 十万种考研考证电子书、题库视频学习平台
7.查表,做出统计决断。
称为变量 y 对变量 x 的一元线性回归方程。 2.一元线性回归模型的性质
(7.4)
在一元线性回归模型 线在 y 轴上的截距。
(二)一元线性回归方程的建立
中,系数β是这条直线的斜率,α是这条直
要建立一元线性回归方程
,实际上就是要确定方程中的两个参数α与β。
由 n 对样本数据建立因变量 y 对自变量 x 的一元线性回归方程的步骤如下:
(1)根据所求回归方程函数类型的不同,可分为线性回归分析和非线性回归分析。
(2)根据内含自变量个数为一个还是多个而分为一元回归分析和多元回归分析。
(三)主要内容
回归分析包括三部分内容:建立回归方程、检验和评价所建回归方程的有效性、利用所
建回归方程进行预测和控制。
1.建立回归方程
(1)依据专业知识调查所研究现象可能涉及到的变量的种类和个数。
7.1 复习笔记
以相关关系描述两个变量之间的不确定性关系,只能对它们之间的密切程度作描述。回 归分析可以在描述变量之间不确定关系的基础上,进一步通过自变量去估计和预测因变量的 发展及变化,并且能较好地以回归系数表现各自变量对因变量的影响。回归分析既可以应用 于有明确因果关系的变量研究,也可以应用于无明确因果关系的变量研究。
二、一元线性回归分析 (一)一元线性回归的模型及其性质 一元线性回归研究的是具有线性相关关系的因变量和一个自变量之间的回归问题。确认 因变量 Y 只受一个自变量或者主要受一个自变量 X 的影响,并且确认两者之间的线性关系。
3 / 29
圣才电子书 十万种考研考证电子书、题库视频学习平台
(2)进行实验或调查以获取实际数据。
(3)结合以往的经验,对所获数据进行分析研究,确定回归方程的函数形式。
2 / 29
圣才电子书 十万种考研考证电子书、题库视频学习平台
(4)根据最佳拟合原则估计回归方程中的所有参数。 (5)建立一个回归方程。 2.检验和评价所建回归方程的有效性 (1)对所建立的回归方程作有效性检验,检验方程有无使用价值。 (2)找到评价回归方程有效性高低的统计指标来评价所建回归方程使用价值的高低。 (3)必要时必须检验各个自变量的统计显著性,以鉴别已选自变量中是否夹杂了与因 变量无关或可以忽略不计的变量,把它们从回归方程中剔除出去,以便简化方程形式,提高 使用效率。 (4)在实际计算分析过程中,建立一个回归方程后,为了追求它的高效和实用,往往 要在第一和第二两部分的计算中往返进行,直至真正建立起一个既高效又实用的“最佳”方 程。 3.利用所建回归方程进行预测和控制 根据已获得的研究结果对研究或实验的发展变化作出预测和控制,是研究回归现象、进 行回归分析的根本目的所在。在建立起回归方程之后,利用方程所揭示的变量间的关系,对 因变量进行估计或预测。估计或预测因变量的主值,估计或预测因变量的取值范围,或者利 用回归方程所揭示的变量间的发展变化和互相制约的关系,通过控制或调整自变量的值而达 到控制因变量变化趋势的目的。
(5)列出回归方程:y=a+bx。
(三)一元线性回归方程的有效性检验 1.建立假设:H0:所建回归方程无效;
H1:所建回归方程有效。 2.计算离差平方和
总离差平方和:
n
回归平方和:U =b2 (xi x )2 i 1
剩余平方和: Q lyy U
3.计算自由度
df总 n 1, dfU 1, dfQ n 2 。
圣才电子书 十万种考研考证电子书、题库视频学习平台
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解 第 7 章 回归分析
【本章重点】 ☆ 回归分析的基本原理 ☆ 一元线性回归方程的建立 ☆ 检验和评价所建回归方程的有效性 ☆ 用所建回归方程进行预测和控制
(1)由自变量数据列 x,求得 x 的均值 和离均差平方和 ;
(2)由因变量数据列 y,求得 y 的均值 和离均差平方和 ;
(3)列 x 和 y,求得 x 与 y 的协方差 ;
4 / 29
圣才电子书 十万种考研考证电子书、题库视频学习平台
(4)由
,求出 a 和 b;
1 / 29
圣才电子书 十万种考研考证电子书、题库视频学习平台
间的相关关系用精确的数学公式伴以其他手段加以进一步的定量刻画。在回归分析中,自变
量可以是精确变量,也可以是随机变量,但在计算分析的过程中,都是作为精确变量处理的。
(二)基本原理
1.回归分析的数学模型:
y=f(x1,x2,x3,…,xk)+ε