张厚粲《现代心理与教育统计学》配套题库【课后习题】(线性回归)【圣才出品】
张厚粲《现代心理与教育统计学》配套题库【课后习题】(参数估计)【圣才出品】
第7章参数估计1.何谓点估计与区间估计,它们各有哪些优缺点?答:(1)点估计①定义点估计是指用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示。
②优缺点a.优点它能够提供总体参数的估计值。
b.缺点点估计以随机变量中的某一个值来做估计,很显然会产生一定的误差。
若误差较小,这个点估计值还是一个好的估计值,若误差较大,这个点估计便失去了意义。
(2)区间估计①定义区间估计是指根据估计量以一定可靠程度推断总体参数所在的区间范围,它是用数轴上的一段距离表示未知参数可能落入的范围。
②优缺点a.优点不仅给出一个估计的范围,使总体参数包含在这个范围之内,而且还能给出估计精度并说明估计结果的有把握的程度。
b .缺点 无法具体指出总体参数等于什么。
2.试以方差的区间估计为例说明区间估计的原理。
答:区间估计的原理是样本分布理论。
在计算区间估计值,解释估计的正确概率时,依据的是该样本统计量的分布规律及样本分布的标准误(SE )。
也就是说,只有知道了样本统计量的分布规律和样本统计量分布的标准误才能计算总体参数可能落入的区间长度,并对区间估计的概率进行解释,可见标准误及样本分布对于总体参数的区间估计是十分重要的。
样本分布可提供概率解释,而标准误的大小决定区间估计的长度。
一般情况下,加大样本容量可使标准误变小。
自正态分布的总体中,随机抽取容量为n 的样本,其样本方差与总体方差比值的分布为χ2分布。
根据χ2分布,可以说:σ2有1-α的概率落在与之间。
3.总体平均数估计的具体方法有哪些?答:总体平均数估计的具体方法有两种:(1)总体方差σ2已知时,用Z 分数对总体平均数μ的估计①当总体分布为正态时,不论样本n 的大小,其标准误X σ都是,这时样本的方差S 2在计算中没有用处。
依据上面所讲的步骤,查正态表,确定Z α/2,一般情况下显著性水平α确定为0.05或0.01。
()212/21n n s αχ--()()2121/21n n s αχ---②当总体为非正态分布时,只有当样本容量n >30以上,才能根据样本分布对总体平均数μ进行估计,否则不能进行估计。
张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](线性回归)
dfR 1
MSR
SSR dfR
=118.95
dfE N 2 =8
MSE
SSE dfE
8.08
F MSR =14.72 MSE
查 F 表, F0.01(1,8) 5.32 , F F0.05(1,8)
5.某研究所 10 名学生研习某教授的高级统计课程,期中与期末考试成绩见下表。请 问该教授是否可以利用期中考试成绩来预测期末考试成绩?
4/6
圣才电子书 十万种考研考证电子书、题库视频学习平台
解:(1)建立回归方程
经计算 X 79.2, Y 84.2, sX 8.75, sY =4.52
dfE N 2 =8
MSE
SSE dfE
230.5
F MSR =9.15 MSE
查 F 表, F0.05(1,8) 5.32 , F F0.05(1,8)
3/6
圣才电子书
方差分析表如下
十万种考研考证电子书、题库视频学习平台
变异来源
自由度
平方和
均方
F
F0.05(1,8)
bYX
Y Y
2
=0.57
X X
a Y bX 23.13
则回归方程为 Yˆ 23.13 0.57X 。
(2)对回归方程进行检验
SST
Y2
Y 2
N
=3952.5
SSR
b2
X
2
X
N
2
=2108.6
SSE SST SSR =1843.9
dfR 1
MSR
SSR dfR
=2108.6
SST SSR N 2
MSE =15.18
2
张厚粲《现代心理与教育统计学》(第3版)配套题库【章节题库】第1章~第3章 【圣才出品】
第三部分章节题库第1章绪论一、单选题1.三位研究者评价人们对四种速食面品牌的喜好程度。
研究者甲让评定者先挑出最喜欢的品牌,然后挑出剩下三种品牌中最喜欢的,最后再挑出剩下两种品牌中比较喜欢的。
研究者乙让评定者将四种品牌分别给予1—5的等级评定,(1表示非常不喜欢,5表示非常喜欢),研究者丙只是让评定者挑出自己最喜欢的品牌。
研究者甲,乙,丙所使用的数据类型分别是:()A.类目型---顺序型---计数型B.顺序型---等距型---类目型C.顺序型---等距型---顺序型D.顺序型---等比型---计数型【答案】B2.调查了n=200个不同年龄组的被试对手表显示偏好程度偏好程度年龄组数字显示钟面显示不确定30岁或以下90401030岁以上104010该题自变量与因变量的数据类型分别是:()A.类目型-顺序型B.计数型-等比型C.顺序型-等距型D.顺序型-命名型【答案】D3.157.5这个数的上限是()。
A.157.75B.157.65C.157.55D.158.5【答案】C4.随机现象的数量化表示称为()。
A.自变量B.随机变量C.因变量D.相关变量【答案】B5.实验或研究对象的全体被称之为()。
A.总体B.样本点C.个体D.元素【答案】A6.下列数据中,哪个数据是顺序变量?()A.父亲的月工资为1300元B.小明的语文成绩为80分C.小强100米跑得第2名D.小红某项技能测试得5分【答案】C二、概念题1.描述统计(吉林大学2002研)答:描述统计指研究如何整理心理教育科学实验或调查的数据,描述一组数据的全貌,表达一件事物的性质的统计方法。
比如整理实验或调查来的大量数据,找出这些数据分布的特征,计算集中趋势、离中趋势或相关系数等,将大量数据简缩,找出其中所传递的信息。
2.推论统计(中国政法大学2005研,浙大2000研)答:推论统计又称推断统计,主要研究如何通过局部数据所提供的信息,推论总体或全局的情形;如何对假设进行检验和估计;如何对影响事物变化的因素进行分析;如何对两件事物或多种事物之间的差异进行比较等。
张厚粲《现代心理与教育统计学》配套题库【章节题库】(相关关系)【圣才出品】
3 / 22
圣才电子书
C.相同
十万种考研考证电子书、题库视频学习平台
D.丌确定
【答案】C
【解析】相关系数的“+、-”(正、负)号表示双发量数列乊间相关的方向,正值表
示正相关,负值表示负相关,而丌表示大小。相关系数叏值的大小表示相关的强弱程度。如
果相关系数的绝对值在 1.00 不 0 乊间,则表示丌同程度的相关。绝对值接近 1.00 端,一
般为相关程度密切;接近 0 值端,一般为关系丌够密切。
7.相关系数的叏值范围是( )。 A.|r|<1 B.|r|≥0 C.|r|≤1 D.0<|r|<1 【答案】C 【解析】相关系数是两列发量间相关程度的数字表现形式,或者说是用来表示相关关系 强度的指标。相关系数的叏值情况:-1.00≤r≤1.00。
一般为关系丌够密切。
3.A、B 两发量线性相关,发量 A 为符合正态分布的等距发量,发量 B 也符合正态分 布且被人为划分为两个类别,计算它们的相关系数应采用( )。
A.积差相关系数 B.点二列相关 C.二列相关 D.肯德尔和谐系数 【答案】C 【解析】二列相关适用的资料是两列数据均属亍正态分布,其中一列发量为等距或等比 的测量数据,另一列发量为人为划分的二分发量。例如,在一个测验中,测验成绩常常会划 分为及格和丌及格,人的健康状态分为健康不丌健康两类,平时的学习成绩依一定标准将其 划分为好、差两类等。
②共发关系,即表面看来有联系的两种事物都不第三种现象有关。这时,两种事物乊间的关
系便是共发关系;③相关关系,即两类现象在収展发化的方向不大小方而存在一定的联系,
张厚粲《现代心理与教育统计学》配套题库【章节题库】(统计图表)【圣才出品】
第2章统计图表一、单项选择题1.统计图中的y轴一般代表()。
A.因变量B.自变量C.数据D.被试变量【答案】A【解析】统计图一般采用直角坐标系,通常横坐标或横轴表示事物的组别或自变量X,称为分类轴;纵坐标或纵轴表示事物出现的次数或因变量Y,称为数值轴。
2.上限与下限之差为()。
A.组限B.组距C.组数D.全距【答案】B【解析】A项,组限是一个组的起点值和终点值之间的距离,起点值称组下限,终点值称组上限,包括表述组限和精确组限两种。
B项,组距是指任意一组的起点和终点之间的距离,用符号i表示。
C项,组数(分组数目)的多少要根据数据的多少来定。
如果数据个数在100以上,习惯上一般分10~20组,经常取12~16组;数据个数较少时,一般分为7~9组。
D项,全距指最大数与最小数两个数据值之间的差距。
3.直方图一般适用于自变量的是()。
A.称名变量B.顺序变量C.等距变量D.等比变量【答案】C【解析】直方图,又称等距直方图,是以矩形的面积表示连续性随机变量次数分布的图形。
一般用纵轴表示数据的频数,横轴表示数据的等距分组点,即各分组区间的上下限,有时用组中值表示。
直方图适用于等距变量。
4.小李认为实验获得的数据有一定的偏斜,他想通过一种迅速有效的方式描述这种偏斜。
下列各种统计图中能描述这种偏斜的是()。
A.直条图B.直方图C.圆形图D.线形图【答案】C【解析】A项,直条图主要用于表示离散型数据资料,即计数资料。
它是以条形的长短表示各事物间数量的大小与数量之间的差异情况。
B项,直方图,又称等距直方图,是以矩形的面积表示连续性随机变量次数分布的图形。
C项,圆形图,又称饼图,主要用于描述间断性资料,目的是为显示各部分在整体中所占的比重大小,以及各部分之间的比较。
D项,线形图更多用于连续性资料,凡欲表示两个变量之间的函数关系,或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的情形,用线形图表示是较好的方法。
张厚粲《现代心理与教育统计学》配套题库【考研真题】(多项选择题)【圣才出品】
二、多项选择题1.卡方检验可以应用于()。
[统考2019年研]A.拟合性检验B.中位数检验C.独立性检验D.符号秩次检验【答案】ABC【解析】卡方检验包括拟合度检验、独立性检验和同质性检验,同时在非参数检验中的中位数检验也应用到卡方检验。
2.取样时应遵循的原则有()。
[统考2018年研]A.随机化B.代表性C.数量化D.置换性【答案】ABD【解析】A项,随机性是指研究中的被试、实验处理等被抽选的概率均等。
B项,代表性是指当样本能够代表总体的程度。
常用的方法之一是通过随机取样,使样本具有代表性。
这只在统计意义上获得的特征。
D项,置换性是指取样过程中已取样的样本成分返回到总体,继续参加取样;这在随机取样中特别重要。
一些研究表明,非置换性随机取样避免了在样本中出现重复选择的成分,因而比置换性取样更准确地估算样本指标。
3.建立一元线性回归模型的主要方法有()。
[统考2018年研]A.因素分析法B.平均数方法C.最小二乘法D.逐步回归法【答案】BC【解析】建立回归模型的方法有平均数法和最小二乘法。
如果只想从一组(X,Y)值中粗略地看看X与Y的简单线性关系,有时可以用平均数法建立回归方程来描述这种关系。
如果想得到比较精确的回归方程,则常用最小二乘法。
所谓最小二乘法,就是如果散点图中每一点沿Y轴方向到直线的距离(即Y i-Y i)的平方和最小,简单讲就是使误差的平方和最小,则在所有直线中这条直线的代表性就是最好的,它的表达式就是所要求的回归方程。
4.下列关于非参数检验的表述,正确的有()。
[统考2017年研]A.适用于小样本B.变量总体须服从二项分布C.适用于顺序数据资料D.未能充分利用资料的全部信息【答案】ACD【解析】非参数检验的特点:一般需要严格的前提假设;适用于小样本,方法简单;适用于顺序资料(等级变量);未能充分利用资料的全部信息,目前不能处理“交互作用”。
5.以下可以用于顺序量表数据的统计方法有()。
张厚粲《现代心理与教育统计学》配套题库【章节题库】(差异量数)【圣才出品】
第4章差异量数一、单项选择题1.测得某班学生的物理成绩(平均分78分)和英语成绩(平均分70分),若比较两者的离中趋势,应计算()。
A.方差B.标准差C.四分差D.差异系数【答案】D【解析】两个或两个以上样本所使用的观测工具不同,所测的特质不同,此时不能用绝对差异量来比较不同样本的离散程度,而应使用相对差异量数。
最常用的相对差异量就是差异系数。
差异系数,又称变异系数、相对标准差等,它是一种相对差异量,用CV来表示,是标准差对平均数的百分比。
2.研究者决定通过每一个分数除以10来对原始分数进行转换。
原始分数分布的平均数为40,标准差为15。
那么转换以后的平均数和标准差将会是()。
A.4,1.5B.0.4,0.15C.40,1.5D.0.4,1.5【答案】A 【解析】平均数的特点是在一组数据中,每一个数都乘以一个常数c 所得的平均数为原来的平均数乘以常数c ,因此转换后的平均数为4;标准差的特点是每一个观测值都乘以一个相同的常数c ,则所得的标准差等于原标准差乘以这个常数,因此转换后的标准差为1.5。
3.已知平均数M =4.0,S =1.2,当X =6.4时,其相应的标准分数为( )。
A .2.4B .2.0C .5.2D .1.3【答案】B【解析】标准分数,又称基分数或Z 分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。
其计算公式为X X Z s-=把数据代入: 6.4 4.021.2X X Z s --===4.求数据16,18,20,22,17的平均差( )。
A .18.6B .1.92C .2.41D .5【答案】B【解析】平均数 161820221718.65i X X N++++===∑平均差 ..1618.61818.62018.62218.61718.651.92i X XA D n-=-+-+-+-+-==∑5.某学生某次数学测验的标准分为2.58,这说明全班同学中成绩在他以下的人数百分比是( ),如果是-2.58,则全班同学中成绩在他以上的人数百分比是( )。
张厚粲《现代心理与教育统计学》配套题库【课后习题(第8~14章)】【圣才出品】
接受 H0),而前提 H1 为真,因而犯了错误,这就是Ⅱ型错误,其概率为 β。很显然,当 α
=0.05 时,β 不一定等于 0.95。
3.影响 β 错误的因素有哪些,什么叫统计检验能力?
2 / 84
圣才电子书 十万种考研考证电子书、题库视频学习平台
答:β 错误,即Ⅱ型错误,指虚无假设 H0 本来不正确但却接受了 H0。 (1)影响 β 错误的因素主要有 3 个 ①显著性水平即 α 值,二者成负相关,即 α 增大时 β 减小,但是二者之和不为 1。 ②样本统计量。 ③样本容量,增大样本容量会减小 β。 (2)统计检验力,又称假设检验的效力,是指假设检验能够正确侦察到真实的处理效 应的能力,也指假设检验能够正确地拒绝一个错误的虚无假设的概率,因此效力可以表示为 1-β。检验的效力越高,侦察能力越强。影响统计检验力的因素有: ①处理效应大小,处理效应越明显,越容易被侦查到,假设检验的效力也就越大。 ②显著性水平 α,α 越大,假设检验的效力也就越大。 ③检验的方向性,单侧检验侦察处理效应的能力高于双侧检验。 ④样本容量,样本容量越大,标准误越小,样本均值分布越集中,统计效力越高。
图 8-1 α 与 β 的关系示意图
_
如果 H0∶μ1=μ0 为真,关于Xi 与 μ 的差异就要在图 8-1 中左边的正态分布中讨论。对
_
_
于某一显著性水平 α,其临界点为Xα。(将两端各 α/2 放在同一端)。Xα 右边表示 H0 的拒绝
区,面积比率为 α;左边表示 H0 的接受区,面积比率为 1-α。在“H0 为真”的前提下随
4 / 84
2.从 α 与 β 两类错误的关系分析,为什么 α 与 β 的和不一定等于 1? 答:α 与 β 是在两个前提下的概率。α 是拒绝 H0 时犯错误的概率(这时前提是“H0 为真”);β 是接受 H0 时犯错误的概率(这时“H0 为假”是前提),所以 α+β 不一定等于 1。
张厚粲《现代心理与教育统计学》配套题库【考研真题+课后习题(第1~7章)】【圣才出品】
第一部分考研真题一、单项选择题1.已知某小学一年级学生的体重平均数21kg,标准差3.2kg,身高平均数120cm,标准差6.0cm,则下列关于体重和身高离散程度的说法正确的是()。
[统考2019年研] A.体重离散程度更大B.身高离散程度更大C.两者离散程度一样D.两者无法比较【答案】A【解析】计算体重和身高的变异系数,CV体重=(3.2/21)×100%=15.2%,CV身高=(6/120)×100%=5%。
由此可知体重离散程度更大。
2.已知某正态总体的标准差为16,现从中随机抽取一个n=100的样本,样本标准差为16,则样本平均数分布的标准误为()。
[统考2019年研]A.0.16B.1.6C.4D.25【答案】B【解析】总体正态,且方差已知,则样本平均数的分布为正态分布,标准误SE=σ/sqr (n)=16/10=1.6。
3.如果学生参加压力量表测试的分数服从正态分布,平均数为5,标准差为2,那么分数处在5和9之间的学生百分比约为()。
[统考2019年研]A.34%B.48%C.50%D.68%【答案】B【解析】计算原始分数为5的标准分数Z1=0,原始分数为9的标准分数Z2=2,已知±1.96包含95%的个体,则可估计p(0<Z<2)=0.48。
4.对样本平均数进行双尾假设检验,在α=0.10水平上拒绝了虚无假设。
如果用相同数据计算总体均值的置信区间,下列描述正确的是()。
[统考2019年研] A.置信区间不能覆盖总体均值B.置信区间覆盖总体均值为10%C.置信区间覆盖总体均值为90%D.置信区间覆盖总体均值为0.9%【答案】C【解析】置信度即置信区间覆盖总体均值的概率,题干说明置信度为1-α=0.90。
5.一元线性回归分析中对回归方程是否有效进行检验,H0∶β=0,t=7.20,b=1.80,则斜率抽样分布的标准误SE b为()。
[统考2019年研]A .0.25B .1.48C .2.68D .4.00【答案】A 【解析】斜率即回归系数,回归系数的显著性检验t =(b -β)/SE b =7.20,已知β=0,b =1.80,则可计算得到标准误SE b =0.25。
张厚粲《现代心理与教育统计学》配套题库【课后习题】(抽样原理及方法)【圣才出品】
圣才电子书 十万种考研考证电子书、题库视频学习平台
分层抽样由于充分利用了总体已知的信息,其样本的代表性及推论的精确性一般优于简 单随机抽样。比较两种抽样方式的标准误,能够说明这种分层的效果。
一般总体方差幵丌易得到,常以样本方差 s2 来估计,因而这里 s2 代表总体的变异。在 分层抽样中,总体变异实际上来源于层不层之间和各层内部,即层间不层内两部分。
d
2
可以看到,迚行平均数的估计时,当 α 确定后(0.05 或 0.01),总体标准差 σ 和最大
允许误差 d 是决定样本容量的两个因子。
(2)假设检验
_
_
设某总体平均数为 μ0,样本平均数为X,当 H0 为真时,意味着X所代表的总体平均 x
H∶ 不 μ0 重合(即 0
x
0 ),这时如果拒绝 H0,则犯 α 型错误。
X 0 SEX
Za/2 Z
即
X 0
(Za/2
Z )
n
令
δ μX μ0
则
n
(Za/2
Z
)
2
可见,在平均数的假设检验中,确定了 α 不 β 之后(由研究者自己确定)样本容量 n
决定于总体标准差。
n
s 即各层内部方差(
2 i
)的加权平均,称作层内变异,以
sW2
表示(相当于方差分析中
的组内变异)。
即
2/6
圣才电子书 十万种考研考证电子书、题库视频学习平台
SEX 分层
sW2 n
该公式表明,尽管分层抽样时,总变异被分解为层间不层内两部分来源,但平均数的标
张厚粲《现代心理与教育统计学》(第3版)配套题库【章节题库】第7章~第10章 【圣才出品】
9.已知两样本,其中 n1=10,方差为 8,n2=1 5,方差为 9,问该两样本的方差是否
3 / 56
圣才电子书
相等?( )。
十万种考研考证电子书、题库视频学习平台
A.
B.
C.
D.无法确定
【答案】A
10.一个好的估计量应具备的特点是( )。 A.充分性、必要性、无偏性、一致性 B.充分性、无偏性、一致性、有效性 C.必要性、无偏性、一致性、有效性 D.必要性、充分性、无偏性、有效性 【答案】B
D.充分性
十万种考研考证电子书、题库视频学习平台
【答案】ABCD
2.有一个 64 名学生的班级,语文历年考试成绩的σ=5,又知今年期中考试语文平均 成绩是 80 分,如果按 99%的概率推测,那么该班语文学习的真实成绩可能为( )。
A.78 B.79 C.80 D.81 【答案】BCD
3.已知某次物理考试非正态分布分布,σ=8,从这个总体中随机抽取 n=64 的样本, 并计算得其平均分为 71,那么下列成绩在这次考试中全体考生成绩均值μ的 0.95 的置信区 间之内的有( )。
11.从某正态总体中随机抽取一个样本,其中 n=10,S=6,其样本平均数分布的标准 差为( )。
A.1.7 B.1.9 C.2.1 D.2.0 【答案】D
4 / 56
圣才电子书 十万种考研考证电子书、题库视频学习平台
12.用从总体抽取的一个样本统计量作为总体参数的估计值称为( )。 A.样本估计 B.点估计 C.区间估计 D.总体估计 【答案】B
三、概念题
十万种考研考证电子书、题库视频学习平台
1.无偏估计(中科院 2004 研)
张厚粲《现代心理与教育统计学》配套题库【章节题库】(非参数检验)【圣才出品】
第11章非参数检验一、单项选择题1.秩和检验法首先由()提出。
A.弗里德曼B.维尔克松C.惠特尼D.克-瓦氏【答案】B【解析】秩和检验法首先由维尔克松提出,叫维尔克松两样本检验法,后来曼-特尼将其应用到两样本容量不等(n1≠n2)的情况,因而又称作曼-特尼维尔克松秩和检验,又叫曼-特尼U检验。
2.秩和检验与参数检验中的()相对应。
A.两独立样本平均数之差t检验B.相关样本的t检验C.独立样本的t检验D.配对样本差异显著性t检验【答案】C【解析】秩和检验法与参数检验中独立样本的t检验相对应。
由于t检验中要求“总体分布正态”,当这一前提不成立时就不能使用t检验,此时可以用秩和检验代替t检验。
当两个独立样本都为顺序变量时,也需使用秩和法来进行差异检验。
3.符号检验法与参数检验中的()相对应。
A.两独立样本平均数之差t检验B.相关样本的t检验C.独立样本的t检验D.配对样本差异显著性t检验【答案】D【解析】符号检验是以正负符号作为资料的一种非参数检验程序。
它是一种简单的非参数检验方法,适用于检验两个配对样本分布的差异,与参数检验中配对样本差异显著性t 检验相对应。
符号检验法将中数作为集中趋势的量度,虚无假设是配对资料差值来自中位数为零的总体。
具体而言,它是将两样本每对数据之差(X i-Y i)用正负号表示,若两样本没有显著性差异,则正差值与负差值应大致各占一半。
在实验中,当碰到无法用数字去描述的问题时,符号检验法就是一种简单而有效的检验方法。
4.在秩和检验中,当两个样本容量都大于10时,秩和分布为()。
A.T分布B.接近t分布C.接近正态分布D.接近F分布【答案】C【解析】在秩和检验中,一般认为当两个样本容量都大于10时,秩和T的分布接近正态分布。
其平均数及标准差公式为:()11212T n n n μ++=T σ=其中n 1为较小的样本容量,即n 1≤n 2。
5.参数检验中两独立样本的平均数之差的t 检验,对应着非参数检验中的( )。
张厚粲《现代心理与教育统计学》配套题库【章节题库】-第1~6章【圣才出品】
第三部分章节题库第1章绪论一、单项选择题1.三位研究者评价人们对四种速食面品牌的喜好程度。
研究者甲让评定者先挑出最喜欢的品牌,然后挑出剩下三种品牌中最喜欢的,最后再挑出剩下两种品牌中比较喜欢的。
研究者乙让评定者将四种品牌分别给予1~5的等级评定,(1表示非常不喜欢,5表示非常喜欢),研究者丙只是让评定者挑出自己最喜欢的品牌。
研究者甲,乙,丙所使用的数据类型分别是()。
A.类目型-顺序型-计数型B.顺序型-等距型-类目型C.顺序型-等距型-顺序型D.顺序型-等比型-计数型【答案】B【解析】研究者甲使用的是顺序型数据。
顺序数据是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。
研究者乙使用的是等距型数据。
等距数据是有相等单位,但无绝对零的数据,如温度、各种能力分数、智商等。
研究者丙使用的是类目型数据。
称名数据只说明某一事物与其他事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小。
2.调查了n=200个不同年龄组的被试对手表显示偏好程度:该题自变量与因变量的数据类型分别是()。
A.类目型-顺序型B.计数型-等比型C.顺序型-等距型D.顺序型-命名型【答案】D【解析】自变量是年龄(30岁或以下/30岁以上)和手表显示(数字显示/钟面显示/不确定),因变量是偏好程度。
自变量属于顺序型数据。
顺序数据是指既无相等单位,也无绝对零的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。
因变量属于命名型数据。
称名数据只说明某一事物与其他事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小。
3.随机现象的数量化表示称为()。
A.自变量B.随机变量C.因变量D.相关变量【答案】B【解析】随机变量是指由于变量在测查之前,不能准确地预料会获得什么样的值。
张厚粲《现代心理与教育统计学》配套题库【章节题库】(集中量数)【圣才出品】
第3章 集中量数一、单项选择题1.假设60名学生的总平均数为75分,其中40名女生的平均数为79分,则剩下的20名男生的平均数为( )。
A .67B .71C .75D .77【答案】A【解析】算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。
计算公式:iX X N =∑756079406720X ⨯-⨯==2.如果从一个正态分布中,将上端的少数极端值去掉,下列统计量不会受到影响的是( )。
A .平均数B .中数C .众数D.标准差【答案】C【解析】A项,平均数所有观察值的总和除以总频数所得之商,易受极端值的影响。
B 项,中数是按顺序排列在一起的一组数据中居于中间位置的数,因此,数据减少会影响中数。
C项,众数是指在次数分布中出现次数最多的那个数的数值,少数极端值对其没有影响。
D 项,在求解标准差时,要应用平均数,因此标准差也会被极端值影响。
3.中数在一个分布中的百分等级是()。
A.50B.75C.25D.50~51【答案】A【解析】百分等级是一种相对位置量数,中数处于一组数据的中间位置,因此其百分等级为50。
4.6,8,10,12,26,这一组数据的集中趋势宜用()。
A.平均数B.中数C.众数D.平均差【答案】B【解析】A项,算术平均数易受极端值影响,这组数据存在极端值。
B项,若出现两极端的数目,又不能确定这些极端数目是否由错误观测造成,因而不能随意舍去,在这种情况下,只能用中数作为该被试的代表值,这样做,并不影响进一步的统计分析。
C项,这一组数据中不存在重复数据,因此不能用众数。
D项,平均差是差异量数,反映的是一组数据的离中趋势。
5.六名考生在作文题上的得分为12,8,9,10,13,15其中数为()。
A.12B.11C.10D.9【答案】B【解析】针对未分组且个数为偶数的数据,中数为居于中间位置两个数的平均数,即第N/2与第(N/2+1)位置的两个数据相加除以2。
将这组数据排列:8,9,10,12,13,15,中间位置的两个数为10和12,因此中数为11。
张厚粲《现代心理与教育统计学》(第4版)章节题库-线性回归(圣才出品)
第12章线性回归一、单项选择题1.如果实验得到遗传与儿童多动行为的相关系数是0.5,这意味着有多少儿童多动行为的变异会被除遗传外的其他变量解释?()A.25%B.50%C.75%D.无法确定【答案】C【解析】相关系数的平方等于回归平方和在总平方和中所占比例。
决定系数r2=0.25,表明变量儿童多动行为的变异中有25%是由遗传的变异引起的,或者说有25%可以由遗传的变异解释,有75%是除遗传外的其他变量解释。
2.XY两个变量间呈正相关,R=0.76,其回归是()。
A.拟合的一条线B.准确的两条线C.确定的一条线D.拟合的两条线【答案】A【解析】建立回归模型实际上就是根据已知两变量的数据求回归方程。
如果两个变量之间存在着线性关系,则两个变量间的关系就可以拟合直线模型。
此处只有一个相关关系,因此二者的回归是拟合的一条直线。
3.当XY间相关程度很小时,从X推测Y的可靠性就()。
A.很小B.很大C.中等D.大【答案】A【解析】相关系数是用来描述双变量数据相互之间关系的指标,因此相关程度越小,X 推测Y的可靠性越小。
4.从人类学角度,首先发现回归现象的是()。
A.达尔文B.高尔顿C.高斯D.瑟斯顿【答案】B【解析】“回归”一词,最先是由高尔顿在研究身高与遗传问题时提出。
1855年,他发表了一篇文章《遗传的身高向平均数方向的回归》,分析儿童身高与父母身高之间的关系,发现父母的身高可以预测子女的身高,当父母越高或越矮时,子女的身高会比一般儿童高或矮,他将子女与父母身高的这种现象拟合出一种线性关系。
尽管这是一种拟合较好的线性关系,但仍然存在例外现象:矮个的人的儿子比其父要高,身材较高的父母所生子女的身高将回降到人的平均身高。
换句话说,当父母身高走向极端(或者非常高,或者非常矮)的人的子女,子女的身高不会像父母身高那样极端化,其身高要比父母们的身高更接近平均身高。
高尔顿选用“回归”一词,把这一现象叫做“向平均数方向的回归”。
张厚粲《现代心理与教育统计学》(第3版)笔记和课后习题(含考研真题)详解
张厚粲《现代心理与教育统计学》(第 3 版)笔记和课后习题详解第 1 章绪论一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3 .统计学大致分为理论统计学(theoretical statistics )和应用统计学(applied statistics )两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现2.心理与教育科学研究数据具有随机性和变异性3.心理与教育科学研究数据具有规律性4.心理与教育科学研究的目标是通过部分数据来推测总体特征(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
二、心理与教育统计学的内容心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别。
(一)依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。
张厚粲《现代心理与教育统计学》(第3版)笔记和课后习题(含考研真题)详解
张厚粲《现代心理与教育统计学》(第3版)笔记和课后习题详解第1章绪论一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(applied statistics)两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现2.心理与教育科学研究数据具有随机性和变异性3.心理与教育科学研究数据具有规律性4.心理与教育科学研究的目标是通过部分数据来推测总体特征(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
二、心理与教育统计学的内容心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别。
(一)依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。
张厚粲《现代心理与教育统计学》配套题库【考研真题】(综合题)【圣才出品】
四、综合题1.考察被试在不同环境下问题解决的正确率,被试共40名,平均分到两个组,分别在安静和轻音乐两个环境下解决问题,测得安静组被试平均正确率为0.6,标准差为0.1。
轻音乐组被试平均正确率为0.7,标准差为0.2,在两种环境中正确率是否有差异?(1)本问题的零假设和备择假设是什么?(2)适用的统计方法是什么?(3)本统计的拒绝区间是多少?(4)统计的推断结论是什么?[华中师范大学2017年研]备注:单侧0.05显著水平下t (19)=1.729,t (38)=1.684;双侧0.05显著水平下,t (19)=2.093,t (38)=2.021。
答:(1)零假设H 0:两组被试平均正确率相同;备择假设H 1:两组被试平均正确率不同。
(2)独立样本平均数差异的显著性检验时,若两总体正态,总体方差未知,样本均值之差服从t 分布,则使用t 检验。
(3)拒绝区间:α=5%。
(4)根据公式df =n 1+n 2-2=380.0512X D SE ==12 1.95XD X X t SE -== 双侧条件下,t <t (38)=2.2021,则统计的推断结论为接受虚无假设拒绝备择假设,即在显著性水平为5%情况下,安静组被试的平均正确率与轻音乐组被试的平均正确率没有显著性差异。
2.某机构开发了一套选拔性测验,有100名考生参加了测验,平均分为50,标准差为11,一年后又搜集了考生工作能力分数,其平均数为500,标准差为110,考生的测验分数与工作能力分数的相关系数为0.80,选拔性测验次数分布表如下:根据上述材料,回答下列问题,计算结果保留2位小数。
(1)检验这次选拔性测验的分数是否满足正态分布[χ2(3)0.05=7.81,χ2(4)0.05=9.49,χ2(5)0.05=11.10;F (3.99)0.05=2.70,F (4.99)0.05=2.46,F (5.99)0.05=2.30]。
(2)就本选拔性测验的目的而言,工作能力分数中无法解释的误差变异所占的比例是多少?(3)如果学生甲的选拔性测验分数为71.60,则该学生的百分等级是多少?(4)如果回归方程为Y ∧=a +bx ,其中a =100,请预测学生甲的工作能力分数。
张厚粲《现代心理与教育统计学》(第4版)章节题库-相关关系(圣才出品)
第5章相关关系一、单项选择题1.现有8名面试官对25名求职者的面试过程做等级评定,为了解这8位面试官的评价一致性程度,最适宜的统计方法是求()。
A.Spearman相关系数B.积差相关系数C.肯德尔和谐系数D.点二列相关系数【答案】C【解析】肯德尔和谐系数,又称肯德尔W系数,是表示多列等级变量相关程度的一种方法,适用于两列以上的等级变量。
肯德尔和谐系数常用符号W表示。
计算肯德尔和谐系数,原始数据资料的获得一般采用等级评定法,即让K个被试(或称评价者)对N件事物或N种作品进行等级评定,每个评价者都能对N件事物(或作品)的好坏、优劣、喜好、大小、高低等排出一个等级顺序。
2.以下几个点二列相关系数的值,相关程度最高的是()。
A.0.8B.0.1C.-0.9D.-0.5【答案】C【解析】相关系数取值的大小表示相关的强弱程度。
如果相关系数的绝对值在1.00与0之间,则表示不同程度的相关。
绝对值接近1.00端,一般为相关程度密切;接近0值端,一般为关系不够密切。
3.A、B两变量线性相关,变量A为符合正态分布的等距变量,变量B也符合正态分布且被人为划分为两个类别,计算它们的相关系数应采用()。
A.积差相关系数B.点二列相关C.二列相关D.肯德尔和谐系数【答案】C【解析】二列相关适用的资料是两列数据均属于正态分布,其中一列变量为等距或等比的测量数据,另一列变量为人为划分的二分变量。
例如,在一个测验中,测验成绩常常会划分为及格和不及格,人的健康状态分为健康与不健康两类,平时的学习成绩依一定标准将其划分为好、差两类等。
4.假设两变量线性相关,两变量是等距或等比的数据,但不呈正态分布,计算它们的相关系数时应选用()。
A.积差相关B.斯皮尔曼等级相关C.二列相关D.点二列相关【答案】B【解析】斯皮尔曼等级相关适用于只有两列变量,而且是属于等级变量性质的具有线性关系的资料,主要用于解决称名数据和顺序数据的相关问题。
对于属于等距或等比性质的连续变量数据,若按其取值大小,赋予等级顺序,转换为顺序变量数据,亦可计算等级相关,此时不必考虑分数分布是否是正态。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第12章线性回归
1.线性回归的基本假设是什么?
答:(1)线性关系假设
X与Y在总体上具有线性关系,这是一条最基本的假设。
回归分析必须建立在变量之间具有线性关系的假设成立上。
如果X与Y的真正关系不是线性,而回归方程又是按线性关系建立的,这个回归方程就没有什么意义了。
非线性的变量关系,需使用非线性模型。
(2)正态性假设
正态性的假设系指回归分析中的Y服从正态分布。
(3)独立性假设
①指与某一个X值对应的一组Y值和与另一个X值对应的一组Y值之间没有关系,彼此独立。
②指误差项独立,不同的X所产生的误差之间应相互独立,无自相关,而误差项也需与自变量X相互独立。
(4)误差等分散性假设
误差等分散性是指特定X水平的误差,除了应呈随机化的常态分配,其变异量也应相等。
不相等的误差变异量(即误差变异歧异性),反应出不同水平的X与Y的关系不同,不应以单一的回归方程式去预测Y。
当研究资料具有极端值存在时,或非线性关系存在时,误差变异歧异性的问题就容易出现。
违反假设时,对于参数的估计检验力就会变得不足。
2.回归分析与相关分析的区别和联系是什么?
答:(1)联系
它们通常都是基于两正态连续变量的假设,都是处理两变量间相互关系的统计方法,通常两种方法不同时出现在文章中。
(2)区别
①作为相互关系分析的方法,相关分析是通过提供一个相关系数来考察两变量间的联系程度,而回归分析则是重在建立两变量间的函数关系式,因此通常可以先考察相关系数的显著性,如果显著则可以进一步考虑建立变量间的回归方程。
②相关分析和回归分析各有一些具体方法用于处理不同的情况,如相关分析还包括等级相关、质量相关和品质相关,回归分析还包括非线性回归等。
3.解释回归系数。
答:在回归方程式Y∧=a+bX中常数b称为Y对X的回归系数,表示该直线的斜率,实际上也是Y∧的变化率,它表示当X增加1个单位时Y的平均增加或减少的数量,即当X 变化一个单位时,Y∧将变化b个单位。
4.利用下面的数据建立英语对语文的线性回归方程,并对方程进行检验,根据所建方程,若某学生语文40分,则其英语成绩的0.95预测区间是多少?
答:(1)建立回归方程
经计算X_=41,Y_=46.5,s X=25.48,s Y=19.88。
设Y∧=a+bX,
2
()()38600.595()6490YX
X X Y Y b X X --===-∑∑ a =Y _―bX _=46.5-(
3860/6490)×41=22.115 则回归方程为Y ∧=22.115+0.595X 。
(2)对回归方程进行检验
样本误差的标准差为
(
3548.6614.393
YX s =
+
+-==
回归系数的标准误
0.179b SE === 00.595 3.320.179
b b t SE -=== 查t 分布表,t 0.05/2(8)=2.306,t >t 0.05/2,说明回归系数0.595是显著的。
(3)误差的标准差为
02ˆ)(()114.3915.098
P YX Y Y X X s s --==⨯= 查表,得t 0.05/2(8)=2.306,
因此与X =40对应的Y 0的0.95的置信区间为:45.93±2.306×15.098,即11.099~80.731。
综上,语文成绩为40分的学生,其英语成绩0.95的置信区间为11.099~80.731。
5.某研究所10名学生研习某教授的高级统计课程,期中与期末考试成绩见下表。
请问该教授是否可以利用期中考试成绩来预测期末考试成绩?
答:(1)建立回归方程
经计算X _=79.8,Y _=84.2,S X =8.75,S Y =4.52。
设Y ∧=a +bX , 2()()286.40.415()689.6YX
X X Y Y b X X --===-∑∑ a
=Y _―bX _=84.2-0.415×79.8=51.058
则回归方程为Y ∧
=51.058+0.415X 。
(2)对回归方程进行检验
22()183.60T Y SS Y N =-=∑∑
222()118.946R X SS b X N ⎡⎤=-=⎢⎥⎣
⎦∑∑ SS E =SS T -SS R =64.654
df R =1
118.946R R R
SS MS df == df E =N -2=8
8.082E E E
SS MS df == 14.72R E
MS F MS == 查F 表,F 0.01(1,8
)=5.32,F >F 0.05(1,8)。
方差分析表如下:
*表示在0.05水平是上差异具有统计学意义。
所以所建立的回归方程是有效的,即教授可以用期中成绩预测期末成绩。