教育统计学试题库
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
教育统计学
一、选择题
1、当一组数据用中位数来反映集中趋势时,这组数据最好用哪种统计量来表示离散程度?( B )
A.全距 (差异量)
B.四分位距(差异量)
C.方差(差异量)
D.标准差(差异量)
2、总体不呈正态分布,从该总体中随机抽取容量为1000的一切可能样本的平均数的分布接近于:( D )
A. 二项分布
B.F分布
C. t分布
D.正态分布
3、检验某个频数分布是否服从正态分布时需采用:( C )
A.Z检验
B. t检验
C.χ2 检验
D. F检验
4、对两组平均数进行差异的显着性检验时,在下面哪种
情况下不需要进行方差齐性检验?( B )
A.两个独立样本的容量相等且小于30;
B.两个独立样本的容量相等且大于30;
C.两个独立样本的容量不等,n1小于30,n2大于30;
D.两个独立样本的容量不等,n1大于30,n2小于30。
5、下列说法中哪一个是正确的?( C )
A.若r1=0.40,r2=0.20,那么r1就是r2的2倍;
B.如果r=0.80,那么就表明两个变量之间的关联程度达到80%;
C.相关系数不可能是2;
D.相关系数不可能是-1。
6、当两列变量均为二分变量时,应计算哪一种相关?( B )
A.积差相关(两个连续型变量)
B.φ相关
C.点二列相关(一个是连续型变量,另一个是真正的二分名义变量)
D.二列相关(两个连续型变量,其中之一被人为地划分成二分变量。
)
7、对多组平均数的差异进行显着性检验时需计算:( A )
A.F值
B. t值
C.χ2 值
D.Z值
8、比较不同单位资料的差异程度,可以采用何种差异量?( A )
A.差异系数
B.方差
C.全距
D.标准差
二、名词解释
1.分层抽样:按与研究内容有关的因素或指标先将总体划分成几个部分,然后从各部分(即各层)中进行单纯随机抽样或机械抽样,这种抽样方法称为分层抽样。
2.描述统计:对已获得的数据进行整理、概括,显现其分布特征的统计方法称为描述统计。
3.集中量:集中量是代表一组数据典型水平或集中趋势的量。
它能反映频数分布中大量数据向某一点集中的情况。
4.统计表:统计表是用来表达统计指标与被说明的事物之间数量关系的表格。
5.总体:总体是我们所研究的具有某种共同特性的个体的总和。
样本是从总体中抽出的作为观察对象的一部分个体。
6.二列相关:当两个变量都是正态连续变量,其中一个变量被人为的划分为二分变量,表示这两个变量之间的相关,称为二列相关。
7.参数:总体上的各种数字特征是参数。
业绩反映总体上各种特征的数量是参数。
8.小概率事件:样本统计量(随机事件)在其抽样分布上出现的概率小于或等于事先规定的水平,则该事件为小概率事件。
9.中位数:在一组安大小顺序排列的数据中,位于中央位置上的那个数称为中为数。
10.统计量和参数:样本上的数字特征量是统计量。
总体上的各种数字特征量是参数。
11.回归分析:把存在相关的两个变量,一个作为自变量,另一个作为因变量,并建立方程式,由自变量的值估计、预测因变量的值,这一过程称为回归分析。
12.相关关系:两个变量间的不精确、不稳定的变化关系称为相关关系。
三、填空题
1.从变化方向上看,两个变量之间的相关类型有正相关、负相关、零相关。
2.教育统计资料的来源有两个方面:经常性资料、专题性资料。
3.表示间断变量的统计图有直条图和圆形图。
4.假设检验一般有两个相互对立的假设,即零假设和备择假设。
5.统计图的结构一般包括标题、图号、标目、图形、图注等。
6.差异系数是标准差与平均数的百分比。
7.统计数据按来源方式可分为点计数据和测量数据。
8.统计表一般由标题、表号、标目、线条、数字和表注等构成。
9.教育统计学的内容一般分为描述统计、推断统计和实验设计三部分。
10.统计学是研究统计原理和方法的科学。
11.我们所研究的具有某种共同特性的个体总和称为总体。
12.一般情况下,大样本是指样本容量超过30 的样本。
13.表示总体的数字特征的特征量称为参数。
14.要了解一组数据的集中趋势,需计算该组数据的集中量。
15. “65、69、72、87、89”这组数据的算术平均数是 76.4 。
16. “78、69、53、77、54”这组数据的中位数是 69 。
17. 6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是145厘米。
18.要了解一组数据的差异程度,需计算该组数据的差异量。
19.有7个学生的语文成绩分别为:80、65、95、70、55、87、69分,他们的全距是40分。
20.若某班学生数学成绩的标准差是5分,平均分是85分,其差异系数是5.88% 。
21.比较某班学生在身高和体重两方面的差异程度,要把学生身高和体重的标准差转化为差异系数。
22.两个变量之间不精确、不稳定的变化关系称为相关关系。
23.要描述两个变量之间变化方向及密切程度,需要计算相关系数。
24.若两个变量之间存在正相关,则它们的相关系数是正数。
25.若两个变量之间的相关系数是负数,则它们之间存在负相关。
26.质与量的相关分析的方法主要包括二列相关、点二列相关和多系列相关。
27.品质相关的分析方法包括四分相关、Φ相关和列联相关。
28.某班50个学生中有30个女生,若随机抽取一个同学,抽到男生的概率是2/5。
29.某一种统计量的概率分布称为抽样分布。
30.平均数差异显着性检验中需要判断两个样本是相关样本还是独立样本。
31.单纯随机抽样能保证抽样的随机性和独立性。
32.χ2检验的数据资料是点计数据。
33.单向表是把实测的点计数据按一种分类标准编制而得的表。
34.单向表χ2检验是对单向表的数据进行χ2检验,即单因素的χ2检验。
35.双向表是把实测的点计数据按两种分类标准编制而得的表。
36.双向表χ2检验是对双向表的数据进行的χ2检验,即双因素的χ2检验。
37.假设检验的方法包括参数检验和非参数检验。
38.符号秩次检验属于非参数检验。
39.标准正态曲线在Z=0处为最高点。
40.直条图是表示间断变量的统计图。
41.直方图是表示连续变量的统计图。
42.教育统计资料的来源主要是经常性资料和专题性资料。
43.教育调查从范围来看,可分为全面调查和非全面调查。
四、简答题
1. 简述积差相关系数的使用条件
答:积差相关系数的使用条件:
(1)两个变量都是由测量获得的连续性数据。
(2)两个变量的总体都呈正态分布,或接近正态分布。
(3)必须是成对数据,而且每对数据之间相互独立。
(4)两个变量之间呈线性关系。
(5)要排除共变因素的影响。
(6)样本容量n≥30.
2. 二列相关使用的条件
答:(1)两个变量都是连续变量,且总体呈正态分布。
(2)两个变量之间是线性关系。
(3)二分变量是人为划分的,其分界点应尽量靠近中值。
(4)样本容量n 应当大于80。
3. 简述Ⅰ型错误α,II型错误β及其控制方法。
答:(1)I型错误:零假设为真而被拒绝所犯的错误。
(2)II型错误:保留了不真实的零假设所犯的错误。
(3)I型错误的控制由检验者选择检验的水平来控制。
(4)II型错误的控制:一是合理安排拒绝区域的位置;二是增大样本容量。
4、制作直方图需要哪些步骤?
答:直方图是连续型变量的频数分布图。
制作直方图需要以下步骤:
(1)作横轴,即把各组的上、下限或组中值按相等的
距离依次画在横轴上。
(2)作纵轴,在纵轴上标明尺度及其单位,以指示频数。
(3)在纵轴上定出各组的高度,并在各组频数高度处画一条横线与各组上、
下限上的两条纵线相交,形成一个矩形。
各矩形组合在一起,即可得到一个直方图。
5、制作频数分布表需要哪些步骤?
答:制作频数分布表一般需要采取以下步骤:
(1)求全距
(2)决定组数和组距
(3)决定组限
(4)登记频数
6、请说出总体平均数显着性检验的基本步骤。
答:(1)提出零假设(样本平均数等于总体平均数)和备择假设(样本平均数不等于总体平均数)。
(2)选择检验的统计量(t或Z),并计算其值。
(3)确定检验形式(单侧检验,还是双侧检验)。
(4)做出拒绝或接受零假设的统计决断。
7、简述教育统计学的研究对象和内容。
答:教育统计学的主要任务是研究如何搜集、整理、分析有关教育研究和教育实践工作中的数字资料,并以此为依据进行科学推断,揭示教育现象所蕴涵的客观规律。
教育统计学的主要内容包括描述统计、推断统计和实验设计。
8、学习教育统计学有哪些意义?
答:⑴教育统计学为科学研究提供了科学方法。
⑵教育统计学是教育科研定量分析的重要工具。
⑶教育统计学的方法可用于教育实践工作和有关课程的学习中。
9、数据有哪些种类?
答:根据来源可分为:⑴点计数据:计算个数所获得的数据。
⑵测量数据:用一定的工具或标准测量所获得的数据。
根据随机变量取值情况可分为:⑴间断变量的数据:取值个数有限的数据。
⑵连续变量的数据:取值个数无限的数据。
10、编制统计表有哪些注意事项?
答:统计表由标题、表号、标目、线条、数字、表注等项目构成。
各个部分都有一些规范性的具体要求,例如,标题要写在表的上方等。
11、简述统计图的基本结构和绘制规则。
答:统计图由标题、图号、标目、图形、图注等项目构成。
在绘制统计图时对各组成部分有一些具体的要求,例如,标题要写在图的下方等。
对于具体的统计图又有特殊的制作要求。
12、比较集中量和差异量的含义和用途。
答:集中量是代表一组数据典型水平或集中趋势的一类特征量。
它能反映一组数据的分布中大量数据向某一点集中的情况。
我们可以通过计算所搜集数据的集中量来反映变量分布的集中趋势,说明所研究对象整体的发展水平和效果。
差异量是表示一组数据变异程度或离散程度的一类特征量。
我们可以通过计算所搜集数据的差异量来反映数据分布的离散程度,差异量越大,说明数据分布的范围越广,分布越不整齐;差异量越小,说明数据变动范围越小,分布就越集中。
13、结合实例说明推断统计包含的内容。
答:推断统计包括参数估计和假设检验。
参数估计是根据样本统计量对相应
的总体参数进行的估计。
分为点估计和区间估计。
假设检验是根据一定概率,利用样本信息对总体参数或分布的某一假设作出拒绝或保留的决断。
14、简述符号检验的含义和用途。
答:符号检验是以正负号作为检验资料的统计检验方法,是通过对两个相关样本的每对数据之差的符号(正号或负号)进行检验,以比较这两个样本差异的显着性。
适用于两个相关样本的差异检验。
在符号检验中,只考虑两个相关样本每对数据之差的符号即方向,不考虑差异的大小。
15、简述秩和检验的含义和用途。
答:秩和是秩次的和或者等级之和。
秩和检验是以秩和为检验资料的检验方法。
秩和检验是对两个独立样本的差异进行检验的方法。
五、计算题
1、请计算下列数据的平均数和标准差。
9,3,7,5,6,8,7,5,8,9,4,6,5,6,8,7,4,10。
解:根据平均数和标准差的计算公式,得
2、请计算下列数据的中位数和标准差。
11,11,11,15,14,13,13,9,17,
10,10,10,12,12,12,8,8,9。
解:根据中位数的计算方法,先对数据进行从小到大排序:
8,8,9,9,10,10,10,11,11,11,
12,12,12,13,13,14,15,17。
Md=(11+11)/2=11
根据标准差的计算公式,得
3、请计算下面这组数据的中位数。
7,3,2,9,4,4,
7,8,9,5。
解:中位数=(5+7)/2=6 =Md
4、调查者对68名小学生提出的问题是:“你喜欢上学吗?”样本按年级分成高低二组,高年级组有38人,低年级组有30人。
两组人对该问题答“喜欢”的数目分别为17和23,问对该问题的回答是否与小学生的年级有关? 解:(1)、提出假设
对该问题的回答与被访问者的年级无关
对该问题的回答与被访问者的年级有关
(2)、计算χ2值
5、调查者对106名小学生提出的问题是:“你喜欢你的班主任吗?”对该问题答“喜欢”、“无所谓”、“不喜欢”的人数分别为57、29和20,问小学生对班主任的态度是否有显着差异?
解:(1)、提出假设
H0: 小学生对班主任的态度没有显着差异
H1: 小学生对上班主任的态度有显着差异
(2)、计算?2值
因为ft=106?3=35.33
所以,
6、某年级对三个班进行了语文统一测验,一班共40人,平均分是80.2分;二班共32人,平均分是72.6分;三班共36人,平均分是75分。
全年级的平均分是多少? t t f f f 2
02)(-∑
=χ
解:
答:全年级的平均分是76.2分。
7、学生的期中和期末成绩在学期总平均分中各占40%和60%,某学生期中成绩是85分,期末成绩是80分,这个学生的学期总平均分是多少?
8、随机抽取32名男教师和50名女教师进行一项测试,测查结果:男教师的平均分是80分,标准差是8分;女教师的平均分是76分,标准差是10分。
请检验男、女教师的测查结果有无显着性差异。
解:⑴提出假设:
H 0:μ1=μ2 H 1∶μ1≠μ2
⑵计算Z 值:
采用独立大样本Z 检验,计算Z 值的公式如下:
根据公式计算出:Z=2
⑶检验形式:双侧检验
⑷统计决断:1.96<Z=2*<2.58,根据双侧Z 检验的决断规则做出决断:在0.05的显着性水平上拒绝零假设,接受备择假设,即男女教师的测试结果有显着差异。
六、综合题
2.7636
32403675326.72402.80=++⨯+⨯+⨯==∑∑N X N X t ()。
可能相等和分别为两个样本的容量准差;
分别表示两个样本的标均数;
分别表示两个样本的平,在式中,212121212
2212
12
1,,n n n n X X n n X X Z x x x x σσσσ+-=
1、请回答当:
(1)显着性水平取?=0.05时哪些变量间彼此相关?
(2)显着性水平取?=0.01时哪些变量间彼此相关?
答:当显着性水平取?=0.05时,T1、T2、T3、T4四个变量彼此都相关。
当显着性水平取?=0.01时,T2与T3、T4以及T3与T4相关。
2、进一步在上述数据文件中将AVG变量的数值变成以优、良、中等、及格和不及格表达的几种成绩,并生成一个新的变量“总评”。
其中:
60以下为:不及格
60到70为:及格
71到80为:中等
81到90为:良好
91及其以上为:优
应该使用什么命令?命令中至少回答什么内容?
答:应选择[Transform][Recode][Into different Variables]命令,并在“Input Variable -> Output”中输入:avg,
在“Output Variable”中输入新的变量名“总评”,然后点击“Change”按钮。
在“Old and New Values”中输入Old Values 的Values 和New Values的Values,通过Add添加到Old --> New:对照表中。
对照关系分别为:
60以下为:不及格
60到70为:及格
71到80为:中等
81到90为:良好
91及其以上为:优
执行OK。
3、将下列20个学生的体育成绩以5分为组距编制一个频数分布表。
答案:
《教育统计学》作业题:(任选十题)
1. 简述积差相关系数的使用条件
2. 二列相关使用的条件
3. 简述Ⅰ型错误α,II型错误β及其控制方法。
4.制作直方图需要哪些步骤?
6.请说出总体平均数显着性检验的基本步骤。
7.简述教育统计学的研究对象和内容。
8.学习教育统计学有哪些意义?
9.数据有哪些种类?
10.编制统计表有哪些注意事项?
11.简述统计图的基本结构和绘制规则。
12.比较集中量和差异量的含义和用途。
13.结合实例说明推断统计包含的内容。
14.简述符号检验的含义和用途。
15.简述秩和检验的含义和用途。