教育统计学考试复习资料

合集下载

《教育统计学》期末复习资料总结

《教育统计学》期末复习资料总结

第十章卡方检验第一节卡方及其分布一.卡方检验的特点卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所做的假设检验,即根据样本的频数分布来推断总体的分布。

它与前面所讲的测量数据的假设检验的不同在于:1.测量数据的假设检验,其数据属于连续变量,而卡方检验的数据属于点计而来的间断变量。

2.测量数据所来自的总体要求呈正态分布,而卡方检验的数据所来自的总体分布是未知的。

3.测量数据的假设检验是对总体参数或几个总体参数之差所进行的假设检验;卡方检验在多数情况下是对总体分布的假设检验。

所以,卡方检验属于自由分布的非参数检验,凡可以应用比率进行检验的资料,都可以用卡方检验。

二.卡方检验统计量1.卡方检验统计量的基本形式为:f0表示实际频数,ft表示理论频数,∑表示总和例题一:从某校随机抽取50个学生,其中男生27人,女生23人,问该校男女生人数是否相同?解:根据男女生人数相同的假设,其理论频数应为50/2=25.于是卡方值就等于各组实际频数和理论频数差的平方与理论频数之比,再求其和。

2.卡方值的特点:可加性;永为正值;值的大小随实际频数与理论频数差的大小而变化(差越小,样本分布与假设理论分布越一致)。

三.的抽样分布一切可能个样本卡方值的频数分布,就形成了一个实验性的卡方抽样分布。

卡方分布的两个特点:呈正偏态,右侧无限延伸,但永不与基线相交;随自由度的变化而形成一簇分布形态。

自由度越小,偏斜度越大,自由度越大,分布形态越趋于对称。

第二节单向表的卡方检验把实得的点计数据按一种分类标准编制成表就是单向表。

卡方检验统计决断原则:一.按一定比率决定理论频数的卡方检验二.一个自由度的卡方检验1.各组ft>=5的情况2某组ft<5的情况当df=1,其中只要有一个组的ft<5,就要用亚茨连续性校正法,即在每一组实际频数与理论频数差数的绝对值平方之前,各减去0.5。

即三.频数分布正态性的卡方检验检验步骤:提出假设计算卡方值统计决断第三节双向表的卡方检验(双因素的卡方检验)把实得的点计数据按两种分类标准编制成的表就是双向表。

教育统计学复习资料

教育统计学复习资料

教育统计学复习资料(第一、二章)第一章1. 教育统计学是运用树立统计原理和方法研究教育问题的一门应用科学。

2. 教育统计学的研究任务是:研究如何搜集、整理、分析由教育调查和教育实验等途径所获得的数字资料,并以此为依据进行科学推断,从而揭示蕴含在教育现象中的客观规律。

3. 教育统计学的主要内容:(1)描述统计:对已经获得的数据进行整理、概括,显现出其分布特征(2)推断统计:根据样本所提供的信息,运用概率的理论进行分析、论证,在一定程度上对总体分布特征进行估计、推测。

(3)实验设计:实验者为了揭示试验中自变量和因变量之间的关系,在实验之前所制订的试验计划,成为实验设计。

4. 学习教育统计学的意义:教育统计学是对教育问题进行定量分析的重要科学工具,学习教育统计学具有重要的实际意义:(1)可以顺利的阅读和运用统计方法进行定量分析的科研报告和文献,从中可以间接地学习国内外先进的科研成果,即提高科学思维水平。

(2)可以提高教育工作的科学性和效率,有利于进行科学研究;(3)为学习教育测量和教育评价打下基础。

5.相关概念:(1)随机变量:能表示随机现象各种结果的变量;(2)总体:是指我们研究的具有某种共同特征的个体的总和;样本:是指从总体中抽取的作为观察对象的一部分个体;(3)统计量与参数:统计量是样本上的数字特征,而参数是总体上的各种数字特征。

第二章数据的初步整理(说明:搜集数字资料是统计工作的第一步)一、资料1.经常性资料:日常工作中文字记载的资料,如日常工作记录,统计报表等;方面有关客观事实的观察、分析。

包括现情调查回顾调查追踪调查进行的观察和分析。

包括单组实验(对同一组实验对象先后实行两种实验处理)等组实验轮组实验二、数据(随机变量的观察值)用来描述对客观事物观察测量结果的数值点计数据:计算个数所获得的数据 度量数据:用一定的工具或一定的标准测量所获得的数据间断型随机变量的数据(取值个数有限)连续型随机变量的数据(取值格式无限)三、统计表(用来表达统计指标与被说明的事物之间数量关系的表格,以便数据的分析、比较、计算、记忆。

现代心理与教育统计学复习资料

现代心理与教育统计学复习资料

现代心理与教育统计学复习资料第一章心理与教育统计学基础知识1、数据类型称名数据计数数据离散型数据顺序数据等距数据测量数据连续型数据比率数据2、变量、随机变量、观测值变量就是可以挑相同值的量。

统计数据观测的指标都就是具备变异的指标。

当我们用一个量则表示这个指标的观测结果时,这个指标就是一个变量。

用来表示随机现象的变量,称为随机变量。

一般用大写的x或y表示随机变量。

随机变量所取得的值,称为观测值。

一个随机变量可以有许多个观测值。

3、总体、个体和样本须要研究的同质对象的全体,称作总体。

每一个具体内容研究对象,称作一个个体。

从总体中抽出的用以推测总体的部分对象的集合称为样本。

样本中包含的个体数,称为样本的容量n。

通常把容量n≥30的样本称作大样本;而n<30的样本称作大样本。

4、统计数据量和参数统计数据指标平均数标准差相关系数回归系数统计数据量srb参数μσρβ5、统计误差误差就是测量得值与真值之间的差值。

测出数值=真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。

由于采用的仪器、测量方法、读数方法等问题导致的测出值与真值之间的误差,称作测量误差。

由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差第二章统计图表一、数据的整理在展开整理时,如果没充裕的理由证明某数据就是由实验中的过错导致的,就无法轻而易举将其确定。

对于个别极端数据与否该剔出,应当遵从三个标准差法则。

二、次数原产表中(一)简单次(频)数分布表(二)相对次数分布表将次数原产表各组的实际次数转变为相对次数,即为用频数比率(f/n)或百分比f)去则表示次数,就可以做成相对次数原产表中(?100%n(三)累加次数分布表(四)双列次数分布表双列次数原产表中又称有关次数原产表中,就是对存有联系的两列变量用同一个表中则表示其次数原产。

所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。

北师大教育统计学期末复习

北师大教育统计学期末复习

教育统计学期末复习1.统计学分为数理统计学和应用统计学,教育统计学是运用数理统计的原理和方法研究教育问题的一门应用科学。

描述性统计和推断性统计(估计和假设检验)2.随机现象的每一种结果叫做一个随机事件,能表示随机现象各种结果的变量称为随机变量,统计处理的变量都是随机变量。

第二章数据的初步整理一、数据的来源、种类及其统计分类(一)来源1.经常性资料:文字记载的资料2.专题性资料①教育调查:在没有预定因子、不施行控制的条件下,对现成的教育方面有关客观事实所进行的观察和分析。

分为:现情调查、回顾调查和追踪调查或全面调查和非全面调查②教育实验:在预定的控制因子影响下,对教育方面有关客观事实所进行的观察和分析。

一般设立两种实验处理进行对照和比较:单组实验(看两种形式对结果的影响)、等组实验(甲乙两组基本条件相同的情况下,对之施行不同的实验处理)和轮组实验(在实验组和对照组分别进行两种实验处理,并且每种处理各重复一次:甲组实验先A后B,重复为先B后A;乙组实验先B后A,重复先A后B)(二)种类1.变量①定类(称名)变量:如性别、专业②定序(顺序)变量(无相等单位和绝对零点):1级、2级、三级③定距(等距)变量(有相等单位无绝对零点):摄氏温度④定比(比率)变量(有相等单位有绝对零点):身高、体重2.数据①点计:人数、物品个数。

度量:用工具得到的数据②间断型随机变量数据(类别数据,人数、等级),连续型随机变量数据(数据可以用小数表示,连续区间)3.统计量与参数(统计量:在统计工作中,对一系列原始数据进行计算,得出的平均数,标准差)参数(由样本估计总体的水平)二、统计图表1.统计表一般由标题、表号、题目、线段、数字(暂缺或未记录…表示,无用—表示)、表注构成表2.12 师大附小和云岭小学二年级学生身高的频数百分比分布表2.统计图标题、图号、标目、图形、图注①表示间断变量:直条图(纵条图和横条图)、圆形图②表示连续变量:线形图、频数分布图(直方、多边、累积频数和累积百分比图)三、抽样为了使统计推断正确可靠,就应当使样本对于总体有较好的代表性,这就引伸出抽样的问题:抽样方法:1.单纯随机抽样:抽签,等概率,一般来说要放回,但无限总体放回与不放回不改变2.机械抽样:从总体中抽取样本时,按照时间或空间的等距间隔抽取,可与单纯随机抽样结合起来(前20人中选任一个,再从下一个20人中任选一个)3.分层抽样:分组后单纯随机抽样4.整群抽样:如要调查北京市五年级小学生患近视眼的情况,不是个别地抽取每个学生,而是按照学校来抽样,然后对抽取到的学校中的每个五年级小学生进行检查。

教育统计学复习题纲

教育统计学复习题纲

教育统计学复习题纲1.教育统计学的内容包括( )A.数理统计和推断统计B.描述统计和推断统计C.应用统计和参数估计D.描述统计和参数估计2.教育统计的内容除推断统计外,还包括()A.差异检验B.数据统计C.标准分数D.描述统计3.学习教育统计与测量对教育工作者十分重要,它是()A.教育研究的重要方法与工具B.测量的重要方法与工具C.写文章的重要方法D.教学的重要手段4.对大量数据资料进行整理、简缩、概括,从而使其分布的特征显现出来的工作,属于()A、描述统计B、推断统计5.研究如何由对局部的观察结果去把握总体的真实情况,这样的工作,属于()A、描述统计B、推断统计C、实验设计D、测量学问题6.教育统计就是要由样本来推断总体,这说明教育统计具有()特点A、统一性B、总体性C、归纳性D、或然性7.统计学方法的核心任务是()A、描述统计B、推断统计C、实验设计D、实验处理8.属于计数数据的是()A、本次考试排名,甲为9,乙为16B、投票中赞成人数为14,反对人数为27C、学生身高甲是136厘米,乙是141厘米D、0表示男,1表示女9.日常生活或生产中使用的温度计所测出的气温量值是()A、顺序数据B、等距数据C、比率数据D、类别数据10下列数据中,运算结果只是反映位次顺序关系的是()A.称名变量数据B.顺序变量数据C.等距变量数据D.比率变量数据11下列不属于...数据的特点的是()A.离散性B.顺序性C.变异性D.规律性12.在某个语文测验分数分布表中,“70~75”这一组的累积次数是30,这表示:()A.70分以下有30人B.70分以上有30人C.75分以下有30人D.75分以上有30人13.在某个拼写测验分数分布表中,“80~90”这一组的累积百分数为76,这表示()。

A.80分以上的考生人数占76% B.80分以上的考生人数占24%C.90分以上的考生人数占76% D.90分以上的考生人数占24%14.当我们需要用图形按学生的家庭出身(包括工人、农民、干部及其他)及性别来描述学生情况时最好采用()。

2023年高等教师资格证《教育统计学》复习重点(附答案)

2023年高等教师资格证《教育统计学》复习重点(附答案)

2023年高等教师资格证《教育统计学》
复习重点(附答案)
本文档旨在提供2023年高等教师资格证《教育统计学》的复重点和相应答案。

以下是复的重点内容:
描述统计学
- 数据类型:定类、定序、定距、定比
- 散布程度:极差、方差、标准差、百分位数、四分位数
- 数据的图示方法:条形图、饼图、帕累托图、折线图、散点图、箱线图
- 集中趋势:平均数、中位数、众数
- 偏度和峰度:正态分布、偏态分布、峰态分布
统计推断
- 总体和样本:总体参数、样本容量、样本标本差
- 抽样方法:无偏性、代表性、随机性
- 点估计:样本均值、样本比例、样本方差
- 区间估计:置信水平、置信区间估计
- 假设检验:零假设、备择假设、显著性水平
- 单样本均值检验:t检验、z检验
- 双样本均值检验:t检验、z检验
- 单样本比例检验:正态近似法、精确法
- 双样本比例检验:正态近似法、精确法
- 方差分析:单因素、双因素、方差齐性、方差不齐性
- 相关分析:相关系数、回归方程、显著性检验
教育统计分析方法
- 教育统计学基本概念
- 教育调查研究方法
- 教育测量与考评方法
- 教育统计分析软件使用
以上内容为复的重点,希望能对您的复有所帮助。

祝您考试顺利!
附答案,请根据复的内容自行查阅教材或相关资料。

请注意,本文档仅提供了复习的重点,具体细节仍需参考教材和教师的指导。

山东省考研教育学复习资料教育统计学重点知识点梳理

山东省考研教育学复习资料教育统计学重点知识点梳理

山东省考研教育学复习资料教育统计学重点知识点梳理教育统计学是教育学中的一门重要学科,它通过收集、整理、分析和解释教育相关的定量数据,帮助教育工作者深入了解教育现象,做出科学决策。

在山东省考研教育学中,教育统计学是一个重要的考察内容,掌握教育统计学的基本概念、方法和技巧,对于提高考生的综合素质和解题能力具有重要意义。

本文将针对山东省考研教育学中教育统计学的重点知识点进行梳理和总结,以帮助考生更好地复习备考。

一、教育统计学的基本概念及作用教育统计学是以收集、整理和分析教育数据为基础,研究教育现象的一门学科。

其基本概念包括以下几个方面:1. 教育统计学的定义:教育统计学是利用统计学原理和方法,对教育数据进行收集、整理、分析和解释的科学。

2. 教育统计数据的特点:教育统计数据具有客观性、数量性、综合性和时效性等特点,为教育研究提供了重要的依据和参考。

3. 教育统计学的作用:教育统计学可以帮助教育工作者了解教育现象、优化教育政策、评估教育质量、预测教育发展趋势等,对于改进教育工作具有重要的指导作用。

二、教育统计学的数据收集方法教育统计学的数据收集是指通过各种方式和途径,获取教育数据的过程。

常用的数据收集方法包括:1. 问卷调查法:通过设计问卷,向被调查对象发放,并收集回收到的问卷。

问卷调查法可以用于了解教师、学生、家长等不同群体的教育需求和意见。

2. 访谈法:通过面对面或电话等方式,访谈对象了解其对教育问题的看法。

访谈法可以深入了解被访者的思想、观点和情感,帮助研究者获取更多的细节信息。

3. 观察法:通过实地观察教室、学校等教育场所,记录和分析教育活动和事件。

观察法可以直接观察到教育过程中的细节,并提供客观的数据基础。

4. 文献研究法:通过阅读、分析和综合已有的文献资料,获取相关的教育数据。

文献研究法可以帮助研究者了解过去的研究成果和现有的理论观点,为研究提供理论依据。

三、教育统计学的数据分析方法教育统计学的数据分析是指对收集到的教育数据进行整理、分析和解释的过程。

教育统计学复习资料

教育统计学复习资料

教育统计学复习资料一.单选题1、当一组数据用中位数来反映集中趋势时,这组数据最好用哪种统计量来表示离散程度?( B )A.全距(差异量)B.四分位距(差异量)C.方差(差异量)D.标准差(差异量)2、总体不呈正态分布,从该总体中随机抽取容量为1000的一切可能样本的平均数的分布接近于:( D )A. 二项分布B.F分布C. t分布D.正态分布3、检验某个频数分布是否服从正态分布时需采用:( C )A.Z检验B. t检验C.χ2 检验D. F检验4、对两组平均数进行差异的显著性检验时,在下面哪种情况下不需要进行方差齐性检验?( B )A.两个独立样本的容量相等且小于30;B.两个独立样本的容量相等且大于30;C.两个独立样本的容量不等,n1小于30,n2大于30;D.两个独立样本的容量不等,n1大于30,n2小于30。

5、下列说法中哪一个是正确的?( C )A.若r1=0.40,r2=0.20,那么r1就是r2的2倍;B.如果r=0.80,那么就表明两个变量之间的关联程度达到80%;C.相关系数不可能是2;D.相关系数不可能是-1。

6、当两列变量均为二分变量时,应计算哪一种相关?( B )A.积差相关(两个连续型变量)B.φ相关C.点二列相关(一个是连续型变量,另一个是真正的二分名义变量)D.二列相关(两个连续型变量,其中之一被人为地划分成二分变量。

)7、对多组平均数的差异进行显著性检验时需计算:( A )A.F值B. t值C.χ2 值D.Z值8、比较不同单位资料的差异程度,可以采用何种差异量?( A )A.差异系数B.方差C.全距D.标准差9.下列变量中属于离散变量的是:( C )A 身高B 体重C 人数D 利润10.某班主任想了解本班学生月生活费支出的内容,用抽签形式抽取本班10名同学进行调查。

这种调查方式属于:( B )A 典型调查B 抽样调查C 统计报表制度D 重点调查11.2009年某市生产总值7450.27亿元,按可比价格计算,比上年增长13.6%,达到自1996年以来的最高水平。

现代心理与教育统计学复习资料

现代心理与教育统计学复习资料

现代⼼理与教育统计学复习资料第⼀章⼼理与教育统计学基础知识1、数据类型称名数据计数数据离散型数据顺序数据等距数据测量数据连续型数据⽐率数据2、变量、随机变量、观测值变量是可以取不同值的量。

统计观察的指标都是具有变异的指标。

当我们⽤⼀个量表⽰这个指标的观察结果时,这个指标是⼀个变量。

⽤来表⽰随机现象的变量,称为随机变量。

⼀般⽤⼤写的X或Y表⽰随机变量。

随机变量所取得的值,称为观测值。

⼀个随机变量可以有许多个观测值。

3、总体、个体和样本需要研究的同质对象的全体,称为总体。

每⼀个具体研究对象,称为⼀个个体。

从总体中抽出的⽤以推测总体的部分对象的集合称为样本。

样本中包含的个体数,称为样本的容量n。

⼀般把容量n ≥30的样本称为⼤样本;⽽n <30的样本称为⼩样本。

5、统计误差误差是测得值与真值之间的差值。

测得值=真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。

由于使⽤的仪器、测量⽅法、读数⽅法等问题造成的测得值与真值之间的误差,称为测量误差。

由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差第⼆章统计图表⼀、数据的整理在进⾏整理时,如果没有充⾜的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。

对于个别极端数据是否该剔除,应遵循三个标准差法则。

⼆、次数分布表(⼀)简单次(频)数分布表(⼆)相对次数分布表将次数分布表中各组的实际次数转化为相对次数,即⽤频数⽐率(f /N )或百分⽐()来表⽰次数,就可以制成相对次数分布表(三)累加次数分布表(四)双列次数分布表双列次数分布表⼜称相关次数分布表,是对有联系的两列变量⽤同⼀个表表⽰其次数分布。

所谓有联系的两列变量,⼀般是指同⼀组被试中每个被试两种⼼理能⼒的分数或两种⼼理特点的指标,或同⼀组被试在两种实验条件下获得的结果。

三、次数分布图使⼀组数据特征更加直观和概括,⽽且还可以对数据的分布情况和变动趋势作粗略的分析。

简单次(频)数分布图——直⽅图、次数多边形图累加次数分布图——累加直⽅图、累加曲线(⼀)简单次数分布图--直⽅图(⼆)简单次数分布图-次数多边图次数分布多边形图(frequency polygon )是⼀种表⽰连续性随机变量次数分布的线形图,属于次数分布图。

教育统计学期末复习题

教育统计学期末复习题

1.教育统计学的研究对象与内容
1.以下是对性开放态度调查的结果。

分数越高,表示对性开放越持支持态度:男性:10, 9,8,8,8,7;女性:5,5,4,4。

请:1)计算性别和对性开放态度的相关系数;2)如果要检验男女性别在对待性开放的态度是否有显著差异,应该使用哪种检验方法?根据前面计算出来的相关系数,应该会得出什么样的结论?3)用该种假设检验的方法验证前面的结论
2.点估计量的评价标准有哪些?
用某一样本统计量的值来估计相应总体参数值的估计方法叫总体参数的点估计。

(1)无偏性。

样本统计量的一切可能值与其总体参数的偏差的平均数为0;(2)一致性。

当样本容量n无限增大时,估计值应能越来越接近它所估计的总体参数。

(3)有效性。

当总体参数的无偏估计不止一个统计量时,某种统计量的一切可能值的方差小者有效性高,方差大者有效性低。

3.两所小学各抽取100名二年级的学生进行了身高测量(单位:厘米),有关的统计结果见下表,试问哪所小学二年级学生的平均身高更具有代表性?。

《教育统计学》复习

《教育统计学》复习

《教育统计学》复习统计与测量复习一、教育统计学的性质、作用及主要内容1、性质(定义):研究如何收集、整理、分析由教育调查和教育实验所获得的数据资料,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。

2、作用:进行教育科学研究的一个定量化工具;是教育科学研究中不可缺少的思想、观念、方法和技术。

3、主要内容:描述统计、推论统计、实验设计二、总体、个体和样本总体:具有某种特征的一类事物的全体。

个体:构成总体的每个基本单元。

样本:从总体当中抽取的,并对总体具有代表性的一部分。

样本的大小称为样本容量n三、误差1、随机误差:由与实验目的无关的偶然因素造成的,且难以控制。

2、系统误差:由于实验目的无关的所引起的有规律性的误差。

3、抽样误差:由抽样而产生的误差。

属于随机误差。

四、统计量与参数统计量:描述样本情况的统计指标。

参数:由样本的统计量去估计、推测相应总体的特征量。

五、数据的特点1、离散性:每一个数据是相互独立、互不关联的。

2、变异性(波动性):总会在一定范围内波动,时大时小,无法预测。

3、规律性:波动变化的数值都会趋于稳定在某一个数值上。

六、编制次数分布表的步骤1、求全距R R = Xmax – Xmin2、确定组数和组距①组数:a、经验法100以内5~10组,100~200以内10~18组b、公式法②组距:a、经验法 2、3、5、10、20b、公式法 i = R / K3、列出分组区间和组限① 列分组区间②组限(精确上下限)4、整理次数5、绘制次数分布表组别|组距(i)|组中值(Xc)|次数(f)|比例|上累加次数比例|累积百分比七、算数平均数、中数、众数的优缺点1、算数平均数优点:反应灵敏、严密确定、简明易懂、计算简便,适合代数运算,受抽样变动的影响较小是总体平均数的最好估计值。

缺点:易受两级端数值的影响;一组数据中某个数值的大小不够确切时就无法计算。

2、中数优点:严密确定、简明易懂、计算简便,少受两级端数值的影响,受抽样变动的影响较小。

教育统计学复习资料

教育统计学复习资料

教育统计学复习资料一.单选题1、当一组数据用中位数来反映集中趋势时,这组数据最好用哪种统计量来表示离散程度( B )A.全距 (差异量)B.四分位距(差异量)C.方差(差异量)D.标准差(差异量)2、总体不呈正态分布,从该总体中随机抽取容量为1000的一切可能样本的平均数的分布接近于:( D )A. 二项分布分布C. t分布D.正态分布3、检验某个频数分布是否服从正态分布时需采用:( C )检验 B. t检验C.χ2 检验D. F检验4、对两组平均数进行差异的显着性检验时,在下面哪种情况下不需要进行方差齐性检验( B )A.两个独立样本的容量相等且小于30;B.两个独立样本的容量相等且大于30;C.两个独立样本的容量不等,n1小于30,n2大于30;D.两个独立样本的容量不等,n1大于30,n2小于30。

5、下列说法中哪一个是正确的( C )A.若r1=,r2=,那么r1就是r2的2倍;B.如果r=,那么就表明两个变量之间的关联程度达到80%;C.相关系数不可能是2;D.相关系数不可能是-1。

6、当两列变量均为二分变量时,应计算哪一种相关( B )A.积差相关(两个连续型变量)B.φ相关C.点二列相关(一个是连续型变量,另一个是真正的二分名义变量)D.二列相关(两个连续型变量,其中之一被人为地划分成二分变量。

)7、对多组平均数的差异进行显着性检验时需计算:( A )值 B. t值C.χ2 值值8、比较不同单位资料的差异程度,可以采用何种差异量( A )A.差异系数B.方差C.全距D.标准差9.下列变量中属于离散变量的是:( C )A 身高B 体重C 人数D 利润10.某班主任想了解本班学生月生活费支出的内容,用抽签形式抽取本班10名同学进行调查。

这种调查方式属于:( B )A 典型调查B 抽样调查C 统计报表制度D 重点调查 11.2009年某市生产总值亿元,按可比价格计算,比上年增长%,达到自1996年以来的最高水平。

教育统计学复习资料

教育统计学复习资料

一、公式(1)算数平均数(2)算数平均数(频数分布计算法)(3)中位数(频数分布计算法)●Lmd表示中位数所在组的下限●n表示总频数●n1表示小于中位数所在组下限的频数总和(4)众数(公式求理论众数的近似值)●fa表示大于众数所在组上限那个相邻组的频数●fb表示小于众数所在组下限那个相邻组的频数(5)加权平均数(6)加权平均数(7)几何平均数(8)调和平均数(9)四分位距(10)平均差(11)平均差(频数分布计算法)(12)方差(13)标准差(14)方差和标准差(频数分布计算法)(15)相对差异量(16)抽样分布1.从总体中随机抽出的容量为n的一切可能样本的平均数2.容量为n的平均数在抽样分布上的标准差等于总体标准差除以n的平方根(17)样本平均数的分布1.当总体标准差已知时,一切可能样本平均数与总体平均数的离差统计量呈标准正态分布。

其估计2.总体标准差未知时的估计。

需用样本标准差估计3.当总体方未知时,需要用估计量S来代替,于是平均数标准误也被SX所代替,这时一切可能样本平均数与总体平均数的离差统计量呈t分布。

●t分布是常用的一种随机变量分布,也称为学生氏分布。

●t分布受自由度(df=n-1,指总体参数估计量中变量值独立自由变化的个数)影响,与总体标准差无关。

(18)总体平均数的估计1.正态分布表,置信区间为2.t值表,置信区间为3.平均数的抽样分布呈正态,总体平均数的置信区间为:(19)总体标准差(σ)未知条件下总体平均数的区间估计1.平均数的抽样分布为t分布,平均数的置信区间为:2.平均数的抽样分布接近于正态分布,用正态分布代替t分布近似处理:(20)平均数显著性检验的几种情形1.总体标准差σ已知的总体平均数的显著性检验平均数的抽样分布服从正态分布,以Z为检验统计量,其计算公式为:2.总体标准差σ未知---小样本情况平均数的抽样分布服从t分布,但由于样本容量较大,平均数的抽样分布接近于正态分布,因此可以用Z代替t近似处理,计算公式为:(21)相关样本平均数之差的标准误(22)独立样本平均数之差的标准误(23)相关样本平均数差异的显著性检验1.在小样本的情况2.在大样本的情况(24)独立样本平均数差异的显著性检验1.独立大样本平均数差异的显著性检验Array2.独立小样本平均数差异的显著性检验1.F分布2.对两总体方差是否齐性进行检验,应选F做检验统计量,其计算公式为二、定义1.方差和标准差的优缺点和应用优点(1)反应灵敏、随任何一个数据的变化而变化;(2)严密确定,一组数据的方差和标准差有确定的数值;(3)适合代数运算;不仅体现在求方差和标准差的过程,而且可以将多个方差和标准差总和成一个方差和标准差;(4)用样本数据推断总体差异量时,方差和标准差是最好的估计量;(5)在避免两极端数值的影响方面,大大优于全距;(6)优于平均差,避免绝对值。

《教育统计学》复习题及答案

《教育统计学》复习题及答案

《教育统计学》复习题及答案一、填空题1.教育统计学的研究对象是.教育问题。

2.一般情况下,大样本是指样本容量.大于30 的样本。

3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。

4.统计工作的三个基本步骤是:、和。

5.集中量数是反映一组数据的趋势的。

6.“65、66、72、83、89”这组数据的算术平均数是。

7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。

8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。

9.参数估计的方法有和两种。

10.若两个变量之间的相关系数是负数,则它们之间存在。

11.统计工作与统计资料的关系是和的关系。

12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。

13.总量指标按其反映的内容不同可以分为和。

二、判断题1、教育统计学属于应用统计学。

()2、标志是说明总体特征的,指标是说明总体单位特征的。

()3、统计数据的真实性是统计工作的生命()4、汉族是一个品质标志。

()5、描述一组数据波动情况的量数称为差异量数。

()6、集中量数反映的是一组数据的集中趋势。

()7、在一个总体中,算术平均数、众数、中位数可能相等。

()8、同一总体各组的结构相对指标数值之和不一定等于100%。

()9、不重复抽样误差一定大于重复抽样误差。

()10. 一致性是用样本统计量估计统计参数时最基本的要求。

()三、选择题1.某班学生的平均年龄为22岁,这里的22岁为( )。

A.指标值B.标志值C.变量值D.数量标志值2.统计调查中,调查标志的承担者是( )。

A.调查对象B.调查单位C.填报单位D.调查表3.统计分组的关键是( )。

A.确定组数和组距B.抓住事物本质C.选择分组标志和划分各组界限D.统计表的形式设计4.下列属于全面调查的有( )。

A.重点调查B.典型调查C.抽样调查D.普查5.统计抽样调查中,样本的取得遵循的原则是( )。

教育统计学硕士考试复习题

教育统计学硕士考试复习题

教育统计学复习题一、问答题什么是描述统计和推断统计?如何理解统计规律为什么要使用抽样推断,而不用全体研究样本容量的大小对统计研究有何影响?变量有哪些种类,各有什么特点,能否相互转换?(按测量尺度——数值变量、定序变量、类别变量;按变量的取值特点——连续变量与离散变量;按数据的获取方式——测量数据与点计数据;)频数分布的作用是什么什么是集中量数,哪些属于集中量数?什么是差异量数,哪些属于差异量数?平均数有哪些特点?什么是百分等级,有什么作用?什么是标准分数,有哪些应用?如何理解两个变量的相关关系,相关关系是与函数关系吗?什么是正相关与负相关积差相关的条件是什么等级相关的条件是什么解释相关系数时要注意什么统计推断的基本问题是什么什么是随机事件与概率概率分布有什么意义什么是正态分布,有什么特点假设检验的思想与步骤什么是原假设和备择假设什么是小概率原理与显著性水平统计假设检验的判断法则是什么χ²检验的概念和思想是什么?什么是适合性检验,其原假设是什么什么是独立性检验,其原假设是什么?二、计算题1.请计算下列数据的平均数和标准差。

6,3,5,8,4,3,7,8,10,6。

2. 以下是36个学生在一次测验中的得分:606265687071717374757576767777777879808080808182828283858586868888888995试以5分为组距制作频数分布表。

3. 某年级甲、乙、丙三个班级学生人数分别为50人、55人、55人。

期末数学考试各班的平均成绩分别为90分、90分、85分,使用加权平均数求全年级学生的平均成绩,并指出丙班的权数和权重。

4. 在一次测验中,全班学生的成绩平均分为90分,标准差为4分。

一名得94分的学生,他的标准分数为多少?另一个标准分数为-2 的学生,他的原始分数为多少?5.下表是甲、乙两个学生三门学科的成绩及该班的平均成绩和标准差。

问甲、乙两生谁考得更好?6. 从某中学二年级学生中随机抽取15人,开学初与学期末测试他们的某项能力,取得的成绩见下表。

教育统计学考试复习资料

教育统计学考试复习资料

第一章:1、何谓心理与教育统计学学习它有何意义教育统计学是专门研究如何运用统计学原理和方法;搜集、整理、分析教育科学研究中获得的随机性数据资料;并根据这些数据资料所传递的信息;进行科学推论找出教育活动规律的一门科学..具体讲;就是在教育研究中;通过调查、实验、测量等手段有意获取一些数据;并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理;最后得出结论的一种研究方法..意义:1统计学为科学研究提供了一种科学方法..2教育统计学是教育科学研究定量分析的重要重要工具..3广大教育工作者学习教育统计学既可以顺利地阅读国内外先进的研究成果;又可以提高工作的科学性和效率;同时也为学习教育测量打下基础..2、教育科学研究数据的特点1教育科学研究数据与结果多用数字形式呈现;2教育科学研究数据具有随机性和变异性;3教育科学研究数据具有规律性;4教育科学研究的目的是通过部分数据来推测总体特征..总之;在教育科学实验或调查中;所获得的数据都具有变异性与规律性的特点..3、思考题:选用统计方法有哪几个步骤①要分析一下实验设计是否合理;即所获得的数据是否适合用统计方法去处理;正确的数量化是应用统计方法的起步;如果对数量化的过程及其意义没有了解;将一些不着边际的数据加以统计处理是毫无意义的.. ②要分析实验数据的类型..不同数据类型所使用的统计方法有很大差别;了解实验数据的类型和水平;对选用恰当的统计方法至关重要.. ③要分析数据的分布规律;如总体方差的情况;确定其是否满足所选用的统计方法的前提条件..4、教育统计学的分类1依研究的问题实质来划分;教育统计学的研究内容可划分为描述一件事物的性质、比较两件事物之间的差异、分析影响事物变化的因素、一件事物两种不同属性之间的相互关系、取样方法等等..2依统计方法的功能进行分类;教育统计学的研究内容可分为描述统计、推论统计和实验设计..5、描述统计:主要研究如何整理科学实验或调查得来的大量数据;描述一组数据的全貌;表达一件事物的性质..具体内容包括:1数据如何分组;如何使用各种统计图表描述一组数据的分布情况;2怎样计算一组数据的特征值;简缩数据;进一步描述一组数据的全貌;3表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件;描述数据分布特征的峰度及偏度系数计算方法等..6、推论统计:主要研究如何通过局部数据所提供的信息;推论总体或称全局的情形..具体内容包括:1如何对假设进行检验;即各种各样的假设检验;包括大样本检验方法z 检验;小样本检验方法t检验;各种计数资料的假设检验的方法百分数检验、χ2检验等;变异数分析的方法F检验;回归分析方法等等..2总体参数的估计方法..3各种非参数的统计方法等..7、思考题:描述统计、推论统计和实验设计这三部分统计内容有何关系教育统计学的三个组成部分的内容不是截然分开的;而是相互联系的..描述统计是推论统计的基础;推论统计离不开描述统计计算所获得的特征值;描述统计只是对数据进行一般的分析归纳;如果不进一步应用推论统计作进一步的分析;描述统计的结果就不会产生更大的价值和意义;达不到统计分析的最终目的要求..同样;只有良好的实验设计才能使所获得的数据具有意义;进一步的统计处理才能说明问题..当然一个好的实验设计;也必须符合基本的统计方法的要求;否则;再好的设计;如果事先没有确定适当的统计方法处理;在处理研究结果时可能会遇到许多麻烦问题..8、教育统计与心理统计的异同相同之处:二者的研究对象都是人;教育现象在很多情况下要通过人的心理现象去观察和分析;统计方法基本相同..不同之处:①在统计方法上:在教育方面的研究中;大样本的统计方法应用较多;而在心理学上小样本的方法较多..②在实验设计的水平上:教育实验中控制因素较难;采用自然实验、准实验设计方式较多;对统计结果的解释需要特别谨慎;而心理学实验则在实验室条件下进行较多;对各种实验变量的控制相对容易;统计处理结果的解释也较易进行..9、数据的类型一从数据的观测方法和来源划分;研究数据可区分为计数数据和测量数据两大类..计数数据是指计算个数的数据;一般属性的调查获得的是此类数据;它具有独立的分类单位;一般都取整数的形式..测量数据是借助于一定的测量工具或一定的测量标准而获得的数据..二根据数据反映的测量水平;可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型..称名数据只说明某一事物与其它事物在属性上的不同或类别上的差异;它具有独立的分类单位;其数值一般都取整数形式;只计算个数;并不说明事物之间差异的大小..顺序数据是指既无相等单位;也无绝对零点的数据;是按事物某种属性的多少或大小;按次序将各个事物加以排列后获得的数据资料..等距数据是具有相等单位;但无绝对零点的数据..比率数据既表明量的大小;也有相等单位;同时还具有绝对零点的数据..三按照数据是否具有连续性;把数据划分为离散数据和连续数据..离散数据一般取整数;在两个单位之间不能再划分细小单位..连续数据的单位可以划得很细微;细微的程度能达到只可想象而不能看见的程度..10、思考题:统计量与参数之间有何区别和联系区别:①参数是从整个总体中计算得到的量数;通常是通过相应样本特征值来预测得到;统计量是从一个样本中计算出来的一些量数;它可以描述一组数据的情况..②参数代表总体的特性;它是一个常数;统计量代表样本的特性;它是一个变量;随着样本的变化而变化..③参数与统计量之间最明显的区别是参数常用希腊字母表示;而统计量常用英文字母表示..联系:从数值计算上讲;当总体大小已知并与实验观测的总次数相同时;统计量与参数是同一统计指标;当总体为无限时;统计量与总体参数不同;但统计量可在某种程度上作为总体参数的估计值..通过样本统计量;对总体参数做出预测和估计..第二章:1、统计分组应注意的事项1统计分组前的准备 ..将数据进行分组前;先要对观测数据做进一步的核对和校验..校核数据的目的是为了尽可能地消去记录误差;以便后续的统计分析建立在一个坚实的基础上..2统计分组时应注意的问题..①分组要以被研究对象的本质特性为基础;②分类标志要明确;要能包括所有的数据..2、分组次数分布表的意义与缺点意义:编制分组次数分布表;可将一堆杂乱无序的数据排列成序..从表中可以发现各个数据的出现次数是多少;其分布的状态如何..缺点:分组次数分布表也有缺点;仅从这张表看;原始数据不见了;只见到各分组区间及各组的次数..根据这样的统计表提供的数据资料计算得到的平均值;会与用原始数据计算的值有一定的出入..3、思考题:直方图、条形图、圆形图、线性图、散点图等这些常用的统计图;根据它们表现的作用和内容;把它们可分为哪几类根据它们表现的作用和内容;把它们可分为五类..第一种是表现分布的图;比如直方图..第二种是表现内容的图;如条形图和圆形图..第三种是表现变化的图;这种图形的代表是线性图..第四种是表现比较的图;这几种图形都能采用..第五种是表现相关的图;如散点图..4、条形图和直方图的区别..1描述的数据类型不同..2表示数据多少的方式不同..3坐标轴上的标尺分点意义不同..4图形直观形状不同..第三章:1、算术平均数的优缺点算术平均数具备一个良好的集中量数所应具备的一些条件:①反应灵敏;②严密确定;③简明易懂;④计算简单;⑤适合代数运算;⑥较少受抽样变动的影响..除此之外;算术平均数还有以下一些特殊的优点:①只知一组观察值的总和及总频数就可以求出算术平均数;②用加权法可以求出几个平均数的总平均数;③用样本数据推断总体集中量数时;算术平均数最接近总体集中量数的真值;它是总体平均数的最好估计值;④在计算方差、标准差、相关系数以及进行统计推断时;都要用到它..缺点:①易受极端数据的影响;②若出现模糊不清的数据时;无法计算平均数..2、算术平均数的意义、适用条件及应用原则意义:算术平均数是应用最普遍的集中量数;它是“真值”渐近、最佳的估计值..适用的条件:一组数据是比较准确;可靠又同质;而且需要每一个数据都加入计算;同时还要作进一步代数运算时;这时就需要用算术平均数表示其集中趋势..原则:①同质性原则;②平均数与个体数值相结合的原则;③平均数与标准差、方差相结合的原则..3、中数适用的情况1当一组观测结果中出现两极端数目时;2当次数分布的两端数据或个别数据不清楚时;3当需要快速估计一组数据的代表值时..4、众数适用的情况1当需要快速而粗略地寻求一组数据的代表值时;2当一组数据出现不同质的情况时;3当次数分布中有两极端的数目时;4当粗略估计次数分布的形态时..第四章:1、思考题:为什么要引入差异量数来描述一组数据的特征在教育研究中;要全面描述数据的特征;不但要了解数据的典型情况;而且还要了解特殊情况..这些特殊性常表现为数据的变异性..因此;只有集中量数不可能真实地反映它们的分布情况..为了全面反映数据的总体情况;除了使用集中量数外;还需要引入差异量数..2、思考题:为什么说标准差是重要而完善的差异量1标准差具有简单明了;反映灵敏;严密确定;容易计算;适合代数运算;受抽样变动的影响较少等优点..2标准差在避免两极端数值影响方面大大超过全距、百分位差和四分位差;在避免绝对值方面;优于平均差;在考虑单位方面;优于方差..3、差异系数的应用1同一团体不同观测值离散程度的比较即不同单位资料差异程度的比较;2对于水平相差较大;但进行的是一种观测的各种团体;进行观测值离散程度的比较即单位相同而平均数相差较大的两组资料差异程度的比较..应用差异系数比较相对差异大小时;应注意以下几点:①测量的数据要保证具有等距尺度;②观测工具应具备绝对零;③差异系数只能用于一般的相对差异量的描述;至今尚无有效的假设检验方法..第五章:1、思考题:如何理解相关系数相关系数是两列变量间相关程度的数字表现形式..对于这一概念;我们可以从以下几个方面来理解:1相关系数的取值在-1.00和+1.00之间;2相关系数的绝对值表示两个变量之间的相关强度;绝对值越接近1表示相关越强;越接近0表示相关越弱;3相关系数的正负号表示相关的方向;相关系数为正的表示正相关;相关系数为负的表示负相关;4相关系数可以比较大小;但不能进行加减乘除运算..2、如何选择合适的相关系数选择计算相关系数的方法主要取决于要处理的数据的性质类别以及某一相关系数需要满足的假设条件..具体来说;为了选择一个合适的相关系数进行相关分析;要分以下几个步骤考虑:1考虑每种测量所产生的数据属于什么类别;测查被试的哪种心理属性;是分类;还是排序;还是评定等级是否给出确定的分数 2要对第一种测量数据和第二种测量数据的类别做出判断..是二分数据、等级数据;还是等距数据 3确定采用哪一种相关系数..3、积差相关的适用资料1要求成对的数据;即若干个体中每个个体都有两种不同的观测值..2计算相关的成对的数据的数目不宜少于30对..3两列变量各自总体的分布都是正态分布;至少两个变量服从的分布是接近正态的单峰分布..4两个相关的变量是连续变量;也即两列数据都是测量数据..5两列变量之间的关系应是直线性的第六章:1、测验分数的正态化步骤如下:1将原始分数整理成次数分布表;2计算各分组上限以下的累加次数cf ;3计算每组中点的累加次数;即前一组上限以下的累加次数加上该组次数的一半;4各组中点以下的累加次数除以总数求累积比率;5将各组中点以下的累积比率视为正态分布的概率;查正态表;将概率转化为Z 分数;6将正态化的Z 值利用公式 T=10Z+50 加以直线转化..2、概率分布的类型1按随机变量是否具有连续性来分类;可分为离散分布与连续分布..2按分布函数的来源来分类;可分为经验分布是指根据观察或实验所获得的数据而编制的次数分布或相对频数分布与理论分布一是指随机变量概率分布的函数—数学模型;二是指按某种数学模型计算出的总体的次数分布..3按概率分布所描述的数据特征来分类;可分为基本随机变量分布与抽样分布..第七章:1、总体参数估计简称参数估计是指根据样本统计量对相应总体参数所作的估计..总体参数估计可分为点估计和区间估计..2、点估计是指用样本统计量的值来估计相应总体参数的值..点估计的优点在于它能够提供总体参数的估计值;缺点在于它总是以误差的存在为前提;但又不能提供正确估计的概率..良好估计量的标准:无偏性、有效性、一致性、充分性区间估计是指以样本统计量的样本分布为理论依据;按一定的概率要求;由样本统计量的值估计总体参数值的所在范围..优点是不仅给出一个估计的范围;是总体参数包含在这个范围之内;而且还能给出估计精度并说明估计结果的有把握的程度..缺点是无法具体指出总体参数等于什么..第八章1、思考题:假设检验这种反证法与一般的数学反证法有什么不同1数学反证法最终推翻假设的依据一定是出现了百分之百的谬误;因此推翻假设的决策无论是决策逻辑还是从决策内容看都是百分之百正确的..而假设检验的反证法最终推翻零假设的依据是一个小概率事件;从决策逻辑角度看是百分之百正确的;但其决策的内容却是有可能出错的..2数学中使用反证法;其最终结果一定是推翻原假设;而假设检验这种反证法的最终结果却有可能无充分理由推翻零假设..2、在统计学中;通过样本统计量得出的差异做出一般性结论;判断总体参数之间是否存在差异;这种推论过程称作假设检验..第九章:1、思考题:为什么不能用t检验对多个平均数的差异进行比较这是因为在假设检验中作统计决策冒有犯错误的风险..在对两个总体平均数作检验时;我们犯拒真错误的概率为α;结论正确的概率为1-α..而在对多个总体平均数作检验时;采用两两比较的方法;比较的次数会随总体的增多而迅速增多;假设共要比N次;那么连续次结论都正确的概率就是1-αN ;结论出错的概率为1-1-αN ;这个值会随着N的增大而迅速增大;这就不符合我们希望在一次检验中犯拒真错误的概率为α的要求了..所以;在对多个平均数作显着性检验时;不能用t检验对多个平均数的差异进行比较..第十一章:1、非参数检验的特点1非参数检验一般不需要严格的前提条件;2非参数检验特别适用于顺序资料等级变量;3非参数检验很适合于小样本;且方法简单;4非参数检验最大的不足是未能充分利用资料的全部信息;5非参数检验目前还不能处理“交互作用”..2、适用资料秩和检验法与参数检验中独立样本的t 检验相对应..当“总体正态”这一前提不成立;不能使用t检验时以秩和检验法代替t 检验..当两个样本都为顺序变量时;也需使用秩和检验法来进行差异检验..中数检验法与秩和检验法的适用条件基本相同;而且在非参数检验法中的地位也同秩和检验法相当;对应着参数检验中两独立样本平均数之差的t 检验..所谓符号检验法是以正负号作为资料的一种非参数方法;它适用于相关样本的差异检验;与参数检验中相关样本差异显着性t 检验相对应..符号检验法也是将中数作为集中趋势的度量;主要用来检验与某些差值的中数有关的零假设..符号等级检验法又称添号秩和检验法;其适条件与符号检验法相同;也适合配对比较;但它的精确度比符号法高..克—瓦氏单向方差分析也称H 检验;作为非参数方法;它与参数方法中的完全随机资料方差分析相对应..弗里德曼双向等级方差分析可解决随机区组实验设计的一些非参数检验问题..适合于配对组随机区组设计的多个样本进行比较..第十二章:1、回归分析与相关分析的区别和联系是什么联系:它们通常都是基于两正态连续变量的假设;都是处理两变量间相互关系的统计方法;通常两种方法不同时出现在文章中..区别:作为相互关系分析的方法;相关分析师通过提供一个相关系数来考察两变量间的联系程度;二回归分析则是重在建立两变量间的函数关系式;因此通常可以先考察相关系数的显着型;如果显着则可以进一步考虑建立变量间的回归方程..此外;相关分析和回归分析又各有一些具体方法用于处理不同的情况;如相关分析还包括等级相关、质量相关和品质相关;回归分析还包括非线性回归等..2、线性回归的基本假设:1线性关系假设2正态性假设3独立性假设4误差等分散性假设3、回归分析与相关分析的综合应用的具体步骤:1将成对资料绘制散点图;从散点图中点子的分布形状判断和是否有线性关系;2建立回归方程;3回归方程显着性检验;4计算回归估计标准误差;5根据建立的回归模型进行预测;估计真值预测区..4、回归分析与相关分析的关系:回归分析和相关分析均为研究及度量两个或两个以上变量之间关系的方法..从广义上说;相关分析包括回归分析;但严格地讲;二者有区别..当旨在分析变量之间关系的密切程度时;一般使用相关系数;这个过程叫相关分析..倘若研究的目的是确定变量之间数量关系的可能形式;找出表达它们之间依存关系的合适的数学模型;并用这个数学模型来表达这种关系形式;则叫做回归分析..第十三章:1、因子分析的类别:1 R型因子分析和Q型因子分析2探索性因子分析与验证性因子分析2、多重回归方程中自变量的选择1最优方程选择法2同时多重回归法3逐步多重回归法4层次多重回归法第十四章:1、思考题:两阶段随机抽样与分层抽样有何区别从形式上看;两阶段抽样与分层抽样似乎都分成两步:第一步将总体分成若干部分;第二步再分别从部分中抽取个体;但二者在第一步中有着根本区别..在分层抽样中;对于每一个部分总体即“层”均需从中抽取个体;因而没有第一阶段样本的问题;而在两阶段抽样中;将总体分成若干个“集团”后;并不是对每一个集团都再进行第二阶段抽样;而是从所有的“集团”中先抽取一部分“集团”;这里实际上进行了第一阶段的抽样;构成了第一阶段样本;然后再对所选“集团”作第二阶段抽样..2、抽样研究的特点和作用1节省人力及费用;2节省时间;提高研究的时效性;3保证研究结果的准确性..3、随机化是抽样研究的基本原则..最主要的抽样方法:简单随机抽样、分层抽样、等距抽样..。

齐鲁师范学院成人高等教育期末考试教育统计学复习资料及参考答案

齐鲁师范学院成人高等教育期末考试教育统计学复习资料及参考答案

教育统计学(1311)复习资料一、单项选择题答题要求:下列各题,只有一个符合题意的正确答案,请选择你认为正确的答案,多选、错选、不选均不得分。

1、A.该生考试成绩为80分B.该生考试成绩为20分C.80%以上高于该生成绩D.80%以下低于该参考答案:D答案解析:无2、一组限为70—80,不属于该组的数据是(考虑精确下限):()A.69.5B.75.5C.79.5D.74.6参考答案:C答案解析:无3、若将某班每个人的语文考试分数都加上5分,那么与原来相比其平均数和标准差的变化是:()A.平均数减少,标准差不变B.平均数增加,标准差增加C.平均数增加,标准差不变D.平均数增加,标准差减少参考答案:C答案解析:无4、常用于描述离散性随机变量统计事项的统计图是()A.条形图B.次数直方图C.次数多边图D.散点图参考答案:A答案解析:无5、日常生活或生产中使用的温度计所测出的气温量值是()A.称名变量数据B.顺序变量数据C.等距变量数据D.比率变量数据参考答案:C答案解析:无6、下列相关系数中,表示两列变量数量变化方向一致的是()A.-0.71B.-0.65C.0.31D.0参考答案:C答案解析:无7、一组数据的标准差为,若每一数据都乘以3,其标准差的变化是:()。

A.B.C.D.以上都不对参考答案:B答案解析:无8、某城市调查8岁儿童的身高情况,所用单位为厘米,根据这批数据计算得出的差异系数()A.单位是厘米B.单位是米C.单位是平方厘米D.无单位参考答案:D答案解析:无9、A.两者互为相反数B.C.D.以上说法都不对参考答案:C答案解析:无10、有8个数据4、5、2、9、7、6、1、3,它们的中位数为:()A.8B.4.5C.7D.9参考答案:B答案解析:无1、日常生活或生产中使用的温度计所测出的气温量值是()A.称名变量数据B.顺序变量数据C.等距变量数据D.比率变量数据参考答案:C答案解析:无2、下列统计量中对数据变化灵敏性最差的是()A.方差B.平均差C.算术平均差D.中位数参考答案:D答案解析:无3、向下累积次数的含义是某一组:()A.对应次数的总和B.以下各组次数的总和C.以上各组次数的总和D.对应的总次数参考答案:C答案解析:无4、编制次数分布表最关键的两个步骤是:()A.求全距与定组数B.求组距与定组限C.求组中值与划记D.记录次数与核对参考答案:B答案解析:无5、标准差和变异系数是描述:()A.一组数据的集中趋势B.两组数据的集中趋势C.一组数据的分散程度D.两组数据的分散程度参考答案:C答案解析:无6、下列相关系数中,表示两列变量数量变化方向一致的是()A.-0.71B.-0.65C.0.31D.0参考答案:C答案解析:无7、下列相关系数中表示两列变量间的相关强度最小的是()A.0.90B.0.10C.-0.40D.-0.70参考答案:B答案解析:无8、某城市调查8岁儿童的身高情况,所用单位为厘米,根据这批数据计算得出的差异系数()A.单位是厘米B.单位是米C.单位是平方厘米D.无单位参考答案:D答案解析:无9、一组限为70—80,不属于该组的数据是(考虑精确下限):()A.69.5B.75.5C.79.5D.74.6参考答案:C答案解析:无10、有8个数据4、5、2、9、7、6、1、3,它们的中位数为:()A.8B.4.5C.7D.9参考答案:B答案解析:无1、编制次数分布表最关键的两个步骤是:()A.求全距与定组数B.求组距与定组限C.求组中值与划记D.记录次数与核对参考答案:B答案解析:无2、从数据来源的角度,找出与其它不同类的数据:()A.50本B.50人C.50公斤D.50所参考答案:C答案解析:无3、下列相关系数中表示两列变量间的相关强度最小的是()A.0.90B.0.10C.-0.40D.-0.70参考答案:B答案解析:无4、标准差和变异系数是描述:()A.一组数据的集中趋势B.两组数据的集中趋势C.一组数据的分散程度D.两组数据的分散程度参考答案:C答案解析:无5、下列统计量中对数据变化灵敏性最差的是()A.方差B.平均差C.算术平均差D.中位数参考答案:D答案解析:无6、任何一个随机事件发生的概率的取值区间是()A.0<p≤1B.0≤P<1C.0≤P≤1D.-1<P<1参考答案:C答案解析:无7、某城市调查8岁儿童的身高情况,所用单位为厘米,根据这批数据计算得出的差异系数()A.单位是厘米B.单位是米C.单位是平方厘米D.无单位参考答案:D答案解析:无8、日常生活或生产中使用的温度计所测出的气温量值是()A.称名变量数据B.顺序变量数据C.等距变量数据D.比率变量数据参考答案:C答案解析:无9、下列选择项中不属于集中量数的是()A.平均数B.中位数C.众数D.全距参考答案:D答案解析:无10、有8个数据4、5、2、9、7、6、1、3,它们的中位数为:()A.8B.4.5C.7D.9参考答案:B答案解析:无二、填空题答题要求:请根据题目要求结合所学知识进行作答。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章:1、何谓心理与教育统计学?学习它有何意义?教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析教育科学研究中获得的随机性数据资料,并根据这些数据资料所传递的信息,进行科学推论找出教育活动规律的一门科学。

具体讲,就是在教育研究中,通过调查、实验、测量等手段有意获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。

意义:(1)统计学为科学研究提供了一种科学方法。

(2)教育统计学是教育科学研究定量分析的重要重要工具。

(3)广大教育工作者学习教育统计学既可以顺利地阅读国内外先进的研究成果,又可以提高工作的科学性和效率,同时也为学习教育测量打下基础。

2、教育科学研究数据的特点(1)教育科学研究数据与结果多用数字形式呈现;(2)教育科学研究数据具有随机性和变异性;(3)教育科学研究数据具有规律性;(4)教育科学研究的目的是通过部分数据来推测总体特征。

总之,在教育科学实验或调查中,所获得的数据都具有变异性与规律性的特点。

3、思考题:选用统计方法有哪几个步骤?①要分析一下实验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。

②要分析实验数据的类型。

不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。

③要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。

4、教育统计学的分类(1)依研究的问题实质来划分,教育统计学的研究内容可划分为描述一件事物的性质、比较两件事物之间的差异、分析影响事物变化的因素、一件事物两种不同属性之间的相互关系、取样方法等等。

(2)依统计方法的功能进行分类,教育统计学的研究内容可分为描述统计、推论统计和实验设计。

5、描述统计:主要研究如何整理科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。

具体内容包括:(1)数据如何分组,如何使用各种统计图表描述一组数据的分布情况;(2)怎样计算一组数据的特征值,简缩数据,进一步描述一组数据的全貌;(3)表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件,描述数据分布特征的峰度及偏度系数计算方法等。

6、推论统计:主要研究如何通过局部数据所提供的信息,推论总体(或称全局)的情形。

具体内容包括:(1)如何对假设进行检验,即各种各样的假设检验,包括大样本检验方法(z检验),小样本检验方法(t检验),各种计数资料的假设检验的方法(百分数检验、χ2检验等),变异数分析的方法(F检验),回归分析方法等等。

(2)总体参数的估计方法。

(3)各种非参数的统计方法等。

7、思考题:描述统计、推论统计和实验设计这三部分统计内容有何关系?教育统计学的三个组成部分的内容不是截然分开的,而是相互联系的。

描述统计是推论统计的基础,推论统计离不开描述统计计算所获得的特征值;描述统计只是对数据进行一般的分析归纳,如果不进一步应用推论统计作进一步的分析,描述统计的结果就不会产生更大的价值和意义,达不到统计分析的最终目的要求。

同样,只有良好的实验设计才能使所获得的数据具有意义,进一步的统计处理才能说明问题。

当然一个好的实验设计,也必须符合基本的统计方法的要求,否则,再好的设计,如果事先没有确定适当的统计方法处理,在处理研究结果时可能会遇到许多麻烦问题。

8、教育统计与心理统计的异同相同之处:二者的研究对象都是人,教育现象在很多情况下要通过人的心理现象去观察和分析,统计方法基本相同。

不同之处:①在统计方法上:在教育方面的研究中,大样本的统计方法应用较多;而在心理学上小样本的方法较多。

②在实验设计的水平上:教育实验中控制因素较难,采用自然实验、准实验设计方式较多,对统计结果的解释需要特别谨慎;而心理学实验则在实验室条件下进行较多,对各种实验变量的控制相对容易,统计处理结果的解释也较易进行。

9、数据的类型(一)从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。

计数数据是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数的形式。

测量数据是借助于一定的测量工具或一定的测量标准而获得的数据。

(二)根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。

称名数据只说明某一事物与其它事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小。

顺序数据是指既无相等单位,也无绝对零点的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。

等距数据是具有相等单位,但无绝对零点的数据。

比率数据既表明量的大小,也有相等单位,同时还具有绝对零点的数据。

(三)按照数据是否具有连续性,把数据划分为离散数据和连续数据。

离散数据一般取整数,在两个单位之间不能再划分细小单位。

连续数据的单位可以划得很细微,细微的程度能达到只可想象而不能看见的程度。

10、思考题:统计量与参数之间有何区别和联系?区别:①参数是从整个总体中计算得到的量数,通常是通过相应样本特征值来预测得到;统计量是从一个样本中计算出来的一些量数,它可以描述一组数据的情况。

②参数代表总体的特性,它是一个常数;统计量代表样本的特性,它是一个变量,随着样本的变化而变化。

③参数与统计量之间最明显的区别是参数常用希腊字母表示,而统计量常用英文字母表示。

联系:从数值计算上讲,当总体大小已知并与实验观测的总次数相同时,统计量与参数是同一统计指标;当总体为无限时,统计量与总体参数不同,但统计量可在某种程度上作为总体参数的估计值。

通过样本统计量,对总体参数做出预测和估计。

第二章:1、统计分组应注意的事项(1)统计分组前的准备。

将数据进行分组前,先要对观测数据做进一步的核对和校验。

校核数据的目的是为了尽可能地消去记录误差,以便后续的统计分析建立在一个坚实的基础上。

(2)统计分组时应注意的问题。

①分组要以被研究对象的本质特性为基础;②分类标志要明确,要能包括所有的数据。

2、分组次数分布表的意义与缺点意义:编制分组次数分布表,可将一堆杂乱无序的数据排列成序。

从表中可以发现各个数据的出现次数是多少,其分布的状态如何。

缺点:分组次数分布表也有缺点,仅从这张表看,原始数据不见了,只见到各分组区间及各组的次数。

根据这样的统计表提供的数据资料计算得到的平均值,会与用原始数据计算的值有一定的出入。

3、思考题:直方图、条形图、圆形图、线性图、散点图等这些常用的统计图,根据它们表现的作用和内容,把它们可分为哪几类?根据它们表现的作用和内容,把它们可分为五类。

第一种是表现分布的图,比如直方图。

第二种是表现内容的图,如条形图和圆形图。

第三种是表现变化的图,这种图形的代表是线性图。

第四种是表现比较的图,这几种图形都能采用。

第五种是表现相关的图,如散点图。

4、条形图和直方图的区别。

(1)描述的数据类型不同。

(2)表示数据多少的方式不同。

(3)坐标轴上的标尺分点意义不同。

(4)图形直观形状不同。

第三章:1、算术平均数的优缺点算术平均数具备一个良好的集中量数所应具备的一些条件:①反应灵敏;②严密确定;③简明易懂;④计算简单;⑤适合代数运算;⑥较少受抽样变动的影响。

除此之外,算术平均数还有以下一些特殊的优点:①只知一组观察值的总和及总频数就可以求出算术平均数;②用加权法可以求出几个平均数的总平均数;③用样本数据推断总体集中量数时,算术平均数最接近总体集中量数的真值,它是总体平均数的最好估计值;④在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。

缺点:①易受极端数据的影响;②若出现模糊不清的数据时,无法计算平均数。

2、算术平均数的意义、适用条件及应用原则意义:算术平均数是应用最普遍的集中量数,它是“真值”渐近、最佳的估计值。

适用的条件:一组数据是比较准确,可靠又同质,而且需要每一个数据都加入计算,同时还要作进一步代数运算时,这时就需要用算术平均数表示其集中趋势。

原则:①同质性原则;②平均数与个体数值相结合的原则;③平均数与标准差、方差相结合的原则。

3、中数适用的情况(1)当一组观测结果中出现两极端数目时;(2)当次数分布的两端数据或个别数据不清楚时;(3)当需要快速估计一组数据的代表值时。

4、众数适用的情况(1)当需要快速而粗略地寻求一组数据的代表值时;(2)当一组数据出现不同质的情况时;(3)当次数分布中有两极端的数目时;4)当粗略估计次数分布的形态时。

第四章:1、思考题:为什么要引入差异量数来描述一组数据的特征?在教育研究中,要全面描述数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。

这些特殊性常表现为数据的变异性。

因此,只有集中量数不可能真实地反映它们的分布情况。

为了全面反映数据的总体情况,除了使用集中量数外,还需要引入差异量数。

2、思考题:为什么说标准差是重要而完善的差异量?(1)标准差具有简单明了,反映灵敏,严密确定,容易计算,适合代数运算,受抽样变动的影响较少等优点。

(2)标准差在避免两极端数值影响方面大大超过全距、百分位差和四分位差;在避免绝对值方面,优于平均差;在考虑单位方面,优于方差。

3、差异系数的应用(1)同一团体不同观测值离散程度的比较(即不同单位资料差异程度的比较);(2)对于水平相差较大,但进行的是一种观测的各种团体,进行观测值离散程度的比较(即单位相同而平均数相差较大的两组资料差异程度的比较)。

应用差异系数比较相对差异大小时,应注意以下几点:①测量的数据要保证具有等距尺度;②观测工具应具备绝对零;③差异系数只能用于一般的相对差异量的描述,至今尚无有效的假设检验方法。

第五章:1、思考题:如何理解相关系数?相关系数是两列变量间相关程度的数字表现形式。

对于这一概念,我们可以从以下几个方面来理解:(1)相关系数的取值在-1.00和+1.00之间;(2)相关系数的绝对值表示两个变量之间的相关强度,绝对值越接近1表示相关越强,越接近0表示相关越弱;(3)相关系数的正负号表示相关的方向,相关系数为正的表示正相关,相关系数为负的表示负相关;(4)相关系数可以比较大小,但不能进行加减乘除运算。

2、如何选择合适的相关系数?选择计算相关系数的方法主要取决于要处理的数据的性质类别以及某一相关系数需要满足的假设条件。

具体来说,为了选择一个合适的相关系数进行相关分析,要分以下几个步骤考虑:(1)考虑每种测量所产生的数据属于什么类别,测查被试的哪种心理属性,是分类,还是排序,还是评定等级?是否给出确定的分数?(2)要对第一种测量数据和第二种测量数据的类别做出判断。

相关文档
最新文档