3教育统计学第三章
《教育统计学》名词解释重点
第一章绪论1,教育统计学是运用数理统计学的原理来研究教育问题的一门应用科学。
2,教育统计学分为描述统计、推断统计和实验设计三类。
(1)描述统计:计算集中量(算术平均数、中位数、众数、加权算术平均数、几何平均数、调和平均数)来反映集中趋势;计算差异量(全距、四分位距、百分位距、平均差、标准差、差异系数)反映离散程度;计算偏态量及峰态量反映分布形态;计算相关量(积差相关系数、等级、点二列、二列、四分、C相关系数、肯德尔和谐系数、多系列相关系数)反映一致性程度。
(2)推断统计包括总体参数估计和假设检验两部分。
3,随机现象三个特性:一,一次试验有多种可能的结果,其所有结果是已知的;二,试验之前不能预料那一种结果会出现;三,在相同条件下可以重复试验。
随机事件:随机现象的每一种结果。
随机变量:把能表示随机现象各种结果的变量称之4,总体:是我们研究的具有某种共同特性的个体的总和。
样本数目大于30称为大样本,小于等于30称为小样本。
第二章数据的初步整理1,教统资料来源有经常性资料和专题性资料。
专题性资料包括(1)教育调查。
按调查方法分为现情调查、回顾调查和追踪调查;按调查范围分全面调查和非全面调查(抽样调查和典型调查)。
(2)教育实验。
分为单组实验(指对同一实验对象先后实施两种实验处理)、等组实验(指在甲乙两组条件基本相同的情况下,对之实行不同的实验处理)和轮组实验(指在实验组和对照组分别进行两种实验处理,并且每种处理各重复一次,也即每个或多个单组实验的联合)2,数据的分类。
按来源分为点计数据和度量数据;按随机变量取值情况分为间断型随机变量(取值个数有限、独立的、两个单位之间不能再划分细小单位、一般用整数表示,如优劣程度、品德爱好打分)和连续性随机变量(个数无限、单位之间可以再划分、可以用小数表示如身高体重、完成作业的时间等)。
3,频数分布表制作步骤:求全距;决定组数和组距;决定组限;登记频数。
4,用累计频数表示的频数分布表称为累计频数分布表。
现代心理与教育统计学课后题完整版14145
第一章绪论1.名词解释随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量总体:又称为母全体、全域,指据有某种特征的一类事物的全体样本:从总体中抽取的一部分个体,称为总体的一个样本个体:构成总体的每个基本单元称为个体次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。
频率通畅用比例或百分数表示概率:又称机率。
或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率统计量:样本的特征值叫做统计量,又叫做特征值参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据2.何谓心理与教育统计学学习它有何意义心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。
整理。
分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
3.选用统计方法有哪几个步骤首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件4.什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量5.怎样理解总体、样本与个体总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。
教育统计学重点
1.心理与教育统计学的内容,①描述统计:差异量数,统计图表,集中量数,相关分析。
②推论统计:统计估计(参数估计(点估计,区间估计),非参数估计),假设检验(参数检验,非参数检验)③实验设计:样本选择与分配,实验误差分析,方差分析,协方差分析分析,回归分析,因子分析。
描述统计主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。
推论统计主要研究如何通过局部数据所提供的信息,推论总体的情形。
实验设计主要目的在于研究如何科学地,经济地以及有效地进行实验。
2.心理与教育统计基础概念,(1)数据类型:①从数据观测方法和来源划分,研究数据可区分为计数数据(计算个数的数据,具有独立的分类单位)和测量数据(借助一定的测量工具或者一定的测量标准获得的数据)两大类②根据数据反应的测量水平,可以把数据分为称名数据(只说明一事物与其他事物在属性上的不同或者类别上的差异),顺序数据(即无相等单位,也无绝对零的数据,是按事物某种属性的多少和大小,按次序将各个事物排列后获得的数据资料),等距数据(有相等单位,无绝对零的数据,如温度),比例数据(既表明量的大小,也有相等的单位,同时还有绝对零点,如身高)四类。
③按照数据是否具有连续性,把数据划分为离散型数据(又称不连续数据,在任何两个据点之间所取的数值个数都是有限的)连续性数据(任意两个数据点之间都可以细分出无限个大小不同的数值)。
(2)变量(心理与教育实验,观察,调查中想要获得的数据)观测值(一旦确定了某个值,就称这个值为某一变量的观测值)随机变量(取值之前不能预料取到什么值的变量)(3)总体(指具有某种特征的一类事物的全体)样本(从总体中抽取一部分个体)个体(构成总体的每个基本单元)(4)次数(某一事件在某一类别中出现的数目)比率(两个数的比)频率(某一事件发生的次数被总的事件数目除)概率(某一事件在无限的观测中所能预料的相对出现的次数)(5)参数(描述总体情况的统计指标)与统计量(样本的特征值)参数用希腊字母表示,统计量用英文字母表示1.数据的初步整理,(1)数据排序,按照某种标准,对收集到的杂乱无章的数据按照一定的标准进行排列(2)统计分组,根据被研究对象的特征,将所得的数据划分到各个组别中,统计分组应该注意的问题:分组要以被研究对象的本质特征为基础;分类标志要明确,要能包括所有的数据。
(完整版)现代心理与教育统计学
心理统计学第一章概述描述统计定义:研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理概括和表述作用:使杂乱无章的数字更好的显示出事物的某些特征,有助于说明问题的实质。
具体内容:1数据分组:采用图与表的形式。
2计算数据的特征值:集中量数(平均数中数)离散量数(方差)3计算量事物间的相关关系:积差相关(2列3列多列)推断统计定义:主要研究如何利用局部数据(样本数据)所提供的信息,依据数理统计提供的理论和方法,推论总体情形。
作用:用样本推论总体。
具体内容:1如何对假设进行检验。
2如何对总体参数特征值进行估计。
3各种非参数的统计方法。
心理与教育统计基础概念数据类型一从数据来源来划分1计数数据:计算个数或次数而获得的数据。
(都是离散数据)2测量数据:借助一定测量工具或测量标准而获得的数据。
(连续数据)二根据数据所反映的测量水平1称名数据(分类)定义:指用数字代表事物或数字对事物进行分类的数据。
特点:数字只是事物的符号,而没有任何数量意义。
统计方法:百分数次数众数列联相关卡方检验等。
(非参检验)2顺序数据(分类排序)定义:指代事物类别,能够表明不同食物的大小等级或事物具有的某种特征的程度的数据。
(年级)特点:没有相等单位没有绝对零点。
不表示事物特征的真正数量。
统计方法:中位数百分位数等级相关肯德尔和谐系数以及常规的非参数检验方法。
3等距数据(分类排序加减(相等单位))(真正应用最广泛的数据)定义:不仅能够指代物体的类别等级,而且具有相等的单位的数据。
(成绩温度)特点:真正的数量,能进行加减运算,没有绝对零点,不能进行乘除计算。
统计方法:平均数标准差积差相关Z检验t检验F检验等。
4比率数据(分类排序加减法乘除法(绝对零点))定义:表明量的大小,也具有相等单位,同时具有绝对零点。
(身高反应时)特点:真正的数字,有绝对零点,可以进行加减乘除运算。
在统计中处理的数据大多是顺序数据和等距数据。
三按照数据是否具有连续性离散数据连续数据变量观测值随机变量变量:指心理与教育实验观察调查种想要获得的数据。
教育统计学课件绪论【共45张PPT】
Correlational Research
Descriptive Statistics & Inferential Statistics
因变量(dependent Variable )是研究者感兴趣的结果,
通过观察和测量这一结果,可以评估自变量的效应。
Definition of terms
Manipulated Variable VS Subjective Variable
Manipulated Variable is a type of independent variable that the experimenter systematically controls or manipulates and to which the subjects are assigned.
总体参数(Parameters)是描述一个总体的特征的各种
值,通常是样本统计量的一个估计值。如总体平均数
。 总体参数是常数,而且必须用希腊字母代表。
总体
参数
抽取部分观察单位 样本
统计量
统计量:样本的统计指标,
如样本均数、标准差,采
用拉丁字母分别记
X、S 为
。 参数附近
波动的随机变量 。
推断inference
Definition of psychological and educational statistics
心理与教育统计学的价值
心理与教育统计使我们能以最少的样本含量,达到我们所 需要的数据精确度,对总体的有关参数等作出判断,同时 又给出发生错误的可能性。
教育统计学
第一章:概述一、教育统计学的含义(一)什么是统计学A统计学是研究随机现象的数量规律性的一门数学分支。
自然界中有两类现象:a.确定现象b.随机现象。
随机现象的规律性可用概率论来描述,起源于(法)帕斯卡对赌博现象的研究。
B数理统计学:以概率论为基础C应用统计学:是数理统计学理论在各个学科领域中的应用。
(二)什么是教育统计学探讨如何将统计学的原理和方法应用于研究教育现象中数量关系的科学。
根据不同功能可划分为:1.统计设计:研究如何科学全面地搜集统计数据以确保统计结论的可靠性。
如:如何进行随机抽样,如何设计实验等。
2.描述统计:研究如何对搜集到的统计数据进行分析整理,以显示数量关系,如:计算数据的集中度、离散度等。
3.推断统计:研究如何利用样本数据来推测和判断未知的总体特征,如总体参数估计、假设检验等。
二、几个基本概念(一)变量与变量值A变量:可以定量并能取不同数值的事物的某种特征。
B变量值:变量具体的数值如考试的分数、智力水平C变量的类型:①类别变量:只是用数字来代表事物或对事物进行分类,数字没有任何数值意义。
不能做量化分析,无大小意义,只表明类别。
如性别男1 女2②顺序变量:表明类别的大小或某种属性的多少。
主要用于分等论级和分类。
仅表示等级,不表示某种属性的真正量和绝对值。
无参照点(没有绝对零度)和相等单位。
如:五点评分:ABCDE③等距变量:存在大小关系,无绝对零点,但存在相对零点。
可进行数学运算、有相等单位。
如IQ④比率变量:有相等单位和绝对零点,可以知道事物之间的某种特点上相差多少及他们之间的倍数关系。
如长度(二)总体与样本A总体:具有某种特征的个体总和例如大学生、中学生、女性、男性,包括有限总体和无限总体。
总体的量化特征称为总体参数。
如总体平均数B样本:从总体中抽取的观察对象。
样本容量(>30称为大样本,<30称为小样本),样本的量化特征称为样本统计量,如样本平均数。
(研究分布关系越大越好;研究事物关系越小越好)第二章:原始数据的整理一、次数分布表(一)分类1.简单次数分布表:又称简单频叔分布表,根据不同组别数据出现频数编制而成。
心理与教育统计学课后题答案
张厚粲现代心理与教育统计学第一章答案1名词概念(1)随机变量答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。
(2)总体答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体.(3)样本答:样本是从总体中抽取的一部分个体。
(4)个体答:构成总体的每个基本单元。
(5)次数是指某一事件在某一类别中出现的数目,又称作频数,用f表示。
(6)频率答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。
(7)概率答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。
其描述性定义。
随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。
(8)统计量答:样本的特征值叫做统计量,又称作特征值。
(9)参数答:又称总体参数,是描述一个总体情况的统计指标.(10)观测值答:随机变量的取值,一个随机变量可以有多个观测值。
2何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义。
①统计学为科学研究提供了一种科学方法。
科学是一种知识体系。
它的研究对象存在于现实世界各个领域的客观事实之中.它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。
要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。
统计学正是提供了这样一种科学方法。
统计方法是从事科学研究的一种必不可少的工具。
《教育统计学》(王孝玲版)超详细知识点及重点笔记
华东师大心理统计学大纲教材:《教育统计学》(王孝玲编著,修订版)华东师范大学出版社 1993年6月第一版第一章绪论第一节什么是统计学和心理统计学一、什么是统计学 统计学是研究统计原理和方法的科学。
具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。
统计学分为两大类。
一类是数理统计学。
它主要是以概率论为基础,对统计数据数量关系的模式加以解释,对统计原理和方法给予数学的证明。
它是数学的一个分支。
另一类是应用统计学。
它是数理统计原理和方法在各个领域中的应用,如数理统计的原理和方法应用到工业领域,称为工业统计学;应用到医学领域,称为医学统计学;应用到心理学领域,称为心理统计学,等等。
应用统计学是与研究对象密切结合的各科专门统计学。
二、统计学和心理统计学的内容 统计学和心理统计学的研究内容,从不同角度来分,可以分为不同的类型。
从具体应用的角度来分,可以分成描述统计,推断统计和实验设计三部分。
1.描述统计 对已获得的数据进行整理、概括,显示其分布特征的统计方法,称为描述统计。
2.推断统计 根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推断统计。
推断统计的内容包括总体参数估计和假设检验两部分。
3.实验设计 实验者为了揭示试验中自变量和因变量的关系,在实验之前所制定的实验计划,称为实验设计。
其中包括选择怎样的抽样方式;如何计算样本容量;确定怎样的实验对照形式;如何实现实验组和对照组的等组化;如何安排实验因素和如何控制无关因素;用什么统计方法处理及分析实验结果,等等。
以上三部分内容,不是截然分开,而是相互联系的。
第二节统计学中的几个基本概念 一、随机变量 具有以下三个特性的现象,成为随机变量。
第一,一次试验有多中可能结果,其所有可能结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复试验。
现代心理与教育统计学课后题完整版50609
第一章绪论1.名词解释随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量总体:又称为母全体、全域,指据有某种特征的一类事物的全体样本:从总体中抽取的一部分个体,称为总体的一个样本个体:构成总体的每个基本单元称为个体次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。
频率通畅用比例或百分数表示概率:又称机率。
或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率统计量:样本的特征值叫做统计量,又叫做特征值参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据2.何谓心理与教育统计学学习它有何意义心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。
整理。
分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
3.选用统计方法有哪几个步骤首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件4.什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量5.怎样理解总体、样本与个体总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。
现代心理与教育统计学课后题完整版
第一章绪论之老阳三干创作2.名词解释随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量总体:又称为母全体、全域,指据有某种特征的一类事物的全体样本:从总体中抽取的一部份个体,称为总体的一个样本个体:构成总体的每个基本单位称为个体次数:指某一事件在某一类别中呈现的数目,又成为频数,用f 暗示频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据呈现的次数被这一组数据总个数去除.频率通畅用比例或百分数暗示概率:又称机率.或然率,用符号P暗示,指某一事件在无限的观测中所能预料的相对呈现的次数,也就是某一事物或某种情况在某一总体中呈现的比率统计量:样本的特征值叫做统计量,又叫做特征值参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据3.何谓心理与教育统计学?学习它有何意义心理与教育统计学是专门研究如何运用统计学原理和方法,搜集.整理.分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科.4.选用统计方法有哪几个步伐?首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处置,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边缘的数据加以统计处置是毫无意义的其主要分析实验数据的类型,分歧数据类型所使用的统计方法有很年夜分歧,了解实验数据的类型和水平,对选用恰当的统计方法至关重要第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件5.什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量随机变量的界说:①率先无法确定,受随机因素影响,成随机变动,具有偶然性和规律性②有规律变动的变量6.怎样理解总体、样本与个体?总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,经常使用N暗示,其构成的基本单位为个体.特点:①年夜小随研究问题而变(有、无限)②总体性质由组成的个体性质而定样本n:从总体中抽取的一部份交个体,称为总体的一个样本.样本数目用n暗示,又叫样本容量.特点:①样本容量越年夜,对总体的代表性越强②样天职歧,统计方法分歧总体与样本可以相互转化.个体:构成总体的每个基本单位称为个体.有时个体又叫做一个随机事件或样本点7.何谓次数、频率及概率次数f:随机事件在某一类别中呈现的数目,又称为频数,用f 暗示频率:即相对次数,即某个事件次数被总事件除,用比例、百分数暗示概率P:又称机率或然率,用P暗示,指某事件在无限管偏重所能预料的相对呈现次数.估计值(后验):几次观测中呈现m 次,P(A)=m/n真实值(先验):特殊情况下,直接计算的比值(结果有限,呈现可能性相等)8.统计量与参数之间有何区别和关系?参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标统计量:样本的特征值叫做统计量,又称特征值二者关系:参数是一个常数,统计量随样本而变动参数经常使用希腊字母暗示,统计量用英文字母暗示当试验次数=总体年夜小时,二者为同一指标当总体无限时,二者分歧,但统计量可在某种水平上作为参数的估计值9.试举例说明各种数据类型之间的区别?10.下述一些数据,哪些是丈量数据?哪些是计数数据?其数值意味着什么?17人 25本是计数数据11.说明下面符号代表的意义μ反映总体集中情况的统计指标,即总体平均数或期望值ρ暗示某一事物两个特性总体之间关系的统计指标,相关系数r 样秘闻关系数σ反映总体分散情况的统计指标标准差s样本标准差β暗示两个特性中体之间数量关系的回归系数Nn第二章统计图表1.统计分组应注意哪些问题?①分类要正确,以被研究对象的实质为基础②分类标识表记标帜要明确,要包括所有数据③如删除过失所造成的变异数据,要遵循3σ原则2.直条图适合哪种资料?条形图也叫做直条图,主要用于暗示离散型数据资料,即计数资料.3.圆形图适合哪种资料又称饼图,主要用于描述间断性资料,目的是为显示各部份在整体中所占的比重年夜小,以及各部份之间的比力,显示的资料多以相对数(如百分数)为主4.将下列的反应时测定资料编制成次数分布表、累积次数分布表、直方图、次数多边形.177.5 167.4 116.7 130.9 199.1 198.3 225.0 212.0 180.0 171.0 144.0 138.0 191.0 171.5 147.0 172.0 195.5 190.0 206.7 153.2 217.0 179.2 242.2 212.8 171.0 241.0 176.5 165.4 201.0 145.5 163.0 178.0 162.0 188.1 176.5 172.2 215.0 177.9 180.5 193.0 190.5 167.3 170.5 189.5 180.1 217.0 186.3 180.0 182.5 171.0 147.0 160.5 153.2 157.5 143.5 148.5 146.4 150.5 177.1 200.1 137.5 143.7 179.5 185.5 181.6N=65 代入公式K=1.87(N-1)2/5=9.8 所以K取10定组距13 最低组的下限取115表2-1 次数分布表分组区间组中值(Xc)次数(f)频率(P)百分次数(%)232~ 238 2 3 219~ 225 1 2 206~ 212 6 9 193~ 199 6 9180~ 186 14 22 167~ 173 16 25 154~ 160 5 8 141~ 147 11 17 128~ 134 3 5 115~ 121 1 2 合计65 100表2-2 累加次数分布表分组区间次数(f)向上累加次数向下累加次数实际累加次数(cf)相对累加次数实际累加次数(cf)相对累加次数232~ 2 65 2219~ 1 63 3206~ 6 62 9193~ 6 56 15180~ 14 50 29167~ 16 36 45154~ 5 20 50141~ 11 15 61128~ 3 4 64115~ 1 1 657.下面是一项美国高中生打工方式的调查结果.根据这些数据用手工方式和计算方式个制作一个条形图.并通过自己的体会说明两种制图方式的分歧和优缺点打工方式高二(%)高三(%)看护孩子商店销售餐饮服务其他零工左侧Y轴名称为:打工人数百分比下侧X轴名称为:打工方式第三章集中量数1.应用算术平均数暗示集中趋势要注意什么问题?应用算术平均数必需遵循以下几个原则:①同质性原则.数据是用同一个观测手段采纳相同的观测标准,能反映某一问题的同一方面特质的数据.②平均数与个体数据相结合的原则③平均数与标准差、方差相结合原则2.中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料?中数适用于:①当一组观测结果中呈现两个极端数目时②次数分布表两端数据或个别数据不清楚时③要快速估计一组数据代表值时众数适用于:①要快速且粗略的求一组数据代表值时②数据分歧质时,暗示典范情况③次数分布中有两极真个数目时④粗略估计次数分布的形态时,用M-Mo作为暗示次数分布是否偏态的指标(正态:M=Md=Mo;正偏:M>Md>Mo; 负偏:M<Md<Mo)⑤当次数分布中呈现双众数时几何平均数适用于①少数数据偏年夜或偏小,数据的分布成偏态②等距、等比量表实验③平均增长率,按一定比例变动时调和平均数适用于①工作量固定,记录各被试完成相同工作所用时间②学习时间一定,记录一按时间内各被试完成的工作量3.对下列数据,使用何种集中量数暗示集中趋势其代表性更好?并计算它们的值.⑴ 4 5 6 6 7 29 中数=6⑵ 3 4 5 5 7 5 众数=5⑶4.求下列次数分布的平均数、中数.解:组中值由“精确上下限”算得;设估计平均值在35~组,即AM=37;中数所在组为35~,f MD=34,其精确下限Lb=34.5,该组以下各组次数累加为Fb=21+16+11+9+7=645.求下列四个年级的总平均成果.n2363182152006.三个分歧被试对某词的联想速度如下表,求平均联想速度被试 联想词数 时间(分)词数/分(Xi )A 13 2 13/2B 13 3 13/3 C1325-解:C 被试联想时间25分钟为异常数据,删除7.下面是某校几年来结业生的人数,问平均增加率是几多?并估计10年后的结业人数有几多.年份 1978 1979 1980 1981 1982 1983 1984 1985 结业人数54260175076081093010501120解:用几何平均数变式计算:所以平均增加率为11%10年后结业人数为1120×10=3159人8.计算第二章习题4中次数分布表资料的平均数、中数及原始数据的平局数.解:组中值由“精确上下限”算得;设估计平均值在167~组,即设AM=173;中数所在组为167~,f MD=16,其精确下限Lb=166.5,该组以下各组次数累加为Fb=1+3+11+5=20分组区间组中值(Xc)次数(f)d=(Xi-AM)/i fd 232~ 238 2 5 10 219~ 225 1 4 4 206~ 212 6 3 18 193~ 199 6 2 12 180~ 186 14 1 14 167~ 173 16 0 0 154~ 160 5 -1 -5 141~ 147 11 -2 -22 128~ 134 3 -3 -9 115~ 121 1 -4 -4 合计∑N=65 ∑fd=18第四章不同量数1.怀抱离中趋势的不同量数有哪些?为什么要怀抱离中趋势?怀抱离中趋势的不同量数有全距、四分位差、百分位差、平均差、标准差与方差等等.在心理和教育研究中,要全面描述一组数据的特征,不单要了解数据的典范情况,而且还要了解特殊情况.这些特殊性常暗示为数据的变异性.如两个样本的平均数相同可是整齐水平分歧,如果只比力平均数其实不能真实的反映样本全貌.因此只有集中量数不成能真实的反映出样本的分布情况.为了全面反映数据的总体情况,除必需求出集中量数外,这时还需要使用不同量数.2.各种不同量数各有什么特点?见课本103页“各种不同量数优缺点比力”3.标准差在心理与教育研究中除怀抱数据的离散水平外还有哪些用途?可以计算不同系数(应用)和标准分数(应用)4.应用标准分数求分歧质的数据总和时应注意什么问题?要求分歧质的数据的次数分布为正态5.计算下列数据的标准差与平均差6.计算第二章习题4所列次数分布表的标准差、四分差Q设估计平均值在167~组,即AM=173, i=13分组区间Xc f d=(Xc-AM)/i fd fd2232~ 238 2 5 10 50219~ 225 1 4 4 16206~ 212 6 3 18 54193~ 199 6 2 12 24180~ 186 14 1 14 14167~ 173 16 0 0 0154~ 160 5 -1 -5 5141~ 147 11 -2 -22 44128~ 134 3 -3 -9 27115~ 121 1 -4 -4 16合计65 18 25065×75%=48.75 所以Q1、Q3分别在154~组(小于其组精确下限的各组次数和为15)和180~组(小于其组精确下限的各组次数和为36),其精确下限分别为153.5和179.5,所以有:7.今有一画线实验,标准线分别为5cm和10cm,实验结果5cm组的误差平均数为1.3cm,标准差为0.7cm,10cm组的误差平均数为4.3cm,标准差为1.2cm,请问用什么方法比力其离散水平的年夜小?并具体比力之.用不同系数来比力离散水平.×100%=()×100%=53.85%×100%=(1.2/4.3) ×100%=27.91%<CV1所以标准线为5cm的离散水平年夜.8.求下表所列各班成果的总标准差班级平均数标准差人数di1 402 513 484 43其值见上表9.求下表数据分布的标准差和四分差设估计平均数AM=52,即在50~组,d=(Xc-AM)/I计算各值如下表所示:分组 f Xc 累加次数 d d2fd2fd 75~80 1 77 55 5 25 25 5 70~ 2 72 54 4 16 32 865~ 4 67 52 3 9 36 12 60~ 5 62 48 2 4 20 10 55~ 8 57 43 1 1 8 8 50~ 10 52 35 0 0 0 0 45~ 9 47 25 -1 1 9 -9 40~ 7 42 16 -2 4 28 -14 35~ 4 37 9 -3 9 36 -12 30~ 2 32 5 -4 16 32 -8 25~ 2 27 3 -5 25 50 -10 20~ 1 22 1 -6 36 36 -6 合计55 312 -1655×25%=13.75 55×75%=41.25 所以Q1在40~组,其精确下限Lb1=39.5,小于其组的次数为Fb1=9,其组次数f1=7;Q2在55~组,其精确下限Lb2=54.5,小于其组的次数为Fb2=35,其组次数f2=8.计算Q1、Q2如下:第五章相关关系1.解释相关系数时应注意什么?(1)相关系数是两列变量之间相关成都的数字暗示形式,相关水平指标有统计特征数r和总体系数ρ(2)它只是一个比率,不是相关的百分数,更不是等距的怀抱值,只能说r年夜比r小相关密切,不能说r年夜小=0.4的两倍(不能用倍数关系来解释)(3)当存在强相关时,能用这个相关关系根据一个变量的的值预测另一变量的值(4)-1≤r≤1,正负号暗示相关方向,值年夜小暗示相关水平;(0为无相关,1为完全正相关,-1为完全负相关)(5)相关系数年夜的事物间纷歧定有因果关系(6)当两变量间的关系收到其他变量的影响时,两者间的高强度相关很可能是一种假象(7)计算相关要成对数据,即每个个体有两个观测值,不能随便2个个体计算(8)非线性相关的用r得可能性小,但其实不能说不密切2.假设两变量为线性关系,计算下列各情况的相关时,应用什么方法?(1)两列变量是等距或等比的数据且均为正态分布(积差相关)(2)两列变量是等距或等比的数据且不为正态分布(品级相关)(3)一变量为正态等距变量,另一列变量也为正态变量,但人为分为两类(二列相关)(4)一变量为正态等距变量,另一列变量也为正态变量,但人为分为多类(多列相关)(5)一变量为正态等距变量,另一列变量为二分称名变量(点二列相关)(6)两变量均以品级暗示(品级相关、交错系数、相容系数)3.如何区分点二列相关与二列相关?主要区别在于二分变量是否为正态.二列相关要求两列数据均为正态,其中一列被人为地分为两类;点二列相关一列数据为等距或等比丈量数据,且其总体分布为正态,另一列变量是二分称名变量,且两列数存在一一对应关系.4.品质相关有哪几种?各种品质相关的应用条件是什么?品质相关分析的总条件是两因素多项分类之间的关联水平,分为一下几类:(1)四分相关,应用条件是:两因素都为正态连续变量(eg.学习能力,身体状态))人为分为两个类别;同一被试样品中,分别调查两个分歧因素两项分类情况(2)Φ系数:除四分相关外的2×2表(最经常使用)(3)列联表相关C:R×C表的计数资料分析相关水平5.预考查甲乙丙丁四人对十件工艺美术品的品级评定是否具有一致性,用哪种相关方法?品级相关6.下表是平时两次考试成果分数,假设其分布成正态,分别用积差相关与品级相关方法计算相关系数,并回答,就这份资料用哪种相关法更恰当?被试 A B A2B2AB R A R B R A R B D=R A-R B D21 86 83 7396 6889 7138 236-112 58 52 3364 2704 3016 7856-113 79 89 6241 7921 7031 414394 64 78 4096 6084 4992 6424245 91 85 8281 7225 7735 122-116 48 68 2304 4624 3264 9654397 55 47 3025 2209 2585 8972-118 82 76 6724 5776 6232 3515-249 32 25 1024 625 800 10101000010 75 56 5625 3136 4200 5735-24∑670 659 48080 47193 46993 555536834用积差相关的条件成立,故用积差相关更精确7.下列两列变量为非正态,选用恰当的方法计算相关本题应用品级相关法计算,且含有相同品级X有3个数据的品级相同,品级3.5的数据中有2个数据的品级相同,品级为6.5和8.5的数据中也分别有2个数据相同;Y有3个数据品级相同,品级为3的数据中有3个数据品级相同,品级为5.5的数据中有2个数据品级相同,品级为9的数据中有3个数据品级相同.被试X Y RX RYD=RX-RYD21 13 14 1 1 0 02 12 11 23 -1 13 10 11 34 10 11 35 8 7 56 67 1 17 6 5 78 5 4 99 5 4 910 2 4 10 9 1 1N=108.问下表中成果与性别是否相关?被试性别成果男成果女成果成果的平方1 男83 83 68892 女91 91 82813 女95 95 90254 男84 84 70565 女89 89 79216 男87 87 75697 男86 86 73968 男85 85 72259 女88 88 774410 女92 92 8464∑880 425 455 77570适用点二列相关计算法.p为男生成果,q为女生成果平均成果从表中可以计算得:p=0.5 q=0.5相关系数为-0.83,相关较高9.第8题的性别若是改为另一成果A ()正态分布的及格、不及格两类,且知1、3、5、7、9被试的成果A 为及格,2、4、6、8、10被试的成果A 为不及格,请选用适当的方法计算相关,并解释之.被试成果A 成果B 及格成果 不及格成果 成果的平方1 及格 83 83 68892 不及格 91 91 82813 及格 95 95 90254 不及格84 84 7056 5 及格 89 89 7921 6 不及格 8787 7569 7 及格 86 86 7396 8 不及格 85 85 7225 9 及格88 88 7744 10 不及格 92 92 8464 ∑880441 439 77570适用二列相关B 的标准差和平均数别是成果A 及格和不及格时成果B 的平均数,p 为成果A 及格的比率,y 为标准正态曲线中p 值对应的高度或者10.11.下表是9名被试评价10名著名的天文学家的品级评定结果,问这9名被试的品级评定是否具有一致性?被评价者被试∑R i∑R i2 1 2 3 4 5 6 7 8 9A 1 1 1 1 1 1 1 1 1 9 81B 2 4 3 3 9 4 3 3 2 33 1089C 4 2 4 4 2 9 5 5 8 43 1849D 3 5 5 5 5 2 10 7 4 46 2116E 9 6 2 2 6 5 2 6 9 47 2209F 6 7 8 6 3 6 6 4 6 52 2704G 5 3 9 10 4 7 9 8 3 58 3364H 8 10 6 8 8 3 7 10 7 67 4489I 7 8 10 7 10 10 8 2 5 67 4489 J 10 9 7 9 7 8 4 9 10 73 5329 ∑495 27719适用肯德尔W系数.即存在一定关系但不完全一致12.将11题的结果转化为对偶比力结果,并计算肯德尔一致性系数ABCDEFGHIJ已知N=10,K=9 选择对角线以下的择优分数或者选择对角线上的择优分数第六章概率分布1.概率的界说及概率的性质标明随机事件发生可能性年夜小的客观指标就是概率2.概率分布的类型有哪些?简述心理与教育统计中经常使用的概率分布及其特点概率分布是指对随机变量取值的概率分布情况用数学方法(函数)进行描述.概率分布依据分歧的标准可以分为分歧的类型:(一)离散分布与连续分布连续分布指连续随机变量的概率分布,即丈量数据的概率分布,如正态分布离散分布是指离散随机变量的概率分布,即计数数据的概率分布,如二项分布(二)经验分布与理论分布经验分布指根据观察或试验所获得的数据而编制的次数分布或相对频率分布理论分布有两个含义,一是随机变量概率分布的函数-数学模型,二是指按某种数学模型计算出的总体的次数分布(三)基本随机变量分布与抽样分布基本随机变量分布指理论分布中描述构成总体的基本变量的分布,经常使用的有二项分布与正态分布抽样分布是样本统计量的理论分布,又称随机变量函数的分布,如平均数,方差等3.何谓样本平均数的分布所谓样本平均数的分布是指从基本随机变量为正态分布的总体(又称母总体)中,采纳有放回随机抽样方法,每次从这个总体中抽取年夜小为n的一个样本,然后将这些个体放回去,再次取n个个体,……再将n个个体放回去,再抽取n个个体……,这样如此反复,可计算出理论及实验证明这无限多个平均数的分布为正态分布.4.从N=100的学生中随即抽样,已知男生人数为35,问每次抽取1人,抽的男生的概率是几多?(35/100=0.35)5.两个骰子掷一次,呈现相同点数的概率是几多?6.从30个白球20个黑球共50个球中随机抽取两次(放回抽样),问抽一黑球与一白球的概率是几多?两次皆是白球与两次皆是黑球的概率各是几多?(一黑一白)(皆是黑球)(皆是白球)7.自一副洗好的纸牌中每次抽取一张.抽取下列纸牌的概率是几多?(1)一张K 4/54(2)一张梅花 13/54(3)一张红桃 13/54(4)一张黑心 13/54(5)一张不是J、Q、K牌的黑桃 10/548.掷四个硬币时,呈现一下情况的概率是几多?服从二项分布b(4, 0.5)(1)(2)(3)(4)(5)9.在特异功能试验中,五种符号分歧的卡片在25张卡片中各重复5次,每次实验自25张卡片中抽取一张,记下符号,将卡片送回.共抽25次,每次正确的概率是1/5.写出实验中的二项式.问这个二项式分布的平均数和标准差各即是几多?服从二项分布b(25, 0.2)10.查正态表求:(1)(2)(3)Z=±×2=(4)P=0.78 Z=? Y=? Z=0.77 Y=0.29659(5)P(6)11.在单位正态分布中,找出有下列个案百分数的标准丈量Z的分值12.在单位正态分布中,找出有下列个案百分数的标准丈量的Z值13.今有1000人通过一数学能力检验,欲评为六个品级,问各个品级评定人数应是几多?解:6σ÷6=1σ,要使各品级等距,每一品级应占1个标准差的距离,确定各品级的Z分数界限,查表计算如下:分组各组界限比率p 人数分布p×N1 2σ以上232 1σ~2σ1363 0~1σ3414 -1σ~0 3415 -2σ~-1σ1366 -2σ以下23 14.将下面的次数分布表正态化,求正态化T分数分组组中值 f 上限以下累加各组中点以下累加次数累积百分比Z正态化T分数T=10Z+5055~ 52 2 100 99 99%50~ 47 2 98 97 97%45~ 42 6 96 93 93%40~ 37 8 90 86 86%35~ 32 12 82 76 76%30~ 27 14 70 63 63%25~ 22 24 56 44 44%20~ 17 12 32 26 26%15~ 12 16 20 12 12%10~ 7 4 4 2 2%15.掷骰子游戏中,一个骰子掷6次,问3次及3次以上6点向上的概率各是几多?服从二项分布:33次以上:16.今有四择一选择检验100题,问答对几多题才华说是真的会答而不是猜想?解:服从二项分布,p=1/4, q=3/4, np=100×1/4=25>5,此二项分布接近正态,故:根据正态分布概率,当Z=1.645时,该点以下包括了全体的95%.如果用原是分数暗示,即完全凭猜想,100题中猜对33题以下的可能性为95%,猜对33题及以上的概率仅为5%.所以答对33题才华说是真的会而不是猜想.17.一张考卷中有15道多重选择题,每题有4个可能的回答,其中至少有一个是正确谜底.一考生随机回答,(1)答对5至10题的概率,(2)答对的平均题数是几多?18.E字形试标检查儿童的视敏度,每种视力值(1.0,1.5)有4个方向的E字各有两个(共8个),问:说对几个才华说真看清了而不是猜想对的?解:服从二项分布,n=8,p=1/4,np=2<5,所以不能用正态分布概率算,而直接用二项分布算:由以上计算可知说对5个及5个以上的概率总和为0.000015+0.000366+0003845+0.023071=0.027297=2.73%<5%而说对4个及以上概率总和为0.027297+0.0865=0.1138=11.38% 年夜年夜超越5%的误差范围,不成取.所以至少说对5个才华才华认为是看清了而不是猜想对的,作此结论犯毛病的概率为2.73%.19.一学生毫无准备介入一项检验,其中有20道是非题,他纯洁是随机地选择“是”和“非”,试计算:(1)该学生答对5题的概率;(2)该学生至少答对8题的概率解:服从二项分布 n=20, p=0.5 np=10>5,可用正态分布概率作近似值.答对5至少答对8题的概率用正态分布概率近似计算如下:所以答对8题的Z20.设某城市年夜学录取率是40%,求20个介入高考的中学生中至少有10人被录取的概率.解:服从二项分布 n=20,p=0.4,q=0.6.因为np=5,可以用正态分布概率作近似计算人被录取时的Z至少10人被录取的概率即为Z=2.283以上的概率,查表得Z=2.283时p=0.48870,所以Z=2.283以上的概率为0.5-0.48870=0.0113,即至少10人被录取的概率为1.13%解2:设X为录取人数,则21.已知一正态总体μ=10,σ=2.今随机取n=9的样本求Z值,及年夜于该Z以上的概率是几多?解:属于样天职布中总体正态,方差已知的情况:22.从方差未知的正态总体(μ=50)中抽取n=10的样本,算得平问年夜于该平均数以上的概率?解:总体正态方差未知,服从t分布查表当df=9时没有准确的p对应,采纳内插法单侧界限概率:t=1.383以上概率为p=0.1,t=1.833以上概率为p=0.05,令t=1.581以上概率为p,则:23.解,查表得df=7时24.抽取样本n=15解:不知总体平均数时,df=n-1=14查表得df=14时0.25,采纳内插法,p,则解得p=0.27,25.,随机抽取n=10的样本为:10、20、17、19、25、24、22、31、26、26,,并求年夜于该值的概率?解:正态总体平均数未知查df=9时26.,,年夜于该值以上的概率又是几多?解,正态总体平均数已知27.已知从一正态总体中抽取两样本,;解:同一总体方差相等样本方差比为第七章参数估计第八章假设检验第九章方差分析第十章X2检验第十一章非参数检验第十二章线性回归第十三章多变量统计分析简介第十四章抽样原理及方法O50IZF6l3OlC。
《心理与教育统计学》习题答案
邵志芳: 《心理与教育统计学》 ,上海科学普及出版社,2004 年目 84 平 82 均 分 80 数 78 76 74 50 60 70 80 能力测验得分 90
邵志芳: 《心理与教育统计学》 ,上海科学普及出版社,2004 年第 1 版
1
《心理与教育统计学》练习与思考题参考答案
第三章 第 1 题: (1)84 (2)89 (3)420 (4)略 第 2 题: (1)13.5 (2)12 第 3 题:S2 = 8.5 S = 2.915 第 4 题:3159 第 5 题:男生 CV = 10%,女生 CV = 9.17%,男生成绩离散程度较高 第四章 第 2 题: (1)0.077 (2)0.25 (3)0.50 (4)0.25 (5)0.192 第 3 题: (1)0.0625 (2)0.0625 (3)0.25 (4)0.004 第 4 题: (1)0.008 (2)0.128 第五章 第 1 题: (1)1 (2)0.866 (3)0.0469 第 2 题: (1) 0.38493 (2) 0.30598 (3) 0.41924 (4) 0.89726 (5) 0.66141 (6) 0.78193 第 3 题:34.134 人;68.268% 第 4 题:A、B、C、D、E 等级人数分别为 18、119、226、119、18 第七章 第 1 题:95%的置信区间(66.08,73.92) ,99%的置信区间(64.84,75.16) 第 2 题: (67.30,75.70) 第 3 题: (73.27, 86.73) 第 4 题:Z = 9.09 > Z0.005 = 2.58 第 5 题:Z = – 2.68 < – Z0.01 = – 2.33 第八章 第 1 题: (– 8.573,9.538) 第 2 题:t = 0 第 3 题:|t| = | –1.033| < t0.025, 9=2.262 第 4 题:|t| = | –3.4| > t0.01, 7 = 2.998 第九章 第 1 题: (5.30,14.06) 第 2 题:F = 186.67 > F0.01, 4, 6 = 9.15 第 3 题:Z = 4.187 > Z0.005 = 2.58 第十章 第 1 题:F = 25.70 < F0.05, 2, 9 = 4.26 第 2 题:F = 2.854 < F0.05, 2, 9 = 4.26 第 3 题:F = 4.495 > F0.05, 3, 21 = 3.07 第 4 题:FA =1.692,FB =0.884,FA*B =0.617,均小于 F0.05,1, 16 = 4.49 第 5 题: 差异来源 平方和 SS 自由度 df A 因素 B 因素 A*B 组内 180 300 3000 100 2 3 6 12 方差 MS 90 100 500 8.33
张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](集中量数)
第3章集中量数1.应用算术平均数表示集中趋势要注意什么问题?答:在应用算术平均数表示几种趋势时,要注意:①算术平均数易受两极端数值(极大或极小)的影响。
②一组数据中某个数值的大小不够确切时就无法计算其算术平均数。
如果不处理好这两个问题,那么算术平均数将无法表示集中趋势。
2.中数,众数,几何平均数,调和平均数各适用于心理与教育研究中的哪些资料?答:中数的适用条件:①当一组观测结果中出现两个极端数目时;②当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值;③当需要快速估计一组数据的代表值时,也常用中数。
众数的适用条件:①当需要快速而粗略地寻求一组数现代心理与教育统计学据的代表值时;②当一组数据出现不同质的情况时,可用众数表示典型情况,如工资收入、学生成绩等常以次数最多者为代表值;③当次数分布中有两极端的数目时,除了一般用中数外,有时也用众数;④当粗略估计次数分布的形态时,有时用平均数与众数之差,作为表示次数分布是否偏态的指标;⑤当一组数据中同时有两个数值的次数都比较多时,即次数分布中出现双众数时,也多用众数来表示数据分布形态。
几何平均数的适用资料:当要计算教育经费增加率、学习方面的进步率和学生或人口增加率的估计时,可使用几何平均数。
调和平均数的适用资料:在心理与教育研究方面的应用,主要是用来描述学习速度方面的问题。
调和平均数作为一种集中量数,在描述速度方面的集中趋势时,优于其他集中量数。
在有关研究学习速度的实验设计中,反应指标一般常取两种形式:一是工作量固定,记录各被试完成相同工作所用的时间。
二是学习时间一定,记录一定时间内各被试完成的工作量。
由于反应指标不同,在计算学习速度时也不一样,这是应用调和平均数要特别注意的地方。
3.对于下列数据,使用何种集中量数表示集中趋势其代表性更好?并计算它们的值。
(1)4 5 6 6 7 29(2)3 4 5 5 7 5(3)2 3 5 6 7 8 9答:(1)中数6,因为题目中有极端数据,不适合用算术平均数。
现代心理与教育统计学课后题完整版
第一章绪论1.名词解释随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量总体:又称为母全体、全域,指据有某种特征的一类事物的全体样本:从总体中抽取的一部分个体,称为总体的一个样本个体:构成总体的每个基本单元称为个体次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。
频率通畅用比例或百分数表示概率:又称机率。
或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率统计量:样本的特征值叫做统计量,又叫做特征值参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据2.何谓心理与教育统计学?学习它有何意义心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。
整理。
分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
3.选用统计方法有哪几个步骤?首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件4.什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量5.怎样理解总体、样本与个体?总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。
现代心理与教育统计学第03章习题解答
1应用算术平均数表示集中趋势要注意什么问题?(1) 数据必须同质同质指使用同一观测手段,采用相同的观测标准,能反映某一问题同一方面特质的数据。
因为不同质的数据观测手段、测量标准不一致。
(2) 平均数与个体数据相结合在作出结论时,把总体的平均水平与个体数据结合起来会能更加说明问题。
(3) 将平均数与标准差和方差结合平均数只是反映数据的集中趋势,而标准差和方差能够反映数据差异趋势,将二者结合起来才能全面准确的反映总体数据的分布特征。
(4)当出现极端数据或模糊数据时,用中数或众数表示数据的集中趋势会更好。
2.中数、众数、几何平均数、调和平均数各适合哪些资料?中数适用于:一组观测数据中出现极端数据时;一组数据的两端有模糊数据出现;需要快速估计一组数据的代表值时。
众数适用于:当一组数据出现不同质的情况或分布中出现极端数据时;数据分布中出现双众数时。
几何平均数主要适用于:一组数据中有少量数据偏大或偏小,数据分布呈偏态分布;数据按一定的比例关系变化。
调和平均数主要用于描述学习速度方面的问题。
3对于下列数据,使用何种集中量数表示集中趋势更好?并计算其值(1)4 5 6 6 7 29中数或众数(2)3 4 5 5 7 5平均数,其值为5(3)2 3 5 6 7 8 9平均数40/74.求下列次数分布的平均数、中数127.36157654*626*578*5216*4715724*4234*3721*3216*2711*229*177*12=+++++++++++=∑n fx X c =5.求下列四个年级的总平均成绩6.求平均联想速度平均联想速度为3.9个 7平均增加率是多少?估计10年后毕业人数有多少1120×1.1110=3180平均增长率为11%,10后毕业人数为3180人• 四• 1.度量离中趋势的差异量数有哪些?为什么要度量离中趋势?• (1)有全距、四分位差、百分位差、平均差、标准差和方差等。
张敏强《教育与心理统计学》(第3版)课后习题(概率与分布)【圣才出品】
第3章概率与分布1.下面描述的现象是随机现象的是()。
A.股市在休息日的变化情况B.花粉随溪水流动时,沿溪水流动方向的轨迹C.小明某次语文期中考试的成绩D.导体通电时发热【答案】C【解析】随机现象是指在一定条件下,事先不能断言会出现哪种结果的现象。
小明的某次语文考试成绩不能断言会出现什么结果,因此为随机现象。
2.某学校对其200名高三应届生做摸底测试,根据成绩推算这200名学生能上重点线的概率为0.8,能上清华大学分数线的概率为0.03,从该学生团体随机抽取一名学生,该生能上重点并考上清华大学的概率是多少?()A.0.8×0.03B.0.03C.(1/200)×0.03D.(1/200)×0.8×0.03【答案】B【解析】当且仅当B⊃A时,P(AB)=P(A)。
题中,上重点线⊃上清华大学分数线,所以P(上重点线的概率上清华大学分数线的概率)=P(上清华大学分数线的概率)=0.03。
3.某生下定决心考公务员,打算拼搏3次。
3次都不行则不再言考,问该考生如愿的机会有多大?(假定公务员录取率在未来10年内都稳定在1:50)()【答案】D【解析】由题干可知,公务员录取率在未来10年内都稳定在1:50,因此第一次考上的概率为1/50,第一次未考上第二次考上的概率为49/50×1/50,前两次未考上第三次考上的概率为49/50×49/50×1/50,该生考试3次,这3次是相互独立的,用加法定率,所以该生如愿的概率为1/50+49/50×1/50+49/50×49/50×1/50。
4.在某随机样本中有10名被试,现需从中选择一人做实验A,若每人被选机会均等,选择被试l或被试2的概率是多少?()A.1/10+1/10B.(1/10)×(9/10)+(9/10)×(1/10)C.1/10+1/10-(1/10)×(1/10)D.1/10+1/10-(9/10)×(9/10)【答案】A【解析】因为每人被选机会均等,从10人中选一个,所以被选中概率为1/10,又因为选择被试l或被试2为两个相互独立的事件,因此用加法定理,答案为1/10+1/10。
教育统计学第3章
X 1 X 2 X N X N
X X N
X
i 1
N
i
N
一、平均数(AVERAGE)
(一)算术平均数 3. 简单算术平均数(Mean、M,均值) 例3-1: 某研究者对实验班用计算机辅助教学,而对照班仍用传 统的讲授方式进行教学,期末进行统一测试,两班学生 的成绩如下,试比较两种授课方式产生的效果有何不同?
实验班
83 92 84 84 86 91 76 86 87 87 83 85 89 74 87 78 82 81 88 84 80 78 90 95 91 87 92 81 72 88 79 90 85 79 75 76 77 89 79 85 76 89 86 87 78 82 75 68 84 76 75 72 78 84 74 78 78 79 76 66 87 83 87 73 84 85 65
一组有序数据中间位置的量数。 一半:在这一数值上、下各有一半频数分布着。
(二)计算方法 排序 数据为奇数时:(N+1)/2 数据为偶数时:?
二、中位数(MEDIAN)
例3-3:某某研究者对实验班用计算机辅助教学, 而对照班仍用传统的讲授方式进行教学,期末进行 统一测试,两班学生的成绩如下,试比较两种授课 方式产生的效果有何不同?
M G 3 1300 =1.0987 980
答:该校毕业生的年平均增长率为9.87%
二、调和平均数:
1、调和平均数的概念 一组数据倒数的算术平均数的倒数,亦称倒数平均数。 用MH表示。(调和平均数 HARMONIC MEAN)
MH 1 1 1 1 1 ( ) N X1 X 2 XN
张敏强《教育与心理统计学》(第3版)章节题库(概率与分布)【圣才出品】
8.从 n=200 的学生样本中随机抽样,已知女生为 132 人,问每次抽取 1 人,抽到男 生的概率是( )。
A.0.66 B.0.34 C.0.33 D.0.17 【答案】B 【解析】根据题意可知,男生人数为 200-132=68,则抽到男生的概率为 68/200=0.34。
9.总体分布正态,总体方差 2 未知,从总体中随即抽取容量为 25 的小样本,此样本
圣才电子书 十万种考研考证电子书、题库视频学习平台
7.在正态分布下,Z=1 到 Z=1.96 之间的概率为( )。 A.0.05 B.0.15 C.0.01 D.0.25 【答案】B 【解析】介于均值和标准差之间的概率为 34.1%;介于均值和 1.96 标准差之间的概率 为 47.5%;介于均值和 2.58 标准差之间的概率为 49.5%。根据以上知识点可知,介于 1 个标准差和 1.96 个标准差的概率为 0.495-0.341≈0.15。
1 / 13
圣才电子书 十万种考研考证电子书、题库视频学习平台
D.样本从二项分布的总体中随机抽取 【答案】C 【解析】t 检验、Z 检验和 F 检验都要求数据是来自正态分布的总体,而且要求数据方 差同质。
3.有 20 项选择题,每题有 4 个答案,其中只有 1 个是正确的,那么答对( )题 才能说不是猜测的结果。
ta/2
n
【答案】D
【解析】总体正态分布,总体方差已知。此时不论样本 n 的大小,其标准误
x 都是
n
,
因为样本小于 30,其分布为 t 分布,故应查 t 值表。此时,可用 X ta/2
n
<<X
ta/2
n
5 / 13
圣才电子书 十万种考研考证电子书、题库视频学习平台
教育统计学考试复习资料
第一章:1、何谓心理与教育统计学?学习它有何意义?教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析教育科学研究中获得的随机性数据资料,并根据这些数据资料所传递的信息,进行科学推论找出教育活动规律的一门科学。
具体讲,就是在教育研究中,通过调查、实验、测量等手段有意获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
意义:(1)统计学为科学研究提供了一种科学方法。
(2)教育统计学是教育科学研究定量分析的重要重要工具。
(3)广大教育工作者学习教育统计学既可以顺利地阅读国内外先进的研究成果,又可以提高工作的科学性和效率,同时也为学习教育测量打下基础。
2、教育科学研究数据的特点(1)教育科学研究数据与结果多用数字形式呈现;(2)教育科学研究数据具有随机性和变异性;(3)教育科学研究数据具有规律性;(4)教育科学研究的目的是通过部分数据来推测总体特征。
总之,在教育科学实验或调查中,所获得的数据都具有变异性与规律性的特点。
3、思考题:选用统计方法有哪几个步骤?①要分析一下实验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。
②要分析实验数据的类型。
不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。
③要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。
4、教育统计学的分类(1)依研究的问题实质来划分,教育统计学的研究内容可划分为描述一件事物的性质、比较两件事物之间的差异、分析影响事物变化的因素、一件事物两种不同属性之间的相互关系、取样方法等等。
(2)依统计方法的功能进行分类,教育统计学的研究内容可分为描述统计、推论统计和实验设计。
5、描述统计:主要研究如何整理科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。
《教育统计学》(王孝玲版)超详细知识点及重点笔记
华东师大心理统计学大纲教材:《教育统计学》(王孝玲编著,修订版)华东师范大学出版社 1993年6月第一版第一章绪论第一节什么是统计学和心理统计学一、什么是统计学 统计学是研究统计原理和方法的科学。
具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。
统计学分为两大类。
一类是数理统计学。
它主要是以概率论为基础,对统计数据数量关系的模式加以解释,对统计原理和方法给予数学的证明。
它是数学的一个分支。
另一类是应用统计学。
它是数理统计原理和方法在各个领域中的应用,如数理统计的原理和方法应用到工业领域,称为工业统计学;应用到医学领域,称为医学统计学;应用到心理学领域,称为心理统计学,等等。
应用统计学是与研究对象密切结合的各科专门统计学。
二、统计学和心理统计学的内容 统计学和心理统计学的研究内容,从不同角度来分,可以分为不同的类型。
从具体应用的角度来分,可以分成描述统计,推断统计和实验设计三部分。
1.描述统计 对已获得的数据进行整理、概括,显示其分布特征的统计方法,称为描述统计。
2.推断统计 根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推断统计。
推断统计的内容包括总体参数估计和假设检验两部分。
3.实验设计 实验者为了揭示试验中自变量和因变量的关系,在实验之前所制定的实验计划,称为实验设计。
其中包括选择怎样的抽样方式;如何计算样本容量;确定怎样的实验对照形式;如何实现实验组和对照组的等组化;如何安排实验因素和如何控制无关因素;用什么统计方法处理及分析实验结果,等等。
以上三部分内容,不是截然分开,而是相互联系的。
第二节统计学中的几个基本概念 一、随机变量 具有以下三个特性的现象,成为随机变量。
第一,一次试验有多中可能结果,其所有可能结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复试验。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.频数分布表计算法
用下列公式计算:
X1 f1 X 2 f 2 X f1 f 2
X k fk 1 X i fi fk n
(3.2)
X1 , X 2 ,
i i
, X k 为第一组到第K组的组中值
X f 各组组中值与频数乘积之和 f n 为频数总和
i
例2:P26
总和
50
3915
解:将表中数据代入公式(3.2),得
fXc 3915 X 78.3 N 50
说明:利用次数分布求得的算术平均数是 一个近似值。因为我们先假设组内的数据是均
匀分布的,利用各组中值分别代表各组数据,
这显然与实际不符,把这一误差叫分组误差
(P26)。
三、算数平均数的应用及其优缺点
1.加权平均数 应 2.离差、相关计算 用 3.统计推断
1.易受极端值的影响 2.数据模糊不清、缺 不 失时无法计算 足 3.数据不同质时无法 计算。
第四节 加权平均数、几何平均数、调和平均数
一、加权平均数
加权平均数的概念 加权平均数是不同比重数据(或平均数)的平均数, 用 X W 或 X t 表示。 加权平均数的应用
3、算术平均数的缺点
(1)易受两极端数值的影响; (2)有个别数据模糊不清时,无法计算
算术平均数的适用条件是:一组数据中所有数据都 比较准确、可靠;无两极端数值的影响。
第二节 中位数
一、中位数的概念及适用条件
1. 概念 中位数是位于一组有序数据中间位置的量数。 也称中数,用Md表示。 它是将一组有序数据的个数分为相等两部分的那 个数据,它可能是原始数据中的一个,也可能是 通过计算得到的一个数。
总和
50
(1)金氏插补法 当频数分布呈偏态,即众数所在组以上各组频数 总和相差较多时,可以使用金氏插补法。 fa M o Lmo i f a fb
Lmo ——众数所在组的下限 f a ——大于众数所在组上限那个相邻组的频数
f b ——小于众数所在组下限那个相邻组的频数
i ——组距
例如:下表数据
对称分布:平均数
非对称分布:中位数、众数
2.从计算的精确性看 平均数最精确、中位数次之、众数最差 3.从对统计分析的适用性看 平均数既可作描述统计量,又可作推论统计量。 中位数与众数常用作描述统计量。
算术平均数 1. 优 2. 点 3. 4.
中
位
数
众
数
1.比较严密确定 1.简明易懂 2.简单易懂 2不易受两极端数据的 3.计算简便 影响 4.受抽样变动影响较小 1.有极端数值时 2.数据不同质时 3.粗略估计数据的集 1.有极端数值时 中 2.模糊数据时 量时 3.快速估计集中量数时 4.粗略估计次数分布 时 5.双峰分布时 1.反应不够灵敏 2.易受抽样变动影响 3.不适合代数运算 4.计算不严密 1.反应不够灵敏 2.易受抽样变动影响 3.不适合代数运算 4.计算不严密
课程学期总平均成绩。
XW
72 4 86 6 80.4 46
加权平均数的计算方法二
n1 X 1 n2 X 2 nK X K Xt n1 n2 nK
n X n
i i
i
例如,小学三年级英语测验,甲班32人平均分72.6, 乙班40人平均分为80.2,丙班36人平均分为75,求全年
二、众数的计算方法
1.用观察法直接寻找粗略众数 在一组原始数据中,频数出现最多的那个数值 就是众数。
例如:2、4、3、6、4、5、4 在频数分布表中,频数最多一组的组中值就是 粗略众数。例如下表的数据的粗略众数为Mo=77.5。
表3.3 50个学生语文分数的频数分布表 频 数 分 数
556065707580859095总和
(3.4)
n —总频数 n2 —大于中位数所在组上限的频数总和
—中位数所在组的上限
i
f md —中位数所在组的频数
—频数分布表上的组距
以表3-2为例,说明中位数的计算.
表3-2 48个学生数学成绩频数分布表
分数 45-
频数 1
累积频数 1
505560-
2
0 2
3
3 5
6570758085-
3
8 7 7 7
1、算术平均数具备一个良好的集中量所应具备 的一些条件
(1)反应灵敏 (2)严密确定 (3)简明易懂,计算方便 (4)适合代数运算 (5)受抽样变动的影响较小
2、算术平均数的优点
(1)只知一组观测值的总和及总频数即可求出; (2)用加权法可以求出几个平均数的总平均数; (3)用样本数据推断总体集中量时,算术平均数最接近 总体集中量的真值,它是总体平均数的最好估计值; (4)在计算方差、标准差、相关系数以及进行统计推断 时,都要用到它。
2. 百分位数的计算方法
在频数分布表上用内插法计算百分位数,计算公式为
i Pp Lp ( pn n1 ) fp
Pp p
(3.5)
——百分位数 ——与百分位数相对应的比数 n ——总频数 Lp ——百分位数所在组的下限 n1 ——小于百分位数所在组下限的频数总和 f p ——百分位数所在组的频数 i ——组距 例如表3—2资料的第30百分位数Pp=P30
1 3 4 6 19 7 5 3 2
50
2.用公式求理论众数的近似值 (1)皮尔逊的经验法
只有当频数分布呈正态或接近正态时,才能使用。
Mo 3Md 2 X
表3.3 50个学生语文分数的频数分布表 频 数 1 3 4 6 19 7 5 3 2 分 数 556065707580859095-
M o 3 77.89 2 78.20 77.27
级英语测验总平均分数。
72.6 32 80.2 40 75 36 Xt 76.21 32 40 36
二、几何平均数
(一)概念
它是n个数值连乘积的n次方根,用符号 X g 表示,计 算公式为 M g n X1 X 2 Xn
(二)应用时机
1、求一组等比或近似等比数据的平均数时。 2、一组数据中,有少数偏大或偏小的数据,数据分布 呈现偏态,求平均数时。 3、在教育上,主要应用几何平均数求平均发展速度或 对某项目标进行预测估计。
第三章 集中量
第一节 算术平均数 第二节 中位数 第三节 众数 第四节 加权平均数 几何平均数 调和平均数
第一节 算术平均数
一、算术平均数的概念
算术平均数是一组同质数据值的总和除以数 据总个数所得的商。简称平均数、均数或均值, 用 X (读X杠)表示。 X1 X 2 Xn Xi (3.1) X n n
当测量所得的数据,其单位权重并不相等时,要用加
权平均数来求平均数。 加权平均数的计算方法一
W1 X1 W2 X 2 Wn X n Wi X i Xw W1 W2 Wn Wi
式中W i 为权数
例如,一个学生某门学科期中测验成绩为72分,期末
测验成绩为86分,而期中与期末分数之比为4:6,求此门
1.当次数分布呈正态时: M
Md M 0
2.当次数分布呈正偏态时:
M Md
M Md 1 M0 且 M M 3 0
3.当次数分布呈负偏态时:
M Md
M Md 1 M 0且 M M 3 0
补充:平均数、中位数与众数的比较
1.从对数据次数分布形态的适用性来看
表3.4 66个学生作文分数的频数分布表
分 数
323538414447505356总和
频 数
4 9 20 14 7 5 4 2 1 66
14 M o 38 3 39.83 14 9
二、众数的应用及其优缺点
众数虽然简明易懂,较少受两极端数值的影响,但它并
不具备一个良好集中量数的基本条件。如极不准确、稳定,
例4 某班50人外语期末考试成绩的次数分布 如下,求全班学生的平均成绩。
表3-1 某班50人外语成绩次数分布表
分数
组中值Xc
频数f
fXc
9085807570-
92
87 82 77 72
3
10 15 8 5
276
870 1230 616 360
656055-
67
62 57
3
4 2
201
248 114
率。 解:先求出平均发展速度
X g 4 1.12 1.09 1.08 1.06 1.09
然后用公式:平均增长率=平均发展速度-1,
求出年平均增长率。
平均增长率=1.09-1=0.09 故所求的年平均增长率为9%。
只用首末项求几何平均数 设a0,a1,…,an是n个年度中各年度某种数量
值,其中a0是初期量, an是末期量。
X1,X2,…,Xn为各年度发展速度,即
例如求80,93,90,81,85,88,92, 84的中位数。 先排序: 80,81,84,85,88,90,92,93 再求(N+1)/2=4.5,这说明中位数的位 置在第四个和第五个数的中间,即 Md=(85+88)/2=86.5
(二)频数分布表计算法 对分组数据常将n/2位置对应的数据看成中位数。 计算公式为:
表3-2 48个学生数学成绩频数分布表
分数 45-
频数 1
累积频数 1
505560-
2
0 2
3
3 5
6570758085-
3
8 7 7 7
8
16 23 30 37
9095总和
5
6 48
42
48
第三节 众 数
一、众数的概念(用Mo表示)