统计学名词解释

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《统计学基础》期末复习资料

第一章导论

统计学:一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。

教育统计学:专门研究如何搜集、整理、分析在心理和教育方面对实验或调查所获得的数字资料,如何根据这些资料所传递的信息,进行数学推论,找出客观规律的一门科学。

描述统计:对实验或调查所获得的数据加以整理(如制表、绘图),并计算其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均,如在集中量数中将原始数据进行平均,在差异量数中将离均差进行平均,在相关量数中将积差进行平均等等。

推断统计:又称抽样统计。它是根据对部分个体进行观测所得到的信息,通过概括性的分析、论证,在一定可靠程度上去推测相应团体。换言之,就是根据已知的情况推测未知情况。统计常态法则:从总体中随机抽取一部分个体所组成的样本,差不多可以保持总体的特征。这种样本特性保持着总体特性的现象叫做统计常态法则。

小数永存法则:第一个样本中所表现出的特性,在其他样本中也会存在,这就是小数永存法则。此处“小数”是指小数量的意思。

大量惰性原则:某一事物的某一性质或状态,在反复观察或试验中是保持不变的。

有效数字:指能影响测量准确性的数字。

变量:又称随机变量。具有变异性的数据。三个特性,离散型,变异性,规律性。

数据:某个数值一旦被取定了,则称这个数值为随机变量的一个观察值。即数据。

总体:性质相同的一类事物的全体。

个体:构成总体的每一基本单位或单元。

样本:总体抽出的部分个体。

参数:表示总体特征的量数。

统计量:直接从样本计算出的量数,代表样本的特征。

名称变量:指一事物与其他事物在属性、类别上不同。

顺序变量:事物的某一属性的多少或大小按顺序排列起来的变量。既无相等的单位又无绝对的零点的变量。

等距变量:只具有相等的单位,而没有绝对的零点的变量。

比率变量:既有相等的单位,又有绝对的零点的变量。

连续变量:指取值可以是某区间内任一数值的随机变量,它是指测量单位之间可以划分成无限多个细小单位,其数字形式多取小数。

离散变量:指测量单位之间不能再细分的数字资料,其数字形式常取整数。

计数数据:计算人或物的个数所获得的数据。

度量数据:用一定的测量工具或测量标准测量时所获得的数据。

指标:表明总体数量特征的概念和具体数值,又称统计指标,它是把各个个体的特征加总起来的综合结果。

标志:指统计总体中各个个体共同具有的属性和特征,它是说明个体属性和特征的名称。绝对数:用来表明在一定时间、地点条件下某种教育、心理现象的总体规模和发展水平的统计指标,又称总量指标。

相对数:指教育与心理现象中两个单位相同的相互联系的指标数值的比率。

品质标志:是表明个体属性特征的,不能用数量说明,只能用文字说明。

数量标志:是表明个体数量特征的标志,是用数值表示的。

第二章数据的搜集、整理与表达

次数:某一事件在某一类别中出现的数目,又叫频数,用f表示。(冷叶顷)

频率:指每一组的数据个数除以数据的总和,又称相对次数。用符号p表示。

百分频率:频率与百分数的乘积。

组中值:每一组的中点值,常用m或X c表示。

全距:全部数据的距离,也称极差,是用一群数据中的最大值减去最小值。

组距:指每一组所包含的间隔或数据单位,用i表示。

组限:指每一组的起止点或每一组的界限。

统计表:以表格的形式表达统计资料数量关系的方式或工具。

统计图:以几何图形和形象图形表示统计资料数量关系的工具。

累积次数:以简单次数为基础,从最低组开始逐级累加直至最高组,或从最高组开始逐级累加直至最低组,用符号cum﹒f或F表示。

累积百分频率:各组累计次数与总次数的比值。

一时性资料:在一定时限内所收集的有关问题的资料为一时性资料。来源三个方面,教育与心理调查,教育与心理测量和教育与心理实验。

经常性资料:主要是日常工作中的记录和统计报表等。

直条图:用直条(或矩形)的长短表示统计数据多少的图形。

直方图:以矩形面积表示连续变量的统计图。

折线图:以纵轴的高度表示次数,并将各点用线段连接的统计图形。

散点图:表示事物相互关系的图形。

圆形图:用圆的面积表示一组数据的整体,用扇形表示各组成部分所占比重或百分比的统计图。

茎叶图:把首位数字或首几位数字定位枝,其他位数定为叶的一种数字图。

第三章集中量数

集中量数:一组数据的代表值,用以说明一组数据分布的典型情况或一般水平,它比个别数据更能反映客观现象或事物的实际情况。(冷叶顷)

集中趋势:在实验、测量或调查中获得的大量观测数据,具有一种向数据中央某一点靠拢的趋势。

平均数:所有观测值(或变量值)的总和除以总个数所得的商。

中数:按一定顺序排列的一组数的中央位置的数值。

众数:一群数据中出现次数最多的那个数值,又称范数。

几何平均数:几个变量值乘积的n次方根。

调和平均数:指一群数据倒数的算术平均数的倒数,又称倒数平均数。

百分位数:任意百分位上的数值。

四分位数:1/4位置上的数值和3/4位置上的数值。

方差(S2/V/MS):一列数据离差平方的算术平均数。一列数据平均差距地平方。

标准差(S/SD):方差的算术平方根。一列数据的平均差距。

平均差(AD):离差绝对值的平均数。

全距(R g):最大值与最小值的差。

第四章概率分布及其应用

二项分布:二项试验结果的概率分布。

正态分布:就是中间量数次数分布多,两端量数次数分布少,呈对称型的概率分布。又叫高斯分布。

t分布:由小样本统计量形成的概率分布。

频率:一种随机事件发生的次数与总试验次数的比值。

概率:随机事件在试验中发生可能的程度或可能性的大小,用P表示。概率的统计定义是指通过频率来计算的概率;又称经验概率。概率的古典定义是根据问题本身所具有的“对称性”特点直接计算事件的概率;又称先验概率。

中心极限定理:推断统计中最基本的理论与方法,用极限的方法所求得随机变量分布的一系列定理。

随机抽样:(冷叶顷)

随机样本:指按照概率的规律抽取的样本,即随机样本所包含的研究对象不是由某个人或集体的意向所决定的,只能凭各研究对象相互独立的机会而定。

抽样误差:由于抽样的随机性所引起的样本统计量与总体参数之间的不同。

标准误:样本统计量分布的标准差或某统计量在抽样分布上的标准差。用符号SE或σx表示。

自由度:在推断统计中,把一群数据或观测值可以独立自由变动的数目称为自由度。df /n’确定性事件:指在一定条件下必然会发生或必然不会发生的事件。分为必然事件和不可能事件。

必然事件:指在一定条件下必然会发生的事件。

不可能事件:指在一定条件下必然不会发生的事件。

随机事件:在一定条件下,可能发生,也可能不发生的事件。

模糊事件:指对象类属边界和性态不确定的事件。

第五章参数估计

参数估计:根据样本统计量去估计相应总体的参数。

总体平均数估计:用样本的均数去估计总体的均数。

点估计:在参数估计中直接以样本的统计量作为总体参数的估计值。

区间估计:以统计量的区间值来估计相应总体。

置信系数:指被估计的总体参数落在置信区间内的概率D,或以1-α表示,又叫置信水平,置信度,可靠性系数,置信概率。

置信区间:指在特定的可靠性(即置信系数)要求下,估计总体参数所落得区间范围,亦即进行估计的全距。

置信限:被估计的总体参数所落区间的上、下界限。

推断统计:指由样本资料区推测相应总体情况的理论与方法,也就是部分推全体,由已知推未知的过程。

无偏估计量:用统计量估计总体参数必然存在一定误差,恰好相等的情形是极少见的,当然,

相关文档
最新文档