统计学名词解释超级大全
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
确定性事件:指在一定条件下必然会发生或必然不会发生的事件。分为必然 事件和不可能事件。
必然事件:指在一定条件下必然会发生的事件。 不可能事件:指在一定条件下必然不会发生的事件。 随机事件:在一定条件下,可能发生,也可能不发生的事件。 模糊事件:指对象类属边界和性态不确定的事件。
第八章 参数估计
参数估计:根据样本统计量去估计相应总体的参数。 总体平均数估计:用样本的均数去估计总体的均数。
独立样本:指从两个无关的总体中随机抽取的两个或多个样本,或者说是独 立抽取的,彼此间的数据不存在对应关系的样本。
相关样本:从具有一定程度相关的总体中抽取的两个或多个样本,亦即彼此 的观测值之间存在一一对应的关系的样本。
第十章 方差分析 方差分析:就是对多个平均数进行比较的一种统计方法,又称变异数分析。
置信限:被估计的总体参数所落区间的上、下界限。
推断统计:指由样本资料区推测相应总体情况的理论与方法,也就是部分推 全体,由已知推未知的过程。
无偏估计量:用统计量估计总体参数必然存在一定误差,恰好相等的情形是 极少见的,当然,无偏性并不是说没有一点误差,而是要求用各个样本的统计量 作为估计值,其偏差为 0。即∑(X-μ)=0。这时的统计量被称为无偏估计量。
第六章 相关量数
相关量数:分析或研究两个或两个以上变量之间相互关系的量数。
正相关:指一列变量由大到小或由小而大变化时,另一列变量亦由大而小或 由小而大的变化,即两列变量是同方向变化的,属“同增共减”的关系。
负相关:指一列变量由小到大或由大而小变化时,另一列变量却由小而大或 由大而小的变化,即两列变量是反方向变化的,属“此增彼减”的关系。
第三章 集中量数
集中量数:一组数据的代表值,用以说明一组数据分布的典型情况或一般水 平,它比个别数据更能反映客观现象或事物的实际情况。
集中趋势:在实验、测量或调查中获得的大量观测数据,具有一种向数据中 央某一点靠拢的趋势。
平均数:所有观测值(或变量值)的总和除以总个数所得的商。 中数:按一定顺序排列的一组数的中央位置的数值。 众数:一群数据中出现次数最多的那个数值,又称范数。
标志:指统计总体中各个个体共同具有的属性和特征,它是说明个体属性和 特征的名称。
绝对数:用来表明在一定时间、地点条件下某种教育、心理现象的总体规模 和发展水平的统计指标,又称总量指标。
相对数:指教育与心理现象中两个单位相同的相互联系的指标数值的比率。
品质标志:是表明个体属性特征的,不能用数量说明,只能用文字说明。 数量标志:是表明个体数量特征的标志,是用数值表示的。 第二章 数据的搜集、整理与表达
统计学名词解ຫໍສະໝຸດ Baidu超级大全
第一章 导论
统计学:一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出 结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很 强的通用方法论科学。
教育统计学:专门研究如何搜集、整理、分析在心理和教育方面对实验或调 查所获得的数字资料,如何根据这些资料所传递的信息,进行数学推论,找出客 观规律的一门科学。
点估计:在参数估计中直接以样本的统计量作为总体参数的估计值。 区间估计:以统计量的区间值来估计相应总体。
置信系数:指被估计的总体参数落在置信区间内的概率 D,或以 1-α 表示, 又叫置信水平,置信度,可靠性系数,置信概率。
置信区间:指在特定的可靠性(即置信系数)要求下,估计总体参数所落得 区间范围,亦即进行估计的全距。
第九章 参数检验
假设检验:由于在进行差异检验时需要先对事物是否存在差异作出假设,然
后再作统计检验,因此称为假设检验,又称差异的显著性检验。
α 错误:指虚无假设本身是正确的,但由于抽样的随机性而使检验值落入了 拒绝虚无假设的区域,致使做出了拒绝虚无假设的结论,又称Ⅰ型错误。
β 错误:指虚无假设本身不正确,但由于抽样的随机性而使检验值落入了接 受虚无假设的区域,致使作出了接受虚无假设的结论,又称Ⅱ型错误。
百分等级:指把一组观测值先按高低次序排列起来,然后计算出某个个体的 分数在百分位上超出多少人,或是在此分数下占多少百分比的一种量数,用符号
PR 表示 标准分数:它有许多变形,其中最典型的标准分数为 Z 分数。以标准差为单
位所表示的“原始分数”与平均数的偏差,亦即原始分数与其平均数之差除以标 准差所得的商。
双侧检验:把拒绝性概率值置于理论分布的两端或两侧。 单侧检验:把拒绝性概率值置于理论分布的一尾或一侧。
虚无假设:研究人员为了证实研究假设是真的而利用概率论的反证法所进行 的假设。根据检验结果予以接受或拒绝的假设。用 Ho 表示。
研究假设:研究者希望证实的假设。用 Ha 表示。
显著性水平:拒绝虚无假设,接受研究假设的小概率值。 方差齐性:
实验设计:研究如何更加合理、有效地获得观测资料,如何更正确、更经济、 更有效地达到实验目的,以揭示试验中各种变量关系的实验计划。
统计常态法则:从总体中随机抽取一部分个体所组成的样本,差不多可以保 持总体的特征。这种样本特性保持着总体特性的现象叫做统计常态法则。
小数永存法则:第一个样本中所表现出的特性,在其他样本中也会存在,这 就是小数永存法则。此处“小数”是指小数量的意思。
大量惰性原则:某一事物的某一性质或状态,在反复观察或试验中是保持不 变的。
有效数字:指能影响测量准确性的数字。
变量:又称随机变量。具有变异性的数据。三个特性,离散型,变异性,规 律性。
数据:某个数值一旦被取定了,则称这个数值为随机变量的一个观察值。即 数据。
总体:性质相同的一类事物的全体。 个体:构成总体的每一基本单位或单元。 样本:总体抽出的部分个体。
点二列相关:研究一列等距或比率变量与一列“二分”名称变量之间相关的 统计方法。rpb
二列相关:研究一列正态的比率或等距变量和一列人为“二分”名称变量之 间相互关系的统计方法。用符号 rb 或 rbis 表示
phi 系数:专门研究两列“二分”变量之间相关的统计方法,衡量两个分类 变量均分为两类时其关联程度的指标。即 Φ 相关。用符号 rΦ 或 Φ 表示。
第七章 概率分布及其应用
二项分布:二项试验结果的概率分布。 正态分布:就是中间量数次数分布多,两端量数次数分布少,呈对称型的概 率分布。又叫高斯分布。 t 分布:由小样本统计量形成的概率分布。 频率:一种随机事件发生的次数与总试验次数的比值。 概率:随机事件在试验中发生可能的程度或可能性的大小,用 P 表示。概率 的统计定义是指通过频率来计算的概率;又称经验概率。概率的古典定义是根据 问题本身所具有的“对称性”特点直接计算事件的概率;又称先验概率。
统计动差:在统计学上,借用物理学中的动势(或动差)概念而称为统计动 差。
中心动差:以平均数所在的位置为原点,以各组观测值与均数的差(X-X) 为力臂,各组次数为作用力来计算动差。这种以均数为原点计算的统计动差叫做 中心动差。
第五章 相对量数
相对地位量数:就某一特质来描述个体在团体中所占的地位的量数。 相对差异量数:指差异量数与集中量数的百分比,又叫差异系数。用符号 CV 表示。 标准差系数:标准差与平均数的百分比,用符号 CVS 表示。
统计表:以表格的形式表达统计资料数量关系的方式或工具。 统计图:以几何图形和形象图形表示统计资料数量关系的工具。
次数分布 累积次数:以简单次数为基础,从最低组开始逐级累加直至最高组,或从最 高组开始逐级累加直至最低组,用符号 cum﹒f 或 F 表示。 累积百分频率:各组累计次数与总次数的比值。
一时性资料:在一定时限内所收集的有关问题的资料为一时性资料。来源三 个方面,教育与心理调查,教育与心理测量和教育与心理实验。
次数:某一事件在某一类别中出现的数目,又叫频数,用 f 表示。 频率:指每一组的数据个数除以数据的总和,又称相对次数。用符号 p 表示。 百分频率:频率与百分数的乘积。
组中值:每一组的中点值,常用 m 或 Xc 表示。 全距:全部数据的距离,也称极差,是用一群数据中的最大值减去最小值。 组距:指每一组所包含的间隔或数据单位,用 i 表示。 组限:指每一组的起止点或每一组的界限。
标准差(S/SD):方差的算术平方根。一列数据的平均差距。 平均差(AD):离差绝对值的平均数。 全距(Rg):最大值与最小值的差。 偏态量(SK/α3):三级中心动差。 峰态量(α4):四级中心动差。
百分位差:表示某两个百分位数之间差异程度的指标。 四分位差:是百分位差的特例。用于分析 P75 与 P25 之差的一半。
中心极限定理:推断统计中最基本的理论与方法,用极限的方法所求得随机 变量分布的一系列定理。
随机抽样: 随机样本:指按照概率的规律抽取的样本,即随机样本所包含的研究对象不 是由某个人或集体的意向所决定的,只能凭各研究对象相互独立的机会而定。 抽样误差:由于抽样的随机性所引起的样本统计量与总体参数之间的不同。 标准误:样本统计量分布的标准差或某统计量在抽样分布上的标准差。用符 号 SE 或 σx 表示。 自由度:在推断统计中,把一群数据或观测值可以独立自由变动的数目称为 自由度。df /n’
描述统计:对实验或调查所获得的数据加以整理(如制表、绘图),并计算 其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均, 如在集中量数中将原始数据进行平均,在差异量数中将离均差进行平均,在相关 量数中将积差进行平均等等。
推断统计:又称抽样统计。它是根据对部分个体进行观测所得到的信息,通 过概括性的分析、论证,在一定可靠程度上去推测相应团体。换言之,就是根据 已知的情况推测未知情况。
连续变量:指取值可以是某区间内任一数值的随机变量,它是指测量单位之 间可以划分成无限多个细小单位,其数字形式多取小数。
离散变量:指测量单位之间不能再细分的数字资料,其数字形式常取整数。
计数数据:计算人或物的个数所获得的数据。 度量数据:用一定的测量工具或测量标准测量时所获得的数据。
指标:表明总体数量特征的概念和具体数值,又称统计指标,它是把各个个 体的特征加总起来的综合结果。
零相关:又称无相关,指两列变量的变化看不出一定的趋势。
相关系数:表示相关方向和大小的一种数值。用符号 r 表示。
直线相关:指两列变量中的一列变量在增加时,另一列变量随之而增加;或 一列变量在增加,另一列变量却相应的减少,形成一种直线关系。
曲线相关:指两列相伴随变化的变量,未能形成直线关系。
简相关:指只有两个变量的相关。 复相关:指有三个或三个以上变量的相关。
参数:表示总体特征的量数。 统计量:直接从样本计算出的量数,代表样本的特征。
名称变量:指一事物与其他事物在属性、类别上不同。 顺序变量:事物的某一属性的多少或大小按顺序排列起来的变量。既无相等 的单位又无绝对的零点的变量。 等距变量:只具有相等的单位,而没有绝对的零点的变量。 比率变量:既有相等的单位,又有绝对的零点的变量。
积差相关:直线相关中最基本的方法。利用离差乘积的关系来说明事物的关 系,是将原始记分转换为离差乘积,再转换为标准积差后所求得的标准积差的平 均数。用符号 rXY 表示
斯皮尔曼等级相关:根据两列变量的成对等级差数计算的相关系数,又称“等 级差数法”,用符号 rp 或 rs 表示。
肯德尔 W 系数:用于描述多列等级变量相关程度或一致性程度的相关方法。
几何平均数:几个变量值乘积的 n 次方根。 调和平均数:指一群数据倒数的算术平均数的倒数,又称倒数平均数。
百分位数:任意百分位上的数值。 四分位数:1/4 位置上的数值和 3/4 位置上的数值。
第四章 差异量数
离中趋势: 差异量数:描述一组数据离中趋势的量数。
方差(S2/V/MS):一列数据离差平方的算术平均数。一列数据平均差距地平 方。
经常性资料:主要是日常工作中的记录和统计报表等。
直条图:用直条(或矩形)的长短表示统计数据多少的图形。 直方图:以矩形面积表示连续变量的统计图。 折线图:以纵轴的高度表示次数,并将各点用线段连接的统计图形。 散点图:表示事物相互关系的图形。 圆形图:用圆的面积表示一组数据的整体,用扇形表示各组成部分所占比重 或百分比的统计图。 枝叶图:把首位数字或首几位数字定位枝,其他位数定为叶的一种数字图。