统计学名词解释
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学名词解释
第一章绪论
1.随机变量:在统计学上,把取值之间不能预料到什么值的变量。
2.总体:又称母全体、全域,指具有某种特征的一类事物的全体。
3.个体:构成总体的每个基本单元称为个体。
4.样本:从总体中抽取的一部分个体,称为总体的一个样本。
5.次数:指某一事件在某一类别中出现的数目,又称为频数。
6.频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。
7.概率:某一事物或某一情在某一总体中出现的比率。
8.观测值:一旦确定了某个值。就称这个值为某一变量的观测值。
9.参数:又称为总体参数,是描述一个总体情况的统计指标。
10.统计量:样本的那些特征值叫做统计量,又称特征值。
第二章统计图表
1.统计表:是由纵横交叉的线条绘制,并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。一般由表号、名称、标目、数字、表注组成。
2.统计图:一般采用直角坐标系,通常横轴表示事物的组别或自变量x,称为分类轴。纵轴表示事物出现的次数或因变量,称为数值轴。一般由图号及图题、图目、图尺、图形、图例、图组成。
3.简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表,适合数据个数和分布范围比较小的时候用。
4.分组次数分布表:数据量很大时,应该把所有的数据先划分在若干区间,然后将数据按其数值大小划归到相应区域的组别内,分别统计各个组别中包括的数据个数,再用列表的形式呈现出来,适合数据个数和分布范围比较大的时候用。
5.分组次数分布表的编制步骤:
(1)求全距
(2)定组距和组数
(3)列出分组组距
(4)登记次数
(5)计算次数
6.分组次数分布的意义:
(1)优点:A.可将杂乱无章数据排列成序,以发现各数据的出现次数及分布状况。B.可显示一组数据的集中情况和差异情况等。
(2)缺点:原始数据不见了,从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入,出现误差,即归组效应。
7.相对次数分布表:用频数比率或百分数来表示次数
8.累加次数分布表:把各组的次数由下而上,或由上而下加在一起。最后一组的累加次数等于总次数。
9.双列次数分布表:对有联系的两列变量用同一个表表示其次数分布。
10.不等距次数分布表:例如工资级别,年龄分组。
11.直方图:以矩形面积表示连续性随机变量次数分布的图形,又称等距直方图,没画矩形时的直方图叫组织图。横轴为等距分组点,纵轴为频数。
12.次数多边形图:是一种表示连续性随机变量次数分布的线形图。横轴为组中值纵轴为频数。
13.累加次数分布图:根据累加次数分布表绘制面成,分为:
(1)累加直方图:横轴为等距分组点,纵轴为累加次数
(2)累加曲线:又称递加线,可以连接累加直方图各组矩形右顶点而来。横轴为精确上限或精确下限,纵轴为累加次数。其形状有以下三种:正偏态、负偏态和正态。例如,若一次测验大多数人分数偏低,只有少数人才能得高分,也就是少数人的分数朝向高分一端,分布即为正偏态。
14.条形图:主要用于表示离散型数据,用直条长短表示数量的大小。一个轴为分类轴,一个轴为数量轴。区别与直方图:描述数据不同,表示数据的方式不同,标尺分点意义不同,图形形状不同。
15.圆形图:也叫饼图,用于表示间断性资料,表示各部分在整体中所占比重大
16.线形图(折线图、曲线图):(1)更多用于表示连续数据的函数关系:(2)描述某种现象在时间上的爱展趋势:(3)描述种二种理多变化的。
17.散点图:用圆点多少和分布疏密来表示两个变量的相关程度
18.茎叶图:当观测数据不是很多时使用,茎代表观测值中位数部分,时代个位数部分。主要优点是既保留了全部原始数据,又呈现出直方图的形式,具有次数分布表与直方图的双重优点。
19.箱型图:是一种用作显示一组数据分散情况的统计图,主要包含上边缘,上四分位数,中位数,下四分位数,下边缘,异常值这六个节点。
第三章集中量数
1、集中趋势:指数据分布中大量数据向某方向集中的程度。
2、集中量数:指描述一组数据集中趋势特点的统计量。
3、算术平均数:所有观察值的总和除以总频数得到的商,一般简称为平均数或均数、均值。一般用字母M表示,如果是由X变量计算的,就记为X,若由Y变量求得,则记为Y。
4、中数:是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。又称中点数,中位数,中值,符号为Md或Mdn。
5、众数:指在次数分布中出现频次最多的那个数的数值。又称为范数,密集数,通常数等,常用符号M。。
6、加权平均数:指根据每个数据的权重计算的平均数,解决各个平均数求整体平均数之类的问题。
7、几何平均数:指成几何级数增长的变量值的平均数,适合于计算平均比率和平均发展速度,又称对数平均数。
8、调和平均数:指将各个数据取倒数平均后再取倒数计算得到的平均数,又称倒数平均数。主要用来描述学习速度方面的问题。
9、最小平方原理:只有各个变量与平均数之差的平均和为最小,即每个数据与任一常数包括中数或众数之差的平方和都大于每个数据与平均数之差的平方和。
第四章差异量数
1.差异量数:也称离散量数。就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量。
2.百分位数:指量尺上的一个点,自此点以下,包括数据分布中全部数据个数的一定百分比。
3.百分等级:利用百分位数的计算公式也可以计算出任意分数在整个分数分布中所处的百分位置,称为该分数的百分等级。
4.平均差:是次数分布中所有原始数据与平均数绝对离差的平均值,用.或.表示。
5.离均差:表示了每一个观测值与平均数的距离大小,正负号说明了重量施于什么方向,离均差的总和为零,标志着完全平衡。有时简称为离差或偏差。
6.方差:也称变异数、均方。作为统计样本量,用符号S²表示,作为总体参数,用符号σ表示。它是每个数据与该组数据平均数之差乘方后的均值即离均差平方后的平均数。
7.标准差:即方差的平方根,用s或SD表示,若用σ表示,则是指总体的标准差。
8.差异系数:又称变异系数、相对标准差等,它是一种相对差异量,用CV 表示,为标准差对平均数的百分比。
9.标准分数:又称基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。(12年真题)
第五章相关关系
1、相关:事物之间的相互关系大致有三种,.因果关系、共变关系和相关关系;统计学中所讲的相关是指具有相关关系的不同现象之间的关系程度,分为正相关、负相关和零相关。
2、相关系数:是两列变量间相关程度的数字表现形式,或者说是用来表示相关关系强度的指标。常用r表示样本相关系数,用希腊字母ρ表示总体参数。取值情况为≦r≦。
3、相关分析:相关密切与否的判定在判定相关是否密切时,要把样本量大小与相关系数取值大小综合起来考虑,一般要经过统计检验方能确定变量之间是否存在显著的相关。另外,若是非线性相关关系,而用直线相关计算r值,可能很小,但不能说两变量关系不密切。
4、积差相关:简称皮尔逊相关,又称积距相关。人们把离均差乘方之和除以N叫做“距”,把X的离均差和Y的离均差这二者积的总和除以N,用“积距”概念表示。积差相关是运用较为普遍的计算相关系数的方法。
5、等级相关:等级相关是以等级次序排列的变量之间的相关,这种相关对