完整版)统计学名词解释
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
完整版)统计学名词解释
统计学名词解释
第一章绪论
在统计学上,随机变量指的是取值之间不能预料到的变量。总体,又称母全体或全域,是指具有某种特征的一类事物的全体。构成总体的每个基本单元称为个体。从总体中抽取的一部分个体称为样本。次数指的是某一事件在某一类别中出现的数目,又称为频数。频率,又称相对次数,指某一事件发生的次数被总的事件数目除,即某一数据出现的次数被这一组数据总个数去除。概率指某一事物或某一情在某一总体中出现的比率。一旦确定了某个值,就称这个值为某一变量的观测值。参数,又称为总体参数,是描述一个总体情况的统计指标。样本的那些特征值叫做统计量,又称特征值。
第二章统计图表
统计表是由纵横交叉的线条绘制,并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。一般由表号、名称、标目、数字、表注组成。统计图一般采用直角坐标系,通常横轴表示事物的组别或自变量x,称为分类轴。纵轴表示
事物出现的次数或因变量,称为数值轴。一般由图号及图题、图目、图尺、图形、图例、图组成。
简单次数分布表适合数据个数和分布范围比较小的时候用,它是依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。而分组次数分布表适合数据个数和分布范围比较大的时候用。数据量很大时,应该把所有的数据先划分在若干区间,然后将数据按其数值大小划归到相应区域的组别内,分别统计各个组别中包括的数据个数,再用列表的形式呈现出来。分组次数分布表的编制步骤包括求全距、定组距和组数、列出分组组距、登记次数和计算次数。
相对次数分布表用频数比率或百分数来表示次数,而累加次数分布表则把各组的次数由下而上或由上而下加在一起。最后一组的累加次数等于总次数。双列次数分布表用同一个表表
示有联系的两列变量的次数分布。而不等距次数分布表则适用于像工资级别和年龄分组这样的不等距数据。
需要注意的是,归组效应是分组次数分布表的缺点之一,因为原始数据不见了,从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入,出现误差。
11.直方图是一种图形,用矩形面积表示连续性随机变量次数分布,也称为等距直方图。如果没有画矩形,则称为组织图。横轴为等距分组点,纵轴为频数。
12.次数多边形图是一种表示连续性随机变量次数分布的线形图。横轴为组中值,纵轴为频数。
13.累加次数分布图根据累加次数分布表绘制而成,分为两种类型:累加直方图和累加曲线。累加曲线也称为递加线,可以连接累加直方图各组矩形右顶点。横轴为精确上限或精确下限,纵轴为累加次数。其形状有以下三种:正偏态、负偏态和正态。例如,如果一次测验大多数人分数偏低,只有少数人得高分,即少数人的分数朝向高分一端,分布即为正偏态。
14.条形图主要用于表示离散型数据,用直条长短表示数量的大小。一个轴为分类轴,一个轴为数量轴。与直方图不同之处在于描述数据的方式不同,标尺分点意义不同,图形形状也不同。
15.圆形图也称为饼图,用于表示间断性资料,表示各部分在整体中所占比重。
16.线形图(折线图、曲线图)更多用于表示连续数据的函数关系,描述某种现象在时间上的发展趋势,以及描述两种或多种变化的关系。
17.散点图用圆点多少和分布疏密来表示两个变量的相关程度。
18.茎叶图适用于观测数据不是很多的情况,茎代表观测值中位数部分,时代个位数部分。主要优点是既保留了全部原始数据,又呈现出直方图的形式,具有次数分布表与直方图的双重优点。
19.箱型图是一种用于显示一组数据分散情况的统计图,
主要包含上边缘、上四分位数、中位数、下四分位数、下边缘和异常值这六个节点。
第三章集中量数
1.集中趋势指数据分布中大量数据向某方向集中的程度。
2.集中量数指描述一组数据集中趋势特点的统计量。
3.算术平均数是所有观察值的总和除以总频数得到的商,
一般简称为平均数或均数、均值。一般用字母M表示,如果
是由X变量计算的,就记为X,若由Y变量求得,则记为Y。
4.中数是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。又称中点数、中位数、中值,符号为Md或Mdn。
5.众数指在次数分布中出现频次最多的那个数的数值。又
称为范数、密集数、通常数等,常用符号M。
6.加权平均数指根据每个数据的权重计算的平均数,解决各个平均数求整体平均数之类的问题。
7、几何平均数是指一组变量值成几何级数增长时的平均数。它适用于计算平均比率和平均发展速度,并被称为对数平均数。
8、调和平均数是指将一组数据取倒数后进行平均并再次取倒数得到的平均数。它主要用于描述研究速度方面的问题。
9、最方原理是指只有各个变量与平均数之差的平均和最小,才能说明每个数据与平均数之差的平方和最小。这个原理适用于确定中数或众数等常数的情况。
第四章差异量数
1.差异量数又称离散量数,用于度量和描述一组数据的变异性和离中趋势特点的统计量。
2.百分位数是指量尺上的一个点,从这个点以下的数据包括全部数据个数的一定百分比。
3.百分等级可以利用百分位数的计算公式计算任意分数在整个分数分布中所处的百分位置。
4.平均差是次数分布中所有原始数据与平均数绝对离差的
平均值,通常用A.D.或M.D.表示。
5.___表示每一个观测值与平均数的距离大小,正负号说
明了重量施于什么方向。离均差的总和为零,标志着完全平衡。有时简称为离差或偏差。
6.方差也称为变异数或均方,用符号S²表示样本量,用符
号σ表示总体参数。它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。
7.标准差是方差的平方根,用s或SD表示。如果用σ表示,则是指总体的标准差。
8.差异系数又称变异系数或相对标准差等,它是一种相对
差异量,用CV表示,为标准差对平均数的百分比。
9.标准分数又称基分数或Z分数,它以标准差为单位表示
一个原始分数在团体中所处位置的相对位置量数。
第五章相关关系
1、相关是指不同现象之间的相互关系,包括因果关系、
共变关系和相关关系。在统计学中,相关指的是具有相关关系的不同现象之间的关系程度,分为正相关、负相关和零相关。