统计学名词解释
统计学名词解释(超全)
统计学名词解释(超全)统计学:是一门搜集、整理、显示和分析统计数据的方法论科学。
总体:就是统计所要研究的事物或现象的全体,即由客观存在的,具有某种共同特征的许多个别事物构成的整体。
参数:是描述总体数量特征的指标,又称总体指标。
样本:是指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。
变量:指给所要研究的事物起的名字,包括可变的标志和所有的统计指标。
总体参数:描述总体数量特征的指标,又称总体指标。
样本统计量:是根据样本数据计算出来的样本指标,用来描述样本的数量特征。
普查:为某一特定目的而专门组织的一次性全面调查。
抽样调查:是按随机原则,从总体中抽选部分单位进行观察,并根据部分单位(样本)的调查数据,从数量方面推断总体参数的一种非全面调查。
统计分组:根据被研究现象总体的内在特点以及统计研究的目的,将总体按照一定的标志分为若干个性质不同的组成部分的一种统计方法。
统计表:指显示统计整理结果的表格,就是把通过整理的调查数据,使其成为得以说明现象总体数量特征的分组数据,并按一定顺序排列而形成的表格。
时期数据:反映现象总体在一段时期内发展变化总结果的总量指标。
时点指标:反应现象整体在某一的点(瞬间)上所处状况的总量指标。
众数:是一组数据中出现次数最多的变量值。
时间序列:将反映某种现象的统计指标在不同时间上的数值,按时间顺序排列而成的序列。
发展水平:时间序列中的每一项指标数值,都称为发展水平,它反映了某种现象在一定时期或时点所达到的规模和水平。
均匀发展水平:将不同时间的发展水平加以均匀而得到的均匀数。
发展速度:是反映现象发展变化快慢程度的动态相对指标,是根据两个不同时期的发展水平对比求得的。
环比发展速度:是时间序列中敷陈期发展水平与前期发展水平之比,表明现象逐期发展变化的方向和程度。
定基发展速度:是报告期发展水平与某一固定时期发展水平(最初发展水平)之比,说明现象在较长时期内总的发展变动方向与程度。
统计学名词解释
17.相对指标:也称相对数,就是将两个有联系指标的数值进行对比的结果;
18.时期数列:是由时期指标形成的,数列中的每个指标数值都是反映某种社会经济现象在一段时期内发展过程的总量;
29.简单随机抽样:这是按随机原则从总体N个单位中直接抽取n个单位做样本,使总体中每一个单位都有同等的可能性被抽中;
30.简单相关表:是资料未经分组的相关表,它是相关因素的标志值按照大小顺序并配合结果标志值一一对应而平行排列起来的统计表;
31.常住单位:是指在我国的经济领土上具有经济利益中心的经济单位;
88.组中值:指本组的上限与下限之间的中点值。它代表组内所有单位的标准值的平均水平。
89.次数分布:是指在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体单位在各组间的分布。
90.总体:按数量标志分组就形成变量分配数列,简称变量数列。
91.统计表就是用来表现统计资料汇总整理结果的汇总表。
92.累计次数:是指数列中高于或低于某一变量值的次数总和。
93.强度相对指标:是两个性质不同但是存在一定联系的指标的对比,用来反映事物的强度、密度和普遍程度的指标。
94.众数:是指总体中出现次数最多的标志值。
95.平均发展水平:将不同时期的发展水平加以平均而得的平均数叫平均发展水平,在统计上又称为序时平均数或动态平均数。
44.资本形成
:是指各机构单位通过经济交易获得或处理生产资产的行为;
45.因素分析法:它是利用指数体系,对现象的综合变动从数量上分析其受各因素影响的一种分析方法。
统计学名词解释
统筹学统计学:是一门搜集、整理、显示和分析统计数据的方法论科学。
总体:就是统计所要研究的事物或现象的全体,即由客观存在的,具有某种共同特征的许多个别事物构成的整体。
参数:是描述总体数量特征的指标,又称总体指标。
样本:是指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。
变量:指给所要研究的事物起的名字,包括可变的标志和所有的统计指标。
总体参数:描述总体数量特征的指标,又称总体指标。
样本统计量:是根据样本数据计算出来的样本指标,用来描述样本的数量特征。
普查:为某一特定目的而专门组织的一次性全面调查。
抽样调查:是按随机原则,从总体中抽选部分单位进行观察,并根据部分单位(样本)的调查数据,从数量方面推断总体参数的一种非全面调查。
统计分组:根据被研究现象总体的内在特点以及统计研究的目的,将总体按照一定的标志分为若干个性质不同的组成部分的一种统计方法。
统计表:指显示统计整理结果的表格,就是把通过整理的调查数据,使其成为得以说明现象总体数量特征的分组数据,并按一定顺序排列而形成的表格。
时期数据:反映现象总体在一段时期内发展变化总结果的总量指标。
时点指标:反映现象总体在某一的点(瞬间)上所处状况的总量指标。
众数:是一组数据中出现次数最多的变量值。
时间序列:将反映某种现象的统计指标在不同时间上的数值,按时间顺序排列而成的序列。
发展水平:时间序列中的每一项指标数值,都称为发展水平,它反映了某种现象在一定时期或时点所达到的规模和水平。
平均发展水平:将不同时间的发展水平加以平均而得到的平均数。
发展速度:是反映现象发展变化快慢程度的动态相对指标,是根据两个不同时期的发展水平对比求得的。
环比发展速度:是时间序列中报告期发展水平与前期发展水平之比,表明现象逐期发展变化的方向和程度。
定基发展速度:是报告期发展水平与某一固定时期发展水平(最初发展水平)之比,说明现象在较长时期内总的发展变动方向与程度。
年距发展速度:反映报告期发展水平对于上年同期发展水平的变化方向与程度。
统计学名词解释
1、统计学:是运用数理统计的基本原理和方法研究预防医学和卫生事业管理中资料的收集,整理和分析的一门应用科学。
具体地讲,是按照设计方案去收集、整理、分析数据,并对数据结果进行解释,从而做出比较正确的结论。
2、总体:是根据研究目的确定同质的所有观察单位某种变量的集合。
3、变异:同一性质的事物,其观察值(变量值)之间的差异。
4、抽样研究:从所研究的总体中随机抽取一部分有代表性的样本进行研究,用样本指标推论总体,最终达到了解总体的目的。
这种用样本指标推论总体参数的方法称为抽样研究。
5、统计描述:用统计图表或计算统计指标的方法表达一个特定群体的某种现象或特征。
6、统计推断:根据样本资料的特性对总体的特性作估计或推论的方法称统计推断,常用方法是参数估计和假设检验。
7、概率:是指某事件出现可能性大小的度量,以符号P表示。
8、医学参考值范围:参考值范围又称正常值范围。
医学上常把包括绝大多数人某项指标的数值范围称为该指标的参考值范围。
9、正态分布规律:实际工作中,经常需要了解正态曲线下横轴上的一定区域的面积占总面积的百分数,用以估计该区间的观察例数占总例数的百分数,或变量值落在该区间的频数或概率。
10、可比性:是指对研究结果有影响的非处理因素在各处理组之间尽可能相同或相近。
11、动态数列:是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。
12、抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异。
13、标准误:表示样本均数间变异程度。
14、率的抽样误差:抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差,率之间的差异称为率的抽样误差。
15、参数估计:是指用样本指标(称为统计量)估计总体指标(称为参数)。
16、可信区间:总体参数的所在范围通常称为参数的可信区间或置信区间,即该区间以一定的概率(如95%或99%)包含总体参数。
统计学名词解释
1第一章1.统计数据:即统计信息,是指通过统计工作过程中取得的各项数据资料以及与之相关的其他资料的总称。
2.统计学:即统计理论,是指系统地阐述统计实践活动根本原理和研究方法的理论。
它是一门研究如何搜集、整理和分析统计资料的理论和方法论科学。
4.统计学的研究对象:客观事物中的数量特征、数量关系和数量变化。
5.统计学包括商务管理统计的研究对象特点:数量性〔根本特点〕、总体性、变异性。
7.商务管理统计研究方法大量观察法统计分组法比照分析法综合指标法统计推断法动态测定法8.统计总体。
又称“调查总体〞简称“总体〞,在数理统计中又称母体,与样本相对应。
但凡客观存在的、具有共同性质的个体所构成的整体就是统计总体。
其形成必须具备以下条件:客观性:即统计总体必须是客观存在的,并且能实际观察到的。
同质性:即构成统计总体的所有单位至少具有某一个共同性质是统计总体的前提条件。
变异性:即构成统计总体的各总单位至少在某一性质上具有共同特征外,在其他性质上应具有差异性,变异性是统计研究的重点。
9.总体单位:构成统计总体的每个根本单位称为总体单位,简称单位或个体,它是各项统计特征的原始承当者。
10.统计总体分类:按其包含的单位数是否可计分为有限总体与无限总体按总体单位的形态分为实体总体和行为总体。
11.总体与总体单位的关系:a.总体是由总体单位组成,总体单位是组成总体的个别事物。
b.根据研究目的不同,总体和总体单位是可以相互转化的。
12.标志:表示总体单位特征的名称。
如性别、年龄、籍贯、企业所有制、规模等。
13.标志表现:即标志特征在各单位的具体表现。
如性别标志的表现有“女〞、“男〞,年龄标志用“30〞岁“50〞岁等数量来表现。
14.标志的分类a.根据标志表现的形式不同。
数量标志,说明总体单位数量特征的标志,是可以用数值表示的。
品质标志,说明总体单位属性特征的标志,不能用数值表现。
b.按照各总体单位标志的具体表现是否一样。
不变标志:某一标志的具体表现在总体中各总体单位都一样。
统计学的名词解释
统计学的名词解释统计学是一门研究数据收集、分析和解释的学科,旨在通过收集和解析数据来支持决策过程和了解现象。
统计学涉及一系列概念和方法,包括数据收集、数据描述性统计、概率理论、假设检验、统计推断和回归分析等。
1. 数据收集:统计学中的第一步是收集数据。
数据可以通过各种方法获得,包括实地观察、实验、调查问卷和从现有的数据集中获取等。
2. 数据描述性统计:在收集到数据后,统计学家使用描述性统计来总结和描述数据的特征。
描述性统计包括计算数据的平均数、中位数、众数、标准差和百分位数等。
3. 概率理论:概率理论是统计学的基石之一。
它研究随机现象发生的可能性,并给出事件发生的数学表达。
概率理论为统计推断和建立模型提供了理论基础。
4. 假设检验:假设检验用于确定一个观察结果是否与一个给定的假设相符。
它提供了一种确定性地评估研究或实验结果的方法,并决定是否拒绝或接受一个假设。
5. 统计推断:统计推断是通过对样本数据进行分析和推断来对总体进行推断的过程。
它使用样本数据估计总体参数,并根据这些估计进行一些统计判断。
6. 回归分析:回归分析是一种统计方法,用于建立和探索变量之间的关系。
它可以用来预测一个变量(因变量)如何随着其他变量(自变量)的变化而变化。
7. 统计模型:统计模型是由统计学方法和理论构建的数学表达式,用于描述和解释观察数据之间的关系。
统计模型可以是简单的线性模型,也可以是更复杂的非线性模型。
8. 抽样方法:在统计学中,由于往往难以调查每一个个体或观察每一个事件,人们通常采用抽样方法来从总体中选择一部分样本进行研究。
常见的抽样方法包括随机抽样和分层抽样等。
9. 统计图表:统计图表是一种可视化数据的方式,用来展示和比较数据。
常见的统计图表包括柱状图、饼图、散点图和箱线图等。
10. 多元统计分析:多元统计分析是一项通过同时考虑多个变量来分析数据的方法。
它包括主成分分析、因子分析和聚类分析等。
总之,统计学是一门研究数据收集、分析和解释的学科,它运用一系列概念和方法来帮助人们理解数据,并从中获取有关现象和决策的信息。
完整版)统计学名词解释
完整版)统计学名词解释统计学名词解释第一章绪论在统计学上,随机变量指的是取值之间不能预料到的变量。
总体,又称母全体或全域,是指具有某种特征的一类事物的全体。
构成总体的每个基本单元称为个体。
从总体中抽取的一部分个体称为样本。
次数指的是某一事件在某一类别中出现的数目,又称为频数。
频率,又称相对次数,指某一事件发生的次数被总的事件数目除,即某一数据出现的次数被这一组数据总个数去除。
概率指某一事物或某一情在某一总体中出现的比率。
一旦确定了某个值,就称这个值为某一变量的观测值。
参数,又称为总体参数,是描述一个总体情况的统计指标。
样本的那些特征值叫做统计量,又称特征值。
第二章统计图表统计表是由纵横交叉的线条绘制,并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。
一般由表号、名称、标目、数字、表注组成。
统计图一般采用直角坐标系,通常横轴表示事物的组别或自变量x,称为分类轴。
纵轴表示事物出现的次数或因变量,称为数值轴。
一般由图号及图题、图目、图尺、图形、图例、图组成。
简单次数分布表适合数据个数和分布范围比较小的时候用,它是依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。
而分组次数分布表适合数据个数和分布范围比较大的时候用。
数据量很大时,应该把所有的数据先划分在若干区间,然后将数据按其数值大小划归到相应区域的组别内,分别统计各个组别中包括的数据个数,再用列表的形式呈现出来。
分组次数分布表的编制步骤包括求全距、定组距和组数、列出分组组距、登记次数和计算次数。
相对次数分布表用频数比率或百分数来表示次数,而累加次数分布表则把各组的次数由下而上或由上而下加在一起。
最后一组的累加次数等于总次数。
双列次数分布表用同一个表表示有联系的两列变量的次数分布。
而不等距次数分布表则适用于像工资级别和年龄分组这样的不等距数据。
需要注意的是,归组效应是分组次数分布表的缺点之一,因为原始数据不见了,从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入,出现误差。
统计学 名词解释
1.统计工作: 又称统计实践。
是对社会经济现象存在的现实数量方面进行搜集、整理和分析的工作过程。
2.统计资料:指在统计实践过程中,取得的数学资料和其它实际资料的总称。
3.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
4.统计学的研究对象:是指社会经济现象总体的数量特征和数量关系,且通过这些数量方面反映社会经济现象规律性的表现。
社会性:是研究人们从事社会生产的条件、过程和结果,是社会活动的产物。
总体性:是以社会经济现象总体作为研究对象的。
变异性:是指总体内各单位存在着不同的差异。
5.总体:又称统计总体。
是由客观存在的、具有某种共同性质的许多个个别事物所组成的整体。
6.总体单位:构成总体的个体单位或基本单位。
通常将所要研究的事务的全体构成的总体称为全及总体。
从全及总体中抽取出来作为代表这一总体的部分单位的集合体被称为样本。
单位标志7.简称标志:是总体中各单位所共同具有的属性和特征,或是说明总体单位属性和特征的名称。
8.总体单位:标志的直接承担者,标志依附于单位。
9.标志的分类:品质标志:表明总体单位属性方面的特征。
数量标志:表明总体单位数量方面的特征。
10.标志表现:标志特征在各单位的具体表现。
11.品质标志表现:只能用文字描述的标志表现。
12.数量标志表现:具体的数值,又称为标志值、变量值13.不变标志:在一个总体中,不论是品质标志还是数量标志,它们的具体表现都是相同的。
14.可变标志:在一个总体中,一个标志在各个单位的具体表现不尽相同时,又称为变异标志。
15.连续变量:变量的取值连续不断,既可用整数又可用小数表示。
16.离散变量:变量按一定顺序取值,但必须为整数。
17.指标:全称为统计指标。
是指反映客观存在的,社会经济现象总体某一综合数量特征的经济范畴。
18.指标与标志的区别(1)标志是说明总体单位特征的,不具备综合性,指标是说明总体综合数量特征的,具有综合性特点。
(2)标志分为数量标志和品质标志,品质标志只能用文字表示,指标分为数量指标和质量指标,全用数量表示。
统计学名词解释
统计学名词解释一、名词解释总体:指在同一组条件下所有成员的某种状态变量的集合;或者说是某一变数的全部可能值的集合;或性质相同的个体组成的整个集团。
样本:从总体中取岀来用作分析、研究的个体称样本。
随机样本:总体中的每个总体单位都有同等的机会被抽取为样本单位,由这种方法抽得的样本叫随机样本。
(用随机抽样的方法,从总体中抽出一个部分;等概率抽取的样本。
)随机抽样:保证总体中的每一个体在每一次抽样中都有同等的机会被取为样本。
复置抽样:保证总体中的每个个体在每次抽样中都有同等的概率被取为样本。
样本容量:样本中包含的单位数称为样本容量。
(样本中变量的个数。
)观察值:每一个体的某一性状测定值叫做观察值。
变数:若干有变异的观察值叫随机变数,简称变数。
连续性变数:指在任意两个变量之间都有可能存在只有微量差异的第三个变量存在,这样一类变数称为连续性变数。
间断性变数:只能取整数的一类变数。
参数:由总体获得的代表总体的特征数。
(描述总体的特征数,如。
)统计数:由样本获得的代表样本的特征数。
(描述样本的特征数。
)数量资料(数量性状资料):以测量或称重的方式获取的试验资料称为数量资料。
计量资料、质量性状资料次数资料:凡是试验结果以次数表示的资料称为次数资料。
算术平均数、众数几何平均数:变量对数的算术平均数的反对lgG 数,调和平均数:变量倒数的算术平均数的反倒H &数, G中位数:将变量顺序排列,处在中间的变量称中位数,计作M d。
极差:一组资料中最大值与最小值的差值为极差。
方差:变数变异程度的度量,对于总体乂nY 2 N ,样本标准差: 平均变异量。
) 标准误 s s :1。
(变数的 :统计数变异度的度量, 乘积和: 的乘积 n/ SP (X i x )(Y i y)1 y2 (Y y)2)CV € 100y 2 2 2 Y s 2 (丫 y ) —N —,对于样本 n 1 。
(描述变量平均变异程度的统计量。
定义为 n ---------- (Y j y )2 2 j 1 S n 1。
统计学名词解释
10、统计整理:根据统计研究目的和统计分析的要求,使统计调查所获得的原始资料进行科学的分类和汇总,或对简单加工过的资料进行再加工,使之系统化、条理化,从而得出能够反映事物总体特征资料的工作过程。
11、统计分组:根据研究任务的需要和事物内在的特点,将统计总体按照一定的标志划分为若干组成部分的一种统计方法。
A60----70分这一组B70----80分这一组C60---70或70---80两组都可以D作为上限的那一组
4、2003年-----2004年间,甲单位的商品销售额平均增长速度是乙单位的103%,这是(B)
A比例相对指标 B比较相对指标 C强度相对指标 D动态相对指标
5、变量数列中的各组(单位数)表示我们所要考察(标志值)在各组中出现的次数,所以称为次数。
6、变量数列中各组标志值出现的次数称(频数),各组单位数占单位总数的比重称(频率)。
7、所谓同度量因素,就是在计算综合指数时,吧不能直接相加的(指标)过渡到可以总的指标的那个(媒介因素)。
8、编制时间序列应遵循的基本原则就是保证构成时间数列的(各个指标值)具有(可比)性
统计整理:根据统计研究的目的,把统计调查所搜集到的资料(原始资料、次级资料)进行科学的加工,使之系统化、条理化、科学化,从而得出能够反映事物总体特 征的资料的工作过程
统计分组:根据研究的目的和现象的内在特点,按某个标志(或几个标志)把被研究的总体分为若干不同性质的组。
抽样调查:是一种非全面,按随机原则从全部研究对象中抽取部分单位进行观察,并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断的一种统计调查方法。。
A相对数时间序列 B时期数列 C平均数时间数列 D时点数列
10、“首末折半法”适用于(B)
统计学名词解释
1.总体:根据研究的目的确定的同质观察单位的全体,更确切的说,它是同质的所有观察单位某种观察值的集合2.参数:描述总体数量特征的统计指标3.样本:从总体中随帆抽取部分观察单位,其测量结果的集合称为样本。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本,该样本中所包含的观察单位数称该样样本的样本含量。
4.误差:泛指实测值与真值之差。
按其产生的原因的性质可粗分为随机误处和非随机误差,后者又可分为系统误差和非系统误差。
5.标准误:将样本统计量的标准差称为标准误,样本均数的标准差也称为均数的标准误(反应样本均数间的离散程度,也反应样本均数与相应总体均数间的差异,从而说明均数抽样误差的大小)6.医学参考值:指包括绝大多数的正常人的人体形态、功能和代谢产物等各种生理级生化指标常数,也叫正常值。
由于存在个体差异,生物医学数据并非常数,而是在一定的范围内波动,故又采用医学参考值范围作为判定正常或者异常的标准。
7.医学参考值范围:7:I类错误:指拒绝了实际上成立的HO,这类“弃真”的错误称为I型错误,其架率大小用a表示。
8.II类错误:指接受了实际上不成立的HO,这类“存伪”的误称为II 型错误,其频率大小用β。
9.系统误差:在实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生的原因往往是克制的或可以掌握地。
10.医学参考值:指包括绝大多数正常人的人体形态、功能和代谢产物等各种的生理及生化指标常数,也成正常值。
11.随机误差:是一类不恒定、陆机变化的误差,由多种尚无法控制的因素引起。
在抽样过程中由于抽样的偶然性而出现的抽样误差。
脸机误差是不可避免的,在大量的重复测量中,或在抽样过程中,它可出现或大或小或正或负,呈一定规律的变化。
12.抽样误差:这种由个体变异产生,随机抽样造成的样本统计量与总体参数的差异。
13.P 值:概率又叫几率,是度量某一随机事件A发生可能性的大小的一个数值,(Λ),P(A)越大,说明此时入事件发生的概率越大。
统计学 名词解释
统计学名词解释1. 啥是总体呀?比如说咱全校学生就是一个总体呀!总体就是包含所研究的全部个体的集合。
就像一片森林,所有的树木加起来就是总体。
2. 样本呢,就是从总体里抽出来的一部分呀!比如从全校学生里随机选出来的 100 个学生就是样本呀。
这不就像从那片森林里砍几棵树出来研究一样嘛!3. 平均数大家都懂吧?就是一组数据的平均值呀!像咱班这次考试成绩的平均数,能反映出咱班的整体水平呢!这不就像大家一起走路,平均数就是大家走的平均速度嘛。
4. 中位数呢,就是按顺序排好中间的那个数呀!比如 1、2、3、4、5,那 3 就是中位数呀。
这就好比排队,站在中间的那个人的位置就是中位数呀!5. 众数可有意思啦!就是一组数据中出现次数最多的那个数呀!比如咱班同学最喜欢的颜色,出现最多的那个颜色就是众数呀。
这就好像一堆糖果里,数量最多的那种糖果嘛!6. 方差呀,就是用来衡量数据波动大小的呀!方差大,说明数据波动大;方差小,说明数据稳定呀。
就像天气,有时晴天有时雨天,波动大;一直晴天,波动就小呀!7. 标准差呢,和方差有关系,其实就是方差的平方根呀!它也能看出数据的离散程度呢。
就好像跑步的步幅,步幅变化大,标准差就大嘛!8. 概率,哇,这个可重要啦!就是某件事发生的可能性大小呀!比如抛硬币正面朝上的概率是二分之一呀。
这不就像抽奖,中不中奖都有个概率在那嘛!9. 相关系数呢,就是衡量两个变量之间关系的呀!要是相关系数大,说明关系紧密;要是小,说明关系不那么密切呀。
就像两个好朋友,关系好的相关系数就大嘛!10. 回归分析呢,就是找变量之间的关系呀!通过一些数据,找出它们之间的规律呀。
这就像找宝藏,通过一些线索找到宝藏的位置嘛!我的观点结论:统计学的这些名词都好有意思呀,能帮助我们更好地理解和分析数据呢!。
统计学名词解释
1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。
统计学名词解释
名词解释1.备择假设(alternative hypothesis):与原假设逻辑上反面的假设。
2.标准分数(standard score):也称标准化值或分数,它是变量值与其平均数的离差除以标准差后的值。
3.残值(residual):因变量的观测值y i与根据估计的回归方程求出的预测值y i之差,用e表示。
对于第i个观测值,残差为e i=y i-y i。
4.α错误(αerror):原假设为真却在检验中将原假设被拒绝,又称弃真错误或者第一类错误(type I error),用α表示其概率。
5.β错误(βerror)原假设为伪却在检验中未拒绝的原假设,又称取伪错误或者第二类错误(type II error),用β表示其概率。
6.对照组(control group):随记选取的实验对象的子集。
在这个子集中,每个单元不接受实验组成员所接受的某种特别的处理。
7.多重共线性(multicollinearity)回归模型中两个或两个以上的自变量彼此相关。
8.多重判定系数(multiple coefficient of determination)回归平方和占总平方和的比例,反映因变量y取值的变差中,能被估计的多元回归方程所解释的比例。
9.峰态(kurtosis)对数据分布平峰或尖峰的程度的测度。
10.假设检验(hypothesis testing)根据样本信息,对提出的命题进行检验的一套程序和方法。
11.离散系数(coefficient variation)也称变异系数,一组数据的标准差与其相对应的平均数之比,是测度数据离散程度的相对值。
12.拟合优度实验(goodness of fit test)对多个总体比例是否等于其期望概率的检验。
当期望概率相同时,表现为对多个总体的比例是否相等的检验。
13.偏态(skewness)对数据分布对称性的测度。
14.异众比率(variation ratio)非众数组的频数占总频数的比例。
统计学名词解释
一、名词解释标志:统计标志简称标志,是说明总体单位属性或特征的名称。
指标:统计指标简称指标,是反映统计总体数量特征的X畴和具体数值。
变量:可以是在不同总体单位之间具体表现不尽一样的标志,也可以是在不同时间或空间上数值不尽相等的指标。
普查:为某种特定目的而专门组织的一次性全面调查。
统计报表:按统一规定的表格形式,统一的报送程序和报表时间,自下而上提供根底统计资料。
统计表:用来表现统计资料的表格,是展示统计资料的常见方式。
总量指标:反映社会经济现象开展的总规模、总水平的综合指标。
相对指标:又称相对数,它是两个有相互联系的现象数量的比率,以反映现象的开展程度、构造、强度、普遍程度或比例关系。
平均指标:是将一组数据的总和除以该组数据的项数所得到的结果,是说明同一总体各单位标志值一般水平的指标。
变异指标:测定离散程度的指标。
综合反映总体各单位标志值的差异程度和离散程度。
抽样估计:在抽样调查的根底上,用样本的实际资料计算样本指标,并据此估计或推算总体相应数量特征的一种统计推断方法。
总体:即所要认识的研究现象全体,它是由所研究X围内具有某种一样性质的全体单位所组成的整体。
总体单位:总体的单位数,用N表示。
样本:又称子样,它是从总体中随机抽取出来,代表总体的那局部单位的集合。
时间序列:把反映某种现象在不同时间上的开展变化情况的一系列统计指标志,按照时间先后顺序排列起来所形成的序列。
开展速度:将报告期开展水平与基期开展水平相比照而计算的动态相对指标,用以反映现象报告期水平比基期水平开展的相对程度。
增长速度:将报告期增长量与基期开展水平比照而计算的相对指标,用以反映现象报告期水平比基期水平纯增减的相对程度。
狭义的统计指数:是一种特殊的相对数,它是反映多种不能直接相加的现象数量总体变动的相对数。
数量指数:反映生产、经营或经济工作中数量变动的指数。
质量指标指数:说明产品或工作等质量变动的指数。
指数体系:由假设干个有联系的指数结合形成的一个整体。
统计学名词解释
第1章统计与统计数据1. 统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计:研究数据收集、处理和描述的统计学分支。
3. 推断统计:研究如何利用样本数据来推断总体特征的统计学分支。
4. 分类数据:只能归于某一类别的非数字型数据。
5. 顺序数据:只能归于某一有序类别的非数字型数据。
6. 数值型数据:按数字尺度测量的观察值。
7. 观测数据:通过调查或观测而收集到的数据。
8. 实验数据:在实验中控制实验对象而收集到的数据。
9. 截面数据:在相同或近似相同的时间点上收集的数据。
10. 时间序列数据:在不同时间上收集到的数据。
11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。
12. 普查:为特定目的而专门组织的全面调查。
13. 总体:包含所研究的全部个体(数据)的集合。
14. 样本:从总体中抽取的一部分元素的集合。
15. 样本容量:也称样本量,是构成样本的元素数目。
16. 参数:用来描述总体特征的概括性数字度量。
17. 统计量:用来描述样本特征的概括性数字度量。
18. 变量:说明现象某种特征的概念。
19. 分类变量:说明事物类别的一个名称。
20. 顺序变量:说明事物有序类别的一个名称。
21. 数值型变量:说明事物数字特征的一个名称。
22. 离散型变量:只能取可数值的变量。
23. 连续型变量:可以在一个或多个区间中取任何值的变量。
第2章数据的图表展示24. 频数:落在某一特定类别(或组)中的数据个数。
25. 频数分布:数据在各类别(或组)中的分配。
26. 比例:一个样本(或总体)中各个部分的数据与全部数据之比。
27. 比率:样本(或总体)中各不同类别数值之间的比值。
28. 累积频数:将各有序类别或组的频数逐级累加起来得到的频数。
29. 数据分组:根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。
30. 组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、名词解释总体:指在同一组条件下所有成员的某种状态变量的集合;或者说是某一变数的全部可能值的集合;或性质相同的个体组成的整个集团。
样本:从总体中取出来用作分析、研究的个体称样本。
随机样本:总体中的每个总体单位都有同等的机会被抽取为样本单位,由这种方法抽得的样本叫随机样本。
(用随机抽样的方法,从总体中抽出一个部分;等概率抽取的样本。
)随机抽样:保证总体中的每一个体在每一次抽样中都有同等的机会被取为样本。
复置抽样:保证总体中的每个个体在每次抽样中都有同等的概率被取为样本。
样本容量:样本中包含的单位数称为样本容量。
(样本中变量的个数。
)观察值:每一个体的某一性状测定值叫做观察值。
变数:若干有变异的观察值叫随机变数,简称变数。
连续性变数:指在任意两个变量之间都有可能存在只有微量差异的第三个变量存在,这样一类变数称为连续性变数。
间断性变数:只能取整数的一类变数。
参数:由总体获得的代表总体的特征数。
(描述总体的特征数,如μσ 。
)统计数:由样本获得的代表样本的特征数。
(描述样本的特征数。
)数量资料(数量性状资料):以测量或称重的方式获取的试验资料称为数量资料。
计量资料、质量性状资料次数资料:凡是试验结果以次数表示的资料称为次数资料。
算术平均数、众数 几何平均数:变量对数的算术平均数的反对数,(lg )lg Y G n=∑ 调和平均数:变量倒数的算术平均数的反倒数,1()n H Y =∑中位数:将变量顺序排列,处在中间的变量称中位数,计作M d 。
极差:一组资料中最大值与最小值的差值为极差。
方差:变数变异程度的度量,对于总体()22i Y N μσ-=∑,对于样本22()1Y y s n -=-∑。
(描述变量平均变异程度的统计量。
定义为212()1n j j Y y s n =-=-∑。
) EMS :期望均方,是对均方MS 的期望值。
标准差:变数变异程度的度量,总体标准差:()N Y ∑-=2μσ,样本标准差:()12--=∑n y Y s 。
(变数的平均变异量。
)标准误:统计数变异度的度量,12y y y s s -==。
(统计数的标准差。
)乘积和:X 变数的离均差与Y 变数的离均差的乘积之和,()()SP X x Y y =--∑。
(1()()n i i X Y SP X x Y y XY n =--=-∑∑∑∑。
)平方和:离均差的平方和简称为平方和,定义为21()n j j SS Y y ==-∑。
(22()y Y y =-∑∑) 变异系数:变数的相对变异量。
100s CV y =⨯ 次数分布:由不同区间内变量出现的次数组成的分布。
次数分布图:根据变量的次数分布而绘制的图称为次数分布图,该图能直接的反应变量次数分布的情况。
样本单位:供作调查并从中得到一个观察值的由一个或多个个体组成的集团,它是一个统计单位。
样本配置:样本单位在调查区内的分布,是抽样方法研究的主要内容。
事件:把一次试验所有可能的结果称为事件。
互斥事件:如果事件A 1和A 2不能同时发生,即A 1A 2为不可能事件,则称事件A 1和A 2互斥。
对立事件:如果事件A 和事件A 1必发生其一,但不能同时发生,则称A 1为A 的对立事件。
(如果事件A 1和A 2必发生其一,但不能同时发生。
)随机事件:一次试验中可能发生也可能不发生的结果称为随机事件。
(在一定条件下,可能发生也可能不发生,可能这样发生,也可能那样发生的事件。
)随机抽样:保证总体中的每一个体,在每一次抽样中都有同等的概率被取为样本。
试验误差(Error ):试验中环境因素这样或那样的不一致而对处理产生的使观察值偏离真值的偶然效应,简称为误差。
(因非处理因素的偶然干扰和影响而造成的试验结果与真值的偏差。
)随机误差:在试验过程中,某些人所难以控制的偶然因素的影响造成的,由这类原因引起的误差为随机误差。
系统误差:是由于可以察觉或可以鉴别的原因造成的偏差,这类误差叫系统误差。
无偏估计:在统计上,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计。
如:y 是μ的无偏估计。
标准误:样本平均数分布的标准差,y σ=概率的统计定义小概率事件实际不可能性原理:若事件A 发生的概率较小,如小于0.05或0.01,则认为事件A 在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。
正态分布、标准正态分布t 分布、2χ分布、F 分布二项分布:每次独立抽取二项总体的n 个个体,则所得变量Y 将可能有01n ,,,,共n+1种。
这n+1种变量有它各自的概率而组成一个分布。
这个分布就叫二项分布。
两尾概率、一尾概率统计假设测验:根据某种实际需要,对未知或不完全知道的统计总体提出一些假设,然后由样本的实际结果,经过一定的计算,作出在概率的意义上应当接受或否定哪种假设的测验。
统计推断:根据抽样分布律和概率理论,由样本结果(统计数)来推论总体特征(参数)。
显著性检验β错误(Ⅱ型错误,第二类错误):如果0H 是不真实的,我们通过测验却接受了它,即犯了一个接受不真实的0H 的错误。
这种错误就叫β错误。
(接受一个不真实假设时所犯的错误。
接受一个错误0H 时所犯的错误。
)α错误(Ⅰ型错误,第一类错误):否定真实假设的错误。
(否定正确的H 0所犯的错误。
) 无效假设:是对研究总体提出一个假想目标,所谓“无效”是指处理效应与假设值之间没有真实差异,试验结果所得的差异乃误差所致。
备择假设(Alternative hypothesis ):与无效假设相反,记作H A ;认为试验结果所得的差异是由总体参数不同引起的。
统计假设测验中,接受H 0,就否定H A ;接受H A ,就否定H 0。
参数估计:由样本统计数对总体参数做出点估计和区间估计。
两尾测验(Two-tailed test ):有两个否定区,分别位于分布的两尾的测验。
(否定区在两尾的测验。
)单尾测验(一尾检验,One-tailed test ):否定区位于分布的一尾的测验。
(只有一个否定区的假设测验。
)显著水平:否定无效假设H 0的概率标准。
Very significant :极显著。
若试验结果由误差造成的概率0.01ρ=<,则称样本统计数的差异为极显著。
否定区:否定无效假设H 0的区间。
接受区:接受无效假设H 0的区间。
置信区间:在一定概率保证下,估计总体平均数可能存在的范围。
(若使参数θ在[]12,L L 中的概率为1α-,即:{}121P L L θα≤≤=-,则区间[]12,L L 叫做参数θ的1α-的置信区间。
)置信度:总体平均数出现于置信区间的概率称为置信度。
(若使总体参数θ在区间[]12,L L 中的概率为1α-,即:{}121P L L θα≤≤=-,则称1α-为参数θ在区间[]12,L L 的置信概率和置信度。
)(保证一定区间能覆盖参数的概率。
)(06B )成对比较:如果两组样本的观察值可以根据某种联系而一一配对,则以之进行的两个样本平均数的比较称为成对比较。
非配对设计、配对设计、点估计、区间估计合并均方:将具有同质的均方合并。
21212kkSS SS SSsdf df df+++=+++。
适合性检验适合性测验:是测验中观察的实际次数和根据于某种理论或需要预期的理论次数是否相符合。
所作的假设是H0:相符;H A:不相符。
独立性检验次数资料的独立性测验:这是测验两个因素的列联次数彼此独立还是相关的一种测验试验因素(因素):将作为试验研究对象的因素称试验因素。
精确度:指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。
(重复同一试验各次试验结果之间相接近的程度;观察值之间的接近程度。
)边际效应:因边际环境条件引起的作物生长发育上的差异称边际效应。
因素水平(水平):将一个因素从质量方面和数量方面划分成的不同等级或状态。
水平:某一因素的不同数量或质量等级。
单因素试验:只研究一个因素的试验。
多因素试验:在一个试验中同时研究二个或两个以上的因素的试验叫多因素试验。
准确度:指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。
(是指试验结果与真值相接近的程度。
)真值:试验处理的真实效果。
试验方案:根据试验目的与要求所拟订的要进行比较的一组试验处理的总称。
试验小区(小区):一个处理在田间所占有的地段或地块。
全面试验:对所有可能的处理组合都进行试验的多因素试验,称全面试验。
部分试验:根据生物统计原理选取一部分处理组合进行的多因素试验,称部分试验。
综合试验:根据试验目的和以往经验只对少数特定处理组合进行试验的多因素试验,称综合试验。
田间试验:就是在田间进行的试验。
交互作用效应:不同因素的不同水平搭配组合在一起时还将产生一些额外的效应,这种效应称交互作用效应,简称互作。
唯一差异原则:在试验中进行比较的各个处理,除了被研究的因素(处理因素)具有的不同水平外,其余各种环境因素均应保持在某一特定的水平上,即环境一致的条件下研究处理的效应。
(试验)处理:水平和水平的组合。
(在试验小区上所实施的试验措施。
)处理效应:试验处理对所研究的性状所起到的增进或减少的作用称为处理效应。
重复:试验中同一处理种植的小区数或种植次数称为重复。
局部控制:是分范围分地段地控制非处理因素,使非处理因素对各处理的影响趋向最大程度的一致。
生长竞争:不同处理的相邻小区之间的影响。
随机排列:在一个重复内,试验方案所规定的每个处理安排在哪一个小区上要排除主观因素的影响,采取随机的方式来确定。
小区技术:一个试验处理所占据小区的面积、形状和提供试验处理较为均匀的环境的一些措施。
统计控制:利用统计方法对试验因素进行控制。
试验指标、样本容量方差分析、多重比较交叉分组、系统分组主效应、简单效应、交互作用自由度:在统计上指独立变量的个数。
PLSD 0.05:显著水平达到0.05的最小显著差数。
同质性假定:方差分析的基本假定之一,k 个样本所估计的总体方差相等的假定。
正态性假定:方差分析的基本假定之一。
是要求观察值Y 的误差项e ~2(0,)e N σ。
)(x X i y =:矫正处理平均数,()()i X x i i y y be x x ==--矫正处理平均数:把各处理的i x 矫正为x 时的i y ,即消除X 对Y 影响后的个处理的i y 。
()()i X x i e i y y b x x ==--。
均积:两个变数的互变异数,11()()1n i i cov X x Y y n =---∑ 偏回归系数:在其它自变数皆保持在一定数量水平时,任一自变数对依变数的效应。
拉丁方试验:将k 个不同的处理排成k 行k 列,使得每个处理在每一行、列都仅出现一次的方阵,这种试验方法就叫拉丁方试验。