统计学基础名词解释及简答题
统计学名词解释
1、统计包括三方面的涵义:统计活动、统计资料、统计学;2、统计活动:是在一定的理论指导下,采用适宜的科学方法搜集、处理统计资料的一系列调查研究过程。
3、统计资料:即统计信息,它集中、全面、综合地反应国民经济和社会发展的现象和过程4、统计学:即统计理论,是一门独立的方法论科学,它根据自己的研究对象,系统的阐述统计理论的方法5、统计总体:是根据一定的目的和要求所确定的研究事物的全体,它是由客观存在的,具有某种共同性质的许多个别单位构成的整体。
6、总体单位:是指构成总体的个体单位,它是总体的基本单位。
(又称个体)7、同质性:指总体各单位在某一标志上的共同性8、变异性:指总体所有单位至少有一个以上的可变品质标志或数量标志9、大量性:指统计总体中的单位应有足够的数量,如果总体单位应有足够的数量,如果总体单位数量很少,就难以揭示总体的规律性10、标志:是指统计总体中各单位所具同具有的属性和特征11、品质标志:表明总体单位属性方面的特征,用文字表示12、数量标志:数量方面的特征13、指标:是反映社会经济现象总体数量特征的概念和数值。
14、变异:统计中的标志和指标都是可变的15、变量:可以取不同值得量,在社会经济统计学中,各种数量标志和全部统计指标都是变量16、连续变量:数值是连续不断的,相邻两值之间可作无限分割,即可去无限数值17、离散变量:数值都是以整数位断开的,其数值要用计算的方法取得18、确定性变量:变量值的变动受制于某种决定性因素,致使其沿着一定的方向变动19、随机变量:影响变量值变动的因素有很多,作用不同,因而变量值变动无确定方向20、统计法:国家制定和认可的调整参与统计活动的各方面——统计主体、客体、宿体在统计活动中形成的社会关系的法律规范的总称21、统计设计:对一个完整的统计工作涉及各个方面和各个环节的通盘考虑和适当安排22、统计指标体系:将反映社会经济现象数量特征的一系列相互依存、相互联系的统计指标有机结合所组成的整体;23、指标名称:指标质的规定,它反映一定的社会经济范畴24、指标数值:根据指标的内容所计算出来的具体数值25、数量指标:反映总体总规模、总水平或总工作量的统计指标,又称总量指标26、质量指标:反映总体内部数量关系、单位一般水平、工作质量的统计指标27、描述指标:对总体及其组成部分的规模水平和数量关系进行客观描述的统计指标28、评价指标:反映社会经济总体的结构、比例、速度以及利用状况和效益、效果的统计指标29、监测指标:对社会经济总体运行进行跟踪监测,看其是否偏离既定目标,是否保持平衡的统计指标30、预警指标:可以对总体运行中出现的偏离进行及时的调控31、统计调查:是按照统计的任务和调查的目的要求,运用科学的方法搜集或者收集被研究对象的各个标志值的过程。
统计学复习资料(名词解释、简答)
统计学复习资料(名词解释、简答)计算题:以老师圈的重点,以及之前布置的作业为主,重点复习11/12章一、名词解释:时间序列数据:是在不同时间收集到的数据,这些数据是按时间顺序收集到的,用于所描述现象随时间变化的情况.总体:是包含所研究的全部个体(数据)的集合样本:是从总体中抽取的一部分元素的集合样本量:构成样本的元素的数目统计量:用来描述样本特征的概括性数字度量参数:用来描述总体特征的概括性数字度量概率抽样:即随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本非概率抽样:抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查简单随机抽样:指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本整群抽样:是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。
系统抽样:根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式抽样误差:由抽样的随机性引起的样本结果与总体真值之间的误差分组数据:根据统计研究的需要,将原始数据按照某种标准化分成不同的组别,分组后的数据称为分组数据。
方法有单变量值分组和组距分组两种。
众数:是一组数据中出现次数最多的变量值中位数:是一组数据排序后处于中间位置上的变量值平均数:也称均值,是一组数据相加后除以数据的个数得到的结果算术平均数:是指在一组数据中所有数据之和再除以数据的个数。
几何平均数:是n个变量乘积的n次方根方差:各变量值与其平均数离差平方的平均数经验法则:当一组数据对称分布时,经验法则表明:约有68%的数据在平均数1个标准差的范围之内。
约有95%的数据在平均数2个标准差的范围之内。
约有99%的数据在平均数3个标准差的范围之内。
统计学名称解释
第一章一、名词解释1、参数parameter:也叫参变量,是一个变量;如果我们引入一个或一些另外的变量来描述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究的变量,我们把这样的变量叫做参变量或参数;描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值;2、统计量statistic:描述样本特征的数,是统计理论中用来对数据进行分析、检验的变量;3、总体population:根据研究目的确定的研究对象的全体;当研究有具体而明确的指标时,总体是指该项变量值的全体;4、样本 sample:从总体中随机抽取的部分观察单位,总体中有代表性的一部分;5、同质 homogeneity:是指观察单位研究个体间被研究指标的影响因素相同;6、变异 variation:同质事物个体间的差异;来源于一些未加控制或无法控制的甚至不明原因的因素;7、概率 probability:度量随机事件发生可能性大小的一个数值,是一个在0到1之间的实数;8、抽样误差 sampling error:由于抽样所造成的样本统计量与总体参数的差别;三、简答题1、统计学的基本步骤有哪些设计、搜集、整理、分析资料2、总体与样本的区别与关系区别:总体:根据研究目的确定的研究对象的全体;当研究有具体而明确的指标时,总体是指该项变量值的全体;样本:总体中有代表性的一部分;联系:总体包含样本,样本是总体中的一部分3、抽样误差产生的原因有哪些可以避免抽样误差吗产生原因:1总体单位的标志值的差异程度; 差异程度愈大则抽样误差愈大,反之则愈小; 2样本单位数的多少; 在其他条件相同的情况下,样本单位数愈多,则抽样误差愈小;3抽样方法; 抽样方法不同,抽样误差也不相同;一般说,重复抽样比不重复抽样,误差要大些;4抽样调查的组织形式; 抽样调查的组织形式不同,其抽样误差也不相同,而且同一组织形式的合理程度也会影响抽样误差;不可以,它具有不可避免性,只能减少抽样误差4、何为概率及小概率事件概率:度量随机事件发生可能性大小的一个数值,是一个在0到1之间的实数; 小概率事件:统计分析中的很多结论都基于一定置信程度下的概率推断,习惯上将 pA≤或≤称为小概率事件,认为小概率事件在一次试验中不可能发生;第二章第三章1. 正态分布 normal distribution:也叫高斯分布Gaussian distribution,一种最常见、最重要的连续型对称分布正态分布是对称分布,但对称分布不一定是正态分布2. 中位数 median:是将一批数据从小至大排列后位次居中的数据值,反映一批观察值在位次上的平均水平;3. 四分位数间距 quartile interval:是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小.即:Q3 --Q14. 方差 variance:样本观察值的离均差平方和的均值;表示一组数据的平均离散情况;反映一组数据的平均离散水平;5. 正偏态分布 positively skewed distribution:也称右偏态分布,右侧的组段数多于左侧的组段数,频数向右侧拖尾6. 负偏态分布 negatively skewed distribution:左偏态分布,左侧的组段数多于右侧的组段数,频数向左侧拖尾7. 对数正态分布 logarithmic normal distribution :对数为正态分布的任意随机变量的概率分布;如果X是正态分布的随机变量,则 exp X为对数分布;同样,如果Y是对数正态分布,则 log Y为正态分布;8. 医学参考值范围 medical reference range:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围;最常用的是95%参考值范围;三、简答题1. 描述数值变量资料集中趋势的指标有哪些其适用范围有何异同平均数:描述一组变量值的集中位置或平均水平的指标体系;不同的分布使用不同的指标算术均数:正态或近似正态或观察值相差不大的小样本资料几何均数:对数正态分布或等比级数资料中位数:一般偏态分布传染病发病的潜伏期2. 描述数值变量资料离散趋势的指标有哪些其适用范围有何异同反映数据的离散度 Dispersion ;即个体观察值的变异variation程度;常用的指标有:1. 极差Range 全距适用范围:任何计量资料;是参考变异指标2. 百分位数与四分位数间距 Percentile and Quartile range百分位数:适用范围广泛,可用于偏态资料,分布不明的资料和分布两端无确定值的资料四分位数间距:常用于描述偏态分布资料的离散程度,值越大——变异程度越大,中位数与四分位间距一起使用,描述偏态分布资料的特征;3. 方差 Variance正态分布资料4. 标准差Standard Deviation适用范围:均数与标准差经常被同时用来描述正态分布资料的集中和离散趋势;5. 变异系数 Coefficient of Variation适用范围:主要用于单位不同或均数相差悬殊资料3. 医学中参考值范围的涵义是什么确定的步骤和方法是什么医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围;最常用的是95%参考值范围;步骤与方法:1. 确定“正常人”对象的范围:即根据研究目的确定的未患被研究疾病的个体;2. 统一测定标准:即检验用的试剂批号、仪器、人员、条件等应相同;3. 确定分组:一般需用年龄、性别等对“正常人”对象进行分组,分组特征也可根据检验判断;4. 样本含量确定:一般来讲,正态分布资料所需的样本含量应在100以上,偏态或未知分布时样本含量应更大;5. 确定参考值范围的单双侧:一般生理物质指标多为双侧、毒物指标则多为单侧;6. 确定百分位点:一般取95%或99%;第四章第五章一、名词解释1 标准误standard error:表示样本统计量抽样误差大小的统计指标,统计上通常将统计量如样本均数、样本率p等的标准差称为标准误;2 可信区间confidence interval:按一定的或1-α用一个区间来估计参数所在的范围,该范围通常称为参数的可信区间或者置信区间confidenceinterval,CI,预先给定的概率1-α称为可信度或者confidencelevel,常取95%或99%;3 假设检验hypothesis testing:利用样本提供的信息判断假设是否成立的统计方法称为统计假设检验;4 统计推断statistical inference:用一个或一系列样本的结果去估计总体可能的结果的过程;包括假设检验和参数估计;5 Ⅰ型错误type I error::“实际无差别,但下了有差别的结论”,假阳性错误;犯这种错误的概率是其值等于检验水准6 Ⅱ型错误type II error:“实际有差别,但下了不拒绝H0的结论”,假阴性错误;犯这种错误的概率是其值未知7 检验效能power of test:当两总体确有差别,按检验水准所能发现这种差别的能力;8 变量变换 variable transformation:也称变量代换,是将原始数据作某种函数转换,如转换为对数值;三、简答题1 假设检验的基本原理和步骤;假设检验过去称显着性检验;它是利用小概率反证法,从问题的对立面H0出发间接判断要解决的问题H1是否成立;然后在H0成立的条件下计算检验统计量,最后获得P值来判断;1. 建立检验假设,确定检验水准选用单侧或双侧检验1无效假设null hypothesis零假设,记为H0;2备择假设又称对立假设,记为H1;2. 计算检验统计量根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等如数据的分布类型选择相应的检验统计量;3. 确定P值,下结论;选定显着性水平α的值,P≤α,拒绝H0,接受H1 ,下“有差别”的结论;P>α不拒绝H0,但不能下“无差别”或“相等”的结论,只能下“根据目前试验结果,尚不能认为有差别”的结论;2 标准差和标准误的异同;相同点:都是用来表示变异程度的,均是反映随机误差的;区别:标准差与标准误的意义、作用和使用范围均不同;标准差亦称单数标准差一般用SD 表示,是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度,是数据精密度的衡量指标;而标准误一般用SE 表示,反映样本平均数对总体平均数的变异程度,从而反映抽样误差,是量度结果精密度的指标;标准差是最常用的统计量, 一般用于表示一组样本变量的分散程度;标准误一般用于统计推断中,主要包括假设检验和参数估计,如样本平均数的假设检验、参数的区间估计与点估计等;3 参考值范围和置信区间有何区别参考值范围是指具有明确背景资料的参考人群某项指标的测定值,例如医学参考范围指包括绝大多数的正常人的人体形态,功能和代谢产物等,表示值时可能有单侧也可能有双侧,表示方法为正态分布或百分位数法.置信区间是指在做区间的估计时指按一定的概率1-a估计总体参数所在的范围,其中1-a被称为置信度,两者的不同之处在于前者是对于某种指标的估计,后者是对参数的估计;前者用,后者用;前者用,后者用α为,为v的t或u界值;4 t 检验和方差分析的基本思想各是什么二者的区别是什么t 检验假设检验的一种:假设检验的基本思想是小概率反证法思想;小概率思想是指小概率事件P<或P<在一次试验中基本上不会发生;反证法思想是先提出假设检验假设H0,再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立;方差分析的基本思想是根据资料设计的类型及研究目的,可将总变异分解为两个或多个部分,每个部分的变异可由某因素的作用来解释;通过比较可能由某因素所至的变异与随机误差,即可了解该因素对测定结果有无影响;区别:t检验可用于2个样本均数差异的显着性检验,但不适于多组均数的检验;方差分析是判断多组≥3 数据之间均数差异是否显着的一种假设检验方法;5、t 检验和t 检验的应用条件有何异同t 检验:样本含量n较小时如n<601正态分布2方差齐性homogeneity of variance方差分析:总体——正态且方差相等样本——独立、随机6 以随机区组设计的两因素方差分析为例,简述方差分析的基本原理;正态分布且方差齐同的资料,应采用两因素处理、配伍方差分析two-way ANOVA或配对t检验g=21总变异:反映所有观察值之间的变异,记为SS总;2 处理间变异:由处理因素的不同水平作用和随机误差产生的变异,记为SS处理;3 区组间变异:由不同区组作用和随机误差产生的变异,记为SS区组.4 误差变异:由随机误差产生的变异,记为SS误差;对总离均差平方和及其自由度的分解,有:7 可信区间和假设检验的区别和联系;一主要区别:1、可信区间是以样本资料估计总体参数的真值,假设检验是以样本资料检验对总体参数的先验假设是否成立;2、可信区间为双侧,假设检验既有双侧检验,也有单侧检验;3、可信区间立足于大概率,假设检验立足于小概率;二主要联系:1、都是根据样本信息推断总体参数;2、都以抽样分布为理论依据,建立在概率论基础之上的推断;3、二者可相互转换,形成对偶性;可信区间与假设检验各自不同的作用,要结合使用;一方面,可信区间亦可回答假设检验的问题,算得的可信区间若包含了H0,则按水准,不拒绝H0;若不包含H0,则按水准,拒绝H0,接受H1;另一方面,可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义;8 配对t 检验与两样本t 检验的基本原理有何不同;配对t 检验适用于配对设计的计量资料;配对设计类型:①两同质受试对象分别接受两种不同的处理;②同一受试对象分别接受两种不同处理;③同一受试对象一种处理前后;两样本t 检验适用于完全随机设计两样本均数的比较,第七章1. 二项分布、Poisson 分布与正态分布间有何关系二项分布:是正态分布的特殊形式,记作X~Bn, ,理论上n→+∞且→则二项分布呈正态分布;在实际应用中,当n较大、np与n1-p均>5, 且有→时,二项分布可看成近似正态分布;Poisson 分布:它是普通二项分布在次数极大,发生机率很小时的极限,记作PX,λ越大则Poisson分布渐近正态分布;实际应用上,λ≥20就可将其看作()~λ是正态分布;第六章分类资料的统计描述一、名词解释1、率rate:是说明某事物或现象发生的频率或强度的指标;2、构成比constituent ratio:是说明某事物内部各组成部分的比重或分布的指标;3、相对比relative ratio:是说明两个有关联的事物间的相对关系的指标;4、标准化率standardized rate:也称调整率,是多组率之间按统一的“标准”进行调整,使之具有可比性的率;5、标化发病比standardized incidence ratio:被标化组实际发病数与预期发病数之比;6、标化死亡比standardized mortality ratio:被标化组实际死亡发病、患病等数与预期死亡发病、患病等数之比;第七章二项分布与Poisson分布及其应用第八章X2检验第九章秩和检验三、简答题1、二项分布、Poisson分布与正态分布间有何关系2、X2检验的应用条件有哪些1四格表的分析方法选择条件:n≥40,T≥5,专用公式;n≥40,1≤T<5,校正公式;n<40或T<1,直接计算概率;X2连续性校正仅用于v=1的四格表资料,当v≥2时,一般不作校正;2配对四格表的分析分析方法选择条件:b+c>40,专用公式;20<b+c≤40,用校正公式;b+c<20,二项分布直接计算概率;3R×C表的分析方法选择条件:1.理论数不能小于1;2.理论数大于等于1小于5的格子数不超过总格子数的1/5;3.否则用Fisher确切概率,或似然比检验;4.如果以上条件不能满足,可采用:增加样本含量;删去某行或某列;合理地合并部分行或列;Fisher精确概率法;5.多个率或构成比比较的X2检验,结论为拒绝H0时,仅表示几组有差别,并非任两组之间都有差别;若要了解之,可进行多重比较:X2表的分割或率的可信区间法;6.对于有序的分类变量,采用X2检验方法不能考虑数据的有序性质;为此,对于单向有序可采用秩和检验、Ridit分析,双向有序可采用趋势检验等;3、X2检验用于解决哪些问题1推断两个总体率或构成比之间有无差别2多个总体率或构成比之间有无差别3多个样本率的多重比较4两个分类变量之间有无关联性4、四格表的u检验与X2检验有何异同二者的相同点:1.四格表u检验是根据正态近似的原理np,n1-p>5,n充分大,凡是能用u检验的都可以用卡方检验,u2=x2ν=1;2.两者都有连续性校正问题;二者的不同点:1.由于正态分布可确定单双侧检验界值,当满足正态分布近似条件时,可使用u检验进行单侧检验;2.满足四格表U检验的资料,计算两率间的95%可信区间,尚可分析两率之差有无实际意义;检验可用于2×2列联表资料有无关联的检验5、请列举R×C表X2检验的注意事项;1注意对T值大小的要求:要求T<5的个数不能超过1/5,且不能有T<1;如果不符可选用以下方法处理:1.增加样本例数;2.相邻行列例数进行合理地合并;3.删去理论数小的行或列;4.确切概率法;(2)注意多组比较结果如为差别有显着性,并不代表每两组差别有显着性,如需分析可进一步作两两比较;(3)注意有序行×列表资料不宜采用X2检验,因为X2检验与分类变量的顺序无关;。
统计学(名词解释及简答)
统计学名词解释统计量:用来描述样本特征的概括性数字度量简单随机抽样:指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
整群抽样:是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。
系统抽样:根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式众数:是一组数据中出现次数最多的变量值中位数:是一组数据排序后处于中间位置上的变量值平均数:也称均值,是一组数据相加后除以数据的个数得到的结果标准差:离均差平方和平均后的方根区间估计:在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减抽样误差得到。
假设检验:利用样本信息,对提出的命题进行检验的一套程序和方法。
双侧假设检验:当统计量U的观测值的绝对值大于临界值Uα/2即|u0|>Uα/2时,则拒绝原假设H0,此时假设检验的拒绝域在统计量分布的两侧尾部,则称这种假设检验为双侧假设检验。
相关系数:是根据样本数据计算的度量两个变量之间线性关系强度的统计量。
回归模型:描述因变量y如何依赖于自变量x和误差项的方程。
回归方程:描述因变量y的期望值如何依赖于自变量x的方程。
估计的回归方程:根据估计数据求出的回归方程的估计。
多重共线性:是指线性回归模型中的两个或两个以上的自变量彼此相关。
时间序列:是同一现象在不同时间上的相继观察值排列而成的序列。
趋势:是时间序列在长时期内呈现出来的某种持续上升或持续下降的变动,也称长期趋势。
季节变动(季节性):时间序列在一年内重复出现的周期性波动。
指数:广义的讲,任何两个数值对比形成的相对数都可以称作指数,狭义的讲,指数是用于测定多个项目在不同场合下综合变动的一种相对数。
消费者价格指数(CPI):反映一定时期内消费者所购买的生活消费品价格和服务项目价格的变动趋势和程度的一种相对数。
简答一、概率抽样与非概率抽样比较答:非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。
统计学简答题及部分名词解释
统计学简答题及部分名词解释1.简述总体与样本、参数和统计量的含义总体:我们所要研究的所有基本单位的总和。
样本:总体的一部分单位。
参数:描述总体或概率分布的数量值。
统计量:又称样本统计量,是对样本数据特征值的数量描述。
2.关于样本均值的抽样分布,中心极限定理的含义是什么?样本均值的抽样分布:当总体服从正态分布N(μ,σ2)时,在重复抽样条件下,来自该总体的容量为n的样本的均值某也服从正态分布,某的数学期望为μ,方差为σ2/n。
即某~N(μ,σ2/n)中心极限定理:设从均值为,方差为2的一个任意总体中重复地抽取容量为n的样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布含义:中心极限定理就是一个抽自任意总体样本容量为n的随机样本。
当n充分大时,样本均值的抽样分布将近似于一个具有均值和标准差的正态分布。
3.什么是抽样误差?其特点是什么?抽样误差是利用样本推断总体时产生的误差。
特点:对任何一个随机样本来讲都是不可避免的;是可以计量的,并且是可以控制的;样本的容量越大,抽样误差就越小;总体的变异性越大,抽样误差也就越大。
4.简述样本容量与置信水平、总体方差、允许误差的关系样本容量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本容量也就越大;样本容量与总体方差成正比,总体的差异越大,所要求的样本容量也越大;样本容量与允许误差成反比,可以接受的允许误差越大,所需的样本容量就越小。
5.假设检验中的第一类错误和第二类错误分别是指什么?它们发生的概率大小之间存在怎样的关系?第Ⅰ类错误(弃真错误):原假设为真时拒绝原假设时所犯的错误第Ⅱ类错误(取伪错误):原假设为假时未拒绝原假设当样本容量n确定后,当α变小时,则检验的拒绝域变小,相应的接受域会变大,因此β值也就随之变大;相反,若β变小,则α又会变大.6.试解释“上组限不在内”的原则是指当相邻两组的上下限相叠时,为了“不重”(任一个单位数值只能分在其中某一组中,不能同时分在两组中),上组限数值不算在该组内。
统计学名词解释
统筹学统计学:是一门搜集、整理、显示和分析统计数据的方法论科学。
总体:就是统计所要研究的事物或现象的全体,即由客观存在的,具有某种共同特征的许多个别事物构成的整体。
参数:是描述总体数量特征的指标,又称总体指标。
样本:是指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。
变量:指给所要研究的事物起的名字,包括可变的标志和所有的统计指标。
总体参数:描述总体数量特征的指标,又称总体指标。
样本统计量:是根据样本数据计算出来的样本指标,用来描述样本的数量特征。
普查:为某一特定目的而专门组织的一次性全面调查。
抽样调查:是按随机原则,从总体中抽选部分单位进行观察,并根据部分单位(样本)的调查数据,从数量方面推断总体参数的一种非全面调查。
统计分组:根据被研究现象总体的内在特点以及统计研究的目的,将总体按照一定的标志分为若干个性质不同的组成部分的一种统计方法。
统计表:指显示统计整理结果的表格,就是把通过整理的调查数据,使其成为得以说明现象总体数量特征的分组数据,并按一定顺序排列而形成的表格。
时期数据:反映现象总体在一段时期内发展变化总结果的总量指标。
时点指标:反映现象总体在某一的点(瞬间)上所处状况的总量指标。
众数:是一组数据中出现次数最多的变量值。
时间序列:将反映某种现象的统计指标在不同时间上的数值,按时间顺序排列而成的序列。
发展水平:时间序列中的每一项指标数值,都称为发展水平,它反映了某种现象在一定时期或时点所达到的规模和水平。
平均发展水平:将不同时间的发展水平加以平均而得到的平均数。
发展速度:是反映现象发展变化快慢程度的动态相对指标,是根据两个不同时期的发展水平对比求得的。
环比发展速度:是时间序列中报告期发展水平与前期发展水平之比,表明现象逐期发展变化的方向和程度。
定基发展速度:是报告期发展水平与某一固定时期发展水平(最初发展水平)之比,说明现象在较长时期内总的发展变动方向与程度。
年距发展速度:反映报告期发展水平对于上年同期发展水平的变化方向与程度。
统计学名词解释
《统计学基础》期末复习资料第一章导论统计学:一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。
教育统计学:专门研究如何搜集、整理、分析在心理和教育方面对实验或调查所获得的数字资料,如何根据这些资料所传递的信息,进行数学推论,找出客观规律的一门科学。
描述统计:对实验或调查所获得的数据加以整理(如制表、绘图),并计算其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均,如在集中量数中将原始数据进行平均,在差异量数中将离均差进行平均,在相关量数中将积差进行平均等等。
推断统计:又称抽样统计。
它是根据对部分个体进行观测所得到的信息,通过概括性的分析、论证,在一定可靠程度上去推测相应团体。
换言之,就是根据已知的情况推测未知情况。
统计常态法则:从总体中随机抽取一部分个体所组成的样本,差不多可以保持总体的特征。
这种样本特性保持着总体特性的现象叫做统计常态法则。
小数永存法则:第一个样本中所表现出的特性,在其他样本中也会存在,这就是小数永存法则。
此处“小数”是指小数量的意思。
大量惰性原则:某一事物的某一性质或状态,在反复观察或试验中是保持不变的。
有效数字:指能影响测量准确性的数字。
变量:又称随机变量。
具有变异性的数据。
三个特性,离散型,变异性,规律性。
数据:某个数值一旦被取定了,则称这个数值为随机变量的一个观察值。
即数据。
总体:性质相同的一类事物的全体。
个体:构成总体的每一基本单位或单元。
样本:总体抽出的部分个体。
参数:表示总体特征的量数。
统计量:直接从样本计算出的量数,代表样本的特征。
名称变量:指一事物与其他事物在属性、类别上不同。
顺序变量:事物的某一属性的多少或大小按顺序排列起来的变量。
既无相等的单位又无绝对的零点的变量。
等距变量:只具有相等的单位,而没有绝对的零点的变量。
比率变量:既有相等的单位,又有绝对的零点的变量。
统计学名词解释、简答
名词解释统计总体:指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。
统计总体的特征:同质性、差异性、大量性。
总体单位:个体,指构成总体的各个单位。
统计指标:简称指标,用来反映社会经济现象总体的数量特征的概念及其数值。
任一概念都包含指标名称和指标数值。
特征有总体性、数量性、综合性、具体性。
统计标志:在统计中,总体单位所具有的属性或特征的名称。
标志是统计研究的起点,总体单位是标志的载体,是标志的承担者,统计研究是从登记标志开始的,并通过对标志的综合来反映总体的数量特征。
可分为品质标志和数量标志,或不变标志和变异标志。
统计调查:就是根据统计研究的预定目的、要求和任务,运用各种科学的调查方法,有计划、有组织地搜集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的原始资料的工作过程。
统计调查是整个统计工作的基础环节。
统计调查的好坏,将影响统计资料的正确与否,从而影响统计质量。
统计调查的要求:准确性、及时性、全面性、系统性。
普查:是根据统计任务的特定目的而专门组织的一次性全面调查。
调查范围:1.属于一定时点的社会经济现象的总量(如人口普查)。
2.反映一定时期现象的总量(如出生人口总数)。
优点:所获资料更详细,有较高的准确性和时效性。
缺点:工作量大,花费时间长,耗费大量的人力、物力和财力。
主要作用:在于掌握某些关系国计民生、国情国力的数据,获得比较准确的信息。
抽样调查:指从所要研究的总体中,按照随机原则,抽取部分单位进行调查,并将调查整理得出的数量特征,用以推断总体综合数量特征的一种非全面调查组织形式。
特点:随机性、推断性。
优点:经济性、时效性、准确性、灵活性。
应用范围:①对总体不可能或不必要进行全面调查,但要掌握总体某些现象的全面数值②用抽样调查资料修正全面调查资料。
作用:①承担全面调查无法或很难承担的调查任务。
如气象调查。
②与全面调查结合,可以发挥相互补充、校对的作用。
③进行生产过程的质量控制。
统计学名词解释
抽样平均误差:是指所有可能出现的样本的样本指标的标准差,也可以说是所有可能出现的样本指标和总体指标的平均离差。
总量指标:是反映社会经济现象在一段时间、地点、条件下的总规模或总水平的统计指标。
也称绝对指标或绝对数。
平均指标:平均指标是说明同质总体内某一数量标志在一定历史条件下一般水平的综合指标。
不变价格:是在综合不同的产品产量并反映他们的总动态时,为了消除不同时期价格变动的影响所用的固定价格。
指数:广义:指一切说明社会经济现象数量变动或差异程度的相对数。
狭义:指一种特殊相对数,也即专指不能直接相加和对比的复杂社会经济现象综合变动程度的相对数。
置信区间:统计上把这个给定的抽样误差范围叫做抽样极限误差,也称置信区间(抽样误差范围:变动的的抽样指标与确定的全及指标之间离差的可能范围)发展水平:在动态数列中,各项具体的指标数值叫发展水平或动态数列水平。
它反映社会经济现象在不同时期所达到的水平,是计算其他动态分析指标的基础。
长期趋势:就是研究某种现象在一个相当长的时期内持续向上或向下发展变动的趋势。
抽样推断:按已经抽定的样本指标(样本平均数或样本成数)来估计总体指标(总体平均数或总体成数),或其所在的区间范围。
抽样调查:按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。
质量指标:指反映现象总体的社会经济效益和工作质量的各种相对指标和平均指标。
标准差系数:根据标准差与算术平均数对比的离散系数。
数量指标:指说明总体规模和水平的各种总量指标。
相对指标:又称相对数,它是两个有联系的指标数值对比的结果。
用来对比的两个数,既可以是绝对数,也可以是平均数和相对数。
估计标准误差:就是用来说明回归方程推算结果的准确程度的统计分析指标,或者说是反映回归直线代表性大小的统计分析指标。
指数体系:是由三个或三个以上有联系的指数所组成的数学关系式。
统计学名词解释与简答题参考答案
1. 分类数据是只能归于某一类别的非数字型数据,(1分)它是对事物进行分类的结果,(1分)数据表现为类别,使用文字来表述的。
(1分)2. 四分位数(quartile)也称四分位点,他是一组数据排序后处于25%和75%位置上的值。
(1分)四分位数是通过3个点将全部数据等分为4部分,(1分)其中每部分包括25%的数据。
(1分)3. 方差分析(analysis of variance, ANOVA)就是通过检验各总体的均值是否相等,(1分)来判断分类型自变量对数值型因变量是否有显著影响。
(2分)4. 相关系数(correlation coefficient)是根据样本数据计算的,(1分)度量两个变量之间线性关系强度的统计量。
(2分)5. 居民消费价格指数(consumer price index, CPI)是度量居民消费品和服务项目价格水平随时间变动的相对数,(1分)反映居民家庭购买的消费品和服务价格水平的变动情况。
(2分)五、简答题6. 简述直方图和茎叶图的区别。
答:(1)直方图虽然能很好地显示数据的分布,但不能保留原始的数值;茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息。
(3分)(2)在应用方面,直方图通常用于大批量数据,茎叶图通常适用于小批量数据。
(2分)7. 回归分析主要解决那几个方面的问题?答:(1)从一组样本数据出发,确定出变量之间的数学关系式;(1分)(2)对这些关系式的可信程度进行各种统计检验,并从中影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的;(2分)(3)利用这些所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测的可靠程度。
(2分8. 简述概率抽样的定义及特点。
答:概率抽样(probability sampling)也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
统计学名词解释
统计学名词解释
①Ⅰ类错误:当拒绝H0时,可能犯错误;拒绝一个正确的H0所犯的
错误,称为Ⅰ类错误,其概率为α。
(拒真错误)
②Ⅱ类错误:当接受H0时,可能犯错误;接受一个错误的H0所犯的错
误,称为Ⅱ类错误,其概率为β。
(存伪错误)
③独立事件:一个事件是否发生不影响另一事件的发生。
④概率:是描述随机事件出现可能性的大小的统计指标。
⑤小概率事件:概率小于或等于5%的随机事件;通常情况下,在一
次随机抽样中不可能出现。
⑥随机样本:按照概率的规律抽取的样本。
(不由个人意志所决定的,)
⑦抽样误差:样本统计量与总体参数之间总会存在一定差距,而这种
差距是由于抽样的随机性所引起的。
⑧标准误:是样本统计量分布的标准差,用来衡量抽样误差的大小。
⑨参数检验:根据样本统计量去估计对应总体的参数
⑩假设检验:又称显著性检验,是用样本差异大小去估计总体之间是否存在差异。
区间估计:根据估计量以一定可靠程度推断总体参数所在的区间范围。
四分位差:
完全随机化设计:被试通过随机抽取并被随机分配到各个实验条件下进行实验的设计形式。
随机区组设计:将特征相似的被试分为一组,称为区组。
随机让每个区组接受一种实验的设计形式。
相关系数:表示两列量数之间的线性相互关系(程度)
决定系数:回归分析中衡量回归方程有效性高低指标,是回归平方和在离差平方和所占的比例。
统计学 名词解释
统计学名词解释1. 啥是总体呀?比如说咱全校学生就是一个总体呀!总体就是包含所研究的全部个体的集合。
就像一片森林,所有的树木加起来就是总体。
2. 样本呢,就是从总体里抽出来的一部分呀!比如从全校学生里随机选出来的 100 个学生就是样本呀。
这不就像从那片森林里砍几棵树出来研究一样嘛!3. 平均数大家都懂吧?就是一组数据的平均值呀!像咱班这次考试成绩的平均数,能反映出咱班的整体水平呢!这不就像大家一起走路,平均数就是大家走的平均速度嘛。
4. 中位数呢,就是按顺序排好中间的那个数呀!比如 1、2、3、4、5,那 3 就是中位数呀。
这就好比排队,站在中间的那个人的位置就是中位数呀!5. 众数可有意思啦!就是一组数据中出现次数最多的那个数呀!比如咱班同学最喜欢的颜色,出现最多的那个颜色就是众数呀。
这就好像一堆糖果里,数量最多的那种糖果嘛!6. 方差呀,就是用来衡量数据波动大小的呀!方差大,说明数据波动大;方差小,说明数据稳定呀。
就像天气,有时晴天有时雨天,波动大;一直晴天,波动就小呀!7. 标准差呢,和方差有关系,其实就是方差的平方根呀!它也能看出数据的离散程度呢。
就好像跑步的步幅,步幅变化大,标准差就大嘛!8. 概率,哇,这个可重要啦!就是某件事发生的可能性大小呀!比如抛硬币正面朝上的概率是二分之一呀。
这不就像抽奖,中不中奖都有个概率在那嘛!9. 相关系数呢,就是衡量两个变量之间关系的呀!要是相关系数大,说明关系紧密;要是小,说明关系不那么密切呀。
就像两个好朋友,关系好的相关系数就大嘛!10. 回归分析呢,就是找变量之间的关系呀!通过一些数据,找出它们之间的规律呀。
这就像找宝藏,通过一些线索找到宝藏的位置嘛!我的观点结论:统计学的这些名词都好有意思呀,能帮助我们更好地理解和分析数据呢!。
统计学
统计学名词解释:1.离散系数:标准差与平均数的比值,用以不同组别间离散程度的比较。
2.综合指数与平均指数:将各个个体在不同时间或空间上的数量通过引入同度量因素进行综合,然后将同度量因素固定在同一个水平进行对比所得的比率。
综合指数由两个总量指标对比形成,编制原则为“先综合,后对比”。
平均指数的编制原则为“先对比,后平均”,即首先通过对比计算个别产品或商品的数量指标或质量指标的个体指数,然后将个体指数进行加权平均求的总指数。
3.时期指标与时点指标:时期指标也叫流量指标,反映总体在一段时期内的累计总量。
时点指标也叫存量指标,反映总体在某一时刻下的现存总量。
4.环比发展速度与定基发展速度:环比发展速度是以报告期的前一期为基期计算的发展速度,环比发展速度=报告期水平/前一期水平;定基发展速度是以固定时期为基期计算的发展速度,定基发展速度=报告期水平/固定时期水平。
二者的关系是:环比发展速度的连乘积等于相应时期的定基发展速度。
5.回归分析:对具有相关关系的现象,根据其关系的形态,选择一个合适的数学模型,用来近似地表达变量间的平均变化关系。
6.抽样调查:是一种非全面调查,它是按照随机原则从总体中抽取一部分单位组成样本进行观察研究,根据样本指标去推算总体指标的一种调查。
7.时期数列与时点数列:时期数列中各指标值反映总体在一段时期内的累计总量。
时点数列各指标值反映总体在某一时刻下的现存总量。
简答题:1.重点调查与典型调查有什么区别?重点调查是只对总体中的重点单位进行调查。
典型调查是有意识地从总体中选出少数几个具有代表性的典型单位进行深入细致的调查研究。
重点调查和典型调查都是非全面调查。
主要是调查的着眼点不同!重点调查是选取一部分重要样本进行调查,这些重要样本在量的方面占优势;而典型调查是有目的的选取有代表性的样本进行调查,侧重该样本的质的方面,侧重于对总体的定性认识,凭主观抽取。
2.普查的意义,特点和作用?普查是专门组织的一次性的全面调查。
《统计学》名词解释,简答
名词解释:统计学:是指从总体上阐述客观现象数量方面的特征与相互关系的方法论科学。
总体:指客观存在的,在某一相同性质基础上结合起来的许多个别事物的整体。
总体单位:是构成统计总体的个别事物或基本单位。
统计指标体系:是指若干个相互联系的统计指标所构成的总体,用以说明被研究现象各个方面相互依存和相互制约的关系,从不同角度、不同侧面全面反映研究对象的总体状况。
统计调查:是按照预定的统计任务,运用科学的调查方法,有组织、有计划地向社会实际搜集资料的过程。
普查:专门组织的一次性全面调查,可以用来搜集某些不能够或不适宜用定期全面统计报表搜集的统计资料。
统计报表:是按照国家有关部门的有关规定,由国家有关部门统一制定的表格形式、指标内容、报送时间和程序,自上而下地布置,然后由填报单位自上而下地提供国民经济基本统计资料的一种调查方法。
重点调查:是指在调查对象总体中,只选择其中一部分重点单位进行调查,以了解总体基本情况的一种调查方法,是非全面调查。
抽样误差:是指仅根据总体的一部分单元而不是全面单元的调查来估计总体特征所引起的误差。
统计整理:根据研究目的,将统计调查所取得的原始资料进行科学的分组与汇总,使其系统化、合理华,得出反映总体特征的综合性资料的工作过程。
次数分布:在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体单位在各组间的分布。
是非标志:是指表现为“是”与“否”或“有”与“无”两种属性额品质标志,又叫交替标志。
必要样本容量:是指既能够满足抽样推断精确性和可靠性的要求,又不会造成浪费样本的单位数目。
纯随机抽样:是按照随机原则直接从总体N个单位中抽取n个单位作为样本,然后通过对样本单位的调查观测,计算出样本指标,据以对相应的总体指标作出推断。
相关关系:指变量之间存在的一种不严格的不确定的依存关系。
相关分析:是研究一个变量与另一个变量或另一组变量之间相互关系密切程度和相关方向的一种统计分析方法。
统计学名词解释
备择假设:与原假设逻辑相反的假设。
比例:一个样本中各个部分的数据占全部数据之比。
比率:样本中各不同类别数值之间的比值。
必然事件:在同一组条件下,每次试验一定出现的事件。
变量:说明现象某种特征的概念。
标准差:方差的平方根。
标准分数:也称标准化值或分数,它是变量值与其平均数的离差除以标准差后的值。
标准化残差:残差除以它的标准差后得到的数值。
不规则波动:称为随机波动,指序列中的偶然性波动。
不可能事件:在同一组条件下,每次试验一定不出现的事件。
参数:用来描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。
残差:因变量的观测值y i与根据估计的回归方程求出的预测值y i之差,用e表示。
对于第i 个观测值,残差为e i=y i-y i。
充分统计量:在样本加工统计量的过程中不损失任何信息的统计量。
抽样分布:样本统计量的分量。
抽样框:用于抽选样本的总体单位信息,是概率抽样中所不可缺少的。
抽样误差:由抽样的随机性引起的样本结果与总体真值之间的差异。
处理:不同的因子水平。
次序统计量:设有样本,若有满足如下条件的函数:每当样本得到一组观察值x1,x2,…x n时,其由小到大的排序x(1)<=x(2)<=…<=x(n)中,第i个值x(i)就作为统计量X(i)的观测值,而X(1),X(2),…,X(n)称为次序统计量。
β错误:原假设为伪却在检验中未拒绝原假设,又称取伪错误错误或第Ⅱ类错误,用β表示其概率。
а错误:原假设为真却在检验中原假设放弃,又称弃真错误或第Ⅰ类错误,用а表示其概率。
单因素方差分析:研究一个分类型自变量同数值型因变量之间关系的一种统计方法。
点估计:用样本估计量θ的取值直接作为总体参数θ的估计值。
独立性:两个事件中不论哪一个事件发生与否并不影响另一个事件发生的概率,则称这两个事件具有相互独立性。
独立性检验:对两个分类型变量是否存在相依关系的检验。
如果存在相依关系,有必要对这种相关性进行进一步测定。
统计学名词解释
第1章统计与统计数据1. 统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计:研究数据收集、处理和描述的统计学分支。
3. 推断统计:研究如何利用样本数据来推断总体特征的统计学分支。
4. 分类数据:只能归于某一类别的非数字型数据。
5. 顺序数据:只能归于某一有序类别的非数字型数据。
6. 数值型数据:按数字尺度测量的观察值。
7. 观测数据:通过调查或观测而收集到的数据。
8. 实验数据:在实验中控制实验对象而收集到的数据。
9. 截面数据:在相同或近似相同的时间点上收集的数据。
10. 时间序列数据:在不同时间上收集到的数据。
11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。
12. 普查:为特定目的而专门组织的全面调查。
13. 总体:包含所研究的全部个体(数据)的集合。
14. 样本:从总体中抽取的一部分元素的集合。
15. 样本容量:也称样本量,是构成样本的元素数目。
16. 参数:用来描述总体特征的概括性数字度量。
17. 统计量:用来描述样本特征的概括性数字度量。
18. 变量:说明现象某种特征的概念。
19. 分类变量:说明事物类别的一个名称。
20. 顺序变量:说明事物有序类别的一个名称。
21. 数值型变量:说明事物数字特征的一个名称。
22. 离散型变量:只能取可数值的变量。
23. 连续型变量:可以在一个或多个区间中取任何值的变量。
第2章数据的图表展示24. 频数:落在某一特定类别(或组)中的数据个数。
25. 频数分布:数据在各类别(或组)中的分配。
26. 比例:一个样本(或总体)中各个部分的数据与全部数据之比。
27. 比率:样本(或总体)中各不同类别数值之间的比值。
28. 累积频数:将各有序类别或组的频数逐级累加起来得到的频数。
29. 数据分组:根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。
30. 组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。
统计学名词解释
1、统计学:有关统计数据的搜集、整理、归纳和分析的方法论科学。
2、统计总体:根据统计研究目的确定的所研究对象的全体。
样本:从总体中抽取出来的,作为总体的代表,由部分单位组成的集合体。
3、总体单位:指构成总体的个别单位。
统计总体的特征:同质大量差异4、标志:总体各单位所具有的属性或特征。
5、指标:说明总体单位数量特征的科学概念和具体数值。
7、普查:专门组织的一次性的全面调查。
8、统计调查:根据统计设计的内容、指标和指标体系的要求,有计划、有目的、有组织的手机统计原始资料的工作过程,是统计认识过程的第二个阶段,即定量认识的阶段。
9、统计报表:按照国家统一规定的表格形式,统一规定的指标内容,统一规定的报送程序和报送时间,由填报单位自上而下逐级提供统计资料的一种统计调查方式。
10、统计整理:根据统计研究目的和统计分析的要求,使统计调查所获得的原始资料进行科学的分类和汇总,或对简单加工过的资料进行再加工,使之系统化、条理化,从而得出能够反映事物总体特征资料的工作过程。
11、统计分组:根据统计研究的目的和客观现象的内在特点,将统计总体按照一定的标志划分为若干组成部分的一种统计方法。
12、分类数列:将各组别与次数按一定的次序排列所形成的数列。
13、统计表:以表格来表现统计数据资料的一种形式。
14、总量指标:反映社会经济现象发展的总规模、总水平的综合指标。
15、平均指标:平均指标又称平均或均值,反映的是现象在某一空间或时间上的平均数量状况。
变异指标:综合反映总体各单位标志值变异程度的指标。
16、时期指标:指反映某种社会经济现象在一段时间发展变化结果的总量指标。
17、时点指标:反映社会经济现象在某一时间状况上的总量指标。
18、时间序列:指社会经济现象在不同时间生的一系列同类指标值按时间先后顺序加以排列后形成的数列19、发展水平:动态数列中的每一项具体指标数值。
20、增长量:用来说明社会经济现象在一定时期内所增长的绝对数量的指标。
统计学基础名词解释及简答题
统计学基础名词解释及简答题统计学基础知识名词解释及简答题⼀、名词解释1、统计学统计学是⼀门阐明如何去采集、整理、显⽰、描述、分析数据和由数据得出结论的⼀系列概念、原理、原则、⽅法和技术的科学,是⼀门独⽴的、实⽤性很强的通⽤⽅法论科学。
2、指标和标志标志是说明总体单位属性或特征的名称。
指标是说明总体综合数量特征和数量关系的数字资料。
3、总体、样本和单位统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。
简称总体。
构成总体的个体则称为总体单位,简称单位。
样本是从总体中抽取的⼀部分单位。
4、统计调查统计调查是根据统计研究的⽬的和要求、采⽤科学的⽅法,有组织有计划的搜集统计资料的⼯作过程。
它是取得统计数据的重要⼿段。
5、统计绝对数和统计相对数反映总体规模的绝对数量值,在社会经济统计中称为总量指标。
统计相对数是两个有联系的指标数值之⽐,⽤以反映现象间的联系和对⽐关系。
6、时期指标和时点指标时期指标是反映总体在⼀段时期内累计总量的数字资料,是流量。
时点指标是反映总体在某⼀时刻上具有的总量的数字资料,是存量。
7、抽样估计和假设检验抽样估计是指根据所抽取的样本特征来估计总体特征的统计⽅法。
假设检验是先对总体的某⼀数据提出假设,然后抽取样本,运⽤样本数据来检验假设成⽴与否。
8、变量和变异标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。
数量标志和指标在统计中称为变量。
9、参数和统计量参数是反映总体特征的⼀些变量,包括总体平均数、总体⽅差、总体标准差等。
统计量是反映样本特征的⼀些变量,包括样本平均数、样本⽅差、样本标准差等。
10、抽样平均误差样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。
重复抽样的抽样平均误差为总体标准差的1/n。
11、抽样极限误差抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。
我们⽤样本统计量变动的上限或下限与总体参数的绝对值表⽰抽样误差的可能范围,称为极限误差或允许误差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学基础知识名词解释及简答题一、名词解释1、统计学统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。
2、指标和标志标志是说明总体单位属性或特征的名称。
指标是说明总体综合数量特征和数量关系的数字资料。
3、总体、样本和单位统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。
简称总体。
构成总体的个体则称为总体单位,简称单位。
样本是从总体中抽取的一部分单位。
4、统计调查统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。
它是取得统计数据的重要手段。
5、统计绝对数和统计相对数反映总体规模的绝对数量值,在社会经济统计中称为总量指标。
统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。
6、时期指标和时点指标时期指标是反映总体在一段时期内累计总量的数字资料,是流量。
时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。
7、抽样估计和假设检验抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。
假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。
8、变量和变异标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。
数量标志和指标在统计中称为变量。
9、参数和统计量参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。
统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。
10、抽样平均误差样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。
重复抽样的抽样平均误差为总体标准差的1/n。
11、抽样极限误差抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。
我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。
12、重复抽样和不重复抽样重复抽样也称为回置抽样,是从总体中随机抽取一个样本时,每次抽取一个样本单位时都放回的抽样方式。
不重复抽样也叫不回置抽样,它是在每次抽取样本单位时都不放回的抽样方式。
13、点估计和区间估计点估计也叫定值估计,就是直接用抽样平均数代替总体平均数,用抽样成数代替总体成数。
区间估计是在一定概率保证下,用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。
14、统计指数广义上来说,它是表明社会经济现象的数量对比关系的相对指标。
狭义上来说,它是反映不能直接相加对比的复杂总体综合变动的动态相对数。
15、综合法总指数凡是一个总量指标可以分解为两个或两个以上的因素指标时,将其中一个或一个以上的因素指标固定下来,仅观察另一个因素指标的变动程度,这样的总指数就叫综合法指数。
16、平均法总指数平均法总指数是通过对个体指数进行加权平均而求得的反映不能直接加总的多个个体所组成的复杂总体综合变动的指数。
分为两种:加权算术平均法总指数和加权调和平均法总指数。
17、时间数列时间数列是指同一观察现象的观察值按其发生的时间先后顺序排列而形成的数列。
时间数列也称为时间序列和动态数列。
18、相关分析和回归分析相关分析是一种分析几个变量之间是否存在关系以及它们的关系如何的统计方法。
回归分析是指对具有显著相关关系的现象,根据其关系形态,选择一合适的数学模式,用来近似地表达变量见的平均变动关系的统计分析的方法。
19、时间序列的最初水平、中间水平和最末水平时间数列中第一个观察值称为最处水平,最后一个观察值称为最末水平,其余各个观察值称为中间水平。
20、调查对象、调查单位和填报单位调查对象是所要研究对象的总体。
调查单位是所要研究对象的个体。
填报单位是提交调查资料的单位。
调查单位和填报单位有时相同,有时不同。
21、环比发展速度和定基发展速度环比发展速度是以报告期水平与其前一期水平对比,所得到的动态相对数。
表明现象逐期的发展变动程度。
定基发展速度是用报告期水平与某一固定基期水平(通常为最初水平)对比,所得到的动态相对数。
它表明所观察现象在一段时期内发展的总速度。
22、经常性调查与一次性调查的区别两者的区分是以调查单位的登记在时间上是否具有连续性为依据的。
经常性调查的对象本身具有连续不断变化的特点。
商品零售额。
一次性调查的对象是时点现象。
如人口普查。
二、简答题1、指标和标志的区别与联系两者的区别:(1)指标是反映总体特征的,而标志是反映总体单位特征的。
(2)标志可以用文字来反映,也可以用数字来表示。
而指标都是用数量来表示的。
两者的联系:(1)指标是指标的汇总和综合。
(2)根据研究目的的不同,两者有时可以互换。
2、统计总体的特点(1)同质性。
即总体单位都必须具有某些共同的品质标志属性或数量标志属性。
这是构成总体的前提。
(2)大量性。
即构成总体的总体单位数目要足够多。
这是形成总体的充分条件。
(3)差异性。
即总体单位必须具有一个或若干个可变的品质标志或数量标志。
这是形成总体的必要条件。
3、重点调查、抽样调查、典型调查的区别与联系联系:都是非全面调查,调查对象都是总体中的一部分区别:4、统计绝对数的分类(1)按其反映总体内容的不同分:总体单位总量和总体标志总量。
(2)按其反映不同的时间状况不同分:时期指标和时点指标。
(3)按其采用的计量单位的不同分:实物指标、价值指标和劳动指标。
5、时期指标和时点指标的区别时期指标:(1)连续记数,其值可以相加(2)具有时间长度,与时间长短有关(3)是流量时点指标:(1)间断记数,其值不可以相加,相加无实际意义(2)不具有时间长度,与时间长短无关(3)是存量6、抽样技术的特点(1)在调查单位的抽取上,遵循随机原则。
(2)以样本数据估计总体数据。
(3)以概率估计的方法对总体进行估计。
(4)在推断理论上,以大数定律和中心极限定理为基础。
(5)抽样误差可以计算并加以控制。
7、抽样误差的种类(1)登记性误差。
又称调查误差或工作性误差,是完全可以避免的。
(2)代表性误差。
它又可以分为系统性误差和随机性误差。
系统性误差是破坏随机原则造成的偏差,也是可以避免的。
随机性误差包括抽样个体误差和抽样平均误差。
抽样个体误差不确定,难以计算。
抽样平均误差无法避免,但可以计算和控制。
8、影响抽样误差的因素(1)总体总变量值X间的差异大小。
差异越大,误差越大。
(2)样本容量。
样本容量越大,抽样误差越小。
(3)抽样方法。
重复抽样误差一般大于不重复抽样误差。
(4)抽样调查的组织形式。
不同的组织形式,误差不同。
9、统计相对数的种类(1)计划完成相对数。
是实际完成数与计划数的比值。
(2)结构相对数。
是总体各组成部分数值与总体总数值的比值。
(3)比例相对数。
总体中某一组的指标数值与总体中另一组的指标数值的比值。
(4)动态相对数。
某现象报告期数值与同一现象基期数值的比值。
(5)比较相对数。
某类现象的数值与不同空间同类现象的数值的比值。
(6)强度相对数。
某一现象数值与另一有联系但性质不同的现象数值的比值。
10、强度相对数与平均数的区别(1)概念含义不同。
平均数=总体标志总量/总体单位总量。
强度相对数是某一现象数值与另一有联系但性质不同的现象数值的比值。
(2)作用不同。
强度相对数是反映某现象在另一现象中的强度、密度或普遍程度,反映现象间依存性的比例关系。
而平均数是反映总体各单位的某一变量的各个变量值一般水平的代表值。
(3)表现形式不同。
强度相对数的单位多是复合单位,由分子、分母的指标单位复合而成。
平均数则是和标志总量单位的一致。
(4)强度相对数分子、分母可以互换,平均数的分子、分母不可以互换,互换无意义。
11、统计指数的种类(1)按反映对象的范围不同分:个体指数、类指数和总指数。
(2)按反映统计指标的不同内容分:质量指标指数和数量指标指数。
(3)按所采用的基期不同分:定基指数和环比指数。
(4)按表现形式不同分:综合法总指数和平均法总指数。
12、相关关系的种类(1)从涉及的因素多少来分,可分为单相关和复相关。
只研究两个因素之间的相关关系叫单相关。
两个以上的为复相关。
(2)从相关关系所呈现形态来分,可分为直线相关和曲线相关。
(3)直线单相关按呈现相关关系的方向划分,又可分为正相关和负相关。
正相关表明两个因素的变动方向是相同的,负相关表明两个因素的变动方向是不同的。
三、计算题1、组距、组限和组中值的计算例:某地区工人劳动生产率分布情况见表1要求:根据上述资料计算各组的组距、组中值和频率(填在表中即可)2、平均数、方差、标准差、离散系数的计算例:(1)比较甲乙两工人平均日产量的高低(2)计算甲乙工人日产量的标准差和离散系数,说明哪个工人的平均日产量更具有代表性3、抽样平均误差、抽样极限误差和区间估计例:3求:(1)抽样平均误差(2)在概率度t=2的条件下的平均文化程度的变化范围4、综合法统计指数的编制例:求:(1(2)分析由于销售量的变动所引起的商品销售额的变动状况(3)分析由于商品价格的变动所引起的商品销售额的变动状况5、平均发展水平、环比速度、定基速度的计算例:求:(1)计算表中空缺数值(2)计算1997~2002年平均发展水平、平均增长量、平均增长速度6、相关系数、回归方程例:生产费用与产品产量有一定关系,现从某一行业中随机抽取8个企业,所得产量与生产费用的数据如下表:求:(1)计算产量和生产费用的相关系数(2)求解以产量为自变量,生产费用为因变量的直线回归方程统计学是一门研究具体现象数量方面的科学,其研究对象是各种社会经济现象的数量表现,以及社会经济现象变化的数量关系和数量界限。
第一节统计学概要一、统计学的基本概念1、统计总体与总体单位统计总体,简称总体或母体,是指至少有一个主要性质相同的众多个体所组成的集合体。
总体单位是构成总体的个体。
构成总体的所有单位至少有一个主要属性相同,这是组成总体的前提条件。
因此,总体必然为同质性总体,同质性是构成统计总体的基础。
总体和总体单位是相对而言的,随着研究目的的改变,总体和总体单位可以相互转化。
2、标志、变量和指标(1)标志反映总体单位的属性或特征的统计术语称为标志。
标志是统计认识的起点。
按标志是否可以用数量表现进行划分,分为品质标志和数量标志。
品质标志是指不能用数量表现而只能用文字、符号或代码进行说明的标志,如:人的性别、文化程度、工种等;数量标志是指能用数量表现的标志,如:人的年龄、工人工资、工业产值等。
凡是反映品质标志单位组成的总体称为属性总体;凡是反映数量标志组成的总体称为变量总体。
(2)变量将可变的数量标志抽象化就称其为变量,其取值称为变量值或标志值。
变量分为确定性变量和随机变量。
确定性变量是指受必然性因素的作用,各变量值呈现出上升或下降惟一方向性变动的变量;随机变量是指受偶然性因素的作用,变量值呈现出随机的混沌状态变动的变量。