统计学复习资料(名词解释、简答)
统计学名词解释(超全)
![统计学名词解释(超全)](https://img.taocdn.com/s3/m/bbdd6d1c590216fc700abb68a98271fe910eafd2.png)
统计学名词解释(超全)统计学:是一门搜集、整理、显示和分析统计数据的方法论科学。
总体:就是统计所要研究的事物或现象的全体,即由客观存在的,具有某种共同特征的许多个别事物构成的整体。
参数:是描述总体数量特征的指标,又称总体指标。
样本:是指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。
变量:指给所要研究的事物起的名字,包括可变的标志和所有的统计指标。
总体参数:描述总体数量特征的指标,又称总体指标。
样本统计量:是根据样本数据计算出来的样本指标,用来描述样本的数量特征。
普查:为某一特定目的而专门组织的一次性全面调查。
抽样调查:是按随机原则,从总体中抽选部分单位进行观察,并根据部分单位(样本)的调查数据,从数量方面推断总体参数的一种非全面调查。
统计分组:根据被研究现象总体的内在特点以及统计研究的目的,将总体按照一定的标志分为若干个性质不同的组成部分的一种统计方法。
统计表:指显示统计整理结果的表格,就是把通过整理的调查数据,使其成为得以说明现象总体数量特征的分组数据,并按一定顺序排列而形成的表格。
时期数据:反映现象总体在一段时期内发展变化总结果的总量指标。
时点指标:反应现象整体在某一的点(瞬间)上所处状况的总量指标。
众数:是一组数据中出现次数最多的变量值。
时间序列:将反映某种现象的统计指标在不同时间上的数值,按时间顺序排列而成的序列。
发展水平:时间序列中的每一项指标数值,都称为发展水平,它反映了某种现象在一定时期或时点所达到的规模和水平。
均匀发展水平:将不同时间的发展水平加以均匀而得到的均匀数。
发展速度:是反映现象发展变化快慢程度的动态相对指标,是根据两个不同时期的发展水平对比求得的。
环比发展速度:是时间序列中敷陈期发展水平与前期发展水平之比,表明现象逐期发展变化的方向和程度。
定基发展速度:是报告期发展水平与某一固定时期发展水平(最初发展水平)之比,说明现象在较长时期内总的发展变动方向与程度。
医学统计学复习资料
![医学统计学复习资料](https://img.taocdn.com/s3/m/531f9968a8956bec0875e314.png)
小;③要注意分子分母正确选用;④要注意率与比的正确应用;⑤要注 意平均率的计算方法;⑥要注意资料的可比性;⑦率和构成比比较时作 假设检验。 7. 简述直线回归与直线相关的区别。 (1)资料要求上不同:直线回归分析适用于应变量是服从正态分布的随 机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布 的资料。 (2) 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存 关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快; 相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越 大,两个变量的关联程度越大。 9. 假设检验的理论依据是什么?请简述假设检验的基本步骤。 答:假设检验的理论依据是小概率事件原理,步骤为: (1)根据研究目的建立假设,确定检验水准 (2)根据样本统计量的抽样分布规律,选择适当的统计方法,计算检验 统计量 (3)确定P值,做出推断结论 10.方差分析应用广泛,可用于:①两个或多个样本均数间的比较;②分 析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元 线性回归分析中偏回归系数的假设检验等。本章主要介绍完全随机设计 资料的方差分析、配伍组设计资料的方差分析及重复测量数据的方差分 析。 11. 完全随机设计的两样本率比较时,如何正确选择统计分析方法 (写出相应的计算公式)。 (1)当总例数n≥40且所有格子的T≥5时,用2检验的基本公式或四格表 资料2检验的专用公式; (2)当n≥40但有1≤T<5时,用四格表资料2检验的校正公式;或改用四 格表资料的Fisher确切概率法的连续性校正法: (3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。 12. 什么是医学参考值范围?估计医学参考值范围如何正确选用统计 方法? 答:医学参考值范围是指所谓“正常人”的解剖、生理、生化等指标的 波动范围,亦称正常值范围。如95%的参考值范围包括了95%的观察 值,而有5%的观察值不在这一范围内。 估计医学参考值范围确定方法:
统计学复习资料(名词解释、简答)
![统计学复习资料(名词解释、简答)](https://img.taocdn.com/s3/m/4b4055e19a89680203d8ce2f0066f5335a81678e.png)
统计学复习资料(名词解释、简答)计算题:以老师圈的重点,以及之前布置的作业为主,重点复习11/12章一、名词解释:时间序列数据:是在不同时间收集到的数据,这些数据是按时间顺序收集到的,用于所描述现象随时间变化的情况.总体:是包含所研究的全部个体(数据)的集合样本:是从总体中抽取的一部分元素的集合样本量:构成样本的元素的数目统计量:用来描述样本特征的概括性数字度量参数:用来描述总体特征的概括性数字度量概率抽样:即随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本非概率抽样:抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查简单随机抽样:指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本整群抽样:是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。
系统抽样:根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式抽样误差:由抽样的随机性引起的样本结果与总体真值之间的误差分组数据:根据统计研究的需要,将原始数据按照某种标准化分成不同的组别,分组后的数据称为分组数据。
方法有单变量值分组和组距分组两种。
众数:是一组数据中出现次数最多的变量值中位数:是一组数据排序后处于中间位置上的变量值平均数:也称均值,是一组数据相加后除以数据的个数得到的结果算术平均数:是指在一组数据中所有数据之和再除以数据的个数。
几何平均数:是n个变量乘积的n次方根方差:各变量值与其平均数离差平方的平均数经验法则:当一组数据对称分布时,经验法则表明:约有68%的数据在平均数1个标准差的范围之内。
约有95%的数据在平均数2个标准差的范围之内。
约有99%的数据在平均数3个标准差的范围之内。
统计学基础名词解释及简答题
![统计学基础名词解释及简答题](https://img.taocdn.com/s3/m/520645a3bceb19e8b8f6baf3.png)
统计学基础知识名词解释及简答题一、名词解释1、统计学统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。
2、指标和标志标志是说明总体单位属性或特征的名称。
指标是说明总体综合数量特征和数量关系的数字资料。
3、总体、样本和单位统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。
简称总体。
构成总体的个体则称为总体单位,简称单位。
样本是从总体中抽取的一部分单位。
4、统计调查统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。
它是取得统计数据的重要手段。
5、统计绝对数和统计相对数反映总体规模的绝对数量值,在社会经济统计中称为总量指标。
统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。
6、时期指标和时点指标时期指标是反映总体在一段时期内累计总量的数字资料,是流量。
时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。
7、抽样估计和假设检验抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。
假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。
8、变量和变异标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。
数量标志和指标在统计中称为变量。
9、参数和统计量参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。
统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。
10、抽样平均误差样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。
重复抽样的抽样平均误差为总体标准差的1/n。
11、抽样极限误差抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。
我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。
统计学(名词解释及简答)
![统计学(名词解释及简答)](https://img.taocdn.com/s3/m/f2072e4776232f60ddccda38376baf1ffc4fe3d4.png)
统计学名词解释统计量:用来描述样本特征的概括性数字度量简单随机抽样:指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
整群抽样:是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。
系统抽样:根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式众数:是一组数据中出现次数最多的变量值中位数:是一组数据排序后处于中间位置上的变量值平均数:也称均值,是一组数据相加后除以数据的个数得到的结果标准差:离均差平方和平均后的方根区间估计:在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减抽样误差得到。
假设检验:利用样本信息,对提出的命题进行检验的一套程序和方法。
双侧假设检验:当统计量U的观测值的绝对值大于临界值Uα/2即|u0|>Uα/2时,则拒绝原假设H0,此时假设检验的拒绝域在统计量分布的两侧尾部,则称这种假设检验为双侧假设检验。
相关系数:是根据样本数据计算的度量两个变量之间线性关系强度的统计量。
回归模型:描述因变量y如何依赖于自变量x和误差项的方程。
回归方程:描述因变量y的期望值如何依赖于自变量x的方程。
估计的回归方程:根据估计数据求出的回归方程的估计。
多重共线性:是指线性回归模型中的两个或两个以上的自变量彼此相关。
时间序列:是同一现象在不同时间上的相继观察值排列而成的序列。
趋势:是时间序列在长时期内呈现出来的某种持续上升或持续下降的变动,也称长期趋势。
季节变动(季节性):时间序列在一年内重复出现的周期性波动。
指数:广义的讲,任何两个数值对比形成的相对数都可以称作指数,狭义的讲,指数是用于测定多个项目在不同场合下综合变动的一种相对数。
消费者价格指数(CPI):反映一定时期内消费者所购买的生活消费品价格和服务项目价格的变动趋势和程度的一种相对数。
简答一、概率抽样与非概率抽样比较答:非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。
统计学简答题及部分名词解释
![统计学简答题及部分名词解释](https://img.taocdn.com/s3/m/475ca913a216147917112866.png)
1.简述总体与样本、参数和统计量的含义总体:我们所要研究的所有基本单位的总和。
样本:总体的一部分单位。
参数:描述总体或概率分布的数量值。
统计量:又称样本统计量,是对样本数据特征值的数量描述。
2.关于样本均值的抽样分布,中心极限定理的含义是什么?样本均值的抽样分布:当总体服从正态分布N(μ,σ2)时,在重复抽样条件下,来自该总体的容量为n的样本的均值⎺x也服从正态分布,⎺x 的数学期望为μ,方差为σ2/n。
即⎺x~N(μ,σ2/n)中心极限定理:设从均值为μ,方差为σ2的一个任意总体中重复地抽取容量为n的样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布含义:中心极限定理就是一个抽自任意总体样本容量为n的随机样本。
当n充分大时,样本均值的抽样分布将近似于一个具有均值和标准差的正态分布。
3.什么是抽样误差?其特点是什么?抽样误差是利用样本推断总体时产生的误差。
特点:对任何一个随机样本来讲都是不可避免的;是可以计量的,并且是可以控制的;样本的容量越大,抽样误差就越小;总体的变异性越大,抽样误差也就越大。
4.简述样本容量与置信水平、总体方差、允许误差的关系样本容量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本容量也就越大;样本容量与总体方差成正比,总体的差异越大,所要求的样本容量也越大;样本容量与允许误差成反比,可以接受的允许误差越大,所需的样本容量就越小。
5.假设检验中的第一类错误和第二类错误分别是指什么?它们发生的概率大小之间存在怎样的关系?第Ⅰ类错误(弃真错误):原假设为真时拒绝原假设时所犯的错误第Ⅱ类错误(取伪错误):原假设为假时未拒绝原假设当样本容量n确定后,当α变小时,则检验的拒绝域变小,相应的接受域会变大,因此β值也就随之变大;相反,若β变小,则α又会变大.6.试解释“上组限不在内”的原则是指当相邻两组的上下限相叠时,为了“不重”(任一个单位数值只能分在其中某一组中,不能同时分在两组中),上组限数值不算在该组内。
(完整版)统计学名词解释
![(完整版)统计学名词解释](https://img.taocdn.com/s3/m/ae2782ef05a1b0717fd5360cba1aa81144318f8c.png)
(完整版)统计学名词解释统计学名词解释第⼀章绪论1.随机变量:在统计学上,把取值之间不能预料到什么值的变量。
2.总体:⼜称母全体、全域,指具有某种特征的⼀类事物的全体。
3.个体:构成总体的每个基本单元称为个体。
4.样本:从总体中抽取的⼀部分个体,称为总体的⼀个样本。
5.次数:指某⼀事件在某⼀类别中出现的数⽬,⼜称为频数。
6.频率:⼜称相对次数,即某⼀事件发⽣的次数被总的事件数⽬除,亦即某⼀数据出现的次数被这⼀组数据总个数去除。
7.概率:某⼀事物或某⼀情在某⼀总体中出现的⽐率。
8.观测值:⼀旦确定了某个值。
就称这个值为某⼀变量的观测值。
9.参数:⼜称为总体参数,是描述⼀个总体情况的统计指标。
10.统计量:样本的那些特征值叫做统计量,⼜称特征值。
第⼆章统计图表1.统计表:是由纵横交叉的线条绘制,并将数据按照⼀定的要求整理、归类、排列、填写在内的⼀种表格形式。
⼀般由表号、名称、标⽬、数字、表注组成。
2.统计图:⼀般采⽤直⾓坐标系,通常横轴表⽰事物的组别或⾃变量x,称为分类轴。
纵轴表⽰事物出现的次数或因变量,称为数值轴。
⼀般由图号及图题、图⽬、图尺、图形、图例、图组成。
3.简单次数分布表:依据每⼀个分数值在⼀列数据中出现的次数或总计数资料编制成的统计表,适合数据个数和分布范围⽐较⼩的时候⽤。
4.分组次数分布表:数据量很⼤时,应该把所有的数据先划分在若⼲区间,然后将数据按其数值⼤⼩划归到相应区域的组别内,分别统计各个组别中包括的数据个数,再⽤列表的形式呈现出来,适合数据个数和分布范围⽐较⼤的时候⽤。
5.分组次数分布表的编制步骤:(1)求全距(2)定组距和组数(3)列出分组组距(4)登记次数(5)计算次数6.分组次数分布的意义:(1)优点:A.可将杂乱⽆章数据排列成序,以发现各数据的出现次数及分布状况。
B.可显⽰⼀组数据的集中情况和差异情况等。
(2)缺点:原始数据不见了,从⽽依据这样的统计表算出的平均值会与⽤原始数据算出的值有出⼊,出现误差,即归组效应。
统计学名词解释与简答题参考答案
![统计学名词解释与简答题参考答案](https://img.taocdn.com/s3/m/7ae6d407192e45361066f5e2.png)
1. 分类数据是只能归于某一类别的非数字型数据,(1分)它是对事物进行分类的结果,(1分)数据表现为类别,使用文字来表述的。
(1分)2. 四分位数(quartile)也称四分位点,他是一组数据排序后处于25%和75%位置上的值。
(1分)四分位数是通过3个点将全部数据等分为4部分,(1分)其中每部分包括25%的数据。
(1分)3. 方差分析(analysis of variance, ANOVA)就是通过检验各总体的均值是否相等,(1分)来判断分类型自变量对数值型因变量是否有显著影响。
(2分)4. 相关系数(correlation coefficient)是根据样本数据计算的,(1分)度量两个变量之间线性关系强度的统计量。
(2分)5. 居民消费价格指数(consumer price index, CPI)是度量居民消费品和服务项目价格水平随时间变动的相对数,(1分)反映居民家庭购买的消费品和服务价格水平的变动情况。
(2分)五、简答题6. 简述直方图和茎叶图的区别。
答:(1)直方图虽然能很好地显示数据的分布,但不能保留原始的数值;茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息。
(3分)(2)在应用方面,直方图通常用于大批量数据,茎叶图通常适用于小批量数据。
(2分)7. 回归分析主要解决那几个方面的问题?答:(1)从一组样本数据出发,确定出变量之间的数学关系式;(1分)(2)对这些关系式的可信程度进行各种统计检验,并从中影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的;(2分)(3)利用这些所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测的可靠程度。
(2分8. 简述概率抽样的定义及特点。
答:概率抽样(probability sampling)也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
统计学名词解释与重点
![统计学名词解释与重点](https://img.taocdn.com/s3/m/3081ece6db38376baf1ffc4ffe4733687f21fc5a.png)
统计学名词解释与重点统计学名词解释与重点1、数据类型:分类数据:只能归于某一类别的非数字型数据,它是对事物进行匪类的结果,数据表现为类别,是用文字来表述。
(定性数据或品质数据)顺序数据:只能归于某一有序类别的非数字型数据。
有类别,但类别是有序的。
(定性数据或品质数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
现实中所处理的大多数都是数值型数据。
(定量数据或数量数据)2、截面数据:在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况。
3、总体:是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。
可分为有限总体和无限总体。
4、样本:从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。
5、参数(对应总体)是用来描述总体特征的概括性数字度量,是研究者想要了解总体的某种特征值。
6、统计量(对应样本)是用来描述样本特征的概括性数字度量。
是根据样本数据计算出来来的一个量,由于抽样时随机的,因此统计量是样本的函数。
7、调查方法:普查,抽样调查,统计报表8、抽样采集数据的方式分为概率抽样和非概率抽样。
9、概率抽样:简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样。
10、非概率抽样:方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样。
11、搜集数据的基本方法:自填式、面访式、电话式12、数据的误差:抽样误差和非抽样误差抽样误差:是有抽样的随机性引起的样本结果与总体真值的误差。
非抽样误差:相对抽样误差而言的,初抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异。
13、集中趋势:一组数据向某一中心值靠拢的程度,反映了一组数据中心点的位置所在14、众数(分类数据):是一组数据中出现次数最多的变量值,用M0表示。
众数主要用于测度分类数据的集中趋势,当然也适用于作为顺序数据以及数值型数据集中趋势的测度值。
统计学名词解释资料
![统计学名词解释资料](https://img.taocdn.com/s3/m/7a3f548fa0116c175f0e48ed.png)
11、统计分组:根据研究任务的需要和事物内在的特点,将统计总体按照一定的标志划分为若干组成部分 的一种统计方法。
假设检验:是抽样推断的一项重要内容,是利用样本的实际资料来检验事先对总体某些数量特征所作的假设 是否可信的一种统计方法。
相关关系:两种类型: 一类是函数关系,另一类是相关关系。函数关系。函数是指现象之间有一种严格的 确定性的依存关系。相关关系。相关关系是指客观现象之间确实存在的,但数量上不是严格对应的依存关系。在这种关系中,对于某一现象的每一数值,可以有另一现象的若干数值与之相对应
7、普查:专门组织的一次性的全面调查。
8、统计调查:根据统计设计的内容、指标和指标体系的要求,有计划、有目的、有组织的手机统计原始资 料的工作过程,是统计认识过程的第二个阶段,即定量认识的阶段。
9、 统计报表:按照国家统一规定的表格形式,统一规定的指标内容,统一规定的报送程序和报送时间, 由填报单位自上而下逐级提供统计资料的一种统计调查方式。
20、增长量:用来说明社会经济现象在一定时期内所增长的绝对数量的指标。
21、发展速度:以相对数形式表现的动态分析指标,是两个不同时期发展水平指标对比的结果。
22、增长速度:反映现象数量增长方向和程度的动态相对指标。
23、统计指数:指用来反映不能同度量的多种事物综合动态变化的特殊相对数。
24、个体指数:指同一种现象的报告期与基期指标数值对比得到的发展数度指标。
12、分类数列:将各组别与次数按一定的次序排列所形成的数列。
统计学名词解释,简答
![统计学名词解释,简答](https://img.taocdn.com/s3/m/8c51dbfec0c708a1284ac850ad02de80d4d80631.png)
统计学名词解释,简答1.统计数据:即统计信息,是指通过统计工作过程中取得的各项数据资料以及与之相关的其他资料的总称。
2.统计学:即统计理论,是指系统地阐述统计实践活动基本原理和研究方法的理论。
它是一门研究如何搜集、整理和分析统计资料的理论和方法论科学。
4.统计学的研究对象:客观事物中的数量特征、数量关系和数量变化。
5.统计学包括商务管理统计的研究对象特点:数量性(基本特点)、总体性、变异性。
7.商务管理统计研究方法大量观察法统计分组法对比分析法综合指标法统计推断法动态测定法8.统计总体。
又称“调查总体”简称“总体”,在数理统计中又称母体,与样本相对应。
凡是客观存在的、具有共同性质的个体所构成的整体就是统计总体。
其形成必须具备以下条件:客观性:即统计总体必须是客观存在的,并且能实际观察到的。
同质性:即构成统计总体的所有单位至少具有某一个共同性质是统计总体的前提条件。
变异性:即构成统计总体的各总单位至少在某一性质上具有共同特征外,在其他性质上应具有差异性,变异性是统计研究的重点。
9.总体单位:构成统计总体的每个基本单位称为总体单位,简称单位或个体,它是各项统计特征的原始承担者。
10.统计总体分类:按其包含的单位数是否可计分为有限总体与无限总体按总体单位的形态分为实体总体和行为总体。
11.总体与总体单位的关系:a.总体是由总体单位组成,总体单位是组成总体的个别事物。
b.根据研究目的不同,总体和总体单位是可以相互转化的。
12.标志:表示总体单位特征的名称。
如性别、年龄、籍贯、企业所有制、规模等。
13.标志表现:即标志特征在各单位的具体表现。
如性别标志的表现有“女”、“男”,年龄标志用“30”岁“50”岁等数量来表现。
14.标志的分类a.根据标志表现的形式不同。
数量标志,表明总体单位数量特征的标志,是可以用数值表示的。
品质标志,表明总体单位属性特征的标志,不能用数值表现。
b.按照各总体单位标志的具体表现是否相同。
自-统计学概论名词、简答
![自-统计学概论名词、简答](https://img.taocdn.com/s3/m/5e83cd89caaedd3383c4d3f4.png)
统计学概论—名词解释、简答1、简单分组:就是对被研究现象总体只按一个标志进行的分组。
简单分组的特点是:只能反映现象在某一标志特征方面的差异情况,而不能反映现象在其他标志特征方面的差异,说明的问题比较简单。
2、时点指标:则反映了某一时刻(时点)瞬间的总量,例如,人口总数、国土面积、公路里程、固定资产等等宏观经济指标,以及商品库存、企业资产负债、设备数量、职工人数等等微观指标。
3、因素分析法:就是利用指数体系,对现象的综合变动从数量上分析其受各因素影响的一种分析方法。
4、普查:是专门组织的一次性的全面调查。
5、定基发展速度:是指以报告期水平与某一固定时期水平之比计算的发展速度,它用来说明报告期水平已经发展到了固定时期水平的百分之几(或多少倍),表明这种现象在较长时期内总的发展速度,因此,有时也叫做“总速度”。
6、指数(或统计指数):指数有广义和狭义之分。
广义的指数是指用来测定一个变量对于一个特定的变量值大小的相对数;狭义的指数是指因不同度量而不能直接加总的多种事物在不同时间对比的综合相对数。
7、一元线性回归模型:对于只涉及一个自变量的一元线性回归模型可表示为: y=+x+。
在一元线型回归模型中,y是x线性函数(a+ x)加上随机误差项()。
+ 反映了由于x的变化引起的y的线性变化,随机误差项反正了除x之外其他影响y的随机因素。
8、国内生产总值:是指按市场价格计算的一个国家或地区所有常住单位在一定时期内生产活动的最终成果。
9、普查:是专门组织的一次性全面调查。
它有两个主要特点:第一,普查是一次性调查,其主要用来调查属于一定时点上的社会经济现象的总量。
第二,普查是专门组织的全面调查,其主要用来全面、系统地掌握重要的国情国力方面的统计资料。
10、统计整理:是根据统计研究的任务与要求,对统计调查阶段所搜集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的综合资料的工作过程。
统计学名词解释及简答题
![统计学名词解释及简答题](https://img.taocdn.com/s3/m/9115ccbddc3383c4bb4cf7ec4afe04a1b071b0db.png)
名词解释一、分类数据〔categorical data 〕是只能归于某一类别的非数字型数据,它是对事物进展分类的结果,数据表现为类别,使用文字来表述的。
二、顺序数据〔ran k data 〕是只能归于某一有序类别的非数字型数据。
三、数值型数据〔metric data 〕是按数字尺度测量的观察值,其结果表现为详细的数值。
四、系统抽样〔systematic sampling 〕将总体中的所有单位〔抽样单位〕按一定顺序排列,在规定的范围内随机的抽取一个单位作为初始单位,然后按事先规定好的规那么确定其他样本单位,这种抽样方法被称为系统抽样。
五、非概率抽样〔non-probability sampling 〕是相对于概率抽样而言的,指抽取样本时不是根据随机原那么,而是根据研究目的对数据的要求,采取某种方式从总体中抽出局部单位对其施行调查。
六、抽样误差〔sampling error 〕是由于抽样的随机性引起的样本结果与总体真值之间的误差。
七、四分位数(quartile)也称四分位点,他是一组数据排序后处于25%和75%位置上的值。
四分位数是通过3个点将全部数据等分为4局部,其中每局部包括25%的数据。
八、离散系数也成为变异系数〔coefficient of variation 〕,它是一组数据的标准差与其相应的平均数之比。
其计算公式为:s s v x =离散系数是测度数据离散程度的相对统计量,主要是用于比拟不同样本数据的离散程度。
离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。
九、泊松分布〔Poisson distribution 〕是用来描绘在一指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布。
十、中心极限定理〔central limit theorem 〕:设从均值μ、2σ(有限)的任意一个总体中抽取样本量为n 的样本,当n 充分大时,样本均值X 的抽样分布近似服从均值为μ、方差2σ/n 的正态分布。
统计学名词解释、简答
![统计学名词解释、简答](https://img.taocdn.com/s3/m/e5e97a49852458fb770b5640.png)
名词解释统计总体:指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。
统计总体的特征:同质性、差异性、大量性。
总体单位:个体,指构成总体的各个单位。
统计指标:简称指标,用来反映社会经济现象总体的数量特征的概念及其数值。
任一概念都包含指标名称和指标数值。
特征有总体性、数量性、综合性、具体性。
统计标志:在统计中,总体单位所具有的属性或特征的名称。
标志是统计研究的起点,总体单位是标志的载体,是标志的承担者,统计研究是从登记标志开始的,并通过对标志的综合来反映总体的数量特征。
可分为品质标志和数量标志,或不变标志和变异标志。
统计调查:就是根据统计研究的预定目的、要求和任务,运用各种科学的调查方法,有计划、有组织地搜集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的原始资料的工作过程。
统计调查是整个统计工作的基础环节。
统计调查的好坏,将影响统计资料的正确与否,从而影响统计质量。
统计调查的要求:准确性、及时性、全面性、系统性。
普查:是根据统计任务的特定目的而专门组织的一次性全面调查。
调查范围:1.属于一定时点的社会经济现象的总量(如人口普查)。
2.反映一定时期现象的总量(如出生人口总数)。
优点:所获资料更详细,有较高的准确性和时效性。
缺点:工作量大,花费时间长,耗费大量的人力、物力和财力。
主要作用:在于掌握某些关系国计民生、国情国力的数据,获得比较准确的信息。
抽样调查:指从所要研究的总体中,按照随机原则,抽取部分单位进行调查,并将调查整理得出的数量特征,用以推断总体综合数量特征的一种非全面调查组织形式。
特点:随机性、推断性。
优点:经济性、时效性、准确性、灵活性。
应用范围:①对总体不可能或不必要进行全面调查,但要掌握总体某些现象的全面数值②用抽样调查资料修正全面调查资料。
作用:①承担全面调查无法或很难承担的调查任务。
如气象调查。
②与全面调查结合,可以发挥相互补充、校对的作用。
③进行生产过程的质量控制。
医学统计学复习题(名词解释和简答)
![医学统计学复习题(名词解释和简答)](https://img.taocdn.com/s3/m/60b1f0b0c1c708a1294a443a.png)
一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、@计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I型错误概率的最大值。
I型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。
《统计学》名词解释,简答
![《统计学》名词解释,简答](https://img.taocdn.com/s3/m/cb63fdd7240c844769eaee0e.png)
名词解释:统计学:是指从总体上阐述客观现象数量方面的特征与相互关系的方法论科学。
总体:指客观存在的,在某一相同性质基础上结合起来的许多个别事物的整体。
总体单位:是构成统计总体的个别事物或基本单位。
统计指标体系:是指若干个相互联系的统计指标所构成的总体,用以说明被研究现象各个方面相互依存和相互制约的关系,从不同角度、不同侧面全面反映研究对象的总体状况。
统计调查:是按照预定的统计任务,运用科学的调查方法,有组织、有计划地向社会实际搜集资料的过程。
普查:专门组织的一次性全面调查,可以用来搜集某些不能够或不适宜用定期全面统计报表搜集的统计资料。
统计报表:是按照国家有关部门的有关规定,由国家有关部门统一制定的表格形式、指标内容、报送时间和程序,自上而下地布置,然后由填报单位自上而下地提供国民经济基本统计资料的一种调查方法。
重点调查:是指在调查对象总体中,只选择其中一部分重点单位进行调查,以了解总体基本情况的一种调查方法,是非全面调查。
抽样误差:是指仅根据总体的一部分单元而不是全面单元的调查来估计总体特征所引起的误差。
统计整理:根据研究目的,将统计调查所取得的原始资料进行科学的分组与汇总,使其系统化、合理华,得出反映总体特征的综合性资料的工作过程。
次数分布:在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体单位在各组间的分布。
是非标志:是指表现为“是”与“否”或“有”与“无”两种属性额品质标志,又叫交替标志。
必要样本容量:是指既能够满足抽样推断精确性和可靠性的要求,又不会造成浪费样本的单位数目。
纯随机抽样:是按照随机原则直接从总体N个单位中抽取n个单位作为样本,然后通过对样本单位的调查观测,计算出样本指标,据以对相应的总体指标作出推断。
相关关系:指变量之间存在的一种不严格的不确定的依存关系。
相关分析:是研究一个变量与另一个变量或另一组变量之间相互关系密切程度和相关方向的一种统计分析方法。
统计学(版)期末复习资料
![统计学(版)期末复习资料](https://img.taocdn.com/s3/m/9c71ac95d15abe23492f4d3b.png)
第七章 分类变量的推断。 名词解释 1. χ2 拟合优度检验:利用 χ2 停机梁来判断某个分类变量个类别的观察频数与某一理论频数或期望 频数是否一直的检验方法。文档来自于网络搜索 2.列联表:有两个或两个以上分类变量交叉分类的频数分布表。 3. χ2 独立性检验:利用 χ2 统计量来判断两个分类变量是否独立的检验方法。
3/7
期望概率,而独立性检验中,原假设则假设两个变量之间相互独立。最后,计算期望频数时,在拟合优 度检验中利用原假设中的期望概率,用观察频数乘以期望概率,直接得到期望频数,如果独立性检验, 则假设两个变量的分类是独立的,因而两个水平的联合概率是两个单独的概率的乘积。文档来自于网络搜
统计学名词解释汇总
![统计学名词解释汇总](https://img.taocdn.com/s3/m/607dca0d66ec102de2bd960590c69ec3d5bbdb0b.png)
统计学名词解释汇总1.统计学是一门科学,它涉及到收集、处理、分析和解释数据,并从数据中得出结论的过程。
统计方法可分为描述统计和推断统计两类。
2.统计数据可分为分类、顺序和数值型数据。
分类数据只能归于某一类别的非数字型数据,顺序数据只能归于某一有序类别的非数字型数据,而数值型数据则是按数字尺度测量的观察值。
此外,统计数据还可按采取计量尺度、收集方法和被描述对象与时间关系等不同方式进行分类。
3.总体是指研究对象的全体,样本是从总体中抽取的一部分,参数是描述总体特征的数值,而统计量则是描述样本特征的数值。
变量则是用来说明现象某种特征的概念,比如灯泡的寿命就是一个变量。
4.有限总体指总体的范围能够明确确定,而且元素的数目是有限可数的;无限总体则指总体包括的元素是无限不可数的。
5.变量可分为分类变量、顺序变量和数值型变量。
变量也可以分为随机变量和非随机变量,经验变量和理论变量。
6.离散型变量只能取有限个值,取值以整数位断开,比如企业数;连续型变量则取之连续不断,不能一一列举,比如温度。
数据的预处理包括数据审核、数据筛选和数据排序等内容。
3.抽样方法可以分为重复抽样和不重复抽样。
重复抽样是从总体中抽取一个元素后,将其放回到总体中再抽取下一个元素,直至抽取n个元素。
不重复抽样是一个元素被抽中后不再放回总体,然后再从所剩下的元素中抽取下一个元素,直到抽取n个元素为止。
4.抽样分布是指重复选取容量为n的样本时,由每一个样本算出的统计量数值的相对频数分布或概率分布。
它是一种理论分布,与总体分布有密切关系。
以样本均值为例,如果原有总体是正态分布,那么,无论样本容量的大小,样本均值也服从正态分布。
其分布的数学期望为总体均值,方差为总体方差的1/n。
如果原有总体的分布不是正态分布,就要看样本容量的大小了。
当n为大样本时(n≥30),根据中心极限定理可知,当样本容量n增大时,不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于服从正态分布。
统计学名词解释
![统计学名词解释](https://img.taocdn.com/s3/m/f114590184868762caaed5f2.png)
7、抽样估计和假设检验
抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。
8、变量和变异
标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。数量标志和指标在统计中称为变量。
1
9、"时间序列的最初水平、处水平,最后一个观察值称为最末水平,其余各个观察值称为中间水平。
20、"调查对象、调查单位和填报单位
调查对象是所要研究对象的总体。调查单位是所要研究对象的个体。填报单位是提交调查资料的单位。调查单位和填报单位有时相同,有时不同。
4、统计调查
统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。它是取得统计数据的重要手段。
5、统计绝对数和统计相对数
反映总体规模的绝对数量值,在社会经济统计中称为总量指标。统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。
6、时期指标和时点指标
总体单位总量和总体标志总量。
(2)按其反映不同的时间状况不同分:
时期指标和时点指标。
(3)按其采用的计量单位的不同分:
实物指标、价值指标和劳动指标。
5、时期指标和时点指标的区别
时期指标:
(1)连续记数,其值可以相加
(2)具有时间xx,与时间长短有关
(3)是流量时点指标:
(1)间断记数,其值不可以相加,相加无实际意义
算总体相应指标
了解被研究对象的特征及发展变化
趋势,可近似推算总体数量,无法估计误差用样本指标数值推断总体指标数值,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学复习资料(名词解释、简答)
计算题:以老师圈的重点,以及之前布置的作业为主,重点复习11/12章
一、名词解释:
时间序列数据:是在不同时间收集到的数据,这些数据是按时间顺序收集到的,用于所描述现象随时间变化的情况。
总体:是包含所研究的全部个体(数据)的集合
样本:是从总体中抽取的一部分元素的集合样本量:构成样本的元素的数目
统计量:用来描述样本特征的概括性数字度量
参数:用来描述总体特征的概括性数字度量
概率抽样:即随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本
非概率抽样:抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查
简单随机抽样:指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本
整群抽样:是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。
系统抽样:根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式
抽样误差:由抽样的随机性引起的样本结果与总体真值之间的误差
分组数据:根据统计研究的需要,将原始数据按照某种标准化分成不同的组别,分组后的数据称为分组数据。
方法有单变量值分组和组距分组两种。
众数:是一组数据中出现次数最多的变量值
中位数:是一组数据排序后处于中间位置上的变量值
平均数:也称均值,是一组数据相加后除以数据的个数得到的结果
算术平均数:是指在一组数据中所有数据之和再除以数据的个数.
几何平均数:是n个变量乘积的n次方根
方差:各变量值与其平均数离差平方的平均数
经验法则:
当一组数据对称分布时,经验法则表明:
约有68%的数据在平均数±1个标准差的范围之内。
约有95%的数据在平均数±2个标准差的范围之内。
约有99%的数据在平均数±3个标准差的范围之内。
离散系数:是一组数据的标准差与其相应的平均数之比
偏态:它是对数据对称性的测度。
(不要求计算,但求了解偏什么)
SK<0,左偏
SK=0,分布对称;
SK>0,右偏
参数估计:用样本统计量去估计总体的参数
估计量:用来估计总体参数的统计量
区间估计:在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统
计量加减估计误差得到.
置信水平:将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例
相关系数:是根据样本数据计算的度量两个变量之间线性关系强度的统计量。
判定系数:回归平方和占总平方和的比例。
估计标准误差:度量各实际观测点在直线周围的散布状况的一个统计量。
残差:是因变量的观测值与根据估计的回归方程求出的预测值之差
多重判定系数:多元回归中回归平方和占总平方和的比例,度量多元回归方程拟合程度的一个统计量,反映了在因变量的变差中被估计的回归方程所解释的比例。
多重共线性:是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。
时间序列:是同一现象在不同时间上的相继观察值排列而成的序列。
平稳序列:基本上不存在趋势的序列。
季节性:时间序列在一年内重复出现的周期性波动。
周期性:是时间序列中呈现出来的围绕长期趋势的一种波浪形或震荡式变动。
线性趋势:指现象随着时间的推移而呈现出稳定增长或下降的线性变化规律。
(不掌握计算)
二、简答:
一、概率抽样与非概率抽样比较
答:非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,无法使用样本的结果对总体相应的参数进行推断。
特点是操作简便、时效快、成本低概率抽样是依据随机原则抽选样本,统计量的理论分布是存在的。
可根据调查的结果对总体的有关参数进行估计。
特点是技术含量高,成本较高
频数:指变量值中代表某种特征的数(标志值)出现的次数。
频率:每个对象出现的次数与总次数的比值
二、众数中位数平均数的比较
1.答:(1)众数是一组数据分布的峰值,是一种位置代表值。
其优点是不受极端值影响。
其缺点是具有不唯一性。
(1分)
(2)中位数是一组数据中间位置上的代表值,也是位置代表值,其特点是不受数据极端值的影响。
(1分)
(3)均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。
其主要缺点是易受数据极端值的影响。
(1分)
应用场合:当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应选择均值作为集中趋势的代表值;当数据为偏态分布,特别是当偏斜的程度较大时,应选择众数或中位数等位置代表值,这时它们的代表性要比均值好。
此外,均值只适用于定距或定比尺度的数据,而对于定类和定比尺度的数据则无法计算均值,但却可以计算众数和中位数。
三、为什么要使用变异系数
答:标准差是反映数据分散程度的绝对值,其数值的大小一方面取决于原变量值本身水平高低的影响,也就是与变量的均值大小有关。
(2分)。
因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散
程度的测度值直接进行比较的。
为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数
四、什么是假设检验的P值?如何根据P值作出假设检验的结论?
答:拒绝原假设的最小的显著性水平,被称为观察到的显著性水平(2分)。
1、离中趋势的指标有哪些(至少列出三个),它们之间有何区别?
五、影响抽样误差的因素有哪些?
答:总体各单位的差异程度(即标准差的大小),总体各单位的差异程度越大,抽样误差越大;样本单位数的多少,样本单位数越大,抽样误差越小;抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小;抽样组织方式:简单随机抽样的误差最大。
六、相关分析和回归分析的联系与区别?
答:相关分析,就是用一个指标来表明现象相互依存关系的密切程度。
回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系联系:(1)相关分析是回归分析的基础和前提(2)回归分析是相关分析的继续和深入。
区别:(1)相关分析中两个变量是对等关系,回归分析中则必须确定哪个是自变量,哪个是因变量;(2)相关分析主要用来测试变量之间关系的密切程度,回归分析主要用来研究自变量与因变量之间的一般关系值;(3)两个现象之间的相关系数是唯一的,而回归系数则可能有两个。
七、假设检验一般有哪些步骤?
答: 1.提出原假设和备择假设(2分)
2.确定适当的检验统计量(2分)
3.规定显著性水平α,确定临界值(2分)
4.计算检验统计量的值(2分)
5.作出统计决策(2分)
八、评价估计量的标准
(1)无偏性,估计量抽样分布的数学期望等于被估计的总体参数
(2)有效性,对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效
(3)一致性,随着样本量的增大,估计量的值越来越接近被估总体的参数
九、影响样本容量的决定的因素
(1)总体各单位标志变异程度;
(2)允许误差的大小;
(3)概率度的大小;
(4)抽样方法不同;
(5)抽样方式不同。
十、假设检验的步骤:
1.提出原假设与备择假设
2.确定适当的检验统计量,并计算其数值
3.根据统计量比较数值大小,作出统计推断
十一、相关关系的主要内容:
0<r≤1,存在正相关关系
-1≤r<0,存在负相关关系
r=1,完全正相关关系
r=-1,完全负相关关系
r=0,不存在线性相关关系
十二、多重共线性的表现
1.变量之间高度相关可能会是回归的结果混乱,甚至会把分析引入歧途
2.可能对参数估计的正负号产生影响
十三、时间序列预测的步骤
1.确定时间序列所包含的成分,也就是确定时间序列的类型
2.找出适合此类时间序列的预测方法
3.对可能的预测方法进行评估,已确定最佳预测方案
4.利用最佳预测方案进行预测。