统计学复习资料

合集下载

统计学复习资料(名词解释、简答)

统计学复习资料(名词解释、简答)

统计学复习资料(名词解释、简答)计算题:以老师圈的重点,以及之前布置的作业为主,重点复习11/12章一、名词解释:时间序列数据:是在不同时间收集到的数据,这些数据是按时间顺序收集到的,用于所描述现象随时间变化的情况.总体:是包含所研究的全部个体(数据)的集合样本:是从总体中抽取的一部分元素的集合样本量:构成样本的元素的数目统计量:用来描述样本特征的概括性数字度量参数:用来描述总体特征的概括性数字度量概率抽样:即随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本非概率抽样:抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查简单随机抽样:指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。

分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本整群抽样:是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。

系统抽样:根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式抽样误差:由抽样的随机性引起的样本结果与总体真值之间的误差分组数据:根据统计研究的需要,将原始数据按照某种标准化分成不同的组别,分组后的数据称为分组数据。

方法有单变量值分组和组距分组两种。

众数:是一组数据中出现次数最多的变量值中位数:是一组数据排序后处于中间位置上的变量值平均数:也称均值,是一组数据相加后除以数据的个数得到的结果算术平均数:是指在一组数据中所有数据之和再除以数据的个数。

几何平均数:是n个变量乘积的n次方根方差:各变量值与其平均数离差平方的平均数经验法则:当一组数据对称分布时,经验法则表明:约有68%的数据在平均数1个标准差的范围之内。

约有95%的数据在平均数2个标准差的范围之内。

约有99%的数据在平均数3个标准差的范围之内。

统计学复习资料

统计学复习资料

1、统计学——是一门收集、整理、实和分析统计数据的科学,其目的使探索数据内在的数量规律。

2、统计学的两个含义指的什么?1当他以名词出现时表示一门科学名称—“统计学“。

2当他以复数名词出现时,表示”统计数据“或”统计资料“。

3、统计学分为哪两大类?其含义是什么??1描述统计——是用图形、表格和概括性的的数字对数据进行描述的统计方法。

2推断统计——是根据样本信息对总体进行估计、假设检验、预测的统计方法。

4、解释总体,变量,样本。

1总体就是我们所要研究的所有单位的总和2变量就是我们重点关注的是总体单位具有哪些特征或属性3样本就是总体的一部分。

5、数据的计量尺度分为哪几种?各有哪些特点?1列名尺度—最粗略的计量程度,2顺序尺度—比列名精确性高一些,3间隔尺度—可以对数据进行精确计量的尺度,4比列尺度—和间隔差别很小,主要在于对“0“的理解不同。

6、直接获取统计数据的方法有哪几种?1普查2抽样调查7、基尼系数反映的是什么问题?当基尼系数超过0.4说明什么?当基尼系数=0 表示收入绝对平均,基尼系数=1表示收入绝对不平均,基尼系数小于0.2表示分配平均,在0.2~0.4之间是比较合适的。

基尼系数为0.4时,被认为是收入分配不公的警戒线,超过0.4就应该采取缩小这一差距。

8、影响加权算数平均数的因素是什么?1组中值2权数3分组的组数。

9、众数、中位数、均值的关系是什么?1对称分布MO=ME=X 2右偏分布MO<ME<X 3左偏分布X<ME<MO。

10、反映现象集中趋势的主要指标有哪些?1众数2中位数3均值。

11、反映现象离散趋势的指标又哪些?1极差2方差3标准差。

12、为什么要计算离散系数而不是标准差系数?因为离散系数是从相对的角度观察变异和离散程度的,在比较相关事物的差异程度时,较之直接比较标准差要好些。

13、按抽样的组织方式如何分类?1简单随即抽样2分层抽样3系统抽样4正群抽样14、什么是参数?参数估计的方法又哪几种?参数——是描述总体数据分布特征的一个常量。

统计学复习资料

统计学复习资料

一、单选题1.为了估计全国高中生的平均身高,从50个城市、县选取了100所中学进行调查,在该项研究中,研究者感兴趣的总体是()。

A。

100所中学B。

50个市、县C.全国的高中学生D.100所中学的高中学生2.用组中值代表各组内的一般水平的假定条件是()。

A.各组的次数均相等B。

各组的组距均相等C。

各组的变量值均相等 D.各组数据在本组内呈均匀分布3.中位数和众数是一种()。

A。

数值平均数B。

位置代表值C。

不能反映现象一般水平的指标 D.几何平均数4.如果按年计算的发展水平指标组成一个时间数列,则该数列不体现下列哪个因素的影响()?A。

长期趋势 B.季节变动C。

循环变动D。

不规则变动5.采用几何平均法计算平均发展速度的依据是()。

A。

各年环比发展速度之积等于总速度B。

各年环比发展速度之和等于总速度C。

各年环比增长速度之积等于总速度 D.各年环比增长速度之和等于总速度6.为了调查某校学生的购书费支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种调查方法是().A.简单随机抽样B.整群抽样C。

分层抽样D。

系统抽样7.在方差分析中,()反映的是样本数据与其组平均值的差异。

A。

总离差B。

组间误差C。

抽样误差 D.组内误差8.直线相关系数的绝对值接近于1时,说明两变量相关关系的密切程度是()。

A。

完全相关B。

微弱相关C。

无线性相关 D.显著相关9.下面各式子中,错误的是()。

A.y=-40—1.6x;r=0。

89 B。

y=-5—3。

8x;r=-0.94C.y=36—2。

4x;r=—0.96D.y=-36+3.8x;r=0。

9810. 若两个变量存在负线性相关关系,则对二者建立的回归方程可决系数的值为( )。

A. (-1,0)B。

(0,1)C。

小于-1 D。

无法确定11.总指数与个体指数的主要差异是()。

A。

指标形式不同 B. 计算范围不同C。

计算方法不同D。

计算范围和方法均不同12。

若基尼系数为零,表示收入分配( )。

统计学复习资料

统计学复习资料

统计学复习资料一、填空题(每空1分,共10分)1.变量按其取值的连续性可分为_____________ 和_____________两种。

2.统计调查根据被研究总体范围的不同可分为_____________和_____________ 两种。

3.统计模型中除了用数学方程表示现象的基本关系式外,还应具有_____________ 与两项要素。

4.统计调查根据被研究总体范围的不同可分为_____________ 和_____________两种。

5.统计指标是一定社会经济范畴的具体表现,其特点有_____________和_____________·6.统计模型中除了用数学方程表示现象的基本关系式外,还应具有_____________ 与_____________两项要素。

7.总量指标按其反映时间状态不同分为_____________和_____________。

8.统计研究运用大量观察法是由于研究对象的_____________和_____________所决定的。

9.相关分析研究的是_____________关系,它所使用的分析指标是_____________·二、判断题1.对某市工程技术人员进行普查,该市工程技术人员的工资收入水平是数量标志。

( )2.总体的同质性是指总体中的各个单位在所有标志上都相同。

( )3.在对现象进行分析的基础上,有意识地选择若干具有代表性的单位进行调查,这种调查属于重点调查。

( )4.估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。

( )5.对我国主要粮食作物产区进行调查,以掌握全国主要粮食作物生长的基本情况,这种调查是重点调查。

( )6.若将某地区社会商品库存额按时间先后顺序排列,此种动态数列属于时期数列。

( )7.分析复杂现象总体的数量变动时,若研究的是数量指标的变动,则选择的同度量因素是数量指标。

统计学复习资料

统计学复习资料

一、判断题:1.运用大量观察法,必须对研究对象的所有单位进行观察调查。

()2.一般地,凡是编制数量指标指数,均应以相应的基期质量指标作为同度量因素。

()3.间隔相等间断时点数列序时平均数的计算方法采用简单序时平均法。

()4.分布在各组之内的单位数称频率。

()5.我国的人口普查每10年进行一次,因此,它是一种经常性调查方式。

()6.变量数列中任一组标志值为零,则无法计算调和平均数。

()7.权数的绝对值越大,对算术平均数的影响也就越大。

()8.全距易受极端数值的影响。

()9. 抽样平均误差越大,样本的代表性越大。

()10.相邻两项的累积增长量之差等于相应的逐期增长量。

()11某生产组有5名工人,日产零件数分别为68件.69件.70件.71件.72件,因此说这些是5个数量标志或5个变量。

()12变量按其值是否连续出现,可以分为确定性变量与随机变量。

()13某地区国内生产总值为1000亿万元”是一个要素完整的指标。

14比例相对指标是在分组的基础上计算的。

15 中位数是位置平均数,不受极端数值的影响。

7.权数的绝对值越大,对算术平均数的影响也就越大。

()16时点指标数值大小与时间长短成正比。

()17 抽样极限误差可以小于.大于或等于抽样平均误差。

()18 相对数时间序列求序时平均数时,根据所给数列简单平均即可。

()19 发展水平是计算其他动态分析标志的基础,它只能用总量指标来表示。

()20 编制销售量指数,一般是用报告期价格作同度量因素。

()21抽样平均误差的大小与样本容量的大小成正比例关系。

()22建立指数体系时,首先要分析研究对象与其影响因素之间的内在经济了解。

()23环比速度与定基速度之间存在如下关系式:各环比增长速度的连乘积等于定基增长速度。

()24回归分析中,两个变量是对等关系。

()25在测定相关关系之前,一般在理论分析的基础上,要利用相关表和相关图粗略地判断现象之间的相关程度和相关形态。

()26总指数的平均性是以综合性为基础的,没有综合性就没有平均性。

《统计学》综合复习资料

《统计学》综合复习资料

《统计学》综合复习资料一、单选题1.统计一词的三种涵义是( A )A.统计活动、统计资料、统计学 B.统计调查、统计整理、统计分析C.统计设计、统计分组、统计预测 D.统计方法、统计分析、统计预测2.统计调查按其组织形式分类,可分为( C )A.普查和典型调查 B.重点调查和抽样调查C.统计报表和专门调查 D.经常性调查和一次性调查3.我国编制零售物价指数是采用( C )法来编制的。

A.综合指数 B.平均指标指数C.固定加权算术平均指数D.固定加权调和平均指数4.某商品价格比原先降低5%,销售量增长了5%,则销售额( B )。

A.上升B.下降C.不变D.无法确定5.现有一数列:3,9,27,81,243,729,2187,反映其平均水平最好用( C )。

A.算术平均数 B.调和平均数 C.几何平均数 D.众数6.欲以图形显示两变量X与y的关系,最好创建( D )。

A.直方图 B.圆形图 C.柱形图 D.散点图7.直接反映总体规模大小的指标是( A )。

A.总量指标 B.相对指标 C.平均指标 D.变异指标8.统计调查表可以分为( C )两种形式。

A.单一表和复合表B.简单表和复合表C.单一表和一览表D.简单表和分组表9.大量观察法的数学依据是(C )。

A.贝努里定律B.贝叶斯定理C.大数定律D.中心极限定理10.两变量的线性相关系数为 -1,说明两变量(C )。

A.完全正相关B.不完全相关C.完全负相关D.不存在线性相关关系11.若无季节变动,则季节比率理论上应该(B )。

A.小于1B.等于1C.大于1D.等于012.抽样平均误差的实质是(D )。

A.总体标准差B.样本的标准差C.抽样误差的标准差D.样本平均数的标准差13.某商品价格比上期下降5%,销售额比上期降低了5%,则销售量(C )。

A.上升B.下降C.不变D.无法确定14.几位工人的年龄分别是32岁,35岁,42岁,这几个数字是(C )。

统计学 复习资料

统计学 复习资料

统计学复习提纲1.下列数据中,属于数量标志的是()A.学生的性别B.学生的年龄C.学生的专业D.学生的住址答案:B2. 在国有企业设备普查中,每一个国有工业企业是()A. 调查对象B. 调查单位C. 填报单位D. 调查项目答案:C3.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于()A 简单分组B 平行分组C 复合分组D 再分组答案:B4.下面属于结构相对数的有()。

A. 人口出生率B. 恩格尔系数C. 产值利率值D. 工农业产值比答案:B5.下面四个平均数中,只有()是位置平均数A.算数平均数B.中位数C.调和平均数D.几何平均数答案:B6.累积增长量等于()。

A. 报告期水平与基期水平之差B. 报告期水平与前一期水平之差C. 报告期水平与某一固定基期水平之差D. 逐期增长量之差答案:C7.若价格指数下降,销售额指数持平,则销售量指数( )A. 下降B. 不变C. 上升D. 为零答案:C8、统计预测是对社会经济现象的未来,从( )方面进行的预测A. 质量B.性质C.数量D.理论答案:C9、为了研究某城市的居民收入状况,把该城市按人均年收入分组,其中最后两组是1800~2000元,2000元以上的,则最末一组的组中值是( )。

A、2000元B、2200C、2100D、2150答案:C10、假如各个标志值都增加5个单位,那么算数平均数会( )。

A、增加到5倍B、增加5个单位C、不变D、不能预期平均数的变化答案:B11.权数对算术平均数的影响作用,实质上取决于( )。

A.作为权数的各组单位数占总体单位数比重的大小B.各组标志值占总体标志总量比重的大小C.标志值本身的大小D.标志值数量的多少答案:A12.对某城市工业企业未安装设备进行普查,总体单位是( )。

A.工业企业全部未安装设备B.工业企业每一台未安装设备C.每个工业企业的未安装设备D.每一个工业企业答案:B13.以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身,这一标准称为( )。

统计学复习题

统计学复习题

“统计学”复习资料一、单选题:1、在企事业单位中直接影响统计报表工作数字资料真实可靠的因素是:(A)A、高质量的原始记录工作B、建立统计台帐C、完善企业内部报表D、各种经济核算协调一致2、对占煤炭开采量75%的大矿井进行劳动生产率调查;调查几个铁路枢纽,就可以了解我国铁路货运量的基本情况和问题;统计机关在拥有全国人口一半以上的各大城市的超市进行的零售价格水平系统调查。

这些都是:(C)A、全面调查B、抽样调查C、重点调查D、典型调查3、2010年7月1日零点的全国人口普查是(C)A、一次性调查和非全面调查B、经常性调查和非全面调查C、一次性调查和全面调查D、经常性调查和全面调查4、在不重复抽样中,抽样单位数从5%增加25%,抽样平均误差(C)A、增加39.7%B、增加约3/5C、减少约3/5D、没有什么变化5、计算向上累计次数及比率时,各累计数的意义是各组(A)A、上限以下的累计次数或比率B、上限以上的累计次数或比率C、下限以上的累计次数或比率D、下限以下的累计次数或比率6、2012年某集团公司A分公司工人的月平均工资为2000元,B分公司工人的月平均工资为1800元,2013年各分公司的工资水平不变,但A分公司的工人人数增加30%,B分公司的工人人数增加15%,则2013年两分公司工人总平均工资比2012年()A、降低B、提高C、不变D、不能做结论7、(甲)某高校新生1000人,从理科中随机抽取60人,文科中随机抽取40人,进行英语水平测试;(乙)从麦地总垅长中每3000市尺测竿落点处前后5尺长垅的产量进行实割实测;(丙)为研究城市青年业余时间活动情况,某城市每第10个居委会被抽取,并询问住在那里所有从16岁到30岁的青年人。

上述哪项属于类型抽样?()A、甲B、乙C、乙、丙D、甲、乙、丙=50+70x,这意味着()8、工人工资(元)倚劳动生产率(千元)变化的回归方程为YcA、劳动生产率为1000元时,工资为150元B、劳动生产率每增加1000元时,工人工资提高70元。

《统计学》复习资料

《统计学》复习资料

《统计学》复习资料(一)一单选题1. 下面的哪一个图形最适合描述结构性问题( )A. 条形图B. 饼图C. 对比条形图D. 直方图2. 下列描述正确的是A. 点估计比区间估计需要更大的样本容量B. 点估计相对于区间估计更加准确C. 点估计无法给出参数估计值的置信度和误差大小D. 区间估计无法给出参数估计值的置信度和误差大小3. 假设检验中所犯的错误有两种类型,β错误是指()A. 弃真错误,即拒绝正确的原假设。

B. 取伪错误,即接受一个错误的原假设。

C. 弃真错误,即接受一个错误的原假设。

D. 取伪错误,即拒绝正确的原假设。

4. 同时抛3枚质地均匀的硬币,巧合有2枚正面向上的概率为 ( )。

A. 0.125B. 0.25C. 0.375D. 0.55. 根据概率的统计定义,可用以近似代替某一事件的概率的是 ( )。

A. 大量重复试验中该随机事件出现的次数占试验总次数的比重B. 该随机事件包含的基本事件数占样本空间中基本事件总数的比重C. 大量重复随机试验中该随机事件出现的次数D. 专家估计该随机事件出现的可能性大小6. 为了反映商品价格与需求之间的关系,在统计中应采用( )A. 划分经济类型的分组B. 说明现象结构的分组C. 分析现象间依存关系的分组D. 上述都不正确7. 1.指出下面的数据哪一个属于分类数据( )A. A 年龄B. B 工资C. C 汽车产量D. D 购买商品的支付方式(现金、信用卡、支票)8. 在成数估计中,样本容量的取得通常与总体成数有关,但总体成熟未知,通常A. 取成数为0.5B. 取成数为0C. 取成数的标准差最小D. 取抽样误差最小9. 样本或总体中各不同类别数值之间的比值称为( )A. 频率B. 频数C. 比例D. 比率10. 调查项目( )A. 是依附于调查单位的基本标志B. 与填报单位是一致的C. 与调查单位是一致的D. 是依附于调查对象的基本指标11. 要反映我国工业企业的整体业绩水平,总体单位是:A. 我国每一家工业企业B. 我国所有工业企业C. 我国工业企业总数D. 我国工业企业的利润总额12. 一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。

统计学总复习资料

统计学总复习资料

时间序列构成要素
趋势、季节变动、循环变动、不规则变动。
平稳时间序列模型
01
平稳时间序列定义
统计特性不随时间推移而变化的 序列。
02
平稳时间序列模型
03
模型识别与定阶
自回归模型(AR)、移动平均模 型(MA)、自回归移动平均模 型(ARMA)。
通过自相关函数和偏自相关函数 的截尾或拖尾性质进行识别,利 用信息准则进行定阶。
回归分析
用于探究一个或多个自变量与一个因变量之间的线性关系,通过建立回归方程来 预测因变量的值。常见的回归分析方法包括简单线性回归、多元线性回归、逻辑 回归等。
04
时间序列分析与预测
时间序列概念及特点
时间序列定义
按时间顺序排列的一组数据,反映现象随时 间变化的发展过程。
时间序列特点
动态性、连续性、规律性、随机性。
偏态与峰态度量
偏态系数和峰态系数,用于描述数据分布的形状。
类别型数据描述
频数与频率
计算各类别的频数和频率,以 了解各类别的分布情况。
比例与百分比
计算各类别所占的比例和百分 比,以便更直观地了解数据分 布。
列联表分析
对于两个或多个类别变量,可 以构建列联表并分析其关联性 。
图表展示方法
80%
条形图与饼图
综合评价的方法
包括主成分分析、因子分析、聚类分析等,这些方法可以消除指标 间的相关性,简化数据结构,便于分析和解释。
综合评价的应用领域
广泛应用于经济、社会、环境等领域,如企业绩效评价、区域经济 发展评价、环境质量评价等。
因子分析和聚类分析在综合评价中应用
因子分析在综合评价中的应用
因子分析可以将多个相关指标转化为少数几个不相关的综合指标(即因子),这些因子能够反映原始指标的大部 分信息,从而简化数据结构,便于分析和解释。在综合评价中,因子分析可以用于提取影响评价结果的主要因素, 并对各因素进行客观赋权,得出综合评价值。

统计学复习资料

统计学复习资料
来自第三章 统计数据整理与展示
第一节 统计数据的整理
统计分组指将数据按照某种特征或标准分为不同的组别, 分组后的数据称为分组数据。 分组 时所依据的特征或标准为统计分组标志。 数据审核:检查数据中是否有错误。包括对原始数据的审核和对二手数据的审核。 (1)原始数据的审核:
审核的内容: 1)完整性审核:检查应调查的单位或个体是否有遗漏;所有的调查项目 或指标是否填写齐全。2)准确性审核:检查数据是否真实反映客观实际情况,内容是否符 合实际;检查数据是否有错误,计算是否正确等 审核数据准确性的方法:1)逻辑检查(从定性角度看,审核数据是否符合逻辑,内容是 否合理,各项目或数字之间有无相互矛盾的现象;主要用于对分类和顺序数据的审核) 2) 计算检查 (检查调查表中的各项数据在计算结果和计算方法上有无错误; 主要用于对数值型 数据的审核) (2)二手数据的审核:1)适用性审核(弄清楚数据的来源、数据的口径、相关的背景材料; 确定数据是否符合自己分析研究的需要)2)时效性审核(尽可能使用最新的数据)3)确认 是否必要做进一步的加工整理 数据筛选是根据需要找出符合特定条件的某类数据。 包括将某些不符合要求的数据或有明显 错误的数据予以剔除和将符合特种条件的数据筛选出来, 而不符合特定条件的数据予以剔除。 数据排序: 把定量数据按从小到大或从大到小的顺序排列, 把定性数据按习惯的文字顺序排 列,便于我们研究其条理。 关于数据排序 1)通过数据排列,发现一些明显的特征或趋势,找到解决问题的线索。 2)排序有助于对数据检查纠错,以及为重新归类或分组等提供方便。 3)在某些场合,排序本身就是分析的目的之一(如美国《财富》杂志的世界 500 强企业) 。 4)排序可借助计算机完成。 5)分类数据的排序:字母型数据(升序)汉字型数据。 数值型数据的排序:递增排序,递减排序 数据分组: 对于定性数据就是依据属性的不同将数据划分成若干组, 对于定量数据就是依据 属性数值的不同将数据划分成若干组。 1)分组应考虑:组内同质性,组间差异性。 2)分组关键:变量的选择(选择与研究的问题有关的变量) 、组限的确定(应遵循穷尽和互 斥原则) 。 3)定性数据的分组:组限的确定一般比较简单。如人口,按数量分组。 4)定量数据分组:单变量值分组(即变量的一个取值为一组,适用于离散型变量,并且变量 的取值较少。如家庭的人口数、建筑层数)组距分组(每一组由一个上限值和一个下限值所 形成的区间,适用于连续性变量,或离散型变量且变量的取值较多地情况。如建筑面积、身 高。需遵循“不重不漏”原则可采用等距分组或不等距分组) 组距分组:等距分组,异距分组 组距分组要点:1)将变量的一个区间作为一组 2)适合于连续变量 3)适合于变量值较多的 情况 4)需要遵循“不重不漏”的原则 5)可采用等距分组 ,也可采用不等距分组 组距分组相关概念 下组限:一个组的最小值 上组限:一个组的最大值 组距:本组上限与下限之差 组中距:下限与上限之间的中点值 组距分组的步骤: 1)确定组数 K=1+lg(n)/lg(2)。 2)确定组距。组距等=(最大值-最小值)/组数 K。为便于计算,组距宜取 5 或 10 的倍数。 3))确定组限和次数分配 4)绘制统计图 5)统计分析 频数分布表的编制:

统计学复习资料

统计学复习资料

一、单项选择题1、下列变量中,()属于离散变量。

(A)一包谷物的重量(B)一个轴承的直径(C)在过去一个月中平均每个销售代表接触的期望客户数(D)一个地区接受失业补助的人数2、某班学生数学考试成绩分别为65分,71分,80分和87分,这四个数字是()。

(A)指标(B)标志(C)变量(D)标志值3、下列属于品质标志的是()(A)工人年龄(B)工人性别(C)工人体重(D)工人工资4、现要了解某机床厂的生产经营情况,该厂的产量和利润是(A)连续变量(B)离散变量(C)前者是连续变量,后者是离散变量(D)前者是离散变量,后者是连续变量5、要了解20个工业企业的职工的工资情况时,则总体是()。

(A)20个工业企业(B)20个工业企业的职工工资总额(C)每一个工业企业的职工(D)20个工业企业的全部职工6、构成统计总体的必要条件是()。

(A)差异性(B)综合性(C)社会性(D)同质性二、多项选择题1、在全国人口普查中()。

A、全国所有人口数是总体B、每一个人是总体单位C、人的年龄是变量D、全部男性人口的平均寿命是统计指标E、某人的性别为“女性”是一个品质标志2、统计总体的特征是()。

A、科学性B、大量性C、实用性D、同质性E、变异性3、下列统计指标为质量指标的有()。

A、工资总额B、储蓄存款余额C、人口密度D、职工人数E、人均国民收入4、总体、总体单位、标志、指标这几个概念间的相互关系表现为()。

A、没有总体单位就没有总体,总体单位也离不开总体而独立存在B、指标是说明总体特征的,标志是说明总体单位特征的C、总体单位是标志的承担者D、统计指标的数值来源于标志E、指标和标志都能用数值表示答案一、单项选择题1、D2、D3、B4、D5、D6、D二、多项选择题1、BCD2、BDE3、CE4、ABCD1.某机械工业系统欲进行工业企业生产设备状况普查,要求在1月1日至20日全部调查完毕,这一时间是()A.调查期限B.调查时间C.登记期限D.标准时间2.对一批商品进行质量检验,最适宜采用的调查方法是()A.全面调查B.抽样调查C.典型调查D.重点调查3.某城市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是()A.普查B.抽样调查C.典型调查D.重点调查4.重点调查中的重点单位是指()A.这些单位举足轻重B.这些单位是工作重点C.这些单位的数量占总体全部单位的很大比重D.这些单位的标志总量在总体标志总量中占绝大比重5.全面调查与非全面调查的划分是以()A.时间是否连续来划分的B.调查组织的规模大小来划分C.调查对象所包括的单位是否完全来划分的D.最后取得的资料是否全面来划分的的6.对某市全部商业企业职工生活状况进行调查,调查对象是()A.该市全部商业企业B.该市全部商业企业的职工C.该市每一个商业企业D.该市商业企业的每一个职工7.抽样调查与重点调查的主要区别是()A.作用不同B.组织方式不同C.灵活方式不同D.选取的调查单位不同8.调查时限是指()A.调查资料所属的时间B.进行调查工作的期限C.调查资料报送的时间D.调查工作登记的时间1.普查是一种()A.专门组织的调查 B.经常性调查C.一次性调查D.非全面调查E.全面调查2.在工业企业生产设备的调查中()A.全部工业企业是调查对象B.每台生产设备是调查单位C.每台生产设备是填报单位D.每个工业企业是填报单位E.工业企业的全部生产设备是调查对象3.按抽样法抽取部分单位进行调查()A.部分单位是有意识抽取的B.部分单位是按随机原则抽取C.哪些单位被抽中由其代表性决定D.哪些单位被抽中纯属偶然E.总体各个单位都有同等中选的机会4.下列情况的调查单位和填报单位不一致的是()A.工业企业生产设备调查B.人口普查C.农产量调查D.工业企业现状调查E.城市零售商店销售情况调查5.下列情况的统计调查,哪些属于连续性调查()A.商店的商品库存量B.运输部门的客运周转量C.企业发生的工伤事故次数D.学校年底在校生人数E.某地区年出生人数答案一、单项选择题1、A2、B3、D4、D5、C6、B7、A8、B二、多项选择题1、ACE2、BDE3、BDE4、ABC5、BCE练习题一、单项选择题(1)加权算术平均数()A.只受各组变量值大小影响B.只受各组次数多少的影响C.同时受到以上两种因素的影响D.无法判断(2)权数本身对加权算术平均数的影响,决定于()A.权数所在组标志值的数量大小B.权数绝对数值的大小C.各组单位数占总体单位数比重的大小D.总体单位数的多少(3)设有8个工厂生产某种产品,他们某日的日产量(件)按顺序排列是:4、6、6、8、9、12、14、15,则日产量的中位数是()A.4.5B.8和9C.8.5D.没有中位数(4)根据某管理局8家企业每一家的工人月平均工资和每一家企业工人数占所有企业工人数的比重资料,要计算该管理局工人的平均工资,应采用的计算形式是()A.简单算术平均B.简单调和平均C.加权算术平均D.加权调和平均5)两个总体的平均数不等,但标准差相等,则()A.平均数小,代表性大B.平均数大,代表性大C.无法进行正确判断D.两个平均数代表性相同(6)下列表述中错误的是()A.总体中各个标志值与其算术平均数离差之和为零B.各个标志值与其算术平均数的离差平方之和为最小C.总体中各个标志值与其算术平均数离差皆为零D.标志总量=单位总量×算术平均数7)是非标志的标准差最大值是()A.1B.0.5C.0.25D.0.4(8)甲乙两厂的平均工资分别为1000元和2000元,工资的标准差分别为100元和150元,则()A.甲厂平均工资的代表性大B.乙厂平均工资的代表性大C.甲乙两厂平均工资的代表性相同D.无法判断二、计算答案一、单项选择题1、C2、C3、C4、C5、B6、C7、B8、B练习题一、单项选择题1.已知环比增长速度为9.2%、8.6%、7.1%、7.5%,则定基增长速度为()A.9.2%×8.6%×7.1%×7.5%B.(9.2%×8.6%×7.1%×7.5%)-100%C.109.2%×108.6%×107.1%×107.5%D.(109.2%×108.6%×107.1%×107.5%)-100%2.下列等式中,不正确的是()A.发展速度=增长速度+1B.定基发展速度=相应各环比发展速度的连乘积C.定基增长速度=相应各环比增长速度的连乘积D.平均增长速度=平均发展速度-13.累计增长量与其相应的各个逐期增长量的关系表现为()A.累计增长量等于相应的各个逐期增长量之积B.累计增长量等于相应的各个逐期增长量之和C.累计增长量等于相应的各个逐期增长量之差D.以上都不对4.编制动态数列的基本原则是要使动态数列中各项指标数值具有()A.可加性B.可比性C.一致性D.同质性5.某地区1990-1996年排列的每年年终人口数动态数列是()A.绝对数动态数列B.绝对数时点数列C.相对数动态数列D.平均数动态数列6. 计算序时平均数时,”首末折半法”适用于( )A.时期数列计算序时平均数B.间隔相等的时点数列计算序时平均数C.间隔不等的时点数列计算序时平均数D.由两个时点数列构成的相对数列动态数列计算序时平均数7. 若今年比去年的环比发展速度为112%,去年比前年的环比增长率为3%,那么今年比前年的平均增长率为( )。

统计学复习资料

统计学复习资料

第一章1.统计:包含三方面的含义,统计工作(或统计活动)、统计资料和统计学。

2.统计工作:是指为管理需要或科学研究需要,而对社会经济现象的数据进行搜集、整理和分析的一系列统计活动过程。

3.统计活动:一般包括统计设计、统计调查、统计整理、统计分析等这几个阶段依次进行。

4.统计资料:统计资料是指统计工作过程中所产生的统计数据、统计报表、统计图表、统计分析报告(文)以及与之相联系的其他资料的总称。

5.统计学:是指系统阐述统计实践活动基本原理和研究方法的理论。

它是一门研究如何搜集、整理和分析统计资料的理论和方法论的科学。

6.统计学特点:1)研究客观事物总体数量的方法论2)在大量观察的基础上,通过归纳推理获得总体数量方面的综合认识3)是一门多学科性的科学7.统计总体:1)概念:客观存在的,具有同一性质的多个个体,就是统计总体。

统计总体简称总体,与样本相对应。

统计总体分为有限总体与无限总体。

有限总体是指总体中包含的单位数是有限的。

无限总体是指总体中包含的单位数是无限的。

2)基本特征:①大量性;②局限性;③变异性8.总体单位:构成统计总体的每个基本单位或元素称为总体单位,总体单位简称单位或个体,它是各项统计特征的原始承担者。

9.标志:标志是总体单位特征的名称。

分品质标志与数量标志。

品质标志:表示事物的质的特征,是不能用数值表示的,一般用文字来表示;数量标志:表示事物的量的特征,即变量,是可以用数值表示的。

品质标志的具体表现是属性,数量标志的具体表现是数值。

数量标志的具体表现,也称为数量标志值,或标志值。

10.指标与指标体系1)定义:统计指标是说明总体数量特征的概念和具体数值,简称指标,用来反映事物质的规定性与量的确定性。

它是根据总体单位某一标志值汇总或综合而成,是用来说明总体某一数量特征的,或质的特征。

2)统计指标构成五要素:指标名称、计量单位、指标数值、时间、地点。

11.标志与指标的关系:标志与指标既有区别,又有联系。

统计学复习资料

统计学复习资料

统计模拟试卷一一、填空题(每空1分,共计10分)1. 从统计方法的构成看,统计学可以分为__描述统计学________和推断统计学。

2.____普查____是为一定目的而专门组织的一次性全面调查。

3. 如果我们要研究某班学生的学习状况,则该班所有学生是一个总体,每个学生是一个___总体单位_____。

4. 在抽样调查中,使总体的每个单位都有相同的被抽中可能性的原则,称为___随机原则_______。

5. 若身高与体重的直线相关系数为0.85,则体重与身高的直线相关系数为___0.85____。

6. 比率P的方差为_P(1─)P__。

7.某企业有两个生产车间,A车间的人均日加工产量为20件,标准差为5件,B车间的人均日加工产量为30件,标准差为7件,则A车间人均日加工产量的代表性小于B车间人均日加工产量的代表性。

8. 客观事物之间的数量联系,一种是函数关系,另一种是相关关系。

9. 拉氏指数将同度量因素固定在基期。

8.二、单项选择题(每题1分,共计12分)1.某连续变量数列,其末组组限为500以上,又知其相邻组中值为480,则末组的组中值为( ① )。

①520 ②510 ③500 ④490 2.如果要对某类型号炮弹的杀伤力进行检测,则应该采用(② )进行调查。

①统计报表②抽样调查③重点调查④典型调查 3.如果要比较10个男生的平均身高和平均体重的代表性哪个更好,最好采用(③ )。

①标准差②方差③标准差系数④极差4.权数本身对加权算术平均数的影响,取决于(③)。

①权数所在组标志值的数量大小②权数绝对数值的大小③各组单位数占总体单位数比重的大小④总体单位数的多少 5.纯随机重复抽样条件下,当误差范围Δ扩大一倍,抽样单位数(②)①只需原来的1/2 ②只需原来的1/4③需要原来的1倍④需要原来的2 6.下列指标中属于时点指标的有(② )。

①利润总额②人口数③国民收入④产量7.已知变量X与变量Y之间存在着正相关,指出下列回归方程中哪个肯定是错的(④)。

统计学复习资料

统计学复习资料

统计学复习资料(简答题)1、简述统计数据的类型及预处理。

答:1)按照所采用的不同的计量尺,统计数据分为分类数据、顺序数据和数值型数据。

2)按照统计数据的收集方法,统计数据可分为观测数据和实验数据3)按照被描述的现象和时间关系,统计数据可分为截面数据和时间序列数据。

2、统计数据的具体收集方法有哪些答:1)询问调查:具体包括方为调查、邮寄调查、电话调查、电脑辅助调查、座谈会和个别深访调查2)观察与实验:具体包括观察法和实验法3、从应用的数据类型、画图及作用三方面谈谈你对箱线图的认识。

答;箱线图由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而形成的,反应原始数据分布的图形。

通过箱线图,不仅可以反应出一组数据分布的特征,还可以进行多组数据分布特征的比较。

箱线图由一个箱子和两条线组成,他用中位数来描述一组数据的集中趋势,有两个四分位数形成的箱子和两个极值与箱子相连的实线分别描述数据的离散程度。

4、简述饼图和环形图的区别。

答:环形图与饼图相似,但又有区别。

环形图有一个空洞,样本或总体中的每一部分数据用环中的一段表示,饼图只能显示一个总体和样本各部分所占的比例,而环形图则可以同时绘制多个总体和样本的数据系列,每一个总体或样本的数据系列为一个环。

因此,环形图可显示多个总体或样本各部分所占的相应比例,从而利于进行比较研究。

5、平均数、众数、中位数在应用上有哪些区别?答:平均数、中位数和众数是描述数据集中趋势的三个主要统计量。

平均数在实践中较多用,主要缺点是易受极端值得影响,对于偏态分布的数据,平均数的代表性较差,中位数和众数提供的信息不像平均数那样多,但他们也有优点,比如不受极端值得影响,就有统计上的稳定性,当数据为偏态分布,可以考虑选择中位数或者是众数,这是他们代表性要比平均数好。

6、简述时间序列的构成要素。

答:时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。

统计学复习资料

统计学复习资料

考試題型:單選題10题/2分多選題5题/2分填空題10空/0.5分名詞解釋5个/3分簡答題1个/5分計算分析題3个/10+15+15考试时间:1.18統計學09:00~11:00第一章绪论名词解释统计学原理:阐述统计学的基本理论和方法,即阐述关于统计调查、统计整理、统计分析的基本理论和方法。

总体:指在某种共性的基础上由许多个别事物结合起来的整体。

总体单位:构成总体的个别事物。

标志:指说明总体单位特征的名称。

变异:总体单位间品质和数量上的差异。

变量:可变的数量标志。

指标:是说明总体数量特征的概念。

概念理解统计学的学派:记述学派、政治算术学派、图表学派、数理学派、社会学派。

统计的特点:❤数量性。

统计最基本的特点就是以数字为语言,用数字说话。

具体来说,是用规模、水平、速度、结构和比例关系,去描述和分析客观事物的数量表现、数量关系和数量变化,揭示事物的本质,反映事物发展的规律,推断事物发展的前景。

❤具体性。

统计所研究的量不是抽象的量,而是与客观事物的质密切相关的量,是体现事物相互关系和发展的变化的量,具有明显的时空特点和事物属性的特点。

统计不能离开事物的质去研究事物的量;研究事物的量,目的也在于认识事物的质及其发展变化的规律。

统计不研究抽象的量,也没有自我的目的,不应当为统计而统计,更不应该搞数字游戏。

❤综合性。

作为认识武器的统计,是从总体上研究客观事物的。

它虽然也是研究个体,但只是为了研究综合个体来认识总体。

不与总体密切联系的量,不具有体现事物运动规律的重复性和稳定性,不是统计研究的量。

统计学研究的对象:统计工作的规律性,即搜集、整理和分析统计数据的方法。

总体的特征:①同质性。

构成总体的各个单位必须具有某一方面的共性,这个共性是我们确定总体范围的标准②大量性。

总体是由许多单位所组成的,而不是只有个别单位。

③差异性。

总体单位之间,除了必须在某一方面有共性之外,在其他方面必然存在差异。

第二章统计调查概念理解统计调查的基本原则:要实事求是,如实反映情况(准确性原则)要及时反映,及时预报(及时性原则)要数字与情况相结合(完整性原则)统计调查的组织形式(给出一个例子,要懂得判断是用了哪种调查方法)调查误差的总类:※代表性误差(一部分推断总体时必然存在的误差,影响因素包括样本的大小、总体的差异性)※工作误差(由于调查工作中的失误造成的误差,包括抽样框误差、回答误差、调查员误差等)产生调查误差的原因◎因调查方案不妥而产生的误差◎因调查过程中记录不准和转抄有误而产生的记录误差◎因计量器具不准,计量单位折算和数据汇总有误而产生的计算误差◎因调查者故意弄虚作假而产生的立意误差名词解释调查误差:指调查所得的同居数据与调查对象实际数量之间的差异。

统计学复习资料整理

统计学复习资料整理

极差:一组数据的最大值与最小值之差称为极差,也称全距,用R表示。

其计算公式为:R=max(xi)-min(xi)离散系数:也称为变异系数,它是一组数据的标准差与其相应的平均数之比。

其计算公式为:V=S/X。

离散系数是测量数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。

离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。

三大统计分布:卡方分布、T分布、F分布卡方分布(χ2)定理:设n个相互独立并且都服从正态N(0,1)分布的随机变量X1、X2,……Xn,记则随机变量χ2服从自由度为n的χ2分布。

统计变量服从卡方分布,其含义是:在给定概率α的条件下,满足或者说表达式的概率为α。

T分布定理:设随机变量x,y相互独立,X~N(0,1),Y~χ2(n)记。

则随机变量T服从自由度为n的t分布。

设T~t(n),0<α<1,对于满足下列等式的数t a(n),称为t(n)分布的上侧分位数。

对于较大的n(>45)可以同标准正态分布的上侧分位数u a作为t(n)分布的上侧分位数F分布定理:设随机变量x,y相互独立,X~χ2(n1),Y~χ2(n2)记,则随机变量F服从第一自由度为n1,第二自由度为n2的F分布,记作:F~F(n1,n2)若F~F(n1,n2),易知:,若则统计量:描述样本特征的概括性数字度量。

完全由样本决定的量,叫做统计量;或者说不含有其他未知量的样本的函数称为统计量。

统计量可以看做是对样本的一种加工,它吧样本中所包含的关于总体的其一方面的信息集中起来。

最常用的统计量是样本均值和样本方差S 2。

自由度:随机变量所包含的独立变量的个数。

参数估计:就是用样本统计量去估计总体的参数。

在参数估计中,用来估计总体参数的统计量的名称称为估计量,用符号θ表示。

样本均值、样本比例、样本方差等都可以是一个估计量。

而根据一个具体的样本计算出来的估计量的数值称为估计值。

参数估计的方法有点估计和区间估计两种。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

6、统计中所说的样本是指:
A.随意抽取的总体中任意部分
B.有意识的选择总体中典型部分
C.依照研究者要求选取总体中有意义的一部分
D.按照随机原则抽取总体中有代表性的一部分
E.以上方法都不是、
7、统计中所说的总体是指:
A.根据研究目的确定研究对象的全体
B.随意想象的研究对象的全体
C.根据地区划分的研究对象的全体
D.根据时间划分的研究对象的全体
E.根据人群划分的研究对象的全体
8、直条图可用于
A.某现象内部构成
B.各相互独立指标数值大小
C.各现象的比较
D.某现象的频数分布
E.某现象的发展速度
9、直方图可用于
A.某现象内部构成
B.各现象的比较、
C.某现象随另一现象的伴随变化趋势
D.某现象频数分布
E.某现象的发展速度
10、用图表示某地区解放以来三种疾病的发病率在各年度的动态发展速度情况,宜绘制:
A.普通线图
B.直方图
C.构成比直条图
D.半对数线图
E.直条图
11、U±δ范围占正态分布曲线下面积的:
A.50.0%
B.90.0%
C.95.0%
D.95.45%
E.68.27%
14、计算抗体滴度的平均滴度习惯上用:
A.中位数
B.几何均数
C.众数
D.算术均数
E.百分位数
15、标准差(S)的大小与下列何者有关
A. x
B. N和∑(X- x) 2
C.全距
D.变展系数
16、均数的标准误是衡量:
A.变异值之间的差距
B.正态曲线下面积
C.样本均数之间的变异
D.均数与某一标准指标之间的差值
E.标准正态分布
17、正态曲线参数:
A.S和CV决定
B.X和Sx决定
C.U和δ决定
D.U和决定
E.例数和变异值决定
18、当抽取无限多个样本时,无限多个样本均数的均数
A.与总体均数相差一个δ
B.与总体均数相差一个S
C.等于总体均数
D.非常接近总体标准差19、t检验的作用
A.检验样本均数间的实际差异是否等于0
B.检验随机抽样误差的有无
C.检验均数的实际差由随机抽样误差所固定的概率大小
D.检验系统误差是否等于随机抽样误差
E.检验随机抽样误差为0时的概率
20、当n1=100算得t=1.96,结论为
A.P<0.05拒绝Ho
B.P=0.05拒绝Ho
C.P>0.05接受Ho
D.P<0.01
E.P=0.01
21、在配对资料的t检验中,其无效假设是:
A.两样本来自同一总体
B.差数的均数来自U=O总体
C.差数的均数来自U#O的总体
D.差数的均数来自U>O的总体
E.差数的均数来自U<O的总体
4、统计表的标题应是指:
A.说明表的内容
B.注明资料的时间
C.注明资料的地点
D.说明统计者
5、Sx大小取决于:
A.S
B.X
C.N
D.X与S
6、表示个体变量值离散情况的指标:
A.变异系数
B.标准差
C.全距
D.标准误
7、标准差的作用:
A.表示观察值分布的变异程度
B.表示抽样误差的分布情况
C.估计正常值范围
D.估计总体均数的可信区间
8、用变异系数比较变异程度适宜于:
A.不同指标,均数相差较大
B.不同指标,标准差相差较大
C.相同指标,均数相差较大
D.相同指标,标准差较大
9、t检验中的t值是:
A.均数间的差异相当于样本标准误的倍数
B.均数间的差异相当于样本标准差的倍数
C.是衡量均数间差异的一个度量
D.概率为0.05或0.01时的t分布的临界值
10、何种情况下可作差异显著性的判断?
A.t> t0.05(n')
B.t=t0.01(n')
C.t= t0.05(n')
D. t0.05(n') <t< t0.01(n')
16、对于正态分布资料可用以公式估计正常值范围
A.x±1.96Sx
B.x±1.96S
C.x±2.58Sx
D.x±2.58S
填空
1.几何均数应用于_________ 或_________ 。

2 .计量资料的分布特征有和。

3. 描述计量资料离散趋势的常用指标有,___和__ 。

4.统计表是由_____、_____、_____、_____和_____五部分构成。

3.描述计量资料平均水平的指标有,,。

4.医学统计资料分为,二类。

名词解释
标准差
样本

同质
正态分布
总体
样本
抽样误差
统计表
概率
第一、二类错误
小概率事件
正交设计
参数检验
抽样误差
完全随机设计
参考值范围
可信区间
解答题:
•1.描述集中趋势三个指标的应用区别
•2.统计表的制作要求
•3。

标准差与标准误的区别、联系
•4。

何谓假设检验?
•5。

正常值范围与可信区间的区别
•6。

统计图的绘制通则.
•7。

例举5种试验设计方法,并简述其设计要点.
8.下表是关于某医院对自行制备的三种消毒剂的杀菌效果考察资料,以被消毒物品的残余细菌数(cfu/m2)为评价指标,说明三种消毒剂的效果是否存在差异。

现欲对其用SPSS统计,请写出:(1)如何用SPSS建交数据库(变量设置);(2)SPSS分析的操作步骤
•9。

某研究者把24名贫血患儿按年龄及贫血程度分成8个区组(ni=8),每一区组中三名儿童用随机的方式分配给A、B和C三种不同的治疗方法(处理组)。

治疗后测量患儿血红蛋白含量的增加量(g/L),结果见附表。

现欲对其用SPSS统计,请写出:
•(1)如何用SPSS建交数据库(变量设置);
•(2)SPSS分析的操作步骤
第9题答案:(1)建立了三个变量来包括上述信息,即“区组”表示区组,“疗法”代表三种治疗方法(以1、2、3分别表示三种处理),X 表示血红蛋白增加量(必考题)(2)Analyze==>General Lineal model==>Univariate
Dependent Variable框:选入X
Fixed Factors框:选入“区组”和“疗法”
Model钮:单击;Custom单选钮:选中
Model框:选入“区组”和“疗法”。

单击continue
Post Hoc钮:单击
Post Hoc test for框:选入“疗法”
SNK复选框:选中
单击continue
单击OK ,输出结果。

完成方差表格,做出统计推断,解释结果。

变异来源
SS υMS F P 区组1462.67
疗法误差167.59 99.08
总1729.33
注公式见P44,要自己记的!
•10。

均数、几何均数、中位数的适用范围有何异同?(8分) •11.假设检验注意事项?
计算题
1、据大量调查知,健康成年男子脉搏的均数为72次/分,某医生在某山区随机调查了25名健康成年男子,其脉搏均数为74.2次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏高于一般人群?(P25、27)。

相关文档
最新文档