2013统计学e(7-2)
《统计学》-第7章-习题答案
第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。
2.答:相关和回归都是研究现象及变量之间相互关系的方法。
相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。
3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。
复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。
偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。
4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。
根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。
总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。
两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。
第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。
统计学第七章课后题及答案解析
第七章一、单项选择题1.按指数所包括的范围不同, 可以把它分为( )A .个体指数和总指数B .数量指标指数和质量指标指数C .综合指数和平均指数D .定基指数和环比指数2.某集团公司为了反映所属各企业劳动生产率水平的提高情况,需要编制( ) A.质量指标综合指数 B.数量指标综合指数 C.可变构成指数 D.固定构成指数3.在一般情况下,商品销售量指数和工资水平指数的同度量因素分别为( ) A .商品销售量、平均工资水平 B .商品销售量、职工人数C .单位商品销售价格、职工人数D .单位商品销售价格、平均工资水平 4.下列指数中属于数量指标指数的是( )A .产品价格指数B .单位成本指数C .产量指数D .劳动生产率指数 5.下面属于价格指数的是( ) A .1101PQ P Q ∑∑ B .1100PQ P Q ∑∑ C .0100P Q P Q ∑∑ D .1000PQ P Q ∑∑ 6.某商品价格发生变化,现在的100元只值原来的90元,则价格指数为( ) A .10% B .90% C .110% D .111% 7.固定构成指数的公式是( )A .001110X F X F F F ∑∑÷∑∑ B .010010X F X F F F ∑∑÷∑∑ C .011111X F X F F F ∑∑÷∑∑ D .011010X F X F F F ∑∑÷∑∑ 二、多项选择题1.下列属于数量指标指数的有( )A .产量指数B .销售量指数C .价格指数D .单位产品成本指数E .职工人数指数 2.下列表述正确的是( )A .综合指数是先综合后对比B .平均数指数是先对比后综合C .平均数指数必须使用全面资料D .平均数指数可以使用固定权数E .固定构成指数受总体结构影响 3.同度量因素的作用有( )A .同度量作用B .联系作用C .权数作用D .比较作用E .平衡作用4.对某商店某时期商品销售额的变动情况进行分析,其指数体系包括( ) A .销售量指数 B .销售价格指数C .总平均价格指数D .销售额指数E .个体指数5.若用某企业职工人数和劳动生产率的分组资料来进行分析时,该企业总的劳动生产率的变动主要受到( )A.企业全部职工人数变动的影响 B.企业劳动生产率变动的影响C.企业各类职工人数在全部职工人数中所占比重的变动影响D.企业各类工人劳动生产率的变动影响E.受各组职工人数和相应劳动生产率两因素的影响6.下列指数中,属于拉氏指数的有()A.∑∑1QpQpB.∑∑11QpQPC.∑∑1pQpQD.∑∑111QpQpE.∑∑111pQpQ7.某企业产品总成本报告期为183150元,比基期增长10%,单位成本综合指数为104%,则()A.总成本指数110% B.产量增长了5.77% C.基期总成本为166500元D.单位成本上升使总成本增加了7044元 E.产量增产使总成本增加了9606元三、判断题1.综合指数的编制方法是先综合后对比。
统计学7
=755.9(元 =755.9(元)
∑ f =1500,所以第三组为中位数组。 中位数位置= =1500,所以第三组为中位数组。 中位数位置=
∑f
Me = am − 1 + 2
2
− Sm−1 fm
1500 − 720 ×100 ×d=700 + 1050
=774.3(元 =774.3(元)
数据的特征和测度
例:计算某车间工人平均工资(单值式分组) 计算某车间工人平均工资(单值式分组)
工资(x) 工资 500 530 740 860 1020 合计 工人数(f) 工人数 2 4 8 5 1 20 工资总额(xf) 工资总额 1000 2120 5920 4300 1020 14360
:
∑xf X = ∑f
总体内在的 数量规律性
第3节几个重要的基本概念
一、统计总体、个体和样本 统计总体、 二统计量
1 x = ∑ xi n
2
( Χ i − Χ) ∑
2
2 2 1 ~2 1 S = ∑ (Χ i − Χ) S = ∑ ( Χ i − Χ) n −1 n
第2章 统计调查
系统误差、随机误差( 14) 系统误差、随机误差(P14) 第2节非随机调查 一、统计报表 二、普查 三、重点调查 四、典型调查
水平法——计划期末应达到的的水平( 水平法——计划期末应达到的的水平(例3.5 ) 计划期末应达到的的水平 确定是否完成计划 确定是否提前完成 累计法——计划期内应达到的总规模 累计法——计划期内应达到的总规模 确定是否完成计划 确定是否提前完成了计划
(三)平均数 三、时间序列数据与截面数据 截面数据:描述多种不同事物(指标) 截面数据:描述多种不同事物(指标)在同一时 刻或同一状态下的变化情况 时间序列数据:描述的同一事物(指标)随时间 时间序列数据:描述的同一事物(指标) 或状态的变化情况
2013统计学课后习题答案
应用统计学2011级工商管理专2班秦明全第一章总论一.单项选择1.C2.B3.D4.A5.D6.A7.A8.D9.C 10.C二.填空题1.连续性离散型2.指标名称指标数值3.不变标志变异标志4.数量标志变量值5.某种综合数量特征的名称和具体数值6.有限总体无限总体7.数量品质三.判断题1.√2.×3.√四.简答题1.统计指标和标志的关系?答:区别:1.标志的说明总体单位属性的,一般不具有综合的特征;指标是说明总体综合数量特征的,具有综合的性质。
2.统计指标都可以用数量来表示;标志中,数量标志可以用数量来表示,品质标志只能用文字表示。
联系:1.统计指标的指标值是由各单位的标志值汇总或计算得来的;2.随着研究目的的不同,指标与标志之间可以相互转化。
2.什么是统计总体?它的特点是什么?答:a统计总体简称总体是我们要调查或统计某一现象全部数据的集合。
b统计总体的基本特征:总体和总体范围的确定,取决于统计研究的目的要求。
而形成总体的必要条件,亦即总体必须具备的三个特性:1大量性2同质性3变异性举例:大量性:所有的工业企业;同质性:在性质上每个工业企业的经济职能是相同的,都是从事工业活动的基本单位; 变异性:每个工业企业从事的活动内容不同,企业法人不同,员工人数不同3.什么是总体和总体单位?其关系如何?答:a总体:是一个统计问题中所涉及个体的全体。
b总体单位:是构成总体的各个个别单位,它是组成总体的基本单位,也是调查项目的直接承担者。
如:对工业企业进行调查,全国工业企业是总体,每一个工业企业就是单位。
若研究目的不同,总体和总体单位可以互换,总体有可能变成总体单位,总体单位有可能变成总体。
c①同质性。
构成总体的各个单位必须具有某一方面的共性,这个共性是我们确定总体范围的标准②大量性。
总体是由许多单位所组成的,而不是只有个别单位。
③差异性。
总体单位之间,除了必须在某一方面有共性之外,在其他方面必然存在差异。
统计学考试试题
统计学考试试题一、不定项项选择题(共35小题,每小题2分,共70分)1、标准差(CE)正确答案:()A、表明总体单位标志值的一般水平B、反映总体单位的一般水平C、反映总体单位标志值的离散程度D、反映总体分布的集中趋势2、由反映总体各单位数量特征的标志值汇总得出的指标是(B)。正确答案:()A、总体单位总量B、总体标志总量C、质量指标D、相对指标3、比较两个不同水平数列总体标志的变异程度,必须利用(B)。正确答案:()A、标准差B、标志变动系数C、平均差D、全距4、划分连续变量的组限时,相邻组的组限必须(A)。正确答案:()A、重叠B、相近C、不等D、间断5、影响加权算术平均数的因素有(AB)正确答案:()A、各组频率或频数B、各组标志值的大小C、各组组距的大小D、各组组数的多少6、甲、乙两数列的平均数分别为100和5,它们的标准差为8和7,则(A)。正确答案:()A、甲数列平均数的代表性高于乙数列B、乙数列平均数的代表性高于甲数列C、两数列平均数的代表性相同D、两数列平均数的代表性无法比较7、反映样本指标与总体指标之间的平均误差程度的指标是(C)。正确答案:()A、平均数离差B、概率度C、抽样平均误差D、抽样极限误差8、某公司下属五个企业,共有2000名工人。已知每个企业某月产值计划完成百分比和实际产值,要计算该公司月平均产值计划完成程度,采用加权调和平均数的方法计算,其权数是(B)。正确答案:()A、计划产值B、实际产值C、工人数D、企业数9、统计表按主词是否分组及分组的程度,可分为(ACD)正确答案:()A、简单表B、一览表C、分组表D、复合表10、调查几个重要铁路枢纽,就可以了解我国铁路货运量的基本情况和问题,这种调查属于(B)。正确答案:()A、普查B、重点调查C、典型调查D、抽样调查11、估计标准误是反映(ABDE)正确答案:()A、回归方程代表性大小的指标B、估计值与实际值误差程度的指标C、自变量与因变量离散程度的指标D、因变量估计值的可靠程度的指标12、普查是一种(ABE)正确答案:()A、专门组织的调查B、一次性调查C、经常性调查D、非全面调查13、对总体按某个标志进行分组,得到的统计表属于(A)。正确答案:()A、分组表B、复合表C、简单表D、整理表14、下列相对数中,属于不同时期对比的指标有(B)。正确答案:()A、结构相对数B、动态相对数C、比较相对数D、强度相对数15、抽样调查的主要目的是(B)。正确答案:()A、计算和控制抽样误差B、推断总体总量C、对调查单位作深入研究D、广泛运用数学方法16、下述各项调查中属于全面调查的是(B)。正确答案:()A、对某种连续生产的产品质量进行检验B、对某地区对工业企业设备进行普查C、对全面钢铁生产中的重点单位进行调查D、抽选部分地块进行农产量调查17、总量指标按反映时间状况的不同,分为(B)。正确答案:()A、数量指标和质量指标B、时期指标和时点指标C、总体单位总量和总体标志总量D、实物指标和价值指标18、反映社会经济现象发展总规模、总水平的综合指标是(B)。正确答案:()A、质量指标B、总量指标C、相对指标D、平均指标19、定基发展速度与环比发展速的关系是(ABD)正确答案:()A、两者都属于速度指标B、环比发展速度的连乘积等于定基发展速度C、定基发展速度的连乘积等于环比发展速度D、相邻两个定基发展速度之商等于相应的环比发展速度20、权数对算术平均数的影响作用,实质上取决于(A)。正确答案:()A、作为权数的各组单位数占总体单位数比重的大小B、各组标志值占总体标志总量比重的大小C、标志值本身的大小D、标志值数量的多少21、统计整理的方法是(ADE)正确答案:()A、统计分组B、划分经济类型C、检验统计资料库D、统计汇总。
统计学原理(第2版)习题答案解析简版
第一章总论二、单项选择题1.B 2.C 3.A 4.B 5.A6.D 7.D 8.B 9.D 10.D 11.C 12.A 13.C 14.D 15.D三、多项选择题1.ACE 2.ABD 3.BE 4.CE5.BDE 6.ABC 7.ACE 8.ABCE9.BCE 四、判断题1.×2.×3.√4.√5.×6.×7.√8.×第二章统计设计一、填空题(1)第一、各个方面、各个环节(2)整体设计、专项设计(3)全阶段设计、单阶段设计。
(4)长期设计、中期设计、短期设计。
(5)相互联系、相互制约(6)总体数量、概念、具体数值。
(7)总量指标、相对指标、平均指标(8) 数量指标、质量指标。
(9) 数量性、综合性、具体性。
(10) 国民经济统计指标体系、科技统计指标体系、社会统计指标体系二、多项选择题1.BE 2.AD 3.ABCE4.ACE 5.BD 6.ABC 7.CD 8.ABCD 9.ABCDE三、判断题1.√2.√3.×4.√5.√第三章统计调查一、填空题1.准确、及时、全面、系统。
2.基础资料。
3.全面、非全面、经常性、一次性、组织方式不同4.核心、原始资料5.国民经济(或国家)、地方、专业6.原始记录、统计台账7.一次性、全面8.全面、非全面9.原始、次级10.范围11.重点调查、典型调查12.普查、全面统计报表、重点调查、典型调查、抽样调查13.明确调查目的14.调查单位15.调查表、表头、表体、表脚、单一、一览16.开放式问题、封闭式问题二、单项选择题1.C 2.B 3.C 4.D 5.C 6.D 7.D 8.D 9.D 10.D 11.B 12.C 13.B 14.A 15.B 16.B 17.A 18.B三、多项选择题1.ADE 2.ACDE 3.AE4.ACE 5.ABC 6.CD 7.ACD 8.ABC 9.ABCDE 10.DE 11.BCDE第四章统计整理二、单项选择题1.C 2.A 3.B 4.B 5.B 6.C 7.C 8.C 9.A 10.C 11.C 12.A 13.B 14.C 15.B三、多项选择题1.AC 2.CE 3.DE 4.BCDE 5.ACD 6.ABE7.ABE 8.CD E9.ACD 10.ACDE四、判断题1.×2.×3.×4.√5.×6.√7.√8.√9.×10.√六、计算题1.分组标志为学习成绩,为数量标志,分组方法采用的是组距式分组。
统计学期末考试题(含答案)
西安交大统计学考试试卷一、单项选择题(每小题2分,共20分)1.在企业统计中,下列统计标志中属于数量标志的是(C)A、文化程度B、职业C、月工资D、行业2。
下列属于相对数的综合指标有(B )A、国民收入B、人均国民收入C、国内生产净值D、设备台数3。
有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量?A、0个B、两个C、1个D、3个4。
下列变量中属于连续型变量的是(A )A、身高B、产品件数C、企业人数D、产品品种5.下列各项中,属于时点指标的有(A )A、库存额B、总收入C、平均收入D、人均收入6。
典型调查是(B )确定调查单位的A、随机B、主观C、随意D盲目7.总体标准差未知时总体均值的假设检验要用到( A ):A、Z统计量B、t统计量C、统计量D、X统计量8。
把样本总体中全部单位数的集合称为(A )A、样本B、小总体C、样本容量D、总体容量9。
概率的取值范围是p(D )A、大于1B、大于-1C、小于1D、在0与1之间10. 算术平均数的离差之和等于(A )A、零B、1C、-1D、2二、多项选择题(每小题2分,共10分。
每题全部答对才给分,否则不计分)1。
数据的计量尺度包括(ABCD ):A、定类尺度B、定序尺度C、定距尺度D、定比尺度E、测量尺度2.下列属于连续型变量的有(BE ):A、工人人数B、商品销售额C、商品库存额D、商品库存量E、总产值3.测量变量离中趋势的指标有(ABE )A、极差B、平均差C、几何平均数D、众数E、标准差4.在工业企业的设备调查中(BDE )A、工业企业是调查对象B、工业企业的所有设备是调查对象C、每台设备是填报单位D、每台设备是调查单位E、每个工业企业是填报单位5.下列平均数中,容易受数列中极端值影响的平均数有(ABC )A、算术平均数B、调和平均数C、几何平均数D、中位数E、众数1、怎样理解统计的三种含义答:统计包含统计工作、统计资料和统计学三个方面的含义。
统计学考试试卷A及答案
2012—2013学年第二学期闽江学院考试试卷考试课程: 统计学试卷类别:A卷错误! B卷□考试形式:闭卷错误!开卷□适用专业年级:2011级金融学、国际贸易学、保险学专业注明:试卷答案请做在答题纸上。
一、单选题(每题1分,共30分,30%)1。
下列不属于描述统计问题的是( )A根据样本信息对总体进行的推断B了解数据分布的特征C分析感兴趣的总体特征D利用图,表或其他数据汇总工具分析数据2。
根据样本计算的用于推断总体特征的概括性度量值称作()A.参数 B。
总体C.样本 D。
统计量3。
通过调查或观测而收集到的数据称为()A.观测数据 B。
实验数据C.时间序列数据 D. 截面数据4. 从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为( )。
A.重复抽样 B。
不重复抽样C.分层抽样D.整群抽样5. 调查时首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查.这样的调查方式称为()。
A 系统抽样B 整群抽样C 滚雪球抽样D 判断抽样6。
下面的哪一个图形最适合于描述结构性问题()A。
条形图 B。
饼图 C。
雷达图 D。
直方图7. 对于大批量的数据,最适合描述其分布的图形是( )A.条形图 B。
茎叶图 C。
直方图 D。
饼图8。
将某企业职工的月收入依次分为2000元以下、2000元~3000元,3000元~4000元、4000元~5000元、5000元以上几个组。
最后一组的组中值近似为() A.5000 B.7500 C。
5500 D.65009。
下列关于众数的叙述,不正确的是()A。
一组数据可能存在多个众数 B.众数主要适用于分类数据C。
一组数据的众数是唯一的 D.众数不熟极端值的影响10。
一组数据的最大值与最小值之差称为()A.平均数B.规范差 C。
极差 D。
四分位差11。
如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=3,其意义是()A.至少有75%的数据落在平均数加减3个规范差的范围之内B。
7-2-统计学-分配数列和次数分布
组距式变量数列实例
表3-5
月工资(元) 500 元以下 500-600 600-700 700-800 800-900 900-1000 1000 元以上 合 计
某车间工人按月工资分组
工人数(人) 16 28 34 56 38 18 10 200 比重(%) 8.00 14.00 17.00 28.00 19.00 9.00 5.00 100.00
公式:
次数密度=各组次数 / 各组组距
( 9)
开口组:缺上限或缺下限的组 闭口组:上下限齐全的组
(10)组中值及计算** ①闭口组
临近组组限重合时:组中值=(上限+下限)/ 2 临近组组限间断时:组中值=(下限+下组下限)/2
②开口组
缺上限时: 组中值=下限+邻组组距/ 2 缺下限时: 组中值=上限 -邻组组距/ 2
组数和组距的关系
定性关系:全距一定的情况下,组数和组距呈 反方向变动。 定量关系: 组数=全距/组距=R/d 组距=R/(1+3.322lgN) 式二为确定组距的经验公式,其中N代表组数。
(5)频数(次数)与频率(比重) (6)品质数列与变量数列 (7)等距数列与异距数列 (8)次数密度:单位组距内分布的总体单位数。
数据排序并计算全距
确定变量数列的形式(单项式或组距式) 确定组数和组距
确定组限
计算各组次数和频率 绘制表格
注意事项
(1)组距最好为5或10的倍数。 (2)最小组的下限略低于最小变量值,最大组的 上限略高于最大变量值。
(3)离散型变量分组,相邻组的组限可以间断, 也可以重叠;连续型变量分组,相邻组的组限必须重 叠。 (4)组限重叠时,临界点的总体单位按“上限不 在内”的原则归组。
单项式变量数列实例
统计学答案第七章
1 估计量的含义是指()。
A。
用来估计总体参数的统计量的名称B.用来估计总体参数的统计量的具体数值C。
总体参数的名称D。
总体参数的具体数值2 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。
这种评价标准称为().A。
无偏性B。
有效性C。
一致性 D.充分性3 根据一个具体的样本求出的总体均值的95%的置信区间().A.以95%的概率包含总体均值B.有5%的可能性包含总体均值C.一定包含总体均值D。
要么包含总体均值,要么不包含总体均值4 无偏估计是指().A.样本统计量的值恰好等于待估的总体参数B。
所有可能样本估计值的数学期望等于待估总体参数C。
样本估计值围绕待估总体参数使其误差最小D。
样本量扩大到和总体单元相等时与总体参数一致5 总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以()。
A.样本均值的抽样标准差B。
样本标准差C.样本方差D。
总体标准差6 当样本量一定时,置信区间的宽度()。
A。
随着置信系数的增大而减小B。
随着置信系数的增大而增大C。
与置信系数的大小无关D.与置信系数的平方成反比7 当置信水平一定时,置信区间的宽度().A。
随着样本量的增大而减小B.随着样本量的增大而增大C。
与样本量的大小无关D。
与样本量的平方根成正比8 一个95%的置信区间是指()。
A。
总体参数有95%的概率落在这一区间内B.总体参数有5%的概率未落在这一区间内C。
在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数9 95%的置信水平是指()。
A.总体参数落在一个特定的样本所构造的区间内的概率为95%B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95%C.总体参数落在一个特定的样本所构造的区间内的概率为5%D。
在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5%10 一个估计量的有效性是指()。
7医学统计学chi-2检验
= 0
p
0
p
29
30
5
2014/4/7
1.单样本率的u检验
即:样本率( p )与总体率( 0)比较的u检验 检验目的:推断样本所来自总体的总体率( )与已知 总体的总体率( )是否相同。
0
例9
已知某地40岁以上成年男性高血压患病率为
8.5%( 0 ),经健康教育数年后,随机抽取该地成年 男性1000名,查出高血压患者55例,患者率( p )为 5.5%。问经健康教育后,该地成年男性高血压患病 率是否有降低?
n X 0 X n X
n
n X
式中,n为样本量(试验次数),X 为阳性事件发生数,
为阳性事件发生率。我们称X (阳性事件数)服从参数 为n和的二项分布,记为X ~ B(n, )。
CnX X (1 ) n X 又被称为二项分布的概率函数。
7 8
二项分布的分布函数计算
【例2】投掷5次硬币,求出现至少2次 正面朝上的概率。
9
二项分布的分布函数计算
【例3】据研究报道,试管婴儿(IVF)采用输卵 管内胚胎植入(TET)技术,临床受孕的成功概 率为45%。今随机抽取接受IVF/TET治疗的女性 12名,至少有6人临床受孕的概率是多少?
统计学习题参考答案完整版
统计学习题参考答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】第一章导论(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。
(1)总体是所有IT从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
(1)总体是所有在网上购物的消费者的集合。
(2)分类变量。
(3)参数是所有在网上购物者的月平均花费。
(4)参数(5)推断统计方法。
第二章数据的搜集1.什么是二手资料使用二手资料需要注意些什么与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。
使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。
在引用二手资料时,要注明数据来源。
2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
概率抽样是指抽样时按一定概率以随机原则抽取样本。
每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。
如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
非概率抽样也适合市场调查中的概念测试。
3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。
统计学原理(第2版)习题答案简版
第一章总论二、单项选择题1.B 2.C 3.A 4.B 5.A6.D 7.D 8.B 9.D 10.D 11.C 12.A 13.C 14.D 15.D三、多项选择题1.ACE 2.ABD 3.BE 4.CE5.BDE 6.ABC 7.ACE 8.ABCE9.BCE 四、判断题1.×2.×3.√4.√5.×6.×7.√8.×第二章统计设计一、填空题(1)第一、各个方面、各个环节(2)整体设计、专项设计(3)全阶段设计、单阶段设计。
(4)长期设计、中期设计、短期设计。
(5)相互联系、相互制约(6)总体数量、概念、具体数值。
(7)总量指标、相对指标、平均指标(8) 数量指标、质量指标。
(9) 数量性、综合性、具体性。
(10) 国民经济统计指标体系、科技统计指标体系、社会统计指标体系二、多项选择题1.BE 2.AD 3.ABCE4.ACE 5.BD 6.ABC 7.CD 8.ABCD 9.ABCDE 三、判断题1.√2.√3.×4.√5.√第三章统计调查一、填空题1.准确、及时、全面、系统。
2.基础资料。
3.全面、非全面、经常性、一次性、组织方式不同4.核心、原始资料5.国民经济(或国家)、地方、专业6.原始记录、统计台账7.一次性、全面8.全面、非全面9.原始、次级10.范围11.重点调查、典型调查12.普查、全面统计报表、重点调查、典型调查、抽样调查13.明确调查目的14.调查单位15.调查表、表头、表体、表脚、单一、一览16.开放式问题、封闭式问题二、单项选择题1.C 2.B 3.C 4.D 5.C 6.D 7.D 8.D 9.D 10.D 11.B 12.C 13.B 14.A 15.B 16.B 17.A 18.B三、多项选择题1.ADE 2.ACDE 3.AE4.ACE 5.ABC 6.CD 7.ACD 8.ABC 9.ABCDE 10.DE 11.BCDE第四章统计整理二、单项选择题1.C 2.A 3.B 4.B 5.B 6.C 7.C 8.C 9.A 10.C 11.C 12.A 13.B 14.C 15.B三、多项选择题1.AC 2.CE 3.DE 4.BCDE 5.ACD 6.ABE7.ABE 8.CD E9.ACD 10.ACDE四、判断题1.×2.×3.×4.√5.×6.√7.√8.√9.×10.√六、计算题1.某班学生学习成绩次数分布表46名同学中不及格学生为2人,不及格率为4.35%,及格率为95.65%,优秀学生为8人,优秀率为17.39%;成绩为良好的同学有19人,占41.3%,成绩为中等的同学有10人,占21.74%,成绩为及格的同学有7人,占15.22%。
统计学人教版第五版7,8,10,11,13,14章课后题答案
统计学人教版第五版7,8,10,11,13,14章课后题答案第七章 参数估计7.1 (1)79.0405===nx σσ (2)由于1-α=95% α=5% 96.12=αZ所以 估计误差55.140596.12≈⨯=nZ σα7.2 (1)14.24915===nx σσ (2)因为96.12=αZ 所以20.4491596.12≈⨯=nZ σα(3)μ的置信区间为20.41202±=±nZ x σα7.3 由于96.12=αZ 104560=x 85414=σ n=100所以μ的95%置信区间为14.167411045601008541496.11045602±=⨯±=±nZ x σα7.4(1)μ的90%置信区间为97.18110012645.1812±=⨯±=±n s Z x α(2)μ的95%置信区间为35.2811001296.1812±=⨯±=±n s Z x α(3)μ的99%置信区间为096.3811001258.2812±=⨯±=±n s Z x α7.5 (1)89.025605.396.1252±=⨯±=±nZ x σα(2)416.66.1197589.23326.26.1192±=⨯±=±n s Z x α(3)283.0419.332974.0645.1419.32±=⨯±=±n s Z x α7.6 (1)035.25389001550096.189002±=⨯±=±nZ x σα(2)650.16589003550096.189002±=⨯±=±nZ x σα(3)028.139890035500645.189002±=⨯±=±n s Z x α(4)583.196890035500326.289002±=⨯±=±n s Z x α7.7 317.31==∑i x nx ()609.1113612=--=∑=i ix x n s 90%置信区间为441.0317.336609.1645.1317.32±=⨯±=±n s Z x α95%置信区间为526.0317.336609.196.1317.32±=⨯±=±n s Z x α99%置信区间为6908.0317.336609.1576.2317.32±=⨯±=±n s Z x α7.8 101==∑i x nx ()464.311812=--=∑=i ix x n s 所以95%置信区间为()896.2108464.33646.21012±=⨯±=±-n s t x n α7.9 375.91==∑i x n x 由于()131.2)15(025.012==-t t n α ()113.4112=--=∑x x n s i 所以95%置信区间为()191.2375.916113.4131.2375.912±=⨯±=±-n s t x n α7.10 (1)63.05.1493693.196.15.1492±=⨯±=±n s Z x α(2)中心极限定理 7.11 (1)132.10150665011=⨯==∑i x nx ()641.188.131491112=⨯=--=∑x x n s i 455.032.10150641.196.132.1012±=⨯±=±n s Z x α(2)由于9.05045==p 所以 合格率的95%置信区间为()083.09.0501.09.096.19.012±=⨯⨯±=-±n p p Z p α7.12 由于128.161==∑i x n x ()745.3)24(005.012==-t t n α ()8706.0112=--=∑x x n s i所以99%置信区间为653.028.161258706.0745.328.161)1(2±=⨯±=-±n s n t x α 7.13 7396.1)17()1(05.02==-t n t α 556.131==∑i x nx ()800.7112=--=∑x x n s i所以90%置信区间为198.3556.13188.77396.1556.13)1(2±=⨯±=-±n s n t x α 7.14(1)()194.051.04449.051.0576.251.012±=⨯⨯±=-±n p p Z p α(2)()0435.082.030018.082.096.182.012±=⨯⨯±=-±n p p Z p α(3)()024.048.0115052.048.0645.148.012±=⨯⨯±=-±n p p Z p α7.15(1)90%置信区间为()049.023.020077.023.0645.123.012±=⨯⨯±=-±n p p Z p α(2)95%置信区间为()058.023.020077.023.096.123.012±=⨯⨯±=-±n p p Z p α7.16 89.1652001000576.222222222=⨯=⎪⎪⎭⎫ ⎝⎛=⇒=E Z n nZ E σδαα所以n 为166 7.17(1)()13.25302.06.04.0054.2122222=⨯⨯=-⎪⎪⎭⎫⎝⎛=E Z n ππα 所以n 为254 (2)()0625.15004.05.05.096.1122222=⨯⨯=-⎪⎪⎭⎫⎝⎛=E Z n ππα 所以n 为151(3)()89.26705.045.055.0645.1122222=⨯⨯=-⎪⎪⎭⎫⎝⎛=E Z n ππα 所以n 为268 7.18(1)64.05032==p (2)()46.611.02.08.096.1122222=⨯⨯=-⎪⎪⎭⎫⎝⎛=E Z n ππα 所以n 为62 7.19(1)()()339.661501205.022=-=-χχαn()()930.331501295.0221=-=--χχαn ()()2212222211ααχσχ--≤≤-s n s n所以()()40.272.1293.33492339.66491122122≤≤⇒⨯≤≤⨯⇒-≤≤--σσχσχααs n s n(2)()()6848.231151205.022=-=-χχαn()()5706.61151295.0221=-=--χχαn()()043.0015.002.05.61470602.06848.23141122122≤≤⇒⨯≤≤⨯⇒-≤≤--σσχσχααs n s n (3)()()6706.321221205.022=-=-χχαn()()5913.111221295.0221=-=--χχαn ()()725.4185.24315913.112131706.36211122122≤≤⇒⨯≤≤⨯⇒-≤≤--σσχσχααs n s n 7.20(1)15.71==∑i x n x ()4767.0112=--=∑x x n s i ()()0228.1911012025.022=-=-χχαn ()()7004.211012975.0221=-=--χχαn ()()87.0328.04767.07004.294767.00228.1991122122≤≤⇒⨯≤≤⨯⇒-≤≤--σσχσχααs n s n(2)()()326.3253.1822.17004.29822.10228.1991122122≤≤⇒⨯≤≤⨯⇒-≤≤--σσχσχααs n s n7.21 2)1()1(212222112-+-+-=n n s n s n s p=442.981910268.9613≈⨯+⨯ (1)21μμ-的90%置信区间为: 212122111)2()(n n s n n t x x p+-+±-α=⨯⨯±442.98729.18.971141+ =9411.78.9± (2)21μμ-的95%置信区间为: 212122111)2()(n n s n n t x x p+-+±-α=⨯⨯±442.9893.028.971141+ =13.698.9± (3)21μμ-的99%置信区间为: ⨯⨯±442.98609.828.971141+=40.1138.9± 7.22(1)2122121221)(n s n s z x x +±-α=36.096.12⨯±=176.12±(2)2)1()1(212222112-+-+-=n n s n s n s p=18209169⨯+⨯=18212122111)2()(n n s n n t x x p+-+±-α=5118.122⨯⨯±=8.932± (3)1)(1)()(222221212122122121-+-+=n n s n n s n s n s ν=17.78 2122121221)(t )(n s n s x x +±-να=6.31.22⨯±=98.32±(4)048.2)28(t 025.0=2)1()1(212222112-+-+-=n n s n s n s p=18.714 212122111)2()(n n s n n t x x p+-+±-α=20110114.71848.022+⨯⨯± =3.432±(5)1)(1)()(222221212122122121-+-+=n n s n n s n s n s ν1919.61)20201016(222++==20.05 086.2)(t =να2122121221)(t )(n s n s x x +±-να=1.61086.22+⨯±=64.332± 7.23(1)47d = 1)(2--=∑n d ds id =48332=917.6(2)n s n t d )1(d -±α=185.447± 7.24 6216.2)1(2=-n t α 11=d ,53197.6=d s d μ的置信区间为:ns n t d )1(d 2-±α=1053197.66216.211⨯±=4152.511±7.25(1)222111221)1()1()(p n p p n p p z p -+-±-α=25076.03.02506.04.0645.11.0⨯+⨯⨯±=0698.01.0± (2)222111221)1()1()(p n p p n p p z p -+-±-α=25076.03.02506.04.096.11.0⨯+⨯⨯±=0831.01.0± 7.26 241609.01=s 076457.02=s)1,1(21--n n F α=)20,20(025.0F =2.464 )20,20(975.0F =0.40576212221222122221αασσ-≤≤F s s F s s 40576.0986.9446.2986.92221≤≤σσ 611.240528.42221≤≤σσ7.27 222)1()(Ez n ππα-==2204.098.002.096.1⨯⨯=47.06 所以 n =487.282222)(E z n σα==2222012096.1⨯=138.30所以 n =139第8章 假设检验二、练习题(说明:为了便于查找书后正态分布表,本答案中,正态分布的分位点均采用了下侧分位点。
统计学基本知识试题及答案解析
统计学原理试题(6)一、单项选择题:(每小题1分,共20分)1.设某地区有200家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( )。
A.每一家工业企业B.200家工业企业C.每一件产品D.200家工业企业的全部工业产品2.有600家公司每位职工的工资资料,如果要调查这些公司的工资水平情况,则总体单位是()。
A.600家公司的全部职工B.600家公司的每一位职工C.600家公司所有职工的全部工资D.600家公司每个职工的工资3.一个统计总体()。
A.只能有一个指标B.可以有多个指标C.只能有一个标志D.可以有多个标志4.以产品等级来反映某种产品的质量,则该产品等级是()。
A.数量标志B.品质标志C.数量指标D.质量指标5.在调查设计时,学校作为总体,每个班作为总体单位,各班学生人数是()。
A.变量值B.变量C.指标值D.指标6.年龄是()。
A.变量值B.连续型变量C.离散型变量D. 连续型变量,但在实际应用中常按离散型处理7.人口普查规定统一的标准时间是为了()。
A.登记的方便B.避免登记的重复与遗漏C.确定调查的范围D.确定调查的单位8.以下哪种调查的报告单位与调查单位是一致的()。
A.职工调查B.工业普查C.工业设备调查D.未安装设备调查9.通过调查大庆、胜利、辽河等油田,了解我国石油生产的基本情况。
这种调查方式是()。
A.典型调查B.抽样调查C.重点调查D.普查10.某市进行工业企业生产设备普查,要求在10月1日至15日全部调查完毕,则这一时间规定是()。
A.调查时间B.登记期限C.调查期限D.标准时间11.统计分组的关键问题是()。
A.确定分组标志和划分各组界限B.确定组距和组中值C.确定组距和组数D.确定全距和组距12.某连续变量数列,其最小组为开口组,组限为400,又知其相邻组的组中值为500,则下开口组的组中值为()。
A.200B.300C.400D.60013.统计表的主词是统计表所要说明的对象,一般排在统计表的()。
统计学考试试题
统计学考试试题一、不定项项选择题(共35小题,每小题2分,共70分)1、下列指数中属于质量指标指数的有(ABCE)正确答案:()A、单位产品成本指数B、商品价格指数C、工资水平指数D、商品销售额指数2、工业企业的设备台数、产品产值是(D)。
正确答案:()A、连续变量B、离散变量C、前者是连续变量,后者是离散变量D、前者是离散变量,后者是连续变量3、抽样误差是指(C)。正确答案:()A、调查中所产生的登记性误差B、调查中所产生的系统性误差C、随机的代表性误差D、计算过程中产生的误差4、下列各项中,属于统计指标的有(ACD)正确答案:()A、1999年全国人均国内生产总值B、某台机床使用年限C、某市年供水量D、某地区原煤生产量5、计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和(C)正确答案:()A、小于100%B、大于100%C、等于100%D、小于或大于100%6、下列相对数中,属于不同时期对比的指标有(B)。正确答案:()A、结构相对数B、动态相对数C、比较相对数D、强度相对数7、普查是一种(ABE)正确答案:()A、专门组织的调查B、一次性调查C、经常性调查D、非全面调查8、变量之间的相关程度越低,则相关系数的数值(B)正确答案:()A、越小B、越接近于0C、越接近于-1D、越接近于+19、统计整理的关键在(B)。正确答案:()A、对调查资料进行审核B、对调查资料进行统计分组C、对调查资料进行汇总D、编制统计表10、估计标准误是反映(ABDE)正确答案:()A、回归方程代表性大小的指标B、估计值与实际值误差程度的指标C、自变量与因变量离散程度的指标D、因变量估计值的可靠程度的指标11、抽样极限误差和抽样平均误差的数值之间的关系为(A)。正确答案:()A、抽样极限误差可以大于或小于抽样平均误差B、抽样极限误差一定大于抽样平均误差C、抽样极限误差一定小于抽样平均误差D、抽样极限误差一定等于抽样平均误差12、划分连续变量的组限时,相邻组的组限必须(A)。正确答案:()A、重叠B、相近C、不等D、间断13、用抽样指标估计总体指标,所谓优良估计的标准有(BCD)正确答案:()A、客观性B、无偏性C、一致性D、有效性14、在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/2时,则样本单位数为原来的(C)。正确答案:()A、2倍B、3倍C、4倍D、1/4倍15、如果计划任务数是五年计划中规定最后一年应达到的水平,则计算计划完成程度相对指标可采用(B)。正确答案:()A、累计法B、水平法C、简单平均法D、加权平均法16、位置平均数包括(DE)正确答案:()A、算术平均数B、调和平均数C、几何平均数D、众数17、抽样推断中,样本容量的多少取决于(ABCE)正确答案:()A、总体标准差的大小B、允许误差的大小C、抽样估计的把握程度D、总体参数的大小18、总量指标是用(A)表示的。正确答案:()A、绝对数形式B、相对数形式C、平均数形式D、百分比形式19、对某城市工业企业未安装设备进行普查,总体单位是(B)。
统计学期末考试题及答案
统计学期末考试题及答案一、单项选择题(每题2分,共20分)1. 以下哪个选项是描述统计学中总体的特征?A. 样本B. 总体C. 个体D. 总体单位答案:B2. 在统计学中,中位数是将数据集按大小顺序排列后位于中间位置的数值。
如果数据集有偶数个数值,中位数是:A. 最小值B. 最大值C. 第一个数值D. 两个中间数值的平均值答案:D3. 描述数据离散程度的度量中,方差和标准差的关系是:A. 方差是标准差的平方B. 标准差是方差的平方C. 方差是标准差的平方根D. 标准差是方差的平方根答案:A4. 以下哪种图形可以清晰地展示数据的分布情况?A. 饼图B. 条形图C. 折线图D. 散点图答案:D5. 相关系数的取值范围是:A. -1到1B. -2到2C. 0到1D. 0到2答案:A6. 以下哪个选项是描述统计学中样本的特征?A. 总体B. 总体单位C. 样本单位D. 样本容量答案:C7. 以下哪个选项是描述统计学中样本容量的特征?A. 总体B. 总体单位C. 样本单位D. 样本容量答案:D8. 在统计学中,众数是指:A. 数据集中出现次数最多的数值B. 数据集中的最小值C. 数据集中的中位数D. 数据集中的平均值答案:A9. 以下哪个选项是描述统计学中变量的特征?A. 总体B. 总体单位C. 样本单位D. 变量答案:D10. 以下哪个选项是描述统计学中数据收集的方法?A. 实验法B. 观察法C. 调查法D. 所有以上答案:D二、多项选择题(每题3分,共15分)1. 在统计学中,以下哪些方法可以用来收集数据?A. 实验B. 观察C. 调查D. 模拟答案:ABCD2. 以下哪些是描述统计学中数据的集中趋势的度量?A. 平均值B. 中位数C. 众数D. 方差答案:ABC3. 以下哪些是描述统计学中数据的离散程度的度量?A. 方差B. 标准差C. 极差D. 变异系数答案:ABCD4. 以下哪些图形可以用来展示数据的分布情况?A. 条形图B. 折线图C. 散点图D. 箱线图答案:ABCD5. 以下哪些是相关系数的特点?A. 取值范围在-1到1之间B. 描述两个变量之间的线性关系C. 值越接近1,表示关系越强D. 值越接近-1,表示关系越强答案:ABCD三、简答题(每题5分,共20分)1. 请解释什么是统计学中的总体和样本,并给出一个例子。
《统计学》-第7章-习题答案
第七章思考与练习参考答案1 •答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在定的范围内变化。
2•答:相关和回归都是研究现象及变量之间相互关系的方法。
相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。
3•答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数二样本相关系数,「一】。
复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数R2的正的平方根。
偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。
4.答:回归模型假定总体上因变量Y与自变量X之间存在着近似的线性函数关系,可表示为Y^ 11X t u t,这就是总体回归函数,其中u t是随机误差项,可以反映未考虑的其他各种因素对Y的影响。
根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:Y?=耳+弭x t。
总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。
两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。
第二,总体回归函数中的-0和-1是未知的参数,表现为常数;而样本回归直线中的'?Q和?i是随机变量,其具体数值随所抽取的样本观测值不同而变动。
统计学期末试题(含答案)
2013-2014学年第一学期一、单项选择题1、分配数列中的次数是指( C )A、用以分组的数量标志B、分组的组数C、统计分组后各组对应的单位数D、分组的次数2、抽样调查与重点调查的主要区别是( D )A、作用不同B、组织方式不同C、灵活程度不同D、选取调查单位的方法不同3、按某一标志分组的结果表现为( B )A、组内差异性,组间同质性B、组内同质性,组间差异性C、组内同质性,组间同质性D、组内差异性,组间差异性4、对某市机动车进行普查,调查单位是该市( A )A、每一辆机动车B、每一个机动车车主C、所有的机动车D、所有的机动车车主5、累计增长量( A )A、等于逐期增长量之和B、等于逐期增长量之积C、等于逐期增长量之差D、与逐期增长量没有关系6、下列指标中属于时点指标的是( A )A、商品库存量B、商品销售量C、平均每人销售额D、商品销售额7、按全国总人口数计算的人均粮食产量是一个CA、平均指标B、结构相对指标C、强度相对指标D、比较相对指标8、下列数列中属于时期数列的是BA、历年全国的铁路总长度B、历年全国的招生人数C、历年全国的在校人数D、历年全国的职工人数9、如果变量x和变量y之间的相关系数为-1,这说明两变量之间是( B )A、低度相关关系B、完全相关关系C、高度相关关系D、完全不相关10、某校共20个班级,现从中按班级序号间隔相等地抽取5个班,并对这5个班的全体学生进行体格检查,此类抽样调查属于( D )A、纯随机抽样B、分层抽样C、等距抽样D、整群抽样11、几位学生的某门课成绩分别是67分、78分、88分、96分,则“成绩”是( B )A、品质标志B、数量标志C、标志值D、数量指标12、对于不等距数列,在制作直方图时,应计算出( B )A、次数分布B、次数密度C、各组次数D、各组组距13、某连续变量数列,其第一组为开口组,上限为500,已知第二组的组中值为540,则第一组的组中值为( D )A、480B、420C、450D、46014、用同样多的货币购买同类商品,今年比去年少买20%,这是因为价格上涨了BA、10%B、25%C、15%D、20%15、相关系数的取值范围是( C )A、0≤r≤1B、-1≤r≤2C、-1≤r≤1D、0≤r≤216、要了解100名学生的学习情况,则个体是(B)A、100名学生B、每一名学生C、100名学生的学习成绩D、每一名学生的学习成绩17、某企业计划2008年产值达到5500万元,但实际产值完成了5000万元,则该企业产值计划完成相对指标为( B )A、10%B、90.9%C、100%D、110%18、某企业银行存款余额4月初为80万元,5月初为150万元,6月初为210万元,7月初为160万元,则该企业第二季度的平均存款余额为( D )A、140万元B、150万元C、160万元D、170万元19、登记性误差( C )A、只在全面调查中产生B、只在非全面调查中产生C、在全面调查和非全面调查中都会产生D、在抽样调查中不会产生20、对一批商品进行质量检验,最适宜采用的调查方法是(B)A、全面调查B、抽样调查C、典型调查D、重点调查21、研究某企业职工的基本情况时,下列属于品质标志的是(B)A、工龄B、健康状况C、工资级别D、工资收入22、统计分组对总体而言是(B)A、将总体区分为性质相同的若干部分B、将总体区分为性质不同的若干部分C、将总体单位区分为性质相同的若干部分D、将总体单位区分为性质不相同的若干部分23、统计表中的主词是指(A)A、所要说明的对象B、说明总体的统计指标C、横行标题D、纵列标题24、由变量y对变量x回归,与由变量x对变量y回归是(B)A、同一个问题B、不同的问题C、有时相同有时不同的问题D、不同的问题但方程相同25、抽样推断中,抽样误差是(C)A、可以避免的B、可以避免也可以控制C、不可以避免但可以控制D、不可避免也无法控制的26、编制数量指标指数时一般应以哪个作同度量因素?(B)A、报告期的质量指标作同度量因素B、基期的质量指标作同度量因素C、报告期的数量指标作同度量因素D、基期的数量指标作同度量因素二、多项选择题在每小题列出的五个备选项中至少有两个是符合题目要求的,请将其代码填写在题后的括号内。
统计学概论练习题及参考答案
2013年《统计学概论》练习题一、单项选择题1.统计学的两大基本内容是( )A .统计资料的收集和分析B .理论统计和运用统计C .统计预测和决策D .描述统计和推断统计 2.下面的变量中哪一个属于分类变量( )A .年龄B .工资C .汽车产量D .付款方式(现金、信用卡、支票) 3.下面哪一个图形最适合描述结构性问题( )A .条形图B .饼图C .直方图D .折线图 4.统计分组后,应使( )A .组内具有同质性,组间具有差异性B .组内具有差异性,组间具有同质性C .组内具有差异性,组间具有差异性D .组内具有同质性,组间具有同质性 5.一组数据中出现频数最多的数值称为( )A .众数B .中位数C .四分位数D .平均数6.根据经验,当算术平均数小于中位数且小于众数时,次数分布为( )A .对称分布B .右偏分布C .左偏分布D .右偏或左偏分布7.对两个总体分布进行变异性比较,当它们的平均数不等,计量单位不同时,需要计算( )比较。
A .标准差系数B .标准差C .平均差D .方差 8.当原假设正确,按检验规则却拒绝了原假设,则犯了( )A .取伪错误B .检验错误C .第Ⅰ类错误D .第Ⅱ类错误9.每一吨铸铁成本c y (万元)和铸件废品率x (%)变动的回归方程为:568c y x =+,这意味着( )A .废品率每增加1%,成本每吨增加64万元B .废品率每增加1%,成本每吨增加8%C .废品率每增加1%,成本每吨增加8万元D .废品率每增加1%,则每吨成本为56万元10.将总体全部单位按照某个标志分组,再从各类型组中随机抽取一定单位组成样本,这种抽样是( )A .随机抽样B .等距抽样C .分层抽样D .整群抽样 11.根据经验,当算术平均数大于中位数且大于众数时,钟形分布为( )A .对称分布B .右偏分布C .左偏分布D .负偏分布 12.正态总体,总体方差σ2未知,小样本(n <30)的情况下,总体均值μ的置信度为1-α的置信区间为( )A .),(22nZ X n Z X σσαα⋅+⋅- B .),(22nS Z X n S Z X ⋅+⋅-ααC .),()1(2)1(2nS t X nS t X n n ⋅+⋅---ααD .),()1(2)1(2nt X nt X n n σσαα⋅+⋅---13.当总体方差未知时,在大样本条件下,估计总体均值使用的分布是( )A .正态分布B .t 分布C .F 分布D .χ2分布 14.当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是( )A.正态分布B.t分布C.F分布D.χ2分布15.当备择假设为H1:μ<μ0,此时的假设检验称为()A.双侧检验B.右侧检验C.左侧检验D.显著性检验16.根据你的判断,下面的相关系数取值哪一个是错误的()A.-0.86B.0.78 C.1.25 D.017.说明回归方程拟合优度的统计量主要是()A.相关系数B.回归系数C.判定系数D.估计标准误18.在回归分析中,被预测或被解释的变量称为()A.自变量B.因变量C.随机变量D.非随机变量19.在回归分析中,用来预测或用来解释另一个变量的一个或多个变量称为()A.自变量B.因变量C.随机变量D.非随机变量20.如果相关系数r=0,则表明两个变量之间()A.相关程度很低B.相关程度较高C.不存在线性相关关系D.存在非线性相关关系二、多项选择题1.“统计”一词的基本涵义包括()A.统计学B.统计工作C.统计资料D.统计分析2.以下几项符合统计表编制规则的包括()A.统计表的标题力求简明,内容简明扼要B.统计表栏数较多时,通常要加编号,并可说明其相互关系C.统计表如有相同数字,可以写“同上”,没有数字空格即可D.统计表一般左右两端封闭,表的上下端线划粗线或双线3.非全面调查形式有()A.重点调查B.抽样调查C.典型调查D.普查4.调查问卷可以选择的问句形式包括()A.对选式问句B.多项选择式问句C.顺位式问句D.标度式问句5.下列有关假设检验的说法,正确的是()A.原假设和备择假设相互对立,而且两者只有一个正确B.假设检验的基本思想是小概率原理C.假设检验的首要步骤是建立原假设和备择假设D.根据样本推断总体,有可能犯弃真错误和取伪错误6.下列有关回归分析和相关分析的描述,正确的有()A.回归分析中,X与Y要确定自变量和因变量B.相关分析中,X与Y均为随机变量C.相关分析测定相关程度和方向D.回归分析利用回归模型进行预测和分析7.下列有关一元线性回归模型的描述正确的有()A.可以用最小平方法求解模型的两个参数a和bB.判断系数r2是测定回归直线拟合优度的一个重要指标C.回归系数的符号同相关系数的符号一致D.b>0时,表明X与Y反方向变动8.下列情况中,应采用调和平均数计算的有()A.已知各商品的单价和销售额,求平均价格B.已知各商品的单价和销售量,求平均价格C.已知采购站某月购进农产品的单价及收购量,求平均采购价格D.已知采购站某月购进农产品的单价及收购额,求平均采购价格9.下列分组中属于按品质标志分组的有()。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学 3
3.3线性趋势的测定—移动平均法
3.3.1移动平均法及其特点 3.3.2移动平均预测法
统计学 8
3.3.1移动平均法及其特点
(2)移动平均法的特点: C、当数列包含季节变动,移动平均时距项数K应与 季节变动长度一致(如4个季度或12个月),消除季 节变动;数列包含周期变动时,时距项数K应和周期 长度基本一致,较好消除周期波动; D、移动平均后数列比原数列的项数更少。奇数项移 动平均所形成的新数列,首尾各少(K-1)/2项;偶 数项移动平均所形成的新数列,首尾各少K/2项。所 以移动平均使原数列失去部分信息,平均项数越大 失去信息越多,因此项数不宜过大。
2
Et yt 1 Et 1
yt 1 yt 1 1 yt 2 ... 1 yt 1 t E0
2 t 1
1 yt j 1 E0
t j 0
法
加权移动平均法给每个观测值赋予不同的权重,实 际中,近期观测值比远期观测值的影响更大一些, 赋予更大的权重。 设移动间隔为k (1<k<t),权数为wi(i=1,2,…t), ∑wi=1则 t+1期的移动平均预测值为 Yt wt Yt 1wt 1 Yt k 1wt k 1 Y t 1 wt wt 1 ... wt k 1
t 1
j
式中,E0 称为初始值,序列项数 较多时,初始值对平滑 值的 影响不大,故可设为 E0 y1
3.4线性趋势的测定方法—指数平 滑法
(6)平滑系数(权系数)的选择: 由于a是介于0与1之间的小数,随着时间t的增大,最后 一项系数(1-a)t几乎为零,将此略去后,有 j t 1 Et 1 yt j j 0 可见指数平滑值Et实质上是各期观测值yt的加权平均数 (权数和为 1 ),各期权数( a,a(1-a),a(1-a)2,…) 呈指 数递减形式,故称指数平滑。第 t 期平滑值包含了以 前所有数据的信息,但又对不同时期的数据给与不同 的权数,越是近期的数据,给予权数越大 , 且权系数 j t 1 之和为1,即 1 1
3.3.2移动平均预测法—简单移动平均
表 某客运站旅客运输量四次移动平均趋势预测 单位:万人公里 年份 2005年 季度 一 二 三 四 一 二 三 四 一 二 三 四 一 客运量 四次平均 100 95 98 107 110 105 107 115 123 1154线性趋势的测定方法—指数平滑法
(3)为了合理估计趋势值,就要剔除不规则随机 误差,反映出现象的实质性变化。
误差中属于现象实质性变化部分的比例可由平滑系 数(权数)ɑ决定, ɑ值越大,即认为误差中现 象实质性变化的比例越大,在下期的趋势估计中 本期的误差就保留的越多;反之, ɑ值越小,则 认为误差中不规则随机因素引起的随机误差所占 比例越大,在下期的趋势估计中本期的误差就剔 除的越多。
移正平均
2006年
2007年
101.250 103.750 106.125 108.250 110.875 113.750 116.625 119.500
2.500 2.375 2.125 2.625 2.875 2.875 2.875
7
3.3.1移动平均法及其特点
(2)移动平均法的特点:
A、移动平均对原数列有修匀作用,平均的时 距项数K越大,对数列的修匀作用越强; B、移动平均时距项数K为奇数时,只需一次移 动平均,其均值作为移动平均项数中间一期的 数值;时距项数K为偶数时,移动平均值无法 对正某一期,需要再进行相邻两平均值的移动 平均,是其均值对正某一期,这叫移正平均;
移动平均 (预测用)
趋势预 测值T
2006年
2007年
100.00 102.50 105.00 107.25 109.25 112.50 115.00 118.25 120.75
101.250 103.750 106.125 108.250 110.875 113.750 116.625 119.500
(5)将公式一改写,得到公式二,即 Et Et 1 yt Et 1 yt (1 )Et 1, t 1,2,...... 因指数平滑法是将一个指数平滑值(Et)作为下一期趋 势预测值(Tt+1) ,则一次指数平滑趋势预测值:
Tt 1 Et yt 1 Et 1 yt 1 Tt , 因Tt Et 1,t 1,2,......
式中,wt wt 1 ... wt k 1
权重的选择同移动期数相同,可以根据预测误差来判 断,选择误差最小的权重和期数组合。
3.4线性趋势的测定方法—指数平滑法
(exponential smoothing)
(1)指数平滑法可以弥补移动平均法的不足,能够 充分利用所有的数据信息,同时又体现近期数据 对未来预测影响作用更大的特点。 它是通过计算一系列指数平滑值消除不规则变动, 揭示现象的基本趋势。 具体来讲,指数平滑法是一种特殊的加权平均法, 就是利用本期实际观察值和本期预测值,分别给 予不同的权数进行加权,求得一个指数平滑值( Et),作为下一期趋势预测值(Tt+1)的预测方法。
统计学 9
3.3.2移动平均预测法—简单移动平均
选择一定长度的移动间隔,对序列逐期移动求 得平均数作为下一期的预测值 将最近k期数据平均作为下一期的预测值 设移动间隔为k (1<k<t),则t+1期的 移动平均 预测值为
Yt k 1 Yt k 2 Yt 1 Yt Yt 1 Yt k
可以看出,第t期指数平滑值(即第t+1期的预测值) 等于第 t 期的实际值与第 t 期的预测值的加权平均, 指数平滑是加权平均的一种特殊形式。
3.4线性趋势的测定方法—指数平 滑法
(6)平滑系数(权系数)的选择:分析公式
yt 1 yt 1 1 Et 2 yt 1 yt 1 1 Et 2
表7-5 某客运站旅客运输量四次移动平均计算表
年份 2005年 季度 一 二 三 四 一 二 三 四 一 二 三 四 客运量 100 95 98 107 110 105 107 115 123 115 120 125
单位:万人公里 逐期增长
四次平均
100.00 102.50 105.00 107.25 109.25 112.50 115.00 118.25 120.75
3.4线性趋势的测定方法—指数平滑法
(2)其基本思想是: 如果第t期趋势估计值与第t期实际值完全一致,二者之 间没有误差,则可以第t期趋势估计值直接作为第( t+1)期的趋势估计值; 如果二者之间有误差,则这种误差可分为两部分: 一部分是不规则随机误差 另一部分是现象从第(t-1)期到第t期的实质性变化。
统
计
学
工商管理类核心课程
面向21世纪课程教材
第3节 趋势变动分析
3.1长期趋势测定和分析的目的; 3.2线性趋势的测定方法—移动平均法; 3.3线性趋势的测定方法—指数平滑法; 3.4线性趋势的测定方法—直线趋势方程拟合 法; 3.5非线性趋势的线性拟合法; 3.6趋势线的选择。
2
3.1长期趋势测定和分析的目的
将每个观察值都给予相同的权数
只使用最近期的数据,在每次计算移动平均 值时,移动的间隔都为k 主要适合对较为平稳的序列进行预测 对于同一个时间序列,采用不同的移动步长 预测的准确性是不同的
选择移动步长时,可通过试验的办法,选 择一个使均方误差达到最小的移动步长
3.3.2移动平均预测法—加权移动平均
从公式中得知,指数平滑具有递推性质,各期指数平滑 值均在上期平滑值的基础上递推而得, 即第t期指数平滑值Et是在第(t-1)期指数平滑值Et-1的基 础上,加上第t期的实际观测值yt与作为第t期趋势估计 值的第(t-1)期指数平滑值Et-1间误差的一部分组合而 成。
3.4线性趋势的测定方法—指数平 滑法
2 ( Y Y ) i i i 1 n
预测误差用均方误差(MSE) 来衡量
误差平方和 MSE 误差个数 n
例题:利用Excel对某市某客运站旅客运输 量进行移动平均预测
步骤: 1 在工作表中输入数据 2 在“工具”中打开“数据分析”,点击“移动平均 ”,输入数据区域 3 在“间隔”中输入k(3、4、5),在“输出区域” 输入指定区域,点击“确定”。 4 若四次移动平均,需要对四次移动平均的结果再做 “间隔”为2的移动平均。 注意:在选择输出区域时,应将输出区域的第一个 单元格设置在第一个数值的下一行。 用Excel进行移动平均预测
j 0
3.4线性趋势的测定方法—指数平 滑法
(6)平滑系数(权系数)的选择:
第一, a值越小,对序列的平滑作用越强,对时间序 列的变化反映越慢,因而序列中随机波动较大时, 为了消除随机波动的影响,可选择较小的a ,使序 列较少受随机波动的影响; a值越大,对序列的平 滑作用越弱,对时间序列的变化反映越快,因而为 了反映出序列的变动状况,可选择较大的a ,使数 据的变化很快反映出来。
单位:万人公里
五次移动平均 指标值 — — 102.0 103.0 105.4 108.8 112.0 113.0 116.0 119.6 — — 逐期增长 — — — 1.0 2.4 3.4 3.2 2.0 3.0 3.6 — —
2006 年
2007 年
6
例:为消除季节变动对表7-4中的数列作 四次移动平均,结果见表7-5