应用统计学期末复习重点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用统计学期末复习重点(按题型整理)
一、填空题(10分)
1.统计学的三种含义:统计工作;统计数据或统计信息;统计学
2.统计学的研究对象是群体现象
3.根据统计方法的构成不同,可将统计学分为描述统计学和推断统计学,根据统计方法研究和应用的侧重不同,可将统计学分为理论统计学和应用统计学.
4.统计研究的基本方法:大量观察法,实验设计法,统计描述法和统计推断法
5.标志是说明总体单位特征的,而指标是说明总体特征的,
6.标志按其性质不同分为数量标志和品质标志两种。
按其变异情况可以分为不变标志和可变标志,可变标志称为变量。
7.统计总体具有三个基本特征,即同质性、大量性和变异性.
8.统计指标按其作用可分为总量指标、相对指标、平均指标,按所反映总体的内容不同,可以分为数量指标和质量指标.
9.总量指标指在一定时间、地点条件下说明现象总体的规模和水平的指标,其表现形式为绝对数。
10.总量指标按其反映时间状况不同,可以分为时点指标和时期指标,按指标数值采用的计量单位不同可以分为实物指标,价值指标,劳动量指标。
总量指标按其说明总体内容不同,可分为总体标志总量和总体单位总量
11.平均指标说明分配数列中各变量值分布的集中趋势,变异指标说明各变量值分布的离中趋势
12.计量尺度的类型有定类尺度,定序尺度,定距尺度,定比尺度,根据四种计量尺度计量结果,可将统计数据分为三种类型:名义级数据,顺序级数据,刻度级数据。
13.对名义级数据通常是计算众数,对顺序级数据,通常可以计算众数、中位数;对刻度级数据,同样可以计算众数和中位数,还可以计算平均数.
14.全面调查方式有统计报表制度,普查;非全面调查有重点调查、典型调查、抽样调查。
15.常用的抽样调查组织形式有简单随机抽样,类型随机抽样,机械随机抽样,整群随机抽样,阶段随机抽样.
16.统计分组的关键在于正确选择分组标志和合理划分各组界限
17.按分组标志的多少,统计分组可以分为简单分组和复合分组;按分组标志性质不同,统计分组可以分为品质分组和数量分组;按分组作用和任务不同,有类型分组、结构分组和分析分组。
18.离散变量可作单项式分组或组距式分组,连续变量只能做组距式分组。
19.从统计表的内容看 :统计表由主词和宾词两部分构成,从统计表的形式看:统计表包括总标题、横行和纵栏标题、数字资料
20.平均指标可分为两类:计算均值和位置均值。
21.根据算术平均数、众数和中位数的关系,次数分布可以分为对称分布,左偏分布,右偏分布。
22.常用的绝对变异指标有极差、方差和标准差;相对变异指标有极差系数、标准差系数.
23.将总体按分组标志分组后形成的总体单位在各组的分布,又称次数分布数列或频数分布数列
24.抽样推断包括参数估计和假设检验两部分。
25.参数估计有两种估计方法:点估计和区间估计
26.总体指标也称总体参数,其主要有总体均值、总体成数、总体方差和总体标准差。
27.最优评估量的评估标准有:无偏性,一致性,有效性。
28.方差分析在形式上是比较多个总体的均值是否相等,但本质上是研究变量之间的关系。
方差分析的类型有单因素方差分析和多因素分析。
29.变量之间的关系有两种类型相关关系、函数关系
30.按相关程度可分为完全相关、不完全相关和不相关,按相关方向可以分为正相关和负相关,按相关形式可以分为线性相关和非线性相关,按变量多少可分为单相关、复相关和偏相关。
按相关性质可以划分为真实相关和虚假相关。
31.样本相关系数取值范围[—1 , 1].
32.一元线性回归系数的含义:自变量每变动一个单位,因变量平均变动情况
33.判断经验回归方程拟合优度常用的数量指标是判定系数。
34.总离差平方和可以分解为可解释离差和随机误差
35.多元线性回归模型显著性检验可以分为回归方程的检验、回归系数的检验。
36.时间序列也称动态序列,按其排列指标表现形式可以分为三类:绝对数时间序列、相对数时间序列、平均数时间序列,绝对数时间序列按其反映社会经济现象性质不同,又可以区分为时期序列、时点序列。
37.编制时间序列,最重要的是遵循可比性原则.
38.常见的动态时间序列水平指标有:发展水平、平均发展水平、增减水平、平均增减水平;时间序列速度指标有:发展速度、平均发展速度、增减速度、平均增减速度。
39.平均发展水平也称序时平均数或动态平均数
40.计算平均增减水平的方法有水平法和总和法。
41.增减1%的绝对值是逐期增长量和环比增减速度的比值
42.各环比发展速度的连乘积等于定基发展速度,相邻两个定基发展速度之商等于相应的环比发展速度。
43.时间序列的总变动主要包括:长期趋势变动、季节变动、循环变动、不规则变动.
44.测定长期趋势的办法主要有时距扩大法、序时平均法、移动平均法、分段平均法、最小平均法。
45.统计指数按其反映对象范围不同,可以分为个体指数、总指数;按其反映社会经济现象的不同特征可以分为数量指标指数和质量指标指数;按其基期不同,分为定基指数和环比指数;按其对比内容不同,可分为动态指数和静态指数,按照计算总指数方法不同可以分为综合指数和平均数指数。
46.总指数的编制方法,其基本形式有两种:一是综合指数,二是平均指数。
47.平均数指数有两种基本形式,加权算术平均数和加权调和平均数,由于使用权数不同,又可以分为综合指数变形平均数指数形式和固定权数的平均数指数形式。
48.编制综合指数的一般原则是:编制数量指标指数时,应以基期的质量指标为同度量因素;编制质量指标指数,应以报告期的数量指标为同度量因素。
49.指数体系按指数化指标形式不同,可以分为总量指标指数体系和平均指标指数体系。
50.依据各项指数对比方式不同,指数序列可以分两种:定基指数序列、环比指数序列
二、单选(30分)
1、某市对所有高等学校进行调查,该市某一高等学校师生有5680 人,其
中学生有3600 人,教师有2080 人,该校最大的系有学生600 人.上述数
值中有统计指标( )。
A。
3 个 B.1 个 C。
4 个 D.0
2.统计指标按其说明的总体现象的内容不同,可以分为( 3 )
①基本指标和派生指标②数量指标和质量指标
③实物指标和价值指标④绝对数指标,相对数指标和平均数指标
3.变量是( 4 )
①可变的质量指标②可变的数量指标和标志
③可变的品质标志④可变的数量标志和指标
4.2000年11月1日零点的第五次全国人口普查是( 3 )
①典型调查②重点调查③一次性调查④经常性调查
5.调查大庆、胜利等几个主要油田来了解我国石油生产的基本情况,这种调查方式属于3
①普查②典型调查③重点调查④抽样调查
6.某些不能够或不宜用定期统计表搜集的全面统计资料一般应采取的方法是1
①普查②重点调查③典型调查④抽样调查
7.工厂对生产的一批零件进行检查,通常采用( 2 )
①普查②抽样调查③重点调查④典型调查
8.若要了解月末半成品的库存情况调查人员应进行实地盘点,这种搜集资料的方法属于4
①大量观察法②报告法③采访法④直接观察
9.对企业先按经济类型分组,再按企业规模分组,这样的分组属于( 3 )
①简单分组②平行分组③复合分组④再分组
10.用组中值代表各组内一般水平的假定条件是( 3 )
①各组的次数均相等②各组的组距均相等
③各组的变量值均相等④各组的变量值在组内均匀分布
11.分组时,若某单位的变量值刚好等于某组的上限和相邻组的下线时,应将其归在( 2 )
①上限所在组②下限所在组③任意一组均可④另设新组
12.下列指标属于比例相对指标的是( 2 )
①工人出勤率②农轻重的比例关系③每百元产值利税额
④净产值占总产值的比重
13.下列指标属于总量指标的是( 4 )
①人均粮食产量②资金利税率③产品合格率④学生人数
14.将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为( 4 )
①动态相对指标②结构相对指标③比例相对指标④比较相对指标
15.一个企业产品销售收入计划增长8%,实际增长20%,则计划超额完成程度为( 3 )
①12% ②150%③11.11% ④111。
11%
16.现象之间相互依存关系的程度越高,则相关系数值( 4 )
①越接近于∞②越接近于-1 ③越接近于1 ④越接近于-1或1
17.相关系数r=0,说明两个变量之间( 4 )
①相关程度很低②不存在任何相关关系
③完全负相关④不存在直线相关关系
18.在回归方程中,回归系数b表示( 4 )
①当x=0时y的期望值②x变动一个单位时y的变动总额
③y变动一个单位时x的平均变动量④x变动一个单位时y的平均变动量
19、统计分组的关键是( 1 )。
A.正确地选择分组标志与划分各组界限
B.调查资料的准确性
C。
设计出科学的整理表 D。
搞好分组前的准备工作
20、某连续变量数列,其末组为开口组,下限为500,又知其邻组的组距为40,则末组的组中值为
( 1 )。
A.520
B.510
C.500
D.480
21 、若检验H 0 :抽出一个样本,其均值 ,则(A )。
A. 肯定接受原假设 B。
有可能接受原假设C. 肯定拒绝原假设 D。
有可能拒绝原假设
22 若其他条件相同,则下列诸检验的P 值中拒绝原假设理由最充分的是(A).
A.2%
B.10%
C.25% D。
45%
23、在方差分析中,( 4)反映的是样本数据与其组平均值的差异.
A .总体离差平方和;
B .组间误差;
C .抽样误差;
D .组内误差
24、在下列假定中,哪一个不属于方差分析中的假定( 4)。
A. 每个总体都服从正态分布 B。
各总体的方差相等C。
观察值是独立的 D。
各总体的方差等于零
三、简答题10分
1。
统计指标和统计标志的联系与区别:
答:二者的区别:第一,指标说明的是总体的数量特征,而标志则是反映单位的数量特征;第二,指标都可以用数值表示,而标志既有能用数值表示的数量标志,又有不能用数值表示的品质标志。
二者的联系:第一,统计指标的数值是由总体单位的数量标志值进行直接汇总或间接计算分析而来的。
第二,随着研究目的和任务的变化,统计指标和数量标志之间存在着转换关系。
2。
算术平均数和调和平均数的区别和联系:
联系:调和平均数是算术平均数的变形,都是总体标志总量除以总体单位总量。
区别: 已知各组单位数,用算术平均数;已知各组标志总量,用调和平均数.
3。
什么是时期指标和时点指标?它们有什么不同特点?
答:时期指标是反映现象在一定时期内发展过程的总量指标。
时点指标是反映现象在某一时点上状况的总量指标。
它们不同特点有:第一,不同时期的时期指标可以相加计算,而不同时点的时点指标一般不能相加计算;第二,时期指标的数值大小与时期长短有直接关系,而时点指标的数值大小与时点间隔长短没有直接关系;第三,时期指标数值一般通过连续登记取得,而时点指标数值通过间断登记取得。
4.简述相关分析和回归分析的区别与联系
联系:
1.相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续;
2.相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则要依靠相关分析来表现变量之间数量变化的相关程度;
3.只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义.
区别:
1。
相关分析中,变量 x变量 y处于平等的地位;回归分析中变量 y称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化
2。
相关分析中所涉及的变量 x 和和 y都是随机变量;回归分析中,因变量 y是随机变量,自变量 x可以是随机变量,也可以是非随机的确定变量
3。
相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x对变量 y的影响大小,还可以由回归方程进行预测和控制
5。
影响抽样单位数的因素:
(1)总体标志变动度;(2)抽样极限误差;(3)概率保证程度;(4)抽样方式方法
6。
统计指数的作用
1综合反映复杂现象总体总变动的方向和程度;
2利用指数体系分析各因素变动对现象总变动的影响程度和影响绝对值;
3利用动态指数数列,可以分析综合现象在长时间内的变化发展趋势。
7.平均数指数和综合指数的联系与区别:
联系:1都属于总指数的范畴。
2在一定权数下综合指数和平均数指数可以互换换算.
区别:
(1)两种指数是总指数的两种独立形式。
综合指数是从社会经济现象的总量出发,找出同度量因素后再加总对比,以观察总量变动;而平均数指数是从个体指数出发将它们加权平均,以观察个体指数的平均变化。
(2)综合指数主要适用于全面资料,而平均数指数既可以依据全面资料编制,也可以运用非全资料编制。
(3)综合指数一般采用实际资料作权数,而平均数指数既可以用实际资料作为权数,也可以根据实际资料推算确定的比重权数来编制
8强度相对指标和平均指标的区别
四、计算题(50分)
1。
回归方程
在其他条件不变的情况下,某种商品的需求量(y)与该商品的价格(x)有关,现对给定时期内的价格与需求价格x
106891211910127
(元)
60727056555757535470
需求量
y(吨)
②拟合需求量对价格的回归直线;a=—3.12 b=89.7364
③确定当价格为15元时,需求量的估计值。
42。
92
2计划完成程度
2.某制冷机公司计划在未来的五年内累计生产压缩机12000台,其中,最后一年产量达到3000台,实际完成情况如下表所示:
某制冷机公司实际完成情况表(单位:台)
时
间
第
一
年
第
二
年
第
三
年
第四年第五年
一
季
二
季
三
季
四
季
一
季
二
季
三
季
四
季产
量
200
230
260
650650700750750800800850
(1)该公司五年累计完成计划程度?
(2)该公司提前多少时间完成累计产量计划?
(3)该公司提前多少时间达到最后一年计划产量
3 加权、调和平均数计算
4 指数体系因素分析
解:该企业总产值的动态指数为:
报告期总产值比基期增加:
∑∑=-=-
万元
81962040
01
1p q p q
其中,产品产量变动影响为: 产品产量增加使总产值增加的绝对额为:
∑∑=-=-
万元
11961970
00
1p q p q
产品出厂价格变动影响为:
出厂价格提高使总产值增加的绝对额为:
∑∑=-=-万元7
1972041011
q p q p
5.某总厂所属两个分厂的某产品成本资料如下表,试分析总厂该产品平均单位成本变动受分厂成本水平及总
厂产量结构变动的影响
6例:用下表资料进行因素分析
工人月平均工资( 元)工人数(人) X 0 X 1 f 0 f 1技术工 700 750 600 800辅助工 400 450 400 2200合计 580 530 1000 3000(1 )可变构成指数:
(2)固定构成指数:
(3 )结构影响指数
相对数分析:91.4%=110。
4% 82。
8%
绝对数分析: —50=50 + (—100 )
- 150000=150000 + (- 300000)
5序时平均数
6.某企业2003年9—12月各月月末生产工人数和全部职工人数的资料如下,求该企业第四季度生产工人占时间9月末10月末11月末12月末
生产工人数(人)
全部职工人数(人)800
1000
817
1020
827
1030
820
1020
解:(1)一季度工人月平均劳动生产率:
(2)一季度工人劳动生产率:
8。
某商店1990年各月商品库存额(万元)资料如下:
试计算上半年、下半年和全年的月平均商品库存额。
解:(1)上半年的月平均商品库存额:
(2)下半年的月平均商品库存额:
(3)全年的月平均商品库存额:
6 发展速度、增减水平、环比速度、定基发展
9。
某地区1995—2000年粮食产量资料如下
(2)计算该地区1996年至2000年这五年期间的粮食产量的年平均增长量以及按水平法计算的年平均增长速度。
(2)年平均增长量=34。
4÷5 =6。
88(万吨) 年平均增长速度=
10.某企业的调查资料如下表,试用动态指标的相互关系,填写表中所缺的动态指标。
7 总体参数估计(书上5—2,5-3)
10.某企业生产一种新的电子元件,用简单随机重复抽样方法抽取100只作耐用时间试验,测试结果,平均寿命6000小时,标准差300小时,试在95.45%的概率保证程度下,估计这种新电子元件的平均寿命区间。
假定概率保证程度提高到99.73%,允许误差缩小一半,试问应抽取多少只灯泡进行测试? 解:⑴ 6000x = 300σ= 100n =
30x μ=
=
=(小时)
()95.45%F t = ∴2t = 23060x x t μ∆=⋅=⨯=(小时)
x x x X x -∆≤≤+∆
600060600060X -≤≤+
59406060X ≤≤
∴在95。
45%的概率保证程度下,估计这种新电子元件的平均寿命区间在5940~6060小时之间
⑵ 160302x ∆=⨯= ()99.73%F t = 3t =∴2222
22
330030030x t n σ⨯===∆
11.采用简单重复抽样的方法,抽取一批产品中的200件作为样本,其中合格品为195件。
要求:⑴ 计算样本的抽样平均误差;
⑵ 以95。
45%的概率保证程度对该产品的合格率进行区间估计。
解: 200n = 1195n = ()99.45%F t = 2t = ⑴ 样本合格率
119597.5%200n p n =
==
抽样平均误差
()()
197.5%197.5% 1.10%200p p p n μ-⨯-=
==
⑵ 抽样极限误差2 1.10% 2.20%
p p t μ∆=⋅=⨯=
总体合格品率:
p p
p P p -∆≤≤+∆
97.5% 2.2%97.5% 2.2%P -≤≤+
95.3%99.7%P ≤≤
∴以95.45%的概率保证程度估计该产品的合格率进行区间在95。
3%~99.7%之间 8
假设检验
12. 某机床厂加工一种零件 ,根据经验知道 , 该厂加工零件的椭圆度近似服从正态分布 , 其总体均值为u0 =0.081mm , 总体标准差为σ= 0.025 。
今换一种新机床进行加工,抽取n=200 个零件进 行 检 验,得 到 的 椭 圆 度 为0.076mm 。
试问新机床加工零件的椭圆度的均值与以前有无显著差异 ? (α =0.05)
13.一个卖男士衬衣的邮购店,从过去的经验中总结出有15% 的购买者说衬衣的大小不合身,要求退货。
现
在这家邮购店改进了邮购定单的设计,结果在接下来售出的500 件衬衣中,有60 件要求退货,问在5% 的水平下,改进后的退货比例与原来的退货比例是否有显著差异?
9方差分析表
14.某企业准备用三种方法组装一种新的产品, 为确定哪种方法每小时生产的产品数量最多,随机抽取了30 名工人,并指定每个人使用其中的一种方法. 通过对每个工人生产的产品数进行方差分析得到下面的结果:方差来源平方和自由度均方和 F P
组间 210 0。
245
组内 3836 --- --—
总和 29 --——-——--
1、完成上面的方差分析表
2 、在显著性水平0。
05 下,检验三种组装方法的产品数量之间是否有显著差异 ?
方差来源平方和自由度均方和 F P
组间 420 2 210 1.478 0。
245
组内 3836 27 142.07 ——- -—-
总和 4256 29 ———————-—
解: H 0 : u1 =u2 =u3 P=0。
245>α=0.05在显著性水平0。
05下,接受原假设,三种组装方法的产品数量之间没有显著差异。