商业统计学复习大纲
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
商业统计学复习大纲
一、考试题型
1.选择题(20道小题,每小题2分,共40分)
2.判断题(10道小题,每小题1分,共10分)
3.简答题(2道小题,每小题5分,共10分)
4.案例分析(1道小题,共10分)
5.计算题(3-4道题目,共30分)
二、复习要点
1.第一章导论
(1)掌握统计、统计资料、统计工作和统计理论的含义。
(2)熟悉3大统计学派,并知道每个学派的创始人。
(3)了解统计的研究对象,统计的特点。
(4)掌握统计工作的4个阶段。
(5)熟悉统计研究方法。
(6)掌握下面下列的统计概念:总体、总体单位、标志、统计指标、变异和变量。
尤其要区分总体和总体单位,标志和统计指标这两对相似的概念。
2.第二章统计调查
(1)熟悉统计调查的含义和分类
(2)掌握统计调查方案的内容和问卷设计的原则。
(3)了解统计调查的时间和期间的概念,了解调查单位和填表单位的区别。
(4)熟悉普查、重点调查、典型调查和抽样调查的含义和注意要点。
3.第三章统计整理
(1)熟悉直方图、连线图、散点图和饼图这几种统计图形的作用。
(2)掌握频数分析相关的概念。
如分配数列、单项数列、组距数列、频数、频率、向上累计频率等概念。
尤其要掌握频率、向上累计频率的性质。
(3)掌握统计分组。
掌握全距、组数和组距三者之间的关系。
知道“上限不在内”原则。
(4)掌握组中值的计算。
4.第四章综合指数
(1)熟练掌握综合指标的分类,综合指标包括了总量指标、相对指标、平均指标和变异指标。
(2)熟悉总量指标的含义和分类。
(3)掌握6种相对指标的含义和计算公式以及注意要点。
这6种相对指标包括:结构相对指标、比例相对指标、比较相对指标、强度相对指标、动态相对指标和计划完成相对程度指标。
(4)掌握一些常用的宏观经济指标:例如国内生产总值GDP、消费者价格指数CPI,失业率,通货膨胀率的概念。
(5)知道描述数据分布的三个方面:集中趋势、离中趋势和偏度和峰度。
(6)知道平均指标的含义和作用。
(7)熟练掌握算术平均数、调和平均数、几何平均数、众数和中位数这几个平均指标的含义、计算公式、适用条件和特点。
不要求掌握加权调和平均数、加权几何平均数,以及组距数列中位数计算公式。
(8)特别要熟练掌握组距数列加权算术平均数和众数的计算方法。
(9)知道变异指标的含义和作用。
(10)熟悉全距、平均差和方差这三个变异指标的含义、计算公式和注意要点。
(11)熟练掌握方差、标准差含义、计算公式和注意要点。
其中总体方差和总体标准差包括未分组数据和组距数列的计算公式。
(12)掌握标准差系数。
5.第六章统计指数
(1)了解统计指数的含义,包括广义的指数和侠义的指数。
(2)了解统计指数的分类,重点是个体指数、总体指数、数量指标指数和质量指标指数。
(3)熟练掌握综合指数的编制方法。
知道在什么情形下,同度量因素应如何选择。
编制数量指标指数,应以基期的质量指标作为同度量因素。
编制质量指标指数,应以报告期的数量指标作为同度量因素。
(4)熟练掌握拉氏指数和派氏指数
(5)掌握加权平均数指数和加权调和平均数指数
6.第7章抽样推断
(1)掌握抽样的含义和相关观念:如总体、个体、样本、总体容量、样本容量、抽样比、抽样的特征
(2)了解概率抽样方法:简单随机抽样、类型抽样、等距抽样、整群抽样(3)掌握参数与统计量的含义,四种情况下的样本可能数目。
(4)理解三种不同性质的分布
(5)熟练掌握参数估计的方法,点估计和区间估计,重点掌握单个总体平均数的置信区间(方差已知和方差未知)的情况
(6)熟练掌握假设检验的方法,重点掌握单个总体平均数的假设检验(方差已知和方差未知)的情况。
7.第八章相关与回归分析
(1)知道函数关系和相关关系。
(2)掌握相关关系的种类。
(3)掌握相关分析定义,了解相关分析基本方法:相关表、相关图和相关系数。
(4)熟练掌握相关系数的含义、计算方法,以及相关系数与相关关系程度的这两者的对应关系。
(5)熟练掌握回归分析定义
(6)了解回归模型的模型假释、思想和处理方法。
(6)熟练掌握参数估计、预测的计算过程。
三、课堂练习
1.选择题
(1)若要了解某市工业生产设备情况,则总体单位是该市的()
A. 每一个工业企业
B. 每一台设备
C. 每一台生产设备
D. 每一台工业生产设备
(2)统计年鉴属于()
A. 统计资料
B. 统计工作
C. 统计理论
D. 统计实践
(3)下列标志中属于品质标志的是()
A. 年龄
B. 工资
C. 日产量
D. 籍贯
(4)某连续变量数列,其末组为500以上。
又如其邻近组的组中值为480,则末组的组中值为()
A. 510
B. 520
C. 530
D. 540
(5)英国的威廉·配第是()的代表人物。
A. 记述学派
B. 政治算术学派
C. 图表学派
D. 数理学派
(6)变量数列中各组频率的总和应该()
A. 小于1
B. 等于1
C. 大于1
D. 不等于1
(7)重点调查中的重点单位是按()
A. 这些单位数量占总体全部单位总量的很大比重
B. 这些单位的标志总量占总体标志总量的很大比重
C. 这些单位具有典型意义,是工作重点
D. 这些单位能用以推算总体标志总量
(8)某地区有10万人口,共有80个医院。
平均每个医院要服务1250人,这个指标是()
A. 平均指标
B. 强度相对指标
C. 总量指标
D. 发展水平指标(9)平均指标反映了()
A. 总体单位的偏度和峰度
B. 总体分布的特征趋势
C. 总体单位的集中趋势
D. 总体次数分布的离中趋势
(10)某工业企业的某种产品成本,第一季度是连续下降的。
1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。
则第一季度的平均单位成本()
A. 201815
17.67
3
++
=(元)
17.54
=(元)
C. 20750181000151500
17.08
75010001500
⨯+⨯+⨯
=
++
(元)
D. 75010001500
16.83 75010001500
201815
++
=
++
(元)
(11)根据某一统计数列计算的标准差数值越小,则表明( ) A. 平均数代表性越强,总体离差程度越大 B. 平均数代表性越弱,总体离差程度越小 C. 平均数代表性越强,总体离差程度越小 D. 平均数代表性越弱,总体离差程度越大 (12)数列1,3,5,7,9的总体方差是( )
A. 5
B. 8
C. 4
D. 10
(13)某总体容量为N ,其标志值的变量服从正态分布,均值为μ,方差为2
σ。
X 为样本容量为n 的简单随机样本的均值(不重复抽样),则X 的分布为( )。
A. ),(2
σμN B.
),(2
n N σμ C.
)
,(2n X N σ D. )1,(2--⋅N n
N n N σμ (14)某厂产品产量增长了20%,单位产品成本上升了5%,则产品总成本增长( )
A. 25%
B. 26%
C. 15%
D. 18%
(15)在假设检验中,显著性水平α的意义是( )
A.0H 为真,但经检验拒绝0H 的概率
B.0H 为真,经检验接受0H 的概率。
C.0H 不成立,经检验拒绝0H 的概率
D.0H 不成立,但经检验接受0H 的概率。
(16) 用最小二乘法拟合直线回归方程时,必须要满足的一个基本条件是( )。
A. ()2
c y y -∑取最小值 B. ()c y y -∑取最小值 C. ()2
c y y -∑取最大值 D. ()c y y -∑取最大值
(17)已知变量X 与变量Y 之间的关系,如下图所示,其相关系数计算出来放在四个备选答案之中,它是( )。
图1:变量X 与变量Y 的散点图
注:X 用交叉(X )来表示,Y 用圆圈(O )来表示
A. 0.29
B. -0.88
C. 1.03
D. 0.99 (18)下面表述中错误的是:同度量因素是( )
A.综合指数中的固定媒介因素
B.综合指数的权数
C.综合指数中所要对比的指标因素
D.综合指数编制中的核心问题
(19) 拉氏的物量指数公式是( )
A.1000
q q p K q p
=
∑∑ B. 1000
p p q K p q
=
∑∑
C.110
1
q q p K q p
=
∑∑ D.1101
p p q K p q
=
∑∑
(20)某企业按1990年不变价格编制的1995年工业总产值指数为135%,这说明( )
A.每种产品的产量都增长了35%
B.每种产品的价格都上涨了35%
C.由于价格变动使产值增长了35%
D.由于产量变动使产值增长了35%
2. 计算题
问题:
①请计算各组组中值,并在上表第三列填上计算结果。
②各组的组距是多少?组距为10
③计算各组工人数的频率,并在上表第四列填上计算结果。
④计算职工日产量的算术平均数。
⑤计算职工日产量的众数。
⑥计算职工日产量的总体标准差。
解:④计算加权平均数:
55108115
108
1350016482.62i i
i
x f
f
⨯++⨯=
++=
=∑∑
⑤众数为()()
1125019
701076.8950195036o M L i ∆-=+=+⨯=∆+∆-+-。
⑥计算方差
()2
36172.56
()220.56164
i x x f
Var x f
-=
=
=∑∑ 标准差为14.85σ==
<2>设有1995~2004年10年个人消费支出(C )和个人收入水平(Y )资料见下表,
(1)以个人收入为横坐标,以个人消费支出为纵坐标,画出散点图。
(2)计算个人收入与个人消费支出的相关系数
(3)以个人收入为自变量,以个人消费支出为因变量,建立直线回归方程:=+。
请利用资料进行参数估计。
并在(1)的散点图中画出直线
C a bY
回归方程
(4)假设2005年当个人收入达到了200时,试预测消费支出。
答:(1)散点图如下
(2)设个人收入为变量x,个人消费支出为变量y,其样本相关系数的计算公式为:
()()
1
x x y y L x x y y r ----=
==
∑
1011114111.410n i i x x n ====∑,10192992.910
n i i y y n ====∑
②计算xx L ,xy L ,yy L
()2
16482.4xx L x x =-=∑, ()210364.9yy L y y =-=∑,
()()13066.4xy L x x y y =--=∑ ③相关系数的计算公式为:
1L r =
=
=
(3)设回归直线方程为:y a bx =+,根据最小二乘法,参数估计公式为:
13066.4
0.7916482.4
xy xx
L b L =
=
=
92.90.79111.4 4.6a y bx =-=-⨯=
所求的回归直线为: 4.60.79y x =+,即 4.6.79C Y =+ 回归直线拟合图如下:
(5) 当200Y =时,代入回归直线方程,可得: 4.60.79200163.3C =+⨯=,即
消费支出达到163.3。
<3>有40名学生的统计学成绩,成绩资料如下:(单位:分)
问题:
(1)根据上述数据进行统计分组,并编制分配数列。
请依次完成下列问题和表格
①分组数目:拟分 组。
(1分) ②组距:每组组距是 分。
(1分)
③完成下面表格。
其中分组列:应填上每一组的下限和上限;频数列、频率列和累计频率列应填上各组的频数、频率和向上累计频率。
如果表格不够行数,
解:(1)根据上述数据进行统计分组,并编制分配数列。
请依次完成下列问题和表格
①分组数目:拟分 5 组。
(1分)
②组距:每组组距是 10 分 。
(1分)
③完成下面表格。
其中分组列:应填上每一组的下限和上限;频数列、频率列和累计频率列应填上各组的频数、频率和向上累计频率。
如果表格不够行数,可以自行增加行。
(8分)
(2)请计算这40学生统计学成绩的平均分和总体方差。
(5分)
解:①有两种方法:第一种是根据分组数据,采取加权算术平均数的计算公式。
略。
②直接用原始数据计算可得:
888970
79.5540
x x n
++
+=
==∑
()
()()()
2
2
2
2
888089807080var 14540
i x x n
--+-+
+-=
=
=∑
解:略
<5>一家保险公司收集到由36位投保人组成的随机样本,得到每位投保人的年龄(单位:周岁)的数据如下表,建立投保人年龄90%的置信区间。
已知对于标准正态分布的分位点0.05 1.65Z =。
构建置信区间,计算可得
39.5i
x
x n
=
=∑
7.77s == 根据置信区间的计算公式:
22
x Z x Z αα
⎡⎤
-+⎢⎣ 39.51,6539.5 2.13±=± 置信区间为:[]37.4,41.6,即投保平均年龄的90%的置信区间为37.4~41.6。
解:平均月工资为1050100012001550
135810
x x n
++++==
=∑
<7>计算序列{2,4,6}和{5,6,7}这两个序列的相关系数。
解:令{2,4,6}x =,{5,6,7}y =
1
n xy x y r -=
==
<8>计算某国家2000年和2001年国内生产总值资料如下表所示,填列表中所缺
②设2001年实际完成额为x ,x/192=1+5.8%,解得x =203.1 ③424-120.4-203.1=100.5 ④203.1/424=47.9% ⑤100.5/424=23.6%
⑥28.4%+47.9%+23.6%=100%
⑦设2000年实际完成额为x ,
424/x=1+4.8%,解得x =404.6 ⑧404.6-118-192=94.6 ⑨120.4/118-1=2.1% ⑩100.5/94.6-1=6.2%
(2)选择恰当的指数,说明由于价格变动对销售额的影响。
解:(1)应计算拉氏物量指数
100
5000192104050150250400019280050200250
1049500858000122.31%
⨯+⨯+⨯==
⨯+⨯+⨯=
=∑∑q q p
K q p
1
1049500858000191500q p q p
-=-=∑∑(元)
计算结果表明,三种商品销售量报告期比基期平均增长22.31%,由于销售量增长而增加的销售额为191500元。
(2)应计算派氏价格指数
1101
16850004010403001501925000501040250150
926600104950088.29%
⨯+⨯+⨯==
⨯+⨯+⨯=
=∑∑p p q K p q
11
01
9266001049500122900p q p q
-=-=-∑∑(元)
计算结果表明,三种商品价格报告期比基期平均下降11.71%,由于价格下降而减少的销售额为122900元。
下面给出了在考试试卷上可以见到的公式附录 附录:一些复杂的计算公式
1.未分组数据的算术平均数计算公式和方差计算公式:
算术平均数:x x n
=∑ 方差计算公式:()2
var()x x x n
-=
∑
2.组距数列的加权平均数计算公式和总体方差计算公式:
加权平均数:i i i
x f x f
=
∑∑ 总体方差:()2
()i i
i
x x f Var X f
-=
∑∑
3. 组距数列众数的上下限计算公式:
下限公式:1012L M X d ∆=+
∆+∆ 上限公式2
012
U M X d ∆=-∆+∆
4. 样本相关系数的计算公式:
()()
1
x x y y r --=
∑ 5. 回归直线方程:c y a bx =+在最小二乘法下参数估计公式:
()
221
1xy xx
xy x y
L n b L x x n -=
=
-∑∑∑∑∑
a y bx =-
其中 ()2xx L x x =-∑,()2
yy L y y =-∑,()()xy L x x y y =--∑
注意:
1.考试时,要求带直尺和计算器。
2.所有的答案均要求在答卷上填写,在问卷上填写无效。
复习和考试过程中需要注意的问题:
①复习时,要注意看每次小课练习题的答案和做过作业的答案。
答案放在ftp 上。
②考试时,尽量答题,不要留有空白。
③考试时带计算器和直尺。
平均数的“平均性”
1994年1月6日,山西日报的两位记者撰文《平均数掩盖贫困户》。
文章反映,在一个户人均收入声称达千元的村里,71%的户人均纯收入不到500元,其中不到350元温饱线的占32%。
作者指出,平均数之所以高,是因为村里有6户个体建筑大户的人均收入在3万元以上,所以平均数就掩盖了贫困户。
我们再看看2001年我国某市下岗居民年收入增加的情况。
表1 2001年我国某市下岗居民年收入增加情况(扣除物价上涨因素单位:元)
对应的下岗工人的年收入的增加额为0。
但是,如果以这个众数0,来代表万户居民在2001年的收入增加情况,显然不全面,也不符合实际情况,因为表中资料显示:有70%共7000人的居民户,在这一年中收入有不同程度的增加。
所以,采用众数来反映居民户年收入的增加情况没有意义。
如果用算术平均数度量来反映以上资料中万户居民年收入增加情况,所计算的加权平均数结果为3720元。
从资料中可以明显看出这个均值的代表性很不强。
因为在万户居民中只有20%(2000户)居民的年收入在3720以上。
也就是说还有80%(8000户)居民的年收入低于平均数3720元。
之所以户均数这么高,是因为它受到了资料中极大值(200户年收入增加额10万元)的影响。
所以,用算术平均数量度计算的这个人均数不能真实、全面地代表和反映绝大多数居民户在2001年收入增加情况。
问题:
1. 结合案例中有关平均数和众数的论述,分析说明算术平均和众数的适用条件和局限性。
(5分)
2. 对于度量2001年我国某市下岗居民年收入平均增加额应采用那个平均指标较为合理?请说明理由。
(5分)
(4)案例分析
1.答:
(1)算术平均数的局限性是容易受到极端值的影响较大。
遇到与其他数据相比显得特别大或者特别小的数值时,不宜使用算术平均数来代表集中趋势,这就是适用条件。
再案例中由于存在着6户个体建筑大户的人均收入在3万元以上,所以平均数就掩盖了贫困户。
(2)众数是一个位置平均数,它只考虑总体分布中最频繁出现的变量值,而不受极端值的影响。
因此,众数只考虑出现次数最多的组或变量值,其余的组和变量就不考虑,这有一定的缺陷性。
因为在案例中增加收入为0的组的频数最多,而其余增加组就不考虑,这就犯了以偏概全的错误。
众数的适用条件是:当分布列没有明显的集中趋势或趋于均衡分配时,无众数可言。
2. 答:应采用中位数来度量2001年我国某市下岗居民年收入平均增加额。
因为中位数是总体中所有变量按顺序排列后,处在中间位置的那个变量值,它不受极端值的影响。
由于中位数度量最适合总体中变量值差异悬殊现象的数量特点,所以,一般在反映收入的一般水平时,常用中位数统计。
关注一些基本概念:
例如:
1.统计一词含义?
2.统计工作过程有哪些?
3.综合指标有哪些?
4.统计调查方案的内容?
5.基本的统计调查方法。
6.6种相对指标有哪些?
7.什么是相关分析和回归分析?。