统计学原理计算题(公式)资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《统计学原理》复习资料(计算部分)
一、 编制分配数列(次数分布表) 统计整理公式
a) 组距=上限-下限
b) 组中值=(上限+下限)÷2
c) 缺下限开口组组中值=上限-1/2邻组组距 d) 缺上限开口组组中值=下限+1/2邻组组距
1.某班40名学生统计学考试成绩分别为:
57 89 49 84 86 87 75 73 72 68 75 82 97 81
67 81 54 79 87 95 76 71 60 90 65 76 72 70
86 85 89 89 64 57 83 81 78 87 72 61
要求:⑴ 根据上述资料按成绩分成以下几组:60分以下,60~70分,70~80分,80~90分,90~100分,整理编制成分配数列。

⑵ 根据整理后的分配数列,计算学生的平均成绩. 解:分配数列
成绩(分) 学生人数(人) 频率(%) 60以下 4 10
60-70 6 15 70—80 12 30 80—90 15 37。

5 90—100 3 7.5 合计
40
100
平均成绩 554656751285159533070
76.754040
xf x f
⨯+⨯+⨯+⨯+⨯=
=
==∑∑(分)
或 5510%6515%7530%8537.5%957.5%76.75f
x x f
=⋅
=⨯+⨯+⨯+⨯+⨯=∑∑(分)
2.某生产车间40名工人日加工零件数(件)如下:
30 26 42 41 36 44 40 37 43 35 37 25 45 29 43
31 36 49 34 47 33 43 38 42 32 25 30 46 29 34 38 46 43 39 35 40 48 33 27 28
要求:⑴ 根据以上资料分成如下几组:25~30,30~35,35~40,40~45,45~50,整理编制次数分布表. ⑵ 根据整理后的次数分布表,计算工人的平均日产量。

(作业10P 1) 解:次数分布表
日加工零件数(件)
工人数(人)
频率(%) 25—30 7 17.5 30—35 8 20 35-40 9 22。

5 40—45
10
25
45—50 6 15 合计
40 100
平均日产量 27.5732.5837.5942.51047.561500
37.54040
xf x f
⨯+⨯+⨯+⨯+⨯=
=
==∑∑ 件
或 27.517.5%32.520%37.522.5%42.525%47.515%37.5f
x x f
=⋅
=⨯+⨯+⨯+⨯+⨯=∑∑ 件
二、 算术平均数和调和平均数的计算 加权算术平均数公式 xf
x f
=
∑∑(常用) f
x x f
=⋅
∑∑
(x 代表各组标志值,f 代表各组单位数,
f
f

代表各组的比重)
加权调和平均数公式 m x m x
=
∑∑ (x 代表各组标志值,m 代表各组标志总量)
计算该企业的工人平均劳动生产率。

分析: m x m
x
=
总产量工人平均劳动生产率(结合题目)
总工人人数
从公式可以看出,“生产班组”这列资料不参与计算,是多余条件,将其删去。

其余两列资料,根据问题“求平均××”可知“劳动生产率”为标志值x ,而剩余一列资料“实际产量”在公式中做分子,因此用调和平均数公式计算,并将该资料记作m 。

=÷每一组工人数每一组实际产量劳动生产率,即m
x。

同上例,资料是组距式分组,应以各组的组中值来代替各组的标志值。

解:825065005250255047502730068.2582506500525025504750
400
5565758595
m x m x ++++=
===++++∑∑(件/人) 2. 若把上题改成:(作业11P 3)
计算该企业的工人平均劳动生产率。

分析: xf
x f
=
总产量工人平均劳动生产率(结合题目)
总工人人数 从公式可以看出,“生产班组”这列资料不参与计算,是多余条件,将其删去.其余两列资料,根据问题“求平均××”可知“劳动生产率”为标志值x ,而剩余一列资料“生产工人数”在公式中做分母,因此用算术平均数公式计算,并将该资料记作f 。

=⨯每一组实际产量劳动生产率组工人数,即xf .同上例,资料是组距式分组,应以各组的组中值来代替各组的标志值。

解:5515065100757085309550
400
xf x f
⨯+⨯+⨯+⨯+⨯=
=
∑∑=68。

25(件/人)
3.某企业产品的有关资料如下:
试计算该企业98年、99年的平均单位成本. 分析:m
x f
=
总成本平均单位成本总产量
计算98年平均单位成本,“单位成本”这列资料为标志值x ,剩余一列资料“98年产量”在实际公式中做分母,因此用算术平均数公式计算,并将该资料记作f ;计算99年平均单位成本,“单位成本”依然为标志值x ,剩余一列资料“99年成本总额"在实际公式中做分子,因此用调和平均数公式,并将该资料记作m .
解:98年平均单位成本: 2515002810203298097420
27.83150010209803500
xf
x f
⨯+⨯+⨯=
=
==++∑∑(元/件)
99年平均单位成本: 24500285604800010106028.872450028560480003500252832
m x m x ++=
===++∑
∑(元/件)
4.2000年某月甲、乙两市场某商品价格、销售量、销售额资料如下:
分别计算该商品在两个市场的平均价格. 分析:m
x f
=
总销售额平均单价总销售量
计算甲市场的平均价格,“价格”这列资料为标志值x ,剩余一列资料“甲市场销售额”在实际公式中做分子,因此用调和平均数公式计算,并将该资料记作m ;计算乙市场的平均价格,“价格”依然为标志值x ,剩余一列资料“乙市场销售量"在实
际公式中做分母,因此用算术平均数公式,并将该资料记作f .
解:甲市场平均价格:73500108000150700332200123.04735001080001507002700105120137m x m x ++=
===++∑∑(元/件) 乙市场平均价格:1051200120800137700317900
117.7412008007002700
xf x f
⨯+⨯+⨯==
==++∑∑(元/件)
三、 变异系数比较稳定性、均衡性、平均指标代表性(通常用标准差系数V x
σσ=
来比较)
公式:标准差: 简单σ= ; 加权 σ=
1. 有甲、乙两种水稻,经播种实验后得知甲品种的平均亩产量为998斤,标准差为162.7斤,
亩产量(斤)x
播种面积(亩)f
xf
()
2
x x f -
900 1。

1 990 11221.1 950 0。

9 855 2340.9 1000 0.8 800 0.8 1050 1。

2 1260 2881.2 1100 1.0 1100 9801 合计
5.0
5005
26245
试计算乙品种的平均亩产量,并比较哪一品种的亩产量更具稳定性? 分析:xf
x f
=
总产量平均亩产量总面积
根据表格数据资料及实际公式可知,用算术平均数公式计算乙品种的平均亩产量。

比较哪一品种亩产量更具稳定性,用标准差系数V σ,哪个V σ更小,哪个更稳定。

解: 5005
10015
xf x f
=
=
=∑∑乙(斤) ()2
26245
72.455
x x f
f
σ-=
=∑∑乙(斤) 72.45
7.24%1001V x σσ
==
=乙
162.716.30%998
V x σσ===甲
∴V V σσ<乙甲 乙品种的亩产量更具稳定性
2.甲、乙两班同时参加《统计学原理》课程的测试,甲班平均成绩为81分,标准差为9。

5分;乙班成绩分
试计算乙班的平均成绩,并比较甲、乙两个班哪个平均成绩更具代表性。

分析:用标准差系数V σ比较两个班平均成绩的代表性大小,哪个V σ更小,哪个更具代表性。

解:4125
7555
xf x f
=
=
=∑∑乙(分)
9.34σ=
=
=乙(分) 9.34
12.45%75V x σσ
==
=乙
9.511.73%81
V x σσ===甲
∴V V σσ<乙甲 甲班的平均成绩更具代表性
3.6件;乙组工人日产量资料如下:
计算乙组工人平均日产量,并比较甲、乙两个生产小组哪个组的日产量更均衡? (作业12P 5) 解:15182539353145122870
28.718393112100
xf
x f
⨯+⨯+⨯+⨯=
=
==+++∑∑乙(件)
σ=

9.13=
(件) 9.1331.81%28.7V x
σσ
=
=
=乙 9.6
26.67%36
V x σσ===甲 ∴V V σσ<乙甲 甲班的平均成绩更具代表性
四、 总体参数区间估计(总体平均数区间估计、总体成数区间估计) 具体步骤:①计算样本指标x σ、 ; p
②计算抽样平均误差x μ ; p μ ③由给定的概率保证程度()F t 推算概率度t ④计算抽样极限误差x ∆ ; p ∆
⑤估计总体参数区间范围x x x X x -∆≤≤+∆;p p p P p -∆≤≤+∆
抽样估计公式
1。

平均误差:
重复抽样: n
x σ
μ=
n
p p p )
1(-=
μ 不重复抽样: )1(2
N
n n
x -
=
σμ 2.抽样极限误差 x x t μ=∆ 3.重复抽样条件下:
平均数抽样时必要的样本数目
2
22x t n ∆=
σ
成数抽样时必要的样本数目2
2)1(p
p p t n ∆-=
4。

不重复抽样条件下:
平均数抽样时必要的样本数目
2222
2σσt N Nt n x +∆=
1.从某年级学生中按简单随机抽样方式抽取50名学生,对会计学课程的考试成绩进行检查,得知平均分数为76.5分,样本标准差为10分,试以95。

45%的概率保证程度推断全年级学生考试成绩的区间范围;如果其他条件不变,将允许误差缩小一半,应抽取多少名学生?
解:⑴ 75.6x = 10σ= 50n =
1.414x μ===(分)
()95.45%F t = ∴2t =
2 1.414 2.828x x t μ∆=⋅=⨯=(分)
x x x X x -∆≤≤+∆
75.6 2.8375.6 2.83X -≤≤+
72.7778.43X ≤≤
∴以95。

45%的概率保证程度推断全年级学生考试成绩的区间范围为72。

77~78。

43分之间
⑵22
2x t n σ=∆ (
由x
μ=x x t μ∆=推得) 根据条件,1
2
x x '∆=
∆,则4450200n n '==⨯=(人) (或直接代公式:2222
2
22102002.8282x t n σ⨯=
=≈∆⎛⎫ ⎪⎝⎭

2.某企业生产一种新的电子元件,用简单随机重复抽样方法抽取100只作耐用时间试验,测试结果,平均寿命6000小时,标准差300小时,试在95.45%的概率保证程度下,估计这种新电子元件的平均寿命区间。

假定概率保证程度提高到99。

73%,允许误差缩小一半,试问应抽取多少只灯泡进行测试? 解:⑴ 6000x = 300σ= 100n =
30x μ===(小时)
()95.45%F t = ∴2t =
23060x x t μ∆=⋅=⨯=(小时)
x x x X x -∆≤≤+∆
600060600060X -≤≤+
59406060X ≤≤
∴在95.45%的概率保证程度下,估计这种新电子元件的平均寿命区间在5940~6060小时之间
⑵ 1
60302
x ∆=
⨯= ()99.73%F t = 3t =
∴2222
22
330030030
x t n σ⨯===∆
3.采用简单重复抽样的方法,抽取一批产品中的200件作为样本,其中合格品为195件。

要求:⑴ 计算样本的抽样平均误差;
⑵ 以95.45%的概率保证程度对该产品的合格率进行区间估计。

(作业20P 4)
解: 200n = 1195n = ()99.45%F t = 2t = ⑴ 样本合格率119597.5%200
n p n =
== 抽样平均误差
1.10%p μ=
== ⑵ 抽样极限误差2 1.10% 2.20%p p t μ∆=⋅=⨯= 总体合格品率:p p p P p -∆≤≤+∆
97.5% 2.2%97.5% 2.2%P -≤≤+
95.3%99.7%P ≤≤
∴以95。

45%的概率保证程度估计该产品的合格率进行区间在95。

3%~99。

7%之间
五、 相关分析和回归分析ﻩ
相关分析公式 1.相关系数
[][
]
∑∑∑∑∑∑∑---=
2
2
2
2
)
()(y y n x x
n y
x xy n γ
2。

配合回归方程 y=a+bx
∑∑∑∑∑--=
2
2
)
(x x n y x xy n b
x b y a -=
3。

估计标准误:
2
2
---=
∑∑∑n xy b y a y
s y
1.根据某地区历年人均收入(元)与商品销售额(万元)资料计算的有关数据如下: 9n =
546x =∑ 260y =∑ 2
34362x
=∑
16918xy =∑
计算:⑴ 建立以商品销售额为因变量的直线回归方程,并解释回归系数的含义。

⑵ 若2002年人均收入14000元,试推算该年商品销售额。

(作业21P 6)
解:⑴ ()
2
2
2916918546260
0.925934362546
n xy x y b n x x -⨯-⨯=
=
=⨯--∑∑∑∑∑ 260546
0.92527.2399
a y bx =-=
-⨯=- 27.230.925c y a bx x =+=-+
回归系数b 的含义:人均收入每增加1元,商品销售额平均增加0.925万元。

⑵ x = 14000元, 27.230.9251400012922.77c y =-+⨯=(万元)
2.根据5位同学西方经济学的学习时间(x )与成绩(y )计算出如下资料:
5n =
40x =∑
310y =∑ 2
370x
=∑
2
20700y
=∑
2740xy =∑
要求:⑴ 计算学习时间与学习成绩之间的相关系数,并说明相关的密切程度和方向.
⑵ 编制以学习时间为自变量的直线回归方程。

(要求计算结果保留2位小数) 解:⑴
0.96n xy x y
r -=
=
=
由计算结果可得,学习时间与学习成绩呈高度正相关。

⑵ ()
2
2
25274040310
5.20537040n xy x y b n x x -⨯-⨯=
=
=⨯--∑∑∑∑∑
31040
5.2020.40
55
20.40 5.20c a y bx y a bx x
=-=
-⨯==+=+ 3.根据某企业产品销售额(万元)和销售利润率(%)资料计算出如下数据: 7n = 1890x =∑ 31.1y =∑
2
535500x
=∑ 2174.15y =∑ 9318xy =∑
要求:⑴ 计算销售额与销售利润率之间的相关系数,并说明相关的密切程度和方向。

⑵ 确定以利润率为因变量的直线回归方程。

⑶ 解释式中回归系数的经济含义.
⑷ 当销售额为500万元时,利润率为多少? 解:⑴
0.967n xy x y
r -=
=
=
由计算结果可得,销售额与销售利润率呈高度正相关.
⑵ ()
2
2
279318189031.1
0.036575355001890
n xy x y b n x x -⨯-⨯=
=
=⨯--∑∑∑∑∑ 31.11890
0.0365 5.41
77
5.410.0365c a y bx y a bx x
=-=
-⨯=-=+=-+ ⑶ 回归系数b 的经济含义:销售额每增加1万元,销售利润率平均增加0.0365%.
⑷ x = 500万元, 5.410.036550012.84%c y =-+⨯=
⑵ 确定以利润额为因变量的直线回归方程,说明回归系数的经济含义。

⑶ 当产品销售额为500万元时,销售利润为多少?(结果保留三位小数) 解:0.986n xy x y
r -=
=
=
由计算结果可得,销售额与销售利润呈高度正相关。

⑵ ()
2
2
251727803510213.5
0.083527403003510n xy x y b n x x -⨯-⨯=
=
=⨯--∑∑∑∑∑
213.53510
0.08315.566
55
15.5660.083c a y bx y a bx x
=-=
-⨯=-=+=-+ ⑶ 回归系数b的经济含义:销售额每增加1万元,销售利润平均增加0.083万元。

⑷ x = 500万元,15.5660.08350025.934c y =-+⨯=(万元)
五、指数分析计算
指数分析公式
一、综合指数的计算与分析
(1)数量指标指数
01p
q p q ∑∑
此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。


1
p q ∑ -00
p q
∑)
此差额说明由于数量指标的变动对价值量指标影响的绝对额。

(2)质量指标指数
∑∑0
1
11p
q p q
此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。


1
1
p q ∑-0
1
p q ∑)
此差额说明由于质量指标的变动对价值量指标影响的绝对额。

加权算术平均数指数=
∑∑0
00
0p
q p kq
加权调和平均数指数=
∑∑1
1
11
1p
q k p q
(3)复杂现象总体总量指标变动的因素分析
相对数变动分析:
11p
q p q ∑∑=ﻩ
01p
q p q ∑∑×
∑∑0
1
11p
q p q ﻩ
绝对值变动分析:
1
1
p q ∑-00
p q
∑= (01p q ∑ -00p q ∑)×(11p q ∑—01p q ∑)
1
(%)q k
110 120 99
试计算总成本指数、产量总指数及单位成本总指数。

分析:总成本指数等于两个时期实际总成本的比率.
产量总指标是数量指标指数,知道两个时期的总值指标和数量指标个体指数,计算数量 指标指数应用算术平均数指数公式。

而=⨯总成本产量单位成本,因此,=÷单位成本指数总成本指数产量指数。

解:总成本指数11
604512117
130%50301090
q p q p
++=
=
==++∑∑
产量总指数00
50110%30120%1099%100.9
112.11%50301090
kq p q p
⨯+⨯+⨯=
=
==++∑∑
=÷单位成本指数总成本指数产量指数130%112.11%115.96%=÷=
2
(%)p k
102 105 100
试求价格总指数、销售额总指数和销售量总指数。

分析:价格总指标是质量指标指数,知道两个时期的总值指标和质量指标个体指数,计算质量
指标指数应用调和平均数指数公式。

销售额总指数等于两个时期实际销售额的比率。

而=⨯销售额单位价格销售量,因此,=÷销售量指数销售额指数价格指数。

解:价格总指数11
11
111322
101.86%1111322
102%105%100%p q p q
k ++=
=
=++
∑∑
销售额总指数11
00
111322
102.22%101520
p q p q
++=
=
=++∑∑
=÷销售量总指数销售额总指数价格总指数102.22%101.86%100.35%=÷=
11p q
01p q
00q p
4200 3600 3000 3520 3200 4000 3750
3450 3450

11470
10250
10450
求:⑴ 价格总指数,以及由于价格变动对销售额的绝对影响额;
⑵ 销售量总指数,以及由于销售量变动对销售额的绝对影响额; ⑶ 销售额总指数,以及销售额实际变动额.
分析:已知数量指标和质量指标在两个时期具体的指标值,用综合指数公式计算。

解:价格总指数1101
11470
111.90%10250
p q p q
=
=
=∑∑ 由于价格变动对销售额的绝对影响额110111470102501220p q p q =-=-=∑∑(元) 销售量总指数100
10250
98.09%10450
q p q p
=
=
=∑∑
由于销售量变动对销售额的绝对影响额10001025010450200q p q p =-=-=-∑∑(元) 销售额总指数11
00
11470
109.76%10450
p q p q
=
=
=∑∑ 销售额实际变动额110011470104501020p q p q =-=-=∑∑(元) 六、动态数列分析的计算
一、平均发展水平的计算方法: (1)由总量指标动态数列计算序时平均数
①由时期数列计算ﻩ n
a a ∑=
②由时点数列计算
在间断时点数列的条件下计算:
a.若间断的间隔相等,则采用“首末折半法"计算。

公式为:
1
212
11
21-++++=-n a a a a a n n b 。

若间断的间隔不等,则应以间隔数为权数进行加权平均计算。

公式为:
∑--++++++=f
f a a f a a f a a a n n n 1
123212
1222
(2)由相对指标或平均指标动态数列计算序时平均数 基本公式为:b
a c =
式中:c 代表相对指标或平均指标动态数列的序时平均数;
a 代表分子数列的序时平均数;
b 代表分母数列的序时平均数;
逐期增长量之和 ﻩ 累积增长量
二。

平均增长量=─────────=───────── 逐期增长量的个数 逐期增长量的个数
(1)计算平均发展速度的公式为:n x x ∏= (2)平均增长速度的计算
平均增长速度=平均发展速度-1(100%)
(一)时点数列序时平均数的计算
1
又知1月1日商品库存额为63万元。

试计算上半年、下半年和全年的月平均商品库存额。

分析:月末商品库存额为时点指标,因此该数列为时点数列,且以月为间隔,上半年间隔相等,用首末折半法计算序时平均数;
下半年间隔不等,用通式计算。

解: 上半年:0111
16350
6055484340222250.426
n n a a a a a n -++++++++++
=
==(万元)
下半年:12231121
2
22n n
n b b b b
b b f f f b f
--+++++
+
=∑
504545606068
23122252.756
+++⨯+⨯+⨯==(万元
)
全年:50.4252.75
51.5822
a b c ++===(万元)
2.某工厂某年职工人数资料如下:
试计算该厂该年的月平均人数。

分析:总人数为时点指标,因此该数列为时点数列,且以月为间隔,间隔不相等,用通式计算。

解: 12231121
2
22n
n
n a a a a
a a f f f a f
--+++++
+
=∑
354387387339339362362383383360
134222222212
+++++⨯+⨯+⨯+⨯+⨯=
计算:该市2000年平均人口数。

解:1
21124136
129
1331342222131.51
51
n n a a a a a n -++++++++
=
==--(万人)
4.我国人口自然增长情况如下:
单位:万人
试计算我国在“十五”时期年平均人口和年平均增加的人口数量。

分析:人口数是间断登记资料且间隔相等的时点数列。

登记资料的时点在各年底,将2000年底的人口数视为2001年初的
人口数。

用首末折半法计算。

而人口增加数是时期数列,所以直接平均即可.
年平均人口数 1
21221
n n a a a a a n -++++=
-126743130756
1276271284531292271299886221
+++++
=-
年平均增加的人口数 8848267747617685
a a n
++++==∑
(二)平均指标动态数列序时平均数的计算
1.某工业企业资料如下: (作业29P 4)
⑵ 第一季度平均劳动生产率。

分析:数据资料由两个具有相互联系的总量指标动态数列构成。

计算平均劳动生产率,即算平均指标动态数列的序时平均数.
同样,先算出两个动态数列各自的序时平均数,再加以对比。

其中,产值动态数列为时期数列,计算序时平均数用算术平均数公式;而工人数动态数列为时点数列,以月为间隔,间隔相等,计算序时平均数用首末折半法。

解:⑴ 月平均产值
月平均劳动生产率=
月平均工人数
121180160200
30.36006005806202222
31
n n a
a n c
b b b b b n -++====++++++
-∑(万元/人)
⑵ =
第一季度总产值
第一季度平均劳动生产率第一季度工人数
180160200
0.960060058062022
3
a c
b ++===+++∑(万元/人)
或0.330.9c =⨯=(万元/人) (⨯一季度平均劳动生产率=3倍月平均劳动生产率)
2.
计算:⑴第二季度月平均商品流转次数。

⑵第二季度商品流转次数。

(提示:=÷商品流转次数商品销售额商品库存额)
分析:如上题,数据资料由两个具有互相联系的总量指标动态数列构成,先分别计算两个动态数列各自的序时平均数,再加以
对比。

其中,销售额数列为时期数列,库存额数列为时点数列。

解:=
月平均销售额
月平均流转次数月平均库存额
121200240276
3 4.475 4.5457555452222
31
n n a
a n c
b b b b b n -++====≈++++++
-∑次
第二季度商品流转额次数= 4.5×3 = 13.5次 (三)速度指标的计算
要求:(1)试计算各年的环比发展速度(%)、逐期增长量及年平均增长量。

(2)如果从2004年起该地区的粮食生产以10%的增长速度发展,预计到2010年该地区的粮食产量将达到什么水平? 解:(1)计算结果如下表:
平均增长量461
5184
10=-=--=
n a a n (万斤) (2) ()60618(110%)1094.82n
n a a x =⋅=⨯+=(万斤)。

相关文档
最新文档