统计学重要公式考试必备
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.样本平均数:X
2.总体平均数:
3. 四分位差:Q D
4. 方差:
n
X
N IQR
(1总体方差:
(2) 样本方差:S2
7.标准分数分数
8.样本协方差Cov
9.皮尔逊相关系数
XX
XY
YY Y i
10. 加权平均数
11. 分组数据样本平均数
12. 分组数据样本方差
13. 排列组合公式
n !
C m
n m !
2 P
m
厂n m !
C m
n C n m n
统计学重要公式
5.标准差:
(1总体标准差:
X i
~N
2
X i n 1
X ,丫
r XY
Y i
Y i
(2)样本标准差:
6•变异系数
总体:CV
样本:CV
X i X
"S-
S XY
S XY
X
Y i2
2
S S2
100%
100%
标准差一100%
平均数
L XY
L XX L YY
2
X i
X i Y i
I I
1
n 2
Y i
1
n
n
Y i
i 1
14.事件补的概率 P(A) 1 P(A)
15.加法公式 P(A B) P(A) P(B)-P(A
B) 16.条件概率 P(A|B)
P(
A (B)
B)
,
P(A B)
P(B)
P(A) 17.乘法公式 P(A B) P(B) P(A|B) P(A) P(B|A)
18.独立事件 P(A B)
P(A)P(B)
19.全概率公式
P(B
)
n
P(A i ) P(B|A i )
i 1
20•贝叶斯公式P(A i |B)
P(
A
)P(B|
A i ).啥小叫)
P(B)
P(A j ) P(B|A j )
j i
33总体均值的区间估计
21. 离散型随机变量的数学期望 E(X)
22. 离散型随机变量的方差 Var(X) 2
23. 二项分布的概率函数 p(x) C ;p x
q
24.
二项分布的数学期望和方差 E (X )
x
x
e e x!
x!
x n x
C C 25.泊松分布p(x) 27.超几何分布p(x)
,x xp(x) 2
x p(x)
0,1,2,..., n,q 1 p np,Var(X) 2
n p(1 p)
28.正态概率密度函数 29.标准正态分布变换 X 2
f (x) ^2— e
2 2
Z
x
30. X 的数学期望和标准差
32估计 时的抽样误差:X E(X)
有限总体时
(1大样本且方差已知:X 无限总体时
X
n
31比例P 的数学期望和标准差 E(p)
⑵大样本且方差未知:X
Z
2 —,
' n
Z 2 S
, ■■ n
p,
有限总体时
无限总体时 P
p(1 p) n
(3)总体正态,小样本,方差已知X Z 2
n S
(4)总体正态,小样本,方差未知X t 2 S
Z 2
2
34估计 时所需的样本容量:n 一岂一
X
N n N 1
1
(3)小样本,正态
X 1
X 2
t
2S
X 1 X 2
35.总体比率 P 的区间估计 36. p 的区间估计时所需的样本容量 n
n
Z22 P 2
1
P)
37.大样本总体均值的检验统计量
方差已知:Z X ,
/ jn
方差未知:Z X - s/ vn
38.小样本总体均值的检验统计量 39.总体比率检验统计量
:Z
X :t , df n 1
S M/n
P 0
P o (1 P o )
40. 总体均值的单侧检验中所需样本容量
2
Z Z
n ------------------------------------- 2
0 1
41. 独立样本时 ,两个总体均值之差的点估计量
X 1
X 2的期望值与标准差
:
2
-,用Z 2代替Z 即为双侧检验的公式
:X 1 X 2
E(X 1 X 2)
1
2,
2
2
1
2
n ?
42.两个总体均值之差的区间估计: (1)大样本(n 1, n , 30), 1, 2已知
X
1
X
2
厶 2
Z
2 X 1 X 2
X X 的点估计量为
:S X
X i X 2
X i
(2)大样本,
XT X 2
1
, 2未知 X 1
43. 两个总体均值之差的假设检验统计量
Sd /J n
44. 两个比率之差的点估计量
P 2的期望值与标准差 P i
45. 两个总体比率之差的区间估计 :
大样本 n i P i , n i (i P i ),门
2
卩2, ^(i P 2)
P
2 Z S P i P 2
2
(2)小样本t (1)大样本 Z S p
i
n i
i n 2
46. 两个总体比率之差的检验统计量 P 2 P i
P 2
总体比率合并估计 :P
n i P i n 2 n
〔 n 2
P i
P 2时P i P 2的点估计量:S P i P 2
P(i P)丄丄
n 〔 n 2
(3)相关样本
2
p i
p
2
P i (i P i ) P 2(i P 2)
n i
P 2(i P 2)
n ?
(1
i
)
p P 的点估计量 :S
p i p 2
2
(i P 2)
门 2
n 1 S 2
47. 一个总体方差的区间估计 n 1 S 2
------- 2
(1 / 2)
48. 一个总体方差的检验统计量
49. 两个总体方差的检验统计量 50. 拟合优度检验统计量 s ; s ;
2
ei
——,df
e i
51. 独立假设条件下列联表的期望频数 第i 行之和 RT i CT j n 独立性检验统计量 e
ij
第j 列之和 样本容量 ij e ij
2
e
j ,df
52.检验 K 个均值的相等性 第j 个处理的样本均值 n j
X •• ij
i 1
n j
n j
第j 个处理的样本方差 X ij
i 1
X ij
总样本均值 处理均方 :MSTR
n t 1 SSTR_
1
处理平方和 :SSTR
误差均方 :MSE
j
SSE
误差平方和 :SSE
X t )2
k 个均值相等检 总平方和 :SST
验统计量
MSTR MSE
ij
平方和分解 多重比较方法 :SST
i 1
SSTR
SSE
Fisher LSD 的检验统计量 :t
MSE
54.随机化区组设计
求平方和的另一种方法
55.析因试验:
a b r
总平方和 :SST
i 1 j 1 k 1
a
因子A 平方和:SSA br
i 1 b 因子B 平方和:SSB ar
j 1
交互作用平方和
:SSAB
误差平方和 :SSE SST
57.
简
单线性回归模型
:y °
1
X
简单线性回归方程
:E
y °
1 x
估计的简单线性回归方程
:2 b °
b 1 x
最小二乘法
:min y i
2i 2
总平方和 :SS t
2 ij
X ij ak
,df t ak
1,
处理平方和 :SS b
2
X ij 区组平方和 :SS r 误差平方和
:SS e
a
2 X
ij
k
SS t SS b SS r , df e
X ij
ak
2
X
ij
ak
k 1
,df b ,df r
k 1,
a 1,
总平方和 :SS t
____ 2
X ; ,df t
n t 1,
处理平方和
区组平方和 误差平方和
SS b a
j 1 X .j X t ,df b k
1,
SS r a
k i 1
X i.
X t
2
,df r
a 1, SS e SS t
SS b SS r , df e
k
1 a 1
X jk
X t
,df t
n t
1
——2
X i. X t
,df A
a 1,
2
X .j
X t
,df B
b 1,
a
b
2
r
X ij X i.
X . j
X t
,df AB
a 1
b 1 i 1
j 1
SSA SSB
SSAB, df e abr ab
ab(r 1)
b 1
j 1 i 2
1
k
___ 2
估计的回归方程的斜率和截距
:
x i y i
X i y i -------------------------------------------
n
2
2X i
X -------------------------------------
n
b°y b1 x
平方和分解:SST SSR SSE 误差平方和:SSE
总平方和:SST y i
回归平方和:SSR
y i
X i Y i
Y i
X i2
判定系数(决定系数):R2
样本相关系数:r xy
均方误差(2的估计量
估计量的标准误差
X2
^的估计的标准差:S b i
2
y i
b2
SSR
SST
2
y i
X i2
t统计量:t 2
回归均方:MSR F检验统计量:F 。
的估计的标准差
、判定系数
:S
M的符
号
SSR
2
X i
X i2
2
X i
自变量的个数
MSR
MSE
SSR SSR
1
:s y°S
—2
X o X
X i2
2
X i
E(y0)的置信区间估计0 t /2 s
y°
一个个别值估计的标准差:S y。
y o
—2
X o X
X i2
2
X i
y0的预测区间估计0 t /2 S y o y o
58. 多元线性回归模型
统计学原理复习(计算题)
1.某单位40名职工业务考核成绩分别为
68 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 8
1
单位规定:60分以下为不及格,60— 70分为及格,70—80分为中,80— 90 分为良,90-100分为优。
要求:
(1) 将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并 编制一张考核成绩次数分配表;
(2) 指出分组标志及类型及采用的分组方法; (3) 计算本单位职工业务考核平均成绩 (4)分析本单位职工业务考核情况。
解:(1)
成 绩
职工人数 频率(%)
60分以下
3 7.5 60-70
6
15 70-80
15
37.5 80-90
12 30 90-100
4
10
多兀回归方程 :y 估计的多元回归方程 最小二乘法 :min SST, SSR, SSE 之间的关系 SSR SST
多元决定系数 :R 2 修正的多元决定系数 回归均方 :MSR 误差均方:MSE F 检验统计量:F t 检
验统计量 :t
y i 1X 1 :SST :Ra 1 SSR P SSE n p 1 MSR
MSE
b i
2X 2 i X i SSR R 2 p
X p
2X 2
SSE
p
X p
40 100
(2)分组标志为"成绩",其类型为"数量标志”;分组方法为:变量分组中的开放组距式分组,组限表示方法是重叠组限;
(3)本单位职工业务考核平均成绩
(4)本单位的职工考核成绩的分布呈两头小,中间大的”正态分布"的形态,说明大多数职工对业务知识的掌握达到了该单位的要求。
2. 2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下:
试问哪一个市场农产品的平均价格较高?并说明原因。
解:
解:先分别计算两个市场的平均价格如下:
甲市场平均价格X
m 5.5
------- —— 1.375 (兀/斤)m/ x 4
乙市场平均价格X xf 5.3
——— 1.325 (兀/斤)f 4
说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场平均
价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同。
3•某车间有甲、乙两个生产组,甲组平均每个工人的日产量为36 件,
标准差为9.6件;乙组工人日产量资料如下:
日产量(件)
工人数(人)
15 15 25 38 35
34 45
13
要求:⑴计算乙组平均每个工人的日产量和标准差;
⑵比较甲、乙两生产小组哪个组的日产量更有代表性?
解: ( 1)
- xf 15 15 25 38 35 34 45 13 “ n
X ---------- ---------------------------------------------- 29.50 (件)
f 100
(x X)2
f
8.986 (件)
(2) 利用标准差系数进行判断:
96
0.267 36 8
・986 0.305
29.5
因为 0.305 >0.267
故甲组工人的平均日产量更有代表性。
4.某工厂有1500个工人,用简单随机重复抽样的方法抽出
50个工人作为样本,
平,得每人平均产量 560件,标准差32.45
要求:(1)计算抽样平均误差(重复与不重复);
(2)以95%的概率(z=1.9⑤估计该厂工人的月平均产量的区间; (3 )以同样的概率估计该厂工人总产量的区间。
解: (1)
调查其月平均产量水
重复抽样:
月平均产量的区间:
下限:x
△ X =560-9=551 件
不重复抽样:
(2)抽样极限误差
5•采用简单随机重复抽样的方法,在 2000件产品中抽查200件,其中合格品190件.
要求:(1)计算合格品率及其抽样平均误差
(2) 以95.45%的概率保证程度(z=2)对合格品率和合格品数量进行区间估计。
(3) 如果极限误差为 2.31%,则其概率保证程度是多少?
解:(1)样本合格率
p = n 1/n = 190 / 200 = 95%
抽样平均误差p
、 P (1
_P )= 1.54%
n
(2)抽样极限误差△ p =z M = 2 X 1.54% = 3.08%
下限:X △ p=95%-3.08% = 91.92%
上限:X △ p=95%+3.08% = 98.08% 贝U:总体合格品率区间:
(91.92% 98.08% )
总体合格品数量区间(91.92%X 2000=1838 件 98.08% X 2000=1962 件) (3) 当极限误差为2.31%
时,则概率保证程度为
86.64% (z= △/M
6.某企业上半年产品产量与单位成本资料如下:
要求:(1)计算相关系数,说明两个变量相关的密切程度。
(2) 配合回归方程,指出产量每增加 1000件时,单位成本平均变动多少?
(3)
假定产量为6000件时,单位成本为多少元?
解:计算相关系数时,两个变量都是随机变量, 不须区分自变量和因变量。
考虑到要配和合回归方程, 所以这里设产量为自变量(x ),单位成本为因变量(y )
上限:X △ x =560+9=569 件
(3)总产量的区间:(551 X 1500 826500 件;569 X 1500 853500 件)
(1)
n xy x y
i1 2 2 2 ~
.n x ( x) n y ( y)
6 1481 21 426
-----------------------------------------
0.9091 ....6 79 21 6 30268 426
0.9091说明产量和单位成本之间存在高度负相关。
(2)配合回归方程y = a + bx
n xy x y
b --------------------------------- 2=-1.82
2 2
n x ( x)
a y bx =77.37
回归方程为:y = 77 .37—1 .8 2 x
产量每增加1000件时,单位成本平均减少1 . 8 2元
(3)当产量为6 0 0 0件时,即x = 6,代入回归方程:
y = 7 7 .3 7 —1 .8 2 X 6 = 6 6 .4 5 (元)
7 •根据企业产品销售额(万元)和销售利润率(%)资料计算岀如下数据:
n=7 x=1890 y =31.1 x2=535500 y 2=174.15 xy =9318 要求:(1) 确定以利润率为因变量的直线回归方程.
(2) 解释式中回归系数的经济含义.
(3) 当销售额为500万元时,利润率为多少?
解:(1)配合直线回归方程:y = a + bx
xy 1
x y 9318
1
1890 31.1
n ____ - ______ 7 _________ b= n = 7
535500 1
7 18902
=0.0365
2 x 1 2
—x n
1 1 1 1
a= y bx y b_ x =—31.1 0.0365 —1890 =-5.41
n n 7 7
则回归直线方程为:y c=-5.41+0.0365x
(2) 回归系数b的经济意义:当销售额每增加一万元,销售利润率增加0.0365% (3) 计算预测值:
当 x=500 万元时 y c =-5.41+0.0365
500=12.8%
& 某商店两种商品的销售资料如下:
要求:(1)计算两种商品销售额指数及销售额变动的绝对额;
(2)
计算两种商品销售量总指数及由于销售量变动影响销售额的绝对额; (3) 计算两种商品销售价格总指数及由于价格变动影响销售额的绝对额。
9 •某商店两种商品的销售额和销售价格的变化情况如下:
要求:(1)计算两种商品销售价格总指数和由于价格变动对销售额的影响绝对额。
(2) 计算销售量总指数,计算由于销售量变动,消费者增加(减少)的支
出金额。
Pg 130 36 166
X X n 4 0 0/
解:(1)商品销售价格总指数=
110.43
1 ,P21 130
36
150.33
k
1.1 1.12
由于价格变动对销售额的影响绝对额:
1
pg
Pg 1 166 150.32 15.67万元
k
(2))计算销售量总指数
解:(1)商品销售额指数
销售额变动的绝对额:
PM 10 60 14 160 2840 129.09
%
P °q °
8 50 12 150 2200 P21
p q
元
(2)两种商品销售量总指数
8 60 12 160
2400 p 0q 0
2200
2200
销售量变动影响销售额的绝对额
p q 1
p q
(3)商品销售价格总指数
p q 1 p q
价格变动影响销售额的绝对额:
p q 1
解: (1)
年 份
1995 年 1996 年 1997 年 1998 年 1999 年
.某地区年平均人口数为万人,年人口变动情况如下:
月份 1 3 6 9 次年1月
月初人数
102
185
190
192
184
计算:(1) 1995年平均人口数
(2) 1984-1995年该地区人口的平均增长速度
=181.38 万人
(2) 1984-1995年该地区人口的平均增长速度:
年份
1995 年 1996 年 1997 年 1998 年 1999 年 粮食产量(万斤)
434
472
516
584
618
1
(2)计算1995年-1999年该地区粮食产量的年平均增长量和粮食产量
的年平均发展速度;
(3)如果从1999年以后该地区的粮食产量按 8%的增长速度发展,
2005年该地区的粮食产量将达到什么水平?
商品销售价格总指数
P4 1
—P 1
q
1
k
PA 1 —Pg
口
P i q i P °q i
而从资料和前面的计算中得知:
所以:商品销售量总指数
P o q i
P°q 。
由于销售量变动,消费者增加减少的支岀金额
P o
p °q °
160 150.33
93.35%
,
160
P 0q 1 150.32
P 1q 1 -
P 0 q 1
150.33 160
9.67
解:(1) 1995年平均人口数 a
a 1 a 2 £
a 2
a 3 £
a n 1
a n
f
f 1
f 2
2
2
2
X 帕0片150
181
・
38
1 1.74%
n 1。