统计学各章计算题公式及解题方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x
= ———- — = =
8.
6. 一组的累积频数
四分位数位置的确定:
下四分位数:Q A =苇一 上I 甲分位数:% = 3
山:
1)
未分组数据:
;组距分组数据:
7. 简单均值:
JI
r + r ■+ + [
_ r 〒叫T …T f : L x = -------------
n
y Mf.,
_晒斤+叫&—+出血自叭'r i
加权均值: 各组组中值
,其中,
统计学各章计算题公式及解题方法
第四章数据的概括性度量
组距式数值型数据众数的计算:确定众数组后代入公式计算: 单变量数列的中位数:先计算各组的累积次数(或累积频率)一根据位置公式确定中位 数所在的组一对照累积次数(或累积频率)确定中位数(该公式假定中位数组的频数在 该组内均匀分布) 组距式数列的中位数计算公式:
位数所在组的频数, 1. 下限公式:
;上限公式:
,其中,L 为众数所
在组下限,U 为众数所在组上限,
卜I 为众数所在组次数与前一组次数之差,
阪为众数所
在组次数与后一组次数之差, d 为众数所在组组距 2. 中位数位置的确定:未分组数据为
n+ 1
~T~ ;组距分组数据为
3. 未分组数据中位数计算公式:
4.
5.
下限公式: n 2 -几-1 二匕 ------ ---- X d
* m n
2+^i+l
= U -
;上限公式:
,其中,
为中
,门为偶数
几何均值(用于计算平均发展速度) 四分位差(用于衡量中位数的代表性)
异众比率(用于衡量众数的代表性)
离散系数:叫-丘
第七章参数估计
的估计值:
置信水平
9. 10.
11.
12. 13. 14. 15.
16.
17. 18.
19.
1.
2 (策一三)£
z i=l
2 f = 1 样本方差:未分组数据:
斥-1
;分组数据:
S
A
n -1
n - 1
总体标准差:未分组数据:
90% 0.1 0.05 1.654 95%
0.05
0.025
1.96
极差:未分组数据:
' -
;组距分组数据:
R =最高组上限
-Kttfi 下限 平均差(离散程度)
= ---------------
:未分组数据:“
“
k
Y 网
Tt ; .0= 1
M J = --------------------
d
n
£ (叼-M
F 一2 _ ' = 1
£ (叫-心 z 上=】
N
;分组数据:
a
-
N
\
i = 1
a =
N
;分组数据:
4
N
样本标准差:未分组数据:
: '
;组距分组数据:
总体方差:未分组数据:
;分组数据:
99% 0.01 0.005 2.58
其中,】查,查找时需查的数值
bfl -p)
3. 大样本总体比例的区间估计:
(n - 1}s22(n- 1)s2
4. 总体方差■在--置信水平下的置信区间为:
5. 估计总体均值的样本量:■' ,其中,E为估计误差
(勺-刃
口=-------- ---------
6. 重复抽样或无限总体抽样条件下的样本量:,其中n为总体比例
第八章假设检验
1. 总体均值的检验(已知或未知的大样本)[总体服从正态分布,不服从正态分布的
用正态分布近似
总体均值检验(未知,小样本,总体正态分布)
假设双侧检验左侧检验右侧检验假设形式
心p>p u%:咗弘
g p<p u"i:。
已知
X 序=—
统计量。
未知
拒绝域It] > - 1)t <- t£r(n - 1)t > tjn - 1J
1’值决策Pco|,拒绝
3. 一个总体比例的检验(两类结果,总体服从二项分布,可用正态分布近似)
假设的总体比例)
(其中卜』为
假设假设形式
双侧检验
|^o: K= n
//]: MH n
左侧检验
//]:n< n0
右侧检验
jr u "i:心讪
统计量
拒绝域
拒绝
01 0.1 0.05 0.01 双侧检验
± 1.65
士 1.96
± 2.58 单侧检验
± 1.28
+ 2.65
± 2.33
1.期望频数的分布(假定行变量和列变量是独立的)
一个实际频数 5的期望频数 %,是总频数的个数n 乘以该实际频数 5落入第(行和第
2.
统计量(用于检验列联表中变量间拟合优度和独立性;用于测定两个分类变量之间的
实际频数,%为列联表中第i 行 第j 列的期望频数
1)
检验多个比例是否相等 检验的步骤 提出假设Hb : i =
2
=…=j ; H :
i
,
2
,…,j 不全相等;计算检验
2
的统计量;进行决策:根据显著性水平
和自由度(r-l)( c-1)查出临界值 ,若
2 2
2
> ,拒绝H o ;若2< ,不拒绝 H
2)
利用样本数据检验总体比例是否等于某个数值 检验的步骤
提出假设H o : i = , 2 =,•••; H :原假设的等式中至少有一个不成立;计算检 验的统计量;进行决:根据显著性水平
和自由度(r-1)( c-1)查出临界值
2
;若
2 2
2
> ,拒绝H o ;若2< ,不拒绝 H
3)
检验列联表中的行变量与列变量之间是否独立 检验的步骤
提出假设H 0:行变量与列变量独立;
H :行变量与列变量不独立;计算检验的统计
2 I 2|
量;进行决策:根据显著性水平
和自由度(r-1)( c-1)查出临界值山,若2兀』,拒
2
绝H o ;若2< -,不拒绝“
3. 相关系数:测度2 2列联表中数据相关程度;对于 2 2列联表, 系数的值在0〜1
之间
其中,n 为实际频数总个数,即样本容量
4. 列联相关系数(C 系数)用于测度大于 2 2列联表中数据的相关程度
相关程度
二二(f -eV
2 _ y 1 f J * - 2J e*. f - V - 1
9
自由度为(r - l)(c -1)
人;为列联表中第
i 行第j 列的
j 列的概率,即:
M +冲,其中,C的取值范围是0^C<1; C = 0表明列联表中的两个变量独立;C 的数值大小取决于列联表的行数和列数,并随行数和列数的增大而增大;根据不同行和列的列联表计算的列联系数不便于比较
5. V相关系数
v= I . ~
^nmin\{r- 1). U- 1)],其中,v的取值范围是0 < V< 1;V = 0表明列联表中的两个变量独立;
v=i表明列联表中的两个变量完全相关;不同行和列的列联表计算的
列联系数不便于比较;当列联表中有一维为2, min[(r-1),(c-1)]=1, 此时V=
第十章方差分析
1. 单因素方差分析的要点:
1)建立假设的表述方法:
坷:旳二血二…=以,自变量对因变量没有显著影响
心旳....... 斥不全相等,自变量对因变量有显著影响
2)决策:
i. 根据给定的显著性水平比在F分布
表中查找与第一自由度= 、第二自由
ii. 若F> ,则拒绝原假设丨弓,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响iii. 若,则不拒绝原假设n o,不能认为所检验的因素对观察值有显著影响
3)单因素方差分析表的结构:
方罢甘忻
S5 t平弓袍)KS (均
方】
F g)P-^Lu? (P佰》F ecit洁临雪即
1£-J
S5A
vu=—
常£1
差)ll-l MSA■卅]
旦丰r曲全袖池划值越并魁u k丸也去耿
屮■ 5 PTR勺t■姚
SSI=£SA+^E n-h亠
2. 方差分析中的多重比较(步骤):采用Fisher提出的最小显著差异方法,简写为LSD
1)提出假设:
"n;叭i:(第I个总体的均值等于第吻个总体的均值)
丿心;»严儿(第(个总体的均值不等于第个总体的均值)
2) 计算检验统计量:
In, n.
1)无交互作用的双因素方差分析表结构:
2)有交互作用的双因素方差分析表结构:
关系强度测量:变量间关系的强度用自变量平方和
(SSA )及残差平方和(SSE )占总平方和
3)
计算LSD
3.
4)
决策:
x -X 」>LSD 双因素方差分析:
,则拒绝叫;若匡
,则不拒绝
SS
df 白舖
彳了 JJr?
1
9J
£SC
r -1
段茎 (»
■
-;} x 0*・ 1 ■
沽计
5JT=空尸十£比t SS&
h-l
HS F
F cyit.
杵
F 道
XSR Fn=
—
轉出
摊岀
55C
■ 一 i
f-二 --
V5L
给出
F
P —walofi
F ciri i
rtt ________ r tt _____ 閘值
(IT)
SSC
內部氓
羞}
JJf
沏二航一储耽
—1
扎R =
UR.
F — "1
用兀二
r - 1
SSE
-----------
erf 啊-1)
'・
1?札册二
n -1
-
F
^~
MSC
给出
-V55
鑰出
4.
(SST )的比例大小来反映,根据
平方根R 进行判断
尺二SST (总咿方和)
第十一章 一元线性回归
1.
样本的相关系数:
刃
挖(乂-好送©-强
2.
相关系数的显著性检验步骤:
丽(对胁刚
1)提出假设:
n 0: p = o ; //]: P* 0
方差分
•;k 平
■訓
平方右 自由莓 均
方
H+>咖傑里申趙一•卜朮平 申
10. 线性关系的显著性检验:
1)提出假设:
,线性关系不显著;心卩1工°
,有线性关系
J_n-2
t = Irl i
~2 _
*t(n - 2)
2) 计算检验统计量:
J 17 r
Itl
Itl
3) 确定u 并决策: 乙拒绝心 ;
至,不拒绝"D
3. 一元回归模型:
「几十$广…
4.
一元线性回归方程形式:"—5 :爼人,其中.是直线方程在y 轴上的截距,是当’=0 时,y 的期望值; 是直线的斜率,称为回归系数,表示当 阀每变动一个单位时y 的平
均变动值
5. 一元线性回归中,估计的回归方程:卜: f %%其中•是估计的回归直线在 y 轴上的
截距,:是直线的斜率,它表示对于一个给定的 的值,是y 的估计值,表示当•每变
动一个单位时y 的平均变动值
6.
根据最小二乘法求 以及的公式:
SST (总平方和)-SSR 硒归平方和} +SSE 〔残差平方和) 判定系数(回归平方和占离差平方和的比例)
:
2 SSR i ■1 i h 1
R = ----- =
557'
i = 1
估计标准误差(实际观察值与回归估计值离差平方和的均方根
):
亠刃‘=
/ = 1
n~2
7.
误差平方和之间的关系:
n M ri
Y S -旁辽阳刃£十》(尤
-yf
1—1 ,即:
8. 9. ----- =
1 亿-刃
y 0 士匕/科-2)亏
1 + + n
爪
』一】
StmiRY OUTP-JT
回归统计
y
Multiple R R Square Ad jus ted R Square 初
准罠差 翊值
相关系数尺 和定系数尸 调壘的判
定丟数 n
df
SS MS F
iiarLiticaruce F 回归分析
1 SSK :3 -—
' -M5E
pf >用于决策
nr2
SSE =——-
TJ - 2
- — 总计
ri-l 331 — - —
Coeificients
怖盘误差
t Stat F-value
Lover 95將
Urpec 3SW
Tritercacrt
丈備i+疑
甬
截距射饌的歸信区间
11. 12. 13. 3) 确定显著性水平并根据分子自由度1和分母自由度n-2找出临界值尸优 4) 决策:若nF”,拒绝心;iyF“,不拒绝 回归系数的显著性检验:
1) 提出假设:",久=°,线性关系不显著; g Pi*°,有线性关系
n.
t --------- tin - 2)
2) 计算检验统计量:
氷
3) 确定显著性水平a 并决策:若M A %拒绝%;山5⑵不拒维儿
置信区间估计:;;—」在I
;置信水平下的置信区间:
JL
丸士尬仇- 2)亏1
n » 11
N 为估计标准误差,
预测区间估计: 在: 置信水平下的预测区间:
2) 计算检验统计量:
其中,
15. 几点说明:
1)判定系数测度了回归直线对观测数据的拟合程度,若所有观测点都落在直线上,残差平方和SSE=0 R「=1,拟合是完全的
2)在一元线性回归中,相关系数r实际上是判定系数丿’的平方根
3)相关系数r与回归系数是同号的
第十三章时间序列预测和分析
1. 环比增长率:报告期增长率与前一期水平之比减 1 :
q 二厂-1 (1=1. 2. A. II)
*i- 1
2. 定基增长率:报告期水平与某一固定时期水平之比减1
G t――(i = l+A, n)
5 ,其中,丫。
表示用于对比的固定基期的观察值
3. 平均增长率:序列中各逐期环比值(也称环比发展速度)的几何平均数减1后的结果(描
述现象在整个观察期内平均增长变化的程度)
fF Y Y~ ly-
--1,百衣朮平均增长率・II为环比值的个数r i r n-1 a
1)当时间序列中的观察值出现0或负数时,不宜计算增长率
2)在有些情况下,不宜单纯就增长率论增长率,要注意增长率与绝对水平的结合分析4. 时间序列预测的步骤:
1)确定时间序列所包含的成分,也就是确定时间序列的类型
2)找出适合此类时间序列的预测方法
3)对可能的预测方法进行评估,以确定最佳预测方案
4)利用最佳预测方案进行预测
5. 均方误差:通过平方消去正负号后计算的平均误差,用MSE表示
MSE=------------------- .兀中岭为观測值.林为预测值
n 1 B
6. 简单平均法:根据过去已有的t期观察值来预测下一期数值。
设时间序列已有的其观察
值为;贝『•一i.期的预测值伍M为:
f=l
有了1 +】的实际值,则预测误差为:e l n = Y tw r t^l
Y(★十]+岭it十2 +人+岭[+片
p—V ---------------------------------------------------------- -
,+ L 厂k
谋晨平力和
MSE = - —
预测误差用均方误差表示:谀签个妁
8. 指数平滑法(一次):以一段时期的预测值与观察值的线性组合作为t+1的预测值,其
预测模型为:
]=^+(1"^,其中口为平滑系数皿<。
<1),在开始计算时,没有第1个时期的预测值h,通常可以设儿等于1期的实际观察值,即F1 = Yl
9. 线性趋势预测:
A aA
1)一般形式:◎= «■ +叫岭为时间序列趋势值,E为时间标号,□为趋势线在Y轴上
的截距,为趋势线的斜率,表示时间M变动一个单位时观察值的平均变动数量
2)由最小二乘法求得:
3) 预测误差可用估计标准误差来衡量:
S Y~ E |
■\ n~m m为趋势方程中未知常数的个数
10. 指数曲线:用于描述以几何级数递增或递减的现象
A I
1) 一般形式:二—;,a、b为未知常数,若b>1,增长率随着时间t的增加而增加, 若b<1,增长率随着时间t的增
加而降低,若a>0,b<1,趋势值逐渐降低到以0为极限
2) 将一般形式转换为对数直线形式,由最小二乘法求得:
^tigr=lea^t+垠占y
3) 求出瓦及:’,取反对数
11. 修正指数曲线:描述初期增长迅速,随后增长率逐渐降低,最终则K为增长极限现象
1) 一般形式:,’一’,K a、b 为未知常数,K>0, 0, 0<b^ 1
2) 趋势值K无法事先确定时采用;将时间序列观察值等分为三个部分,每部分有m
个时期;令趋势值的三个局部总和分别等于原序列观察值的三个局部总和
设观察值的三个局部总和分别为:巧;% ^,
rrj
t =1;
2ui
t= nl + 1
3rn
1 = ■+ I
ii. 根据三和法求得:
、b —1
m—b(b tn -1)if賦泸r)i
12. Gompertz曲线:描述初期增长缓慢,以后逐渐加快,当达到一定程度后,增长率又逐渐下降,最后接近一条水平
线现象
3.
指数体系:式中 刃戸为报告期总量指标, \
为基期总量指标,q 为数量指标,p
* tl
1) 一般形式:丫严 Kd , K 、a 、b 为未知常数;K>0, 0<a ^ 1, 0<b ^ 1 2) 求解系数方法: i.
将其改写为对数形式:览沪产讯览Q )"
ii.
仿照修正指数曲线的常数确定方法,求出
卫乩,、b ;取:和診园的反对数
求得和:
1IH
£站
t ■ 2tti + 1
则有: 第十四章指数
1)拉氏数量指标指数(同度量因素固定在基期)
为质量指标
因素影响差额之间的关
1.
简单综合指数: (误差太大)
2.
加权综合指数: %
乙(数量指标)
2)帕氏质量指标指数(同度量因素固定在报告期) 刃1卩1 刃I %
令:
2FW
=I
t IFF t
5
2~51)
^a = (S 2-S^ b 1 ,
0 - 1) 血(b J 1)
一■期
质量指标);
刃円一 E W )=①欝珂-》詞+
- 2时o)
居民消费价格指数:
股票价格指数:
I
映亠込今II 市价总值
八加带数=顽丽丽50
一“
,式中:代表规格品个体指数或各层的类指数,
4. 5.。