统计学各章计算题公式及解题方法
![统计学各章计算题公式及解题方法](https://img.360docs.net/img9c/1i8fbbqwm4xmzczc0iv5a0xw1hf5bd1y-c1.webp)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x
= ———- — = =
8.
6. 一组的累积频数
四分位数位置的确定:
下四分位数:Q A =苇一 上I 甲分位数:% = 3
山:
1)
未分组数据:
;组距分组数据:
7. 简单均值:
JI
r + r ■+ + [
_ r 〒叫T …T f : L x = -------------
n
y Mf.,
_晒斤+叫&—+出血自叭'r i
加权均值: 各组组中值
,其中,
统计学各章计算题公式及解题方法
第四章数据的概括性度量
组距式数值型数据众数的计算:确定众数组后代入公式计算: 单变量数列的中位数:先计算各组的累积次数(或累积频率)一根据位置公式确定中位 数所在的组一对照累积次数(或累积频率)确定中位数(该公式假定中位数组的频数在 该组内均匀分布) 组距式数列的中位数计算公式:
位数所在组的频数, 1. 下限公式:
;上限公式:
,其中,L 为众数所
在组下限,U 为众数所在组上限,
卜I 为众数所在组次数与前一组次数之差,
阪为众数所
在组次数与后一组次数之差, d 为众数所在组组距 2. 中位数位置的确定:未分组数据为
n+ 1
~T~ ;组距分组数据为
3. 未分组数据中位数计算公式:
4.
5.
下限公式: n 2 -几-1 二匕 ------ ---- X d
* m n
2+^i+l
= U -
;上限公式:
,其中,
为中
,门为偶数
几何均值(用于计算平均发展速度) 四分位差(用于衡量中位数的代表性)
异众比率(用于衡量众数的代表性)
离散系数:叫-丘
第七章参数估计
的估计值:
置信水平
9. 10.
11.
12. 13. 14. 15.
16.
17. 18.
19.
1.
2 (策一三)£
z i=l
2 f = 1 样本方差:未分组数据:
斥-1
;分组数据:
S
A
n -1
n - 1
总体标准差:未分组数据:
90% 0.1 0.05 1.654 95%
0.05
0.025
1.96
极差:未分组数据:
' -
;组距分组数据:
R =最高组上限
-Kttfi 下限 平均差(离散程度)
= ---------------
:未分组数据:“
“
k
Y 网
Tt ; .0= 1
M J = --------------------
d
n
£ (叼-M
F 一2 _ ' = 1
£ (叫-心 z 上=】
N
;分组数据:
a
-
N
\
i = 1
a =
N
;分组数据:
4
N
样本标准差:未分组数据:
: '
;组距分组数据:
总体方差:未分组数据:
;分组数据:
99% 0.01 0.005 2.58
其中,】查,查找时需查的数值
bfl -p)
3. 大样本总体比例的区间估计:
(n - 1}s22(n- 1)s2
4. 总体方差■在--置信水平下的置信区间为:
5. 估计总体均值的样本量:■' ,其中,E为估计误差
(勺-刃
口=-------- ---------
6. 重复抽样或无限总体抽样条件下的样本量:,其中n为总体比例
第八章假设检验
1. 总体均值的检验(已知或未知的大样本)[总体服从正态分布,不服从正态分布的
用正态分布近似
总体均值检验(未知,小样本,总体正态分布)
假设双侧检验左侧检验右侧检验假设形式
心p>p u%:咗弘
g p
。已知
X 序=—
统计量
。未知
拒绝域It] > - 1)t <- t£r(n - 1)t > tjn - 1J
1’值决策Pco|,拒绝
3. 一个总体比例的检验(两类结果,总体服从二项分布,可用正态分布近似)
假设的总体比例)
(其中卜』为
假设假设形式
双侧检验
|^o: K= n
//]: MH n
左侧检验
//]:n< n0
右侧检验
jr u "i:心讪
统计量
拒绝域
拒绝
01 0.1 0.05 0.01 双侧检验
± 1.65
士 1.96
± 2.58 单侧检验
± 1.28
+ 2.65
± 2.33
1.期望频数的分布(假定行变量和列变量是独立的)
一个实际频数 5的期望频数 %,是总频数的个数n 乘以该实际频数 5落入第(行和第
2.
统计量(用于检验列联表中变量间拟合优度和独立性;用于测定两个分类变量之间的
实际频数,%为列联表中第i 行 第j 列的期望频数
1)
检验多个比例是否相等 检验的步骤 提出假设Hb : i =
2
=…=j ; H :
i
,
2
,…,j 不全相等;计算检验
2
的统计量;进行决策:根据显著性水平
和自由度(r-l)( c-1)查出临界值 ,若
2 2
2
> ,拒绝H o ;若2< ,不拒绝 H
2)
利用样本数据检验总体比例是否等于某个数值 检验的步骤
提出假设H o : i = , 2 =,???; H :原假设的等式中至少有一个不成立;计算检 验的统计量;进行决:根据显著性水平
和自由度(r-1)( c-1)查出临界值
2
;若
2 2
2
> ,拒绝H o ;若2< ,不拒绝 H
3)
检验列联表中的行变量与列变量之间是否独立 检验的步骤
提出假设H 0:行变量与列变量独立;
H :行变量与列变量不独立;计算检验的统计
2 I 2|
量;进行决策:根据显著性水平
和自由度(r-1)( c-1)查出临界值山,若2兀』,拒
2
绝H o ;若2< -,不拒绝“
3. 相关系数:测度2 2列联表中数据相关程度;对于 2 2列联表, 系数的值在0?1
之间
其中,n 为实际频数总个数,即样本容量
4. 列联相关系数(C 系数)用于测度大于 2 2列联表中数据的相关程度
相关程度
二二(f -eV
2 _ y 1 f J * - 2J e*. f - V - 1
9
自由度为(r - l)(c -1)
人;为列联表中第
i 行第j 列的
j 列的概率,即:
M +冲,其中,C的取值范围是0^C<1; C = 0表明列联表中的两个变量独立;C 的数值大小取决于列联表的行数和列数,并随行数和列数的增大而增大;根据不同行和列的列联表计算的列联系数不便于比较
5. V相关系数
v= I . ~
^nmin\{r- 1). U- 1)],其中,v的取值范围是0 < V< 1;V = 0表明列联表中的两个变量独立;
v=i表明列联表中的两个变量完全相关;不同行和列的列联表计算的
列联系数不便于比较;当列联表中有一维为2, min[(r-1),(c-1)]=1, 此时V=
第十章方差分析
1. 单因素方差分析的要点:
1)建立假设的表述方法:
坷:旳二血二…=以,自变量对因变量没有显著影响
心旳....... 斥不全相等,自变量对因变量有显著影响
2)决策:
i. 根据给定的显著性水平比在F分布
表中查找与第一自由度= 、第二自由
ii. 若F> ,则拒绝原假设丨弓,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响iii. 若,则不拒绝原假设n o,不能认为所检验的因素对观察值有显著影响
3)单因素方差分析表的结构:
方罢甘忻
S5 t平弓袍)KS (均
方】
F g)P-^Lu? (P佰》F ecit洁临雪即
1£-J
S5A
vu=—
常£1
差)ll-l MSA■卅]
旦丰r曲全袖池划值越并魁u k丸也去耿
屮■ 5 PTR勺t■姚
SSI=£SA+^E n-h亠
2. 方差分析中的多重比较(步骤):采用Fisher提出的最小显著差异方法,简写为LSD
1)提出假设:
"n;叭i:(第I个总体的均值等于第吻个总体的均值)
丿心;?严儿(第(个总体的均值不等于第个总体的均值)
2) 计算检验统计量:
In, n.
1)无交互作用的双因素方差分析表结构:
2)有交互作用的双因素方差分析表结构:
关系强度测量:变量间关系的强度用自变量平方和
(SSA )及残差平方和(SSE )占总平方和
3)
计算LSD
3.
4)
决策:
x -X 」>LSD 双因素方差分析:
,则拒绝叫;若匡
,则不拒绝
SS
df 白舖
彳了 JJr?
1
9J
£SC
r -1
段茎 (?
■
-;} x 0*? 1 ■
沽计
5JT=空尸十£比t SS&
h-l
HS F
F cyit.
杵
F 道
XSR Fn=
—
轉出
摊岀
55C
■ 一 i
f-二 --
V5L
给出
F
P —walofi
F ciri i
rtt ________ r tt _____ 閘值
(IT)
SSC
內部氓
羞}
JJf
沏二航一储耽
—1
扎R =
UR.
F — "1
用兀二
r - 1
SSE
-----------
erf 啊-1)
'?
1?札册二
n -1
-
F
^~
MSC
给出
-V55
鑰出
4.
(SST )的比例大小来反映,根据
平方根R 进行判断
尺二SST (总咿方和)
第十一章 一元线性回归
1.
样本的相关系数:
刃
挖(乂-好送?-强
2.
相关系数的显著性检验步骤:
丽(对胁刚
1)提出假设:
n 0: p = o ; //]: P* 0
方差分
?;k 平
■訓
平方右 自由莓 均
方
H+>咖傑里申趙一?卜朮平 申