统计学中的一些基本概念和重要公式
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P(B)
P ( A)
17 .乘法公式 P(A B) P(B) P(A | B) P( A) P(B | A)
18 .独立事件 P(A B) P( A)P(B)
n
19 .全概率公式 P(B) P( Ai ) P(B | A i ) i 1
20 .贝叶斯公式
P(A
i
|
B)
P( Ai ) P(B P(B)
j1
误差均方
: MSE SSE ,
nt k
误差平方和
k
: SSE
n
j
1
S
2 j
j1
k 个均值相等检验统计量 总平方和 平方和分解
: F MSTR MSE
k n j
2
: SST
X ij X t
j1 i1
: SST SSTR SSE
多重比较方法
:
Fisher LSD 的检验统计量
m
1 ,
n! 1 2 n,
C
m n
P nm m!
m
n!
!n
m
!
,
C
m n
C
nm n
.
14 .பைடு நூலகம்件补的概率 P( A) 1 P( A)
15 .加法公式 P(A B) P(A) P(B) - P(A B)
16 .条件概率 P(A | B) P(A B) , P(B | A) P(A B)
统计量 : t X , df n 1 S/ n
: Z p p0 p 0 (1 p 0 )
.
n
40.总体均值的单侧检验中 所需样本容量 :
n
Z Z 2
0 1 2
2
, 用Z
代替
2
Z即为双侧检验的公式
41.独立样本时 , 两个总体均值之差的点 估计量 : X1 X 2
X
1
X
9 .皮尔逊相关系数
r XY
S XY S X SY
L XY
,
L XX L YY
L XX
n i1
Xi X
2
n i1
X
2 i
n
X
i1
n
2
i
,
L XY
n
Xi X
i1
Yi Y
n
n
n i1
X
iY i
i1
X
i n
Yi i1
,
L YY
n i1
Yi Y
2
的期望值与标准差
2
:
E( X1 X 2 ) 1 2 ,
X1X2
2 1
2 2
n1 n2
.
42 .两个总体均值之差的区 间估计 :
(1)大样本
(n1, n2
30 ), 1,
已知
2
X 1 X 2 Z 2 X1 X 2
X1 X 2 的点估计量为 : S X1 X 2
S
85、因变量 86、自变量 87、简单线性回归 88、回归模型
.
89、回归方程 90、散点图 91、残差 92、最小二乘估计 93、决定系数 94、复相关系数 95、回归系数 96、标准化回归系数 97、列联表 98、拟合度检验 99、独立性检验
.
100、期望频数(理论频数) 101、观察频数(实际频数) 102、相关系数 103、列联系数
x
0,1,2,...,
n, q
1
p
24 .二项分布的数学期望和 方差 E ( X ) np,Var ( X ) 2 np(1 p)
25 .泊松分布 p( x) xe xe
x!
x!
27 .超几何分布
p(x)
C
x r
C
nx N r
C
n N
,0
x
r
28 .正态概率密度函数 f ( x)
30、条件概率 31、事件的补、并、交运算 32、概率的加法公式 33、概率的乘法公式 34、条件概率公式 35、全概率公式 36、贝叶斯公式
.
37、随机变量 38、离散型随机变量 39、连续型随机变量 40、概率分布 42、概率密度函数 43、概率分布的数学期望和方差 44、二项试验 45、二项分布 46、泊松分布 47、均匀分布 48、指数分布 49、正态分布
2 1
S
2 2
n1 n2
(2)大样本
,
1,
未知
2
X1 X 2 Z 2SX1X2
2 1
2时
2
,
X 1 X 2 的标准差
X1X2
(3)小样本 , 正态
X 1 X 2 t 2 S X1 X 2
2 1
2 2
n1 n2
2( 1 1 )
n1 n2
.
43 .两个总体均值之差的假
18、标准差(总体、样本) 19、离散系数(变异系数) 20、偏度 21、峰度 22、样本 23、样本点(基本事件) 24、样本空间 25、样本容量 26、随机事件 27、相容事件、互斥事件 28、相关事件、独立事件
.
29、事件的概率: (1)概率的古典定义 (2)概率的统计定义 (3)主观概率的定义
p2)
45 .两个总体比率之差的区 间估计 :
大样本
n1 p1 , n1 (1
p1 ), n 2
p 2 , n 2 (1
p2)
5时 ,
p1 p2
Z
S
p1 p2
2
46 .两个总体比率之差的检 验统计量 :
Z
p1
p 2
p1
p2
p1
p
2
总体比率合并估计
:
p
n1 p1
n2 p2
求平方和的另一种方法
:
SS t
X ij 2
X ij nt
2
, df t
nt 1,
SS b
X ij 2 nj
X ij nt
2
, df b
k
1,
SS w SS t SS b , df w n t . k
54 .随机化区组设计
:
总平方和
k a
2
: SS t
X ij X t , df t n t 1 ,
j1 i1
处理平方和
k
2
: SS b a X . j X t , df b k 1 ,
j1
区组平方和 误差平方和
a
2
: SS r k X i. X t , df r a 1 ,
i1
: SS e SS t SS b SS r , df e k 1 a 1
.
72、主效应 73、交互作用 74、多重比较 75、简单效应 76、离差平方和 77、自由度 78、均方(平均平方) 79、变异的分解 80、F值 81、临界值 82、零假设(虚无假设、原假设、无差异假设) 83、备择假设(研究假设、替换假设)
.
84、相关、相关系数 (1)积差相关系数(皮尔逊相关) (2)等级相关(斯皮尔曼等级相关、和谐系数) (3)点二列相关 (4)二列相关 (5)多列相关 (6)四分相关
.
50、标准正态分布 51、标准分数(Z分数) 52、统计量 53、总体参数 54、中心极限定理 55、样本均值的分布 56、标准误 57、卡方分布 58、t分布 59、F分布 60、点估计(有效性、无偏性、一致性、充分性)
.
61、区间估计(显著性水平、置信度、置信区间) 62、假设检验 63、错误(第一类错误) 64、错误(第二类错误) 65、单侧检验 66、双侧检验 67、假设检验中的p值 68、独立样本 69、相关样本 70、因素 71、因素的水平
.
32 .估计 时的抽样误差
:X
33 .总体均值的区间估计
(1 ) 大样本且方差已知
:X
Z 2
, n
( 2 ) 大样本且方差未知
S
: X Z 2
, n
( 3 ) 总体正态
, 小样本 , 方差已知
X Z 2
, n
( 4 ) 总体正态
, 小样本 , 方差未知
X t 2
S n
34 .估计 时所需的样本容量
求平方和的另一种方法
:
总平方和 处理平方和 区组平方和 误差平方和
: SS t
X
2 ij
X ij ak
2
, df t
ak
1,
: SS b
X ij 2 a
ak X ij 2 , df b k 1 ,
: SS r
.
:n
Z
2
2
2
2
35 .总体比率 P 的区间估计
36 . p 的区间估计时所需的样 37 .大样本总体均值的检验
p Z 2
本容量
p (1 p )
n
n
Z
2
2
p
(1
2
p )
统计量 :
方差已知 : Z X , / n
方差未知 : Z X S/ n
38 .小样本总体均值的检验 39 .总体比率检验统计量
.
二、重要公式
1 . 样本平均数:
2 . 总体平均数: 3 . 四分位差: 4 .方差:
X X n
X N Q D IQR Q U Q L
( 1)总体方差: (2) 样本方差:
2 X i 2 N
S 2 X i 2 n 1
.
5. 标准差:
(1)总体标准差: 2
1
e
x 2
2 2
2
29 .标准正态分布变换 Z x
.
30 . X 的数学期望和标准差
:
E (X ) ,
有限总体时
X
N n N 1 n
无限总体时
X
n
31 .比例 P 的数学期望和标准差
:
E (p) p,
有限总体时
P
N N
n 1
p (1 n
p )
无限总体时
P
p (1 p ) n
计量
:
2
n
1S
2
2
计量
:F
S
2 1
S
2 2
: 2 k f i e i 2 , df k 1
i1
ei
的期望频数 :
e ij
RT
i CT n
j
第
i 行之和 第 样本容量
j 列之和
独立性检验统计量
:
2
f ij e ij
2
, df
R 1C 1
ij
e ij
.
52 . 检验 K 个均值的相等性
n1 n2
p1
p
时
2
p1
p2
的点估计量
:
S
p1
p
2
p (1
p )
1 n1
1 n2
.
47 .一个总体方差的区间估 48 .一个总体方差的检验统 49 .两个总体方差的检验统 50 .拟合优度检验统计量 51 .独立假设条件下列联表
计
:
n 1 S2 2
/2
2
n 1 S2 2
(1 / 2 )
统计学中的基本概念和重要公式
一、基本概念 二、重要公式
.
一、基本概念
1、描述统计学
2、推断统计学
3、数据的几种尺度和类型
4、条形图
5、直方图
6、茎叶图
7、箱线图
8、累积频数
9、累积百分比
10、众数
.
11、中数(中位数) 12、百分位数 13、均值(平均数)
简单平均数 加权平均数 调和平均数 几何平均数 14、异众比率 15、范围(全距) 16、四分位差 17、方差(总体、样本) .
|
Ai)
P( Ai ) P(B | A i )
n
P( A j ) P(B | A j )
j1
.
21 .离散型随机变量的数学 期望 E ( X ) xp( x)
22 .离散型随机变量的方差 Var ( X ) 2 x 2 p( x)
23 .二项分布的概率函数
p(x)
C
x n
p xqnx,
:t
.
X i X j
MSE
1 n i
1 n j
53 .完全随机化设计 处理均方 : MSTR
误差均方 : MSE F 值 : F MSTR
MSE
:
k
2
nj X j Xt
j1 k 1
, df tr k 1 ,
k
n
j
1
S
2 j
j1 nt k
, df e n t k ,
n
Y i2
i1
n
2
Y i
i1
n
,
n
n
Xi
Yi
X i1
, Y i1
n
n
.
10 .加权平均数
X
W iX i
Wi
11 .分组数据样本平均数
12 .分组数据样本方差 13 .排列组合公式
X
Fi X i
Fi
S 2
2
Fi X i X
n 1
P nm
n! m!
n n
1 n
2 n
p 2 p 1
p
2
量
: p1
p2
p1 p2
p 1 (1 p 1 ) p 2 (1 p 2 )
n1
n2
p 1 (1 p 1 ) p 2 (1 p 2 )
n1
n2
的点估计量
p1 p2
: S p1
p2
p 1 (1 . n1
p1)
p 2 (1 n2
设检验统计量
(1 ) 大样本
Z X 1 X 2 1 2 ,
2 1
2 2
n1 n2
( 2 ) 小样本 t X 1 X 2 1 2 ,
S
2 p
1 n1
1 n2
( 3 ) 相关样本 t d d
Sd n
44 .两个比率之差的点估计
p E
1
p
1
p
2
的期望值与标准差
(2)样本标准差: S S 2 6 .变异系数
总体:
CV
100
%
标准差 平均数
100 %
样本: CV S 100 % X
.
7 .标准分数 8 .样本协方差
( Z 分数 Cov
)
Zi
Xi X S
,或 Z i
Xi
( X , Y ) S XY
X i X Yi Y n 1
第j个处理的样本均值
nj
X ij
:X j
i1
nj
,
第j个处理的样本方差
n j
2
X ij X j
:
S
2 j
i1
nj1
,
k nj
X ij
k
总样本均值
: X t
j1 i1
nt 1
,nt n j
j1
处理均方
: MSTR SSTR ,
k 1
k
处理平方和
: SSTR n j ( X j X t ) 2