统计学必知知识点合集
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学知识点合集
1. 试验和事件:对某事物或现象所进行的观察或实验叫试验,把结果叫事件。
2. 基本事件(elementary event ):如果一个事件不能分解成两个或更多个事件,就称为基
本事件。一次观察只能有一个基本事件。
3. 样本空间:一个试验中所有的基本事件的全体称为样本空间。
4. 古典概型:如果某一随机试验的结果有限,而且各个结果出现的可能性相等,则某一事
件A 发生的概率为该事件所包含的基本事件个数m 与样本空间中所包含的基本事件个数n 的比值。
5. 统计概型:在相同条件下随机试验n 次,某事件A 出现m 次(m ≤n ),则m/n 称为事
件A 发生的频率。随着n 增大,该频率围绕某一常数p 上下波动,且波动幅度逐渐减小,趋于稳定,这个频率的稳定值就是该事件的概率。 6. 概率加法:(1)两个互斥事件:P (A+B )=P (A )+P (B );任意两随机事件:P (A+B )
=P (A )+P (B )-P (AB )。 7. 事件独立(independent ):一个事件发生与否不会影响另一个事件发生的概率,公式为:
P (AB )=P (A )P (B )。互斥(相依赖)一定不独立,不独立不一定互斥(相依赖)。 8. 全概率公式:根据某一事件发生的各种原因的概率,计算该事件的概率。计算公式为:
∑==
n
1
i i
i
)
A |
B (P )A (P )B (P 。 9. 贝叶斯公式:在条件概率的基础上寻找事件发生的原因。计算公式为:
∑==
n
1
i i
i
i i i )
A |
B (P )A (P )
A |
B (P )A (P )B |A (P ,分母就是全概率公式。也称为逆概率公式。
该公式是在观察到事件B 已发生的条件下,寻找导致A 发生的每个原因A i 的概率。P(A i )
称为验前概率,P(A i |B)是验后概率。
10. 0-1分布:1,0x ,q p )x (P
x
-1x ==。0-1分布也称为两点分布,即非A 即B 。关于是
否的概率统统是0-1分布。性别。
11. 二项分布:现实生活中,许多事件只是具有两种互斥结果的离散变量。如男性和女性、
某种化验结果的阴性阳性,这就是二项分布。x
-n x x n q p C )x X (P ==。参数为n ,p ,
记为X~B(n ,p)。E(X)=np ,D(X)=npq 。当成功的概率很小,而试验次数很大时,二项分布接近泊松分布,此时λ=np 。即P ≤0.25,n >20,np ≤5。二项定理近似服从正态分布。二项分布是0-1分布的n 重实验,表示含量为n 的样本中,有X 个所需结果的概率。 12. 二项分布的正态近似:
)a (-)b (dt e
21q p C )x x (P 2
t -
x x x b
a
x -n x x n 2122
1
ΦΦ==
=
≤∑⎰
=π
,其中a=
npq
np -x 1,
b=
npq
np -x 2,q=1-p 。
13. 超几何分布:n
N
m -n M
-N n M C C C )2X (P ==。即二项分布中,无放回的情况。 14. 泊松分布(poisson distribution ):用来描述在一指定时间范围内或在指定的面积之内某
事件出现的次数的分布。如某企业中每月发生的事故次数、单位时间内到达某一服务柜台需要服务的顾客人数、人寿保险公司每天收到的死亡声明个数、某种仪器每月出现故
障的次数等。公式为:!
x e )X (P -x λ
λ=,E(X)=λ,D(X)=λ。λ是给定时间间隔内事件的
平均数。
15. 期望:各可能值x i 与其对应概率p i 的乘积之和为该随机变量X 的期望,即
∑=n
1
i i
i p
x 。
16. 概率密度满足的条件:(1)f(x)≥0;(2)
⎰
+∞
∞
=-1dx )x (f 。连续型随机变量的概率密度
是其分布函数的倒数。⎰
=b
a )a (F -)
b (F )x (f 。⎰
+∞
∞
==
-dx )x (xf )x (E μ;
⎰
+∞
∞
==
-22dx )x (f E(x)]-[x )x (D σ。
17. 正态分布(normal distribution ):正态分布的概率密度为:2
22)-x (-e
21
)x (f σμπ
σ=
,x
∈R 。记作X~(2
,σμ)。
18. 正态分布图形特点:(1)f(x)≥0,即整个概率密度曲线都在x 轴上方;(2)f(x)相对于x=
μ对称,并在x=μ处取到最大值,最大值为
π
σ21
;(3)曲线的陡缓由σ决定,σ越
大,越平缓,σ越小,曲线越陡峭;(4)当x 趋于无穷时,曲线以x 轴为渐近线。 19. 正态分布的例子:某地区同年龄组儿童的发育特征、某公司的销售量、同一条件下产品
的质量以平均质量为中心上下摆动、特别差和特别好的都是少数,多数在中间状态,如人群中的高个子和矮个子都是少数,中等身材居多等。 20. 标准正态分布,即在正态分布中,μ=0,σ=1,有2
x -
2
e
21)x (f π
=
,即X~N (0,1)。
用Φ表示分布函数,ϕ表示概率密度。Φ(-x)=1-Φ(x)。
21. 方差:即每个随机变量取值与期望值的离差平方的期望值。随机变量的方差计算公式为:
22i 1
i 2i
2
2
)X (E -)X (E p )]X (E -x
[)]X (E -X [E )X (D ==
==∑∞
=σ
。
22. 标准差:随机变量的方差的平方根为标准差,记)X (D =
σ。标准差与随机变量X 有
相同的度量单位。