统计学必知知识点合集
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学知识点合集
1. 试验和事件:对某事物或现象所进行的观察或实验叫试验,把结
果叫事件。
2. 基本事件(elementary event ):如果一个事件不能分解成两个或更多个事件,就称为基本事件。一次观察只能有一个基本事件。
3. 样本空间:一个试验中所有的基本事件的全体称为样本空间。
4. 古典概型:如果某一随机试验的结果有限,而且各个结果出现的可能性相等,则某一事件A 发生的概率为该事件所包含的基本事件个数m 与样本空间中所包含的基本事件个数n 的比值。
5. 统计概型:在相同条件下随机试验n 次,某事件A 出现m 次(m ≤n ),则m/n 称为事件A 发生的频率。随着n 增大,该频率围绕某一常数p 上下波动,且波动幅度逐渐减小,趋于稳定,这个频率的稳定值就是该事件的概率。
6. 概率加法:(1)两个互斥事件:P (A+B )=P (A )+P (B );任意两随机事件:P (A+B )=P (A )+P (B )-P (AB )。
7. 事件独立(independent ):一个事件发生与否不会影响另一个事件发生的概率,公式为:P (AB )=P (A )P (B )。互斥(相依赖)一定不独立,不独立不一定互斥(相依赖)。
8. 全概率公式:根据某一事件发生的各种原因的概率,计算该事件的概率。计算公式为:∑==
n
1i i
i
)
A |
B (P )A (P )B (P 。 9. 贝叶斯公式:在条件概率的基础上寻找事件发生的原因。计算公式为:
10.
∑==
n
1
i i
i
i i i )
A |
B (P )A (P )
A |
B (P )A (P )B |A (P ,分母就是全概率公式。也称
为逆概率公式。该公式是在观察到事件B 已发生的条件下,寻找导致A 发生的每个原因A i 的概率。P(A i )称为验前概率,P(A i |B)是验后概率。 11.
0-1分布:1,
0x ,q p )x (P x -1x ==。0-1分布也称为两点分布,即非A 即B 。关于是否的概率统统是0-1分布。性别。 12.
二项分布:现实生活中,许多事件只是具有两种互斥结果的离
散变量。如男性和女性、某种化验结果的阴性阳性,这就是二项
分布。x
-n x x n q
p C )x X (P ==。参数为n ,p ,记为X~B(n ,p)。E(X)=np ,D(X)=npq 。当成功的概率很小,而试验次数很大时,二项分布接近泊松分布,此时λ=np 。即P ≤0.25,n >20,np ≤5。二项定理近似服从正态分布。二项分布是0-1分布的n 重实验,表示含量为n 的样本中,有X 个所需结果的概率。 13. 二项分布的正态近似:
14. )a (-)b (dt e
21q
p C )x x (P 2
t -
x x x b
a
x
-n x
x
n
2122
1
ΦΦ==
=
≤∑⎰
=π
,其中
a=npq
np -x 1,b=
npq
np -x 2,q=1-p 。
15.
超几何分布:n
N
m -n M
-N n M C C C )2X (P ==。即二项分布中,无放回的情况。 16.
泊松分布(poisson distribution ):用来描述在一指定时间
范围内或在指定的面积之内某事件出现的次数的分布。如某企业
中每月发生的事故次数、单位时间内到达某一服务柜台需要服务的顾客人数、人寿保险公司每天收到的死亡声明个数、某种仪器每月出现故障的次数等。公式为:!
x e )X (P -x λ
λ=
,E(X)=λ,D(X)=λ。
λ是给定时间间隔内事件的平均数。
17. 期望:各可能值x i 与其对应概率p i 的乘积之和为该随机变量X
的期望,即∑=n
1
i i i p x 。
18.
概率密度满足的条件:(1)f(x)≥0;(2)⎰+∞
∞=-1dx )x (f 。连续
型随机变量的概率密度是其分布函数的倒数。⎰=b
a )a (F -)
b (F )x (f 。
⎰
+∞
∞
==
-dx )x (xf )x (E μ;
19. ⎰
+∞
∞
==
-22dx )x (f E(x)]-[x )x (D σ。
20.
正态分布(normal distribution ):正态分布的概率密度为:
2
22)-x (-e
21
)x (f σμπ
σ=
,x ∈R 。记作X~(2,σμ)。
21. 正态分布图形特点:(1)f(x)≥0,即整个概率密度曲线都在
x 轴上方;(2)f(x)相对于x= μ对称,并在x=μ处取到最大值,最大值为
π
σ21
;(3)曲线的陡缓由σ决定,σ越大,越平缓,σ
越小,曲线越陡峭;(4)当x 趋于无穷时,曲线以x 轴为渐近线。 22.
正态分布的例子:某地区同年龄组儿童的发育特征、某公司的
销售量、同一条件下产品的质量以平均质量为中心上下摆动、特别差和特别好的都是少数,多数在中间状态,如人群中的高个子和矮个子都是少数,中等身材居多等。