六西格玛系列之统计学-第3章概率
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 概率
3.1概率在统计学中(统计推断中)的作用
基于样本数据作出的推断是不确定的,一个样本很少能完美精确的叙述它所来自的总体,总是存在一定范围内的误差,因此关于估计(推断)不确定程度的度量(推断的可靠性)在统计学中十分重要。我们用概率来度量估计(推断)的不确定程度(推断的可靠性)
3.2事件、样本空间和概率
试验是获得一个观测值或进行一次测量的过程
简单事件是一个试验的基本结果,它不能分解为更简单的结果
维恩(Venn)图
样本空间(S)用一个封闭的图形表示,包含一个称作样本点的点集,每个点代表一个简单事件,样本空间(S)中的样本点的个数等于与试验相关的简单事件个数
维恩图为解决概率问题提供了一个简单直接的方法,画图通常可以使问题一目了然
简单事件的概率是进行试验时度量简单事件将会发生的可能性的一个数。当试验重复的次数
S S
S
非常多时,概率可以用观测到的简单事件的次数的比例来近似,大数定律表述了当试验被不断地重复进行时,一个结果发生次数的相对频率趋近于这个结果的真实(理论)概率。有些试验不可能重复,因此不可能通过反复的试验来估算概率(如投资一个项目时,投资成功的概率),可以通过确定类似投资成功的比例来估算概率
从生产线抽取一个产品(试验),它的样本空间S{产品有缺陷,产品无缺陷},已知生产线受控时,10%的产品是有缺陷的,求产品无缺陷的概率
1.不能将等概率指派给简单事件,即产品无缺陷的概率不是50%
2.生产线可能是失控的,因此不能将生产线受控时的缺陷率10%当作产品无缺陷的概率
3.可以通过收集一段时间内缺陷产品和无缺陷产品的个数来近似的估计两个简单事件的概率
对于一个简单事件E,E的概率记为P(E)
1.0P(E i)1(所有简单事件的概率必须在0和1之间)
样本空间中所有简单事件的概率之和等于1)
事件是简单事件的一个指定集合(投掷骰子的试验中,观测到的点数为奇数)
事件A的概率等于事件A所包含的简单事件概率之和[P(1)+ P(3)+ P(5)]
计算任意事件概率的步骤
a定义试验,即描述获得观测值(测量值)的过程及记录的观测值(测量值)类型
b定义并列举简单事件
c指派简单事件的概率
d确定事件所包含简单事件的集合
e求事件所包含简单事件的概率之和
3.3复合事件
复合事件是两个或更多事件的组合
事件A和事件B的并(A或B)是在一次单独的试验中,事件A与事件B所包含的简单事件之和
事件A和事件B的交 (A和B)是在一次单独的试验中,事件A与事件B同时包含的简单事件
考虑有等可能简单事件S{1,2,3,4,5,6}的投掷骰子试验
事件A{投掷出一个偶数点}={2,4,6}
事件B{投掷出一个小于等于3的数}={1,2,3}
事件C{投掷出一个大于1的数}={2,3,4,5,6}
求多个事件并和交的概率时,先求两个事件并和交的概率,再将结果和下一个事件求并和交的概率
3.4补事件
事件A的补事件(A c)是所有不在事件A中的简单事件组成的事件,
P(A)+P(A c)=1,在很多概率问题中,计算事件的补事件的概率要比计算事件本身的概率更容易
3.5条件概率
投掷一颗均匀的骰子时,观测到偶数(事件A)的概率是1/2,假如已经知道某次投掷骰子的结果是小于等于3的一个数(事件B),事件A发生的概率就应该为1/3,因为事件B发生后样本空间从6个简单事件缩减到了3个
在给定事件B发生的前提条件下,事件A发生的条件概率
抽取生产线10000Pcs零件,分别用工厂标准和客户标准对零件进行检验,事件I表示零件用工厂标准检验合格(检验合格后才能出货给客户),事件B表示零件用客户标准检验合格(符合客户要求),求工厂检
试验分别用工厂标准和客户标准对零件进行检验包含4个简单事件如下表
P(I)工厂标准检验合格的概率=P(I和B)+P(I和B c)=0.80+0.02=0.82
P(B)客户标准检验合格的概率=P(I和B)+P(I c和B)=0.80+0.15=0.95
P(I)比P(B)小说明工厂的检验标准比客户检验标准严格
3.6并和交的概率法则
1.
A和事件B是互斥事件
2.
如果事件B(A)的发生不改变事件A(B)
事件A和事件B为独立事件,不独立的事件称作相关事件
3.独立事件和互斥事件
3.1互斥事件可以由维恩图证明或说明,独立事件不可以,一般检查独立性的最好办法是确
3.2互斥事件是相关事件。因为我们假定事件B已经发生,那么事件A就不可能发生(除非其中有一个事件的概率为0,否则结果总成立)
3.3
3.4
3.7贝叶斯法则
利用概率进行推断的早期尝试是统计方法论的一个分支,称作贝叶斯统计方法,17世纪中
叶英国伟大的哲学家托马斯·贝叶斯所用的逻辑是将未知的条件概率转换为已知的条件概率
无人监控系统检测到闯入者的概率(设计概率)为0.90,但是天气(晴天/阴天/雨天)会影响无人监控系统检测到闯入者的概率,已知系统实际检测到闯入者时,天气有75%是晴天,20%是阴天,5%是雨天。系统不能检测到闯入者时,天气有60%是晴天,30%是阴天,10%是雨天。利用这些信息求已知天气为雨天时系统检测到闯入者的概率
事件D为系统检测到闯入者,D c系统不能检测到闯入者
已知P(D)=0.90,P(D c)=1.00-0.90=0.10;P(晴天|D)=0.75,P(阴天|D)=0.20,P(雨天|D)=0.05;P(晴天|D c)=0.60,P(阴天|D c)=0.30,P(雨天|D c)=0.10,求P(D|雨天)
根据条件概率的计算公式,为了求P(D|雨天)需要知道和P(雨天)
= P(雨天|D)*P(D)=0.05*0.90=0.045
= P(雨天|D c)* P(D C)=0.10*0.10=0.01
=0.045+0.01=0.055(和是两个互斥且完备的事件),P(D|雨天)=0.045/0.055=0.818
贝叶斯法则
给定k个互斥且完备的自然状态(事件)A1,A2,…,A k和一个观测(测量)到的事件E
上面的例子中P(D)=A1,P(D c)=A2是互斥且完备的自然状态(事件),{雨天}为一个观测(测量)到的事件E
P(D|雨天)=P(D)P(雨天|D)/[ P(D)P(雨天|D)+ P(D c) P(雨天|D c)]=0.90*0.05/[0.90*0.05+0.10*0.10]=0.818
P(D|晴天)=P(D)P(晴天|D)/[ P(D)P(晴天|D)+ P(D c) P(晴天|D c)]=0.90*0.75/[0.90*0.75+0.10*0.60]=0.918
P(D|阴天)=P(D)P(阴天|D)/[ P(D)P(阴天|D)+ P(D c) P(阴天|D c)]=0.90*0.20/[0.90*0.20+0.10*0.30]=0.857
3.8计数法则
1.乘法法则
从k个大小为n1,n2,…,n k的每个集合中抽取一个元素,不同结果的个数S=n1*n2*…*n k
一个产品可以通过3条不同航线运输,每个航线有4个不同路径,k=2,n1为3条不同航线,n2为每条航线的4个不同路径,则不同结果的个数S=3*4=12,决策树表示法