第一章概率统计基础
概率统计基础知识试题和答案
第一章 概率统计基础知识第一节 概率基础知识一、单项选择题(每题的备选项中,只有1个最符合题意)ZL1A0001.已知5.0)(=A P ,6.0)(=B P ,8.0)(=⋃B A P ,可算得=)(AB P ( )。
A.0.2B.0.3C.0.4D.0.5ZL1A0002.已知已知3.0)(=A P ,7.0)(=B P ,9.0)(=⋃B A P ,则事件A 与B ( )。
A.互不兼容B.互为对立事件C.互为独立事件D.同时发生的概率大于0ZL1A0003.某种动物能活到20岁的概率为0.8,活到25岁的概率为0.4,如今已活到到20岁的这种动物至少能再活5年的概率是( )。
A. 0.3B. 0.4C. 0.5D. 0.6ZL1A0004.关于随机事件,下列说法正确的是( )。
A.随机事件的发生有偶然性与必然性之分,而没有大小之别B.随机事件发生的可能性虽有大小之别,但无法度量C.随机事件发生的可能性的大小与概率没有必然联系D.概率愈大,事件发生的可能性就愈大,相反也成立ZL1A0005.( )成为随机现象。
A.在一定条件下,总是出现相同结果的现象B.出现不同结果的现象C.在一定条件下,并不总是出现相同结果的现象D.不总是出现相同结果的现象ZL1A0006.关于样本空间,下列说法不正确的是( )。
A.“抛一枚硬币”的样本空间=Ω{正面,反面}B.“抛一粒骰子的点数”的样本空间=Ω{0,1,2,3,4,5,6}C.“一顾客在超市中购买商品件数”的样本空间=Ω{0,1,…}D.“一台电视机从开始使用到发生第一次故障的时间”的样本空间=Ω{0:≥t t } ZL1A0007.某企业总经理办公室由10人组成,现在从中选出正、副主任各一人(不兼职),将所有可能的选举结果构成样本空间,则其中包含的样本点共有( )个。
A. 4B.8C. 16D.90ZL1A0008.8件产品中有3件不合格品,每次从中随机抽取一只(取出后不放回),直到把不合格品都取出,将可能抽取的次数构成样本空间,则其中包含的样本点共有( )个。
概率与统计课件(一)概率论的基本概念
2
0
A B
表示事件A与事件B中至少有一个事件发生,称此事
件为事件A与事件B的和(并)事件,或记为A+B. 事件A1,A2,…An 的和记为 ,或A1 ∪ A2 ∪ … ∪ An
上一页 下一页 返回
表示事件A与事件B同时发生, 称为事件A与事件B的 积(交)事件,记为AB。积事件AB是由A与B的公共
上一页
下一页
返回
例1.27 一张英语试卷,有10道选择填空题,每题有4 个选择答案,且其中只有一个是正确答案.某同学投机 取巧,随意填空,试问他至少填对6道的概率是多大?
解 设B=“他至少填对6道”.每答一道题有两个可能的 结果:A=“答对”及 =“答错”,P(A)=1/4,故 作10道题就是10重贝努里试验,n=10,所求概率为
定义1.2: 设事件A在n次重复试验中发生了k次, n很大时, 频率 稳定在某一数值p的附近波动,而随着试验次数 n的增加,波动的幅度越来越小,则称p为事件A发生的 概率,记为 P ( A) p
上一页
下一页
返回
2、概率的公理化定义
定义1.3
上一页
下一页
返回
概率的性质:
上一页
下一页
返回
上一页
解 设A1,A2,A3表示产品来自甲、乙、丙三个车间, B表示产品为“次品”的事件,易知A1,A2,A3是样本 空间Ω的一个划分,且有 P(A1)=0.45,P(A2)=0.35,P(A3)=0.2, P(B|A1)=0.04,P(B|A2)=0.02,P(B|A3)=0.05.
上一页 下一页 返回
第三节 条件概率、全概率公式
1、条件概率的定义
上一页
下一页
返回
• 考察有两个小孩的家庭,其样本空间为{bb,bg,gb,gg} • (1)事件A=“家中至少有一个女孩“发生的概率? • (2)若已知事件B=“家中至少有一个男孩”,再求事 件A发生的概率? •
第一章 概率论的基本概念
第一章 概率论的基本概念一、随机事件其运算1.随机试验、样本点和样本空间(1)随机试验随机试验具有如下特点的试验.1、在相同的条件下,试验可以重复进行.2、试验的所有可能结果是预先知道的,并且不止一个.3、每一次试验出现那一个结果事先不能确定. (2)样本点和样本空间随机试验的每一个可能的(不可分解的)结果,称为这个随机试验的一个样本点,记为ω.随机试验的所有样本点组成的集合,称为这个随机试验的样本空间,记为. Ω2.随机事件、基本事件、必然事件和不可能事件在随机试验中,可能发生也可能不发生的事情称为该试验的随机事件,记为A ,B 等. 随机试验的随机事件可以表示为它的一些样本点组成的集合.在一次试验中,若试验结果是随机事件A 中的一个样本点,则称在一次试验中事件A 发生. 只包含一个样本点的事件称为基本事件. 在任何一次试验中都发生的事件,称为必然事件,它就是Ω所表示的事件,因而用Ω表示必然事件.在任何一次试验中都不发生的事件,称为不可能事件,它就是由φ所表示的事件,因而用φ表示不可能事件.3.事件之间的关系和运算 (1)包含关系设A ,B 为二事件,若A 发生必导致B 发生,则称事件A 包含于事件B ,或事件B 包含事件A ,记为B A ⊂.B A ⊂⇔A ∈∀ω必有B ∈ω,见图1—1. (2)相等关系设A ,B 为二事件,若B A ⊂并且A B ⊂,则称A 与B 相等,记为B A =,见图1—2.(3)事件的并设A ,B 为二事件,称事件“A ,B 至少一个发生(A 发生或B 发生)”为A ,B 的并(或和),记为.B A ∪B A ∪}|{B A ∈∈=ωωω或.见图1—3.(4)事件的交设A ,B 为二事件,称事件“A ,B 同时发生(A 发生且B 发生)”为A ,B 的交(或积).记为或B A ∩AB .AB }|{B A ∈∈=ωωω且.见图1—4. (5)事件的差设A ,B 为二事件,称事件“A 发生且B 不发生”为A 减去B 的差,记为B A −.B A − }|{B A ∉∈=ωωω且.见图1—5.(6)互不相容关系设A ,B 为二事件,若A ,B 不能同时发生,称A ,B 互不相容或互斥,记为AB φ=. A ,B 互不相容⇔AB φ=,见图1—6. (7)对立事件设A 为一事件,称事件“A 不发生”为A 的余事件或A 的对立事件,记为A .A =A −Ω,即φ=Ω=+A A A A ,,见图1—7.(8)完备事件组 构成完备事件组,若,,,,21n H H H )( 21j i H H H H H j i n ≠=Ω=++++φ, .换句话说,如果有限个或可数个事件两两不相容,并且“所有事件的和”是必然事件,则称它们构成完备事件组. ,,,,21n H H H 4.事件的运算法则对于任意事件,,有C B A ,, ,,,,21n A A A (1) 交换律 A B B A A B B A ∩∩∪∪==,.(2) 结合律 C B A C B A ∪∪∪∪)()(=;C B A C B A ∩∩∩∩)()(=.(3) 分配律 ;)()()(C A B A C B A ∩∪∩∪∩=)()()(C A B A C B A ∪∩∪∩∪=.() ∪∩∪ ∪∩ ∪∪ ∪∩)()(11n n A A A A A A A =. (4) 对偶律 ,;B A B A B A B A ∪∩∩∪==∩∩ ∩ ∪∪ ∪n n A A 11=; ∪∪ ∪ ∩∩ ∩n n A A 11=.下列关系和运算要熟记:Ω⊂⊂A φ;;B A B A B A ∪∩⊂⊂)(或B B A A B A B A ==⇒⊂∪∩且;A B A ⊂−;φ=−⇒⊂B A B A ;φφ=A ∩;A A =∪φ;φ=Ω;Ω=φ;A B B A ⊂⇒⊂;AB A B A B A −==−∩;)(A B A B A ∪∪=.【例1】写出下列随机试验的样本空间: (1)从袋中任取3个球,记录取球的结果.(2)从袋中不放回地接连取出3个球,记录取球的结果. (3)从袋中有放回地接连取出3个球,记录取球的结果.(4)从袋中不放回地一个一个地取球,直到取得白球为止录取球的结果.【例2】今有3个球、4个盒子.写出下列随机试验的样本空间:(1)将3个球任意地放入4个盒子中去、每个盒子放入的球数不限,记录放球的结果. (2)将3个球放入4个盒子中去,每个盒子至多放入1个球,记录放球的结果.【例3】写出下列随机试验的样本空间: (1)在上任取一点,记录其坐标. )1,0((2)将一尺之捶折成三段,记录三段的长度 (3)在上任取三点,记录三点的坐标.)1,0(【例4】写出下列随机试验的样本空间,用样本点的集合表示所述事件,并讨论它们之间的相互关系.(1)袋中有3个白球和2个黑球,从其中任取2个球,令A 表示 “取出的全是白球”,B 表示“取出的全是黑球”,表示“取出的球颜色相同”, (C i A 2,1=i )表示“取出的2个球中恰有i 个白球”,表示“取出的2个球中至少有1个白球”. D (2)袋中有2个正品和2个次品,从袋中有放回地接连抽取产品3次,每次任取1件,令 ()表示“第次取出的是正品”,i A 3,2,1=i i B 表示“3次都取得正品”. (3)从l,2,3,4这4个数字中,任取—数,取后放回,然后再任取一数.先后取了3次,令A 表示“3次取出的数不超过3”,B 表示“3次取出的数不超过2”,表示“3次取出的数的最大者为3”.C (4)将3个球任意地放入4个盒子中去,令A 表示“恰有3个盒子中各有1球”,B 表示“至少有2个球放入同1个盒子中”.【例5】设为3事件,试用表示下列事件: C B A ,,C B A ,,(1)至少有1个发生. C B A ,, (2)都不发生.C B A ,,(3)不都发生.C B A ,,(4)不多于1个发生. C B A ,,【例6】什么样的事件X 满足下列等式: (1)B A X A X =)()(∪∪∪. (2).B A X A ∪∪=(3). )()(C B C A X AB ∪∩∪∪=二、事件的概率及其性质1.事件概率的定义(1)古典概型满足下列条件的随机试验,称为古典概型.10 有限性:样本点的总数是有限的;20等可能性:所有基本事件是等可能的;①概率的定义:设随机试验为古典概型,样本空间为},,{1n ωω =Ω,A 是一个事件.},,{1r i i A ωω =,则事件的概率为含样本点的个数含样本点的个数Ω==A n r A P )(. ②概率的性质:对于古典概型,事件的概率具有下列性质. 10. 1)(0≤≤A P 20.1)(=ΩP 30有限可加性:若两两互不相容,则n A A A ,,,21 ∑===ni i n i i A P A P 11)()(∪.(2)几何概型满足下列条件的随机试验,称为几何概型.10有限性:样本空间是直线、二维或三维空间中度量(长度、面积或体积)有限的区间或区域.20均匀性:样本点在样本空间上是均匀分布的(可通俗地称为是等可能的) .①概率的定义:在几何概型中,Ω为样本空间,A 是一个事件,定义事件A 的概率)()()(Ω=L A L A P . 其中,分别是)(A L )(ΩL A ,的度量.Ω②概率的性质:对于几何概型,事件的概率具有下列性质. 10. 1)(0≤≤A P 20.1)(=ΩP 30若两两互不相容,则,,,,21n A A A ∑∞=∞==11)()(i i i i A P A P ∪.(3)事件的频率和性质以及概率的统计定义①事件的频率:将试验重复独立地进行次,若其中事件n A 发生了次,则称为A n A n A 在这n 次试验中出现的频数,称比值为n n A /A 在这次试验中出现的频率,记为,即.n )(A f n =)(A n f n n A /②频率的性质:事件的频率有如下性质: 101)(0≤≤A f n . 20.1)(=ΩP 30 若两两互不相容,则m A A A ,,,21 ∑===mi i n m i i n A f A f 11)()(∪.2.概率的公理化定义及性质(1)概率的公理化定义设随机试验E 的样本空间为,以ΩE 的所有随机事件组成的集合(即的一些子集组成的集合)为定义域,定义一个函数(Ω)(A P A 为任意随机事件),即任意一个随机事件A 与一个实数,且满足:)(A P 10.0)(≥A P 20.1)(=ΩP 30 可列可加性:若两两互不相容,则,,,,21n A A A ∑∞=∞==11)()(i i i i A P A P ∪.(2)概率的性质 100)(=φP .20 有限可加性:若两两互不相容,则.n A A A ,,,21 ∑===ni in i iA P A P 11)()(∪30可减性:如果B A ⊂,则)()()(A P B P A B P −=−,)()(B P A P ≤⇒. (无条件等式)()()(AB P B P A B P −=−) 40对于任意事件A ,有1)(≤A P . 50一般加法公式:==)(1∪n i i A P ∑=ni i A P 1)(∑≤<≤−nj i j i A A P 1)( ++∑≤<<≤nk j i k j i A A A P 1)()()1(211n n A A A P −−+【例7】袋中有3个白球及5个黑球,(1)从袋中任取4个球,求取得2个白球及2个黑球的概率.(2)从袋中不放回地接连取出4个球,求取得2个白球及2个黑球的概率. (3)从袋中有放回地接连取出 4个球,求取得2个白球及2个黑球的概率.【例8】设有个人,每个人都等可能地被分配到个房间中的任一间(),求下列事件的概率:n N N n < 事件:某指定的间房中各有1个人. 1A n 事件:恰有间房各有1个人. 2A n 韦件:某指定的房间中有个人.3A k 事件:当4A N n =时,恰有一间房空着.【例9】编号为1,2,3,4,5,6,7,8,9的车皮随机地发往三个地区,和的各2,3和4节,求发往同一地区的车皮编号相邻的概率. 1E 2E 3E【例10】从0,1,2,…,9这10个数字中任取1个,取后放回,先后取了6个数字,求下列事件的概率:事件:6个数字全不相同. 1A 事件:不含0与9. 2A 事件:0恰好出现2次. 3A 事件:至少出现2个0.4A 事件:6个数字中最大的是6. 5A 事件:6个数字的总和是20.6A【例11】有5名插班生,其中有3名男生、2名女生.现将他们按每班1人任意地分配到编号为1—5的5个班中去,求下列事件的概率:事件:3名男生被分到班号相连的3个班中.1A 事件:至少有2个男生被分到的班号或2个女生被分到的班号相连. 2A【例12】从n 双尺码不同的鞋子中任取r 2 (n r ≤2)只,求下列事件的概率: 事件:所取1A r 2只鞋子中只有2只成双 事件:所取2A r 2只鞋子中至少有2只成双.事件:所取3A r 2只鞍子恰成r 双.【例13】在线段AB 上任取一点,该点将AB 分成两段,求下列事件的概率: 事件:其中一段大于另一段的倍. 1A m 事件:其中每一段都小于另一段的倍.2A m【例14】设只1个泊位的码头有甲、乙两艘船停靠,2船各自可能在1昼夜的任何时刻到达.设两艘船停靠的时间分别为1小时和2小时,求下列事件的概率: 事件:码头空闲超过2小时.1A 事件:一艘船要停靠必须等待一段时间. 2A【例15】在线段上任取3个点,求下列事件的概率: AC 321,,A A A 事件:位于与之间.1B 2A 1A 1A 事件:能构成1个三角形. 2B 321,,AA AA AA【例16】若,5.0)(=A P 4.0)(=B P ,3.0)(=−B A P ,求和)(B A P ∪)(B A P ∪.【例17】对于任意两个互不相容的事件A 与B ,以下等式中只有一个不正确,它是: (A) ;)()(A P B A P =−(B) )()(A P B A P =−1)(−+B A P ∪; (C) )()()(B P A P B A P −=−; (D) ; (E) )())()((A P B A B A P =−∩∪)()()(B A P A P B A P ∪−=−.三、条件概率和乘法公式1.条件概率的定义及性质(1)条件概率的定义设为两个事件,,则称B A ,0)(>B P )()()|(B P AB P B A P =为B 发生的条件下A 的条件概率.(2)条件概率的性质 条件概率满足: 10. 0)|(≥B A P 20.1)|(=ΩB P 30可列可加性:若两两互不相容,则,,,,21n A A A ∑∞=∞==11)|()|(i i i i B A P B A P ∪.2.关于条件概率的三个定理(1)乘法公式若,则0)(>A P )()()(A B P A P AB P =. 推广 若,则0)(21>n A A A P )()()()(12112121−=n n n A A A A P A A P A P A A A P .(2)全概率公式设是样本空间的一个划分(或称为完备事件组),即两两不交:n B B B ,,,21 Ωn B B B ,,,21 j i B B j i ≠=,φ,且Ω=n B B B ∪ ∪∪21.则∑==ni i i B P B A P A P 1)()|()(.(3)贝叶斯公式设是样本空间Ω的一个划分,若事件n B B B ,,,21 A 满足:,则有0)(>A P n i B P BA PB P B A P A B P nj j ji i i ,,2,1,)()|()()|()|(1==∑=.)(i B P (),通常叫先验概率.,(n i ,,2,1 =)|(A B P i n i ,,2,1 =),通常称为后验概率.如果我们把A 当作观察的“结果”,而理解为“原因”,则贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断.n B B B ,,,21【例18】在3重努利试验中,设5.0)(=A P ,若已知A 至少出现1次,求A 至少出现1次的概率.【例19】口袋个装有个白球、个黑球,一次取出球,发现都是同一颜色的球,求它们都是黑球的概率. 12−n n 2n【例20】假设一个人在一年内患感冒的次数X 服从参数为5的泊松分布;正在销售的一种药品A 对于75%的人可以将患感冒的次数平均降低到3次,而对于25%的人无效.现在有某人试用此药一年,结果在试用期患感冒两次,试求此药有效的概率α.【例21】对产品作抽样检验时,每100件为一批,逐批进行.对每批检验时,从其中任取1件作检查,如果是次品,就认为这批产品不合格;如果是合格品,则再检查下件.检验过的产品不放回.如此连续检查5件.如果检查5件产品都是合格品,则认为这批产品合格而被接受.假定一批产中有5%是次品,求这批产品被接受的概率.【例22】加工零件需要经过两道工序,第—道工序出现合格品的概率为0.9,出现次品的概今为0.1第一道工序加工出来的合格的,在第二道工序中出现合格品的概率为0.8,出现次品的概率为0.2;第一道工序加工出来的次品,在第二道工序出现次品或出现废品的概率都是0.5.分别求经过两道工序加工出来的零件是合格品、次品、废品的概率.【例23】在某工厂中有甲、乙、丙3台机器生产同样的产品,它们的产量各占25%,35%,40%,并且在各自的产品中.废品各占5%,4%,2%,从产品中任取1件,求它是废品的概率.若取出的是废品,分别求它是甲、乙、丙机器生产的概率.【例24】乒乓球盒内有12个球,其中9个是新球.第一次比赛时任取3个使用,用后放回.第二次比赛时再任取3个球,求此3个球全是新球的概率.若第二次取出的3个球全是新球,求第一次取出使用的3个球也是新球的概率.【例25】袋中装有5个白球和2个黑球,从中任取5个放入一个空袋中.再从这个袋的5个球做任取3个球放入另一个空袋个.最后从第三个袋中任取1球,求从第三个袋中取出白球的概率.若从第三个袋取出的是白球,分别求从第一个袋中取出放入第二个袋的5个球全是白球的概率、从第二个袋中取出放入第三个袋的3个球全是白球的概率.四、事件的独立性1.二事件的独立性定义 设为二事件,若B A ,)()()(B P A P AB P =,则称相互独立. B A , 性质 若,则相互独立的充要条件是)0(>A P B A ,)()|(B P A B P =. 定理 若相互独立,则B A ,A 与B ,A 与B ,A 与B 均独立. 2.三个或三个以上事件的独立性(1)三个事件相互独立 设为三个事件,若满足: C B A ,,)()()(B P A P AB P =; )()()(C P A P AC P =;)()()(C P B P BC P =;)()()()(C P B P A P ABC P =,则称相互独立,简称独立.C B A ,,C B A ,,若只满足上面的前三个式子,称两两独立.两两独立,未必相互独立. C B A ,,C B A ,,(2)个事件相互独立 如果n 个事件满足:n n A A A ,,,21 )()()(j i j i A P A P A A P =, n j i ≤<≤1, 共个等式; 2nC )()()()(k j i k j i A P A P A P A A A P =, n k j i ≤<<≤1 共个等式; 3nC … … … … … … … … … … … … … … … … … …)()()()(2121n n A P A P A P A A A P = 共个等式 nn C 这等式成立,则称相互独立,简称独立.1232−−=+++n C C C n nn n n n A A A ,,,21 n A A A ,,,21 若相互独立,是中的个事件,则相互独立.n A A A ,,,21 k i i i A A A ,,,21 n A A A ,,,21 k k i i i A A A ,,,21若相互独立,将任意n A A A ,,,21 m )1(n m ≤≤个事件换成它的对立事件后,所得个事件仍独立.n 若相互独立,则.n A A A ,,,21 ∏==−−=ni in i iA P A P 11))(1(1)(∪3.独立试验序列概型贝努利试验 对一个试验E ,如果只考虑两个结果A 和A ,且,p A P =)(q p A P =−=1)(,则称E 为贝努利试验.n 重贝努利试验 将贝努利试验E 重复独立地做次,称为n 重贝努利试验.n 二项概率公式 在n 重贝努利试验中,若用表示在n 次试验中k n A ,A 出现次,则k kn k k n k n q p C A P −=)(,,,n k ,,1,0 =p q −=1.【例26】设有两门高射炮,每—门击中飞机的概率都是0.6,求同时射击一发炮弹能击中飞机的概率.若欲以99%的概率击中飞机,求至少需要多少门高射炮同时射击.【例27】今有甲、乙两名射手轮流对同一目标进行射击,甲命中的概率为,乙命中的概率为,甲先射,谁先命中谁得胜,分别求甲、乙获胜的概率. 1p 2p【例28】甲、乙二人进行下棋比赛,假设每局甲胜的概率为α,乙胜的概率为β,且1=+βα,在每局比赛中谁获胜谁得1分.如果谁的积分多于对方2分,谁就获得全场的胜利,分别求甲、乙二人获得全场胜利的概率.【例29】检查产品质量时,从其中连续抽查若干件,如果废品不超过2件,则认为这批产品合格而被接收.现有一大批产品,其废品率为0.1. (1)若连续抽查10件.求这批产品被接收的概率.(2)为使这批产品被接收的概率不超过0.9.应至少抽查多少件产品.【例30】保险公司为某年龄段的人设计一项人寿保险,投保人在1月1日向保险公司交纳保险费10元,1年内若投保人死亡,家属可向保险公司领取5000元,已知在1年内该年龄段的人的死亡率为0.0005,(1)若有10000人投保,水保险公司获利不少于50000元的概率. (2)若有7000人投保,求保险公司亏损的概率.。
质量工程师中级教材《质量专业理论与实务》
2009质量专业理论与实务(中级)
(3) 事件 A 与 B 的交,由事件 A 与 B 中公共的样本点组成的新事件称为事件 A 与 B 的交,记为 A∩B 或 AB。如图 1.1-6 所示,交事件 AB 发生意味着“事件 A 与 B 同 时发生”。
事件的并和交可推广到更多个事件上去(见图 1.1-7)。 (4) 事件 A 对 B 的差,由在事件 A 中而不在 B 中的样本点组成的新事件称为 A 对 B 的差,记为 A-B。如图 1.2-8 所示。 ① 交换律:A∪B=B∪A
A∩B= B∩A
-5-
2009质量专业理论与实务(中级)
② 结合律:A∪(B∪C)=(A∪B)∪C A∩(B∩C)= (A∩B)∩C
③ 分配律:A∪(B∩C)=(A∪B)∩(A∪C) A∩(B∪C)=(A∩B)∪(A∩C)
④ 对偶律: A ∪ B = A ∩ B A∩B = A∪B
以上性质都可以用维恩图加以验证,这些性质都可推广到更多个事件运算上去。 (四) 概率——事件发生可能性大小的度量 随机事件的发生与否是带有偶然性的。但随机事件发生的可能性还是有大小之别,是可 以设法度量的。而在生活、生产和经济活动中,人们很关心一个随机事件发生的可能性大小。 例如: (1) 抛一枚硬币,出现正面与出现反面的可能性各为 1/2。足球裁判就是用抛硬币的方法 让双方队长选择场地,以示机会均等。 (2) 某厂试制成功一种新止痛片在未来市场的占有率是多少呢?市场占有率高,就应多生 产,获得更多利润;市场占有率低,就不能多生产,否则会造成积压,不仅影响资金周转, 而且还要花钱去贮存与保管。 (3) 购买彩券的中奖机会有多少呢?如 1993 年 7 月发行的青岛啤酒股票的认购券共出 售 287347740 张,其中有 180000 张认购券会中签,中签率是万分之 6.264(见 1993 年 7 月 30 日上海证券报)。 上述正面出现的机会、市场占有率、中签率以及常见的废品率、命中率等都是用来度量 随机事件发生的可能性大小。一个随机事件 A 发生可能性的大小用这个事件的概率 P(A)来 表示。概率是一个介于 0 到 1 之间的数。概率愈大,事件发生的可能性就愈大;概率愈小, 事件发生的可能性也就愈小。特别,不可能事件的概率为 0,必然事件的概率为 1,即:
职高数学各章节知识点汇总
职高数学各章节知识点汇总一. 第一章概率统计基础1. 概率的概念及其计算2. 随机事件与样本空间3. 古典概型、几何概型及其应用4. 条件概率、独立性及其应用5. 贝叶斯公式的应用6. 随机变量及其概率分布7. 数学期望、方差及其应用8. 离散型和连续型随机变量及其性质9. 正态分布及其应用二. 第二章数据的搜集1. 调查与抽样2. 问卷设计及其质量评估3. 采样方法及其应用4. 质量控制及其应用5. 数据质量评估三. 第三章数据的表示和分析1. 描述统计学基本概念及其应用2. 基本统计量及其计算方法3. 频率分布表与图的绘制4. 偏态与峰态的概念及其计算5. 相关系数及其应用6. 线性回归分析及其应用7. 方差分析及其应用四. 第四章指数与对数函数1. 指数函数及其性质2. 对数函数及其性质3. 指数与对数的运算法则4. 指数函数、对数函数的图像与性质5. 带底数的指数函数、对数函数及其运算法则6. 指数函数、对数函数的应用五. 第五章三角函数1. 角度与弧度的转换2. 常用角度的三角函数及其图像3. 三角函数的周期性及其应用4. 三角函数的基本公式及其应用5. 立体角与球面三角学的基本概念六. 第六章数列和数学归纳法1. 数列的概念及其性质2. 等差数列与等比数列的求和公式3. 递推与递归数列及其应用4. 数学归纳法的基本思想及其应用七. 第七章函数的基本概念1. 函数的定义及其性质2. 常用函数的图像与性质3. 函数的分类及其应用4. 复合函数的定义与应用5. 反函数的定义与应用八. 第八章一次函数与二次函数1. 一次函数的定义、图像、性质及其应用2. 二次函数的定义、图像、性质及其应用3. 一次函数、二次函数的解析式及其应用4. 一次函数、二次函数的应用九. 第九章不等式与方程1. 不等式的基本概念及其性质2. 一次不等式的求解方法及其应用3. 二次不等式的求解方法及其应用4. 绝对值不等式的求解方法及其应用5. 方程的基本概念及其性质6. 一次方程的解法及其应用7. 二次方程的解法及其应用十. 第十章平面向量1. 平面向量的基本概念及其表示方法2. 平面向量的数量积、向量积及其性质3. 向量共线、垂直的判定及其应用4. 平面向量的应用,如平移、旋转等十一. 第十一章平面几何图形的性质1. 基本特征及其图形的分类2. 三角形的基本性质3. 四边形、多边形的基本性质4. 圆的基本性质5. 圆锥、圆柱、球体的基本概念及其应用。
概率统计 第一章 概率论的基础知识
7 (1) P( A B) P( A) P( B) P( AB) 10 3 (2) P( A B) 1 P( A B) 10 2 (3) P( A B) P( A) P( AB) 5
条件概率
已知事件A发生的条件下,事件B发生 的概率称为A条件下B的条件概率,记 作P(B|A)
27! 3! 9! 9! 9! 50 P( A) N (S ) 203
7 10 10 3 C 27 C 20 C10 18 P( B) N (S ) 203
4、 随机取数问题
例4:从1,2,3,4,5诸数中,任取3个排成自左向右的次序, 求: (1)
A1 “所得三位数是偶数”的概率? (2) A2 “所得三位数不小于200”的概率?
注
任何事件均对应着样本空间的某个子集.
称事件A发生当且仅当试验的结果是子集A中的元素
例1
定义
E4: 掷一颗骰子,考察可能出现的点数。 S4={1,2,3,4,5,6}; A=“掷出偶数点” B=“掷出大于4的点 ” ={2,4,6} ={5,6} C=“掷出奇数点”={1,3,5}
样本空间的子集称为随机事件。
n n1 nm 2 ! nm 1 !n n1 nm 1 !
n! n1!....nm !
种取法.
1、抽球问题
例1:设盒中有3个白球,2个红球,现从盒中 任抽2个球,求取到一红一白的概率。
解:设事件A为取到一红一白
N (S ) C
2 5
N ( A) C C
一般地,设A、B是S中的两个事件,则
P( AB) P( B | A) P( A)
称为事件A发生的条件下事件B发生的条件概率
概率统计1-1
A∩ B
n
A , A2 ,⋯, An 的积事件 —— 1
A , A2 ,⋯, An ,⋯的积事件 —— 1
∩Ai
∩Ai
i= 1
i= 1 ∞
5. 事件的互斥(互不相容)
AB = ∅—— A 与B 互斥
Ω
⇔A、 B不可能同
时发生
A , A2 ,⋯ An 两两互斥 , 1
A B
⇔ A Aj = ∅,i ≠ j,i, j =1,2,⋯, n i A , A2 ,⋯, An ,⋯ 两两互斥 1 ⇔ A Aj = ∅,i ≠ j,i, j =1,2,⋯ i
B
A− B 发生
⇔ 事件 A 发生,但 事件 B 不发生
A− B
8. 完备 完备事件组 则称 A , A2 ,⋯, An为完备 完备事件组 完备 1 或称 A , A2 ,⋯, An为 Ω 的一个划分 1
A 1
若 A , A2 ,⋯, An两两互斥,且 Ω = ∪A i 1
i=1
n
A 2
A 3
⋯
Ω
第一章 概率论的基本概念
确定性现象 随机现象 —— 每次试验前不能预言出现什么结果 每次试验出现的结果不止一个 在相同的条件下进行大量观察或试 验时,出现的结果有一定的规律性 —— 称之为统计规律性 统计规律性
§1.1 随机事件及其运算
基本术语 对某事物特征进行观察, 统称试验 试验. 试验 若它有如下特点,则称为随机试验 随机试验,用E 表示 随机试验 可在相同的条件下重复进行 每次试验的可能结果不止一个,但能明 确所有的结果 试验前不能预知出现哪种结果 E1 投一枚硬币3次,观察正面出现的次数 E2 观察总机每天9:00~10:00接到的电话次数 E3 观察某地区每天的最高温度与最低温度
计量基础知识概率和术语-不确定度基础知识
P(x)
x0
x0+x
x
概率分布
第一章 概率统计的基本知识
第一节 基本概念 六、概率分布 离散型随机变量的概率分布: 设离散型随机变量X所有可能取的值为xi(i=1,2, ), X取所有可能值的概率,即事件{X= xi}的概率为P {X= xi}= pi ,则由概率的定义可知: pi≥0,且 P {X= xi}= pi (i=1,2, )为离散型随机变量X的概率分布或分布率。离散型随机变量的概率分布可用表格形式表示。
第二节 期望、方差和标准偏差
2、数学期望的运算法则 (1) 常数c的期望等于常数本身,E(c) =c (2) 设X为一随机变量,c为一常数,则E(cX)=cE(X) (3) 设X、Y为两个独立的随机变量,则E(X·Y)=E(X) · E(Y) (4) 设X1,X2….Xn为任意的随机变量, a1,a2…, an是任意常数,则
第一章 概率统计的基本知识
第一节 基本概念 五、概率的一些重要性质 例如: 加工某零件100件,要求尺寸在(1000.01)mm,加工后发现尺寸小于99.99的零件有2件,尺寸大于100.01的零件有3件,则尺寸超差的概率为: P(A)=2%+3%=5%
第一章 概率统计的基本知识
第一节 基本概念 六、概率分布 (随机变量的)概率分布定义:一个随机变量取任何给定值或属于某一给定值集时的概率随取值变化的函数。 测量结果的值和 该值出现的概率之间 的对应关系称为测量 结果的概率分布。
p(t)
t
t分布的概率密度函数
-tp()
-tp()
第三节 常用的概率分布
6、t分布 其中: 为 函数, 为分布的自由度,当 时,t 分布 正态分布 通常我们所说的1 (k=1)和3 (k=3)所对应的置信概率为68.27%和99.73%指的是正态分布,即自由度为无穷大,在有限次测量的情况下,应为t 分布.
概率论与数理统计基础知识
从集合的角度看
B
A
事件是由某些样本点所构成的一个集合.一个事件发 生,当且仅当属于该事件的样本点之一出现.由此可 见,样本空间Ω作为一个事件是必然事件,空集Ø作 为一个事件是不可能事件,仅含一个样本点的事件称 为基本事件.
2. 几点说明
⑴ 随机事件可简称为事件, 并以大写英文字母
A, B, C,
基本事件 实例
由一个样本点组成的单点集.
“出现1点”, “出现2点”, … , “出现6点”.
必然事件 随机试验中必然会出现的结果. 实例 上述试验中 “点数不大于6” 就是必然事件. 不可能事件 随机试验中不可能出现的结果. 实例 上述试验中 “点数大于6” 就是不可能事件. 必然事件的对立面是不可能事件,不可能事 件的对立面是必然事件,它们互称为对立事件.
说明 1. 随机试验简称为试验, 是一个广泛的术语.它包 括各种各样的科学实验, 也包括对客观事物进行的 “调查”、“观察”或 “测量” 等. 2. 随机试验通常用 E 来表示. 实例 “抛掷一枚硬币,观 察正面,反面出现的情况”.
分析 (1) 试验可以在相同的条件下重复地进行; (2) 试验的所有可能结果: 字面、花面; (3) 进行一次试验之前不能 确定哪一个结果会出现. 故为随机试验.
将下列事件均表示为样本空间的子集. (1) 试验 E2 中(将一枚硬币连抛三次,考虑正反 面出现的情况),随机事件: A=“至少出现一个正面” B=“三 次出现同一面” C=“恰好出现一次正面” (2) 试验 E6 中(在一批灯泡中任取一只,测试其 寿命),D=“灯泡寿命不超过1000小时”
(1)由S2= {HHH, HHT, HTH, THH,HTT,THT, TTH,TTT}; 故: A={HHH, HHT, HTH, THH,HTT,THT, TTH}; B={HHH,TTT} C={HTT,THT,TTH} (2) D={x: x<1000(小时)}。
概率论与数理统计 1-3
3
1. 条件概率的定义
设A、B是两个事件,且P(A)>0,则称 P(B | A) P( AB) (1) P( A)
为在事件A发生的条件下,事件B的条件概率.
1.3条件概率
B ABA
S
若事件A已发生, 则为使 B也发 生 , 试验结果必须是既在 B 中又在 A中的样本点 , 即此点必属于AB. 由于我们已经知道A已发生, 故A变 成了新的样本空间 , 于是 有(1).
3
P( Ai ) P(A1)P(A2 / A1)P(A3 / A1A2 )
i 1
※想一想: ①应如何推导此式? ② n个事件的公式如何写呢?
7
1.3条件概率
例2 一批零件共100个,其中有10个是次品。今从这批零
件中随机抽取,每次一件,1)若不放回地抽取3次,求3次都 取得合格品的概率;2)若有放回地抽取2次,求2次都取得合 格品的概率。
注 通常, P(B|A) ≠ P(B)
4
2. 条件概率P(.|A)的性质
1.3条件概率
(1)非负性 对每一个事件B, P(B|A) ≧0 概
(2)规范性 对必然事件S, P(S|A) =1
率
定
(3)可列可加性 若B1, B2 ,是两两互不相容的事件,则有
P Bi | A P(Bi | A)
解 记 Ai=“第i次取得合格品”,i=1,2,3;
1) 若不放回地抽,则
P
(
A1
)
90 100
,
P(
A2
|
A1 )
89 99
,
P(
A3
|
A1
A2
)
概率论与数理统计(完整版)
例. 甲、乙、丙三人各射击一次,事件A1,A2,A3分别表示 甲、乙、丙射中,试说明下列事件所表示的结果:
A 2,A 2 A 3, A 1A 2, A 1 A 2, A 1A 2A 3, A 1A 2 A 2A 3 A 1A 3.
14
§3. 概率的概念 一. 古典定义:
等可能概型的两个特点:
在其中计算B发生的概率, 从而得到P(B|A). 例2. 在1, 2, 3, 4, 5这5个数码中, 每次取一个数码, 取后不放回, 连取两次, 求在第1次取到偶数的条 件下, 第2次取到奇数的概率.
32
(二) 乘法公式:
由条件概 ,立率 即P 定 可 (A 义 0 得 )则 , 有 P(AP B()A)|A P)(.B
若事件A发生必然导致事件B发生,则称件B包含事件A,记 作AB. 若A B且A B, 即A=B, 则称A与B相等.
B
A S
(1) AB
8
2.和事件:
AB{x|xA或xB}称为 A与B的和事 . 件
即AB ,中至少有一 ,称个 为 A与 发 B的 生和 ,记AB.
可列个A事 1, A2件 ,的和事件记 Ak.为
推广 P(AB)>0, 则有 P(ABC)=P(A)P(B|A)P(C|AB). 一般, 设A1, A2, …,An是n个事件,(n≥2), P(A1A2 ...An-1)>0, 则有乘法公式: P(A1A2…An)=P(A1)P(A2|A1)…P(An-1|A1A2…An-2) P(An|A1A2…An-1).
P(A1 A2 …)=P(A1)+P(A2)+… (可列可加性)
25
2.概率的性质: 性1质 . P()0.
概率统计第一章概率论的基础知识习题与答案
概率统计第一章概率论的基础知识习题与答案概率论与数理统计概率论的基础知识习题一、选择题1、下列关系正确的是( )。
A、0∈∅B、{0}∅=∅⊂D、{0}∅∈C、{0}答案:C2、设{}{}2222=+==+=,则( )。
P x y x y Q x y x y(,)1,(,)4A、P Q⊂B、P Q<C、P Q⊂与P Q⊃都不对D、4P Q=答案:C二、填空1、6个学生和一个老师并排照相,让老师在正中间共有________种排法。
答案:6!720=2、5个教师分配教5门课,每人教一门,但教师甲只能教其中三门课,则不同的分配方法有____________种。
答案:723、编号为1,2,3,4,5的5个小球任意地放到编号为A、B、C、D、E、F的六个小盒子中,概率论的基础知识第 1 页(共 19 页)每一个盒至多可放一球,则不同的放法有_________种。
答案:()65432720⨯⨯⨯⨯=4、设由十个数字0,1,2,3, ,9的任意七个数字都可以组成电话号码,则所有可能组成的电话号码的总数是_______________。
答案:710个5、九名战士排成一队,正班长必须排在前头,副班长必须排在后头,共有_______________种不同的排法。
答案:77!5040P==6、平面上有10个点,其中任何三点都不在一直线上,这些点可以确定_____个三角形。
答案:1207、5个篮球队员,分工打右前锋,左前锋,中锋,左后卫右后卫5个位置共有_____________种分工方法?答案:5!120=8、6个毕业生,两个留校,另4人分配到4个概率论的基础知识第 2 页(共 19 页)不同单位,每单位1人。
则分配方法有______种。
答案:(6543)360⨯⨯⨯=9、平面上有12个点,其中任意三点都不在一条直线上,这些点可以确定_____________条不同的直线。
答案:6610、编号为1,2,3,4,5的5个小球,任意地放到编号为A,B,C,D,E,F,的六个小箱子中,每个箱子中可放0至5个球,则不同的放法有___________种。
第一章概率统计基础知识
例题
抽取1个产品
每个产品平均缺陷2个 抽取的产品出现X个(与的大小有关)
例题
抽取100个产品
平均50个瑕疵点 抽取的100个产品有X个缺陷点
泊松分布运算
P( X x) E( X ) Var ( X )
二项分布概率公式
b(n,p) P(x)
E(X)=np Var(x)=np(1-p)
例题
过程不合格品率0.1,抽取6个产品,出现1 个不合格品的概率 平均出现几个不合格品 方差是多少
例题
X服从b(100,0.1),则X的均值和标准 差为
(二)泊松分布
一定面积下出现的点数
独立时间和互不相容事件
不相容事件:无共同样本点 独立事件:相互独立
例题
5个部件工作独立,正常工作的概率为90%, 系统正常工作的概率 系统不工作的概率
例题
从一批产品中抽取10个产品,抽到0个不合 格品的概率为40%,抽到1个不合格品的概 率为30%, 抽到2个以上的概率
放回取样
10个产品 2个不合格品 取4个产品 1个不合格品 所有取法:
10
4
1个不合格品的取法 概率
10 2 (10 2)
1
1
41
10 2 (10 2) P( A) 4 10
4 1
放回取样
10个产品 2个不合格品 取4个产品 2个不合格品 所有取法:
Var ( x)
1
2
例题
指数分布 =0.004 P(200X500) E(X) Var(x)
概率统计每章知识点总结
概率统计每章知识点总结第一章:基本概念1.1 概率的概念1.2 随机变量及其分布1.3 大数定律和中心极限定理第一章主要介绍了概率统计的基本概念,包括概率的定义、随机变量的概念以及大数定律和中心极限定律。
概率是描述事物发生可能性的数学工具,是对随机事件发生规律的度量和描述。
随机变量是描述随机现象的数学模型,可以用来描述随机现象的特征和规律。
大数定律和中心极限定律则是概率统计中重要的两个定律,它们描述了大量独立随机变量的和的分布规律。
第二章:随机事件的概率计算2.1 古典概型2.2 几何概型2.3 等可能概型2.4 条件概率2.5 独立性第二章主要介绍了随机事件的概率计算方法,包括古典概型、几何概型、等可能概型、条件概率和独立性。
古典概型是指实验的样本空间是有限的且每个样本点的概率相等的情形,可以直接计算出随机事件的概率。
几何概型是指随机事件的概率与其所在的几何形状有关,需要通过几何方法来计算。
等可能概型是指实验的样本空间是有限的,但不同样本点的概率不一定相等,需要通过计算总体概率来计算随机事件的概率。
第三章:随机变量及其分布3.1 随机变量及其分布3.2 数学期望3.3 方差3.4 常用离散型随机变量的分布3.5 常用连续型随机变量的分布第三章主要介绍了随机变量及其分布的知识,包括随机变量的概念、数学期望、方差以及常用的离散型和连续型随机变量的分布。
随机变量是描述随机现象的数学模型,可以是离散型的也可以是连续性的。
数学期望和方差是描述随机变量分布特征的重要指标,它们能够描述随机变量的集中程度和离散程度。
离散型随机变量常用的分布包括伯努利分布、二项分布、泊松分布;连续型随机变量常用的分布包括均匀分布、正态分布、指数分布等。
第四章:多维随机变量及其分布4.1 二维随机变量4.2 多维随机变量4.3 边际分布4.4 条件分布4.5 独立性第四章主要介绍了多维随机变量及其分布的知识,包括二维随机变量、多维随机变量、边际分布、条件分布和独立性。
概率论与数理统计知识点总结(超详细版)
《概率论与数理统计》第一章概率论的基本概念§2.样本空间、随机事件1.事件间的关系 B A ⊂则称事件B 包含事件A ,指事件A 发生必然导致事件B 发生B }x x x { ∈∈=⋃或A B A 称为事件A 与事件B 的和事件,指当且仅当A ,B 中至少有一个发生时,事件B A ⋃发生B }x x x { ∈∈=⋂且A B A 称为事件A 与事件B 的积事件,指当A ,B 同时发生时,事件B A ⋂发生B }x x x { ∉∈=且—A B A 称为事件A 与事件B 的差事件,指当且仅当A 发生、B 不发生时,事件B A —发生φ=⋂B A ,则称事件A 与B 是互不相容的,或互斥的,指事件A 与事件B 不能同时发生,基本事件是两两互不相容的且S =⋃B A φ=⋂B A ,则称事件A 与事件B 互为逆事件,又称事件A 与事件B 互为对立事件2.运算规则交换律A B B A A B B A ⋂=⋂⋃=⋃结合律)()( )()(C B A C B A C B A C B A ⋂=⋂⋃⋃=⋃⋃ 分配律 )()B (C A A C B A ⋃⋂⋃=⋂⋃)())(()( C A B A C B A ⋂⋂=⋃⋂徳摩根律B A B A A B A ⋃=⋂⋂=⋃ B —§3.频率与概率定义在相同的条件下,进行了n 次试验,在这n 次试验中,事件A 发生的次数A n 称为事件A 发生的频数,比值n n A 称为事件A 发生的频率概率:设E 是随机试验,S 是它的样本空间,对于E 的每一事件A 赋予一个实数,记为P (A ),称为事件的概率 1.概率)(A P 满足下列条件:(1)非负性:对于每一个事件A 1)(0≤≤A P (2)规范性:对于必然事件S 1)S (=P(3)可列可加性:设n A A A ,,,21 是两两互不相容的事件,有∑===nk knk kA P A P 11)()( (n 可以取∞)2.概率的一些重要性质: (i ) 0)(=φP(ii )若n A A A ,,,21 是两两互不相容的事件,则有∑===nk kn k kA P A P 11)()((n 可以取∞)(iii )设A ,B 是两个事件若B A ⊂,则)()()(A P B P A B P -=-,)A ()B (P P ≥ (iv )对于任意事件A ,1)(≤A P (v ))(1)(A P A P -=(逆事件的概率)(vi )对于任意事件A ,B 有)()()()(AB P B P A P B A P -+=⋃§4等可能概型(古典概型)等可能概型:试验的样本空间只包含有限个元素,试验中每个事件发生的可能性相同 若事件A包含k个基本事件,即}{}{}{2]1k i i i e e e A =,里个不同的数,则有中某,是,,k k n 2,1i i i ,21 ()中基本事件的总数包含的基本事件数S }{)(1j A n k e P A P kj i ===∑= §5.条件概率(1) 定义:设A,B 是两个事件,且0)(>A P ,称)()()|(A P AB P A B P =为事件A 发生的条件下事件B 发生的条件概率(2) 条件概率符合概率定义中的三个条件1。
概率统计基础知识
3.统计量
统计量 不含总体未知参数的样本函数称为统计量。 如: 某饮料生产企业用自动罐装机罐装橙汁饮料,每罐标准含量为 500ml,为保证产品的稳定性,需要每隔一定时间检查每罐饮料的 含量情况。现抽得10罐,测得其含量为(单位:ml) 495, 510, 498, 503, 492, 502, 505, 512, 497, 506。
f (x) b1a, 当x[a,b]时; 0, 其他情况,
则称随机变量 X 服从均匀分布,记为:X~U(a,b)
其均值、方差分别为: E (X)ab, V(aX)r(ba)2
2
12
均匀分布密度函数曲线
指数分布 如果随机变量 X 的密度函数为:
f(x)ex p x)(,
则称随机变量 X 服从指数分布,记为:X~E() 其均值、方差分别为: E(X)1, Va (Xr)12
(2)方差与标准差: n (xi x)2 s 2 i1 n 1
(3)变异系数:用于对不同总体或同一总体不同量纲数据离散程 度的比较,目的是消除数据水平高低和量纲的影响;
CV
s x
4.抽样分布
抽样分布
某个样本统计量的抽样分布,从理论上说就是在 抽取容量为n的样本时,由每一个样本算出的该统计 量数值的频数分布或概率分布。
条件概率及概率的乘法法则
条件概率 在事件B已发生的条件下,事件A发生的概率,称为事件A在给
定B下的条件概率,记作P(A|B)。 其中:P(A|B)= P ( A B )
P(B)
例如 掷一颗骰子,事件A表示点数为3,事件B表示点数为6,则 P(A|B)表示第一次骰子的点数为6,第二次点数为3的概率。
B
例如
概率统计第1章
条件: m n ,
7/28/2017
即 m = 0, 1, 2, ……, n.
常见模型(3) ——彩票问题幸运35选7:P21
购买:从01,……,35 中选7个号码. 开奖:7个基本号码,1个特殊号码.
并: A B 交: A B = AB 差: A B 对立: A A 与 B 至少有一发生 A 与 B 同时发生 A发生但 B不发生 A 不发生
ቤተ መጻሕፍቲ ባይዱ
注意:对立→互不相容,反之不然 应用举例:P7
事件运算的图示
AB
AB
AB
事件的运算性质
德莫根公式
A B A B;
1.2.1 概率的公理化定义
定义1.2.1:设Ω为一个样本空间,F为Ω的某些 子集组成的一个事件域,如果对任意一个事件A F,定义在F上的一个实质函数P(A)满足
非负性公理:若 AF,则P(A)0;
正则性公理: P(Ω)=1;
可列可加性公理:若A1, A2, ……, An ……
例1.1.1
口袋中有a 个白球、b 个黑球,从中一个一个不返 回地取球。A = “取到最后一个是白球”, B = “取到最后一段是白球”。问 A 与 B 的关系? 解:1) 显然,B 发生必然导致A发生,所以 BA;.
2) 又因为A发生必然导致B发生,所以 AB, 由此得 A = B.
1.1.6 事件的运算
P(A)=0.4,P(B)=0.3,P(AB)=0.6, 求 P(AB).
解:因为 P(AB) = P(A)P(AB) ,所以先求 P(AB) 由加法公式得 P(AB) = P(A)+P(B)P(AB) = 0.4+0.30.6=0.1 所以 P(AB) = P(A)P(AB) = 0.3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
f k x x; kl , 2
l 1
10
对类别绿,k=1;对类别红,k=2 T ~ N 1,0 ,I 对类别绿,10个均值从正态分布产生: kl T 对类别红,10个均值从正态分布产生:kl ~ N 0,1 , I 方差 2 1 5
f x 0 1 x
其中 0为弹簧的初始长度, 1为物质的弹性系数,由材料 的性质所决定 对给定的弹簧,我们不知道其弹性系数,但我们可以通过 测量不同外力下的形变来估计弹性系数
函数逼近
但测量会有误差 ,这样考虑统计模型的观点: Y f X 其中E 0且为随机误差,与X独立 当有足够多的数据时,最小二乘能得到精确预测,并且我 们能正确(偏差小)、精确(方差小)地预测任意外力下 的形变 如果科学知识告诉我们应该应该选择非线性模型,如 sigmoid模型,我们仍然可以用最小二乘法求解,只是计算 可能稍复杂
在目标点附近很难收集到k个邻居:维数灾难 (curse of
dimensionality)
维数灾难
邻域不再是“局部的” :考虑输入在p维单位超立方体上的 均匀分布,选取目标点的超立方体的邻居,覆盖比例为r, 则边长为: l e p r r1 p
当维数p=10时,边长为 e10 0.01 0.63, e10 0.1 0.80
结果为最大后验估计(MAP),亦称贝叶斯分类器
贝叶斯最优分类器的结果
贝叶斯分类器
ˆ x arg max P g | X x ? 为什么不用贝叶斯分类器 G gG 因为通常我们不知道 P g | X x
在上例中我们是已知数据产生的过程
每个类的概率密度为10个高斯的均匀混合
贝叶斯分类器
knn是贝叶斯分类器的直观实现
不知道 P g | X x ,在x附近的小邻域类别为g的数目
用频数近似概率
在点上取条件放宽为在目标点的邻域内取条件
如果取
Gg 1 Y 0 otherwise
P G g | X x E Y | X x
| X x
对每个输入x,使风险函数最小 k
gG j 1
ˆ x arg min L G ,g P G | X x arg min G j j
gG gG gG
j:G j g
P G
j
arg min 1 P g | X x arg max P g | X x
可能是一个封闭的解析解 也可能要通过数值计算的方法迭代计算得到
函数逼近
但可能我们选定的函数族中的任何函数都不能很 好表示 f
0.14
0.12 0.0
0.185
0.175 0.185
k的选择:偏差—方差折中
较小的k:预测更灵活,但太灵活可能会导致过拟合, 从而估计方差更大 较大的k:预测更稳定,但可能不够灵活,不灵活通常 与偏差/不准确有关
当k较小时,训练误差较小,但测试误差一般较大 当k较大时,训练误差较大,但测试误差一般较小
维数灾难
e
e p r r1 p
r
函数逼近
考虑连续数据的回归问题:给定X,Y的最佳预测为 回归函数:
f x E Y | X x
为了预测,我们需要知道 f ,但通常我们并不知道 f
有时科学知识(如物理化学定律)告诉我们f 的形式 如胡克定律指出:在弹性限度内,弹簧的的形变 f 跟引起 形变的外力x,即
1 T ˆ X X XT y 并最小化训练样本上的平均损失:
ˆ 收敛于 随着样本数目的增多, E X X E XY
T 1
但模型受到线性假设的限制
knn vs. 线性回归
通过用样本均值来逼近数学期望,knn和线性回归最 终都得到近似条件期望。但二者对模型的假设截然 不同:
则贝叶斯分类器与回归函数之间的关系为:
knn vs. 线性回归
当 n, k 且 k n 0时,knn的估计 ˆ x E Y | X x f Y|X
即该估计是一致的。
但通常没有那么多样本
T f x f x X 线性回归假设 的结构是线性的:
i 1 2
拟合 f
例:一个回归例子(续)
样本数据点
拟合得到的曲线
1阶多项式拟合
3阶多项式拟合
例:一个回归例子(续)
10阶多项式拟合
训练正确率和测试误差
一些术语
有监督学习:
给定包含输入特征 X i和对应响应 Yi的训练样本,学习Y与 X之间的关系 对新的输入x,预测其响应y
如果输出值Y的类型是连续值:回归
哲学思想
理解各种技术背后的基本思想,以知道如何和在 什么情况采用这些技术 先理解比较简单的方法,以便掌握更复杂的技术
正确评价方法的性能很重要,以便知道该方法在 什么情况下工作得好,在什么情况下工作得不好 [简单的方法通常和那些很华丽时髦的方法工作得 一样好!]
一个例子
IR2上从未知分布产生的200 点,其中类别G={绿,红} 各100个点 。 我们能建立一 个规则,预测将来的点的颜 色的规则吗?
在前面200个点上训练,在10,000个数据上测试的结果
统计决策理论
令 X IR p 表示一个实值的随机输入向量, Y IR 表示实值的随机输出变量
损失函数: L Y , f X
风险函数(损失函数的期望):
R f E XY L Y , f X E X E Y | X
例:一个回归例子
例:
y f ( x ) 0.5 0.4sin(2 x ) 然后对每个数据加上高斯噪声, 0.05
目标:
f ( x, ) 0 1 x
n
M xM (RSS)
RSS ( ) f xi , yi
著名的支持向量机(support vector machine, SVM)与核平滑有 许多相同之处
维数灾难
似乎有了合理大的训练数据集,使用knn平均总能 逼近理论上的最佳条件期望
我们能找到接近任意x的相当大的观测值邻域,并对它 们取平均 这样就不必考虑线性会回归了
但在高维空间中,knn法将失败
经验告诉我们,当二元正态分布的相关系数为0.5时,意味着线性 关系仍能工作得很好 事实上,有时候人们既没有从理论上,也没有从经验上分析就直 接采用线性模型
函数逼近
更通用的做法是选择一个函数族,参数形式为
f x f x
其中为参数集合 可以用最小二乘法求解,也可以用更一般的极大 似然法来求解
第三部分:统计学习基础
有监督学习概述
[ESL] Chp2
[ESL] Chp3
[Wasserman] Chp13
回归分析
模型评估与选择
[ESL] Chp7/8
[ESL] Trevor Hastie, Robert Tibshirani, Jerome Friedman 著 “The Elements of Statistical Leanring”,范明,柴玉梅,昝红英译《统计学习基础—数据挖掘、 推理与预测》, 电子工业出版社,2004
比较两种最简单的预测方法
线性回归 k近邻法(k - nearest neighbors, knn)
线性回归
输入p维向量,扩展成p+1维: X 1, X 1 , , X p
向量均为列向量
类别G=绿时,Y=0;否则Y=1。
Y用X的线性函数来建模
ˆ XT ˆ ˆ f X X Y 0 j j
根据公司的业绩和经济学数据,预测今后6个月的股票价格 根据患者血液的红外光谱,估计糖尿病患者血液中葡萄糖的含 量
如果输出值Y为离散值:分类
根据数字图像,识别手写的邮政编码数据 根据邮件中单词和字符的比例,识别email是否为垃圾邮 件
目标
根据训练数据, 正确预测未见过的测试样本 理解哪些输入影响输出 怎样评价预测的质量
如果在观测x邻域中某一类明显占优势,则观测 样本也更可能属于该类。分类规则为邻域成员 的多数票 ˆ x0 0.5 红 if y ˆ G x0 ˆ x0 0.5 绿 if y
15-近邻分类:训练集上的错误率为12%
过拟合
knn比线性回归表现稍好 但我们应警惕过拟合(overfitting)问题
线性回归:假定 f x 可以用一个全局线性函数很好近似 knn:假定 f x 可以用一个局部常量函数很好近似
后者看上去更合理:可以逼近更多的函数类,但必 须为这种灵活性付出高昂代价
knn
很多现代的学习过程是knn的变种
核平滑:每个样本的权重不是0/1,而是随样本点到目标 点的距离平滑减至0
ˆ G 0 G ˆ,G L G 1 otherwise
风险函数为
ˆ E ˆ ˆ X R G E X E G| X L G , G G , X L G, G X