第五讲 概率及概率分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
e
x 2
2 2
2
其中x在-∞到+∞之间变化,而μ代表均数, σ表示分布的标准差。正态分布曲线由μ和 σ 唯一确定。
标准正态分布N(0,1)
y
1
Z2
e2
2
Z X
标准正态分布的平均数为0、标准差为1。
正态分布的特征
正态分布的形式是对称的(但对称的不一定是正态 的),它以直线X=μ(Z=0)为对称轴。
二、随机变量及其概率分布
在许多随机现象中,事件可以表现为取某
个值或某个范围内的值的变量,我们称之为随 机变量。例如,
在100张有奖销售中有5张三等奖,现从中抽 取10张,问抽得三等奖的张数是多少?
显然,抽得三等奖券的张数是一个变量, 它可以取1,2,3,4,5,0等值,其取值是随 试验的结果而改变的,而在试验前无法预言它 将抽得什么数值。
概率为1。 (3)在一定条件下必然不发生的事件,即
不可能事件的概率为0。
概率的基本性质
概率的加法定理 两个互不相容事件A、B之和的概率,
等于两个事件概率之和,写作 P(A+B)=P(A)+P(B)
概率的乘法定理 两个独立事件同时出现的概率等于
这两个事件概率的乘积,写作 P(AB)=P(A)×P(B)
概率的古典定义
设某古典概型的一次试验中总共有n个基本事 件,其中某事件A包含m个基本事件,那么, 我们就把比值m/n称为A的概率,记作P (A)。
P先(验A概) 率:A中包基含本的事基件本总事数件个数
m n
例1
例2:某年级甲班33人,乙班36人,丙班31人, 从中随机抽取学生,甲班被抽到的概率是多 少?
当X=μ(Z=0)时曲线处于最高点,即当X=μ时, f () 为21最 大值;x=μ±σ两点是拐点,整条曲线
呈现“中间高,两边低”的形状。 正态曲线与x轴所围成区域的面积为1。 正态分布是由均值μ和标准差σ唯一决定的分布。
随机变量的定义
对于随机试验的每一个可能结果都对应于 一个实数值ξ( ω ),称ξ(ω)为随机变量, 简记作ξ。
有些定性的试验结果也可以“数值化”,比 如掷一枚硬币出现字面或花面,我们可以用 { ξ =1}表示“出现字面”,用{ ξ =0} 表示“出现花面”。
在理解随机变量这一概念时要注意:
(1)它是随试验结果而变的量,是“因变 量”,是随机试验结果的函数;
例2:有一份10道四选一的多项选择题的试卷, 若考生对试题作完全猜测,问考生分别猜中8 题、9题、10题的概率各有多大?至少猜中 一题的概率又有多大?
例3:在10道多重选择题,每道题有5个答案, 其中只有一个正确,让学生作出选择,用这 种方法测验,应怎样确定学生的真实成绩?
正态分布
正态曲线函数
f (x)
第五讲 概率及概率分布 ——统计推断的理论基础
投掷一枚正规的一元硬币25 次而得到23次图朝上和2次字朝 上。当接着投掷第26次时,得到 图朝上的可能性有多大?
主要内容
概率的基本概念和基本性质 概率分布类型 二项分布 正态分布 抽样分布
一、概率的基本概念与性质
随机现象及其统计规律性 在一定条件下具有多种可能发生的结果,某一结果 可能发生也可能不发生事先不能肯定,这种现象我
(3)事件是某些基本事件的集合,每当试验条 件实现后,我们说某个事件A发生了,意指: 这个集合A中的一个基本事件在这次试验中 出现了。
为了方便,我们把随机试验必然会发生的
事件叫做必然事件,用大写希腊字母Ω来表 示;把随机试验一定不发生的事件叫做不可 能事件,用符号φ表示。
对于事件A,”A不发生”这一事件称为
定的。
二项分布
二项分布即二项试验的概率分布,其 概率函数为:
P( k ) Cnk pk qnk
变量X的二项分布
X(或r) 0 1 2 … R … n
P
qn
npqn1 Cn2 p 2q n2
…
Cnr p r q nr
…
pn
二项分布的性质
二项分布是离散型分布。 当p=q时图形是对称的。 当p≠q时,直方图呈偏态,p<q与p>q的偏
(2)等可能性:每次试验,各基本事件出现的可
能性相同。
有关古典型试验中的概率模型称为古典概型。
古典概型在实际中是常见的,如:
从装有5份考题的袋中任抽一份进行测验, 有5个基本结果。由于抽取是随机的,各份试 题外观又一样,那么抽到任意一份试题当然 是等可能的,即抽到任何一份试题的概率均 为1/5。
从编上号码的20名学生中随机抽取一人, 有20个可能的基本结果,由于抽到20名学生 中的任何一个机会均等,因此抽到每个学生 的可能性都是1/20。
大小。我们把这种特性叫做频率的稳定性, 把数值0.5称为稳定值。
表5.1
试验者 投掷次数n
A出现次数 A出现Hale Waihona Puke Baidu率
m
m/n
浦丰 皮尔逊 皮尔逊
4040 12000 24000
2048 6019 12012
0.5069 0.5016 0.5005
概率的统计定义
在大量重复试验下,设试验的次数为n,事件 A出现的次数为m,如果事件A出现的频率 m/n总是在某个常数p附近摆动,我们便把这 个常数p称为A的概率,记作P(A)=p。
斜方向相反。 当p<q且np≥5,或p>q且nq≥5时,二项分
布就可以当作一个正态分布的近似形。二项分 布的极限就是正态分布。 二项分布的平均数与标准差。
np; npq
二项分布的性质
例:如果出10道用正误选择的测验题目, 应如何判断学生的真实成绩?
练习
例1:有10道是非题,若一考生完全不懂,全 凭猜测回答,问分别答对5题、6题、7题、8 题、9题、10题的概率各为多少?至少答对5 题的概率又是多少?
(2)随机变量取每一个值都是一个随机事件。 所以说随机变量实际上是随机事件进一步的 抽象和概括,是用随机变量的函数关系式来 表示随机事件。
(3)对于一个随机变量,我们更关心的是它 取某个数值或在某个范围内取值的概率有多 大?通常我们把随机变量ξ取某一数值a的概 率记做P{ξ=a},在区间[a,b)内取值的 概率,记做P{a≤ξ<b}。
可能性有多大?简单地说,概率就是描述某
事件出现的可能性大小的一个数。
概率的定义
设A为某试验下的一个事件,若将此试验在 相同条件下重复进行n次,事件A出现了m 次,那么我们称比值m/n为n次试验中A出
现的频率,记为fn(A)。
频率fn(A)从某种意义上说也反映了事件 A出现的可能性的大小,但是它随试验次 数在变化,因此直接用频率来描述事件本 身固有的不依人的意志为转移的属性:事 件出现的可能性大小是不能令人满意的。
人都合格,B表示三人中仅有一人合格,C表 示三人中至少有一人合格。 掷一粒骰子,设事件A表示“出现奇数点”, 事件B表示“出现偶数点”,事件C表示“出 现点数2”。
随机事件的概率
在一个随机试验中,有许多基本事件,我们 常常需要知道这些基本事件或由这些事件组 成的随机事件在试验中出现的可能性有多大。 比如某学生参加一次英语考试,我们更关心 的是“该学生在考试中得90分”的可能性有 多大?投掷一枚硬币“出现字面朝上”的可 能性有多大?抽检一件产品是“合格品”的
随机变量的类型
如果一个随机变量只可能取有限个或无穷
可数个数值,则称之为离散性随机变量。所
谓无穷可数个数值是指这些数值可按一定的 顺序排列,从而可表示为数列x1,x2,…xn …。
如果一个随机变量的取值充满数轴的某些 区间,而不是集中在有限个或可数个离散的
点上,则称之为非离散型随机变量(或连续 型随机变量)。
pi 1.
i 1
例:某学生参加一次智力竞赛,共回答了 三个问题,求该生答对题数的分布列。
二项试验与二项分布
二项试验必须满足以下几个条件:
1.任何一次试验恰好有两个结果,成功与失败。 2.共有N次试验,并且N是预先给定的任一正整
数。 3.每次试验各自独立,各次试验之间无相互影响。 4.某种结果出现的概率在任何一次试验中都是固
应该注意的是:
(1)在一次试验中所有基本事件中必出现其 中一个,而且只能出现其中一个;
(2)一个随机试验中基本事件的个数可以是 有限个,也可以是可数个,还可以是不可数 个,其个数的确定都是相对试验目的而言的。
如某箱子中装有红、白、蓝三种颜色的同 一样产品,当试验是检查产品的质量时,则 基本事件有“正品”和“次品”二个,当试 验是弄清产品的颜色时,则基本事件就有 “红”、“白”、“蓝”三个。
例3:从54张扑克牌中随机抽取一张,求抽到 红桃的概率?
例4 从一个装有7枚黑球和4枚白球的口袋中, 随机抽出一球。求这一枚是白球的概率。
例5 一次同掷两枚骰子,求以下概率: ①得总数为9;②总数不为9。
概率的基本性质
概率的公理系统 (1)任何一个随机事件A的概率都是非负
的。 (2)在一定条件下必然发生的必然事件的
那么,就称这个试验为随机试验。随机试验 的某些结果所构成的集合称为随机事件,通
常用大写英文字母表示。
例如,
“某学生参加一次英语考试”
“投掷一枚均匀的硬币”
“抽检一件产品的质量”
在一个试验中,它的每一个可能出现的 结果都是一个随机事件,他们是这个试 验的不可再分解的最简单的随机事件,
我们称之为基本事件。
研究离散型随机变量,一是要知道它可 能取哪些数值,二是它取这些数值的概 率是多大。这样才能确切地掌握它取值 的概率规律。
而对于连续型随机变量来讲,考察其取 值于一点的概率意义不大,只有知道它 取值于任一区间上的概率,才能把握其 取值的概率规律性。
概率分布是指对随机变量取值的概率情况用
数学方法(函数)进行描述。 离散型随机变量及其分布列 连续型随机变量及其概率密度函数
设离散型随机变量ξ取值为x1,x2,x3,…,xn,… ,
取这些值相应的概率为p1,p2, …,pn,… ,则称 P{ξ=xi}=pi,I=1,2, …, n, …为ξ的概率分布列。
ξ x1 x2 … xn …
P p1 p2 … pn …
根据概率的基本含义,易见
(1) pi 0,i 1,2,(2,)n,;
事件A的逆事件(或对立事件),记 A
做 。例如,一道正误判断题,用“T” 表示“正确”,用“F”表示“错误”。
若事件A与B不能同时发生,即“A与B同
时发生”是不可能事件,则称A与B互 斥(或互不相容),记作AB=φ。
显然,两个互逆事件一定互斥,反之未 必。
新生儿会讲话; 明天要下雨; 每一个孕妇都可以生四胞胎; 甲、乙、丙三人参加某项测验,设A表示三
们称其为随机现象或偶然现象。例如,
某工厂一天产品中废品的多少; 电话局每日接到用户呼叫的次数; 一条河流每年出现洪峰的时间和最大洪水流量; 新生婴儿的性别; ……
随机现象虽然就每次观察来说具有 不确定性,但是进行大量的观察,它的 结果却呈现出一种完全确定的规律性,
称之为随机现象的统计规律性。例如,
投掷硬币正面向上的比率为1/2;
新生儿的性别比例为女:男=1:1.03;
降水概率;命中率;及格率;死亡 率 ……
随机试验与随机事件
在概率论中,我们把对随机现象的一次观测
或一次实验都称作它的一次试验,如果这个
试验具有下列二个特征:
(1)可以在相同条件下重复进行;
(2)每次试验之前不能确定会出现哪一个 结果,
单独进行一次试验,其结果难以预料,但当
多次重复这个试验时,就会呈现出某种规律
性。例如,做一次试验:将一枚均匀硬币投
掷n次,观察在n次试验中“字面朝上”这个
事件A出现的可能性有多大。
由表5.1可知,尽管投掷一次硬币,不是“字 面朝上”就是“花面朝上”无规律可言,但 多次抛掷,也不论谁去抛掷,出现“字面朝 上”的频率总是在0.5附近摆动,而逐渐稳定 于0.5,所以0.5这个数能反映A出现的可能性
后验概率: P( A) lim n N N
统计概率易于理解,然而其先决条件是在相同 条件下进行大量重复试验,这带来很大的局限性。 事实上,有一种特殊的概型可以不必进行大量重 复试验,而只要通过一次试验中可能出现的结果
的分析便可求出事件的概律,这就是古典型试验。
它具有两个特点:
(1)有限性:每次试验,基本事件具有有限个;
练习
某一学生从5个试题中任意抽取一题,进行口 试,则抽到试题l或试题2的概率是多少?抽到试 题1或试题2或试题5的概率是多少?
如果第一个学生把抽过的试题还回后,第二个学 生再抽,则两个学生都抽到试题1的概率是多少?
如果前一个学生把抽过的试题还回后,后一个学 生再抽,则4个学生都抽到试题l的概率是多少?