第五章 概率及其分布
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随机事件:随机试验的各种可能的结果,亦称事件。
用英文大写字母来表示随机事件,如A、B、C。
必然事件:当某一事件包含随机试验所有可能的结果。 不可能事件:当某一事件不包含随机试验中的任何结果。
事件
次数N与 频率Fn N Fn N Fn
试验次数
频率所逼 近的定值
正面朝上
反面朝下
10000 4875 0.4875 5125 0.5125
20000 9922 0.4961 10078 0.5039
30000 14941 0.4980 15059 0.5020
40000 19934 0.4984 20066 0.5016
50000 24946 0.4989 0.5000 25054 0.5011 0.5000
随机试验的规律性归纳为频率的稳定性。
概率的基本性质:
非负性。P(A)>=0 正规性。必然事件U, P(U)=1;不可能事件V,恒 有 P(V)=0。 事件A的逆事件(即A不会发生)的概率为1-P(A)
概率的加法定理和乘法定理 加法定理:
设A1,A2,A3,…,An是n个互不相容的事件,即它们中任何 两个都不可能同时发生,则“A1,A2,A3,…,An中至少有 一个发生”这个事件的概率就是这n个互不相容事件的 概率之后,即 P(A1+A2+A3+…+An)=P(A1)+P(A2)+P(A3)+P(An) A1+A2+A3+…+An表示“A1,A2,A3,…,An至少有一个发 生”这一事件
第五章 概率Байду номын сангаас其分布
主要内容
概率 正态分布
学习目标
了解概率的概念,掌握概率的计算方法 理解正态分布的性质,熟练掌握正态分 布表的使用,熟练掌握标准正态分布的 相关内容
概率
随机事件与概率
在自然界和人类社会中,存在着两种不同类型的现象: 确定性现象和随机现象
确定性现象:在一定条件下,事先可以断言必然会产生
某种结果的现象。 必然现象:在一定条件下必然会发生的现象。 必然发生的事件称为必然事件,记作U 不可能现象:在一定条件下必然不会发生的现象。 把不可能发生的事件称为不可能事件,记作V
随机现象:在一定条件下,事先不能断言会出现哪种结
果的现象。 对随机现象的一次观察,称作一次随机试验。 偶然性:一次试验之前,不能确定会出现哪一种结果 规律性:在相同条件下,进行多次的重复试验,试验结 果会呈现出某些统计规律。
正常状态下的分布
一、正态分布的检验
偏态量数法(Skewness)
皮尔逊发现,在偏态分布中平均数距中数较近而离 众数较选,根据平均数与众数或中数的距离,提出 一个偏态量数公式,用来描述分布形态:
SK=(M-MO)/S 或 SK=3(M-Md)/S S标准差,SK偏态量数
一、正态分布的检验
概率
频率: 为了找到某事件A发生的规律性,需要在N 次重复试验中统计出事件A发生的次数n, 并计算出n与实验总次数N之间的比值,这 个比值就是事件A的频率,记为FN(A)。 FN(A)=n/N
概率
概率:随机事件A发生的可能性大小,称作 随机事件A发生的概率,记为P(A)。
频率是事件发生的外在表现。 概率是事件发生的内在性质。
三、正态分布表的使用(附表1)
正态分布表:
第一列表示曲线底线即横轴上的位置,用z表示。 第二列是纵高Y,即曲线的高度 第三列用p表示。 如z=1,p=0.34134,Y=0.24197 z=2,p=?,Y=? z=3,p=?,Y=?
三、正态分布表的使用
查表: (1)Z=0.80,求P (2)Z=1.35,求P (3)Z=-2.10,求P (4)P =0.32,求Z (5)P=0.18 ,求Z
z=(x-)/
四、正态分布的实际应用
标准分数z具有的性质: (1)标准分数z是以均值为0,标准差为1的量表来表示的 (2)z分数的绝对值表示原始分数与分布的均值距离的大小 ,z分数的正负符号表示原始分数在均值之上还是之下 (3)z分数是以等距量表表示的,可以进行一定的四则运算 (4)将原始分数转换为z分数是线性转换。z分数的分布形 状与原始分数的分布形状相似。
概率
例1:某学生从教师准备好的三道试题中随机抽出两 道题,问恰好抽中第一题和第二题的概率是多少? 例2:在一个盒子里有10个球,分别标有号码1,2,3, …,10,现在随机抽出一个球,号码为偶数的概率? 例3:在四选一的多项选择题中,每题有四个可能答 案,正确答案与错误答案的概率分别是。
概率
三、正态分布表的使用
设X服从正态分布x~N(, 2),求以下事件的概 率p。 (1)P(-<X +) (2)P(-2<X +3) (3)P(-2.79<X +2.79)
三、正态分布表的使用
设X服从正态分布x~N(, 2),已知Z1和Z2,求 概率P(Z1<Z<Z2)。 (1)P(0<Z <1.96) (2)P(-1.96<Z<0) (3)P(1<Z <1.96)
例1:掷一个骰子,假定出现的点数是等可能性的,求事 件A={出现点数不超过4}的概率。
例2:一个盒子里有红色球5个,蓝色球10个,白色球15 个,问任意摸到一个红色球或蓝色球的概率是多少?
概率的加法定理和乘法定理 乘法定理:
设A1,A2,A3,…,An是n个相互独立的事件,即它们中任何 一个事件是否发生都不会影响其他事件的发生,则 “A1,A2,A3,…,An同时发生”这一事件的概率就是这n个 相互独立事件的概率之积,即 P(A1A2A3…An)=P(A1)P(A2)P(A3)…P(An) A1A2A3…An表示“A1,A2,A3,…,An同时发生”这一事件
三、正态分布表的使用
z~N(0,1),已知下列概率,求对应的z值。 (1)P(0<z z0)=0.3765 (2)P(- z0 z z0)=0.2661 (3)P(z z0)=0.05
四、正态分布的实际应用
1、原始分数转换成标准分数
若各科原始分数服从正态分布,则可将各科原始分数转 换成标准分数,求其总和,再比较其科总分的大小。 标准分数亦称是z分数,它以标准差为单位,以均值为 参照点,反映了一个分数在其团队中所处的位置。
三、随机变量及其概率分别
对离散型随机变量X,当把它们可能取的每一个值xi和 与之对应的概率P(X=xi)=p列入一个表,就能够全面地 展示离散型随机变量X的概率分布,从而掌握它的取值 规律。 离散型随机变量的概率分布
x1 p1 x2 p2 … … xi pi … …
X P
三、随机变量及其概率分别
四、正态分布的实际应用
例子1:某班级的测验平均分为90分,标准差为3,请分 别将92分和88分转换为对应的标准分数。
例子2:已知某班级期中考试中数学的平均分是85分,标 准差为10;物理的平均分为70分,标准差为8;化学的 平均分为80分,标准差是12。某学生的三科成绩分别 是:数学87分,物理75分,化学85分,问该生哪科成 绩最好?
正态分布
关于1000个儿童智力测验分数的直方图。
假若人数进一步增多,它的相对次数的折线图 就渐渐变得圆滑形成钟状曲线。
正态分布是连续型随机变量中最重要也是最常 见的一种分布。 只要随机变量取值的结果是由多种因素决定的 ,而且这些因素基本上都相互独立,所得到的 数据的分布就近似于正态分布。 正态分布、常态分布、高斯分布
作业
(1)根据调查,儿童智商分布为N(100,102), 某幼儿园共有儿童100人,请问智商在110~120 之间的儿童有多少人? (2)某地区进行公务员考试,考试成绩平均分 是350分,标准差为52,若此次考试录取率为 5%,试确定最低录取分数线。
例1:同时掷两个骰子,掷出12点的概率是多少?掷 出11点和10点的概率分别是多少?
例2:一个家庭中有两名子女同时参加高考,如果已 知两个人考取大学的概率分别是0.9和0.8,请问两 个人同时考取大学的概率是多少?
随机变量及其概率分别
随机事件(随机现象的结果),通常可以用数值来表示。 表示随机现象各种结果的变量称为随机变量。 随机变量每取一个数值,就表示一个随机事件,变量 取不同的数值就表示不同的事件。 随机事件按其取值是否连续,可以分为连续型随机变 量和非连续型随机变量。 在非连续型随机变量中,如果它的取值可以按照一定 次序一一列举出来,则称之为离散型随机变量。 对离散型随机变量X,当把它们可能取的每一个值xi和 与之对应的概率P(X=xi)=p
峰态量数(Kurtosis)
检验分布的中间峰值是高于,还是低于正态分布的 峰值。不管过高或过低于正态分布的峰值,则表明 该分布不符合正态分析。
Ku ( P 15 P 2 5 ) / 2( P 90 P 10 )
P15,P25,P90,P10分别为4个点的百分位数。
一、正态分布的检验
峰度、偏度检验法
二、正态分布的特征
正态分布曲线函数亦称为正态分布密度函数 1 f ( x) exp{( x ) 2 / 2 2 } 2
二、正态分布的特征
均值决定正态分布的位置,当方差2固定时,不同的 表示分布在横轴上左右平行地移动。
二、正态分布的特征
当均值固定时,当方差2决定正态分布的形状。
四、正态分布的实际应用
例子3:设某省2012年高考成绩服从平均分数为520,标 准差为100的正态分布。某考生的分数是580分,,设 2012年高考录取率为30%,请问该生得成绩能否入围 或者他能否顺利考上大学?
四、正态分布的实际应用
2、确定录取分数线
假设某省参加2011年高考的考生人数有20000人,计划 录取的人数为480人,这次考试的平均分是510分,标 准差为100,问录取分数线应定为多少分?
古典概率 统计概率
概率
古典概率
(1)每次试验中可能出现的结果的个数时有限的 ,这些结果叫做基本事件。 (2)每次试验中每个基本事件的出现是等可能的 ,即每个基本事件出现的可能性是相等的。
若某项试验的所有可能结果只有有限个,设共 有n个,并且这些结果的出现具有等可能性。 又假设这些结果中的m个结果出现将导致事件 A的发生,则事件A发生的概率为P(A)=m/n
二、正态分布的特征
当均值为0,方差 为1时的正态分布为标准正 态分布,记为 N(0 ,1) 1 2 1 z2 2 2
标准正态分布的函数表 达式f ( Z )
e
( z )
二、正态分布的特征
任何正态分布都可以转化为标准正态分布。 若x~N(, 2),令z=(x- )/ 那么z~N(0,1)
连续型随机变量可取的值是充满整个取值区间的。它 的每两个可取值之间都是可以插入另外一个可取值, 因而无法一一列举出来。即使这个取值区间很小,其 可取的值也是无限多个的。 连续型随机变量取值个数进入无限领域,它取单个数 值的概率是0,所以研究连续型随机变量的概率分布时 ,所考察的都是它在一定的区间上取值的概率。 连续型随机变量在区间[x1,x2]上取值的概率用P(x1 X x2)表示,其分布规律主要由密度函数决定的。
概率
统计概率
(1)每次试验中某一事件发生的可能性不变。 (2)试验能大量重复进行,且每次试验相互独立 此时,事件A发生的概率就是事件A发生的频率的稳定 值。
在N次重复试验中,当N无限增大时,事件A发 生的频率n/N稳定在一个确定的常熟附近,则 用这个常数来表示事件A发生的概率,即 P(A)=n/N
四、正态分布的实际应用
3、计算在某分数线内的考生人数
假设某省参加2010年高考的考生人数有15000人,平均 成绩是485分,标准差为70,问: (1)成绩在600分以上的有多少人? (2)成绩在600~700分之间的人数有多少? (3)成绩在500分以下的人数有多少?
标准分数Z的线性转换
Z’= Kz+c