第五章 概率及概率分布
统计学课件第5-7章概率分布、抽样分布及参数估计剖析.
概率分布、抽样分布及参数估计
Probability Distributions & Sampling Distributions
& Parameter Estimation
Wednesday, January 16, 2019
Statistical Research Office
1
本部分主要研究的问题有:
● 遵循随机性原则 --- 体现在在每一层抽选中;
● 每一层内应包含足够多的个体;
● 在同等条件下,抽样误差要小于简单随机抽 样和系统抽样的抽样误差。
Wednesday, January 16, 2019 Statistical Research Office 12
Wednesday, January 16, 2019
Statistical Research Office
7
●
常用的随机抽样组织方式
► 简单随机抽样(Simple random sampling)
►分层随机抽样(Stratified sampling)
►系统随机抽样(Systematic sampling)
►整群随机抽样 (Cluster sampling) 常用的随机抽样方法: ►重复抽样 (Sampling with replacement) ►不重复抽样(Sampling without replacement)
8
Wednesday, January 16, 2019
Statistical Research Office
★ 简单随机抽样 -定义:从总体中,按照随机的原则,使得总体 中每个个体都有同等被选中的机会,而先后抽 出的n个个体作为一个容量为n的样本。
03第五章_概论及概论分布
自数据分布中相对位置的高低。
计算不同质的观测值的总和或平均值,以
表示在团体中的相对位置。
当研究需要合成不同质的数据时,如果已知这 些不同质的观测值的次数分布为正态,这时可采用 Z分数来计算不同质的观测值的总和或平均值。
表示标准测验分数
经过标准化的心理和教育测验,常常
种数学模型计算出的概率分布。
3、基本随机变量分布与抽样分布
依所描述的数据的样本特性,可将概率分
布分为基本随机变量分布与抽样分布 (sampling distribution)。
基本随机变量分布是随机变量各种不同取
值情况的概率分布,抽样分布是从同一总体 内抽取的不同样本的统计量的概率分布。
二、二项分布
抽到第一题或第二题的概率应为抽到第一题的概率和抽到第二题的概率之和即四个学生都抽到第一题即四个学生同时抽到第一题其概率应为抽到第一题的概率的乘积即20个黑球共50个球中随机抽取两次放回抽样问抽出一个黑球和一个白球的概率是多少
第五章
概率及概论分布
一、概率的一般概念
1.概论的定义
后验概率(或统计概率)
率之和,即
0 0 6 1 5 2 2 4 P P P C p q C p q C p q ( 0) 1 2 6 6 6
3 2 3 2 6 15 5 5 5 5
6
m n
(5.2)
2.概率的公理系统
(1)任何随机事件A的概率都是在0与1之间 的正数,即 0 ≤ P(A)≤1 (2)不可能事件的概率等于零,即 P(A)= 0 (3)必然事件的概率等于1,即 P (A )= 1
概率与概率分布
掌握概率的概念、性质和法则 明确概率分布的含义,了解二项试验和分布
的基础知识。
概率与概率分布
第一节 概率的一般概念
概率论起源于17世纪,当时在人口统计、人 寿保险等工作中,要整理和研究大量的随机数据资 料,这就需要一种专门研究大量随机现象的规律性 的数学。
参赌者就想:如果同时掷两颗骰子 ,则点数 之和为9 和点数之和为10 ,哪种情况出现的可能 性较大?
概率与概率分布
一、频率和概率的定义
1. 频率 对随机现象进行观测时,若事件A在n次观测中出 现了m次,则m与n的比值,就是事件A出现的频 率(也称为相对频数)。用 W(A)表示事件A 的频率。 公式为:W(A)=m/n
概率与概率分布
2. 概率
概率是对随机事件出现可能性大小的客观量度。
事件A发生的概率记为P(A)。
概率与概率分布
二、概率的性质
1. 对于任何事件A,均有0≤P(A)≤1 2. 不可能事件的概率为零,P(V)=0 3. 必然事件的概率为1,P(U)=1
概率与概率分布
三、概率的加法和乘法
1. 概率的加法
互不相容事件:在一次试验中不可能同时出现的 事件。
事件之和:有限个互不相容事件中任意一个发生。 如:A+B=A或B发生。
假设把两枚硬币投1000次,得到的结果为下表:
正面的数量 0 1 2
总计
频数(f) 253 499 248 1000
百分比(%) 25.3 49.9 24.8 100.0
概率分布实质上是无限次抛掷的频数分布。尽 管我们永远不能观察到这个无限次抛掷的频数 分布,但我们知道这是的频数分布会无限接近 概率分布。
概率与概Байду номын сангаас分布
第五章概率与正态分布
正态分布曲线的特点
• 钟形轴对称曲线,对称轴是随机变量的平均数
。
• 正态分布曲线的位置和形状分别由平均数
和标准差 决定。
• 平均数大小决定图形向左移或右移。 • 标准差大小决定图形的陡峭程度,即纵线的最大
值。
y
0 1
5 1
x
-4 -3 -2 -1 0 1 2 3 4 5 6 7 8
图5.3 平均数不等,标准差相等的正态分布示意图
标准正态分布表中各变量的含义
表 5.4 标准正态分布表中各变量的说明
Z 横轴坐标
原始变量(Xi)取值转换后的标准
分数(Zi)
Y 纵轴高度
某一点取值(Zi)所对应的概率密
度(相对频次,Yi)
P (0,Zi)两点间 取值界于区间(0,Zi)的概率
曲线下的面积
• 已知下列Z值,查表求P值。
– (1)Z=-1与Z=1之间的概率 – (2)Z=-2与Z=2之间的概率 – (3)Z=-3与Z=3之间的概率 – (4)Z=-1.96与Z=1.96之间的概率 – (5)Z=-2.58与Z=2.58之间的概率
• 经验概率 对多次重复相同或相似试验所得到的数据进行分 析,获得事件发生的相对频率,作为对此事件 发生概率的一个估计。
P(A) a,N NFra bibliotek事件的概率
• 先验概率 • 当试验满足:试验中各种可能结果(基本事件)是
有限的,并且每种结果发生的可能性是不变时, 则某事件发生的概率等于该事件包含的基本事件 数除以试验中可能发生的基本事件总件数之商。 • 设N代表可能发生的基本事件总数,K代表事件A 包含的基本事件数,则A事件发生的概率为:
– 例:某公共汽车停车点上乘客候车的时间记为 随机变量Y
概率与概率分布.ppt
–
–
每次试验的可能结果可能不止一个,但试验的所 有可能结果在试验之前是确切知道的 在试验结束之前,不能确定该次试验的确切结果
事件的概念
1. 事件:随机试验的每一个可能结果(任何样本点集合)
– 例如:掷一枚骰子出现的点数为3
2. 随机事件:每次试验可能出现也可能不出现的事件
–
– –
例如:掷一枚骰子可能出现的点数
例如:掷一枚骰子出现的点数小于7 例如:掷一枚骰子出现的点数大于6
3. 必然事件:每次试验一定出现的事件,用表示 4. 不可能事件:每次试验一定不出现的事件,用表示
事件与样本空间
1. 例如:掷一枚骰子出现的点数 一个试验中所有基本事件的集合,用表示 例如:在掷枚骰子的试验中,{1,2,3,4,5,6}
主观概率定义
1. 对一些无法重复的试验,确定其结果的概率 只能根据以往的经验人为确定 2. 主观概率是一个决策者对某事件是否发生, 根据个人掌握的信息对该事件发生可能性的 判断 3. 例如,我认为2011年的中国股市是一个震荡 向上的状况
概率的性质与运算法 则
概率的性质
1. 非负性
– 对任意事件A,有 0 P 1
概率的统计定义
在相同条件下进行 n次随机试验,事件 A 出现
m 次,则比值 m/n 称为事件A发生的频率。 随着n的增大,该频率围绕某一常数P上下摆 动,且波动的幅度逐渐减小,取向于稳定, 这个频率的稳定值即为事件A的概率,记为
m P( A) p n
概率的统计定义
(实例)
【例】:某工厂为节约用电,规定每天的用电量指标 为1000度。按照上个月的用电记录,30天中有12天的 用电量超过规定指标,若第二个月仍没有具体的节电 措施,试问该厂第一天用电量超过指标的概率。 解:上个月30天的记录可以看作是重复进行了30次 试验,试验A表示用电超过指标出现了12次。根据概 率的统计定义有 超过用电指标天数 12 P( A) 0.4 试验的天数 30
第5章概率与概率分布
第5章 概率与概率分布一、思考题、频率与概率有什么关系 、独立性与互斥性有什么关系、根据自己的经验体会举几个服从泊松分布的随机变量的实例。
、根据自己的经验体会举几个服从正态分布的随机变量的实例。
二、练习题、写出下列随机试验的样本空间:(1)记录某班一次统计学测试的平均分数。
(2)某人在公路上骑自行车,观察该骑车人在遇到第一个红灯停下来以前遇到的绿灯次数。
(3)生产产品,直到有10件正品为止,记录生产产品的总件数。
、某市有50%的住户订阅日报,有65%的住户订阅晚报,有85%的住户至少订两种报纸中的一种,求同时订这两种报纸的住户的百分比。
、设A 与B 是两个随机事件,已知A 与B 至少有个发生的概率是31,A 发生且B 不发生的概率是91,求B 发现的概率。
、设A 与B 是两个随机事件,已知P(A)=P(B)=31,P(A |B)= 61,求P(A |B ) 、有甲、乙两批种子,发芽率分别是和。
在两批种子中各随机取一粒,试求: (1)两粒都发芽的概率。
(2)至少有一粒发芽的概率。
(3)恰有一粒发芽的概率。
、某厂产品的合格率为96%,合格品中一级品率为75%,从产品中任取一件为一级品的概率是多少、某种品牌的电视机用到5000小时未坏的概率为43,用到10000小时未坏的概率为21。
现在有一台这种品牌的电视机已经用了5000小时未坏,它能用到10000小时的概率是多少、某厂职工中,小学文化程度的有10%,初中文化程度的有50%,高中及高中以上文化程度的有40%,25岁以下青年在小学、初中、高中及高中以上文化程度各组中的比例分别为20%,50%,70%。
从该厂随机抽取一名职工,发现年龄不到25岁,他具有小学、初中、高中及高中以上文化程度的概率各为多少、某厂有A ,B ,C ,D 四个车间生产同种产品,日产量分别占全厂产量的30%,27%,25%,18%。
已知这四个车间产品的次品率分别为,,和,从该厂任意抽取一件产品,发现为次品,且这件产品是由A ,B 车间生产的分布。
第五章概率与概率分布
P( A)
事件A发生的次数m 重复试验次数n
m n
英语字母出现频率
space 0.2 ; I 0.055 ; C 0.023 ; G 0.011 ; Q 0.001 ; E R U B Z 0.105 ; T 0.072 ; 0.054 ; S 0.052 ; 0.0225 ; M 0.021 ; 0.0105 ; V 0.008 ; 0.001 O H P K 0.0654 ; 0.047 ; 0.0175 ; 0.003 ; A D Y X 0.063 ; 0.035 ; 0.012 ; 0.002 ; N 0.059 L 0.029 W 0.012 J 0.001
一、概率(Probability)的定义
概率:0-1之间的数,衡量事件A发生可能 性(机会)的数值度量。记P(A) •Probability: A value between 0 and 1, inclusive, describing the relative possibility (chance or likelihood) an event will occur.
P ( A) A包 含 的 可 能 结 果 (偶 数 ) 全部可能结果 3 6
实际与理论分析不符时,实际中可能作弊。
如:河北银行人员为买奖券,盗2000万并没中大奖。
西安彩票中心人员中奖率极高,结果是作弊。
例:已知有148名学生统计表
专业
性别
男 女
金融学院 工商学院 经济学院 会计学院 15 15 22 14 30 12 25 15
摘自:概率论与数理统计简明教程1988》李贤平 卞国瑞 立鹏,高等教育出版社
吴
大量统计的结果,用于破解密码
美国正常人血型分布
教育统计学概率及概率分布练习题目答案
第五章 概率及概率分布
练习11
○ 有100人其统计能力呈现正态分布,欲将分成ABCD四个等距等级,问各等级应该有多少人? ○ 答案:
A等级7人 B等级43练 习 5
l从 男 生 占 2 / 5 的学校中随机 抽取6个学生, 问正好抽到4个 男生的概率是 多少?至少抽 到4个女生的概 率是多少?
l答 案 : 0 . 1 3 8 2 , 0.5443
l练 习 6
l从 男 生 占 1 / 2 的学校中随机 抽取10个学生, 请问理论上抽 取男生的平均 数是多少?标 准差呢?
6
答 案 : 3 0 2 . 1 5
第五章 概率及概率分布
练习9 某测试成绩呈正态分布,平均分72,标准差6,问平均分上下多少分中间包括95%的
学生? 答案:60.24分至83.76分之间
○ 练习10 ○ 某考试从1600人中选出200人,成绩呈正态,平均分74,标准差11,问选拔分数线多少?
0 6 答案:0.375
第五章 概率及概率分布
练习3
一学生从5个试题中任意抽取一题,抽取每题的 概率都是五分之一,则抽到第一题或第二题的 概率是多少?
答案:0.4
练习4
一学生从5个试题中任意抽取一题(抽后放回), 抽取每题的概率都是五分之一,则两个学生都 抽到第一题的概率是多少?
答案:0.04
l答 案 : 5 , 1.58
第五章 概率及概率分布
1
练 习 7
3
答 案 : 8 道 或 以 上 。
2
学 生 做 1 0 道 判 断 题 , 凭 猜 测 可 以 猜 对 一 半 。 那么,学生必须做对多少道题目,我们才有 95%的把握认为他们掌握了相关知识呢?
第五章 概率及概率分布
P A B P ( A) P ( B)
16
第一节 概率的一般概念
三、概率的加法和乘法 1、概率的加法 例如:抛掷一枚硬币,正面朝上和正面朝下的概率各为0.50, 问在实验中,硬币正面朝上或朝下的概率是多少? 答:硬币正面朝上或朝下的概率是1。 获得一、二、三等奖的概率分别为:0.002、0.005和0.993, 获奖的概率是多少? 答:获奖的概率为1。
17
第一节 概率的一般概念
三、概率的加法和乘法 2、概率的乘法 A事件出现的概率不影响B事件出现的概率,这两个事件为独 立事件。 两个独立事件积的概率,等于这两个事件概率的乘积。表示 两个事件同时出现的概率。 用公式可表示为:
P ( A B ) P ( A) P ( B)
18
第一节 概率的一般概念
npq 101/ 2 1/ 2 1.58
31
第二节 二项分布
四、二项分布的平均数和标准差 例如:有一份试卷,共有50道选择题,并且都为四选一,假 定一个学生一点都不会,只能凭猜测来回答。问凭猜测来回 答,平均能猜对几道题,猜对题目数的标准差为多少。 分析:因为完全不会做而只是靠猜测,因此属于二项分布的 运用条件。
8
第一节 概率的一般概念
一、概率的定义 (2)后验概率——
表5.1 抛掷硬币试验中正面朝上的频率 试验者 德摩根 蒲丰 皮尔逊 皮尔逊 抛硬币次数 2048 4040 12000 24000 正面朝上次数 1061 2048 6019 12012 正面朝上频率 0.5181 0.5069 0.5016 0.5005
职教学院 刘春雷 E-mail:lcl2156@
1
第五章
概率及概率分布
第一节 概率的一般概念 第二节 二项分布
心理统计学05-概率分布及集中常用概率分布特征
np, npq
正态分布
• 正态分布曲线函数 • 图像
f (x)
e 1
2
( x u)2
2 2
N(μ,0.25)
N(-2,1)
N(0,1)
N(2,1)
N(μ,1)
平均数不同,标准差相同 记作X~N(μ,σ2)
N(μ,2.25) 平均数相同,标准差不同
正态分布——应用
• 假定500个学生某科成绩分布接近于正态分布N(70,100), 问:①75分以下有多少人?②85分以上有多少人?③介于 65和80分之间有多少人?
概率等于1
概率介于(0,1)之间
概率等于0
概率:事件出现可能性大小的数字描述,在[0,1]之间取值
概率定义——后验(经验)概率
• 设随机事件A在相同的条件下进行的n次试验中发生了n次A ,
• •
则当件称nA趋在fnn /(A于该nA是)无条事穷件nnA件大下A时发在该生这数的n次值概试将率验稳。中定即发在:生一的个频常数数,上记,成这一常数称。为事
用概率差求介于65分与80分之间的人数 500x0.5328=266.4≈266人
正态分布——应用
• 某县对初一年级1000名学生进行能力测验,结果μ=75,σ =10,现拟根据此结果选取25名学生作为“尖子班”重点 培养,假定测验成绩近似正态分布,问多少分以上才能被 选到“尖子班”学习?
• 解 求25名学生比例:25/1000=0.025=2.5%
0.5180 0.5069 0.4979 0.5016 0.5005
概率定义——先验(古典)概率
• 满足以下两个条件
•
每次试验中所有可能出现的结果的个数是有限的;
第五章概率分布
32
T分数优点: 1.没有负数,若出现小数时可以四舍五入,误差不
会很大。 2.它的取值范围比较符合百分制的记分习惯,易于
被人们接受。 3.由于偶然因素导致原始分数偏态,运用T分数可转
化为正态。
2019/12/11
33
例:某研究中随机抽取了180名学生的某一能 力测验分数,由于这些分数不是正态,需 要正态化。已有研究表明学生的总体能力 分布为正态,所以可以用正态化原理和T分 数公式将其正态化。
2.当总体分布为非正态而其方差又未知时, 若满足n>30这一条件,样本平均数的分布 近似为t分布。
2019/12/11
40
2. 2 值都是正值。 3. 2 分布的和也是 2 分布。 4. 如果df> 2,这时 2 分布的平均数:
2 d,f方差 22= 2df
5. 2 是连续型分布,但有些离散型的分布也 近似 2分布。
2019/12/11
42
• 2 分布为在统计分析中应用于计数数据的
假设检验以及样本方差与总体方差差异是 否显著的检验等。
2019/12/11
43
四、F分布
• 来自两个正态总体的独立样本,其方差之 比的样本分布为:
F
s / 22源自n1 11 s / 2
2
n2 1
2
• 来自同一总体,12 22 ,F比率:
2019/12/11
36
样本平均数的分布
2.总体分布非正态,但方差已知,当n大于30 时,其样本平均数的分布为渐进正态分布。
2019/12/11
37
(一)t分布的特点
1.平均数为0。 2.以平均值0左右对称的分布,左侧t为负值,右侧
为正值。 3.变量取值在-∞~+∞之间。 4.当样本容量趋于∞时,t分布为正态分布,方差为1;
概率分布及概率分布图
概率密度函数图
总结词
概率密度函数图是一种展示连续概率分布的图形,通过曲线的高低表示概率密度的大小。
详细描述
概率密度函数图是连续概率分布的图形表示,它通过曲线的高低表示概率密度的大小。在概率密度函数图中,曲 线下方的面积表示事件发生的概率。这种图形可以帮助我们了解连续随机变量的分布情况,并用于估计和预测未 来的事件。
02 离散概率分布
二项分布
01
02
03
定义
二项分布是描述在n次独 立重复的伯努利试验中成 功的次数的概率分布。
公式
$B(n, p) = C(n, k) p^k (1-p)^{n-k}$,其中C(n, k)是组合数,表示从n个 不同项中选取k个的方法 数。
应用场景
例如,抛硬币的结果(正 面或反面),或者给定数 量的独立事件中成功事件 的次数。
泊松分布
定义
泊松分布是描述在单位时间内(或单 位面积内)随机事件的次数,当这些 事件以小概率发生,并且这些事件之 间是独立的。
公式
应用场景
例如,放射性衰变或者网络中同时发 生的请求数。
$P(X=k) = frac{e^{lambda}lambda^k}{k!}$,其中 $lambda$是事件的平均发生率。
05 概率分布及概率分布图的 应用实例
在统计学中的应用
1 2 3
描述性统计
概率分布图可以用来描述数据的分布情况,如频 数分布图、直方图等,帮助我们了解数据的集中 趋势、离散程度等。
假设检验
在假设检验中,概率分布图可以用来表示样本数 据和理论分布之间的比较,帮助我们判断样本数 据是否符合预期的分布。
概率分布的种类
离散概率分布
描述离散随机变量的取值概率,如二项分布、泊 松分布等。
第5章 常用概率分布2
正态分布的参数
1
2
3
图9 标准差相同、均数不同的正态分布曲线
正态分布的参数
σ1 σ2 σ3 σ1<σ2<σ3
图10 均数相同、标准差不同的正态分布曲线
正态分布
二、正态概率密度曲线下的面积规律
正态曲线下面积总和为1;
正态曲线关于均数对称;对称的区域内面积相等; 对任意正态曲线,按标准差为单位,对应的面积相 等;
计算z值:
z1 x1
( 1.96 )
1.96
z2
x2
( 1.96 )
1.96
0.025 1.96
查附表1:确定概率 结论:95%
0.025 -1.96
正态分布
例 已知X服从均数为 、标准差 为的正态分布, 1 .96 试估计:(1)X取值在区间 上的概率; (2)X 取值在区间 上的概率。 2.58
记为N(0,1)。 标准正态分布是一条曲线。
标准正态分布曲线下的面积
μ±1范围内的面积为68.27% μ±1.96范围内的面积为95%
μ±2.58范围内的面积占99%
图12 正态曲线下的面积分布示意
标准正态分布曲线下的面积的计算
求z值,用z值查表,得到所求区间面积占总面
积的比例。 曲线下对称于0的区间,面积相等。 曲线下总面积为100%或1。
计算z值:
Z 130 123 .02 1.46 4.79
查附表1:确定概率
0.0721 0.0721 1.46
结论:7.21%
-1.46
人大《统计学》第五章 概率和概率分布
3.乘法的一般定理
• 更多的时候,事件并不是独立的,概率的计算是有条件的。一般
意义上,两个事件之积(同时发生)的概率,为: AB P A P B | A P • 上式也可以写作 P AB P B P A | B
§1.2 概率
• 求两个以上事件之积(同时发生)的概率与之相似。
当离散型随机变量X的只有两个可能的取值,并且其中一个赋值为1,另 一个赋值为0,则X服从0-1分布。 设取1的概率为 p ,则取0的概率 q 1 p 对于服从0-1分布的离散型随机变量X,有:
E X 1 p 0 1 p p
V X 1 p p 0 p 1 p p 1 p
P • 若 P Ai 0 i 1, 2,, n ,则对任意事件B,有: B P B | Ai P Ai
n i 1
§1.2 概率
【例5.1】 某厂生产甲、乙、丙三种产品,各种产品的次品率分别为4%
、6%、7%,各种产品的数量分别占总数量的30%、20%、50%,将三种产品
对连续变量,可计算某段(区间)取值的概率(或概率密度),相应地
便构成了连续变量的概率分布。
§2 离散变量的概率分布
首先看离散型随机变量的概率分布。 为得到离散型随机变量X的概率分布,通常需要列出X的所有可能取值, 以及X取这些值的概率。用下面的表格来表示:
§2 离散变量的概率分布
P X xi pi 称为离散型随机变量的概率函数。并有:
§1.2 概率
2.贝叶斯公式 • 贝叶斯公式与全概率公式要解决的问题正好相反。 • 它是在条件概率的基础上寻找事件发生的原因(或事件是在什么 条件下发生的)。 • 贝叶斯公式也称作逆概公式。
概率论5章
F ( x, y) A[ B arctanx][C arctany]
求常数A,B,C.
解: F ( , ) A[ B
F ( , y ) A[ B
2
][C
2
]1
2
][ C arctan y ] 0
F ( x, ) A[ B arctan x ][ C
x y
f ( x, y)dxdy
dx 8e
x 0 ( 2 x 4 y ) x dy 2e 2 x (e 4 y ) |0 dx 0
= 0 =
0
2e
2 x
(1 e
4 y
)dx 2e
0
2 x
dx 2e6 x dx
0
F ( , y ) lim F ( x, y ) 0
x
§5.1 二维随机变量及分布函数
二、联合分布函数 性质 ⑤ 随机点(X,Y)落在矩形区域
{( x, y) | x1 X x2 , y1 Y y2}
的概率
y y2
y1 0 x1 x2 x
P( x1 X x2 , y1 Y y2 ) F ( x2 , y2 ) F (x2 , y1 ) F (x1, y2 ) F (x1, y1 )
y0 0 y0 0
x
§5.4 边缘分布
一、边缘分布函数 1.边缘分布 设F(x,y)为二维随机变量(X,Y)的联合分布函数,称
P(X≤x)=P(X≤x,Y<+≦)
x , y
其中 -≦<μ1<+≦, -≦<μ2<+≦,σ1>0,σ2>0 ,|ρ|<1,
第5讲:概率及正态分布
模型推导出的总体的次数分布 ➢ 基本随机变量分布: ➢ 抽样分布:样本统计量的分布
概率分布的分类结构图
分布
经验分布——频次分布
理论分布——概率分布
总体分布
抽样分布
离散分布——二项分布
连续分布——正态分布
第二节 正态分布
数学情景
从 某 中 学 男 生 中 随 机 抽 取 出 8 4 名 , 测 量 身 高 , 数 据 如 下 ( 单 位 : cm ):
出正面次数 出正面频率
1
0.25
23
0.46
51
0.51
1061 2048 6019 12012
0.518 0.5069 0.5016 0.5005
试验者
蒲丰 Pearson
概率的统计定义
在一定条件下,进行n次重复试验,当n 充分大时,随机事件A出现的频率稳定在某一 数值P附近摆动。随着试验次数的增多,这种 摆动的幅度越小。我们则定义事件A的概率为 P(A)=P。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)一次试验只有两种可能结果,即成功和失败。 (2)各次试验相互独立,可反复进行。 (3)各次试验中成功的概率相等。如抛硬币,在班中抽取 男生的概率。
22
第二节 二项分布
二、二项分布函数 二项分布是一种离散型随机变量的概率分布;属于理论分布。 定义: 用n次方的二项展开式来表达在n次二项试验中成功事件出现 不同次数(X=0,1,…,n)的概率分布叫做二项分布。
5
第一节 概率的一般概念
一、概率的定义 (1)频率 频率的特点——在0到1之间,包括0和1的情况。 随着试验次数n的无限增大,随机事件A的频率稳定于一个常 数P,这个常数P就是随机事件A出现概率的近似值。可表示 为
P( A)
m n
6
第一节 概率的一般概念
一、概率的定义 (2)后验概率——以随机事件A在大量重复试验中出现的稳 定频率值作为随机事件A概率的估计值,这样寻得的概率称 为后验概率。 如,前边投篮的例子。投10次时频率是0.60,现在老师让学 生投100次,结果进了55次。这时频率又变成0.55。假如老 师又让这个学生投1000次,结果投进500次,这时频率又变 成0.50。……假定这个频率逐渐稳定在0.51。这时0.51就是 这位学生投篮概率的估计值。通过这种方法求得的概率,称 为后验概率。
14
第一节 概率的一般概念
二、概率的性质 1、任何随机事件A的概率都是介于0与1之间的正数;
2、不可能事件的概率等于0;
3、必然事件的概率等于1。
15
第一节 概率的一般概念
三、概率的加法和乘法 1、概率的加法 在一次试验中不可能同时出现的事件称为互不相容的事件。 两个互不相容事件和的概率,等于这两个事件概率之和。 用公式可表示为:
12
第一节 概率的一般概念
一、概率的定义 又如:某班有45人,其中男生25人,女生20人,现随机抽一 个学生,问抽到女生的概率是多少?
答:抽到女生的概率0.44。
13
第一节 概率的一般概念
一、概率的定义 先验概率——是在特定条件下直接计算出来的,是随机事件 的真实概率; 后验概率——则是由频率估计出来的。但是试验重复次数充 分大时,后验概率也接近先验概率。
19
第一节 概率的一般概念
三、概率的加法和乘法 2、概率的乘法 再如: 假设这位老师共编了5个试题,每个学生只能抽到1道题,现 在请问两个学生都抽到第1题的概率是多少。 答:两个学生同时抽到第1题的概率是1/25 (0.04)。
20
第一节 概率的一般概念
三、概率的加法和乘法 2、概率的乘法 有限个独立事件积的概率,等于这些事件概率的乘积。 用公式表示为:
23
第二节 二项分布
二、二项分布函数 例如:一个考生完全凭猜测来做3道是非题,每道题只有两 种结果,即可能对也可能错,现把猜对的事件称为成功事件, 猜对的概率为p,猜错的概率为q。猜测3道题的可能结果有8 种: 3道全答对——ppp;(p3) 答对2道——ppq、pqp、qpp;(3p2q) 答对1道——pqq、qqp、qpq;(3pq2) 3道全答错——qqq(q3)
24
第二节 二项分布
二、二项分布函数 这里是把做一道题看作为做一次试验,一个学生做3道题看 作是做3次试验,即n=3。
把做对1道题看作为成功事件出现了1次, 那么在n次试验中成功事件出现不同次数的概率,可用 (p+q)n的展开式来表达。 (p+q)3= p3+3p2q +3pq2+ q3
25
第二节 二项分布
17
第一节 概率的一般概念
三、概率的加法和乘法 2、概率的乘法 A事件出现的概率不影响B事件出现的概率,这两个事件为独 立事件。 两个独立事件积的概率,等于这两个事件概率的乘积。表示 两个事件同时出现的概率。 用公式可表示为:
P ( A B ) P ( A) P ( B)
18
第一节 概率的一般概念
P( A)
m 3 n 8
11
第一节 概率的一般概念
一、概率的定义 再如: 有一付新买来的扑克牌,从中抽一张,问抽到红桃的概率是 多少?抽到老K的概率是多少?抽到大王的概率是多少? 解: (1)13/54=0.2407; (2)4/54=0.0741; (3)1/54=0.0185
答:抽到红桃的概率是0.2407,抽到老K的概率是0.0741, 抽到大王的概率是0.0185。
8
第一节 概率的一般概念
一、概率的定义 (2)后验概率——
表5.1 抛掷硬币试验中正面朝上的频率 试验者 德摩根 蒲丰 皮尔逊 皮尔逊 抛硬币次数 2048 4040 12000 24000 正面朝上次数 1061 2048 6019 12012 正面朝上频率 0.5181 0.5069 0.5016 0.5005
P( A)
m n
10
第一节 概率的一般概念
一、概率的定义
例如:将一枚硬币抛掷 3 次,观察正、反面出现的情况。则 所有可能结果有8种: 正正正、正正反、正反正、反正正、正反反、反正反、反反 正、反反反。 若一次正面朝上为事件 A ,那么事件 A 包括 3 中可能结果:正 反反、反正反、反反正,即m=3。 于是抛3次硬币恰有一次正面朝上的概率为:
npq 101/ 2 1/ 2 1.58
31
第二节 二项分布
四、二项分布的平均数和标准差 例如:有一份试卷,共有50道选择题,并且都为四选一,假 定一个学生一点都不会,只能凭猜测来回答。问凭猜测来回 答,平均能猜对几道题,猜对题目数的标准差为多少。 分析:因为完全不会做而只是靠猜测,因此属于二项分布的 运用条件。
三、概率的加法和乘法 2、概率的乘法 例如: 有红、绿、兰3个球放在一个布袋子里,在一次抽取中,摸 到红、绿、兰各种颜色的球的概率各为1/3。现在让抽取了 一次后,把球放回去再抽取一次,问两次都摸着红球的概率 是多少?若每次摸完球后都放回去,那么连续四次都摸到红 球的概率是多少? 答:两次都摸着红球的概率是1/9 (0.1111);连续四次都摸 到红球的概率是1/81 (0.0123)。
3
第一节 概率的一般概念
一、概率的定义 概率因寻求方法不同有两种定义,即后验概率和先验概率。 1、后验概率 (1)频率——随机事件A在n次实验中出现m次, m与n的比 值,就是随机事件A出现的频率(即相对频数)。用公式表 示为
W( A)
m n
4
第一节 概率的一般概念
一、概率的定义 (1)频率 例如:在体育课上,老师想考查学生的投篮水平,让学生站 在距篮板一定的距离投十个球。假定投了十次,进了六个。 那么把球投进篮筐这个随机事件发生的频率为多少? 答:球投进篮筐发生的频率是0.60。 再如:在某项实验中,研究者测查了100个学生,其中得85 分的有3个,现在考查的85分这个随机事件出现的频率。 答:85分发生的频率是0.03。
0 6 0 6 1 6 5 2 6 2 4
28
第二节 二项分布
三、二项分布图
二项分布图的特点:
(1)当p=q时,不管n有多大,二项分布呈对称形。 当n很大时,二项分布接近于正态分布。 当n趋近于无限大时,正态分布是二项分布的极限。 (2)当p不等于q时,且n相当小时,图形呈偏态。 但是当p小于q且np大于等于5,或者p大于q且nq大于等于5时, 二项分布即将出现向正态分布接近的趋势。
第二节 二项分布
二、二项分布函数 将二项展开式概括成一个通式
P( X ) C p q
X n X
n X
n! p X qn X X !(n X )!
X 0, 1, 2, ,n
这就是二项式分布函数,可直接求出成功事件出现X次的概 率。
27
第二节 二项分布
二、二项分布函数
例如:从男生占2/5的学校中随机抽取6个学生,问正好抽到 4个男生的概率是多少?至多抽到2个男生的概率是多少?
第三节 正态分布
概率分布——是指对随机变量各取值的概率用图表或函数式 进行的描述。 正态分布——是一种连续型随机变量的概率分布。是一种应 用极为广泛、极其重要的概率分布。 在教育研究中许多现象呈正态分布,例如,学生的学业成绩、 身高、体重等。
34
第三节 正态分布
正态分布的特点是: 1、形态像大钟,中间大两头小,左右对称,也叫做钟形分 布。 如:人的许多生理和心理特征、学生的学习成绩分布。 2、与二项分布比较: 同——正态分布也是一个理论分布,有函数式。 异——正态分布是连续型随机变量分布,而二项分布是离散 型的;函数式也不同。
《教育统计学》
职教学院 刘春雷 E-mail:lcl2156@
1
第五章
概率及概率分布
第一节 概率的一般概念 第二节 二项分布
第三节 正态分布
2
第一节 概率的一般概念
对数据所属总体的某种特征,作出具有一定可靠程度的估计 和推断。
概率分布理论就是讲解这种可靠程度的依据。 概率论是研究随机变量取值规律的科学,是进行统计推断的 基础。
答:凭猜测来回答,平均能猜对12.5道题,猜对题目数的标 准差为3.06。
32
第二节 二项分布
五、二项分布的应用 二项分布函数除了用来确定成功事件恰好出现X次的概率之 外; 在教育中主要用来判断试验结果的偶然性和真实性的界限。 属于二项分布的问题,若试验次数n较大,一般都用正态分 布近似处理。
33
二、二项分布函数 展开二项式的几个要点: (1)项数:展开式中共有n+1项。 (2)方次:每项p与q的方次之和等于n。 (3)系数:各项系数是成功事件次数的组合数。 从两端起,等距项的系数相等; 当项数为奇数时(n为偶数),中间一项的系数最大; 当项数为偶数时(n为奇数),中间两项系数相等且最大。
26
P A B P ( A) P ( B)