第六章 概率分布@
合集下载
第六章概率分析
若Z~N(0,12 );求Z0 =?
PZ>Z0 =0.005
P-1 Z Z0 =0.68268
P Z <Z0 =0.95
PZ>Z0 =0.025
考研真题
1、在人格测验上的分数形成正态分布 80, 12,
一个随机样本n=16,其均值大于85的概率是(
)。
正态分布表的使用:已知P值求Z
①已知Z=0到Z=Z0之间的面积,直接查表得Z; ②已知Z=-Z0到Z=0之间的面积,查得Z前加上负号; ③已知曲线右侧尾端面积,怎样求Z? ④已知曲线左侧侧尾端面积,怎样求Z? ⑤已知正态曲线下中央部位 面积怎样求Z?
习题:
若X ~N(10,22 );则P(10 X 12) ?;P(X 16) ?
第六章 概率分布
后验概率
随机事件A的频率:对随机事件进行n次观测,其中某
一事件A出现的次数m与观测次数n的比值。
当n无限增大时,随机事件A的频率会稳定在一个常数P,
这个常数就是随机事件A的概率。
m P A Lim n n 因这种概率是由随机事件A出现的次数决定,故称后验 概率或统计概率。
先验概率
古典概率模型要求满足两个条件: ①试验的所有可能结果是有限的; ②每一个基本事件出现的可能性相等。 如果基本事件的总数为n,事件A包括m个基本事件,
PZ>Z0 =0.005
P-1 Z Z0 =0.68268
P Z <Z0 =0.95
PZ>Z0 =0.025
考研真题
1、在人格测验上的分数形成正态分布 80, 12,
一个随机样本n=16,其均值大于85的概率是(
)。
正态分布表的使用:已知P值求Z
①已知Z=0到Z=Z0之间的面积,直接查表得Z; ②已知Z=-Z0到Z=0之间的面积,查得Z前加上负号; ③已知曲线右侧尾端面积,怎样求Z? ④已知曲线左侧侧尾端面积,怎样求Z? ⑤已知正态曲线下中央部位 面积怎样求Z?
习题:
若X ~N(10,22 );则P(10 X 12) ?;P(X 16) ?
第六章 概率分布
后验概率
随机事件A的频率:对随机事件进行n次观测,其中某
一事件A出现的次数m与观测次数n的比值。
当n无限增大时,随机事件A的频率会稳定在一个常数P,
这个常数就是随机事件A的概率。
m P A Lim n n 因这种概率是由随机事件A出现的次数决定,故称后验 概率或统计概率。
先验概率
古典概率模型要求满足两个条件: ①试验的所有可能结果是有限的; ②每一个基本事件出现的可能性相等。 如果基本事件的总数为n,事件A包括m个基本事件,
第六章概率与概率分布本章内容
第六章概率与概率分布本章内容
• (2)理论分布 • 理论分布是指根据理论推演出来的随机变量的概
率分布模型,它指的是总体的分布规律(与样本分 布相对应)正态分布、二项分布、T分布、F分布、 χ2分布。在不同的理论分布中,反映它们特征的参 数是不一样的。
第六章概率与概率分布本章内容
• 3、基本随机变量分布与抽样分布 • (1)基本随机变量分布 • (2)抽样分布 • 指样本统计量的理论分布,如样本平均数、方差、
• 解:设每台电视机在保修期以内坏的可能性为 P (此时每 台只能赚2000-1200-500 = 300元),则超过保质期才坏的 可能性为 1-P (此时每台可以赚2000-1200 = 800元),因 此有等式:
第六章概率与概率分布本章内容
此处,利用正态分布的对称性,用 (0.9-0.5 = 0.4) 查标准正态分布概率表得 Z = 1.28,实际上 X 点 所对应的 Z 分数应该是 -1.28,
• 例题 • 1、某地区成年人身高服从正态分布,其均值是169cm,
标准差为7cm。求满足满足以下条件的成人的比例:⑴、 155cm以下;⑵、176cm以上;⑶155cm~176cm之间 • 解:
第六章概率与概率分布本章内容
• 查正态分布,当Z=2时,P=0.47725,当 Z=1时,P=0.34134。所以 :
对称的,对称轴是经过平均数点的垂线。(2)中央点最高,然后逐渐向两侧下
• (2)理论分布 • 理论分布是指根据理论推演出来的随机变量的概
率分布模型,它指的是总体的分布规律(与样本分 布相对应)正态分布、二项分布、T分布、F分布、 χ2分布。在不同的理论分布中,反映它们特征的参 数是不一样的。
第六章概率与概率分布本章内容
• 3、基本随机变量分布与抽样分布 • (1)基本随机变量分布 • (2)抽样分布 • 指样本统计量的理论分布,如样本平均数、方差、
• 解:设每台电视机在保修期以内坏的可能性为 P (此时每 台只能赚2000-1200-500 = 300元),则超过保质期才坏的 可能性为 1-P (此时每台可以赚2000-1200 = 800元),因 此有等式:
第六章概率与概率分布本章内容
此处,利用正态分布的对称性,用 (0.9-0.5 = 0.4) 查标准正态分布概率表得 Z = 1.28,实际上 X 点 所对应的 Z 分数应该是 -1.28,
• 例题 • 1、某地区成年人身高服从正态分布,其均值是169cm,
标准差为7cm。求满足满足以下条件的成人的比例:⑴、 155cm以下;⑵、176cm以上;⑶155cm~176cm之间 • 解:
第六章概率与概率分布本章内容
• 查正态分布,当Z=2时,P=0.47725,当 Z=1时,P=0.34134。所以 :
对称的,对称轴是经过平均数点的垂线。(2)中央点最高,然后逐渐向两侧下
第六章 离散概率分布
与其日平均误差的偏离程度小。
• 研究随机变量与其均值的偏离程度是有必要的。
• 怎么样去度量这个偏离程度呢?
• (1)xk-E(X)表示xk与E(X)之间的偏差;
• (2)E[X-E(X)]不能反映X与E(X)之间的整体偏差;
• (3)E{|X-E(X)|}可以度量X与E(X)之间的整体偏差,但运算 不方便;
p 0.1 0.8 0.1 0.1 0.2 0 0.2 0.1
2022/2/1
商学院
14
本次您浏览到是第十四页,共五十页。
• 例:有A,B两射手,他们的射击技术如表所示,试 问哪一个射手本领较好?
射手名称 击中环数
概率
A
B
8 9 10 8 9 10
0.3 0.1 0.6 0.2 0.5 0.3
解 A射击平均击中环数为
• 我们知道,随机变量的分布列或概率密度,全面地描述 了随机变量的统计规律。但在许多实际问题中,这样的 全面描述并不使人感到方便。
• 已知一只母鸡的年产蛋量是一个随机变量,如果要
比较两个品种的母鸡的年产蛋量,通常只要比较这两 个品种的母鸡的年产蛋量的平均值就可以了。平均值 大就意味着这个品种的母鸡的产蛋量高。如果不去比 较它们的平均值,而只看它们的分布列,虽然全面,却 使人不得要领,既难以掌握,又难以迅速地作出判断。
2022/2/1
商学院
• 研究随机变量与其均值的偏离程度是有必要的。
• 怎么样去度量这个偏离程度呢?
• (1)xk-E(X)表示xk与E(X)之间的偏差;
• (2)E[X-E(X)]不能反映X与E(X)之间的整体偏差;
• (3)E{|X-E(X)|}可以度量X与E(X)之间的整体偏差,但运算 不方便;
p 0.1 0.8 0.1 0.1 0.2 0 0.2 0.1
2022/2/1
商学院
14
本次您浏览到是第十四页,共五十页。
• 例:有A,B两射手,他们的射击技术如表所示,试 问哪一个射手本领较好?
射手名称 击中环数
概率
A
B
8 9 10 8 9 10
0.3 0.1 0.6 0.2 0.5 0.3
解 A射击平均击中环数为
• 我们知道,随机变量的分布列或概率密度,全面地描述 了随机变量的统计规律。但在许多实际问题中,这样的 全面描述并不使人感到方便。
• 已知一只母鸡的年产蛋量是一个随机变量,如果要
比较两个品种的母鸡的年产蛋量,通常只要比较这两 个品种的母鸡的年产蛋量的平均值就可以了。平均值 大就意味着这个品种的母鸡的产蛋量高。如果不去比 较它们的平均值,而只看它们的分布列,虽然全面,却 使人不得要领,既难以掌握,又难以迅速地作出判断。
2022/2/1
商学院
第六章概率分布2-二项分布、样本分布
理解概率和概率分布
概率是0到1之间的一个数,表示某一随机现象某一 结果发生的可能性 概率分布是表示随机现象的结果与其可能性之间的 函数。 正态分布是以平均数为中点的对称图形。 正态分布曲线下,标准差和概率有一定的数量关系。 正态分布表包括三个部分内容:Z分数、y值和p值。 利用正态分布表,可以(1)依据Z分数求概率 (2)依据概率求Z分数
总结——四大分布
关系
Z T X2 F
原始数据 平均数 方差
用处
在二项分布图中,
坐标的意义
X:n次试验中,成功出现x次的A事件
Y:A事件对应的概率(也是概率密度)
二项分布与正态分布
在n次独立的二项试验中,若在每次试验 中成功的概率为p,失败的概率为q (p+q=1) P=q=0.5,n无穷大时,二项分布为正 态分布——正态分布是二项分布的极限 p<q, np≥5,或p>q ,nq≥5时,二项分布 接近正态分布, 随机变量x近似服从的正 态分布。
Z分数的线性转换
正态分布图
正态分布曲线图
坐标的意义
X:在+∞可能性中,x事件出现
Y: x事件出现的概率密度
Z分数及其线性转换T=KZ+C
抽样
研究样本
心理统计概率分布
心理统计概率分布
作业:
某地区进行公务员考试,准备在参加考试的1500人 中录取180人,考试分数接近正态分布,平均分为72 分,标准差为12.5,问录取分数线是多少?
求下列个体在正态曲线下的概率: 1. p(0<Z<1.5) 2. p(1<Z<1.96) 3. p(Z<2.58) 4. p(Z>1.96)
三、二项分布的应用(P181)
心理统计概率分布
心理统计概率分布
第四节 抽样分布
一、抽样分布的概念 要区分以下三种不同性质的分布: 1. 总体分布:总体内每一个体数值的频数分布 2. 样本分布:样本内每一个体数值的频数分布 3. 抽样分布:某一种统计量的概率分布(一个理论的 概率分布,是统计推断的理论依据)
已知X服从均值为 ,标准差为 的正态分布,求以 下概率:
心理统计概率分布
心理统计概率分布
第三节 二项分布
一、二项分布的概念 (一)二项试验(P176) 在同一条件下,将一种试验重复进行n次,如果:①
在每次试验中,所有可能出现的事件只有两个,即A 与 ,且P(A)=p,P( )=q在各次试验中保持不 变; ②各次试验相互独立。满足①②条件的n次重复 试验叫做二项试验,或称n重贝努里试验。
5. 在正态曲线下的面积为1,且标准差与概率(面积) 有一定的数量关系。正负一个 标准差之间包含总面 积的68.26%,正负1.96个标准差之间包含总面积的 95%,正负2.58个标准差之间包含总面积的99%。
统计学习题第六章概率与概率分布
统计学习题第六章概率与概率分布
第六章概率与概率分布
第一节概率论
随机现象与随机事件·事件之间的关系(事件和、事件积、事件的包含与相等、互斥事件、对立事件、互相独立事件)·先验概率与古典法·经验概率与频率法
第二节概率的数学性质
概率的数学性质(非负性、加法规则、乘法规则)·排列与样本点的计数·运用概率方法进行统计推断的前提
第三节概率分布、期望值与变异数
概率分布的定义·离散型随机变量及其概率分布·连续型随机变量及其概率分布·分布函数·数学期望与变异数
一、填空
1.用古典法求算概率.在应用上有两个缺点:①它只适用于有限样本点的情况;②它假设(机会均等)。
2.分布函数)(x F 和)(x P 或 )(x 的关系,就像向上累计频数和频率的关系一样。所不同的是,)(x F 累计的是(概率)。
3.如果A 和B (互斥),总合有P(A/B)=P 〔B/A 〕=0。
4.(大数定律)和(中心极限定理)为抽样推断提供了主要理论依据。
5.抽样推断中,判断一个样本估计量是否优良的标准是(无偏性)、(一致性)、(有效性)。
6.抽样设计的主要标准有(最小抽样误差原则)和(最少经济费用原则)。
7.在抽样中,遵守(随机原则)是计算抽样误差的先决条件。
8.抽样平均误差和总体标志变动的大小成(正比),与样本容量的平方根成(反比)。如果其他条件不变,抽样平均误差要减小到原来的1/4,则样本容量应(增大到16倍)。
9.若事件A 和事件B 不能同时发生,则称A 和B 是(互斥)事
件。
10.在一副扑克牌中单独抽取一次,抽到一张红桃或爱司的概率是(1/4 );在一副扑克牌中单独抽取一次,抽到一张红桃且爱司的概率是( 1/52 )。
06 概率分布
3 2 2 3 P 0.48 5 5 5 5
概率分布 心理统计学
练习
1.两个色子掷一次,出现相同点
数的概率是多少?
2.掷四个硬币时,出现①两个正
面两个反面②四个正面③三个反面的 概率各是多少?
概率分布 心理统计学
(三)概率分布类型
概率分布(probability distribution)
测验题目的难易度一般用答对者
的百分数表示,但是百分数不是等距
尺度,又是比较难度距离时,要将其
转换成难度分数。
概率分布
心理统计学
练习
测验题标号 1 5 10 15 概率分布 通过率 98 85 70 42 心理统计学
步骤:
1.计算各题目的通过率 2.用0.5减去通过率,不计正负号。获得正
5.p=0.23,z=?,y=?
心理统计学
概率分布
三.正态分布理论在测验中的 应用
(一)化等级评定为测量数据
前提:被评定的心理量是否为正态分布。
(二)确定测验题目的难易度 (三)在能力分组或等级评定时确定人数
(四)测验分数的正态化
概率分布 心理统计学
(一)化等级评定为测量数据
在心理学研究中,常常遇到等级评定的 结果。但是不同评定者的评定结果往往不 一致,无法综合他们的评定结果,而且等 级分数不是等距数据,不同事物的评定结 果不能直接比较。将等级评定的结果转化
第六章 统计学 概率分布
要点总结
第六章
概率分布
科学研究的最终目的是通过样本数据的研
究,来推测全体的基本特征,并对推断 的正确性进行概率检验 统计推断:从样本出发来推断总体分布的 过程。 概率论是统计推断的数理基础。
本章内容
第一节
概率的基本概念 第二节 二项分布 第三节 正态分布 第四节 样本分布
第一节 概率的基本概念
随机变量取值的概率分布情况用数学 方法(函数)进行描述
只有了解随机变量的概率分布,才能
使统计分析与推论有可能,为统计分 析提供依据
(一)离散分布与连续分布
依随机变量是否具有连续性进行划分 散随机变量,如计数数据,离散随机变量 的概率分布为离散分布 常见:二项分布,泊松分布(Poisson)
离散分布:取孤立数值的随机变量为离
二项分布的平均数:μ=np
二项分布的标准差:
npq
n 为试验次数 p为事件发生的概率 q=1-p 随着试验次数 n 的增大 , 二项分布的均数与标准差 也将随着增大
式中
三、二项分布的应用
在心理和教育研究中,二项分布主要用于 解决含有机遇性质问题。 机遇性质问题:是指在实验或调查当中, 其结果可能猜测而造成的。如:选择题的 回答,完全有可能是猜测造成的。 凡此类问题,欲区分由猜测造成的结果与 真实结果之间的界限,就要应用二项分布 来解决。
第六章
概率分布
科学研究的最终目的是通过样本数据的研
究,来推测全体的基本特征,并对推断 的正确性进行概率检验 统计推断:从样本出发来推断总体分布的 过程。 概率论是统计推断的数理基础。
本章内容
第一节
概率的基本概念 第二节 二项分布 第三节 正态分布 第四节 样本分布
第一节 概率的基本概念
随机变量取值的概率分布情况用数学 方法(函数)进行描述
只有了解随机变量的概率分布,才能
使统计分析与推论有可能,为统计分 析提供依据
(一)离散分布与连续分布
依随机变量是否具有连续性进行划分 散随机变量,如计数数据,离散随机变量 的概率分布为离散分布 常见:二项分布,泊松分布(Poisson)
离散分布:取孤立数值的随机变量为离
二项分布的平均数:μ=np
二项分布的标准差:
npq
n 为试验次数 p为事件发生的概率 q=1-p 随着试验次数 n 的增大 , 二项分布的均数与标准差 也将随着增大
式中
三、二项分布的应用
在心理和教育研究中,二项分布主要用于 解决含有机遇性质问题。 机遇性质问题:是指在实验或调查当中, 其结果可能猜测而造成的。如:选择题的 回答,完全有可能是猜测造成的。 凡此类问题,欲区分由猜测造成的结果与 真实结果之间的界限,就要应用二项分布 来解决。
第六章__概率分布
• (一)化等级评定为测量数据
• 将等级评定转化为测量数据,首先要考虑被评定
的心理量是否为正态分布。
• 将等级评定转化为测量数据的方法是用各等级中
点的Z分数代表该等级分数。
• • • • •
具体步骤 ①根据各等级被评者的数目求各等级的人数比率; ②求各等级比率值的中间值,作为该等级的中点; ③求各等级中点以上(或以下)的累加比率; ④用累加比率查正态表求Z值,该Z分数就是各等级代 表性的测量值; • ⑤求被评者所得评定等级的测量数据的算术平均数, 即为每个被评定者的综合评定分数。
A
B C D E 总数
• 表6-3 各学生所获得的评定等级
学生 1 2 3 教师甲 B A D 教师乙 A B C 教师丙 A A C
• 表6-4 化等级评定为Z分数
教师甲 等 级 A B C D E P 比率中点 Z 以下累加 0.975 0.825 0.50 0.175 0.025 1.96 0.94 0 -0.94 -1.96 P 比率中 点以下 累加 0.95 0.80 0.50 0.20 0.05 Z P 比率中 点以下 累加 0.90 0.675 0.375 0.125 0.025 Z 教师乙 教师丙
2
3
/N
3/2
/ N
• 当g1=0时分布是对称的;当g1>0时,分布为正偏态 ;当g1<0时,分布呈负偏态。当观测数据数目N>200 时,这个偏态系数的统计量g1才较可靠。
社会统计学第6章_概率与概率分布
记为
P( A)
事件A所包含的基本事件个数 样本空间所包含的基本 事件个数
=m n
概率的古典定义(实例)
某钢铁公司所属三个工厂的职工人数如下表。从 该公司中随机抽取1人,问:
(1)该职工为男性的概率 (2)该职工为炼钢厂职工的概率
某钢铁公司所属企业职工人数
工厂
男职工
女职工
合计
炼钢厂 炼铁厂 轧钢厂
4000 3200 900
可以在相同的条件下重复进行 每次试验的可能结果可能不止一个,但试验的所有
可能结果在试验之前是确切知道的 在试验结束之前,不能确定该次试验的确切结果
基本事件(样本点):随机试验的每一个可能的结果。
样本空间
1. 基本事件 • 一个不可能再分的随机事件 • 例如:掷一枚骰子出现的点数
2. 样本空间 • 一个试验中所有基本事件的集合,用表示 • 例如:在掷枚骰子的试验中,{1,2,3,4,5,6} • 在投掷硬币的试验中,{正面,反面}
• 简单事件:随机事件仅包含样本空间中的一个样本 点。
• 复合事件:随机事件包含样本空间中的一个以上的 样本点。复合事件是样本空间的某个子集。
• 必然事件:每次试验一定出现的事件,用表示
例如:掷一枚骰子出现的点数小于7
• 不可能事件:每次试验一定不出现的事件,用表 示
例如:掷一枚骰子出现的点数大于6
P( A)
事件A所包含的基本事件个数 样本空间所包含的基本 事件个数
=m n
概率的古典定义(实例)
某钢铁公司所属三个工厂的职工人数如下表。从 该公司中随机抽取1人,问:
(1)该职工为男性的概率 (2)该职工为炼钢厂职工的概率
某钢铁公司所属企业职工人数
工厂
男职工
女职工
合计
炼钢厂 炼铁厂 轧钢厂
4000 3200 900
可以在相同的条件下重复进行 每次试验的可能结果可能不止一个,但试验的所有
可能结果在试验之前是确切知道的 在试验结束之前,不能确定该次试验的确切结果
基本事件(样本点):随机试验的每一个可能的结果。
样本空间
1. 基本事件 • 一个不可能再分的随机事件 • 例如:掷一枚骰子出现的点数
2. 样本空间 • 一个试验中所有基本事件的集合,用表示 • 例如:在掷枚骰子的试验中,{1,2,3,4,5,6} • 在投掷硬币的试验中,{正面,反面}
• 简单事件:随机事件仅包含样本空间中的一个样本 点。
• 复合事件:随机事件包含样本空间中的一个以上的 样本点。复合事件是样本空间的某个子集。
• 必然事件:每次试验一定出现的事件,用表示
例如:掷一枚骰子出现的点数小于7
• 不可能事件:每次试验一定不出现的事件,用表 示
例如:掷一枚骰子出现的点数大于6
心理与教育统计学第6章概率分布
6.1.1 什么是概率
(一)后验概率(或统计概率)
观察随机事件A出现的次数的方式来 决定A的概率,称为后验概率。
随机事件的频率
(6.1)
当n无限增大时,随机事件A的频率会 稳定在一个常数P,这个常数就是随机事
件A的概率。
(6.2)
(二)先验概率(古典概率) 在事件A发生之前,可以通过计算确
定的概率,称为先验概率。
0.0978
0.0788 0.0776 0.0707 0.0706 0.0634 0.0594 0.0573
字母 L
D
U C F M W Y G
频率 0.0394
0.0389
0.028 0.0268 0.0256 0.0244 0.0214 0.0202 0.0187
字母 P
B
V K X J Q Z
(6.6)
式中:
• 例 10个硬币投掷一次,或1个硬币投掷10 次,问5次正面向上的概率是多少?
解:根据题意,n=10,p=q=0.5,X=5
•例 已知某长一批产品中一级品率为0.2现 在从中随机地抽查20只。问20只元件中恰 好有6个一级品的概率是多少?
解:n=20, p=0.2, q=0.8. x=6
频率 0.0186
0.0156
0.0102 0.006 0.0016 0.001 0.0009 0.0006
第6章概率分布
6—4 几种重要的连续型概率分布
正态分布 χ2〔卡方〕分布 t 分布
返回
正态分布
如果连续随机变量X的概率密度函数为:
f (x)
1
2
(x)2
e 22
〔
-∞<x<+∞〕
其中σ>0, 则称X服从参数为μ,σ2的正态分布,记作:X~N〔μ, σ2 〕, 其中μ为随机变量的均值,σ2为随机变量的方差.
正态分布〔标准正态分布〕
随机试验必须符合以下条件:
〔1〕它可以在相同条件下重复进行; 〔2〕试验的所有可能结果是事先已知 的,并且不止一个; 〔3〕每次试验只出现这些可能结果中 的一个,但不能预先断定 会出现哪种 结果
返回
随机事件
随机试验的每一个可能的结果称为基本事件.有两个或两个以上基 本事件组成的集合称为复合事件.无论基本事件还是复合事件,它们 在随机试验中发生与否,都带有随机性,所以都称为随机事件. 如果某一事件在每次试验中一定出现,我们就把它称为必然事件.如 果某一事件在每次试验中都不出现,我们就把它称为不可能事件.
返回
二项分布<举例>
[例]某种商品的不合格率为0.3,一顾客从商店买了6件这种商品,试求以 下事件的概率:
〔1〕恰有4件商品不合格; 〔2〕不合格件数不超过一半; 〔3〕至少有一件不合格品.
二项分布<举例>
试验统计方法第六章概率分布
概率的加法法则additive law of probability
»两事件和的概率可由下式给出: P(A∪B) = P(A) + P(B) – P(A∩B)
»如A和B是互不相容事件则: P(A∪B) = P(A) + P(B)
»如有有限个事件两两互不相容则: P(A1∪A2∪….. ∪An) = P(A1) + P(A2) + ..+ P(An)
6
孢子堆占叶(秆)面积100%
四、农药药效的调查和计算
药效试验的目的,是要取得各种农药防治病虫害的 效果的数据,故必须在处理前后分别检查死亡虫数或残 存虫数.病株数、病叶数和病斑数等,然后根据处理前 后虫、病数的变化或增减,求得防治效果,以表示农药 的药效。
农药药效的表示方法
杀虫剂的药效常用 害虫死亡率、虫口减退率、被害 率、缺苗率、防治效果等来表示;
眼点非滞育蛹的条件概率。
例6-3:设小块林地,有1000株林木,其中云南 松有538株,内有31株病腐;有华山松323株,内 有22株病腐;有栎树139株,内有8株病腐。由该 1000株林木中随机抽取1株,试验问:P(病腐|栎 树),P(病腐|针叶树)各多少?
P(病腐|栎树) = P(病腐栎树)/ P(栎树),
»事件A的概率和它的对立事件A-的概率: P(A-) = 1 – P(A)
条件概率conditional probability
»两事件和的概率可由下式给出: P(A∪B) = P(A) + P(B) – P(A∩B)
»如A和B是互不相容事件则: P(A∪B) = P(A) + P(B)
»如有有限个事件两两互不相容则: P(A1∪A2∪….. ∪An) = P(A1) + P(A2) + ..+ P(An)
6
孢子堆占叶(秆)面积100%
四、农药药效的调查和计算
药效试验的目的,是要取得各种农药防治病虫害的 效果的数据,故必须在处理前后分别检查死亡虫数或残 存虫数.病株数、病叶数和病斑数等,然后根据处理前 后虫、病数的变化或增减,求得防治效果,以表示农药 的药效。
农药药效的表示方法
杀虫剂的药效常用 害虫死亡率、虫口减退率、被害 率、缺苗率、防治效果等来表示;
眼点非滞育蛹的条件概率。
例6-3:设小块林地,有1000株林木,其中云南 松有538株,内有31株病腐;有华山松323株,内 有22株病腐;有栎树139株,内有8株病腐。由该 1000株林木中随机抽取1株,试验问:P(病腐|栎 树),P(病腐|针叶树)各多少?
P(病腐|栎树) = P(病腐栎树)/ P(栎树),
»事件A的概率和它的对立事件A-的概率: P(A-) = 1 – P(A)
条件概率conditional probability
教育统计学第六章 概率及概率分布
例如,df=6,
=0.05,双侧检验, t(6)0.05 2.447
(见图6-5,图中阴影部分的面积为0.05), 即服 从自由度为6的 t分布t 的 绝对值大于 等于2.447的概率为0.05。
又如当df=28, 0.01 时,单侧临界 t ( 28)0.01 2.467 。 这表示:自由度为28,显著性水平为0.01,t的单侧临界值 为2.467(见图6-6,图中阴影部分面积为0.01),即服从t 分布的值大于等于2.467的概率为0.01。
一个连续性随机变量的概率分布是指这个 随机变量在所有取值区间上概率取值的分布情 况。 连续性随机变量的分布函数性质:
1、 F ( x) 是非降函数,即当
≤
x1 x2
时,有
F ( x1 ) F ( x2 )
2、 F () 0 ; F () 1
;
3、当
x1 x 2
时,
x2
如果事件A与事件B是相互独立的两个事件,那 么事件A的发生并不影响事件B的发生, 即:
P( B / A) P( B)
也就是说,当两个事件独立时,这两个事件乘积 的概率等于这两个事件概率的乘积:
wenku.baidu.comp( AB) p( A) p( B)
例4 某中学初一学生参加课外小组的情况如下表:
例4 某中学初一学生参加课外小组的情况如下表:
第六章两种常用的概率分布
二项分布的性质
?从概率直方图可以看到,二项分布有如 下性质:
?①.当p=q时,图形是对称的。 ?②.当p≠q时,直方图呈偏态。p>q与
p<q时的偏斜方向相反。
(二)二项分布的平均数与标准差
二项分布的平均数:随机变量k算术平均数, 以k 为原始数据,以概率p为权数的加权算术 平均数)
? ? np (6.7)
? (二)事件的概率(事件发生的概率与频率有关) ? 1、频率:对于随机事件A,如果在N次试
验中出现a次,则A发生的频率记作
F ?A ? ?
a
N
(6.1)
频率满足不等式 0≤F(A)≤1。若A是必然事件,则 F(A)=1,若A是不可能事件 ,则F(A)=0。
2、经(后)验概率(或统计概率)
计数某事件在一系列试验中发生的次数,然后 计算发生次数与试验总次数的比值得到频率。试验 次数越多,某事件发生的频率会在某个常数上下波 动。当试验次数无穷时该事件发生的频率会与一常 数相等,把这一常数称为某事件的 概率。(统计定 义)
四将等级评定结果转化为连续变量型分数由于学生学习成绩或能力是服从正态分布的如果要将等级评定结果转化为连续变量型分数可以利用正态分布模型将等级成绩转换为标准分数再进行线性转换转换为类似于百分制评分中的连续变量型分数
第六章 两种常用的概率分布
第一节 概率 第二节 二项分布 第三节 正态分布
第6章 概率分布及概率分布图
Excel 统计分析
二项分布又称贝努利分布, 二项分布又称贝努利分布,用来描述不连续的离散资 又称贝努利分布 如果在任一次的试验中,某事件发生的概率( 料。如果在任一次的试验中,某事件发生的概率(或称成 功的概率)均为p,则不发生的概率均为q,其中q=1-p, 功的概率)均为 ,则不发生的概率均为 ,其中 , 则在N次独立试验中该事件发生 次的概率为: 则在 次独立试验中该事件发生X次的概率为: 次独立试验中该事件发生 次的概率为
µ = Np
σ 2 = Np (1 − p) 二项分布的方差: 二项分布的方差:
二项分布的偏度: 二项分布的偏度:
α3 =
1− 2 p Np (1 − p )
1 − 6 p(1 − p ) α 二项分布的峰度: 二项分布的峰度: 4 = 3 + Np (1 − p )
Excel 统计分析
BINOMDIST(number_s, trials, probability_s, cumulative) ( ) BINOMDIST用于计算二项分布的概率值,其中 用于计算二项分布的概率值, 用于计算二项分布的概率值 number_s为试验成功的次数,trials为独立试验的次数, 为试验成功的次数, 为独立试验的次数, 为试验成功的次数 为独立试验的次数 Probability_s为每次试验中成功的概率,cumulative为一 为每次试验中成功的概率, 为每次试验中成功的概率 为一 逻辑值,用于确定函数的形式。 逻辑值,用于确定函数的形式。 如果cumulative为TRUE,函数 如果 为 ,函数BINOMDIST返回累积 返回累积 分布函数,即至多number_s次成功的概率;如果为 次成功的概率; 分布函数,即至多 次成功的概率 FALSE,返回概率密度函数,即number_s次成功的概率。 次成功的概率。 ,返回概率密度函数, 次成功的概率
二项分布又称贝努利分布, 二项分布又称贝努利分布,用来描述不连续的离散资 又称贝努利分布 如果在任一次的试验中,某事件发生的概率( 料。如果在任一次的试验中,某事件发生的概率(或称成 功的概率)均为p,则不发生的概率均为q,其中q=1-p, 功的概率)均为 ,则不发生的概率均为 ,其中 , 则在N次独立试验中该事件发生 次的概率为: 则在 次独立试验中该事件发生X次的概率为: 次独立试验中该事件发生 次的概率为
µ = Np
σ 2 = Np (1 − p) 二项分布的方差: 二项分布的方差:
二项分布的偏度: 二项分布的偏度:
α3 =
1− 2 p Np (1 − p )
1 − 6 p(1 − p ) α 二项分布的峰度: 二项分布的峰度: 4 = 3 + Np (1 − p )
Excel 统计分析
BINOMDIST(number_s, trials, probability_s, cumulative) ( ) BINOMDIST用于计算二项分布的概率值,其中 用于计算二项分布的概率值, 用于计算二项分布的概率值 number_s为试验成功的次数,trials为独立试验的次数, 为试验成功的次数, 为独立试验的次数, 为试验成功的次数 为独立试验的次数 Probability_s为每次试验中成功的概率,cumulative为一 为每次试验中成功的概率, 为每次试验中成功的概率 为一 逻辑值,用于确定函数的形式。 逻辑值,用于确定函数的形式。 如果cumulative为TRUE,函数 如果 为 ,函数BINOMDIST返回累积 返回累积 分布函数,即至多number_s次成功的概率;如果为 次成功的概率; 分布函数,即至多 次成功的概率 FALSE,返回概率密度函数,即number_s次成功的概率。 次成功的概率。 ,返回概率密度函数, 次成功的概率
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.正态分布可以转化为标准正态分布曲线(μ=0,σ2=1)。
三、标准正态分布
对于任何一个服从正态分布N(μ,σ2)的随机变量x,都 可以通过标准化变换:z=(x-μ)/σ;将标准分数代入 正态曲线函数,并且,令σ=1,则公式变换为标准正态 分布函数:
Y
◆
1 2
e
Z
2
2
标准正态分布的μ=0,σ2=1,
(二)经验分布与理论分布
依分布函数的来源,可将概率分布分为经验分布与理 论分布。 经验分布(empirical distribution)是指根据观察或实 验所获得的数据而编制的次数分布或相对频率分布。
理论分布(theoretical distribution)是按某种数学模
型计算出的概率分布。
在心理与教育研究中,常常遇到等级评定的结果。但是 不同评定者的评定标准往往不一致,无法综合他们的评定结 果;而且等级分数不是等距数据,不同事物的评定结果不能 直接比较。将等级评定的结果转化为数量结果,就可解决这 些问题。
(例6-2)
具体方法
根据各等级被评者的数目求各等级的人数比率; 求各等级比率值的中间值;
2 2
其中μ为平均数,σ2为方差,称随机变量x服从正态 分布 , 记为x~N(μ,σ2)。
二、 正态分布 的特征
1.正态分布是对称的曲线,对称轴为x=μ;M=Md=Mo,y(max) =0.3989 2.正态曲线的拐点为正负1个标准差处。 3.正态曲线下的面积为1,左右两边相等=0.5
4.正态分布随平均数μ与标准差σ的变化而变化。
从表可看出,随着实验次数的增多, 1个人发生从
众行为这个事件的概率越来越稳定地接近0.7,我
们就把0.7作为这个事件的概率。
在一般情况下,随机事件的概率 p 是不可能 准确得到的。通常以试验次数n充分大时随机事件A 的频率作为该随机事件概率的近似值。
即 P(A)=p≈m/n
(n充分大)
(二)先验概率(古典概率)
(例6-3)
例:今有1000人参加一项数学能力测验,欲将测验结 果评为六个等级。问各等级评定的人数应是多少?
(四)以标准分数表示考试成绩
★比较学生的考试成绩时,使用原始分数有其 不合理之处:
⑴原始分制度没有提示考生成绩在考生团体成绩中的位置。
⑵由于各科命题难度不同,导致各科原始分之间不能直接比较,
1.随机事件的频率 ——在相同条件下进行n次重复试验,如果随机事件A发生的 次数为m ,那么m/n称为随机事件A的频率; W ( A ) 2.随机事件的概率 ——当n无限增大时,随机事件A的频率会稳定在一个常数P, 这个常数就是随机事件A的概率。
P A Lim m n
m n
n
这样定义的概率称为后验概率或统计概率。
四、正态分布表的使用(P166)
统计学家已编制好了标准正态分布表,使其使 用非常方便。
表中仅列有标准正态曲线下的面积,因此,查 表前应先将原始变量X转换为Z。
Z
X X S
1.已知Z值求概率P
(1)求Z分数与平均数(Z=0)之间的概率; (2)求Z分数以上或以下的概率;
(3)求两个Z分数之间的概率。
解:考试成绩服从正态分布,根据题意招生人数的 概率为P(Z≥Z0) = 150/2800 = 0.05357 P(0<Z< Z0) = 0.5-0.05357 = 0.44643 查正态分布表,得Z0 = 1.6112 X0= 75 + 1.6112×8 = 87.8894 ≈ 88
五、正态分布理论在测验中的应用 (一)化等级评定为测量数据
(三)基本随机变量分布与抽样分布
依所描述的数据的样本特性,可将概率分布分为 基本随机变量分布与抽样分布(sampling distribution)。
基本随机变量分布是随机变量各种不同取值情况 的概率分布;(二项分布、正态分布)
抽样分布是从同一总体内抽取的不同样本的统计 量的概率分布。(平均数、量平均数之差、方差、 相关系数等)
X X
n X
n! X ! n X !
p
X
q
n X
例6-4
b X . n . p :n次试验中某事件出 现X次,每次试验出现 的概率为P,不出现的 概率为q.
例:从男生占2/5的学校中随机抽取6个学生,问正 好抽到4个男生的概率是多少?最多抽到2个男生的 概率是多少? 解:将n=6,p=2/5,q=3/5,X=4代入公式,则恰好抽到4 个男生的概率为:
通过,应聘录取和落聘……
二、二项分布
二项分布:是指试验仅有两种不同性质结果的概率分布。 具体定义:有n次试验,各次试验彼此独立,每次试验某事件出 现的概率都是P,某事件不出现的概率都是q(1-P),则对于某 事件出现X次(0,1,2,…n)的概率分布为:
b X .n . p C n p q
第二节 正态分布
正态分布(normal distribution)也称为常态分 布,是连续型随机变量概率分布的一种,是在数理 统计的理论与实际应用中占有最重要地位的一种理 论分布,也称高斯分布。
一、正态分布曲线函数
正态分布曲线函数又称概率密度函数,其一般 公式为 X 1 2 Y e 2
三、概率分布类型
概率分布(probability distribution)是指对随机
变量取不同值时的概率分布情况用函数进行描述。
依不同的标准,对概率分布可作不同的分类。
(一)离散型分布与连续型分布
依随机变量的类型(是否具有连续性),可将概率分布分 为离散型概率分布与连续型概率分布。
心理与教育统计学中最常用的离散型分布是二项分布,最 常用的连续型分布是正态分布。
如果随机试验满足两个条件:
⑴ 试验的所有可能结果是有限的; ⑵ 每一种可能结果出现的可能性相等。 含有m个基本事件,则事件A的概率为m/n,即
——设样本空间由n个等可能的基本事件所构成,其中事件A包
P(A)=m/n
这样定义的概率称为先验概率或古典概率。 如,投掷硬币、抽扑克牌等P157
二、概率的基本性质
350
目前我国一些省在高考中采用标准分数表示
考生的成绩,为了使分数更适合一般习惯, 对标准分数进一步做转换:
T 500 100 Z
第三节 二项分布
二项分布(bionimal
distribution)是一
种具有广泛用途的离散型随机变量的概 率分布,它是由贝努里创始的,因此又
称为贝努里分布。
例如,为了确定1个人发生从众行为这个事件的概率,
在表中列出了人们从众行为实验的记录。
ห้องสมุดไป่ตู้
试验人数 100 n 具有从众 65 行为人数 m
200
300
400
500
600
700
155
204
274
349
419
489
频率 m/n
0.650 0.675 0.680 0.685 0.698 0.6983 0.6986
造成分数解释上的困难。
⑶科目性质不同,直接把各科原始分相加不合理。
例题:下表是两名高考学生的成绩,试分析哪一位考生 的成绩更好?
科目
语文 政治
原始成绩 甲 85 70 乙 89 62
全体考生 平均分 70 65 标准差 10 5
外语
数学 理化
68
53 72
72
40 87
69
50 75
8
6 8
Σ
348
例2:从30个白球和20个黑球共50个球中随机抽取两 次(放回抽样),问抽出一个黑球和一个白球的概率 是多少?
抽出一个白球的概率为3/5,抽出一个黑球的概率 为2/5。
抽出一个黑球和一个白球的情况应包括先抽出一 个黑球、后抽出一个白球和先抽出一个白球、后 抽出一个黑球两种情况。因此:
P 3 5 2 5 2 5 3 5 0 . 48
记作u~N(0,1)
6.标准差与面积之间的关系
关于标准正态分布,以下几种概率应当熟记:
P(-1≤Z ≤ 1)=0.6826 P(-2≤Z ≤ 2)=0.9545 P(-3≤Z ≤ 3)=0.9973 P(-1.96≤Z ≤ 1.96)=0.95 P (-2.58≤Z ≤ 2.58)=0.99
2 5 )
b ( 4 ,6 ,
C6 p q
4 4
2
2 3 4 ! 2 ! 5 5 6!
求各等级中点以上(或以下)的累积比率;
用累积比率查正态分布表; 求被评者所得评定等级的数量化值的平均值。
(二)确定测验题目的难易度P171
(三)在能力分组或等级评定时确定人数
如要将某种能力的分数分成等距的几个等级,在确定各等级 人数时,可将正态分布基线上Z=-3至Z=+3之间6个标准 差的距离分成相等的几份,然后查表求出各段Z值之间的面 积,再乘以总人数,即为各等级人数。
抽,则4个学生都抽到试题1的概率是多少?
抽到第一题或第二题的概率应为抽到第一题
的概率和抽到第二题的概率之和,即
P A B P A P B 1 5 1 5 2 5
四个学生都抽到第一题即四个学生同时抽
到第一题,其概率应为抽到第一题的概率 的乘积,即
P A1 A 2 A 3 A 4 1 5 1 5 1 5 1 5 1 625
P( A A
1 2 A n )
P A P A P A
1 2
n
如,两次抽到扑克牌方块K的概率。例6-1
练习题
例1:某一学生从5个试题中任意抽取一题,
进行口试。如果抽到每一题的概率为1/5,则
抽到试题1或试题2的概率是多少? 如果前
一个学生把抽过的试题还回后,后一个学生再
第六章
概率分布
★为何要学习概率分布?
推测
研究的目的:样本———————总体:推论统计 需要指出推论结果的可能性大小,即概率。 概率分布理论是推论统计的基础。
第一节
概率的基本概念
一、什么是概率
——表明随机事件出现可能性大小的客观指标。
在一定条件下可能出现也可能不出现的 事件或现象。
(一)后验概率(或统计概率)
(一)概率的公理系统
1.任何随机事件A的概率都是非负,即 0 ≤ P(A)≤1 2.必然事件的概率等于1,即 P(A)= 1 3.不可能事件的概率等于零,即 P(A)= 0
(二)概率的加法定理
◆若事件A发生,则事件B就一定不发生,这样的两个事件为
互不相容事件。
两互不相容事件和的概率,等于这两个事件概率之和,即
P( A B ) P A P B
P( A
A2 An )
1
P A
1
P A
2
P A
n
(三)概率的乘法定理
若事件A发生不影响事件B是否发生,这样的两个事件为 互相独立事件。
两个互相独立事件积的概率,等于这两个事件概率的乘积, 即
P( A B ) P A P B
一、二项试验
满足以下4个条件的试验称为二项试验:
1.一次试验只有两种可能的结果;
2.共有n次试验,n是事先给定的任一整数; 3.各次试验相互独立,即各次试验之间互不影响; 4.某种结果出现的概率在任何一次试验中都是固定的,即 某个事件每次出现的概率都相等。
如:抛硬币(正面/反面),判断(对/错),考试通过和不
★记住:
Z=1或-1时,P=0.341;
Z=1.96或-1.96时, P=0.475;
Z=2.58或-2.58时, P=0.495
2.已知概率P求Z分数
(1)已知从平均数开始的P值,求Z; (2)已知两端的概率值P,求z; (3)已知正态曲线中央部分的概率P,求Z。
3.已知概率P或Z值,求概率密度Y
Z=(650-500)/100=1.5
查正态分布表, 当Z=1.5时,p=0.433 从低分到高分的顺序中他处于93.3%的位置 从高分到低分的顺序中他处于6.7%的位置
例:某市参加数学奥林匹克业余学校入学考试的人 数为2800人,只录取学生150人,该次考试的平均分 为75分,标准差为8,问录取分数应定为多少?
直接查正态分布表就能得到相应的概率密度Y值。
如果由概率P求Y值,要注意区分已知概率是位于
正态曲线的中间部分,还是两尾端部分,才能通过
查表求得正确的概率密度。
例:在某年高考的平均分数为500,标准差为100的正态总体 中,某考生得到650分。设当年高考录取率为10%,问该生成
绩能否入围?
解:该生的标准分数为
三、标准正态分布
对于任何一个服从正态分布N(μ,σ2)的随机变量x,都 可以通过标准化变换:z=(x-μ)/σ;将标准分数代入 正态曲线函数,并且,令σ=1,则公式变换为标准正态 分布函数:
Y
◆
1 2
e
Z
2
2
标准正态分布的μ=0,σ2=1,
(二)经验分布与理论分布
依分布函数的来源,可将概率分布分为经验分布与理 论分布。 经验分布(empirical distribution)是指根据观察或实 验所获得的数据而编制的次数分布或相对频率分布。
理论分布(theoretical distribution)是按某种数学模
型计算出的概率分布。
在心理与教育研究中,常常遇到等级评定的结果。但是 不同评定者的评定标准往往不一致,无法综合他们的评定结 果;而且等级分数不是等距数据,不同事物的评定结果不能 直接比较。将等级评定的结果转化为数量结果,就可解决这 些问题。
(例6-2)
具体方法
根据各等级被评者的数目求各等级的人数比率; 求各等级比率值的中间值;
2 2
其中μ为平均数,σ2为方差,称随机变量x服从正态 分布 , 记为x~N(μ,σ2)。
二、 正态分布 的特征
1.正态分布是对称的曲线,对称轴为x=μ;M=Md=Mo,y(max) =0.3989 2.正态曲线的拐点为正负1个标准差处。 3.正态曲线下的面积为1,左右两边相等=0.5
4.正态分布随平均数μ与标准差σ的变化而变化。
从表可看出,随着实验次数的增多, 1个人发生从
众行为这个事件的概率越来越稳定地接近0.7,我
们就把0.7作为这个事件的概率。
在一般情况下,随机事件的概率 p 是不可能 准确得到的。通常以试验次数n充分大时随机事件A 的频率作为该随机事件概率的近似值。
即 P(A)=p≈m/n
(n充分大)
(二)先验概率(古典概率)
(例6-3)
例:今有1000人参加一项数学能力测验,欲将测验结 果评为六个等级。问各等级评定的人数应是多少?
(四)以标准分数表示考试成绩
★比较学生的考试成绩时,使用原始分数有其 不合理之处:
⑴原始分制度没有提示考生成绩在考生团体成绩中的位置。
⑵由于各科命题难度不同,导致各科原始分之间不能直接比较,
1.随机事件的频率 ——在相同条件下进行n次重复试验,如果随机事件A发生的 次数为m ,那么m/n称为随机事件A的频率; W ( A ) 2.随机事件的概率 ——当n无限增大时,随机事件A的频率会稳定在一个常数P, 这个常数就是随机事件A的概率。
P A Lim m n
m n
n
这样定义的概率称为后验概率或统计概率。
四、正态分布表的使用(P166)
统计学家已编制好了标准正态分布表,使其使 用非常方便。
表中仅列有标准正态曲线下的面积,因此,查 表前应先将原始变量X转换为Z。
Z
X X S
1.已知Z值求概率P
(1)求Z分数与平均数(Z=0)之间的概率; (2)求Z分数以上或以下的概率;
(3)求两个Z分数之间的概率。
解:考试成绩服从正态分布,根据题意招生人数的 概率为P(Z≥Z0) = 150/2800 = 0.05357 P(0<Z< Z0) = 0.5-0.05357 = 0.44643 查正态分布表,得Z0 = 1.6112 X0= 75 + 1.6112×8 = 87.8894 ≈ 88
五、正态分布理论在测验中的应用 (一)化等级评定为测量数据
(三)基本随机变量分布与抽样分布
依所描述的数据的样本特性,可将概率分布分为 基本随机变量分布与抽样分布(sampling distribution)。
基本随机变量分布是随机变量各种不同取值情况 的概率分布;(二项分布、正态分布)
抽样分布是从同一总体内抽取的不同样本的统计 量的概率分布。(平均数、量平均数之差、方差、 相关系数等)
X X
n X
n! X ! n X !
p
X
q
n X
例6-4
b X . n . p :n次试验中某事件出 现X次,每次试验出现 的概率为P,不出现的 概率为q.
例:从男生占2/5的学校中随机抽取6个学生,问正 好抽到4个男生的概率是多少?最多抽到2个男生的 概率是多少? 解:将n=6,p=2/5,q=3/5,X=4代入公式,则恰好抽到4 个男生的概率为:
通过,应聘录取和落聘……
二、二项分布
二项分布:是指试验仅有两种不同性质结果的概率分布。 具体定义:有n次试验,各次试验彼此独立,每次试验某事件出 现的概率都是P,某事件不出现的概率都是q(1-P),则对于某 事件出现X次(0,1,2,…n)的概率分布为:
b X .n . p C n p q
第二节 正态分布
正态分布(normal distribution)也称为常态分 布,是连续型随机变量概率分布的一种,是在数理 统计的理论与实际应用中占有最重要地位的一种理 论分布,也称高斯分布。
一、正态分布曲线函数
正态分布曲线函数又称概率密度函数,其一般 公式为 X 1 2 Y e 2
三、概率分布类型
概率分布(probability distribution)是指对随机
变量取不同值时的概率分布情况用函数进行描述。
依不同的标准,对概率分布可作不同的分类。
(一)离散型分布与连续型分布
依随机变量的类型(是否具有连续性),可将概率分布分 为离散型概率分布与连续型概率分布。
心理与教育统计学中最常用的离散型分布是二项分布,最 常用的连续型分布是正态分布。
如果随机试验满足两个条件:
⑴ 试验的所有可能结果是有限的; ⑵ 每一种可能结果出现的可能性相等。 含有m个基本事件,则事件A的概率为m/n,即
——设样本空间由n个等可能的基本事件所构成,其中事件A包
P(A)=m/n
这样定义的概率称为先验概率或古典概率。 如,投掷硬币、抽扑克牌等P157
二、概率的基本性质
350
目前我国一些省在高考中采用标准分数表示
考生的成绩,为了使分数更适合一般习惯, 对标准分数进一步做转换:
T 500 100 Z
第三节 二项分布
二项分布(bionimal
distribution)是一
种具有广泛用途的离散型随机变量的概 率分布,它是由贝努里创始的,因此又
称为贝努里分布。
例如,为了确定1个人发生从众行为这个事件的概率,
在表中列出了人们从众行为实验的记录。
ห้องสมุดไป่ตู้
试验人数 100 n 具有从众 65 行为人数 m
200
300
400
500
600
700
155
204
274
349
419
489
频率 m/n
0.650 0.675 0.680 0.685 0.698 0.6983 0.6986
造成分数解释上的困难。
⑶科目性质不同,直接把各科原始分相加不合理。
例题:下表是两名高考学生的成绩,试分析哪一位考生 的成绩更好?
科目
语文 政治
原始成绩 甲 85 70 乙 89 62
全体考生 平均分 70 65 标准差 10 5
外语
数学 理化
68
53 72
72
40 87
69
50 75
8
6 8
Σ
348
例2:从30个白球和20个黑球共50个球中随机抽取两 次(放回抽样),问抽出一个黑球和一个白球的概率 是多少?
抽出一个白球的概率为3/5,抽出一个黑球的概率 为2/5。
抽出一个黑球和一个白球的情况应包括先抽出一 个黑球、后抽出一个白球和先抽出一个白球、后 抽出一个黑球两种情况。因此:
P 3 5 2 5 2 5 3 5 0 . 48
记作u~N(0,1)
6.标准差与面积之间的关系
关于标准正态分布,以下几种概率应当熟记:
P(-1≤Z ≤ 1)=0.6826 P(-2≤Z ≤ 2)=0.9545 P(-3≤Z ≤ 3)=0.9973 P(-1.96≤Z ≤ 1.96)=0.95 P (-2.58≤Z ≤ 2.58)=0.99
2 5 )
b ( 4 ,6 ,
C6 p q
4 4
2
2 3 4 ! 2 ! 5 5 6!
求各等级中点以上(或以下)的累积比率;
用累积比率查正态分布表; 求被评者所得评定等级的数量化值的平均值。
(二)确定测验题目的难易度P171
(三)在能力分组或等级评定时确定人数
如要将某种能力的分数分成等距的几个等级,在确定各等级 人数时,可将正态分布基线上Z=-3至Z=+3之间6个标准 差的距离分成相等的几份,然后查表求出各段Z值之间的面 积,再乘以总人数,即为各等级人数。
抽,则4个学生都抽到试题1的概率是多少?
抽到第一题或第二题的概率应为抽到第一题
的概率和抽到第二题的概率之和,即
P A B P A P B 1 5 1 5 2 5
四个学生都抽到第一题即四个学生同时抽
到第一题,其概率应为抽到第一题的概率 的乘积,即
P A1 A 2 A 3 A 4 1 5 1 5 1 5 1 5 1 625
P( A A
1 2 A n )
P A P A P A
1 2
n
如,两次抽到扑克牌方块K的概率。例6-1
练习题
例1:某一学生从5个试题中任意抽取一题,
进行口试。如果抽到每一题的概率为1/5,则
抽到试题1或试题2的概率是多少? 如果前
一个学生把抽过的试题还回后,后一个学生再
第六章
概率分布
★为何要学习概率分布?
推测
研究的目的:样本———————总体:推论统计 需要指出推论结果的可能性大小,即概率。 概率分布理论是推论统计的基础。
第一节
概率的基本概念
一、什么是概率
——表明随机事件出现可能性大小的客观指标。
在一定条件下可能出现也可能不出现的 事件或现象。
(一)后验概率(或统计概率)
(一)概率的公理系统
1.任何随机事件A的概率都是非负,即 0 ≤ P(A)≤1 2.必然事件的概率等于1,即 P(A)= 1 3.不可能事件的概率等于零,即 P(A)= 0
(二)概率的加法定理
◆若事件A发生,则事件B就一定不发生,这样的两个事件为
互不相容事件。
两互不相容事件和的概率,等于这两个事件概率之和,即
P( A B ) P A P B
P( A
A2 An )
1
P A
1
P A
2
P A
n
(三)概率的乘法定理
若事件A发生不影响事件B是否发生,这样的两个事件为 互相独立事件。
两个互相独立事件积的概率,等于这两个事件概率的乘积, 即
P( A B ) P A P B
一、二项试验
满足以下4个条件的试验称为二项试验:
1.一次试验只有两种可能的结果;
2.共有n次试验,n是事先给定的任一整数; 3.各次试验相互独立,即各次试验之间互不影响; 4.某种结果出现的概率在任何一次试验中都是固定的,即 某个事件每次出现的概率都相等。
如:抛硬币(正面/反面),判断(对/错),考试通过和不
★记住:
Z=1或-1时,P=0.341;
Z=1.96或-1.96时, P=0.475;
Z=2.58或-2.58时, P=0.495
2.已知概率P求Z分数
(1)已知从平均数开始的P值,求Z; (2)已知两端的概率值P,求z; (3)已知正态曲线中央部分的概率P,求Z。
3.已知概率P或Z值,求概率密度Y
Z=(650-500)/100=1.5
查正态分布表, 当Z=1.5时,p=0.433 从低分到高分的顺序中他处于93.3%的位置 从高分到低分的顺序中他处于6.7%的位置
例:某市参加数学奥林匹克业余学校入学考试的人 数为2800人,只录取学生150人,该次考试的平均分 为75分,标准差为8,问录取分数应定为多少?
直接查正态分布表就能得到相应的概率密度Y值。
如果由概率P求Y值,要注意区分已知概率是位于
正态曲线的中间部分,还是两尾端部分,才能通过
查表求得正确的概率密度。
例:在某年高考的平均分数为500,标准差为100的正态总体 中,某考生得到650分。设当年高考录取率为10%,问该生成
绩能否入围?
解:该生的标准分数为