心理教育统计学 06讲 概率与概率分布(上 下)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
离散分布:随机变量只取孤立的数值时,这种随机变量称之 离散型随机变量,离散随机变量的概率分布,简称离散分布。 常见的离散分布是二项分布。
连续分布:指连续随机变量的概率分布,也就是测量数据的 概率分布,它用连续随机变量的分布函数描述其分布规律。常 见的连续随机变量的分布为正态分布。
第二节
正态分布
一、正态分布和正态曲线的特征
⑶ 不可能事件(是指在一定条件下必然不发生的事件, 记做Φ)的概率等于0,即
P() 0
一、概率及其基本性质与定理
三、概率的加法定理:
定理:两个互不相容事件A、B之和的概率,等于两个事件概率之 和。(所谓互不相容事件是指在一定试验中,若事件A发生, 则事件B就一定不发生) 。即:
P( A B) P( A) P( B)
一、正态分布和正态曲线的特征
二、正态分布表的基本使用方法
⒈已知Z值求概率:
⑴ 求某一Z值与Z=0之间的概率。直接查表即可。如:
p0 Z 1 0.3413
⑵ 某一Z值以上或以下的概率。如求Z=1以上的概率,
先查p0 Z 1 0.3413, 则得 : pZ 1 0.5 0.3413 0.1587
第三节 二项分布
一、二项试验与二项分布
二项试验: 在同一条件下,将一种试验重复进行n次,如果: ①在每次试验中,所有可能出现的事件只有两个,即A与 A, 记 P A p, P A ,且 q p与q在各次试验中保持不变;②各 次试验相互独立。
又如求Z=1以下的概率。
p Z 1 0.5 0.3413 0.8413
二、正态分布表的基本使用方法
⒈巳知Z值求概率:
⑶求两个Z值之间的概率。
p 1 Z 1 p 1 Z 0 p0 Z 1 0.3413 0.3413 0.6826 p1 Z 2 p0 Z 2 p0 Z 1 0.4773 0.3413 0.1360
(二)确定能力分组或等级评定的人数
例:假定500个学生某科成绩分布近似正态分布,其μ = 70,σ= 10,问:①75分以下有多少人?②85分以上 有多少人?
(二)确定能力分组或等级评定的人数
例:假定500个学生某科成绩分布近似正态分布,其μ = 70,σ= 10,问:①75分以下有多少人?②85分以上 有多少人?
m P ( A) n
一、概率及其基本性质与定理
一、概率的意义:
先验概率:
先验概率是通过古典概率模型加以定义的,故又称之古典概率。 古典概率要求满足两个条件:①试验的所有可能结果(即基本事件)是 有限的;②每一种基本事件出现的可能性相等。如果基本事件的总 次数为n,事件A包括m个基本事件, 则事件A的概率为:
某县对初一年级1000名学生进行能力测验,结果μ=75 ,σ=10,现拟根据此结果选取25名学生作为“尖子班 ”重点培养,假定测验成绩 近似正态分布,问多少分以 上才能被选到“尖子班”学习?
(二)确定能力分组或等级评定的人数
如果学生知识能力的水平呈正态分布,欲将他们分成等距 的几个等级或几个组,在确定各等级人数时,可把正态分布中 Z=-3至Z=3之间6个标准差的距离分成相等的几份(因为正态分 布在X=±3之间的面积为0.9973,几乎包括了全体),即将6个 标准差除以分组或等级的数目,作到Z分数等距,然后查正态 分布表求出各组Z分数之间的面积,将各组的概率乘以总人数, 则可得到各等级或分组应有的人数。
正态分布:正态分布也称常态分布或常态分配,是连续随机变量概率
分布的一种。最早由 棣·莫弗(De.Moivre)于1733年发现的,其后拉普拉 斯(Laplace)和高斯(Ganss)对正态分布的研究也做出了很大的贡献,故有 时称正态分布为高斯分布。
定义:对于连续随机变量X,如果它的分布密度函数如下, 则称随机变量X服从正态分布。
标准分数(Z分数)公式:Z=(X-μ )/σ
将原始分数X转换为Z,即把所有绝对量数表示总体参数 μ 和σ的正态分布函数,都变成了以平均数为0,标准差 为1的正态分布函数,这种平均数为0,标准差为1的正 态分布又叫标准正态分布。其分布函数为:
1 y e 2
z2 2
标准正态分布曲线
一、正态分布和正态曲线的特征
此定理可推广到有限多个互不相容事件中。
推论:
P( Ai ) P( Ai )
i 1 i 1
n
n
一、概率及其基本性质与定理
例:盒中共20支粉笔,其中红粉笔6支,黄粉笔5支 ,绿粉笔2支,白粉笔7支。问任意摸得一支红色或 绿色粉笔的概率是多少?
一、概率及其基本性质与定理
四、概率的乘法定理:
推论:有限个独立事件都同时发生的概率,等于这些概率的乘积。 即
P( A1 A2 ... An ) P( A1 ). P( A2 )... P( An )
一、概率及其基本性质与定理
例:某专业研究生复试,让考生从6个试题中任意抽取 一题进行口试,若抽到每1题的概率为1/6,前一考 生抽过的试题再放回,后一考生再抽,问2个考生都 抽到试题1的概率是多少?
在一些选拔性考试中,录取的人数(或比率)往往是事先 确定的。如果考试分数服从正态分布或接近正态分布,在确定 录取分数线时,可以把录取人数的比率作为正态分布中的上端 面积,由此找出相对应的标准分数Z,然后根据标准分数的计算 公式 X X ZS (变形公式)。 由Z值来求原始分数X,这个X就是录取分数的分界点,即平 时人们称谓的录取分数线。
m P( A) n
先验概率是在特定条件下计算出来的,是随机事件的真实概率, 不是由频率估计出来的。当试验重复次数较多时,后验概率也就接 近先验概率。
一、概率及其基本性质与定理
二、概率的基本性质
⑴ 任一随机事件A的概率取值范围都在0与1之间,即 0 P( A) 1
⑵ 必然事件(是指在一定条件下必然发生的事件,记做 Ω )的概率等于1,即 P() 1
X X ZS 72 1.18 12 .5 86 .75
(一)确定录取分数线
例:某县对初一年级1000名学生进行能力测验,结果μ =75,σ=10,现拟根据此结果选取25名学生作为“尖 子班”重点培养,假定测验成绩 近似正态分布,问多少 分以上才能被选到“尖子班”学习?
(一)确定录取分数线
定理:两个独立事件同时都发生的概率,等于这两个事件概率 的乘积。用公式表示:
P( AB) P( A) P( B)
所谓独立事件是指一个事件的出现对另一个事件的出现不 发生影响,如果事件A的概率随事件B是否出现而改变,事件B 的概率随事件A是否出现而改变,则这两个事件称为相关事件。 乘法定理也可推广到有限多个独立事件中,即:
等级 A B C D E
各等级界限 1.8σ以上 0.6σ~ 1.8σ -0.6σ~ 0.6σ -1.8σ~- 0.6σ - 1.8σ以下
比率 0.0359 0.2383 0.4515 0.2383 0.0359
P×N 应占人数 3.59 4 23.83 24 45.15 44 23.83 24 3.59 4
概率: 是表明随机事件出现可能性大小的客观指标。 后验概率
在对随机事件进行n次观测时,其中某一随机事件A出现了m次,则 m/n称为事件A出现的频率。随着试验次数的增加,事件A的频率将稳定 在某一常数p,则此常数p就是事件A出现概率的近似值,可表示为:
以随机事件A在大量重复试验中出现的稳定频率值作为随机事件A的概率 估计值,这种求得的概率叫做后验概率。
推论统计的数学基础是概率论。它通过对样本数据的分 析,在指出是什么或不是什么的同时,还用概率指出这 种可能性的大小。
内容提要
第一节 概率的基础知识
第二节 正态分布 第三节 二项分布
一、概率及其基本性质与定理
一、概率的意义:
Fra Baidu bibliotek
随机现象:又称随机事件,是指在一定条件下可能出现也可能不
出现的事件。
例:掷骰子游戏中,两个骰子掷一次时,问掷得11点 数的概率是多少?
例:某年级举行数学竞赛,其中有10道四选一的选择 题,若一考生全凭随机猜测,则他猜对10道题的概 率有多大?
二、概率分布的类型
概率分布: 是指对随机变量取值的概率分布情况用数学 方法(函数)进行描述。按照随机变量是否具有连续 性可将概率分布分为离散分布和连续分布。
(二)确定能力分组或等级评定的人数
例: 若有100人某种能力呈正态分布,欲将其分成5 个等距的等级,问各等级应有的人数。
例10 若有100人某种能力呈正态分布,欲将其 分成5个等距的等级,问各等级应有的人数。
解:
6σ÷5=1.2σ,每个等级应占1.2个标准差的距离,确定各等 级的Z值界限,然后查表,计算下表:
二、正态分布表的基本使用方法
(4) 非标准正态分布下已知x求概率
设X服从正态分布 x N (, ) ,求以下概率。
2
1.P{ x }; 2.P{ 3 x 3 }; 3.P{ 1.84 x 1.84 }
记住特殊值
Z X X S
X X ZS
(一)确定录取分数线
例: 某地区进行公务员考试,准备在参加考试的 1500人中录取180人,考试分数接近正态分布,平均 数为72分,标准差是12.5分,问录取分数线是多少?
(一)确定录取分数线
例: 某地区进行公务员考试,准备在参加考试的 1500人中录取180人,考试分数接近正态分布,平均 数为72分,标准差是12.5分,问录取分数线是多少? 解: 录取率:180/1500=0.12,即正态分布上端的面积, 然后根据0.5-0.12=0.38,查正态分布表得出最接近 0.38的p值为0.3810,它所对应的Z=1.18。 录取分数线:
二、正态分布表的基本使用方法
⒉由概率(p)求Z值
⑴已知从平均数开始的概率值求Z值(直接查表)
⑵求两端概率的Z值 ⑶已知正态曲线下中央部分的概率求Z值。
⒊求概率密度Y(即正态曲线的纵线高)
⑴已知Z值(直接查表)
⑵已知P值 注意区分已知概率是位于正态曲线的中间部分,还是两尾 端部分。
三、正态分布在测验中的应用
1 Y e 2
2 X
2 2
一、正态分布和正态曲线的特征
正态曲线:正态分布的图形称做正态曲线,形状为钟形曲线。
正态分布是一族分布。每个正态分布的μ ,σ和N的不同,正态 曲线也就不同。
所有正态分布都可以通过Z分数公式非常容易地转换为标准 正态分布。
一、正态分布和正态曲线的特征
⑴正态曲线在X=μ 点取得最大值,即 Y 标准正态分布曲线在Z=0点取得最大值,即 Y
1 2
1 0.3989 2
⑵正态曲线关于直线X=μ 对称(但对称的不一定是正态的), 即随机变量X在μ 的对称区间上取值的概率相等。标准正态分 布关于直线Z=0对称。 ⑶正态曲线下的面积为1,过平均数点的垂线将正态曲线下的面 积划分为相等的两部分,即各为0.50。
因正态曲线下每一横坐标所对应的面积与总面积之比, 其值等于该部分面积值,故正态曲线下的面积可视为概率,即 值为每一横坐标值(加减一定标准差)的随机变量出现的概率。
一、正态分布和正态曲线的特征
⑷ 正态分布是一族分布。它随随机变量的平均数、标准差的大 小与单位而有不同的分布形态。平均数决定正态曲线在横轴 上的位置;当μ 固定时,σ越小,则正态曲线越高狭,σ越 大, 则正态曲线则越低阔。 ⑸正态曲线下,标准差与概率(面积)有一定的数量关系。如正负 1个标准差之间,包含总面积的68.26%,正负1.96个标准差 之间包含总面积的95%,正负2.58个标准差之间,包含总面 积的99%。更详细的数量关系,可通过查附表1得出。
教育统计学 05讲 概率与概率分布
引言
描述统计(统计图表,集中量数,离异量数,相关)
推论统计:从具体的研究资料出发推论一般的方法。从 样本出发来推断总体分布的过程就叫统计推断。如:
根据某学生几次考试情况,推论他真实学习成绩如何 ;
根据一个班的测试结果,推论全年级学生某方面的心 理发展水平。
连续分布:指连续随机变量的概率分布,也就是测量数据的 概率分布,它用连续随机变量的分布函数描述其分布规律。常 见的连续随机变量的分布为正态分布。
第二节
正态分布
一、正态分布和正态曲线的特征
⑶ 不可能事件(是指在一定条件下必然不发生的事件, 记做Φ)的概率等于0,即
P() 0
一、概率及其基本性质与定理
三、概率的加法定理:
定理:两个互不相容事件A、B之和的概率,等于两个事件概率之 和。(所谓互不相容事件是指在一定试验中,若事件A发生, 则事件B就一定不发生) 。即:
P( A B) P( A) P( B)
一、正态分布和正态曲线的特征
二、正态分布表的基本使用方法
⒈已知Z值求概率:
⑴ 求某一Z值与Z=0之间的概率。直接查表即可。如:
p0 Z 1 0.3413
⑵ 某一Z值以上或以下的概率。如求Z=1以上的概率,
先查p0 Z 1 0.3413, 则得 : pZ 1 0.5 0.3413 0.1587
第三节 二项分布
一、二项试验与二项分布
二项试验: 在同一条件下,将一种试验重复进行n次,如果: ①在每次试验中,所有可能出现的事件只有两个,即A与 A, 记 P A p, P A ,且 q p与q在各次试验中保持不变;②各 次试验相互独立。
又如求Z=1以下的概率。
p Z 1 0.5 0.3413 0.8413
二、正态分布表的基本使用方法
⒈巳知Z值求概率:
⑶求两个Z值之间的概率。
p 1 Z 1 p 1 Z 0 p0 Z 1 0.3413 0.3413 0.6826 p1 Z 2 p0 Z 2 p0 Z 1 0.4773 0.3413 0.1360
(二)确定能力分组或等级评定的人数
例:假定500个学生某科成绩分布近似正态分布,其μ = 70,σ= 10,问:①75分以下有多少人?②85分以上 有多少人?
(二)确定能力分组或等级评定的人数
例:假定500个学生某科成绩分布近似正态分布,其μ = 70,σ= 10,问:①75分以下有多少人?②85分以上 有多少人?
m P ( A) n
一、概率及其基本性质与定理
一、概率的意义:
先验概率:
先验概率是通过古典概率模型加以定义的,故又称之古典概率。 古典概率要求满足两个条件:①试验的所有可能结果(即基本事件)是 有限的;②每一种基本事件出现的可能性相等。如果基本事件的总 次数为n,事件A包括m个基本事件, 则事件A的概率为:
某县对初一年级1000名学生进行能力测验,结果μ=75 ,σ=10,现拟根据此结果选取25名学生作为“尖子班 ”重点培养,假定测验成绩 近似正态分布,问多少分以 上才能被选到“尖子班”学习?
(二)确定能力分组或等级评定的人数
如果学生知识能力的水平呈正态分布,欲将他们分成等距 的几个等级或几个组,在确定各等级人数时,可把正态分布中 Z=-3至Z=3之间6个标准差的距离分成相等的几份(因为正态分 布在X=±3之间的面积为0.9973,几乎包括了全体),即将6个 标准差除以分组或等级的数目,作到Z分数等距,然后查正态 分布表求出各组Z分数之间的面积,将各组的概率乘以总人数, 则可得到各等级或分组应有的人数。
正态分布:正态分布也称常态分布或常态分配,是连续随机变量概率
分布的一种。最早由 棣·莫弗(De.Moivre)于1733年发现的,其后拉普拉 斯(Laplace)和高斯(Ganss)对正态分布的研究也做出了很大的贡献,故有 时称正态分布为高斯分布。
定义:对于连续随机变量X,如果它的分布密度函数如下, 则称随机变量X服从正态分布。
标准分数(Z分数)公式:Z=(X-μ )/σ
将原始分数X转换为Z,即把所有绝对量数表示总体参数 μ 和σ的正态分布函数,都变成了以平均数为0,标准差 为1的正态分布函数,这种平均数为0,标准差为1的正 态分布又叫标准正态分布。其分布函数为:
1 y e 2
z2 2
标准正态分布曲线
一、正态分布和正态曲线的特征
此定理可推广到有限多个互不相容事件中。
推论:
P( Ai ) P( Ai )
i 1 i 1
n
n
一、概率及其基本性质与定理
例:盒中共20支粉笔,其中红粉笔6支,黄粉笔5支 ,绿粉笔2支,白粉笔7支。问任意摸得一支红色或 绿色粉笔的概率是多少?
一、概率及其基本性质与定理
四、概率的乘法定理:
推论:有限个独立事件都同时发生的概率,等于这些概率的乘积。 即
P( A1 A2 ... An ) P( A1 ). P( A2 )... P( An )
一、概率及其基本性质与定理
例:某专业研究生复试,让考生从6个试题中任意抽取 一题进行口试,若抽到每1题的概率为1/6,前一考 生抽过的试题再放回,后一考生再抽,问2个考生都 抽到试题1的概率是多少?
在一些选拔性考试中,录取的人数(或比率)往往是事先 确定的。如果考试分数服从正态分布或接近正态分布,在确定 录取分数线时,可以把录取人数的比率作为正态分布中的上端 面积,由此找出相对应的标准分数Z,然后根据标准分数的计算 公式 X X ZS (变形公式)。 由Z值来求原始分数X,这个X就是录取分数的分界点,即平 时人们称谓的录取分数线。
m P( A) n
先验概率是在特定条件下计算出来的,是随机事件的真实概率, 不是由频率估计出来的。当试验重复次数较多时,后验概率也就接 近先验概率。
一、概率及其基本性质与定理
二、概率的基本性质
⑴ 任一随机事件A的概率取值范围都在0与1之间,即 0 P( A) 1
⑵ 必然事件(是指在一定条件下必然发生的事件,记做 Ω )的概率等于1,即 P() 1
X X ZS 72 1.18 12 .5 86 .75
(一)确定录取分数线
例:某县对初一年级1000名学生进行能力测验,结果μ =75,σ=10,现拟根据此结果选取25名学生作为“尖 子班”重点培养,假定测验成绩 近似正态分布,问多少 分以上才能被选到“尖子班”学习?
(一)确定录取分数线
定理:两个独立事件同时都发生的概率,等于这两个事件概率 的乘积。用公式表示:
P( AB) P( A) P( B)
所谓独立事件是指一个事件的出现对另一个事件的出现不 发生影响,如果事件A的概率随事件B是否出现而改变,事件B 的概率随事件A是否出现而改变,则这两个事件称为相关事件。 乘法定理也可推广到有限多个独立事件中,即:
等级 A B C D E
各等级界限 1.8σ以上 0.6σ~ 1.8σ -0.6σ~ 0.6σ -1.8σ~- 0.6σ - 1.8σ以下
比率 0.0359 0.2383 0.4515 0.2383 0.0359
P×N 应占人数 3.59 4 23.83 24 45.15 44 23.83 24 3.59 4
概率: 是表明随机事件出现可能性大小的客观指标。 后验概率
在对随机事件进行n次观测时,其中某一随机事件A出现了m次,则 m/n称为事件A出现的频率。随着试验次数的增加,事件A的频率将稳定 在某一常数p,则此常数p就是事件A出现概率的近似值,可表示为:
以随机事件A在大量重复试验中出现的稳定频率值作为随机事件A的概率 估计值,这种求得的概率叫做后验概率。
推论统计的数学基础是概率论。它通过对样本数据的分 析,在指出是什么或不是什么的同时,还用概率指出这 种可能性的大小。
内容提要
第一节 概率的基础知识
第二节 正态分布 第三节 二项分布
一、概率及其基本性质与定理
一、概率的意义:
Fra Baidu bibliotek
随机现象:又称随机事件,是指在一定条件下可能出现也可能不
出现的事件。
例:掷骰子游戏中,两个骰子掷一次时,问掷得11点 数的概率是多少?
例:某年级举行数学竞赛,其中有10道四选一的选择 题,若一考生全凭随机猜测,则他猜对10道题的概 率有多大?
二、概率分布的类型
概率分布: 是指对随机变量取值的概率分布情况用数学 方法(函数)进行描述。按照随机变量是否具有连续 性可将概率分布分为离散分布和连续分布。
(二)确定能力分组或等级评定的人数
例: 若有100人某种能力呈正态分布,欲将其分成5 个等距的等级,问各等级应有的人数。
例10 若有100人某种能力呈正态分布,欲将其 分成5个等距的等级,问各等级应有的人数。
解:
6σ÷5=1.2σ,每个等级应占1.2个标准差的距离,确定各等 级的Z值界限,然后查表,计算下表:
二、正态分布表的基本使用方法
(4) 非标准正态分布下已知x求概率
设X服从正态分布 x N (, ) ,求以下概率。
2
1.P{ x }; 2.P{ 3 x 3 }; 3.P{ 1.84 x 1.84 }
记住特殊值
Z X X S
X X ZS
(一)确定录取分数线
例: 某地区进行公务员考试,准备在参加考试的 1500人中录取180人,考试分数接近正态分布,平均 数为72分,标准差是12.5分,问录取分数线是多少?
(一)确定录取分数线
例: 某地区进行公务员考试,准备在参加考试的 1500人中录取180人,考试分数接近正态分布,平均 数为72分,标准差是12.5分,问录取分数线是多少? 解: 录取率:180/1500=0.12,即正态分布上端的面积, 然后根据0.5-0.12=0.38,查正态分布表得出最接近 0.38的p值为0.3810,它所对应的Z=1.18。 录取分数线:
二、正态分布表的基本使用方法
⒉由概率(p)求Z值
⑴已知从平均数开始的概率值求Z值(直接查表)
⑵求两端概率的Z值 ⑶已知正态曲线下中央部分的概率求Z值。
⒊求概率密度Y(即正态曲线的纵线高)
⑴已知Z值(直接查表)
⑵已知P值 注意区分已知概率是位于正态曲线的中间部分,还是两尾 端部分。
三、正态分布在测验中的应用
1 Y e 2
2 X
2 2
一、正态分布和正态曲线的特征
正态曲线:正态分布的图形称做正态曲线,形状为钟形曲线。
正态分布是一族分布。每个正态分布的μ ,σ和N的不同,正态 曲线也就不同。
所有正态分布都可以通过Z分数公式非常容易地转换为标准 正态分布。
一、正态分布和正态曲线的特征
⑴正态曲线在X=μ 点取得最大值,即 Y 标准正态分布曲线在Z=0点取得最大值,即 Y
1 2
1 0.3989 2
⑵正态曲线关于直线X=μ 对称(但对称的不一定是正态的), 即随机变量X在μ 的对称区间上取值的概率相等。标准正态分 布关于直线Z=0对称。 ⑶正态曲线下的面积为1,过平均数点的垂线将正态曲线下的面 积划分为相等的两部分,即各为0.50。
因正态曲线下每一横坐标所对应的面积与总面积之比, 其值等于该部分面积值,故正态曲线下的面积可视为概率,即 值为每一横坐标值(加减一定标准差)的随机变量出现的概率。
一、正态分布和正态曲线的特征
⑷ 正态分布是一族分布。它随随机变量的平均数、标准差的大 小与单位而有不同的分布形态。平均数决定正态曲线在横轴 上的位置;当μ 固定时,σ越小,则正态曲线越高狭,σ越 大, 则正态曲线则越低阔。 ⑸正态曲线下,标准差与概率(面积)有一定的数量关系。如正负 1个标准差之间,包含总面积的68.26%,正负1.96个标准差 之间包含总面积的95%,正负2.58个标准差之间,包含总面 积的99%。更详细的数量关系,可通过查附表1得出。
教育统计学 05讲 概率与概率分布
引言
描述统计(统计图表,集中量数,离异量数,相关)
推论统计:从具体的研究资料出发推论一般的方法。从 样本出发来推断总体分布的过程就叫统计推断。如:
根据某学生几次考试情况,推论他真实学习成绩如何 ;
根据一个班的测试结果,推论全年级学生某方面的心 理发展水平。