第六章-概率分布Word版
教育与心理统计学第六章:概率分布
举例:
1、我们队将可能赢得今晚的这场比赛。 2、今天下午下雨的机会有40%。 3、这个冬天的周末我很可能有个约会。 4、我有50比50的机会通过今年的英语四
级考试。
概率的分类
1、后验概率(empirical definition of Probability)
以随机事件A在大量重复试验中出现的稳定频率值作 为随机事件A的概率估计值,这样求得的概率称为 后验概率。
进行推论,从而确定推论正确或错误的概率。
一、正态分布及渐近正态分布
(一)样本平均数的分布
1、总体分布为正态, δ2已知,样本平均数 的分布为正 态分布
标准误,即样本均数的标准差,是描述均数抽样分布的 离散程度及衡量均数抽样误差大小的尺度,反映的是 样本均数之间的变异。
标准误用来衡量抽样误差。标准误越小,表明样本统计 量与总体参数的值越接近,样本对总体越有代表性, 用样本统计量推断总体参数的可靠度越大。
第六章 概率分布
第一节 概率的基本概念 第二节 正态分布 第三节 二项分布 第四节 样本分布
第一节 概率的基本概念
一、什么是概率 随机现象(或随机事件)——在心理学研究中,通过实
验、问卷调查所获得的数据,常因主试、被试、施测 条件等因素的随机变化而呈现出不确定性,即使是相 同的被试在相同的观测条件下,多次重复测量结果也 还是上下波动,我们一般都无法事先确定每一次测量 的结果。 概率(probability):随机事件出现可能性大小的客观 指标
2、计算概率时 ,每一个正态分布都需要有自己 的正态概率分布表,这种表格是无穷多的
3、若能将一般的正态分布转化为标准正态分布, 计算概率时只需要查一张表
(三)标准正态分布表的编制与使用
第六章概率分析
T 70 65 60 56
正态分布表的应用
①将原始数据整理为次数 分布表; ②计算各组上限以下累加 次数; ③计算各组中点以下累加 次数; ④计算各组中点以下累积 比率; ⑤查正态分布表,将概率 转化为Z分数; ⑥将正态化以后的Z值进行 线性转换:T=10Z+50
140135130125-
120115110105100959085807570-
122
117 112 107 102 97 92 87 82 77 72
28
16 16 8 9 8 7 6 6 5 5
0.14
-0.17 -0.40 -0.59 -0.73 -0.90 -1.06 -1.25 -1.46 -1.70 -2.12
51
48 46 44 43 41 39 38 35 33 29
分析:包括两种情况:先抽一黑球、后抽一白球;
先抽一白球、后抽一黑球。
3 2 2 3 P 0.48 5 5 5 5
例4
一枚硬币掷3次,或三枚硬币各掷一次,问出现两
次或两次以上H的概率是多少?
解:可能出现的情况有:HHH HHT HTH THH TTH
THT HTT TTT共8种。每种情况出现的概率,为
根据随机变量的取值是否连续,可将随机变量分为
离散型随机变量与连续型随机变量。
当随机变量只取孤立的数值,这种随机变量称为离
散型随机变量。如投掷一枚硬币4次,几次正面朝上?因 取值只能为0、1、2、3、4,故为离散型随机变量。
离散分布与连续分布
离散型随机变量的概率分布称作离散分布。连续分
布是指连续型随机变量的概率分布,即测量数据的概率 分布。心理统计学中最常用的连续型分布是正态分布。
新版概率与概率分布
2024/10/4
22
[例 ] 为了研究父代文化程度对子代文 化程度旳影响,某大学统计出学生中爸爸 具有大学文化程度旳占30%,母亲具有大 学文化程度旳占20%,而双方都具有文化 程度旳占有10%,问从学生中任抽一名, 父代至少有一名具有大学文化程度旳概率 是多少?
2024/10/4
23
在抽样措施中还经常涉及到回置抽样和不回置抽样。如前所
概率论起源于17世纪,当初在人口统计、人寿保险 等工作中,要整顿和研究大量旳随机数据资料,这就需 要一种专门研究大量随机现象旳规律性旳数学。
参赌者就想:假如同步掷两颗骰子 ,则点数之和为 9 和点数之和为10 ,哪种情况出现旳可能性较大?
例如17世纪中叶,贵族德·梅尔发觉:将一枚骰子 连掷四次,出现一种6 点旳机会比较多,而同步将两枚 掷24次,出现一次双6 旳机会却极少。
事件B至少有一种事件发生所构成旳事件C称为A 与B旳事件和,记作
A B或A B
(2)事件积(As-well-as conjunction)——事 件A与事件B同步发生所构成旳事件C称为A与B 旳事件积,记作
AB或A B
2024/10/4
9
(3)事件旳包括与相等——事件A发生必然 造成事件B发生,则称为B包括A记作
600 202
3
总和
600120012 Nhomakorabea03000
2024/10/4
21
[例] 根据统计成果,男婴出生旳概率是 22/43,女婴出生旳概率是21/43,某单位有两
名 孕妇,问两名孕妇都生男婴旳概率是多少?都 生女婴旳概率是多少?其中一男一女旳概率是 多少? [例] 某居民楼共20户,其中关键家庭为2 户,问访问两户都是关键家庭旳概率是多少? 问访问第二户才是关键家庭旳概率是多少?
《概率分布》课件
06
概率分布的参数估计与假 设检验
参数估计方法
极大似然估计法
通过最大化样本数据的似然函数来估计参数,具有无偏性和一致 性。
最小二乘法
通过最小化误差的平方和来估计参数,适用于线性回归模型。
贝叶斯估计法
基于贝叶斯定理,通过先验信息和样本数据来估计参数,考虑了 参数的不确定性。
假设检验原理
零假设与对立假设
二项分布在统计学、可靠性工程、遗传学等领域有广泛应 用。
泊松分布
01
泊松分布描述了在单位时间内随机事件发生的次数 的概率分布情况。
02
泊松分布的概率函数为P(X=k) = λ^k * e^(-λ) / k! ,其中λ是随机事件发生的平均速率。
03
泊松分布在物理学、工程学、保险学等领域有广泛 应用。
相关系数
相关系数是协方差的归一化形式,用于衡量两个随机变量的线性相关程度,取值范围为 -1到1。
大数定律与中心极限定理
大数定律
大数定律是指在大量重复实验中,某一 事件发生的频率趋于稳定,并收敛于理 论概率。
VS
中心极限定理
中心极限定理表明,无论独立随机变量的 分布是什么,它们的和的分布趋近于正态 分布。
自然现象模拟
自然现象模拟是概率分布应用的另一个领域。在自然科学中,许多自然现象都可 以通过概率分布进行描述和模拟,例如天气变化、地震和疾病传播等。
概率分布在自然现象模拟中主要用于描述自然现象的概率规律,进行模拟和预测 。例如,通过概率分布可以模拟地震发生的概率和强度,预测流行病的传播趋势 等。
人工智能算法
数学期望值是概率分布的中心 位置,表示随机变量的平均值
。
方差
方差是用来描述概率分布的离 散程度的数值。
钱小军《概率论与数理统计》chap06-normal distribution
P(0.0 z 1.0)
English Version: Appendix B A-4
标准正态分布表.xls 中文版:参加附赠CD
2/22/2019
Tsinghua-CUHK Finance MBA 2008
16
-3
2/22/2019
0.00
0.50
1.00
1.50
2.00
2.50
3.00
ab E ( x) 2
(b a) 2 Var( x) 12
2/22/2019
Tsinghua-CUHK Finance MBA 2008
8
Normal Distribution 正态分布
Normal Distribution is one of the most important distributions in the probability statistics. One hand, it is very common in nature; the other hand, it has so many excellent properties. A lot of distributions can be described by it. 正态分布是概率统计中最重要的一种分布 。一方面,正态分布是 自然界最常见的一种分布; 另一方面,正态分布具有许多良好的 性质,很多分布可以用正态分布来近似描述。
Probability Density Function of Standard Normal
Tsinghua-CUHK Finance MBA 2008 17
-2.50
-2.00
-1.50
-1.00
-0.50
Probability of Standard Normal Distribution
第六章 6.4 转移概率的极限与平稳分布
(v) (nd j r v)
ij
jj
v1
除n时,p(jjn) 0. 仅当v ld j r时,
n
f p (ld j r ) ((nl )d j )
ij
jj
l 0
l 0,1, ,n有
p(nd j r v) jj
0)
n
即 p f p (nd j r) ij
(ld j r ) ((nl )d j )
一个平稳分布,如果有
j i pij , iS
或矩阵形式为
=P
jS
其中 ={1,2, }, P ( pij )为X的转移概率矩阵。
显然 若概率分布{ j , j S}是齐次马氏链X
的平稳分布,则也有
j
p , (n) i ij
j S, n 1, 2,
iS
或矩阵形式为
=Pn
总之,:当马氏链X={X n, n 0,1, }为不可约的遍历链时,
事实上若上式对某个j成立严格不等式则两边事实上若上式对某个j成立严格不等式则两边关于j求和得证极限满足条首先反复利用可以得到ikkjikkjikkj又由于转移概率一致有界因此令n又由于转移概率一致有界因此令nlimli最后证的唯一性唯一性得证例643设在任意一天里人的情绪是快乐的一般的和忧郁的
6.4 转移概率的极限与平稳分布
(n)不存在
jj
综上,转移概率的极限有不同的情况,为此,关于转 移概率极限问题的讨论做以下假设:
总假定 j是正常返且i是非常返 或者 j和i属于同一个正常返类
又考虑到,当j为正常返周期态时,lim n
p(jjn)不存在,
但是状态转移遵从周期链原则,为此, 一般讨论以下 形式的极限
lim
统计学习题 第六章 概率与概率分布
第六章 概率与概率分布第一节 概率论随机现象与随机事件·事件之间的关系(事件和、事件积、事件的包含与相等、互斥事件、对立事件、互相独立事件)·先验概率与古典法·经验概率与频率法第二节 概率的数学性质概率的数学性质(非负性、加法规则、乘法规则)·排列与样本点的计数·运用概率方法进行统计推断的前提第三节 概率分布、期望值与变异数概率分布的定义·离散型随机变量及其概率分布·连续型随机变量及其概率分布·分布函数·数学期望与变异数一、填空1.用古典法求算概率.在应用上有两个缺点:①它只适用于有限样本点的情况;②它假设( 机会均等 )。
2.分布函数)(x F 和)(x P 或 )(x 的关系,就像向上累计频数和频率的关系一样。
所不同的是,)(x F 累计的是( 概率 )。
3.如果A 和B ( 互斥 ),总合有P(A/B)=P 〔B/A 〕=0。
4.( 大数定律 )和( 中心极限定理 )为抽样推断提供了主要理论依据。
5.抽样推断中,判断一个样本估计量是否优良的标准是( 无偏性 )、( 一致性 )、( 有效性 )。
6.抽样设计的主要标准有( 最小抽样误差原则 )和( 最少经济费用原则 )。
7.在抽样中,遵守( 随机原则 )是计算抽样误差的先决条件。
8.抽样平均误差和总体标志变动的大小成( 正比 ),与样本容量的平方根成( 反比 )。
如果其他条件不变,抽样平均误差要减小到原来的1/4,则样本容量应( 增大到16倍 )。
9.若事件A 和事件B 不能同时发生,则称A 和B 是( 互斥 )事件。
10.在一副扑克牌中单独抽取一次,抽到一张红桃或爱司的概率是( 1/4 );在一副扑克牌中单独抽取一次,抽到一张红桃且爱司的概率是( 1/52 )。
二、单项选择1.古典概率的特点应为(A )A 、基本事件是有限个,并且是等可能的;B 、基本事件是无限个,并且是等可能的;C 、基本事件是有限个,但可以是具有不同的可能性;D 、基本事件是无限的,但可以是具有不同的可能性。
第六章(三)常用连续型随机变量的理论分布
(一)抽样分布的含义与无偏估计量 1、抽样分布的含义:统计推断是以总 体分布和样本抽样分布的理论关系为 基础的。 由总体中随机地抽取若干个体组成样 本,即使每次抽取的样本含量相等, 其统计量也将随样本的不同而有所不 同。因而样本统计量也是随机变量, 也有其概率分布,我们把统计量的概 率分布称为抽样分布。
如果总体是无限总
体,那么可以得到 无限多个随机样本。
随机样本1 2 3
……
无穷个样本
图 总体和样本的关系
如果从容量为N的有限总体抽样,若每次抽取容量为n的 样本,那么一共可以得到 N n个样本(所有可能的样本个数)。 抽样所得到的每一个样本可以计算一个平均数,全部可能 的样本都被抽取后可以得到许多平均数。 如果将抽样所得到的所有可能的样本平均数集合起来便构
正态分布的分位点的定义:
3、正态分布分位点计算
标准正态分布 N (0,1) 密度函数图形为:
x 图中的点 称为标准正态分布的 (1 )% 的分位点,相当于已知
F(x ) p( X x ) 1
求其中的 x
4、单侧概率与双侧概率 •统计学中,把随机变量 x 落在区间 (μ-kσ,μ+kσ)之外的概率称为双侧(两 尾)概率,记作α。 •对应于双侧概率可以求得随机变量x 小于μ-kσ或大于μ+kσ的概率,称为 单侧概率,记作α/2。
2、无偏估计 • 在统计学上,如果所有可能样本的 某一统计数的平均数等于总体的相 应参数,则称该统计数为总体相应 参数的无偏估计值。
• 设有一N=3的总体,具有变量3,4, 5;求得μ=4,σ2=0.6667, σ=0.8165 • 现以n=2作独立的回置抽样,总共得 Nn=32=9个样本。 • 抽样结果列入下表:
第六章__概率分布
二、正态分布表的编制与使用
• (一)正态分布表的编制与结构
• 正态分布表的结构一般包括三栏
• 第一栏:Z分数单位;
• 第二栏:密度函数或比率数值(y);
• 第三栏:概率值(p)。
• (二)正态分布表的使用
2
3
• 当g2=0时,正态分布的峰度;g2>0时,分布的峰度 比正态分布的峰度低阔;g2<0时,表明分布的峰度比 正态分布的峰度高狭。当N>1000时,g2值才比较可 靠。
• (三)累加次数曲线法
• 正态分布概率曲线和样本的累加频率曲线完全重
合说明样本分布为正态;若偏离,则不符合。
• 四、正态分布理论在测验中的应用
-0.84 -0.525 0 0.84 1.645 2.33
4.160 4.475 5.000 5.840 6.645 7.330
• (三)在能力分组或等级评定时确定人数
• ①将6个标准差除以分组的或等级的数目,做到Z
分数等距;
• ②查正态分布表,从Z求p,即各等级或各组在等
距的情况下应有的比率; • ③将比率乘以欲分组的人数,便得到各等级或分 组该有的人数。
• (二)二项分布
• 二项分布:试验仅有两种不同性质结果的概率分布。也称 两个对立事件的概率分布。
• 二项分布同二项定理有着密切的关系:
n 1 n1 n1 n1 n n (p+q)n =C0 p +C p q + +C pq +C n n n nq
x x n x (p +q)n = Cn pq n
心理统计学课件第六章 概率分布
(三)正态分布的特征
正态分布的形式是对称的,它的对称轴是 经过平均数点的垂线。
正态分布的中央点(即平均数点)最高, 然后逐渐向两侧下降。
正态曲线下的面积为1,平均数点的垂线 将面积划分为相等的两部分0.50。
正态分布曲线,标准差与概率有一定的数 量关系。
二、正态分布表的结构与使用
2、已知P值,求Z分数
已知从平均数开始的概率值,求Z值 已知位于两端的概率值,求该概率分界点
上的Z值 已知正态曲线中间部分的概率,特定区间的人数 求考试成绩中某一特定人数比率的分数界
限 按能力分组或等级评定时确定人数 将等级评定结果转化为测量数据
按能力分组或等级评定时确定人数
要把100人在某一能力上分成5个等级, 各等级应该有多少人?
将等级评定结果转化为测量数据
某教师评价全班50人的作文,有8人优, 17人良,20人中,5人及格,求各等级的 标准分数
求考试成绩中特定区间的人数
已知某年级200名学生考试呈正态分布, 平均分为85分,标准差为10分,学生甲 的成绩为70分,问全年级成绩比学生甲低 的学生人数是多少?
求考试成绩中某一特定人数比率的分数界限
某次招生考试,学生成绩符合正态分布, 学生成绩的平均分为80分,标准差为10 分,要择优录取25%的学生进入高一级学 校学习,问最低分数线应是多少?
第六章 概率分布 第三节 正态分布
一、正态分布特征
(一)正态分布的概念 与二项概率分布对比 变量类型 图形
正态分布:
在一个概率分布中,中间频数多,两 端频数对称地减少,成为一种“钟”形对 称的理论概率分布。
(二)正态分布曲线
标准正态分布的密度函数:
06 概率分布
2、经验分布与理论分布
依分布函数的来源,可将概率分布分为经验
分布与理论分布。
经验分布(empirical distribution)是指根据
观察或实验所获得的数据而编制的次数分布或相 对频率分布。
理论分布(theoretical distribution)是按某
心理统计学
段Z值之间的面积,再乘以总人数,即为各
等级人数。
概率分布 心理统计学
例题
要把100人在某一能力上分成5个
等级,各等级应该有多少人,才能使
等级评定做到等距?
概率分布
心理统计学
注意事项:
最后所计算的各组人数分布,应
该与总数相等。
概率分布
心理统计学
解:
分 组 A B C
6 5 1.2
是指对随机变量取不同值时的概率的描述,一 般用概率分布函数进行描述。
依不同的标准,对概率分布可作不同的分
类。
概率分布 心理统计学
1、离散型分布与连续型分布
依随机变量的类型,可将概率
分布分为离散型概率分布与连续型 概率分布。心理与教育统计学中最
常用的离散型分布是二项分布,最
常用的连续型分布是正态分布。
上的曲线纵坐标的高度。
概率值(p),即不同Z分数点与平均数之间的
心理统计学
面积与总面积之比。
概率分布
2.正态分布表的使用
已知Z值求概率
⑴.求Z=0至某一Z值之间的概率: 直接查表 ⑵.求两个Z值之间的概率
两Z值符号相同:PZ1-Z2=PZ2-PZ1
两Z值符号相反:PZ1-Z2=PZ2+PZ1
试验统计方法第六章概率分布解析
四、农药药效的调查和计算
药效试验的目的,是要取得各种农药防治病虫害的 效果的数据,故必须在处理前后分别检查死亡虫数或残 存虫数.病株数、病叶数和病斑数等,然后根据处理前 后虫、病数的变化或增减,求得防治效果,以表示农药 的药效。
农药药效的表示方法
杀虫剂的药效常用 害虫死亡率、虫口减退率、被害 率、缺苗率、防治效果等来表示; 杀菌剂的药效常用 发病率、普遍率、病情指数、防 病效果等来表示。
(五)事件的独立性
如果事件A的发生与否不影响事件B发生的可 能性,则称事件A和事件B相互独立。
四、频率和概率
(一)频率
某种事件在多次进行同样试验中,发生该事件的次 数(a)和试验次数(n)的比率便是频率。即频率=a/n。
例6-1:如多次随机调查不同株数棉花受棉铃虫危害的 数量及计算被害频率如下:
调查株数 10 受害株数 3 被害频率 0.300 20 3 0.150 50 10 0.20 100 22 0.220 200 43 0.215 500 108 0.216 1000 215 0.215
校正虫口 = 下 降 率(%)
×100
1 - 对照区虫口下降率
蚜虫、红蜘蛛等害虫繁殖较快,使对照区虫量有增有减,其 公式改为:
处理区虫口下降率±对照区虫口下降率 校正虫口= 下降率(%) ×100
1 ± 对照区虫口下降率
(二)杀菌剂效果的计算: 1、根据防治前后发病率的计算公式 对照区发病率 - 防治区发病率 防治效果(%)= ×100 对照区发病率 2、根据防治前后病情指数增长率的计算公式 对照区病情指数 - 防治区病指 防治效果(%)= ×100 对照区病情指数
频率是事件发生之后,其发生次数占总次数的现实比 率,它不包含事件将来发生的可能性。
教育统计学第六章 概率及概率分布
( 0, )
标准正态分布
如果把总频数看成是1,随机变量的分布密度是
f ( x)
1 2
( x )2 2 2
e
( 0 , )
二者相比:
f ( x)
N e 2
x 2
2 2
( 0, )
92 P( A) 0.514 179
87 P( B) 0.486 179
7 P (C / A) 0.076, 92 12 P (C / B ) 0.137, 87
P( AC ) P( A) P(C / A) 0.514 0.076 0.039
P( BC ) P( B) P(C / B) 0.486 0.137 0.067
由于F值是两个总体方差的比值,所以F值均为正 值,故F的图象处于正半轴的上方 ,其最小值为0,最 大值为无穷大。
F值可通过查值表求得
左右两侧临界值之间的关系为:
1 F1 / 2 df1 , df2 F / 2 df2 , df1
例如:查表得 则
F0.05 / 2 8,9 4.10
1 2 c5 c35 p( A1 ) 3 c40
0.301
2 1 c5 c35 p( A2 ) 3 0.035 c40
3 c5 p( A3 ) 3 c40
0.001
p( A) p( A1 A2 A3 ) p( A1 ) P( A2 ) P( A3 )
例3 某班共有40名学生,如果其中只有5人没 有完成作业,而其它学生都较好地完成了作业。若 从该班中随机抽出3人检查作业完成情况,问至少 抽到一人未完成作业的概率是多少?
概率分布及概率分布图
概率密度函数图
总结词
概率密度函数图是一种展示连续概率分布的图形,通过曲线的高低表示概率密度的大小。
详细描述
概率密度函数图是连续概率分布的图形表示,它通过曲线的高低表示概率密度的大小。在概率密度函数图中,曲 线下方的面积表示事件发生的概率。这种图形可以帮助我们了解连续随机变量的分布情况,并用于估计和预测未 来的事件。
02 离散概率分布
二项分布
01
02
03
定义
二项分布是描述在n次独 立重复的伯努利试验中成 功的次数的概率分布。
公式
$B(n, p) = C(n, k) p^k (1-p)^{n-k}$,其中C(n, k)是组合数,表示从n个 不同项中选取k个的方法 数。
应用场景
例如,抛硬币的结果(正 面或反面),或者给定数 量的独立事件中成功事件 的次数。
泊松分布
定义
泊松分布是描述在单位时间内(或单 位面积内)随机事件的次数,当这些 事件以小概率发生,并且这些事件之 间是独立的。
公式
应用场景
例如,放射性衰变或者网络中同时发 生的请求数。
$P(X=k) = frac{e^{lambda}lambda^k}{k!}$,其中 $lambda$是事件的平均发生率。
05 概率分布及概率分布图的 应用实例
在统计学中的应用
1 2 3
描述性统计
概率分布图可以用来描述数据的分布情况,如频 数分布图、直方图等,帮助我们了解数据的集中 趋势、离散程度等。
假设检验
在假设检验中,概率分布图可以用来表示样本数 据和理论分布之间的比较,帮助我们判断样本数 据是否符合预期的分布。
概率分布的种类
离散概率分布
描述离散随机变量的取值概率,如二项分布、泊 松分布等。
管理统计学6 第六章 概率及其分布
星蓝海学习网
6.4 二项分布和泊松分布
6.4.1 二项分布
由于概率P的取值不同,二项分布的形状有差异。当P=0.25时,均值偏向 中心值以下的小值一方;当P=0.5时,均值处于中心位置;当P=0.75时,均 值偏向中心值以上的大值一方。所以,二项分布图形随着不合格率P的变 化而变化,当P=0.5时基本对称。
式中,Cnx
n!
x!n
x!
表示n个产品取x个不合格品的组合数。
星蓝海学习网
6.4 二项分布和泊松分布
6.4.1 二项分布
例题: 已知产品合格率为0.9,对产品检验100次,出现2次不合格品的概 率。 解:
C1200 0.120.91002 4950 0.01 0.00003279 0.0016231
星蓝海学习网
6.3 正态分布
6.3.1 正态分布的特点
总体落在总体平均数1倍标准差周围的概率为68.26%。即 当t=1时,则有
P X P X 1 68.26%
总体落在总体平均数2倍标准差周围的概率为95.45%。即 当t=2时,则有
二项分布的均值为 标准差为
np
npq
由于概率P的取值不同,二项分布的形状有差异。当P=0.25时,均值偏向 中心值以下的小值一方;当P=0.5时,均值处于中心位置;当P=0.75时, 均值偏向中心值以上的大值一方。所以,二项分布图形随着不合格率P的 变化而变化,当P=0.5时基本对称。
3 星蓝海学习网
学习目标
本章要掌握: 1. 数据与概率的关系; 2. 从概率分布上把握统计的特点; 3. 正态分布及其概率计算方法(学习的重点)。
4 星蓝海学习网
第六章 正态分布
第六章正态分布一、基本概念1、正态分布连续性随机变量中重要的分布是钟型概率分布,就是正态分布(normal distribution),也称为常态分布,是一种连续型随机变量的概率分布。
学生的身高、体重、成绩等都是正态分布常见的例子,很高、很矮的都比较少,多数处于正常身高;很胖、很瘦的也较少,多数是正常体重;成绩很高和很低的是少数,多数同学属于中等成绩。
2、标准正态分布在正态分布中,随机变量X是以μ和σ为参数,当μ和σ取值固定,μ=0,σ=1时,随机变量X的概率密度变为:2221Zey-=π,(,)Z∈-∞+∞,相应的正态分布N(0,1)称为标准正态分布。
标准正态分布是正态分布的特殊情况,由于μ和σ取值固定,不依赖于参数μ和σ,而是固定的、唯一的。
3、Z值Z值又称为标准分数,它是以平均数为参照点,以标准差为单位的描述原始数据在总体中相对位置的量数。
我们可以通过计算Z值将一般正态分布转换为标准正态分布。
例如某个数值的Z值为-1.5,则说明这个数值低于均值1.5倍的标准差。
二、基本方法1、Z值的计算Z值的计算公式为:Z=(X—μ)/σ。
假设),(~2σμNX,根据Z值计算公式转换后,Z=()σμ-X~N(0,1),这样就将一般正态分布转换成标准正态分布。
某班同学平均体重为50公斤,标准差为10,某同学同学为70,将这个分数转化为Z 值。
Z=(X—μ)/σ=(70—50)/10= 2表明这个同学的体重在分布中高于均值2个标准差。
2、标准正态分布表使用方法标准正态分布表是根据标准正态分布中随机变量与其概率的对应关系绘制的,表中数值是变量值X所对应的分布函数ф(x)的数值表。
首先只根据Z值公式将正态分布转化为标准正态分布,就可以通过查表得到对应的概率值。
对于负的变量值,转化:ф(—x)=1—ф(x)一般情况下,设X~(0,1),则有:P(X<a)=ф(a),P(a<X<b)=ф(b)—ф(a)P (X>a )=1—ф(a )具体查表时,我们可以看到,标准正态分布表第一行和第一列均表示X 值,列为X 的整数位和第一位小数位,行为X 的第二位小数位,交叉处的值就是对应的概率。
概率论与数理统计 --- 第六章{样本及抽样分布} 第四节:抽样分布
P T 1.059
0.15.
例2:
从正态总体N ( , 0.5 )中抽取样本X 1 , , X 10 .
2
数理统计
10 2 (1)已知 0,求概率P X i 4 ; i 1 10 2 (2)未知,求概率P ( X i X ) 2.85 . i 1
S1 和S2 分别是这两个样本的样本方差, 则有:
2 2
(1)
S1
2 2
S2
~ F ( n1 1, n2 1);
2 2
若两方差 1 2,则
S1 1
2 2
2 2
S2 2
~ F ( n1 1, n2 1);
(2)
X Y ( 1 2 ) ( n1 1) S1 ( n2 1) S2
n取不同值时
( n 1) S
2
2
的分布
定理3 (样本均值的分布) 数理统计 设X1, X2, …, Xn是取自正态总体 N(μ, σ2)的样本, 2 X和S 分别为样本均值和样本方差, 则有:
X S n ~ t ( n 1)
证:由定理1、和t分布的定义可得: 2
X ~ N (0,1), ( n 1) S
2) F分布的分位点:
对于给定的, 1, 称满足条件: 0
P F F ( n1 , n2 )
( y )dy
F ( n1 , n2 )
的点F ( n1 , n2 )为F ( n1 , n2 )分布的上 分位点.
F分布的上分位点的性质:
F1 ( n1 , n2 ) 1 F ( n2 , n1 )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章概率分布一、单选题180,一个随机样本n=16,其均值大于85的概率是()。
A. 2.52%B. 4.78% c. 5.31% D. 6.44%2.让64位大学生品尝A.、B两种品牌的可乐并选择一种自己比较喜欢的。
如果这两种品牌的可乐味道实际没有任何区别,有39人或39人以上选择品牌B的概率是(不查表):()A.2.28%B.4 .01%C.5.21%D. 39.06%3. 某个单峰分布的众数为15,均值是10,这个分布应该是( )A.正态分布 B.正偏态分布 C.负偏态分布 D.无法确定4.一个单项选择有48单侧检验标准,至少应对多少题成绩显著优于单凭猜测()。
A.16题 B.17题 C.18题 D.19题5. 在一个二择一实验中,被试挑12次,结果他挑对10次,那么在Z值等于()A.4.05B.2.31C.1.33D. 2.026. 某班200人的考试成绩呈正态分布,其平均数=l2,S=4分,成绩在8分和16分之间的人数占全部人数的()。
A.34.13%B.68.26%C.90%D. 95%7. 在一个二择一实验中,被试挑12次,结果他挑对10次,那么在Z=(X-M)/S这个公式中X应为()A.12B.10C.9.5D. 10.58. 在处理两类刺激实验结果时,在下列哪种情况下不可以用正态分布来表示二项分布的近似值?()A.N<10B.N>=10C.N>30D. N>109. t分布是平均数的对称的分布,当样本n趋于∞时,t分布为()A. 二项分布B. 正态分布C. F分布10. 概率和统计学中,把随机事件发生的可能性大小称作随机事件发生的()A.概率B.频率C.频数D. 相对频数11. 在一次实验中,若事件B的发生不受事件A的影响,则称AB两事件为()A.不影响事件B.相容事件C.不相容事件D. 独立事件12. 正态分布由()于1733年发现的A.高斯B.拉普拉斯C.莫弗D. 高赛特13. 在正态分布下,平均数上下1.96个标准差,包括总面积的()A.68.26%B.95%C.99%D. 34.13%14. 在次数分布中,曲线的右侧部分偏长,左侧偏短,这种分布形态可能是()A.正态分布 B.正偏态分布 C.负偏态分布 D.常态分布15. 一个硬币掷10次,其中5次正面向上的概率是()A.0.25 B.0.5 C.0.2 D.0.416. t分布是由()推导出来的A.高斯B.拉普拉斯C.莫弗D. 高赛特17. 一个硬币掷3次,出现两次或两次以上正面向上的概率是()A.1/8 B.1/2 C.1/4 D.3/818. 有十道正误题,答题者答对()题才能认为是真会?A.5 B.6 C.7 D.819. 有十道多项选择题,每题有5个答案,其中只有一个是正确的,那么答对()题才能认为是真会?A.4 B.5 C.6 D.720. 正态分布的对称轴是过()点垂线。
A.平均数 B.众数 C.中数 D.无法确定21.在正态分布下Z=1以上的概率是()A. 0.34 B.0.16 C.0.68 D. 0.3222. 在正态分布下Z=-1.96到Z=1.96之间的概率为()。
A. 0.475 B.0.95 C.0.525 D. 0.0523. 从n= 200的学生样本中随机抽样,已知女生为132人,问每次抽取一人,抽到男生的概率是()A. 0.66 B.0.34 C.0.33 D. 0.1724. 两个骰子掷一次,出现两个相同点数的概率是()A. 0.17B. 0.083C. 0.014D. 0.02825. 如果由某一次数分布计算得SK>0,则该次数分布为()A.高狭峰分布 B.低阔峰分布 C.负偏态分布 D.正偏态分布26. 在正态总体中随机抽取样本,若总体方差已知,则样本平均数的分布为()A.t分布 B.F分布 C.正态分布 D27.( )A.正态分布分布 D.F分布28. 下面各组分布中,不因样本容量的变化而变化的分布是()A.正态分布分布D.F分布29. t分布是关于平均值0对称的分布,当样本容量n t分布为()A.正态分布B. t分布D. F 分布30. 总体呈正态分布,方差已知时,样本平均数分布的方差与总体方差间的关系为()31. F分布是一个正偏态分布,其分布曲线的形式随分子、分母自由度的增加而()A. B.渐近二项分布 C.渐近t分布 D. 渐近正态分布32. 设A、B为两个独立事件,则P(A·B)为()A. P(A)B. P(B)C. P(A)·P(B)D. P(A)+P(B)33. 样本容量均影响分布曲线形态的是()A. 正态分布和F分布B. T分布和T分布C. 正态分布和T分布 D.34. 正态曲线与x轴所围成区域的面积为()A. 0.5B. 0.99C. 1D. 0.9535. 对随即现象的一次观察为一次()A. 随机实验B. 随机试验C. 教育与心理实验D. 教育与心理试验36. 如果由某一次数分布计算得SK=0,则该次数分布为()A. 对称分布B. 正偏态分布C. 负偏态分布D. 低阔峰分布37. t分布比标准正态()A. 中心位置左移,但分布曲线相同B. 中心位置右移,但分布曲线相同C. 中心位置不变,但分布曲线峰高D. 中心位置不变,但分布曲线峰低,两侧较伸展38. 一批数据中各个不同数值出现次数情况是()A. 次数分布B. 概率密度函数C. 累积概率密度函数D. 概率参考答案1.B2.B3.C4.B5.B6.B7.B8.A9.B 10.A 11.D 12.C 13.B 14.B 15.A 16.D 17.B 18.D 19.B 20.A 21.B 22.B 23.B 24.A 25.D 26.C 27.C 28.A 29.A 30.A 31.D 32.C 33.B 34.C 35.B 36.A 37.D 38.D二、多选题l、依分布函数的来源,可把概率分布划分为()A. 离散分布 B.连续分布 C.经验分布 D. 理论分布2.使用正态分布表,可以进行的计算有( )A.根据Z分数求概率 B.根据概率求Z分数C. 根据概率求概率密度D. 根据Z值求概率密度3. 检验次数分布是否正态的方法有()A. 皮尔逊偏态量数法 B.累加次数曲线法 C.峰度偏度检验法 D. 直方图法4. 正态分布中,如果平均数相同,标准差不同,那么()A. 标准差大的正态曲线形式低阔 B.标准差大的正态曲线形式高狭C. 标准差小的正态曲线形式低阔 D.标准差小的正态曲线彤式高狭5. 正态分布曲线下,标准差与概率(面积)有一定的数量关系,即(),A. 平均数上下一个标准差包括总面积的34.13%B. 平均数上下1.96个标准差包括总面积的95%C. 平均数上下2.58个标准差包括总面积的99%D. 平均数上下3个标准差包括总面积的99.99%6. 二项实验满足的条件有()A. 任何一个实验恰好有两个结果B. 共有n次实验,并且n是预先给定的任一整数C. 每次实验可以不独立D. 每次实验之间无相互影响7. 下列关于二列分布正确的是()A. 当p=q时图形是对称的B. 二项分布不是离散分布,概率直方图是越阶式的C. 当时图形呈偏态D. 二项分布的极限分布为正态分布8. 下列条件下的样本平均数的分布为正态分布的是()A.总体分布为正态,总体方差已知B.总体分布非正态,总体方差已知,样本n >30C.总体分布为正态,总体方差未知D.总体分布非正态,总体方差未知,样本n >309.下列条件下的样本平均数的分布为t分布的是()A. 总体分布为正态,总体方差已知B. 总体分布非正态,总体方差已知,样本n>30C.总体分布为正态,总体方差未知D.总体分布非正态,总体方差未知,样本n> 3010. 下列关于t分布正确的是()A.t分布的平均数是0B.t分布是以平均数0左右对称的分布C.当样本容量趋于无穷大时t分布为正态分布,方差为lD.当n-1>30以上时,t分布接近正态分布,方差小于111. ( )AD. 如果df >2df12. 下面是F分布特点的是()A.F分布是一个正偏态分布B.F分布具有可加性,F分布的和也是一个F分布C.F总为正值D.当组间自由度为1时,F检验与t检验的结果相同13. 心理与教育研究中,最常用的统计分布类型有()A. 正态分布 B.t分布 C D. F分布14. 以下各分布中,因样本容量的变化而变化的分布是()A. 正态分布 B.t分布 C D. F分布参考答案:1.CD 2.ABCD 3.ABCD 4.AD 5.BCD 6.ABD 7.ACD 8.AB 9.CD 10.ABC 11.CD 12.ACD 13.ABCD 14.BCD(注:可编辑下载,若有不当之处,请指正,谢谢!)。