06 概率分布
概率论与数理统计(06)第6章 统计量及其抽样分布

σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z
钱小军《概率论与数理统计》chap06-normal distribution

P(0.0 z 1.0)
English Version: Appendix B A-4
标准正态分布表.xls 中文版:参加附赠CD
2/22/2019
Tsinghua-CUHK Finance MBA 2008
16
-3
2/22/2019
0.00
0.50
1.00
1.50
2.00
2.50
3.00
ab E ( x) 2
(b a) 2 Var( x) 12
2/22/2019
Tsinghua-CUHK Finance MBA 2008
8
Normal Distribution 正态分布
Normal Distribution is one of the most important distributions in the probability statistics. One hand, it is very common in nature; the other hand, it has so many excellent properties. A lot of distributions can be described by it. 正态分布是概率统计中最重要的一种分布 。一方面,正态分布是 自然界最常见的一种分布; 另一方面,正态分布具有许多良好的 性质,很多分布可以用正态分布来近似描述。
Probability Density Function of Standard Normal
Tsinghua-CUHK Finance MBA 2008 17
-2.50
-2.00
-1.50
-1.00
-0.50
Probability of Standard Normal Distribution
高三概率分布知识点

高三概率分布知识点一、概率分布的基本概念概率分布是描述随机变量可能取值及其对应概率的函数。
在概率论中,常见的概率分布包括离散型概率分布和连续型概率分布两种类型。
二、离散型概率分布离散型概率分布是指随机变量取有限或可数个离散值的概率分布。
常见的离散型概率分布包括:1. 伯努利分布:描述只有两个可能结果的随机试验,如抛硬币、掷骰子等。
2. 二项分布:描述n次独立重复的伯努利试验,如抛n次硬币,成功的次数服从二项分布。
3. 泊松分布:描述单位时间内某事件发生次数的概率分布,如单位时间内电话呼入次数、车辆到达次数等。
三、连续型概率分布连续型概率分布是指随机变量取值在一个区间内连续变化的概率分布。
常见的连续型概率分布包括:1. 均匀分布:描述在区间[a, b]上的随机事件等可能发生的概率分布。
2. 正态分布:也称为高斯分布,是最重要的连续型概率分布之一,常用于描述自然界和社会现象。
正态分布具有钟形曲线状,对称分布的特点。
3. 指数分布:描述一个事件发生与下一个事件发生之间的时间间隔的概率分布。
四、概率分布的参数概率分布的参数是用来描述概率分布形态的统计量。
不同类型的概率分布具有不同的参数,常见的参数包括:1. 伯努利分布的参数是成功的概率p。
2. 二项分布的参数是试验次数n和成功的概率p。
3. 泊松分布的参数是单位时间内事件发生的平均次数λ。
4. 均匀分布的参数是区间的上下界a和b。
5. 正态分布的参数是均值μ和标准差σ。
6. 指数分布的参数是速率参数λ。
五、概率分布的期望和方差期望是概率分布中随机变量的平均值,是对随机变量取值的加权平均。
方差是描述随机变量取值分散程度的度量,是随机变量与其期望值之差的平方的加权平均。
概率分布的期望和方差可以用于描述随机变量的分布特征。
六、应用举例1. 在经济学中,正态分布常用于描述收入分布、价格变动等经济现象。
2. 在生物学中,二项分布可用于描述基因型分布、群体遗传等问题。
06二项分布及泊松分布

●Bernoulli 试验(Bernoulli T est):将感兴趣的事件A出现的试验结果称为“成功”,事件A不出现的试验结果称为“失败”,这类试验就称为Bernoulli 试验●二项分布(binomial distribution):是指在只会产生两种可能结果如阳性或阴性之一的n次独立重复试验中,当每次试验的阳性概率π保持不变时,出现阳性次数X=0,1,2,…,n的一种概率分布。
●Poisson分布(Poisson distribution):随机变量X服从Poisson分布式在足够多的n次独立试验中,X取值为1,2,…,的相应概率为…的分布。
★二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。
★二项分布的图形:当∏=0.5,二项分布图形是对称的,当∏不等于0.5,图形是偏态的,随着n增大,图形趋于对称。
当n趋于无穷大时,只有∏不太靠近0或者1,二项分布近似正态分布。
★二项分布的应用总体率的区间估计,样本率与总体率比较,两样本率的比较★Poisson 分布的应用总体均数的区间估计,样本均数与总体均数的比较,两个样本均数的比较:两个样本计数均较大时,可根据Poisson 分布的正态近似性对其进行u 检验。
★Poisson 分布成立的条件:①平稳性:X 的取值与观察单位的位置无关,只与观察单位的大小有关;②独立增量性:在某个观察单位上X 的取值与前面各观察单位上X 的取值无关;③普通性:在充分小的观察单位上X 的取值最多为1。
Poisson 分布,X~P(μ),X 的均数μX =μ,X的方差σ2 =μ,X的标准差σX★Poisson分布的性质1、总体均数λ与总体方差相等是泊松分布的重要特点。
2、当n增大,而∏很小,且n∏=λ总体均数时,二项分布近似泊松分布。
3、当总体均数增大时,泊松分布渐近正态分布,一般而言,总体均数》20时,泊松分布资料做为正态分布处理。
几种常见的概率分布率分解课件

均匀分布的定 义
均匀分布是一种概率分布,其特点是随机变量在一定区间内取值的可能性是等可 能的。
在数学表达上,如果一个随机变量X服从某个区间[a, b]上的均匀分布,则其概率 密度函数f(x)可以表示为f(x)=1b−a,当x∈[a,b]时,f(x)=0,当x∉[a,b]时。
均匀分布的特点
均匀分布的期望值E(X)和方差Var(X) 分别为(a+b)/2和(b-a)^2/12。
泊松分布在生活中的应用
02
01
03
在物理学中,泊松分布用于描述放射性衰变过程中粒 子发射的次数。
在统计学中,泊松分布常用于二项分布的近似,当试 验次数很大而事件发生的概率很小时。
在计算机科学中,泊松分布在处理网络流量和计算机 系统中的任务调度等问题时非常有用。
04
二项分布
二项分布的定义
总结词
二项分布是一种离散概率分布,描述了在n次独立重复的伯努利试 验中成功的次数。
指数分布的期望值和方差是有限的,分别为1/λ和1/λ^2,其中λ是概率密度函数的 参数。
指数分布在生活中的应用
指数分布在可靠性工程中广泛应 用,用于描述产品寿命、故障间
隔时间等。
在排队论中,指数分布用于描述 顾客到达和服务时间等随机变量。
在保险精算中,指数分布用于计 算保费和准备金。
06
均匀分布
几种常见的概率分布率分解课 件
CONTENCT
录
• 概率分布率概述 • 正态分布 • 泊松分布 • 二项分布 • 指数分布 • 均匀分布
01
概率分布率概述
概率分布率的定 义
概率分布率
表示随机变量取值的概率规律。
定义方式
对于离散随机变量,概率分布律为P(X=xi)=pi,i=1,2,3...;对于连续随机变量, 概率分布函数为P(a≤X≤b)=∫[a,b]f(x)dx,其中f(x)为概率密度函数。
数的概率分布

数的概率分布概率分布是概率论中重要的概念之一,用于描述一个随机变量取值的可能性。
在数学和统计学领域里,数的概率分布研究了在特定情况下数值出现的概率。
本文将介绍数的概率分布的基本含义、常见的概率分布类型以及其在实际应用中的重要性。
一、概率分布的基本定义概率分布是随机变量的可能取值及其对应概率的描述。
随机变量可以是离散型变量或连续型变量。
离散型变量的取值有限且可数,如掷骰子的点数;连续型变量的取值为无限个且不可数,如人的身高。
概率分布描述了随机变量每个取值的概率。
二、常见的概率分布类型1. 离散型概率分布离散型概率分布用于描述随机变量为离散型的情况。
以下是几种常见的离散型概率分布:(1)伯努利分布伯努利分布是一种简单的离散型分布,常用于描述试验只有两个可能结果的情况,如硬币的正反面。
(2)二项分布二项分布是描述n次成功失败试验的离散型分布,例如n次掷硬币中正面朝上的次数。
(3)泊松分布泊松分布用于描述单位时间内随机事件发生的次数,如单位时间内电话呼叫次数、交通事故发生次数等。
2. 连续型概率分布连续型概率分布用于描述随机变量为连续型的情况。
以下是几种常见的连续型概率分布:(1)均匀分布均匀分布描述了在一个区间内随机取值时,每个取值的概率相等,如抛硬币的落点在一个平面上的坐标。
(2)正态分布正态分布是最常见的连续型概率分布之一,也称为高斯分布。
它以钟形曲线为特征,广泛应用于自然和社会科学领域,如身高、体重等。
(3)指数分布指数分布用于描述事件发生的时间间隔或等待时间,如设备故障发生的时间间隔、用户等待的响应时间等。
三、概率分布在实际应用中的重要性概率分布在实际应用中具有重要的作用,主要体现在以下几个方面:1. 预测和决策通过分析和建模某个事件或现象的概率分布,可以对未来可能的结果进行预测。
例如,在金融领域中,通过对股票收益率的概率分析,可以帮助投资者做出决策。
2. 风险评估概率分布可以用于评估风险。
在保险行业中,通过对保险索赔次数或大小的概率分析,可以估算保险公司的风险,并确定合理的保费。
专题06 离散型随机变量及其分布列、数字特征(解析版)

06离散型随机变量及其分布列、数字特征知识点1随机变量(1)定义:一般地,对于随机试验样本空间Ω中的每个样本点ω,都有唯一的实数X(ω)与之对应,我们称X为随机变量.随机变量的取值X(ω)随着随机试验结果ω的变化而变化.(2)离散型随机变量:可能取值为有限个或可以一一列举的随机变量称之为离散型随机变量.(2)表示:随机变量通常用大写英文字母表示,例如X,Y,Z;随机变量的取值用小写英文字母表示,例如x,y,z.知识点2离散型随机变量的分布列的定义(1)定义:一般地,设离散型随机变量X的可能取值为x1,x2,…,x i,…,x n,我们称X取每一个值x i 的概率P(X=x i)=p i,i=1,2,…,n为X的概率分布列,简称分布列.(2)表示方法:①表格;②概率分布图.知识点3离散型随机变量的分布列的性质(1)p i ≥0,i =1,2,…,n ;(2)p 1+p 2+…+p n =1.知识点4离散型随机变量的均值与方差一般地,若离散型随机变量X 的分布列如下表所示,X x 1x 2…x n Pp 1p 2…p n(1)均值:称E (X )=x 1p 1+x 2p 2+…+x i p i +…+x n p n =i ii 1nx P =∑为随机变量X 的均值或数学期望,数学期望简称期望.(2)方差:称D (X )=(x 1-E (X ))2p 1+(x 2-E (X ))2p 2+…+(x n -E (X ))2p n =i 1n=∑(x i -E (X ))2p i 为随机变量X的方差,有时也记为Var (X ),并称D (X )为随机变量X 的标准差,记为σ(X ).(3)均值的意义:均值是随机变量可能取值关于取值概率的加权平均数,它综合了随机变量的取值和取值的概率,反映了随机变量取值的平均水平.(4)方差和标准差的意义:随机变量的方差和标准差都可以度量随机变量取值与其均值E (X )的偏离程度,反映了随机变量取值的离散程度.方差或标准差越小,随机变量的取值越集中;方差或标准差越大,随机变量的取值越分散.知识点5均值与方差的性质若Y =aX +b ,其中X 是随机变量,a ,b 是常数,随机变量X 的均值是E (X ),方差是D (X ).则E (Y )=E (aX +b )=aE (X )+b ;D (Y )=D (aX +b )=a 2D (X ).(a ,b 为常数).知识点6分布列性质的两个作用(1)利用分布列中各事件概率之和为1可求参数的值.(2)随机变量ξ所取的值分别对应的事件是两两互斥的,利用这一点可以求相关事件的概率.知识点7均值与方差的四个常用性质(1)E (k )=k ,D (k )=0,其中k 为常数.(2)E (X 1+X 2)=E (X 1)+E (X 2).(3)D (X )=E (X 2)-(E (X ))2.(4)若X1,X 2相互独立,则E (X 1X 2)=E (X 1)·E (X 2).考点1离散型随机变量分布列的性质(1)求a的值;(2)求;(3)求X.【答案】(1)由分布列的性质,得++++P(X=1)=a+2a+3a+4a+5a=1,所以a=115.(2)=++P(X=1)=3×115+4×115+5×115=45.(3)X=++=115+215+315=25.【总结】离散型随机变量分布列性质的应用(1)利用“总概率之和为1”可以求相关参数的取值范围或值;(2)利用“离散型随机变量在一范围内的概率等于它取这个范围内各个值的概率之和”求某些特定事件的概率;(3)可以根据性质判断所得分布列结果是否正确.【变式1-1】设随机变量X的分布列为P(X=k)=Ck(k+1),k=1,2,3,C为常数,则P(X<3)=__________.【答案】89【解析】随机变量X的分布列为P(X=k)=Ck(k+1),k=1,2,3,∴C2+C6+C12=1,即6C+2C+C12=1,解得C=43,∴P(X<3)=P(X=1)+P(X=2)=43=89.【变式1-2】设离散型随机变量X的分布列为X01234P0.20.10.10.3m(1)求随机变量Y=2X+1的分布列;(2)求随机变量η=|X-1|的分布列;(3)求随机变量ξ=X2的分布列.【解析】(1)由分布列的性质知,0.2+0.1+0.1+0.3+m=1,得m=0.3.首先列表为:X012342X+113579从而Y=2X+1的分布列为:Y13579P0.20.10.10.30.3(2)列表为:X01234|X-1|10123∴P(η=0)=P(X=1)=0.1,P(η=1)=P(X=0)+P(X=2)=0.2+0.1=0.3,P(η=2)=P(X=3)=0.3,P(η=3)=P(X=4)=0.3.故η=|X-1|的分布列为:η0123P0.10.30.30.3(3)首先列表为:X01234X2014916从而ξ=X2的分布列为:ξ014916P0.20.10.10.30.3【变式1-3】设随机变量X的分布列如下:X12345P 112161316p则p为()A.1 6B.13C.14D.112【答案】C【解析】由分布列的性质知,112+16+13+16+p=1,∴p=1-34=14.【变式1-4】设X是一个离散型随机变量,其分布列为X-101P 121-q q-q2则q等于()A.1 B.22或-22C.1+22D.2 2【答案】D【解析】1-q+q-q2=1,1-q≤12,q-q2≤12,解得q=22.【变式1-5】(多选)设随机变量ξ的分布列为ak(k=1,2,3,4,5),则()A.a=115B.ξ=15C.ξ=215D.P(ξ=1)=310【答案】AB【解析】对于选项A,∵随机变量ξ的分布列为ak(k=1,2,3,4,5),∴P(ξ=1)=a+2a+3a+4a+5a=15a=1,解得a=115,故A正确;对于B,易知ξ3×115=15,故B正确;对于C,易知ξ=115+2×115=15,故C错误;对于D,易知P(ξ=1)=5×115=13,故D错误.【变式1-6】设X是一个离散型随机变量,其分布列为X01P9a2-a3-8a则常数a的值为()A.13B.23C.13或23D.-13或-23【答案】A【解析】≤9a 2-a ≤1,≤3-8a ≤1,a 2-a +3-8a =1,解得a =13.【变式1-7】离散型随机变量X 的概率分布列为P (X =n )=an (n +1)(n =1,2,3,4),其中a 是常数,则P X 的值为()A.23B.34C.45D.56【答案】D【解析】因为P (X =n )=a n (n +1)(n =1,2,3,4),所以a 2+a 6+a 12+a 20=1,所以a =54,所以X P (X =1)+P (X =2)=54×12+54×16=56.【变式1-8】若随机变量X 的分布列如下表,则mn 的最大值是()X 024Pm0.5n A.116B.18C.14D.12【答案】A【解析】由分布列的性质,得m +n =12,m ≥0,n ≥0,所以mn =116,当且仅当m =n =14时,等号成立.【变式1-9】随机变量X 的分布列如下:X -101Pabc其中a ,b ,c 成等差数列,则P (|X |=1)=______,公差d 的取值范围是______.【答案】23-13,13【解析】因为a ,b ,c 成等差数列,所以2b =a +c .又a +b +c =1,所以b =13,所以P (|X |=1)=a +c =23.又a =13-d ,c =13+d ,根据分布列的性质,得0≤13-d ≤23,0≤13+d ≤23,所以-13≤d ≤13.考点2求离散型随机变量的分布列【例2】双败淘汰制是一种竞赛形式,与普通的单败淘汰制输掉一场即被淘汰不同,参赛者只有在输掉两场比赛后才丧失争夺冠军的可能.在双败淘汰制的比赛中,参赛者的数量一般是2的次方数,以保证每一轮都有偶数名参赛者.第一轮通过抽签,两人一组进行对阵,胜者进入胜者组,败者进入负者组.之后的每一轮直到最后一轮之前,胜者组的选手两人一组相互对阵,胜者进入下一轮,败者则降到负者组参加本轮负者组的第二阶段对阵;负者组的第一阶段,由之前负者组的选手(不包括本轮胜者组落败的选手)两人一组相互对阵,败者被淘汰(已经败两场),胜者进入第二阶段,分别对阵在本轮由胜者组中降组下来的选手,胜者进入下一轮,败者被淘汰.最后一轮,由胜者组最终获胜的选手(此前从未败过,记为A)对阵负者组最终获胜的选手(败过一场,记为B),若A胜则A获得冠军,若B胜则双方再次对阵,胜者获得冠军.某围棋赛事采用双败淘汰制,共有甲、乙、丙等8名选手参赛.第一轮对阵双方由随机抽签产生,之后每一场对阵根据赛事规程自动产生对阵双方,每场对阵没有平局.(1)设“在第一轮对阵中,甲、乙、丙都不互为对手”为事件M,求M的概率;(2)已知甲对阵其余7名选手获胜的概率均为23,解决以下问题:①求甲恰在对阵三场后被淘汰的概率;②若甲在第一轮获胜,设甲在该项赛事的总对阵场次为随机变量ξ,求ξ的分布列.【分析】(1)先求出8人平均分成四组的方法数,再求出甲,乙,丙都不分在同一组的方法数,从而可求得答案;(2)①甲恰在对阵三场后淘汰,有两种情况:“胜,败,败”和“败,胜,败”,然后利用互斥事件的概率公式求解即可;②由题意可得ξ∈{3,4,5,6,7},然后求出各自对应的概率,从而可得ξ的分布列.【解析】(1)8人平均分成四组,共有C28C26C24C22A44种方法,其中甲,乙,丙都不分在同一组的方法数为A35,所以P(A)=A35C28C26C24C22A44=4 7.(2)①甲恰在对阵三场后淘汰,这三场的结果依次是“胜,败,败”或“败,胜,败”,故所求的概率为23×13×13+13×23×13=427.②若甲在第一轮获胜,ξ∈{3,4,5,6,7}.当ξ=3时,表示甲在接下来的两场对阵都败,即P(ξ=3)=13×13=19.当ξ=4时,有两种情况:(ⅰ)甲在接下来的3场比赛都胜,其概率为23×23×23=827;(ⅱ)甲4场对阵后被淘汰,表示甲在接下来的3场对阵1胜1败,且第4场败,概率为C12·23×13×13=427,所以P (ξ=4)=827+427=49.当ξ=5时,有两种情况:(ⅰ)甲在接下来的2场对阵都胜,第4场败,概率为23×23×13=427;(ⅱ)甲在接下来的2场对阵1胜1败,第4场胜,第5场败,概率为C12·23×13×23×13=881;所以P (ξ=5)=427+881=2081.当ξ=6时,有两种情况:(ⅰ)甲第2场胜,在接下来的3场对阵为“败,胜,胜”,其概率为23×132=881;(ⅱ)甲第2场败,在接下来的4场对阵为“胜,胜,胜,败”,其概率为133×13=8243;所以P (ξ=6)=881+8243=32243.当ξ=7时,甲在接下来的5场对阵为“败,胜,胜,胜,胜”,即P (ξ=7)=134=16243.所以ξ的分布列为:ξ34567P194920813224316243【总结】离散型随机变量分布列的求解步骤【变式2-1】为创建国家级文明城市,某城市号召出租车司机在高考期间至少进行一次“爱心送考”,该城市某出租车公司共200名司机,他们进行“爱心送考”的次数统计如图所示.(1)求该出租车公司的司机进行“爱心送考”的人均次数;(2)从这200名司机中任选两人,设这两人进行送考次数之差的绝对值为随机变量X ,求X 的分布列.【解析】(1)由统计图得200名司机中送考1次的有20人,送考2次的有100人,送考3次的有80人,∴该出租车公司的司机进行“爱心送考”的人均次数为20×1+100×2+80×3200=2.3.(2)从该公司任选两名司机,记“这两人中一人送考1次,另一人送考2次”为事件A ,“这两人中一人送考2次,另一人送考3次”为事件B ,“这两人中一人送考1次,另一人送考3次”为事件C ,“这两人送考次数相同”为事件D .由题意知X 的所有可能取值为0,1,2,则P (X =0)=P (D )=C 220+C 2100+C 280C 2200=83199,P (X =1)=P (A )+P (B )=C 120C 1100C 2200+C 1100C 180C 2200=100199.P (X =2)=P (C )=C 120C 180C 2200=16199.∴X 的分布列为:X 012P8319910019916199【变式2-2】(多选)设离散型随机变量X 的分布列为X 01234Pq0.40.10.20.2若离散型随机变量Y 满足Y =2X +1,则下列结果正确的有()A .q =0.1B .E (X )=2,D (X )=1.4C .E (X )=2,D (X )=1.8D .E (Y )=5,D (Y )=7.2【答案】ACD【解析】因为q +0.4+0.1+0.2+0.2=1,所以q =0.1,故A 正确;由已知可得E (X )=0×0.1+1×0.4+2×0.1+3×0.2+4×0.2=2,D (X )=(0-2)2×0.1+(1-2)2×0.4+(2-2)2×0.1+(3-2)2×0.2+(4-2)2×0.2=1.8,故C 正确;因为Y =2X +1,所以E (Y )=2E (X )+1=5,D (Y )=4D (X )=7.2,故D 正确.考点3求离散型随机变量的均值与方差【例3】为迎接2022年北京冬奥会,推广滑雪运动,某滑雪场开展滑雪促销活动.该滑雪场的收费标准是:滑雪时间不超过1小时免费,超过1小时的部分每小时收费标准为40元(不足1小时的部分按1小时计算).有甲、乙两人相互独立地来该滑雪场运动,设甲、乙不超过1小时离开的概率分别为14,16;1小时以上且不超过2小时离开的概率分别为12,23;两人滑雪时间都不会超过3小时.(1)求甲、乙两人所付滑雪费用相同的概率;(2)设甲、乙两人所付的滑雪费用之和为随机变量ξ(单位:元),求ξ的分布列与数学期望E (ξ),方差D (ξ).【解析】(1)两人所付费用相同,相同的费用可能为0,40,80元,两人都付0元的概率为P 1=14×16=124,两人都付40元的概率为P 2=12×23=13,两人都付80元的概率为P 3-14--16-=124.则两人所付费用相同的概率为P =P 1+P 2+P 3=124+13+124=512.(2)ξ可能取值为0,40,80,120,160,则P (ξ=0)=14×16=124,P (ξ=40)=14×23+12×16=14,P (ξ=80)=14×16+12×23+14×16=512,P (ξ=120)=12×16+14×23=14,P (ξ=160)=14×16=124.所以,随机变量ξ的分布列为ξ04080120160P1241451214124∴E (ξ)=0×124+40×14+80×512+120×14+160×124=80,D (ξ)=(0-80)2×124+(40-80)2×14+(80-80)2×512+(120-80)2×14+(160-80)2×124=40003.【总结】求离散型随机变量ξ的均值与方差的步骤(1)理解ξ的意义,写出ξ全部的可能取值;(2)求ξ取每个值的概率;(3)写出ξ的分布列;(4)由均值的定义求E (ξ),由方差的定义求D (ξ).【变式3-1】据有关权威发布某种传染病的传播途径是通过呼吸传播,若病人(患了某种传染病的人)和正常人(没患某种传染病的人)都不戴口罩而且交流时距离小于一米90%的机率被传染,若病人不戴口罩正常人戴口罩且交流时距离小于一米时60%的机率被传染,若病人戴口罩而正常人不戴口罩且交流距离小于一米时30%的机率被传染上,若病人和正常人都带口罩且交流距离大于一米时不会被传染.为此对某地经常出入某场所的人员通过抽样调查的方式对戴口罩情况做了记录如下表:男士女士戴口罩不戴口罩戴口罩不戴口罩甲地40203010乙地10304515假设某人是否戴口罩互相独立(1)求去甲地的男士带口罩的概率,用上表估计所有去甲地的人戴口罩的概率.(2)若从所有男士中选1人,从所有女士中选2人,用上表的频率估计概率,求戴口罩人数X 的分布列和期望.(3)上表中男士不戴口罩记为“ξ=0”,戴口罩记为“ξ=1”,确定男士戴口罩的方差为Dξ,和女士不戴口罩记为“η=0”,戴口罩记为“η=1”确定女士戴口罩的方差为Dη.比较Dξ和Dη的大小,并说明理由.【解析】(1)设“去甲地的男士带口罩”为事件M ,则P (M )=4040+20=23,设“去甲地的人戴口罩”为事件N ,则P (N )=40+3040+20+30+10=710,(2)设“男士带口罩”为事件A ,则P (A )=40+1040+20+10+30=12,设“女士带口罩”为事件B ,则P (B )=30+4530+10+45+15=34,所有男士中选1人,从所有女士中选2人,戴口罩人数X =0,1,2,3,P (X =0)=12×14×14=132,P (X =1)=12×14×14+12×34×14+12×14×34=732,P (X =2)=12×34×14+12×14×34+12×34×34=1532,P (X =3)=12×34×34=932分布列为:X123P1327321532932E (X )=0×132+1×732+2×1532+3×932=2(3)E (ξ)=0×12+1×12=12,D (ξ)=(0-12)2×12+(1-12)2×12=14,E (η)=0×14+1×34=34,D (η)=(0-34)2×14+(1-34)2×34=316.100名男士中有50人戴口罩,50人不戴口罩,100名女士中有75人戴口罩,25人不戴口罩,从数据分布可看出来女士戴口罩的集中程度要好于男士,所以其方差偏小.【变式3-2】已知X 的分布列为X -101P121316设Y =2X +3,则E (Y )的值为()A .73B .4C .-1D .1【答案】A【解析】∵E (X )=-12+16=-13,∴E (Y )=E (2X +3)=2E (X )+3=-23+3=73.【变式3-3】已知离散型随机变量X 的分布列为X 012P0.51-2qq 2则常数q =________.【答案】1-22【解析】由分布列的性质得0.5+1-2q +q 2=1,解得q =1-22或q =1+22(舍去).【变式3-4】设随机变量X 的分布列为P (X =k )=a k,k =1,2,3,则a 的值为__________.【答案】2713【解析】因为随机变量X 的分布列为P (X =k )=a k,k =1,2,3,所以根据分布列的性质有a ·13+a 2+a 3=1,所以a +19+=a ×1327=1,所以a =2713.【变式3-5】已知随机变量X 的分布列如下:X -101P121316若Y =2X +3,则E (Y )的值为________.【答案】73【解析】E (X )=-12+16=-13,则E (Y )=E (2X +3)=2E (X )+3=-23+3=73.【变式3-6】若随机变量X 满足P (X =c )=1,其中c 为常数,则D (X )的值为________.【答案】0【解析】因为P (X =c )=1,所以E (X )=c ×1=c ,所以D (X )=(c -c )2×1=0.【变式3-7】(2022·昆明模拟)从1,2,3,4,5这组数据中,随机取出三个不同的数,用X 表示取出的数字的最小数,则随机变量X 的均值E (X )等于()A.32B.53C.74D.95【答案】A【解析】由题意知,X 的可能取值为1,2,3,而随机取3个数的取法有C 35种,当X =1时,取法有C 24种,即P (X =1)=C 24C 35=35;当X =2时,取法有C 23种,即P (X =2)=C 23C 35=310;当X =3时,取法有C22种,即P (X =3)=C 22C 35=110;∴E (X )=1×35+2×310+3×110=32.【变式3-8】已知随机变量X ,Y 满足Y =2X +1,且随机变量X 的分布列如下:X 012P1613a则随机变量Y 的方差D (Y )等于()A.59B.209C.43D.299【答案】B【解析】由分布列的性质,得a =1-16-13=12,所以E (X )=0×16+1×13+2×12=43,所以D (X )×16+×13+×12=59,又Y =2X +1,所以D (Y )=4D (X )=209.【变式3-9】已知m ,n 为正常数,离散型随机变量X 的分布列如表:X -101Pm14n若随机变量X 的均值E (X )=712,则mn =________,P (X ≤0)=________.【答案】11813【解析】+n +14=1,-m =712,=112,=23,所以mn =118,P (X ≤0)=m +14=13.【变式3-10】(2022·邯郸模拟)小张经常在某网上购物平台消费,该平台实行会员积分制度,每个月根据会员当月购买实物商品和虚拟商品(充话费等)的金额分别进行积分,详细积分规则以及小张每个月在该平台消费不同金额的概率如下面的表1和表2所示,并假设购买实物商品和购买虚拟商品相互独立.表1购买实物商品(元)(0,100)[100,500)[500,1000)积分246概率141214表2购买虚拟商品(元)(0,20)[20,50)[50,100)[100,200)积分1234概率13141416(1)求小张一个月购买实物商品和虚拟商品均不低于100元的概率;(2)求小张一个月积分不低于8分的概率;(3)若某个月小张购买了实物商品和虚拟商品,消费均低于100元,求他这个月的积分X 的分布列与均值.【解析】(1)小张一个月购买实物商品不低于100元的概率为12+14=34,购买虚拟商品不低于100元的概率为16,因此所求概率为34×16=18.(2)根据条件,积分不低于8分有两种情况:①购买实物商品积分为6分,购买虚拟商品的积分为2,3,4分;②购买实物商品积分为4分,购买虚拟商品的积分为4分,故小张一个月积分不低于8分的概率为14×+12×16=14.(3)由条件可知X 的可能取值为3,4,5.P (X =3)=1313+14+14=25,P (X =4)=P (X =5)=1413+14+14=310,即X 的分布列如下:X 345P25310310E (X )=3×25+4×310+5×310=3910.考点4均值与方差在决策中的作用【例4】2021年3月5日李克强总理在政府作报告中特别指出:扎实做好碳达峰,碳中和各项工作,制定2030年前碳排放达峰行动方案,优化产业结构和能源结构.某环保机器制造商为响应号召,对一次购买2台机器的客户推出了两种超过机器保修期后5年内的延保维修方案:方案一:交纳延保金5000元,在延保的5年内可免费维修2次,超过2次每次收取维修费1000元;方案二:交纳延保金6230元,在延保的5年内可免费维修4次,超过4次每次收取维修费t 元;制造商为制定收取标准,为此搜集并整理了200台这种机器超过保修期后5年内维修的次数,统计得到下表:维修次数0123机器台数20408060以这200台机器维修次数的频率代替1台机器维修次数发生的概率,记X 表示2台机器超过保修期后5年内共需维修的次数.(1)求X 的分布列;(2)以所需延保金与维修费用之和的均值为决策依据,为使选择方案二对客户更合算,应把t 定在什么范围?【分析】(1)由题设描述确定2台机器超过保修期后5年内共需维修的次数的可能值,并确定对应的基本事件,进而求各可能值的概率,写出分布列.(2)根据(1)所得分布列,由各方案的费用与维修次数的关系写出费用的分布列,并求期望,通过期望值的大小关系求参数的范围.【解析】(1)由题意得,X =0,1,2,3,4,5,6,P (X =0)=110×110=1100,P (X =1)=110×15×2=125,P (X =2)=110×25×2+15×15=325,P (X =3)=110×310×2+15×25×2=1150,P (X =4)=310×15×2+25×25=725,P (X =5)=310×25×2=625,P (X =6)=310×310=9100,∴X 的分布列为X 0123456P110012532511507256259100(2)选择方案一:所需费用为Y 1元,则X ≤2时,Y 1=5000,X =3时,Y 1=6000;X =4时,Y 1=7000;X =5时,Y 5=8000,X =6时,Y 1=9000,∴Y 1的分布列为Y 150006000700080009000P1710011507256259100E (Y 1)=5000×17100+6000×1150+7000×725+8000×625+9000×9100=6860,选择方案二:所需费用为Y 2元,则X ≤4时,Y 2=6230;X =5时,Y 2=6230+t ;X =6时,Y 2=6230+2t ,则Y 2的分布列为Y 262306230+t 6230+2t P671006259100E (Y 2)=6230×67100+(6230+t )×625+(6230+2t )×9100=6230+21t50,要使选择方案二对客户更合算,则E (Y 2)<E (Y 1),∴6230+21t50<6860,解得t <1500,即t 的取值范围为[0,1500).【总结】利用均值、方差进行决策的2个方略(1)当均值不同时,两个随机变量取值的水平可见分歧,可对问题作出判断.(2)若两随机变量均值相同或相差不大,则可通过分析两变量的方差来研究随机变量的离散程度或者稳定程度,进而进行决策.【变式4-1】直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力贫困地区农民脱贫增收.某贫困地区有统计数据显示,2020年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示.若将销售主播按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用直播销售用户”,使用次数为5次或不足5次的称为“不常使用直播销售用户”,则“经常使用直播销售用户”中有56是“年轻人”.(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,完成2×2列联表,并根据列联表判断是否有85%的把握认为经常使用网络直播销售与年龄有关?使用直播销售情况与年龄列联表年轻人非年轻人合计经常使用直播销售用户不常使用直播销售用户合计(2)某投资公司在2021年年初准备将1000万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:方案一:线下销售.根据市场调研,利用传统的线下销售,到年底可能获利30%,可能亏损15%,也可能不赔不赚,且这三种情况发生的概率分别为710,15,110;方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利50%,可能亏损30%,也可能不赔不赚,且这三种情况发生的概率分别为35,310,110.针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.参考数据:独立性检验临界值表α0.150.100.0500.0250.010x α2.0722.7063.8415.0246.635其中,χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .【解析】(1)由图1知,“年轻人”占比为45.5%+34.5%=80%,即有200×80%=160(人),“非年轻人”有200-160=40(人),由图2知,“经常使用直播销售用户”占比为30.1%+19.2%+10.7%=60%,即有200×60%=120(人),“不常使用直播销售用户”有200-120=80(人).“经常使用直播销售用户的年轻人”有120×56=100(人),“经常使用直播销售用户的非年轻人”有120-100=20(人).∴补全的列联表如下:年轻人非年轻人合计经常使用直播销售用户10020120不常使用直播销售用户602080合计16040200于是a =100,b =20,c =60,d =20.∴χ2=200×(100×20-60×20)2120×80×160×40=2512≈2.083>2.072,即有85%的把握认为经常使用网络直播销售与年龄有关.(2)若按方案一,设获利X 1万元,则X 1可取的值为300,-150,0,X 1的分布列为:X 1300-1500p71015110E (X 1)=300×710+(-150)×15+0×110=180(万元),D(X1)=(300-180)2×710+(-150-180)2×15+(0-180)2×110=1202×710+3302×15+1802×110=35100若按方案二,设获利X2万元,则X2可取的值为500,-300,0,X2的分布列为:X2500-3000p 35310110E(X2)=500×35+(-300)×310+0×110=210(万元),D(X2)=(500-210)2×35+(-300-210)2×310+(0-210)2×110=2902×35+5102×310+2102×110=132900∵E(X1)<E(X2),D(X1)<D(X2),由方案二的均值要比方案一的均值大,从获利角度来看方案二更大,故选方案二.由方案二的方差要比方案一的方差大得多,从稳定性方面看方案一线下销售更稳妥,故选方案一.【变式4-2】某班体育课组织篮球投篮考核,考核分为定点投篮与三步上篮两个项目.每个学生在每个项目投篮5次,以规范动作投中3次为考核合格,定点投篮考核合格得4分,否则得0分;三步上篮考核合格得6分,否则得0分.现将该班学生分为两组,一组先进行定点投篮考核,一组先进行三步上篮考核,若先考核的项目不合格,则无需进行下一个项目,直接判定为考核不合格;若先考核的项目合格,则进入下一个项目进行考核,无论第二个项目考核是否合格都结束考核.已知小明定点投篮考核合格的概率为0.8,三步上篮考核合格的概率为0.7,且每个项目考核合格的概率与考核次序无关.(1)若小明先进行定点投篮考核,记X为小明的累计得分,求X的分布列;(2)为使累计得分的均值最大,小明应选择先进行哪个项目的考核?并说明理由.【解析】(1)由已知可得,X的所有可能取值为0,4,10,则P(X=0)=1-0.8=0.2,P(X=4)=0.8×(1-0.7)=0.24,P(X=10)=0.8×0.7=0.56,所以X的分布列为X0410P0.20.240.56(2)小明应选择先进行定点投篮考核,理由如下:由(1)可知小明先进行定点投篮考核,累计得分的均值为E(X)=0×0.2+4×0.24+10×0.56=6.56,若小明先进行三步上篮考核,记Y为小明的累计得分,则Y的所有可能取值为0,6,10,P(Y=0)=1-0.7=0.3,P (Y =6)=0.7×(1-0.8)=0.14,P (Y =10)=0.7×0.8=0.56,则Y 的均值为E (Y )=0×0.3+6×0.14+10×0.56=6.44,因为E (X )>E (Y ),所以为使累计得分的均值最大,小明应选择先进行定点投篮考核.【变式4-3】为加快某种病毒的检测效率,某检测机构采取“k 合1检测法”,即将k 个人的拭子样本合并检测,若为阴性,则可以确定所有样本都是阴性的;若为阳性,则还需要对本组的每个人再做检测.现有100人,已知其中2人感染病毒.(1)①若采用“10合1检测法”,且两名患者在同一组,求总检测次数;②已知10人分成一组,分10组,两名感染患者在同一组的概率为111,定义随机变量X 为总检测次数,求检测次数X 的分布列和均值E (X );(2)若采用“5合1检测法”,检测次数Y 的均值为E (Y ),试比较E (X )和E (Y )的大小(直接写出结果).【解析】(1)①对每组进行检测,需要10次;再对结果为阳性的一组每个人进行检测,需要10次,所以总检测次数为20.②由题意,X 可以取20,30,P (X =20)=111,P (X =30)=1-111=1011,则X 的分布列为X 2030P1111011所以E (X )=20×111+30×1011=32011.(2)由题意,Y 可以取25,30,两名感染者在同一组的概率为P 1=C 120C 22C 398C 5100=499,不在同一组的概率为P 1=9599,则E (Y )=25×499+30×9599=295099>E (X ).【变式4-4】(2022·莆田质检)某工厂生产一种精密仪器,由第一、第二和第三工序加工而成,三道工序的加工结果相互独立,每道工序的加工结果只有A ,B 两个等级.三道工序的加工结果直接决定该仪器的产品等级:三道工序的加工结果均为A 级时,产品为一等品;第三工序的加工结果为A 级,且第一、第二工序至少有一道工序加工结果为B 级时,产品为二等品;其余均为三等品.每一道工序加工结果为A 级的概率如表一所示,一件产品的利润(单位:万元)如表二所示:表一工序第一工序第二工序第三工序概率0.50.750.8表二等级一等品二等品三等品利润2385(1)用η表示一件产品的利润,求η的分布列和均值;(2)因第一工序加工结果为A 级的概率较低,工厂计划通过增加检测成本对第一工序进行改良,假如改良过程中,每件产品检测成本增加x (0≤x ≤4)万元(即每件产品利润相应减少x 万元)时,第一工序加工结果为A 级的概率增加19x .问该改良方案对一件产品利润的均值是否会产生影响?并说明理由.【解析】(1)由题意可知,η的所有可能取值为23,8,5,产品为一等品的概率为0.5×0.75×0.8=0.3,产品为二等品的概率为(1-0.5×0.75)×0.8=0.5,产品为三等品的概率为1-0.3-0.5=0.2,所以η的分布列为η2385P0.30.50.2E (η)=23×0.3+8×0.5+5×0.2=11.9.(2)改良方案对一件产品的利润的均值不会产生影响,理由如下:在改良过程中,每件产品检测成本增加x (0≤x ≤4)万元,第一工序加工结果为A 级的概率增加19x ,设改良后一件产品的利润为ξ,则ξ的所有可能取值为23-x,8-x,5-x ,+19x 0.75×0.8=0.3+x15,二等品的概率为10.75×0.8=0.5-x15,三等品的概率为10.2,所以E (ξ)-x )-x )+0.2×(5-x )=6.9-0.3x +2315x -115x 2+4-0.5x -815x +1152+1-0.2x =11.9,因为E (ξ)=E (η),所以改良方案对一件产品的利润的均值不会产生影响.1.(多选)设离散型随机变量X 的分布列如下表:X 12345Pm0.10.2n0.3若离散型随机变量Y =-3X +1,且E (X )=3,则()A .m =0.1B .n =0.1C .E (Y )=-8D .D (Y )=-7.8【答案】BC【解析】由E (X )=1×m +2×0.1+3×0.2+4×n +5×0.3=3得m +4n =0.7,又由m +0.1+0.2+n +0.3=1得m +n =0.4,从而得m =0.3,n =0.1,故A 选项错误,B 选项正确;E (Y )=-3E (X )+1=-8,故C 选项正确;因为D (X )=0.3×(1-3)2+0.1×(2-3)2+0.1×(4-3)2+0.3×(5-3)2=2.6,所以D (Y )=(-3)2D (X )=23.4,故D 选项错误.2.已知随机变量ξ的分布列如下表,D (ξ)表示ξ的方差,则D (2ξ+1)=___________.ξ012pa1-2a14【答案】2【解析】由题意可得:a +1-2a +14=1,解得a =14,ξ012p141214所以E (ξ)=0×14+1×12+2×14=1,D (ξ)=14(0-1)2+12×(1-1)2+14×(2-1)2=12,D (2ξ+1)=22D (ξ)=2.3.京西某地到北京西站有阜石和莲石两条路,且到达西站所用时间互不影响.下表是该地区经这两条路抵达西站所用时长的频率分布表:时间(分钟)10~2020~3030~4040~5050~60莲石路(L 1)的频率0.10.20.30.20.2阜石路(L 2)0.10.40.40.1的频率若甲、乙两人分别有40分钟和50分钟的时间赶往西站(将频率视为概率)(1)甲、乙两人应如何选择各自的路径?(2)按照(1)的方案,用X表示甲、乙两人按时抵达西站的人数,求X的分布列和数学期望.【解析】(1)A i表示事件“甲选择路径L i时,40分钟内赶到火车站”,B1表示事件“乙选择路径L i时,50分钟内赶到火车站”,i=1,2,用频率估计相应的概率,则有P(A1)=0.1+0.2+0.3=0.6,P(A2)=0.1+0.4=0.5,P(A1)>P(A2),所以甲应选择路径L1;P(B1)=0.1+0.2+0.3+0.2=0.8,P(B2)=0.1+0.4+0.4=0.9,P(B1)<P(B2),所以乙应选择路径L2;(2)用A,B分别表示针对(1)的选择方案,甲,乙在各自的时间内到达火车站,由(1)知P(A)=0.6,P(B)=0.9,且A,B相互独立,X的取值是0,1,2,P(X=0)=P(A-B-)=0.1×0.4=0.04,P(X=1)=P(A-B+A B-)=0.4×0.9+0.6×0.1=0.42,P(X=2)=P(AB)=0.9×0.6=0.54,所以X的分布列为:X012P0.040.420.54E(X)=0×0.04+1×0.42+2×0.54=1.5.4.品酒师需定期接受酒味鉴别功能测试,通常采用的测试方法如下:拿出n(n∈N*且n≥4)瓶外观相同但品质不同的酒让品酒师品尝,要求其按品质优劣为它们排序;经过一段时间,等其记忆淡忘之后,再让其品尝这n瓶酒,并重新按品质优劣为它们排序.这称为一轮测试,根据一轮测试中的两次排序的偏离程度的高低为其评分.现分别以a1,a2,a3,…,a n表示第一次排序时被排在1,2,3,…,n的n种酒在第二次排序时的序号,并令X=|1-a1|+|2-a2|+|3-a3|+...+|n-a n|,则X是对两次排序的偏离程度的一种描述.下面取n=4研究,假设在品酒师仅凭随机猜测来排序的条件下,a1,a2,a3,a4等可能地为1,2,3,4的各种排列,且各轮测试相互独立.(1)直接写出X的可能取值,并求X的分布列和数学期望;(2)若某品酒师在相继进行的三轮测试中,都有X≤2,则认为该品酒师有较好的酒味鉴别功能.求出现这种现象的概率,并据此解释该测试方法的合理性.【解析】(1)X的可能取值为0,2,4,6,8P(X=0)=1A44=124,。
概率分布的重要性质

概率分布的重要性质概率分布是概率论中的重要概念,用于描述随机变量的取值与其对应的概率之间的关系。
概率分布具有许多重要的性质,这些性质对于理解和应用概率论具有重要意义。
本文将介绍概率分布的几个重要性质,并探讨其在实际问题中的应用。
一、概率分布的归一性概率分布的归一性是指所有可能事件的概率之和等于1。
对于离散型随机变量,概率分布可以用概率质量函数(Probability Mass Function,简称PMF)来描述,其满足以下性质:∑P(X=x)=1其中,P(X=x)表示随机变量X取值为x的概率。
对于连续型随机变量,概率分布可以用概率密度函数(Probability Density Function,简称PDF)来描述,其满足以下性质:∫f(x)dx=1其中,f(x)表示随机变量X的概率密度函数。
概率分布的归一性是概率论的基本原理之一,它保证了所有可能事件的概率之和为1,使得概率分布具有可解释性和可比较性。
在实际应用中,概率分布的归一性可以用来验证概率模型的合理性,以及计算事件的概率和期望值等。
二、概率分布的期望值概率分布的期望值是描述随机变量平均取值的指标,它是随机变量所有可能取值的加权平均。
对于离散型随机变量,期望值可以用以下公式计算:E(X)=∑xP(X=x)其中,E(X)表示随机变量X的期望值。
对于连续型随机变量,期望值可以用以下公式计算:E(X)=∫xf(x)dx其中,f(x)表示随机变量X的概率密度函数。
概率分布的期望值是概率论中的重要概念,它可以用来描述随机变量的平均取值,反映了随机变量的集中趋势。
在实际应用中,期望值可以用来计算风险、收益、成本等指标,对于决策和评估具有重要意义。
三、概率分布的方差和标准差概率分布的方差和标准差是描述随机变量取值的离散程度的指标。
方差是随机变量与其期望值之差的平方的期望值,标准差是方差的平方根。
对于离散型随机变量,方差可以用以下公式计算:Var(X)=∑(x-E(X))^2P(X=x)其中,Var(X)表示随机变量X的方差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分析试题的相对难度
例:在一次共有四个试题的考试中,学生答
对每题的人数百分比分别为:70%,50%,30%,
10%。试问各题的难度如何?各题间的难度差一 样吗?为什么?
① P Z: 试题 答对率 P Z
1
2
.70
.50
.7-.5=.2
.5-.5=0
-0.52
0.00
3
4
.30
.10
.3-.5=.2
.40
1.28
-
6.28
四 品质评定数量化 例: 三位教师对100名学生的学习能力进行了等级评价。 教师对学生的评定
等级
甲
乙
丙
A
B C
5
25 40
10
20 40
20
25 35
D
E ∑
25
5 100
20
10 100
15
5 100
3名学生的所获得的评定等级 学生 1 2 3 教师甲 B A D 教师乙 A B C 教师丙 A A C
解题步骤
① 确定 Z 值的范围
② Z P
A=0.49865-0.46407=0.03458
B=0.464017-0.22575=0.23832
C=0.22575×2=0.4515
D=B=0.23832
E=A=0.03458(或0.03593)
③ 求各组人数:
三
正态理论的应用
一
求分布中特定分数间个体数量
例:假设500名学生的数学成绩分布符合正态分布。
且已知平均分70,标准差5分。试问60分以下,60~80分, 80分以上,这三个分数段中,学生的人数分布各为多少?
已知:N=500,M=70,SD=5
P←Z←M,SD,X
解题步骤
① X Z :
求任何两个 Z 值间的 P值
例: -1.2σ ~2.4σ
0.6σ ~1.5σ
2
P→Z
查表:近似结果
例: P=0.30,Z=0.85
3、P→Y
查表法:近似结果
例: P=0.30,Y=0.27798
几个常用值
1.±1σ : 2.±2σ : 3.±3σ : 4.±1.96σ : 5.±2.58σ :
⑶.曲线从最高点向左右缓慢下降,向两侧
⑷.标准正态分布曲线的平均数为0,标准
无限延伸,但永不与基线相交。
差为1。从Z=-3至Z=+3之间几乎分布着全 部数据。
⑸.曲线的拐点为正负一个标准差处。
三.标准正态分布表及使用
1.标准正态分布表
利用积分公式可求出正态曲线下任何
区间的面积,但需要计算,非常麻烦。
统计学家已编制好了标准正态分布表,
使其使用非常方便。
正态曲线表
正态曲线表:以σ 为测量面积的单位,用积分法则
算出Z所对应的各个部分的面积(P)及 y 值,制成的曲
线表。
正态曲线表的三个数值 面积值:p 高度值:y 刻度值:Z
三个值的求解 1、Z→P 求均数(0)与某个 Z 值间的 P 值:查表法。 例:Z=0~Z=1 Z=1.96 求Z 值以上或以下的概率 例: Z=1.96 以上的概率 P=0.5-0.475=0.025 P=0.34134 P=0.475
种数学模型计算出的概率分布。
3、基本随机变量分布与抽样分布
依所描述的数据的样本特性,可将概率分
布分为基本随机变量分布与抽样分布 (sampling distribution)。
基本随机变量分布是随机变量各种不同取
值情况的概率分布,抽样分布是从同一总体 内抽取的不同样本的统计量的概率分布。
例如 :
② Z P:
③ 求各段的 P
60~80:
80以上:
④ 求各区间的人数:
60以下:
60~80:
80以上:
二 确定能力分组或等级评定人数
例:假设对100名报考大学的学生进行分班
考试,要按能力将这些学生分为A、B、C、D、E
五个小组(或等级),每组能力组距相等,若考 试成绩所测得的分数是正态的,问A、B、C、D、 E各组应当分布几名学生?
练习
某区要在2500名初三学生中选50名学生参加
全市初中物理竞赛。已知该区初三上学期物理考 试成绩近似正态分布,且平均数57分,标准差16 分。若以这次考试为准来选拔参加竞赛的学生, 分数线应定为多少?
分析结果
① 求入选率:
② 确定P’:
③ P Z:
④ Z X:
第三节 二项分布
.1-.5=.4
0.52
1.28
② 求难度差 ③ 线性转换: 试题 1 2 3 答对率 .70 .50 .30 Q .30 .50 .70 P’ .20 .00 .20 Z -0.52 0.00 0.52 DP .52 .52 .76 4.48 5.00 5.52
4
.10
.90
二项分布(bionimal
distribution)是一种具有广泛 用途的离散型随机变量的概率 分布,它是由贝努里创始的,
因此又称为贝努里分布。
1.二项试验
满足以下条件的试验称为二项试验:
一次试验只有两种可能的结果,即成功
各次试验相互独立,即各次试验之间互 各次试验中成功的概率相等,失败的概
和失败;
当n无限增大时,随机事件A的频率会稳定在
一个常数P,这个常数就是随机事件A的概率。
m P A Lim n n
(6.1)
先验概率(古典概率)
古典概率模型要求满足两个条件:
⑴
⑵
试验的所有可能结果是有限的;
每一种可能结果出现的可能性相等。
P( A )
m n
(6.2)
二.概率的公理系统
第二节 正态分布
正态分布(normal distribution)也称
为常态分布,是连续型随机变量概率分布的一 种,是在数理统计的理论与实际应用中占有最 重要地位的一种理论分布。
正态分布由棣.莫弗于1733年发现的。拉
普拉斯、高斯对正态分布的研究也做出了贡献, 故有时称正态分布为高斯分布。
1.正态分布曲线函数
试题1的概率是多少?
计 算
抽到第一题或第二题的概率应为抽到第一题
的概率和抽到第二题的概率之和,即
1 1 2 P A B P A P B 5 5 5
四个学生都抽到第一题即四个学生同时抽到第
一题,其概率应为抽到第一题的概率的乘积,即
1 1 1 1 1 P A1 A2 A3 A4 5 5 5 5 625
刘菁
E-mail:fionaliujing@
第五章 概率分布
问 题
假设对1000名报考
某高中的学生进行分班 考试,若要按能力将这
某套测验中有10道正
误判断题,若要了解学生 对所测内容在什么情况下 是真正领会了,或什么情 况下属猜测的成分多 ,应 如何分析?
些学生分为A、B、C、D、
将标准分数代入正态曲线函数
并且,令σ =1 则公式变换为标准正态分布函数:
1 Y e 2
Z2 2
以Z为横坐标,以Y
为纵坐标,可绘制标准正 态分布曲线。
标准正态分布曲线的
纵线高度Y为概率密度, 曲线下的面积为概率。
3.标准正态分布曲线的特点
⑴.曲线在Z=0处达到最高点
⑵.曲线以Z=0处为中心,双侧对称
例2:从30个白球和
20个黑球共50个球中随机
抽取两次(放回抽样),
问抽出一个黑球和一个白 球的概率是多少?
抽出一个白球的概率为3/5,抽出一个黑
球的概率为2/5。
抽出一个黑球和一个白球的情况应包括先
抽出一个黑球、后抽出一个白球和先抽出一 个白球、后抽出一个黑球两种情况。因此:
3 2 2 3 P 0.48 5 5 5 5
1.任何随机事件A的概率都是在0与1之间的 正数,即 0 ≤ P(A)≤1 2.不可能事件的概率等于零,即 3.必然事件的概率等于1,即 P (A )= 0 P (A )= 1
三.概率的加法定理和乘法定理
概率的加法定理
若事件A发生,则事件B就一定不发生, 两互不相容事件和的概率,等于这两个
这样的两个事件为互不相容事件。
四、概率分布类型
概率分布(probability distribution)
是指对随机变量取不同值时的概率的描述,一 般用概率分布函数进行描述。
依不同的标准,对概率分布可作不同的分
类。
1、离散型分布与连续型分布
依随机变量的类型,可将概率
分布分为离散型概率分布与连续型 概率分布。心理与教育统计学中最
不影响;
率也相等。
2.二项分布函数
二项分布是一种离散型随机变量的概率分布。
数学模型
二项展开式的通式(即二项分布函数):
P X C p q
X n X