概率论与数理统计 第二讲 随机数的产生数据的统计描述.ppt

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例1、产生U(2,8)上的一个随机数,10个随机数, 2行5列的随机数。
命令:(1) y1=unifrnd(2,8) (2) y2=unifrnd(2,8,1,10) (3) y3=unifrnd(2,8,2,5)
y1=7.7008
y2=3.3868 5.6411 4.9159 7.3478 6.5726 4.7388 2.1110 6.9284 4.6682 5.6926
p为正面向上的概率,n为试验次数 (1)模拟产生n个0-1分布随机数randnum(n)
(2)对模拟产生的随机数, xrandnum (i)表示 第i次试验的结果,1表示正面向上,0表示反 面向上。
(3)统计前i次试验中正面向上的次数, 并计算频率
(4)作图(关于频率和试验次数的图像)
在Matlab中编辑.m文件输入以下命令:
mean1=mean(x) median1=median(x) std1=std(x) var1=var(x) rang1=range(x)
3.表示分布形状的量—偏度和峰度
E( X E( X ))3
分布偏度: g1
3
其估计量为:
G1
1 n
n i 1
(Xi

X )3
s3
其中
1
下面介绍频率直方图和经验分布函数的做法
1、整理资料: 把样本值x1,x2,…,xn进行分组,先 将它们依大小次序排列,得
பைடு நூலகம் 1、均匀分布U(a,b)
1)unifrnd (a,b)产生一个[a,b] 均匀分布的随机数 2)unifrnd (a,b,m, n)产生m行n列的均匀分布随机数矩
当只知道一个随机变量取值在(a,b)内,但不 知道(也没理由假设)它在何处取值的概率大,在
何处取值的概率小,就只好用U(a,b)来模拟它。
命令 (1) y1=binornd(10,0.8) (2) y2=binornd(10,0.8,1,15) (3) y3=binornd(10,0.8,3,6)
20、其他分布随机数的产生方法
定理 设X的分布函数为F(x),连续且严格单调上升, 它的反函数存在,且记为F-1(x),
则① F(X)~U(0,1) ② 若随机变量U~U(0,1),则F-1(U) 的分布函数为F(x)。

[1 n1
n i1
(Xi

X )2]
它是各个数据与均值偏离程度的度量
标准差:是方差的开方
极差:样本中最大值与最小值之差.
标准差:std(x) 方差:var(x) 极差:range(x)
例7:产生5组正态分布随机数,每组100个, 计算均值、中位数、标准差、极差、方差。
x=normrnd(0,1,100,5);
此定理给出的构造分布函数为F(x)的随机 数的产生方法为:
取U(0,1)随机数Ui,(i=1,2…),令Xi=F-1(Ui),则 Xi ,(i=1,2…),就是F(x)随机数,如果Ui独立,则 Xi也互相独立。
(一)直接抽样法(反函数法)
(1)连续分布的直接抽样法
设连续型随机变量X的分布函数为F(x),
在Matlab命令行中输入以下命令: binomoni(0.5,1000)
在Matlab命令行中输入以下命令: binomoni(0.5,10000)
在Matlab命令行中输入以下命令: binomoni(0.3,1000)
二、常用统计量
1、表示位置的统计量—平均值和中位数
平均值(或均值,数学期望):X
0
FX
(
x)


x
1
x0 0 x 1,
x1
生成Y min{ X1, X2 ,, Xn }的随机数
解:Y的分布函数为
FY ( y) 1 1 FX ( y)n 1 1 yn
其反函数为
FY1( y) 1 n (1 y)
设 U ~ U(0,1)
s n
( Xi X )2
正态分布偏度为0,偏度反映分布的对称性, g1 >0称为右偏态,此时数据位于均值右边的 比位于左边的多;g1 <0称为左偏态,情况相 反;而g1接近0则可认为分布是对称的.
命令:y=skewness(x) 若x为矢量,返回样本偏度,若x为矩阵, 结果为行向量,每个元素对应x中列元素 的样本偏度。
function binomoni(p,n) pro=zeros(1,n); %频率向量 randnum = binornd(1,p,1,n);%产生二项分布随机数 a=0; for i=1:n
a=a+randnum(1,i);%频数 pro(i)=a/i;%频率 end pro=pro; num=1:n; plot(num,pro,num,p)
0.0207 0.1974 0.1616 0.1301 0.4182 0.0809]
排队服务系统中顾客到达率为常数时的到达间隔、 故障率为常数时零件的寿命都服从指数分布。
指数分布在排队论、可靠性分析中有广泛应用。
例 顾客到达某商店的间隔时间服从参数为0.1的指 数分布
指数分布的均值为1/0.1=10。 指两个顾客到达商店的平均间隔时间是10个
y3=[6.7516 6.4292 4.4342 7.5014 7.3619; 7.5309 3.0576 7.6128 4.4616 2.3473]
2、正态分布随机数
1)R = normrnd(μ, σ,):产生一个正态分布随机数 2)R = normrnd(μ, σ,m,n)产生m行n列的正态分布随机数
调用格式:
1、y=random(‘name’, A1, A2, A3, m, n) 其中:’name’为相应分布的名称,A1, A2, A3为分布 参数,m为产生随机数的行数,n为列数。
2、直接调用。 如: y=binornd(n, p, 1,10) 产生参数位n,p的1行10 列的二项分布随机数
则产生随机数的方法为: 取U(0,1)随机数Ui,(i=1,2…),令Xi=F(Ui),则Xi ,(i=1,2…), 就是F(x)随机数,如果Ui独立,则Xi也互相独立。
(2)离散分布的直接抽样法
设分布律为P(X=xi)= pi , i=1, 2, ...,其分布函数为F(x) ① 产生均匀随机数R,即R~U(0,1)
总体分布函数的近似
定义: 设x1,x2,…,xn是总体的容量为n的样
本值,将其按由小到大的顺序排列,并 重新编号,记为
x1* x2* xn*
则经验分布函数为:
0
Fn
(
x)


k n
1
x x1*
x
* k

x

x* k 1
x

x
* n
2、频率直方图——近似概率密度函数
单位时间.即平均10个单位时间到达1个顾客. 顾 客到达的间隔时间可用exprnd(10)模拟。
4、二项分布随机数
1) R = binornd(n, p):产生一个二项分布随机数 2) R = binornd(n,p,m,n)产生m行n列的二项分布随机数
例4、产生B(10,0.8)上的一个随机数,15个随机数, 3行6列的随机数。
机械加工得到的零件尺寸的偏差、射击命中点 与目标的偏差、各种测量误差、人的身高、体重等, 都可近似看成服从正态分布。
3、指数分布随机数
1) R = exprnd(λ):产生一个指数分布随机数 2)R = exprnd(λ,m,n)产生m行n列的指数分布随机数
例3、产生E(0.1)上的一个随机数,20个随机数, 2行6列的随机数。
命令:y=kurtosis(x) 若x为矢量,返回x的样本峰度,若x为矩 阵,结果为行向量,每个元素对应x中列 元素的样本峰度。
例8:产生5组正态分布随机数,每组100个, 计算样本偏度和峰度。
x=normrnd(0,1,100,5);
skewness1=skewness(x) kurtosis1=kurtosis(x)
例2、产生N(10,4)上的一个随机数,10个随机数, 2行5列的随机数.
命令 (1) y1=normrnd(10,2) (2) y2=normrnd(10,2,1,10) (3) y3=normrnd(10,2,2,5)
当研究对象视为大量相互独立的随机变量之和, 且其中每一种变量对总和的影响都很小时,可以认 为该对象服从正态分布。
1
则 RandY 1 (1 U ) n
生成n=20的1行10列随机数
命令: U=unifrnd(0,1,1,10); Y=1-(1-U).^(1/20);
例6 生成单位圆上均匀分布的1行10000列随机数,并 画经验分布函数曲线。
Randnum=unifrnd(0,2*pi,1,10000); %(0,2pi)上均匀分布随机数 xRandnum=cos(Randnum);%横坐标 yRandnum=sin(Randnum);%丛坐标 plot(xRandnum,yRandnum);
例6 频率的稳定性
1、 事件的频率 在一组不变的条件下,重复作n次试验,记m是n
次试验中事件A发生的次数。 频率 f=m/n
2.频率的稳定性 在重复试验中,事件A的频率总在一个定值附近摆动, 而且,随着重复试验次数的增加,频率的摆动幅度 越来越小,呈现出一定的稳定性.
掷一枚硬币,记录掷硬币试验中频率P*的波动情况。

X


xi x1
若F ( xi1 ) R F( xi ),(i 2,3, 若R F( x1 )
则X~F(x)
(二)变换抽样法 (三)值序抽样法 (四)舍选抽样法 (五)复合抽样法(合成法) (六)近似抽样法
详见:高惠璇 北京大学出版社《统计计算》
例5、 设X分布函数为
命令 (1) y1=exprnd(0.1) (2) y2=exprnd(0.1,1,20) (3) y3=exprnd(0.1,2,6)
结果
(1) y1=0.0051
(2) y2=[0.1465 0.0499 0.0722 0.0115 0.0272
0.0784 0.3990 0.0197 0.0810 0.0485 0.0233] (3) y3=[0.1042 0.4619 0.1596 0.0505 0.1615 0.0292;

1 n
n i 1
Xi
中位数:将数据由小到大排序后位于中间位置
的那个数值.
平均值:mean(x) 中位数:median(x) 若x为矢量,返回平均值和中位数,若x为 矩阵,结果为行向量,每个元素对应x中 列元素的平均值和中位数
2、表示变异(离散)程度的统计量
—方差、标准差、极差
样本方差:
S2
概率论与数理统计实验
实验2
随机数的产生 数据的统计描述
实验目的
学习随机数的产生方法 直观了解统计描述的基本内容。
实验内容
1、随机数的产生 2、统计的基本概念。
3、计算统计描述的命令。
4、计算实例。
一、随机数的产生
定义:设随机变量X~F(x),则称随机变量X的 抽样序列{Xi}为分布F(x)的随机数 10常用分布随机数的产生
例9:产生5组指数分布随机数,每组100个, 计算样本偏度和峰度。
x=exprnd(10,100,5);
skewness1=skewness(x) kurtosis1=kurtosis(x)
三、分布函数的近似求法(直方图) 1、经验分布函数(累计频率直方图) Empirical Cumulative Distribution Function
分布峰度
E( X E( X ))4
g2
4
其估计量为:
1
G2 n
( Xi X )4 s4
其中
s 1
n
( Xi X )2
峰度是分布形状的另一种度量,正态分布 的峰度为3,若g2比3大很多,表示分布有沉 重的尾巴,说明样本中含有较多远离均值的 数据,因而峰度可用作衡量偏离正态分布的 尺度之一
在Matlab软件中,可以直接产生满足各种常用 分布的随机数,命令如下:
函数名 binornd chi2rnd exprnd
frnd gamrnd geornd hygernd normrnd poissrnd
trnd unidrnd unifrnd
对应分布的随机数 二项分布的随机数 卡方分布的随机数 指数分布的随机数 f分布的随机数 伽玛分布的随机数 几何分布的随机数 超几何分布的随机数 正态分布的随机数 泊松分布的随机数 学生氏t分布的随机数 离散均匀分布的随机数 连续均匀分布的随机数
相关文档
最新文档