Matlab中的概率统计简介
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Matlab中的概率统计简介
几个有用的排列组合函数:
nchoosek(n,k) 求组合数C n k
factorial(n) 求n的阶乘
perms(v) 给出v中所有元素的排列。
例如:perms([1 3 5]) combnk(v,k) 从v中取k个元素的组合。
例如:combnk([2 3 6 7 8],3) randperm(n) 产生一个1到n的随机排列
概率分布
一、二项分布
设随机变量X~B(n,p):
binornd(n,p,M,N) 产生M行N列服从B(n,p)分布的随机变量(M、N默认为1)binopdf(X,n,p) n次试验发生X次事件的概率
binocdf(X,n,p) n次试验发生小于等于X次事件的累积概率
例1:一批元件有400件,已知它的次品率为0.02,求其中至少有5件次品的概率。
>> 1-binocdf(4,400,0.02)
ans =
0.90267
binoinv(P,n,p) n次试验以累积概率P发生的最小次数
例2:某证券营业部开有1000个资金账户,每户资金10万元,设每日每个资金账户到营业部提取20% 现金的概率为0.006,问该营业部每日至少要准备多少现金,才能保证95% 以上的概率满足客户的提款需求?
>> 10*0.2*binoinv(0.95,1000,0.006)
ans =
20
二、泊松分布
设随机变量X~P(λ):
poissrnd(lambda,M,N) 产生M行N列服从P(λ)分布的随机变量(M、N默认为1)poisspdf(X, lambda) n次试验发生X次事件的概率
poisscdf(X, lambda) n次试验发生小于等于X次事件的累积概率
poissinv(P, lambda) n次试验以累积概率P发生的最小次数
例3:某急救中心在间隔t的时间段中收到呼救的次数X~P(t/2),且与时间间隔的起点无关(时间以小时记),试求:
(1)某天12:00 至15:00之间没有收到呼救的概率;
(2)某天12:00 至17:00之间至少收到1次呼救的概率;
>> poisspdf(0,1.5)
ans =
0.22313
>> 1-poisspdf(0,2.5)
ans =
0.91792
三、均匀分布
设随机变量X~U(a,b):
unifrnd(a,b,M,N) 产生M行N列服从U(a,b)分布的随机变量(M、N默认为1)unifpdf(X, a,b) 计算随机变量X的概率
unifcdf(X, a,b) 计算随机变量X的累积概率
unifinv(P, lambda) 计算累积概率为P时的随机变量的值
四、正态分布
设随机变量X~N(μ,σ2):
normrnd(mu,sigma,M,N) 产生M行N列服从N(μ,σ2)分布的随机变量(M、N
默认为1)
normpdf(X, mu,sigma) 计算随机变量X的概率
normcdf(X, mu,sigma) 计算随机变量X的累积概率
norminv(P, mu,sigma) 计算累积概率为P时的随机变量的值
normspec([a,b],mu,sigma) 绘出区间[a,b]在概率密度图上的分布
例4:把温度调节器放入储存着某种液体的容器中,调节器的设定温度为d度。
已知液体的温度T是随机变量,且T~N(d,0.52)
(1)若d=90度,求T≤89的概率;
(2)若要求保持液体的温度至少为80度的概率不小于0.99,问d至少为多少度?>> normcdf(89,90,0.5)
ans =
0.02275
>> norminv(0.99,80,0.5)
ans =
81.163
五、指数分布
设随机变量X~e(λ):
exprnd(lamda,M,N) 产生M行N列服从e(λ)分布的随机变量(M、N默认为1)exppdf(X, lamda) 计算随机变量X的概率
expcdf(X, lamda) 计算随机变量X的累积概率
expinv(P, lamda) 计算累积概率为P时的随机变量的值
假设检验
单正态总体均值检验
1.方差已知
[H,P] = ztest(X,M,sigma,alpha,tail)
X:样本数据;M:假设均值;sigma:已知的方差;alpha:显著水平,默认为0.05;
tail: 备择假设。
取值如下:
’both’:均值不等于M,默认值;
‘right’:均值大于M;
‘left’:均值小于M
返回值:H=0可以接受原假设;H=1不接受原假设;P为观测值的概率。
例5:某面粉厂每袋面粉的重量服从正态分布,机器运转正常时每袋面粉重量的均值为50kg,标准差为1。
某日随机的抽取了刚包装9袋,称其重量分别为:
49.7 50.6 51.8 52.4 49.8 51.1 52 51.5 51.2
问该机器是否运转正常?
解:假设机器运转正常,则备择假设为不正常,即tail值为’both’(默认值)
>> [h,p] = ztest([49.7 50.6 51.8 52.4 49.8 51.1 52 51.5 51.2],50,1)
h =
1
p =
0.00076083
H=1说明在显著水平α=0.05的情况下不能接受原假设,级该机器运转不正常。
2.方差未知
[H,P] = ttest(X,M,alpha)
例6:用某仪器间接测量温度,重复5次,测得结果分别为(℃)
1250 1265 1245 1260 1275
设测量值X服从正态分布,水平α=0.05. 试问能否认为该仪器测量值大于1277℃?
解:假设测量值大于1277℃,则备择假设为测量值小于等于1277℃,tail值应为’left’>> [h,p] = ttest([1250 1265 1245 1260 1275],1277,0.05,'left')
h =
1
p =
0.014
H=1说明不能接受原假设,即认为测量值不大于1277℃
单正态总体的方差检验
[H,P] = vartest(X,v,alpha,tail)
其中v为假设的需检验的方差,其它参数同上。
例:某厂生产的铜丝,质量一向比较稳定,今从中随机抽取10根检查其折断力,数据(千克)如下:
575 576 570 569 572 582 577 580 571 585
设铜丝的折断力服从正态分布,检验水平α=0.05,试问:可否认为该厂生产的铜丝折断力的方差为64?
>> vartest([575 576 570 569 572 582 577 580 571 585],64)
ans =
H=0认为接受原假设,即该批铜丝的折断力的方差为64.
两正态总体方差相等的检验
[H,P] = vartest2(X,Y,alpha,tail)
X和Y为两个随机变量的样本数据,可以是不同长度;tail为备择假设,取值为’right’表示X方差大于Y方差,’left’表示X方差小于Y方差。
例:某一橡胶配方中,原用氧化锌5克,现减为1克。
今分别对两种配方作一批试验,分别测得橡胶伸长率如下:
1克565 577 580 575 556 542 560 532 570 561
5克540 533 525 520 545 531 541 529 534
假设橡胶伸长率服从正态分布,问这两种配方对橡胶伸长率的总体方差有无显著差异(α=0.1)?
>> [h,p]=vartest2([565 577 580 575 556 542 560 532 570 561],[540 533 525 520 545 531 541 529 534],0.1)
h =
1
p =
0.078507
H=1表示拒绝原假设,即认为两总体的方差有显著差异。
两总体均值相等的检验
1.两总体服从独立正态分布且方差相等
[H,P] = ttest2(X,Y,alpha,tail)
X和Y为两个随机变量的样本数据,可以是不同长度;tail为备择假设,取值为’right’
表示X均值大于Y均值,’left’表示X均值小于Y均值。
例7:用自动车床采用新旧两种工艺加工同种零件,测量的加工偏差(微米)分别为:旧工艺 2.7 2.4 2.5 3.1 2.7 3.5 2.9 2.7 3.5 3.3
新工艺 2.6 2.1 2.7 2.8 2.3 3.1 2.4 2.4 2.7 2.3
设测量的加工偏差服从正态分布,所得的两个样本相互独立且总体方差相等,试问自动
车床在新旧两种工艺下的加工精度有无显著差异(α=0.01)?
>> ttest2([2.7 2.4 2.5 3.1 2.7 3.5 2.9 2.7 3.5 3.3],[2.6 2.1 2.7 2.8 2.3 3.1 2.4 2.4 2.7 2.3],0.01)
ans =
H=0表示接受原假设,认为新旧工艺加工精度无显著差异。
2.两总体分布未知
[P,H] = ranksum(X,Y,alpha)
如果X的均值不显著的不同于Y的均值,则H=0,否则H=1;P为观察结果的概率。
例8:两台机床加工同一种轴,抽样测量产品的直径(mm):
甲:33.592 33.862 33.751 33.673 33.847 33.778 33.631 33.911 33.785 33.928
乙:34.221 33.947 33.856 34.039 34.000 33.924 34.125 34.273 33.968 33.923
在显著性水平α=0.05下,能否认为两台机床加工的轴的直径无显著不同。
>> [p,h]=ranksum([33.592 33.862 33.751 33.673 33.847 33.778 33.631 33.911 33.785 33.928],[34.221 33.947 33.856 34.039 34.000 33.924 34.125 34.273 33.968 33.923])
p =
0.00076854
h =
1
H=1认为X的均值显著不同于Y的均值,因此不能认为两者的直径无显著不同。
是否服从正态分布的检验
1.大样本
[H,P] = jbtest(X,alpha)
H=0接受正态分布的假设,H=1则拒绝假设;P为接受假设的概率。
2.小样本
[H,P] = lillietest(X,alpha)
H=0接受正态分布的假设,H=1则拒绝假设;P为接受假设的概率。
hist作图
hist为绘制直方图函数,直方图能直观的显示数据的分布情况。
简单语法如下:
n = hist(Y) 将向量Y中的元素分到10个等间隔的范围内,并返回每个范围内元素的个数作为一行向量
n = hist(Y,X) X是一个向量,返回X的长度个以X为中心的,Y的分布情况若调用方式前无返回值,即hist(Y) 或hist(Y,X) 的调用方式则不返回数据而是直接返回数据的直方图。
例如:
>> x = -2.9:0.1:2.9;
>> y = randn(10000,1);
>> hist(y,x)
读者可以看一下hist(y) 的图形效果,从而比较两种用法的区别。