第四讲 MATLAB统计分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
16
布朗运动图
1 0.8 0.6 0.4 0.2 0 -0.2 -0.4 -0.6 -0.8 -1 -1
-0.5
0
0.5
1
2015-5-14
17
பைடு நூலகம்
三、数据拟合
(一)多项式拟合(最小二乘拟合) (二)指数方程拟合(转化为线性拟合) (三)给定模型(非线性拟合) (四)拟合工具箱
2015-5-14
13
2015-5-14
生成正态分布的随机数 命令:R=normrnd(mu,sigma,m,n) Mu表示均值,sigma表示方差;m,n表示 生成矩阵的行和列数。
2015-5-14
14
布朗运动
布朗运动
分数布朗运动(分形布朗运动)
2015-5-14
2015-5-14 4
求和与求积
sum(X):返回向量X各元素的和。 prod(X):返回向量X各元素的乘积。
sum(A):返回一个行向量,其第i个元素是A的第i列的元素和。
prod(A):返回一个行向量,其第i个元素是A的第i列的元素乘积。 sum(A,dim):当dim为1时,该函数等同于sum(A);当dim为2时,返 回一个列向量,其第i个元素是A的第i行的各元素之和。 prod(A,dim):当dim为1时,该函数等同于prod(A);当dim为2时, 返回一个列向量,其第i个元素是A的第i行的各元素乘积。
生成连续均匀分布的随机数
命令:R=unifrnd(A,B,m,n)或者R=unifrnd(A,B,[m,n]) A,B是生成随机数的上界和下界;m,n是生成随机数的维数。 >> unifrnd(0,1) ans = 0.5560 >> unifrnd(1,2,[3 4]) ans = 1.4434 1.6541 1.1080 1.0408 1.7876 1.1889 1.9638 1.7401 1.3326 1.1683 1.8330 1.6980 >> unifrnd(1,2,3,4) ans = 1.9890 1.7012 1.1889 1.4253 1.1403 1.0986 1.4306 1.3505 1.6594 1.4063 1.1792 1.0342
105
110
115
120
125
130
135
140
2015-5-14
8
描述性统计常用命令(二维)
协方差的命令:cov(x,y) 相关系数命令:corrcoef(x,y) 例子:数据(x,y)
x=[0.0313 -0.0060 -0.0226 0.0160 0.0012 -0.0234 0.0413 -0.0002 0.0179 0.0111] Y=[0.0063 -0.0017 0.0112 -0.0058 0.0119 0.0249 0.0269 -0.0072 0.0393 0.0262] >>ans = 1.0e-003 * 0.4486 0.0578 0.0578 0.2476 >>ans = 1.0000 0.1734 0.1734 1.0000
Lognormal
gam
logn
‘gam‘
’ logn‘
2015-5-14
10
特定分布发生器
同一格式随机数发生器:random(随机) 调用格式:y=random(‘name’,A,B,m,n) name表示分布的类型(见上表) A,B表示随机数的上限和下限 M,n表示随机数的行数和列数
mean(A,dim):当dim为1时,该函数等同于mean(A);当dim为2时, 返回一个列向量,其第i个元素是A的第i行的算术平均值。 median(A,dim):当dim为1时,该函数等同于median(A);当dim为2 2015-5-14 6 时,返回一个列向量,其第i个元素是A的第i行的中值。
最大值和最小值
MATLAB提供的求数据序列的最大值和最小值的函数分别为 max和min,两个函数的调用格式和操作过程类似。
1、求向量的最大值和最小值
求一个向量X的最大值的函数有两种调用格式,分别是: (1) y=max(X):返回向量X的最大值存入y,如果X中包含复数元
素,则按模取最大值;
(2)[y,I]=max(X):返回向量X的最大值存入y,最大值的序号存入I, 如果X中包含复数元素,则按模取最大值。
2015-5-14
11
随机生成函数
均匀分布随机数生成函数 命令:unidrnd(N,m,n) 表示生成m行n列的在1~N之间的正整数 >> unidrnd(30,3,5) ans = 17 8 11 19 9 2 13 20 15 6 9 8 13 23 21
2015-5-14 12
m 2 m1
2015-5-14
20
拟合程序
输入:>>x=[ ],y=[ ]; [p,s]=ployfit(x,y,m) 输出:>>p=a0 a1 a2 y=am*x.^m+…+a2*x.^2+a1*x+a0 完整拟合程序: >>x=[ ] ;%x的实际值 y=[ ];%y的实际值 A=polyfit(x,y,2);%拟合多项式 z=polyval(A,x);%拟合多项式在x处的值 plot(x,y,‘k+’,x,z,‘r’);%画出实际值和拟合值的坐标图 xlabel(‘ ’);%x轴标注 ylabel(‘ ’);%y轴标注 legend(‘ ');
第四讲
MATLAB数据统计分析
一、描述性统计 二、随机数的产生 三、数据拟合 四、数据插值 五、回归分析
2015-5-14
1
一、描述性统计常用命令(一维)
命令 [n,y]=hist(x,k) Hist(x,k) Min(x) Max(x) Mean(x0 Median(x) 名称 频率表 直方图 最小值 最大值 均值 中间值 输入 X:原始数据行向量 N:等分区间数 同上 X:原始数据行向量 X:原始数据行向量 X:原始数据行向量 X:原始数据行向量 输出 N:频数行向量 y:区间中点行向量 直方图 最小值 最大值 均值 中位数
15
布朗运动
M函数
function brouwn(x0,y0,xmin,xmax,ymin,ymax,n,step) figure ; 程序:
>> n=30;%指布朗运动的点数 s=0.02;%指温度或速率 %产生n个随机点(x,y),处于-0.5~0.5之间 x=rand(n,1)-0.5; y=rand(n,1)-0.5; h=plot(x,y,'.'); axis([-1 1 -1 1]); axis square grid off set(h,'EraseMode','Xor','MarkerSize',20);%设置擦除模式 %循环5000次,产生动画效果 for i=linspace(1,10,5000) drawnow x=x+s*randn(n,1); y=y+s*randn(n,1); set(h,'XData',x,'YData',y); end 2015-5-14
2015-5-14
19
最小二乘估计的命令
多项式: y am x am1x ... a2 x a1x a0 多项式拟合的实现: 在matlab中,用polyfit函数来求得最小二乘拟合多项式的系数,再 用polyval函数按所得的多项式计算所给出点上的函数近似值。 polyfit函数的调用格式为: p = polyfit(X,Y,m) 函数根据采样点X和采样点函数值Y,产生一个m次多项式P及其在 采样点的误差向量S。 其中X、Y是两个等长的向量,P是多项式系数。M是多项式的最高 次方。 polyval函数的功能是按多项式的系数计算x点多项式的值。
2015-5-14
求向量X的最小值的函数是min(X),用法和max(X)完全相同。
3
2. 求矩阵的最大值和最小值
求矩阵A的最大值的函数有3种调用格式,分别是: (1) max(A):返回一个行向量,向量的第i个元素是矩阵A的第i列上的 最大值; (2) [Y,U]=max(A):返回行向量Y和U,Y向量记录A的每列的最大值, U向量记录每列最大值的行号; (3) max(A,[],dim):dim取1或2。dim取1时,该函数和max(A)完全相 同;dim取2时,该函数返回一个列向量,其第i个元素是A矩阵的 第i行上的最大值。 求最小值的函数是min,其用法和max完全相同。
简称
Uniform poisson T Normal Noncentra l Noncentra lT
简称
unif poiss t Norm ncf nct
命name
’unif‘ ’poiss‘ ‘t‘ ‘Norm’ ‘ncf’ ‘nct’
T分布
正态分布 非中心F 分布 非中心T 分布
伽马
对数正态
Gamma
2015-5-14 5
数据分析与统计
平均值与中值
求数据序列平均值的函数是mean,求数据序列中值的函数是 median。两个函数的调用格式为:
mean(X):返回向量X的算术平均值。
median(X):返回向量X的中值。 mean(A):返回一个行向量,其第i个元素是A的第i列的算术平均值。
median(A):返回一个行向量,其第i个元素是A的第i列的中值。
Range(x)
Std(x) Var(x) Skewness(x)
极差
标准差 方差 偏度
X:原始数据行向量
X:原始数据行向量 X:原始数据行向量 X:原始数据行向量
极差
标准差 方差 偏度
kurtosis(x)
2015-5-14
峰度
求和
X:原始数据行向量
X:原始数据行向量
峰度
向量x的和
2
Sum(x)
一、描述性统计命令详解
2015-5-14 21
多项式拟合实例
日期 利率
利率水平和时间的数据(利率期限结构)
1 0.0187 2 0.0238 3 0.0533 4 0.0640 5 0.0825
>> x=1:5; y=[0.0187
0.09 0.0238 0.0533 0.0640 0.0825]; 0.08 利率水平拟合图
方差 命令:var(x) 标准差 命令:std(x)
2015-5-14
7
例子
x=[100 110 136 97 104 100 95 120 119 ... 126 113 115 108 93 116 102 122 121 122 ... 118 117 114 106 110 119 127 119 125 119 ... 14 105 95 117 109 140 121 122 131 108 120 ... 12 115 121 130 116 119 134 128 115 110]; [n,y]=hist(x) 10 hist(x) 8 x1=max(x) x2=min(x) 6 x3=mean(x) x4=median(x) 4 x5=range(x) 2 x6=std(x) x7=skewness(x) 0 90 95 100 x8=kurtosis(x) x9=sum(x) >>X1=140,x2=93,x3=115.6042,x4=117,x5=47,x6=10.8877, x7=-0.1352,x8=2.7137,x9=5549
2015-5-14
9
二、随机数的产生
类别 贝塔 二项分布 卡方分布 指数分布 F分布 全称 Beta Binomial chisquare Exponential F 简称 beta bino chi2 exp f 命令name ‘beta’ ‘bino’ ‘chi2’ ‘exp’ ‘f’ 类别
均匀分布 泊松分布
18
(一)最小二乘拟合
最小二乘拟合的定义: 在数值计算中,使得估计值与实际样本 值之间的误差的平方和最小,即样本值 f ( x) ,样本估计误 为 yi ,样本估计值为: n 差平方和为: [ f ( x) yi ]2
i 1
2 min Q min [ f ( x ) y ] i 使得误差平方和最小: i 1 n