数学建模—概率模型 PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3拟合与检验
❖3统计图(examp05-03) ❖箱线图(判断对称性) ❖频率直方图(最常用) ❖经验分布函数图 ❖正态概率图(+越集中在参考线附近,越近似正态分布)
❖4分布检验 ❖Chi2gof,jbtest,kstest,kstest2,lillietest等 ❖Chi2gof卡方拟合优度检验,检验样本是否符合指定分布。它把观测数据分 组,每组包含5个以上的观测值,根据分组结果计算卡方统计量,当样本够 多时,该统计量近似服从卡方分布。 ❖jbtest,利用峰度和偏度检验。
2 方差分析的基本假定 ❖正态性 方差齐性 独立抽样 前两个条件满足认为方差分析是稳健的
3 单因素一元方差分析步骤
( example07_01.m 判断不同院系成绩均值是否相等)
数据预处理
正态性检验 lillietest (p>0.05接受)
方差齐性检验 vartestn (p>0.05接受)
方差分析
方差分析能做: 1 检验多个总体均值是否相等(不同院系的高数成绩) 2 需要研究生产条件或实验条件的改变对产品的质量或产量有无影响,比如 种植业研究诸多因素对因变量的影响(品种、施肥量、密度对产量)。在诸多 影响因素中哪些是主要的? 3 确定最优组合
4方差分析
1 之所以叫方差分析,是我们虽然关心的是均值,但在判断均值是否有差 异时需要借助于方差。这个名字也表示,它是通过误差来源的分析来判断不 同总体的均值是否相等。
数学建模—概率模型
目录
1
数据导入、导出与预处理
2
随机数生成
3
参数估计与假设检验
4
5
数据拟合
6
聚类分析
7
判别分析
8
主成分分析
1数据处理
➢1.1 用菜单导入数据 对txt文档,直接使用file-import data 例如example 02-01;02-05(长短不齐)
➢1.2 调用高级函数导入数据 importdata(‘examp02-01.txt’),把文件复制到目录下,重命名
2随机数生成
❖1 随机数 用于信息安全,网络游戏,计算机仿真和模拟计算等。
Rand [0,1] Randn 标准正态 Randstream 适合于7.7及其以后版本,调用类函数
统计工具箱中以rnd结尾的用来生成符合某种分布的随机数,如 Normrnd 正态分布 Binornd 二项分布 Exprnd 指数分布等 ❖2 histrate函数(非自带)
选中文件名 Load函数适用于全是数据的文件,且等长; 常用的还有dlmread,textread(适合分隔符多样的情况)
➢1.3调用低级函数导入数据 步骤:按指定格式打开文件(fopen),获取文件标识符(fid),读
取文件内容(fseek,ftell,frewind,feof控制读写位置,fgets读取 文件的下一行,textscan读取数据等) ,关闭文件(fclose) 。
还可以用来求面积,体积,积分值,概率等
3参数估计
1 参数估计 统计工具箱中以fit结尾的函数,用来求常见分布的参数的最大似然估计和 置信区间估计。
例子05.01
2 正态总体参数的检验(例子05.02)
U检验(标准差已知) ztest
T检验(标准差未知) ttest
均值比较t检验
ttest2
卡方检验(单个方差)vartest
水平
方差分析
anova2 得到方差分析表
方差分析表把数据差异分为三部分(或四部分): 列均值之间的差异引起的变差 列均值之间的差异引起的变差 行列交互作用引起的变差 (随机误差) 后续可以进行多重比较,multcompare,找出哪种组合是最优的
统计数值型数组,字符串数组等各元素出现的频数,频率等,请同学们检 查是否安装的有matlab统计工具箱
2随机数生成
❖3 蒙特卡洛方法 这是计算机随机模拟方法,是一种基于随机数的计算方法,冯以摩纳哥的
赌城命名。基本思想:频率确定概率。
例子:用蒙特卡洛方法求圆周率 圆心在原点的单位圆与外接正方形,相互独立的x,y服从[-1,1]上的均匀 分布,则(x,y)在正方形内服从二元均匀分布,A为落在圆内的概率, 则P(A)=?
anoval (p=0 有显著差别)
多重比较:两两比较,找出存在显著差异的学院,multcompare
4方差分析
4 双因素一元方差分析步骤(如判断两种肥料使用量不同对产量的影响)
数据预处理
正态性检验 lillietest (p>0.05接受)
方差齐性检验 vartestn (p>0.05接受)
构造观测值矩阵,每一列对应因素A的一个水平,每一行对应因素B的一个
3拟合与检验
❖5核密度估计(example05_04.m) ❖需要用样本估计总体的概率分布函数,方法有参数法和非参数法。参数法 假定总体服从某种已知的分布,估计参数。非参数法不需要做对总体分布的 假设,核密度估计就是一种非参数法。
4方差分析
预备知识 有关术语简介 因素或因子:所要检验的对象 水平:因子的不同表现 观察值:在每个因素水平下得到的样本值
F检验(两个方差) vartest2
大家有疑问的,可以询问和交流
可以Biblioteka Baidu相讨论下,但要小声点
3拟合与检验
理论上概率统计都假定变量服从某分布,构造统计量,做出统计推断。 但总体到底服从何种分布,你的假定是真的吗? ❖例子examp02_14.xls
描述性统计(examp05-03) ❖均值,标准差,最值,极差,中位数,众数, ❖变异系数,标准差与平均数的比值,自己计算 ❖偏度,分布密度曲线的对称性,越接近0,越对称 ❖峰度,密度曲线在峰值附近的陡峭性,正态为3
1数据处理
➢1.4 数据写入txt文件
fprintf(fid,'%-f %-f %-f %-f %-f %-f %-f %-f\n', x);
➢1.5从excel文件中读取数据 num = xlsread('examp02_14.xls', 'A2:H4‘)
➢1.6 数据预处理 1.画出散点图估计趋势 2.剔除奇异点 3.平滑处理(smooth,建议用excel)或对数变换 4.标准化变换,适合于各变量的量纲和数量级不一致的时候。数据减去 均值,除以标准差(zscore)[xz,mu,sigma] = zscore(x) 5.极差归一化变换(rscore ,非matlab自带)