数学建模-数据的统计分析

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数学建模与数学实验

课程设计

学院数理学院专业数学与应用数学班级学号

学生姓名指导教师

2015年6月

数据的统计分析

摘要

问题:某校60名学生的一次考试成绩如下:

93 75 83 93 91 85 84 82 77 76 77 95 94 89 91

88 86 83 96 81 79 97 78 75 67 69 68 84 83 81

75 66 85 70 94 84 83 82 80 78 74 73 76 70 86

76 90 89 71 66 86 73 80 94 79 78 77 63 53 55 (1)计算均值、标准差、极差、偏度、峰度,画出直方图;(2)检验分布的正态性;

(3)若检验符合正态分布,估计正态分布的参数并检验参数;

模型:正态分布。

方法:运用数据统计知识结合MATLAB软件

结果:符合正态分布

一. 问题重述

某校60名学生的一次考试成绩如下:

93 75 83 93 91 85 84 82 77 76 77 95 94 89 91 88 86 83 96 81 79 97 78 75 67 69 68 84 83 81 75 66 85 70 94 84 83 82 80 78 74 73 76 70 86 76 90 89 71 66 86 73 80 94 79 78 77 63 53 55 (1)计算均值、标准差、偏差、峰度,画出直方图; (2)检验分布的正态性;

(3)若检验符合正态分布,估计正态分布的参数并检验参数。

二.模型假设

假设一:此组成绩没受外来因素影响。 假设二:每个学生都是独自完成考试的。 假设三:每个学生的先天条件相同。

三.分析与建立模型

像类似数据的信息量比较大,可以用MATLAB 软件决绝相关问题,将n 名学生分为x 组,每组各n\x 个学生,分别将其命为1x ,2X ……j x 由MATLAB 对随机统计量x 进行命令。此时对于直方图的命令应为 Hist(x,j) 源程序为:

x1=[93 75 83 93 91 85 84 82 77 76 ] x2=[77 95 94 89 91 88 86 83 96 81 ] x3=[79 97 78 75 67 69 68 84 83 81 ]

x4=[75 66 85 70 94 84 83 82 80 78 ] x5=[74 76 76 70 86 76 90 89 71 66 ] x6=[86 73 80 94 79 78 77 63 53 55 ] x=[x1 x2 x3 x4 x5 x6 ] hist(x,6) normplot(x)

[muhat,sigmahat,muci,sigmaci]=normfit(x) [h,sig,ci]=ttest(x,80.1000)

四.模型求解

平均值:∑==n i i x n 11x 标准差:21

2

1

])(11[s ∑=--=n

i i x x n 偏度:3

131)(1∑=-=n i i x x s g 峰度:4

1

4

2)

(1g ∑=-=n

i i

x x s

作频率直方图:在直角坐标系的横轴上,标出x 1’,x 2’,...x k ’各点,分别以(x i ’,x i+1’)为底边,作高

'f i

i

x ∆为的矩形,1,,3,2,1,x ''1'-=-=∆+k i x x i i i ,即得频率直方图。此图大致描述了X 的频率分布情况,因为每个竖着的长方形面积,刚好近似地代表了X 取值落入“底边”的概率。有了直方图,就能大致描绘出分布密度曲线,让曲线大致经过每个竖着的长方形的上边,就得出分布密度曲线的大致模样。 对随机变量X ,计算其基本统计量的命令如下: 均值:mean(x) 中位数:median(x) 标准差:std(x) 方差:var(x) 偏度:skewness(x) 峰度:kurtosis(x)

运行出结果为:

x1=93 75 83 93 91 85 84 82 77 76 X2=77 95 94 89 91 88 86 83 96 81 X3=79 97 78 75 67 69 68 84 83 81 X4=75 66 85 70 94 84 83 82 80 78 X5=74 76 76 70 86 76 90 89 71 66 X6=86 73 80 94 79 78 77 63 53 55 然后计算如下:均值mean(x)=80.1000

标准差std(x)=9.7106

极差range(x)=44

偏度skewness(x)=-0.4682

峰度kurtosis(x)=3.1529

结果估计学生成绩的均值为80.1,标准差为9.7106,均值的0.95的置信区间为[77.5915,82.6085],标准差的0.95置信区间为[8.2310,11.8436]。

五.模型检验

检验结果:(1)布尔变量h=0,表示不拒绝零假设,说明提出的假设成绩均值为80.1000是合理的。(2)95%的置信区间为[77.5915 82.6085]完全包括均值。且精确度比较。(3)sig的值为1,远超过0.5,不能拒绝假设。

六.参考文献

数学建模与数学实验(第四版)第八章

MATLAB遗传算法工具箱及其应用(西安电子科技大学出版社)2005

应用数理统计(机械工程出版社)

七.附录

数据的统计即数理统计学是以概率论为基础,从实际观测资料出发,研究如何合理的搜集资料(数据)来对随机变量的分布函数、数字特征等进行估计、分析和推断。更具体地说,数理统计学是研究从一定总体中随机抽出一部分(称样本或子样)的某些性质,以此对所研究总体的性质作出推测性的判断。

相关文档
最新文档