数学建模-数据的统计分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数学建模与数学实验
课程设计
学院数理学院专业数学与应用数学班级学号
学生姓名指导教师
2015年6月
数据的统计分析
摘要
问题:某校60名学生的一次考试成绩如下:
93 75 83 93 91 85 84 82 77 76 77 95 94 89 91
88 86 83 96 81 79 97 78 75 67 69 68 84 83 81
75 66 85 70 94 84 83 82 80 78 74 73 76 70 86
76 90 89 71 66 86 73 80 94 79 78 77 63 53 55
计算均值、标准差、极差、偏度、峰度,画出直方图;检验分布的正态性;
若检验符合正态分布,估计正态分布的参数并检验参数;
模型:正态分布。
方法:运用数据统计知识结合MATLAB软件
结果:符合正态分布
问题重述
某校60名学生的一次考试成绩如下:
93 75 83 93 91 85 84 82 77 76 77 95 94 89 91 88 86 83 96 81 79 97 78 75 67 69 68 84 83 81 75 66 85 70 94 84 83 82 80 78 74 73 76 70 86 76 90 89 71 66 86 73 80 94 79 78 77 63 53 55
(1)计算均值、标准差、偏差、峰度,画出直方图; (2)检验分布的正态性;
(3)若检验符合正态分布,估计正态分布的参数并检验参数。
模型假设
假设一:此组成绩没受外来因素影响。 假设二:每个学生都是独自完成考试的。 假设三:每个学生的先天条件相同。
三.分析与建立模型
像类似数据的信息量比较大,可以用MATLAB 软件决绝相关问题,将n 名学生分为x 组,每组各n\x 个学生,分别将其命为1x ,2X ……j x 由MATLAB 对随机统计量x 进行命令。此时对于直方图的命令应为 Hist(x,j) 源程序为:
x1=[93 75 83 93 91 85 84 82 77 76 ] x2=[77 95 94 89 91 88 86 83 96 81 ] x3=[79 97 78 75 67 69 68 84 83 81 ]
x4=[75 66 85 70 94 84 83 82 80 78 ] x5=[74 76 76 70 86 76 90 89 71 66 ] x6=[86 73 80 94 79 78 77 63 53 55 ] x=[x1 x2 x3 x4 x5 x6 ] hist(x,6) normplot(x)
[muhat,sigmahat,muci,sigmaci]=normfit(x) [h,sig,ci]=ttest(x,
四.模型求解
平均值:∑==n i i x n 11x 标准差:21
2
1
])(11[s ∑=--=n
i i x x n 偏度:3
131)(1∑=-=n i i x x s g 峰度:4
1
4
2)
(1g ∑=-=n
i i
x x s
作频率直方图:在直角坐标系的横轴上,标出x 1’,x 2’,...x k ’各点,分别以(x i ’,x i+1’)为底边,作高
'f i
i
x ∆为的矩形,1,,3,2,1,x ''1'-=-=∆+k i x x i i i Λ,即得频率直方图。此图大致描述了X 的频率分布情况,因为每个竖着的长方形面积,刚好近似地代表了X 取值落入“底边”的概率。有了直方图,就能大致描绘出分布密度曲线,让曲线大致经过每个竖着的长方形的上边,就得出分布密度曲线的大致模样。 对随机变量X ,计算其基本统计量的命令如下: 均值:mean(x) 中位数:median(x) 标准差:std(x) 方差:var(x) 偏度:skewness(x) 峰度:kurtosis(x)
运行出结果为:
x1=93 75 83 93 91 85 84 82 77 76 X2=77 95 94 89 91 88 86 83 96 81 X3=79 97 78 75 67 69 68 84 83 81 X4=75 66 85 70 94 84 83 82 80 78 X5=74 76 76 70 86 76 90 89 71 66 X6=86 73 80 94 79 78 77 63 53 55 然后计算如下:均值mean(x)=
标准差std(x)=
极差range(x)=44
偏度skewness(x)=
峰度kurtosis(x)=
结果估计学生成绩的均值为,标准差为,均值的的置信区间为[,],标准差的置信区间为[,]。
五.模型检验
检验结果:(1)布尔变量h=0,表示不拒绝零假设,说明提出的假设成绩均值为是合理的。(2)95%的置信区间为[ ]完全包括均值。且精确度比较。(3)sig的值为1,远超过,不能拒绝假设。
参考文献
数学建模与数学实验(第四版)第八章
MATLAB遗传算法工具箱及其应用(西安电子科技大学出版社)2005
应用数理统计(机械工程出版社)
七.附录
数据的统计即数理统计学是以概率论为基础,从实际观测资料出发,研究如何合理的搜集资料(数据)来对随机变量的分布函数、数字特征等进行估计、分析和推断。更具体地说,数理统计学是研究从一定总体中随机抽出一部分(称样本或子样)的某些性质,以此对所研究总体的性质作出推测性的判断。