数理统计课程设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
合肥工业大学
数理统计课程设计设计题目:某级某专业课考试成绩描述性统计分析学生学号:20096307
学生姓名:刘明超
专业班级:数学与应用数学09-02班
指导教师:谭常春李彤
摘要
本文利用数学学院2008级与2009级同学数理统计这门课程的考试成绩,
并且运用MATLAB 进行统计描述与相关假设检验。在本文中,我们选取了2009级信息专业同学的数理统计成绩作为样本并对其统计特征进行具体描述,并将其与2008级信息专业同学的数理统计成绩进行比较。并在此基础上,还作出了曲线拟合检验其是否服从正态(卡方)分布。
一、 题目重述
某级某专业课期末考试成绩描述性统计分析:均值、方差、分组画图形、曲线拟合是否服从正态(卡方检验);描述性分析的其它量:标准差、偏态系数、峰度系数、中位数、众数、极差、经验分布函数、四分位数等、;比较两个班的相应描述性统计量的差异, 画图形表示等,另外做相关的假设检验,要求每个人的区间划分不相同,组数和区间长度对检验结果的影响。
二、描述性统计分析
1.均值
均值被定义为
=1
1=n
i i X x n
相应的matlab 命令mean(A),其中A 是储存有09级信息专业同学数理统计成绩的数组。
根据09级信息专业选课的63名同学的数理统计成绩,可计算出数理统计成绩均值=X 71.0794。
2.中位数
即样本数据的中间值,相应的matlab 命令为median(A),其中A 是储存有09级信息专业同学数理统计成绩的数组。根据09级信息专业选课的63名同学的数理统计成绩,我们得出样本的中位数是73。
3.众数
即出现频率最高的数,相应的matlab 命令为mode(A),其中A 是储存有09级信息专业同学数理统计成绩的数组。根据09级信息专业选课的63名同学的数理统计成绩,我们得出样本的众数是63。
4.方差
样本方差为2
21
1=()-1n i i X X n σ=-∑,相应的matlab 命令为var(A),其中A 是储存有09级信息专业同学数理统计成绩的数组。根据09级信息专业选课的63名同学的数理统计成绩,我们得出样本的方差是277.4936。
5.标准差
样本标准差即为方差的算术平方根,由上述计算的方差值,我们可得标准差为22.4068。
6.极差
定义为样本最大观测值与最小观测值之差,相应的matlab 命令为range(A),其中A 是储存有09级信息专业同学数理统计成绩的数组。根据09级信息专业选课的63名同学的数理统计成绩,我们得出样本的极差是75。
7.四分位数
[x>]=[x<]=αξα
αξα
上分位数为P 下分位数为P
我们计算得:该样本的上下四分位数分别为84和61。
8.峰度系数
峰度是用来反映频数分布曲线顶部尖峭或扁平程度的指标,而峰度系数则被定义为
σ
4
1
4
)
1(--
=
∑⎪⎭⎫ ⎝⎛-=N i a N i X X
本样本其峰度系数为2.7737,由于该系数大于2,所以拒绝其正态性。
9.偏态系数
描述频率分布不对称性的统计参数,通常采用三阶中心矩与标准差立方之比表示。
偏态系数以平均值与中位数之差对标准差之比率来衡量偏斜的程度,用SK 表示偏斜系数:偏态系数小于0,因为平均数在众数之左,是一种左偏的分布,又称为负偏。偏态系数大于0,因为均值在众数之右,是一种右偏的分布,又称为正偏。 计算公式如下
3
1
3
()=
n
i i X
X SK σ
=-∑
该样本偏态系数为-0.3973,表示峰值较正态分布左偏。
三、经验分布函数
09级信息专业数理统计的经验分布函数如下图所示:
20
30
40
50
6070
80
90
100
00.10.20.30.40.50.6
0.70.80.9
1x
F (x )
Empirical CDF
图1. 09信息专业成绩经验分布函数
四、成绩分组频数图
对成绩分布画出其频数图,共分为十个区间:
20
30405060708090100
02
4
6
8
10
12
14
图2. 09信息专业数理统计成绩各区间频数图
五、08和09信息专业数理统计成绩的比较:
(1)、 将09级信息专业与08级信息专业的数理统计成绩进行比较,他们的统
计特征如下表所示:
表1. 两个专业统计特征
统计特征 08信息
09信息
均值
67.6184 71.0794 方差 163.679
1
277.493
6
标准差 12.7937 16.6581
中位数
69
73
众数 78 63 极差 71 75
下四分位数 58
61
上四分位数 77
84
峰度系数 4.3185
2.7737
偏态系数
-0.8007
-0.3973
由表中数据可以看出,09信息专业的平均成绩高于08信息专业,同时09信
息专业的成绩方差较大,说明08信息专业的数理统计成绩的分布较09信息专业更为集中。
(2)、 08信息专业的成绩经验分布函数图如下:
20
30
40
50
6070
80
90
100
0.10.20.30.40.50.6
0.70.80.9
1x
F (x )
Empirical CDF