最新数理统计大作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数理统计学大作业
学院航空航天工程学部专业飞行器设计
班级航宇二班
学号142103130228 姓名张立
指导教师姜永
负责教师
沈阳航空航天大学
2014年12月
目录 (2)
前言 (2)
一、采集样本数据整理及SPSS统计软件的实现 (3)
1.1、数据的收集方法及说明 (3)
1.2、数据整理:给出频数、频率分布表及偏度和峰度 (4)
1.3、画出直方图和折线图 (5)
1.4、经验分布函数和图形 (6)
1.5、各种概率分布 (7)
二、给出总体分布的参数估计 (12)
2.1、矩估计法 (12)
2.2、最大似然估计 (12)
2.3、参数区间估计 (13)
三、参数的假设检验 (16)
3.1. 样本统计数据的t检验 (16)
3.2样本统计数据的2χ检验 (17)
四、非参数假设检验(
2
χ拟合优度检验) (18)
4.1、2χ拟合优度检验 (18)
五、结论 (20)
参考文献 (21)
数理统计学是研究有效地运用数据收集与数据处理、多种模型与技术分析、社会调查与统计分析等,对科技前沿和国民经济重大问题和复杂问题,以及社会和政府中的大量问题,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的应用广泛的基础性学科。随着科学技术的发展,数理统计的作用在国民生活中越来越重要,特别是现在随着大数据的时代来临,迫切的需要我们对大量数据的处理能力,当然这些大量的数据不可能用人工计算,有很多可以实际应用的数理统计软件,这次大作业我使用的是SPSS软件。
由于数理统计是一门实用性极强的学科,在学习中要紧扣它的实际背景,理解统计方法的直观含义。了解数理统计能解决那些实际问题。对如何处理抽样数据,并根据处理的结果作出合理的统计推断,该结论的可靠性有多少要有一个总体的思维框架,这样,学起来就不会枯燥而且容易记忆。例如估计未知分布的数学期望,就要考虑到:1.如何寻求合适的估计量的途径,2.如何比较多个估计量的优劣。这样,针对1按不同的统计思想可推出矩估计和极大似然估计,而针对2又可分为无偏估计、有效估计、相合估计,因为不同的估计名称有着不同的含义,一个具体估计量可以满足上面的每一个,也可能不满足。掌握了寻求估计的统计思想,具体寻求估计的步骤往往是“套路子”的,并不困难,然而如果没有从根本上理解,仅死背套路子往往会出现各种错误.
一、采集样本数据整理及SPSS 统计软件的实现
1.1、数据的收集方法及说明
我的这次作业采取的数据是机械加工零件中,车床C6140其中一个传动轴的长度,由于这零件是大批量生产,数据很多,我选取了其中的100个数据进行计算,数据具体如下:
84 69 73 77 88 83 65 74 79 67
67 89 74 85 92 80 87 71 80 67
77 76 77 73 53 68 79 81 67 76
59 88 70 80 92 79 75 88 48 72
74 73 83 68 65 78 88 84 58 74
70 78 70 69 80 79 76 75 73 70
65 81 81 80 76 52 66 69 77 76
73 65 75 75 79 89 74 88 81 73
77 82 74 88 84 82 81 88 90 65
84 90 78 89 93 81 85 83 61 70
1.2、数据整理:给出频数、频率分布表及偏度和峰度
其中,样本传动轴长度数据最小值为48,最大值为93,取a =40,b=100, 全距L =100-40=60,把数据分布的区间(40,100]等分为6个子区间,等组距为 Δt i =(100-40)/6=10,i =1,2,3,4,5,6。
通过计数要求落在子区间的个数,则得样本传动轴长度的频数i n 和频率i f 分布,
序号 区间 频数n i 频率f i
1 (40,50] 1 0.01
2 (50,60]
3 0.03
3 (60,70] 2
4 0.24
4 (70,80] 43 0.43
5 (80,90] 23 0.23
6 (90,100] 6 0.06
偏度是对样本观察值分布的偏斜方向和程度的度量,通过样本数据计算的偏度为:
3471.2)1()(313
1=--=∑=S n X X V n
i i
V 1 0,分布呈右偏态。
峰度是描述样本观察值分布集中趋势高峰的程度,通过样本数据计算的峰度为:
6328.4)1()(4142=--=∑=S n X X V n
i i
V 2 3,分布为尖峰分布。
1.3、画出直方图和折线图
图一、数据段的直方图
图二、数据分段的折线图
1.4、经验分布函数和图形
设X1,X2,...,X n 是来自总体X 的样本,样本的顺序统计量为X(1)≤X(2)≤...≤X(n),当固定的一组顺序统计量的观察值x(1)≤x(2)≤...≤x(n)时,对于任何实数x 称下式:
⎪⎪⎩
⎪⎪⎨⎧≥-+<≤<+)
(1)1(,11,......,2,1,,,0)(n k k n x x n k x x x n
k x x x F
为总体X 的经验分布函数。
图3经验分布函数图像
1.5、各种概率分布
概率分布类型主要分为离散型概率分布和连续型概率分布,我查阅了图书馆还有专业参考资料搜集到以下的概率分布,个别分布还画出了密度函数图像,还对各种概率密度的背景做了简单的介绍。 1.指数分布:
⎩
⎨⎧<>=-0,00,)(x x e x f x λλ 指数函数的一个重要特征是无记忆性(又称遗失记忆性)。这表示如果一个随机变量呈指数分布,当s,t ≥0时有P(T>s+t|T>t)=P(T>s)。即,如果T 是某一元件的寿命,已知元件使用了t 小时,它总共使用至少s+t 小时的条件概率,与从开始使用时算起它使用至少s 小时的概率相等。
21
)(1
)(λλ==X D X E ,