重大数理统计大作业

合集下载

数理统计大作业

数理统计大作业

数理统计学大作业学院航空航天工程学部专业飞行器设计班级航宇二班学号142103130228 姓名张立指导教师姜永负责教师沈阳航空航天大学2014年12月目录 (2)前言 (3)一、采集样本数据整理及SPSS统计软件的实现 (4)1.1、数据的收集方法及说明 (4)1.2、数据整理:给出频数、频率分布表及偏度和峰度 (4)1.3、画出直方图和折线图 (6)1.4、经验分布函数和图形 (6)1.5、各种概率分布 (7)二、给出总体分布的参数估计 (12)2.1、矩估计法 (12)2.2、最大似然估计 (12)2.3、参数区间估计 (13)三、参数的假设检验 (16)3.1. 样本统计数据的t检验 (16)3.2样本统计数据的2χ检验 (17)四、非参数假设检验(2χ拟合优度检验) (18)4.1、2χ拟合优度检验 (18)五、结论 (20)参考文献 (21)数理统计学是研究有效地运用数据收集与数据处理、多种模型与技术分析、社会调查与统计分析等,对科技前沿和国民经济重大问题和复杂问题,以及社会和政府中的大量问题,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的应用广泛的基础性学科。

随着科学技术的发展,数理统计的作用在国民生活中越来越重要,特别是现在随着大数据的时代来临,迫切的需要我们对大量数据的处理能力,当然这些大量的数据不可能用人工计算,有很多可以实际应用的数理统计软件,这次大作业我使用的是SPSS软件。

由于数理统计是一门实用性极强的学科,在学习中要紧扣它的实际背景,理解统计方法的直观含义。

了解数理统计能解决那些实际问题。

对如何处理抽样数据,并根据处理的结果作出合理的统计推断,该结论的可靠性有多少要有一个总体的思维框架,这样,学起来就不会枯燥而且容易记忆。

例如估计未知分布的数学期望,就要考虑到:1.如何寻求合适的估计量的途径,2.如何比较多个估计量的优劣。

这样,针对1按不同的统计思想可推出矩估计和极大似然估计,而针对2又可分为无偏估计、有效估计、相合估计,因为不同的估计名称有着不同的含义,一个具体估计量可以满足上面的每一个,也可能不满足。

重庆大学学年(秋)数理统计试题及答案

重庆大学学年(秋)数理统计试题及答案

重庆大学全日制学术型硕士研究生 《数理统计》(A )课程试卷2013-2014学年第一学期(秋)请保留四位小数,部分下侧分位数为:0.95 1.65u =,0.99 2.33u =,20.95(1) 3.841χ=,0.95(3,6)9.78f =一、(18分)设1X ,2X ,…,64X 是来自总体N (0,2σ)的样本,X ,2S 分别是样本均值和样本方差:(1)求参数c 满足{}0.1P X S c >⋅=;(2)求概率22122234{1}X X P X X +>+;(3)求322321(2)i i i D X X X +=⎡⎤+-⎢⎥⎣⎦∑。

(请写出计算过程)解:(1)~(1)t n-{}}0.1P X S c P c ∴>⋅=>=得0.95(63)c t = 故 1.650.20638c ==(2)2~(0,)X N σ22212(/)(/)~(2)X X σσχ∴+ 同理22234(/)(/)~(2)X X σσχ+2222223412122234(/)(/)(/)(/)/~(2,2)22X X X X X X F X X σσσσ+++∴=+ 22122234{1}{(2,2)1}X X P P F X X +>=>+ 且0.50.50.51(2,2)(2,2)1(2,2)F F F =⇒= 得2222121222223434{1}1{1}0.5X X X X P P X X X X ++>=-≤=++ (3)令2~(2,2)i i n i Y X X N μσ+=+,112n i i Y Y X n ===∑ 221()(1)ni Y i T Y Y n S =∴=-=-∑3232223211(2)[()]i i i i i D X X X DT D Y Y +==⎡⎤+-==-⎢⎥⎣⎦∑∑2~(0,2(11/))i Y YN n σ-+~(0,1)YN=3222422421[2(11/)4(11/)((32))256(11/32)i Y D n n D σσχσ=+=+=+∑二、(26分)设1X ,2X ,…,n X 是来自总体2~(2,)(0)X N σσ>的样本,{}0.95P X A <=。

重庆大学数理统计试题3

重庆大学数理统计试题3
一、设 X1 , X 2 ,…,X m , X m1 ,…,X mn 为来自总体 X ~N 0, 2 的一个样本, 试确定下列统计量的分布
n Xi
i 1 m n m
( 1 ) Y1
m
2
i m 1
X
; ( 2 ) Y2
2 i
n X i 2 m Xi
i m 1 i 1 mn 2
n n 2 i 1 2 1 e 2 ) ( 2 2 ) 2 e 2 2 n xi2
xi2
n
L( 2 , X 1 , X 2 ,
Xn) (
i 1
ln( L( 2 , X 1 , X 2 , ln( L( 2 , X 1 , X 2 , d 2
xi2 n X n )) ln( 2 ) ln 2 i 1 2 2 2 X n )) n 1 n 1 n 2 i 1 ( xi 2 ) 2 2 2 4 2 2( ) 2 n i 1
s
2
c1
1 1 2 (n 1), c2 2 (n 1) n 1 2 n 1 1 2 s2
k0 :{
2
c2或
s2
2
c1}
(2) H0 : 2 1, H1 : 2 2
2 拒绝域 k0 : (n 1)s 2 12 (n 1);22s 2 0.95 (22) 33.92; :
m
2 i m1
X

n X i 2 m Xi
i m 1 i 1 mn 2
Y2 ~ F (m, n)
2 i
n
Xi
(3)
i 1
m
m n
m
~ N (0,1),

重庆大学研究生数理统计大作业

重庆大学研究生数理统计大作业

NBA球员科比单场总得分与上场时间的线性回归分析摘要篮球运动中,球员的上场时间与球员的场上得分的数学关系将影响到教练对每位球员上场时间的把握,若能得到某位球员的上场时间与场上得分的数据关系,将能更好的把握该名球员的场上时间分配。

本次作业将针对现役NBA球员中影响力最大的球员科比布莱恩特进行研究,对其2012-2013年赛季常规赛的每场得分与出场时间进行线性回归,得到得分与出场时间的一元线性回归直线,并对显著性进行评估和进行区间预测。

正文一、问题描述随着2002年姚明加入NBA,越来越多的中国人开始关注篮球这一项体育运动,并使得篮球运动大范围的普及开来,尤其是青年学生。

本着学以致用的原则,希望将所学理论知识与现实生活与个人兴趣相结合,若能通过建立相应的数理统计模型来做相应的分析,并且从另外一个角度解析篮球,并用以指导篮球这一项运动的更好发展,这也将是一项不同寻常的探索。

篮球运动中,得分是取胜的决定因素,若要赢得比赛,必须将得分超出对手,而影响一位球员的得分的因素是多样的,例如:情绪,状态,体力,伤病,上场时间,防守队员等诸多因素,而上场时间作为最直接最关键的因素,其对球员总得分的影响方式有着重要的研究意义。

倘若知道了其分布规律,则可从数量上掌握得分与上场时间复杂关系的大趋势,就可以利用这种趋势研究球员效率最优化与上场时间的控制问题。

因此,本文针对湖人当家球星科比布莱恩特在2012-2013年赛季常规赛的每场得分与上场时间进行线性回归分析,并对显著性进行评估,以巩固所学知识,并发现自己的不足。

二、数据描述抽出科比布莱恩特2012-2013年常规赛所有82场的数据记录(原始数据见附录),剔除掉其中没有上场的部分数据,得到有参考实用价值的数据如表2.1所示:以上数据由腾讯篮球中心提供,特此说明。

三、模型建立(1)假设条件假定球员每场的发挥均为独立同分布事件, (2)模型构建以上场时间为自变量Xi ,单场得分为应变量Yi ,建立正态线性模型式:()012,1,2,,;0,,,,,i i i ii i i Y x i n N ββεεσεεε=++=⎧⎪⎨⎪⎩且相互独立 其中β0、β1为模型参数。

最新数理统计大作业题目和答案--0348资料

最新数理统计大作业题目和答案--0348资料

1、设总体X 服从正态分布),(2σμN ,其中μ已知,2σ未知,n X X X ,,,21 为其样本,2≥n ,则下列说法中正确的是( )。

(A )∑=-ni iXn122)(μσ是统计量 (B )∑=ni iXn122σ是统计量(C )∑=--ni i X n 122)(1μσ是统计量 (D )∑=ni i X n12μ是统计量2、设两独立随机变量)1,0(~N X ,)9(~2χY ,则YX 3服从( )。

)(A )1,0(N )(B )3(t )(C )9(t )(D )9,1(F3、设两独立随机变量)1,0(~N X ,2~(16)Y χ)。

)(A )1,0(N )(B (4)t )(C (16)t )(D (1,4)F4、设n X X ,,1 是来自总体X 的样本,且μ=EX ,则下列是μ的无偏估计的是( ).)(A ∑-=-1111n i i X n )(B ∑=-ni i X n 111 )(C ∑=n i i X n 21 )(D ∑-=111n i i X n 5、设4321,,,X X X X 是总体2(0,)N σ的样本,2σ未知,则下列随机变量是统计量的是( ).(A )3/X σ; (B )414ii X=∑; (C )σ-1X ; (D )4221/ii Xσ=∑6、设总体),(~2σμN X ,1,,n X X L 为样本,S X ,分别为样本均值和标准差,则下列正确的是( ).2() ~(,)A X N μσ 2() ~(,)B n X N μσ 22211()()~()ni i C X n μχσ=-∑()~()D t n7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X ⋅⋅⋅是来自总体的简单随机样本,则下列随机变量不是统计量为( )( A ) . 12X X +( B ){}max ,15i X i ≤≤( C ) 52X p +( D )()251X X -8、设1,,n X X ⋅⋅⋅为来自正态总体2(,)N μσ的一个样本,μ,2σ未知。

数理统计大作业要求

数理统计大作业要求

大作业要求前言 ............................................................ 页码一、采集样本、数据整理及SPSS 统计软件的实现 ..................... 页码 0、掌握采集样本及数据整理的方法;1、学会SPSS 统计软件安装与启动;2、利用SPSS 建立数据文件、并利用数据库导入数据;3、利用SPSS 对数据进行合并与拆分;4、利用SPSS 对数据进行描述性统计分析:给出频数、频率分布表及偏度和峰度,并画出直方图和折线图;5、写出经验分布函数并利用SPSS 画出图形;6、查找藏于文著里的已知的各种概率分布(力求全),并描述其背景,给出 其期望和方差,利用SPSS 或其他软件画出密度函数的图形;注:SPSS 软件版本为SPSS19.0 (中文版或英文版均可),从百度可以下载.二、给出总体分布的参数估计(用SPSS 软件完成) .............................................. 页码1、矩估计;2、最大似然估计;3、若总体是未知分布,应探求其参数的点估计,并写出方案;4、参数区间估计(假设总体是正态分布); .......................... 页码1)、方差2σ未知,求数学期望μ的置信区间; ........................ 页码2)、数学期望μ,2σ均未知,求方差2σ的置信区间; ......................................... 页码 (要求有步骤,有计算结果)三、 参数的假设检验(用SPSS 完成) .............................. 页码1、 样本统计数据的t 检验........................................ 页码2、 样本统计数据的-2χ检验...................................................................................... 页码 注:可先假设总体是正态情况讨论,总体若不是正态的要给出探求方案四、非参数假设检验(2χ拟合优度检验)(用SPSS 完成) .............. 页码1、2χ拟合优度检验2、当上述检验被接受或被拒绝时,请结合实际问题给出说明五、结论 ........................................................ 页码总结、评述和体会参考文献 ..........................................................................................................................................要求:1、大作业内容按上述过程要求完成,不得缺漏;2、由本人认真独立完成,不得抄袭他人;3、样本数据限在本专业范围内寻找,样本容量原则上100个以上;4、大作业格式应参考本科毕业设计格式(如,页面设置,字号小四,插图等)5、字数要求为A4纸20页左右;6、结束课程后一周内提交,上交纸质版和电子版两种;7、大作业成绩占期末总成绩30% 。

重庆大学硕士研究生《数理统计》课程大作业(论文)

重庆大学硕士研究生《数理统计》课程大作业(论文)

一、问题提出和问题分析今天的重庆,肩负着中央赋予的历史重任——着力打造西部地区的重要增长极、长江上游地区的经济中心、成为统筹城乡发展的试验者、在西部地区率先实现全面建设小康社会的目标。

2010年初,又一重要规划将重庆发展提升到国家战略——重庆被确定为国家五大中心城市之一,是中西部地区唯一入选的城市。

这说明,重庆未来的发展不可限量。

自1997年直辖以来,重庆市的经济社会发展极为迅猛。

全市的GDP由1997年的1360.24亿元增长至2010年的7894.2亿元,而整个社会的发展进步也有目共睹。

在重庆过去、现在和未来的发展进程中,在重庆的各种发展规划的要求下,建设必将成为山城的另一个符号。

过去十多年中的大规模、大范围的建设成就了现在的重庆,而重庆未来的发展将需要更多的建设。

作为重庆建设中最重要的一环,建筑业在重庆显然有着重要的地位。

建筑业这种专门从事土木工程、房屋建设和设备安装以及工程勘察设计工作的生产部门,为重庆的发展建设提供着众多的基础设施,满足着居住、工业、商业、办公等各种城市需求。

数据显示,在过去的数年中,重庆市建筑业的总产值占全市GDP的7%-8%,是名副其实的支柱产业。

因此建筑业的发展情况,可以从侧面反映出整个重庆社会经济的发展情况,对重庆建筑业的研究就有了很大的现实意义。

建筑企业是建筑业的主体。

众多的建筑企业的良好发展构成了建筑业的良好发展。

对于建筑企业来说,要实现企业的良好经营和发展,必须要有良好的收入来支撑。

在建筑企业收入的众多影响因素中,企业的劳动生产率无疑是值得关注的一个。

企业都在致力于提高自身的劳动生产效率,而不断提高的劳动生产率,可使得企业的生产经营行为更具效率,因而获得更多的收入,实现更好的发展。

所以,研究重庆市建筑企业劳动生产率与企业收入的关系,可从一个角度来了解重庆市建筑企业的发展情况,从而了解到了重庆建筑业的发展以至于重庆市的经济发展情况。

为了找出二者之间的关系或者规律性,本文采用2001-2010这十年中重庆建筑企业劳动生产率和企业平均收入的数据,通过数学分析,找出二者关系。

最新重庆大学数理统计试题2

最新重庆大学数理统计试题2

一、假设129,,X X X …,是来自总体2~,X N的简单随机样本,X 是样本均值,2S 是样本方差,求下列常数a 的值。

(1)0.78P Xa ;(2)922113.49()15.51ii P X X a ;(3)0.05X P aS。

解:(1)22~(,),~(0,1)xx N N Nn220.78{}xp ann即2{ 2.34},(2.34),0.99xp a a a n。

(2)222(1)~(1)n sn 992222119221221:()(1)()11{3.49()15.51}(1){3.4915.51}(15.51)(3.49)10.950.10.85ii i i ii s x x n s x x n p x x an sp aaaa(3)2222(1)~(0,1),~(1)Xn sN n n222()/~(1),(1)/(1)X n t n n sn即()~(1)3(){}0.053()1{}0.053(){}0.951.86n X t n s Xp a s Xp a s Xp a s a 二、设总体X 的密度函数2,0()00,0xxex f x x 其一个样本为12,,nX X X …,(1)求1g的最大似然估计量T ;(2)验证T是否为1g的有效估计量,若是,写出信息量I;(3)验证T 是否为1g的相合估计量。

解:(1)122111()(,)()()niii nnnx x ni i i I I i L f x x ex e1111ln ()2lnln 2ln ()01112212nniii i nii nii L n x x dn L x d x xn T X(2)由(1)121220211ln (,,,)2()21,()221111()()222nn ii xdnL X X X X n Xd TX c nE T E X EX x edxT 是1得无偏估计量因而T 是1的有偏估计量。

数理统计大作业题目和答案0348

数理统计大作业题目和答案0348

1、设总体X 服从正态分布),(2σμN ,其中μ已知,2σ未知,n X X X ,,,21 为其样本,2≥n ,则下列说法中正确的是( )。

(A )∑=-ni iXn122)(μσ是统计量 (B )∑=ni iXn122σ是统计量(C )∑=--ni i X n 122)(1μσ是统计量 (D )∑=ni i X n12μ是统计量2、设两独立随机变量)1,0(~N X ,)9(~2χY ,则YX 3服从( )。

)(A )1,0(N )(B )3(t )(C )9(t )(D )9,1(F3、设两独立随机变量)1,0(~N X ,2~(16)Y χ)。

)(A )1,0(N )(B (4)t )(C (16)t )(D (1,4)F4、设n X X ,,1 是来自总体X 的样本,且μ=EX ,则下列是μ的无偏估计的是( ).)(A ∑-=-1111n i i X n )(B ∑=-n i i X n 111 )(C ∑=n i i X n 21 )(D ∑-=111n i i X n 5、设4321,,,X X X X 是总体2(0,)N σ的样本,2σ未知,则下列随机变量是统计量的是( ).(A )3/X σ; (B )414ii X=∑; (C )σ-1X ; (D )4221/ii Xσ=∑6、设总体),(~2σμN X ,1,,n X X L 为样本,S X ,分别为样本均值和标准差,则下列正确的是( ).2() ~(,)A X N μσ 2()~(,)B n X N μσ 22211()()~()ni i C X n μχσ=-∑(~()D t n7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X ⋅⋅⋅是来自总体的简单随机样本,则下列随机变量不是统计量为( )( A ) . 12X X +( B ){}max ,15i X i ≤≤( C ) 52X p +( D )()251X X -8、设1,,n X X ⋅⋅⋅为来自正态总体2(,)N μσ的一个样本,μ,2σ未知。

(完整word版)数理统计大作业1

(完整word版)数理统计大作业1

研究生课程考核试卷科目:数理统计教师: 李寒宇姓名: 蔡亚楠学号:20131102015t 专业:高电压与绝缘技术类别:学术型上课时间: 2014年3月至2014年5月考生成绩:卷面成绩平时成绩课程综合成绩阅卷评语:阅卷教师(签名)相对地过电压数据的统计分析摘要:过电压是指超过正常运行电压并可使电力系统绝缘或保护设备损坏的电压升高。

电力系统的过电压分布情况决定了电气设备的绝缘水平。

变电站过电压由于影响因素的随机性,使得过电压数据复杂且具有随机性。

本文结合电气工程专业的背景,分析了相对地过电压数据的分布规律。

首先对三相的过电压数据分别进行双样本同分布检验,采用两总体分布比较的假设检验方法。

检验结果显示三相的样本具有相同的分布规律,因此将三相的过电压数据合并进行总体的分布规律检验。

文中运用拟合优度2 检验法检验总体分布是否福才能够正态分布。

检验结果表明样本总体分布不服从正态分布,而是服从切断正态分布.针对相对地过电压数据的统计分析有助于确定设备的绝缘水平,具有一定的研究价值.关键词:过电压;假设检验;统计分布一、问题提出过电压是指超过正常运行电压并可使电力系统绝缘或保护设备损坏的电压升高。

电力系统的过电压分布情况决定了电气设备的绝缘水平.由于过电压数据出现的随机性较大,且有明显的统计特征,因此在对单次过电压数据进行统计分析的同时,还可以用数理统计的方法对系统采集的多次样本进行统计分析研究,并预测过电压的概率分布规律,以便将所得结论用于确定设备及线路的绝缘水平,合理解决绝缘配合问题,使设备绝缘故障率或停电故障率降低到经济上和安全运行上可以接受的水平.二、数据描述本次研究以TR2000过电压在线监测装置在某变电站实地运行所采集的过电压数据进行分析。

该变电站的等级为110kV/38.5kV/10。

5kV,以往的运行经验发现,35kV侧事故频繁,属第一、二类等级符合用户较集中,故在35kV侧安装了一台TR2000过电压在线监测装置.通过对监测装置中导出的数据进行进制转换、图形显示、统计分析等手段,分析变电战过电压的规律,由此可以对电力系统设计、改造和故障分析等工作提供可靠的依据.根据现场情况,将暂态过电压记录倍率设定为1。

重庆大学硕士研究生数理统计课外大作业

重庆大学硕士研究生数理统计课外大作业

重庆大学硕士研究生“数理统计”课外作业学生:学号:201510****专业:动力工程专业重庆大学动力工程学院二O一五年十二月学号201510******* 姓名**** 学院****学院专业****专业成绩一元线性回归分析在风力发电中的应用摘要:能源短缺和环境恶化日益严重,风能作为一种可再生的清洁能源,越来越受到世界各国的重视,风力发电的装机容量也越来越大。

风力机是风力发电机组重要的组成部分,实现风能向机械能的转化,机械能再通过直流发电机转发为电能,其中直流发电机输出的直流电压和风速紧密相关。

本文以课题研究中测得的实验数据为基础,对风力发电直流电输出和风速的线性相关关系进行计算分析,运用数理统计中一元线性回归分析及假设检验的相关知识,采用EXCEL软件进行辅助计算,最终得到了风力发电的直流电输出和风速的线性关系显著,对以后的课题研究具有一定的借鉴作用。

1 问题提出与分析在能源短缺和环境趋向恶化的今天,风能作为一种可再生的清洁能源,越来越受到世界各国的重视,也越来越多地被应用到风力发电中。

风力机和发电机是风力发电机组中将风能转化为电能的重要装置,它们不仅直接关系到输出电能的质量和效率,也影响着整电量输出和风速的相关性。

风力机是风力发电机组重要的组成部分,其实现了风动能到风轮机轴机械能的转化,机械能通过直流电动机转发为电能,其中直流电动机产生的直流电压和风力紧密相关。

风力发电的设计和评价和电量输出与风速的关系密不可分,其中对于数学知识要求很高。

本文以课题研究中实验测得的数据为基础,对风力发电直流电输出和风速是否存在线性关系进行分析,运用数理统计中一元线性回归及非参数检验的相关知识,结合EXCEL软件进行辅助计算分析,最终得到了风力发电的直流电输出和风速关系,为以后科研工作和风力发电的应用具有指导意义。

综上所述,对风力发电的直流电输出和风速的研究,具有理论与实践的重要意义。

2 数据描述本文以风力发电的直流输出和风速的关系为研究对象,采用实验中观察得出的直流电输出和风速的部分数值进行计算分析,风力发电的直流电输出y(单位:MW)和风速x(单位:nmile/h)的数据如表1所示。

重庆大学数理统计试题(四套)

重庆大学数理统计试题(四套)

X (4)分析随机变量 S
24 的分布。
2
二 ( . 20 分) 设总体分布 X 的密度函数为 f x; c x 未知,求 (1)参数 的矩估计量 ˆ1 ; 1 ˆ ; (2)参数 g 的极大似然估计 g ˆ 无偏性,有效性和相合性。 (3)试分析 g
4
四、某公司的考勤员试图证实星期一的缺勤是其他四个工作日缺勤的两倍,已有三 月的缺勤记录如下表所示: 星期 缺勤数 给定显著水平 一 二 304 176 ,请用检验证实。 三 139 四 141 五 130
五、(20 分)合成纤维抽丝工段第一导丝盘的速度 y 对丝的质量是很重要的因素。如 由生产记录得相关数据 ( xi , yi ) ,i 1,2,...,10 , 今发现它与电流的周波 x 有密切的关系, 计算得到 x 49.61 , y 16.86 , l xx 1.989 , l xy 0.674 l yy 0.244 。 (1)求第一导丝盘的速度 y 与电流的周波 x 的经验回归直线方程; (2)在显著水平 0.05 下,检验 y 与 x 是否有显著的线性关系; (3)求 ,并求回归系数 1 的置信度为 95% 的置信区间。
六、设组观测数据(xi , yi )(i =1,2,…, n) 满足 yi =β0+β1(x- x ) +εi , 1 n εi ~ N (0,σ 2) (i =1,2,…, n)(其中 x= X i )且 ε1,ε2,…,εn 相互独立。 n 1 ˆ , ˆ; (1) 求系数 β0,β1 的最小二乘估计量
2 2 2 (1)当 n=17 时,求常数 k 使得 P( X Y 1 2 k S X SY 2S X ,Y ) 0.95

重庆大学数理统计课程大作业上证指数与多因素的多元线性回归分析解析

重庆大学数理统计课程大作业上证指数与多因素的多元线性回归分析解析

上证指数与多因素的多元线性回归分析摘要中国的股票市场自1990年成立以来发展迅速,对我国经济的各个方面都产生了深远的影响,从1990年的100点到2007年的6124.17点,增长了60倍,平均年增长3.5倍,以及从2008年到2014年的3234.7点降低了1倍,可见虚拟经济增长和降低速度之快已经超出了人们的想象,为了研究指数增长与股票的一些基本因素的关系,建立了多元线性回归模型,来分析影响上证指数的因素的影响程度大小。

一、问题描述为探究影响上证指数的主要因素,文章选取十一个最具代表性经济指标。

股票市场作为金融市场的重要组成部分,不仅承担着融资和资源配置的资本媒介职能,同时作为经济发展的“晴雨表”也发挥着经济预测等功能。

金融危机过后,我国资本市场正处在关键的转型阶段,我国股票市场的走向都吸引了无数注视目光,甚至在世界范围内目光。

在实际经济运行中,影响股票指数的因素非常复杂。

宏观经济因素是股价波动的大环境,只有从分析宏观经济发展的大方向着手,才能把握住股票市场的总体变动趋势。

虽然现实生活中存在许多不可预测或无法量化的因素,统计模型也不能百分之百地预测指标的下跌或上涨,但可以提供一个基本的预测趋势。

如果将模型的定量分析和市场的定性分析相结合,一定会帮助股民更好地分析股市做出相对明智的决定,还能帮助人们及时发现我国经济的发展中出现的问题解决问题从而实现我国经济又快又好发展。

自2014年底上证指数从2200点到2015年5月底的5000点,涨速可谓迅速,股民数量呈指数形式上涨,人们在大街小巷谈论股票,在这一时段里,中国股市最受世界关注,但是2015年5月底上证指数跌幅巨大,致使大部分股民亏损严重,与上一段时间形成鲜明的对比。

股民亏损的原因有很多方面,其中一个很重要的方面是对股票的基本情况不够了解,不能区分哪些因素是主要的,哪些因素是次要的,同时股票指数可以反映经济发展的状况。

本文选取的数据是1993年到2014年的数据,来进行多元线性回归分析,一方面分析上证指数与相关因素的相关关系,另一方面,巩固老师讲的基本知识。

数理统计大作业

数理统计大作业

数理统计大作业-标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII应用数理统计(论文)国家财政收入的逐步回归分析指导教师院系名称学号学生姓名2012年11月18日摘要财政收入是国民经济基础,是实现国家职能的财力保证。

本文采用SPSS统计软件中的逐步回归分析方法,得出影响我国财政收入的显著性变量,建立国家财政收入回归模型,并将所得的模型给予合理的经济解释。

关键字:国家财政收入,逐步回归,SPSS1 引言财政收入是指国家财政参与社会产品分配所取得到的收入,是实现国家职能的财力保证。

影响财政收入的因素有很多,包括工业总产值、农业总产值、建筑业总产值、社会商品零售总额、人口数、受灾面积等等。

在经济模型的建立中,其中有些自变量对问题的研究可能并不重要,有些自变量数据的质量可能很差,有些变量可能和其它变量有很大程度的重叠。

如果用回归模型把这些变量都包含进来不但会使模型计算复杂,而且往往会扩大估计方差,降低模型精度,直接影响到回归方程的应用。

另外,选进太多的自变量又会造成共线性的存在。

因此,本文采用线性回归中的逐步回归方法,利用SPSS多元统计软件得出影响我国财政收入的显著性变量,剔除了不显著的变量,并且克服了变量间的多重共线性,得出了一个较合理的财政回归模型。

2初始模型的建立及数据分析2.1 自变量与因变量的提出本模型是研究1997年至2011年国家财政收入与主要影响因素之间的定量关系。

本文选取财政收入Y(亿元)为因变量,自变量选取如下:第一产业国内生产总值X1(亿元),第二产业国内生产总值X2(亿元,第三产业国内生产总值X3(亿元),社会消费品零售总额X4(亿元),人口数X5(万人),受灾面积X6(万公顷)。

根据《中国统计年鉴》获取1997-2011年共十五年的统计数据,见表1。

表11997-2011年财政收入与部分项目的统计数据财政收入(亿元)第一产业国内生产总值(亿元)第二产业国内生产总值(亿元)第三产业国内生产总值(亿元)社会商品零售总额(亿元)人口总数(万人)受灾面积(万公顷)1997 8651.14 14441.89 37543.00 26988.15 31252.90 123626.00 5342.70 1998 9875.95 14817.63 39004.19 30580.47 33378.10 124761.00 5014.50 1999 11444.08 14770.03 41033.58 33873.44 35647.90 125786.00 4998.00 2000 13395.23 14944.72 45555.88 38713.95 39105.70 126743.00 5468.80 2001 16386.04 15781.27 49512.29 44361.61 43055.40 127627.00 5221.50 2002 18903.64 16537.02 53896.77 49898.90 48135.90 128453.00 4694.60 2003 21715.25 17381.72 62436.31 56004.73 52516.30 129227.00 5450.60 2004 26396.47 21412.73 73904.31 64561.29 59501.00 129988.00 3710.60 2005 31649.29 22420.00 87598.09 74919.28 67176.60 130756.00 3881.80 2006 38760.20 24040.00 103719.54 88554.88 76410.00 131448.00 4109.10 2007 51321.78 28627.00 125831.36 111351.95 89210.00 132129.00 4899.20 2008 61330.35 33702.00 149003.44 131339.99 114830.10 132802.00 3999.00 2009 68518.30 35226.00 157638.78 148038.04 132678.40 133450.00 4721.40 2010 83101.51 40533.60 187383.21 173595.98 156998.40 134091.00 3742.60 2011 103874.43 47486.20 220412.80 204982.50 183918.60 134735.00 3247.10 2.2 做散点图,设定理论模型作数据散点图,并进行线性拟合,观察因变量与自变量之间关系是否有线性特点。

概率论与数理统计大作业

概率论与数理统计大作业

概率论与数理统计大作业一、选题背景概率论与数理统计是现代科学中的重要分支,具有广泛的应用领域。

在实际问题中,我们经常需要通过数据分析来了解事物的规律性和趋势,而概率论与数理统计正是提供了一种科学的方法来处理这些数据。

因此,在学习概率论与数理统计时进行一次大作业,不仅能够加深对知识点的理解,还能够提高自己的数据分析能力和实际问题解决能力。

二、选题内容本次概率论与数理统计大作业选题为“某超市销售数据分析”。

主要内容包括以下几个方面:1. 数据收集首先需要收集某超市近两年来各种商品的销售数据,并将其整理成表格形式。

表格中应包含商品名称、销售量、销售额等信息。

2. 数据处理在收集到数据后,需要对其进行初步处理。

可以使用Excel等工具进行数据清洗、去重、排序等操作,并计算出每种商品的年销售量、年销售额以及平均单价等指标。

3. 数据分析在完成数据处理后,可以开始进行数据分析。

可以从以下几个方面入手:(1)商品销售情况分析通过统计每种商品的销售量、销售额等指标,分析各种商品的销售情况,找出畅销商品和滞销商品,并探究其原因。

(2)季节性分析通过比较不同季节或不同月份的销售数据,分析商品在不同季节或月份的销售情况,找出季节性规律。

(3)地域性分析通过比较不同门店或不同城市的销售数据,分析商品在不同地域的销售情况,找出地域性规律。

(4)用户行为分析通过统计用户购买行为数据,如购买时间、购买频率、购买金额等指标,分析用户行为特点,并提出相应的营销策略。

4. 数据可视化为了更直观地展示数据分析结果,可以使用图表等工具进行数据可视化。

例如可以绘制柱状图、折线图、饼图等来展示各种商品的年销售量和年销售额;也可以使用热力图来展示不同城市或门店的销售情况。

三、选题意义本次概率论与数理统计大作业选题有以下几个意义:1. 提高数据处理能力在进行本次大作业时,需要进行数据收集、处理和分析等操作,这将有助于提高自己的数据处理能力和实际问题解决能力。

重庆大学数理统计试题答案版

重庆大学数理统计试题答案版

涉及到的有关分位数:()()()()()()()()()()()()20.950.950.950.9750.9750.9752222220.9750.0250.0250.9750.950.97520.95 1.645,16 1.746,15 1.753,16 2.12,15 2.131,1628.851527.49,16 6.91,15 6.26,1 5.02,1 3.84,27.382 5.99u t t t t χχχχχχχχ=============一、设123,,X X X 是来自总体~(0,3)X N 的样本。

记()2332i 1111,32i i i X X S X X====-∑∑,试确定下列统计量的分布:(1)3113i i X =∑;(2)23119i i X =⎛⎫⎪⎝⎭∑;(3)()23113i i X X=-∑;(4X解:(1)由抽样分布定理,311~(0,1)3i i X X N ==∑(2)因311~(0,1)3i i X N =∑,故223321111~(1)39i i i i X X χ==⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭∑∑(3)由抽样分布定理,()()()2223321131211~(2)3323i i i i S X X X X χ==-=⋅-=-∑∑(4)因()222~(0,1),~23X N S χ,X 与2S独立,故()~2X t 。

二、在某个电视节目的收视率调查中,随机调查了1000人,有633人收看了该节目,试根据调查结果,解答下列问题:(1)用矩估计法给出该节目收视率的估计量;(2)求出该节目收视率的最大似然估计量,并求出估计值;(3)判断该节目收视率的最大似然估计是否是无偏估计;(4)判断该节目收视率的最大似然估计是否是有效估计。

解:总体X 为调查任一人时是否收看,记为~(1,)X B p ,其中p 为收视率(1)因EX p =,而^E X X =,故收视率的矩估计量为^Xp =(2)总体X 的概率分布为()1()1,0,1xxf x p p x -=-=1111()(1)(1)(1)ln ()ln (1)ln(1)ln ()(1)01nniii ii i nx n x x x n X n n Xi L p p p pp p p L p nX p n X p d L p nX n X dp p p==---=∑∑=-=-=-=+---=-=-∏解得收视率p 的最大似然估计量为^Xp =现有一参量为1000的样本121000,,X X X ……,,且10001633ii X==∑则6330.6331000X ==,故收视率的极大似然估计值为0.633.(3)因E X p =,故^X p =是无偏估计(4)因()ln ()(1)1(1)d L p nX n X nX p dp p p p p -=-=---,又E X p=故收视率的最大似然估计X 是p 的有效估计。

重庆大学研究生数理统计课程设计大作业(化学化工类)

重庆大学研究生数理统计课程设计大作业(化学化工类)

β-葡聚糖对乳酸菌生长状况的影响一元线性回归模型分析摘要:在人们生活水平不断提高的今天,由于人们的饮食结构和生活环境的变化,一些营养素缺乏而引起的疾病相对减少,而冠心病,糖尿病等发病率则越来越高。

因此,对于这些疾病的预防和治疗受人们的关注,已成为医药和食品工作者研究的热点。

β-葡聚糖是用独特的工艺开发的一种新的产品,其来源于新鲜的食品啤酒酵母。

它是一种多糖,主要化学结构β-1,3 葡聚糖和β-1,6葡聚糖,其中前者具有抗肿瘤性质,而且能够极大地提高人体自然免疫力。

本文应用紫外-可见分光光度计测定加入不同量的β-葡聚糖标准溶液的吸光度。

在建立β-葡聚糖与吸光度之间的线性方程中,采用一元线性回归分析的分析方法,并建立分析β-葡聚糖对乳酸菌生长状况曲线模型。

关键字:β-葡聚糖吸光度一元线性回归分析生长状况曲线模型一、问题提出,问题分析设置对照实验,在实验“β-葡聚糖对乳酸菌生长状况的影响”中,实验通过设置不同的β-葡聚糖浓度,研究相同浓度不同量对乳酸菌生长的影响。

在实验中,由于加入的β-葡聚糖的量不同,通过测定培养基溶液吸光度不同,反映不同培养基中的乳酸菌的生长状况是不同的,通过各实验组的对照,加入的β-葡聚糖浓度与乳酸菌的生长是有关系的。

实验中β-葡聚糖的浓度为75g/L,加入的量设置依次为:0μL、10μL、30μL、45μL、60μL、75μL。

培养12h后,用752紫外可见分光光度计进行检测,测定结果对应的吸光度-加入量关系表(如表1所示)已知朗伯——比尔定律的数学表达式为A=kn, k为摩尔吸收系数,A为吸光度,n为吸光物质的量。

根据此定律设想铬离子浓度与其吸光度存在线性相关关系。

二、数据描述表2.1 β-葡聚糖加入量与其吸光度(β-葡聚糖浓度:75g/L ,培养时间12h )以上数据来自重庆大学本科生马晶晶在做毕业论文《β-葡聚糖对乳酸菌生长状况的影响》数据,实验数据利用用752紫外可见分光光度计测定,真实可靠。

应用数理统计大作业

应用数理统计大作业

一、非参数假设检验数据来自《2009中国卫生统计年鉴》8-1-2各地区人口出生率和死亡率:北京市的人口出生率服从正态分布。

检验假设H由上表可知,假设不成立,即北京市的人口出生率不符合正态分布,应用同种方法可以得到北京市的人口死亡率同样不符合正态分布。

二、多元线性回归分析改革开放以来,我国城乡居民收入分配制度发生了很大的变化。

随着城乡居民收入水平的不断提高,其差距也在逐渐扩大,如果不采取相应的经济政策,任其发展,有可能会影响社会生产力的发展和社会的稳定,因此,需要分析影响城乡居民收入差距的主要因素。

以城乡居民收入比(Y )作为被解释变量,而第一产业增加值占GDP 的比重(X 1)、国家财政对农业支出的增长率(X 2)、乡镇企业职工增长率(X 3)、城镇居民人均年生活费收入增长率(X 4)、第一产业增加值指数(X 5)作为解释变量。

本模型采用时间序列数据,数据来自《中国统计年鉴》(1982—1998)。

模型的理论方程为:Y=0β+1βX 1+2βX 2+3βX 3+4βX 4+5βX 5 城乡居民收入比模型样本观测值数据obs 城乡居民收入比Y 第一产业增加值占GDP 的比重X1 国家财政对农业支出的增长率X2 乡镇企业职工增长率X3 城镇居民人均年生活费收入增长率X4 第一产业增加值指数X51981 2.05 31.73 -26.50 -1.00 4.33 7.00 1982 1.83 33.31 9.33 4.83 8.08 11.50 1983 1.70 32.90 10.27 3.91 6.26 8.30 1984 1.71 32.47 6.34 61.01 15.59 12.90 1985 1.72 28.35 8.73 34.00 12.66 1.80 1986 1.95 27.09 19.91 13.73 20.88 3.30 1987 1.98 26.79 6.25 10.94 10.63 4.70 1988 2.05 25.66 9.38 8.41 22.16 2.50 1989 2.09 25.00 24.23 -1.87 12.69 3.10 1990 2.02 27.05 15.76 -1.09 9.99 7.30 1991 2.18 24.46 12.91 3.72 11.32 2.40 1992 2.33 21.77 8.19 10.12 18.26 4.70 1993 2.53 19.87 17.13 16.67 27.98 4.70 1994 2.60 20.23 21.01 -2.65 36.03 4.00 1995 2.47 20.51 7.93 7.02 22.46 5.00 1996 2.27 20.45 21.83 5.02 12.43 5.10 19972.2318.6810.01-3.396.633.50(以上内容是从网上找的资料)用SPSS进行线性回归分析,结果如下:上表说明了因变量和自变量进入方程的情况。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

研究生“数理统计”课程课外作业
姓名:学号:
学院:光电工程学院专业:测控技术与仪器
类别:上课时间:
成绩:
城镇居民家庭食品总支出与肉类食品支出关系研究分析
摘要:
近些年,我国经济高速增长,居民的家庭收入大幅提高,同时居民的生活水平和质量也有了很大的提高,以前只有在过节或者有贵客时才能在餐桌上见到的各种食品现在已经平常化日常化。

肉类做为日常家庭食品的一个重要组成部分,也快速的增长着.上世纪80年代以来,城市居民家庭人均肉类消费增长了1倍。

从表面看来家庭食品支出越高肉类消费越多。

但是我们将城镇居民按家庭收入分成5等份,发现收入最低的吃肉最少,随着收入的增加,肉类消费数量同步增加,收入越高吃肉越多。

但是也有部分高收入家庭的肉类消费量开始下降。

因为这部分群体对于健康饮食的关注远远高于其他人群。

所以从总体上看来,家庭食品总支出与肉类食品支出之间存在着一定的相互关联。

在此文中我们以回归分析方法分析检验了家庭肉类食品消费支出与家庭食品总支出是否存在线性相关关系。

关键词:家庭肉类食品支出与食品总支出,回归分析方法
正文
随着我国经济的快速发展,居民的生活水平也有了显著的提高。

同时城市居民家庭在食品方面的开支始终占据着很大的份额,其中肉类的开支也有着显著的提高。

故提出在我国居民生活水平日益提高的情况下肉类食品的消费水平是否与家庭总的食品消费水平存在线性相关性?
数据描述:
表一:家庭食品支出与各种肉类支出分布
家庭食品支出与肉类支出关系(元/月)
品名
按人平月可支配收入比例分组
最低收入
户低收入户
中等收入
户高收入户
最高收入

猪肉187.44 233.16 248.88 269.4 236.04 牛肉9.36 18.84 26.76 24.48 28.44
羊肉 3.84 5.88 6.48 9.36 13.32 家禽
76.2
104.52 120 110.52 179.28 鱼 52.56 56.88 65.52 62.64 70.32 肉类支出合计 329.4 419.28 467.64 476.4 527.4 食品支出总合计 1131.84
1351.44
1624.56
1744.72
2017.44
表二:家庭食品支出与肉类支出关系
家庭食品支出与肉类支出关系(元/月)
品名 按人平月可支配收入比例分组
最低收入 低收入户 中等收入 高收入户 最高收入
食品支出总合计 1131.84 1351.44 1624.56 1744.72 2017.44 肉类支出合计 329.4
419.28
467.64
476.4
527.4
模型建立:
提出假设条件,引进参数:由上面两个表格的数据我们可以假设家庭肉类支出与家庭食品总支出之间满足线性关系。

设家庭食品总支出为X (元/月),家庭肉类食品支出为Y(元/月)。

1) 做出表二中家庭食品总支出与肉类食品支出数据的散点图,如图一所示:
图一:家庭食品总支出与肉类食品支出数据的散点图
从图一中可以看出家庭食品总支出与肉类食品支出之间存在线形相关关系。

2) 求家庭食品总支出与肉类食品支出的样本回归直线,由表二的样本资料数据有计算机求解有(表三)
由表三可以计算得:x 7870/51574==;y 2220.12/54440.2==
5
xy i i i 1l x y 5xy 3594351.56515744440.299882.68==-=-⨯⨯=∑
5
2
22xx i i 1
l x 5x 12860759.851574473379.08==-=-⨯=∑
5
2
22yy i i 1
l y 5y 1008094.9754440.222308.41
==-=-⨯=∑
表三:家庭食品总支出与肉类食品支出回归计算
家庭食品支出与肉类支出关系(元/月) 家庭类型 食品总支出x i 肉类支
出y i x i 2 y i 2 x i y i 最低收入户 1131.84 329.4 1281061.79 108504.36 372828.10 低收入户 1351.44 419.28 1826390.07 175795.72 566631.76 中等收入户 1624.56 467.64 2639195.19 218687.17 759709.24 高收入户 1744.72 476.4 3044047.88 226956.96 831184.61 最高收入户 2017.44 527.4
4070064.15 278150.76 1063997.86
∑ 7870 2220.12
12860759.08 1008094.97 3594351.56
1xy xx
l /l 99882.68/473379.080.21β=== 01y x 4440.20.211574111.91ββ=-=-⨯=
2
2
2221yy xx S S S l l 22308.410.21473379.081233.22E
T
R
β=-=-=-⨯= 2
1233.22
20.27n 23
E S σ
===- 所以家庭食品肉类支出Y 对家庭食品总支出X 的样本回归直线方程是:
01y x=111.91+0.21x ββ=+
我们可以在图一上可以做出上面表达式的图形(如图二)

该方程说明,在家庭总体生活水平达到一定阶段后,家庭肉类食品的支出与总的食品支出呈线性关系。

但是在生活水平较低的情况下,次方程显然不符合实际生活情况。

3) 检验:取显著水平0.05α= 用t 检验法:算出临界值
12
20.27
(2) 3.1820.09368
473379.08
xx
c t
n l ασ-
=
-=⨯=
拒绝域为:
{}
1
0.09368β

已知 10.21β=,显然大于0.09368。

故在拒绝域内,所以应该拒绝H 0,即是认为家庭食品总支出X 与肉类食品支出Y 由显著的线性相关关系。

4) 预测
当家庭食品支出x=2500元时,肉类食品支出预测为
01y x=111.91+0.21x=111.91+0.212500=636.91ββ=+⨯
置信度为95%的预测区间为:
010010((),())y x y x -δ+δ
由公式及查表有:
1010
12
22
0100.97512
()()(2)
()11(25001574)() 1.425473379.08(2)(3) 3.182
xx x s x t n x x s x n l t
n t α
-
α
-δ=σ⋅---=+=+=-==

100
1
1
()20.27 1.42 3.18291.59((),())x y x y x δ=⨯⨯=-δ+δ=(545.32,728.50)
即有95%的把握顾忌当家庭食品总支出为2500元的时候,平均肉类食品支出在545.32到728.50元之间。

参考资料
[1]杨虎,刘琼荪,钟波.数理统计[M].高等教育出版社,2004年10月:58-117 [2]中国肉类消费全景图和大趋:/html/news/12/510472 [3]百度数据统计:。

相关文档
最新文档