最新重庆大学数理统计大作业

合集下载

重庆大学研究生数理统计习题答案

重庆大学研究生数理统计习题答案

()(){}{}()22222111221121221164~,~(8),89111,01(1)11~(0,1)1.28 1.280.281(2)0.261 1.8360.2619818ni i n X N S S X S n X X X X E X X n n n n n D X X DX DX DX X X N n n n P X X P U X P X S P μχσμ=-=--=--=---⎛⎫-=+==⇒- ⎪⎝⎭->=>=⎛ -⎧⎫ <-+<=<⎨⎬ ⎩⎭⎝∑解:由题可知(,)且与相互独立(){}22222222241164. 1.836896464 = 2.08814.688=~(9)991188= 2.08814.688=0.90.01=0.89423948i i i S X X P S S P X X χχχμ=⎧⎫⎫⎪⎪⎪⎪⎪⎪+<⎨⎬⎪⎪⎪⎪⎪⎪⎭⎩⎭⎧⎫⎛⎫⎛⎫⎪⎪ ⎪ ⎪--⎪⎪⎪ ⎪<+<+⎨⎬ ⎪ ⎪⎪⎪⎪ ⎪⎪⎪⎝⎭⎝⎭⎩⎭<<-⎛⎫- ⎪⎝⎭=⋅∑,其中原式()()()()(){}24882255448822554821584~(0,1)=~4998244~(4)8944 2.132= 2.132=0.1i ii i i i i i i i i ii i N X X X t t X XP X XP t μμχμμμμμμ======⎛⎫ ⎪⎛⎫⎛⎫ ⎪-- ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪⎝⎭⎛⎫⎛⎫⎛⎫-- ⎪⎪⎪⎝⎭⎝⎭==--⎧⎫⎛⎫⎪⎪-≤-≤⎨⎬ ⎪⎝⎭⎪⎪⎩⎭∑∑∑∑∑∑∑∑∑()则,()()()(){}222222222891(4)=8~1~(1,8)6498911=(1,8)58.82(8,1)10.90.158.8258.82XXX F FSSXP P F P FSμμμχμ-⎛⎫⎪--==⎧⎫-⎪⎪⎧⎫<<=<=-=⎨⎬⎨⎬⎩⎭⎪⎪⎩⎭(),则也可以用T分布与F分布的关系.0020001111()()1ln(1)11,,ˆˆˆ1ln(1),,ln(1)ln(1)2(;,...,)(;)ln (;,...,)=01ˆ=()()似然方程:得到参数的极大似然估计,再由i A nnx n n xn i i i n P X A F A e p p A EX DX A EX p EX X A EX p X p L x x f x e e d L x x nnx d Xλλλλλλλλλλλλλλλ---==<==-=-=-===--=∴=--=--====-∏∏ 0000010000ln(1)ˆln(1)ˆln(1)ˆ(3)=ln(1)=ln(1)==ˆln (;,...,)ln(1){[ln(1)][]}ln(1)ˆ()ln(1)ˆˆ极大似然估计的不变性,推出的极大似然估计为是的无偏估计且是的无偏估计是有效n A p A X p p EA E X p p EX A AA d L x x p n n nx X p d p n AA p AA A λλλλλλ-=-=----⎡⎤----⎣⎦∴-=-=-----=--∴ ()202ˆlim ln(1)ˆlim lim 0ˆ估计又是相合估计量n n n EA A p DA n Aλ→∞→∞→∞⎧=⎪⎨-⎪==⎩∴221212121222122222222221222121.422,2~222(1)(1)~01~(2) (1)(1)(1)(1)2=222X YX Y X YX X X X Nn mX X n S m SU N n mn S m S n S m S X X Sn mX Xtωσσμμμμμμχχσσσσ+++++-+--==++----+-+++-+-+==的无偏估计为且(,+)(,)又且与独立,记则()()()()()()()121212212121211221212122222=22=22222=12122t n mP t t n mX XP t n m t n mP X X t n m S X X t n m SX X t n m Sαααααωαμμμμαμμα-----+-⎧⎫≤+-⎨⎬⎩⎭⎧⎫⎪⎪+-+⎪⎪+-≤≤+-⎨⎬⎪⎪⎪⎪⎩⎭⎧⎪+-+-≤+≤+++-⎨⎪⎩-+-+±+-因此构造的置信区间为{}{}121201212120121212121212.222=022,22=02=02=0=的无偏估计为,在:成立的条件下,大于某个常数应该是小概率事件,因此构造拒绝域:以下确定常数由X X H X X c K X X c cP X X c P P t t μμμμμμμμμμα+++++>+>+⎧⎫⎪⎪⎪=>+⎬⎪⎪⎭⎧⎫⎪⎪⎪⎪=>+=⎨⎬⎪⎪⎪⎪⎩⎭()()122n m c t n m S ααω--+-⇒=+-拒绝域为:3133011331122333333111~(1,).~(3)220.220.230.20.20.80.20.104220.4因为所以,类错误(弃真):为真类错误(纳伪):为真i i i i i i i i i i i i i i X B p X B p P X H P X p P X p P X p C C P X H P X p αβ=======I ⎧⎫⎧⎫=≥=≥=⎨⎬⎨⎬⎩⎭⎩⎭⎧⎫⎧⎫===+==⎨⎬⎨⎬⎩⎭⎩⎭=+=II ⎧⎫⎧=<=<=⎨⎬⎨⎩⎭⎩∑∑∑∑∑∑∑313311223333120.4120.430.410.40.60.40.648i i i i i i P X p P X p P X p C C ===⎫⎬⎭⎧⎫=-≥=⎨⎬⎩⎭⎧⎫⎧⎫=-==-==⎨⎬⎨⎬⎩⎭⎩⎭=--=∑∑∑()()221221111211=200ˆnE i i i n n nEi i i i i i i i i ni ii nii S y x dS y x x y x x d x yxββββββ======-=--=⇒-==∑∑∑∑∑∑解:()利用最小二乘估计使残差平方和最小参数的最小二乘估计量为2211222111111221111ˆ2=~(,)ˆˆˆ~(,)111ˆ===11ˆ(),由正态分布的性质推知服从正态分布ni ii i i i ni ii nnni i iiiinnni i i i i ii i i ni i nn i i i i i x YY x N x xN E D E E x Y x EY x x x x xD D x Y x x ββεβσβββββββ============+⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭⎛⎫⎛ ⎪ ⎪ == ⎪ ⎪⎝⎭⎝∑∑∑∑∑∑∑∑∑∑∑()()()()()222211221222111112211ˆ~(,)ˆˆˆ3=ˆˆˆ2(,)ˆ(,)(,)因此,()nii ni ii n i i nnE i iiiiii i nni i i i i ii i ni ii ii i i i nniii i xDY xN x ES E Y x D Y x E Y x D Y x DY D x Cov Y x x Yx Cov Y x Cov Y x C xxσσβββββββββ==========⎫⎪⎪=⎪ ⎪⎭⎡⎤-=-+-⎣⎦⎡⎤=-=+-⎣⎦==∑∑∑∑∑∑∑∑∑∑()222221112222222222221111(,)(,)221则ni i i i i i i nni iii i nni i Enni i iii i x x ov Y x Y Cov Y Y xxx x ESn n n xxσσσσσσσσ==========+-=+-=-∑∑∑∑∑∑∑因素:车型水平:3种不同的车型A,B,C方差分析前提假设:正态性,方差齐次性,独立性对比分位数:0.95(2,9) 4.26F F >=,拒绝原假设0123:H μμμ==,认为这三种车型耗油量有显著差异。

重庆大学数理统计试题3

重庆大学数理统计试题3
一、设 X1 , X 2 ,…,X m , X m1 ,…,X mn 为来自总体 X ~N 0, 2 的一个样本, 试确定下列统计量的分布
n Xi
i 1 m n m
( 1 ) Y1
m
2
i m 1
X
; ( 2 ) Y2
2 i
n X i 2 m Xi
i m 1 i 1 mn 2
n n 2 i 1 2 1 e 2 ) ( 2 2 ) 2 e 2 2 n xi2
xi2
n
L( 2 , X 1 , X 2 ,
Xn) (
i 1
ln( L( 2 , X 1 , X 2 , ln( L( 2 , X 1 , X 2 , d 2
xi2 n X n )) ln( 2 ) ln 2 i 1 2 2 2 X n )) n 1 n 1 n 2 i 1 ( xi 2 ) 2 2 2 4 2 2( ) 2 n i 1
s
2
c1
1 1 2 (n 1), c2 2 (n 1) n 1 2 n 1 1 2 s2
k0 :{
2
c2或
s2
2
c1}
(2) H0 : 2 1, H1 : 2 2
2 拒绝域 k0 : (n 1)s 2 12 (n 1);22s 2 0.95 (22) 33.92; :
m
2 i m1
X

n X i 2 m Xi
i m 1 i 1 mn 2
Y2 ~ F (m, n)
2 i
n
Xi
(3)
i 1
m
m n
m
~ N (0,1),

重庆大学研究生数理统计大作业

重庆大学研究生数理统计大作业

NBA球员科比单场总得分与上场时间的线性回归分析摘要篮球运动中,球员的上场时间与球员的场上得分的数学关系将影响到教练对每位球员上场时间的把握,若能得到某位球员的上场时间与场上得分的数据关系,将能更好的把握该名球员的场上时间分配。

本次作业将针对现役NBA球员中影响力最大的球员科比布莱恩特进行研究,对其2012-2013年赛季常规赛的每场得分与出场时间进行线性回归,得到得分与出场时间的一元线性回归直线,并对显著性进行评估和进行区间预测。

正文一、问题描述随着2002年姚明加入NBA,越来越多的中国人开始关注篮球这一项体育运动,并使得篮球运动大范围的普及开来,尤其是青年学生。

本着学以致用的原则,希望将所学理论知识与现实生活与个人兴趣相结合,若能通过建立相应的数理统计模型来做相应的分析,并且从另外一个角度解析篮球,并用以指导篮球这一项运动的更好发展,这也将是一项不同寻常的探索。

篮球运动中,得分是取胜的决定因素,若要赢得比赛,必须将得分超出对手,而影响一位球员的得分的因素是多样的,例如:情绪,状态,体力,伤病,上场时间,防守队员等诸多因素,而上场时间作为最直接最关键的因素,其对球员总得分的影响方式有着重要的研究意义。

倘若知道了其分布规律,则可从数量上掌握得分与上场时间复杂关系的大趋势,就可以利用这种趋势研究球员效率最优化与上场时间的控制问题。

因此,本文针对湖人当家球星科比布莱恩特在2012-2013年赛季常规赛的每场得分与上场时间进行线性回归分析,并对显著性进行评估,以巩固所学知识,并发现自己的不足。

二、数据描述抽出科比布莱恩特2012-2013年常规赛所有82场的数据记录(原始数据见附录),剔除掉其中没有上场的部分数据,得到有参考实用价值的数据如表2.1所示:以上数据由腾讯篮球中心提供,特此说明。

三、模型建立(1)假设条件假定球员每场的发挥均为独立同分布事件, (2)模型构建以上场时间为自变量Xi ,单场得分为应变量Yi ,建立正态线性模型式:()012,1,2,,;0,,,,,i i i ii i i Y x i n N ββεεσεεε=++=⎧⎪⎨⎪⎩且相互独立 其中β0、β1为模型参数。

重庆大学概率与数理统计课后答案第八章

重庆大学概率与数理统计课后答案第八章

习题八A 组1.假设总体X ~)1,(μN ,从中抽取容量为25的样本,对统计假设0:,0:10≠=μμH H ,拒绝域为X 0={}392.0≥x 。

(1)求假设检验推断结果犯第Ⅰ类错误的概率。

(2)若3.0:1=μH ,求假设检验推断结果犯第Ⅱ类错误的概率。

解:(1){}{}001H H P P α==犯第I 类错误拒绝成立={}0392.0=>μX P{}{}96.10392.0>==>=n XP X P μ,所以05.01=α(2){}{}00H H P P β==犯第II 类错误接受不成立{}3.0392.0=≤=μX P{}6769.046.0)3.0(46.3=<-<-=n X P2.已知某厂生产的电视机显像管寿命(单位:小时)服从正态分布。

过去,显像管的平均寿 命是15000小时,标准差为3600小时。

为了提高显像管寿命采用了一种新技术,现从新生 产的显像管中任意抽取36只进行测试,其平均寿命为15800=x 小时。

若用假设检验方 法推断新技术是否显著提高了显像管的寿命,试指出:(1)假设检验中的总体;(2)统计假设;(3)检验法、检验统计量、拒绝域;(4)推断结果。

解:(1)假设检验中的总体是新生产的显像管的寿命,用X 表示,由题意知:X ~),(2σμN )90000,5000(N(2)统计假设:15000:0≤μH ,15000:1>μH(3)假设σ与过去一样为3600小时,那么检验方法为U 检验法,检验统计量为:nX U σ15000-=显著水平05.0=α时的拒绝域为:X 0 ={}α->1u u ={}645.1>u(4)推断:因为U 的样本值为1.333不在X 0 内,所以接受原假设,即在显著水平05.0=α下,认为新技术没有提高显像管的寿命。

3.某计算机公司使用的现行系统,运行通每个程序的平均时间为45秒。

现在使用一个新系统运行9个程序,所需的计算时间(秒)分别是:30,37,42,35,36,40,47,48,45。

重庆大学概率与数理统计课后答案第二章

重庆大学概率与数理统计课后答案第二章
X
3 0.1 4 0.3 5
4 6 ; 10 10
P
2)
0.6
x3 0, 0.1, 3 x 4 F ( x) P{ X x} 0.4, 4 x 5 x5 1,
3. 设一学生用同一台机床接连独立地制造 3 个同种零件,第 i 个为不合格品的概率为
1 ,以 X 表示汽车停下时通过的交通岗个数,求 X 的分布律。 2
X 的可能取值:0,1,2,3,4 1 P( X 0) 2 1 1 P( X 1) ( ) 2 2 4 1 1 P( X 2) ( )3 2 8 1 1 P( X 3) ( ) 4 2 16 1 1 2 1 3 1 4 1 P( X 4) 1 ( ) ( ) ( ) 2 2 2 2 16

1
所以 A (2)

f x dx Ae|x|dx 2 Ae x dx 2 A
0


1 ; 2 P 0 X 1 f x dx
0 1 11 1 | x| e dx e x dx 0.316 0 2 0 2 1
解:设 X 为同一时刻使用的设备数,可能取值为:0,1,2,3,4,5, 则 X ~ B(5, 0.2) , (1) P{ X 2}
P{ X k} C
k 0 k 0
2
2
k 5
0.2 k 0.85 k 0.9421 ;
(2) P{X 2} 1 P{X 0,1} 1 0.85 5 0.2 0.84 0.2627 6.一电话总机每分钟收到呼唤次数 X 服从参数为 4 的泊松分布。求(1)某一分钟恰有 8 次 呼唤的概率; (2)某一分钟的呼唤次数大于 3 的概率。 解: (1) X ~ P(4)

重庆大学硕士研究生《数理统计》课程大作业(论文)

重庆大学硕士研究生《数理统计》课程大作业(论文)

一、问题提出和问题分析今天的重庆,肩负着中央赋予的历史重任——着力打造西部地区的重要增长极、长江上游地区的经济中心、成为统筹城乡发展的试验者、在西部地区率先实现全面建设小康社会的目标。

2010年初,又一重要规划将重庆发展提升到国家战略——重庆被确定为国家五大中心城市之一,是中西部地区唯一入选的城市。

这说明,重庆未来的发展不可限量。

自1997年直辖以来,重庆市的经济社会发展极为迅猛。

全市的GDP由1997年的1360.24亿元增长至2010年的7894.2亿元,而整个社会的发展进步也有目共睹。

在重庆过去、现在和未来的发展进程中,在重庆的各种发展规划的要求下,建设必将成为山城的另一个符号。

过去十多年中的大规模、大范围的建设成就了现在的重庆,而重庆未来的发展将需要更多的建设。

作为重庆建设中最重要的一环,建筑业在重庆显然有着重要的地位。

建筑业这种专门从事土木工程、房屋建设和设备安装以及工程勘察设计工作的生产部门,为重庆的发展建设提供着众多的基础设施,满足着居住、工业、商业、办公等各种城市需求。

数据显示,在过去的数年中,重庆市建筑业的总产值占全市GDP的7%-8%,是名副其实的支柱产业。

因此建筑业的发展情况,可以从侧面反映出整个重庆社会经济的发展情况,对重庆建筑业的研究就有了很大的现实意义。

建筑企业是建筑业的主体。

众多的建筑企业的良好发展构成了建筑业的良好发展。

对于建筑企业来说,要实现企业的良好经营和发展,必须要有良好的收入来支撑。

在建筑企业收入的众多影响因素中,企业的劳动生产率无疑是值得关注的一个。

企业都在致力于提高自身的劳动生产效率,而不断提高的劳动生产率,可使得企业的生产经营行为更具效率,因而获得更多的收入,实现更好的发展。

所以,研究重庆市建筑企业劳动生产率与企业收入的关系,可从一个角度来了解重庆市建筑企业的发展情况,从而了解到了重庆建筑业的发展以至于重庆市的经济发展情况。

为了找出二者之间的关系或者规律性,本文采用2001-2010这十年中重庆建筑企业劳动生产率和企业平均收入的数据,通过数学分析,找出二者关系。

最新重庆大学数理统计试题2

最新重庆大学数理统计试题2

一、假设129,,X X X …,是来自总体2~,X N的简单随机样本,X 是样本均值,2S 是样本方差,求下列常数a 的值。

(1)0.78P Xa ;(2)922113.49()15.51ii P X X a ;(3)0.05X P aS。

解:(1)22~(,),~(0,1)xx N N Nn220.78{}xp ann即2{ 2.34},(2.34),0.99xp a a a n。

(2)222(1)~(1)n sn 992222119221221:()(1)()11{3.49()15.51}(1){3.4915.51}(15.51)(3.49)10.950.10.85ii i i ii s x x n s x x n p x x an sp aaaa(3)2222(1)~(0,1),~(1)Xn sN n n222()/~(1),(1)/(1)X n t n n sn即()~(1)3(){}0.053()1{}0.053(){}0.951.86n X t n s Xp a s Xp a s Xp a s a 二、设总体X 的密度函数2,0()00,0xxex f x x 其一个样本为12,,nX X X …,(1)求1g的最大似然估计量T ;(2)验证T是否为1g的有效估计量,若是,写出信息量I;(3)验证T 是否为1g的相合估计量。

解:(1)122111()(,)()()niii nnnx x ni i i I I i L f x x ex e1111ln ()2lnln 2ln ()01112212nniii i nii nii L n x x dn L x d x xn T X(2)由(1)121220211ln (,,,)2()21,()221111()()222nn ii xdnL X X X X n Xd TX c nE T E X EX x edxT 是1得无偏估计量因而T 是1的有偏估计量。

重庆大学数理统计试题答案版

重庆大学数理统计试题答案版

涉及到的有关分位数:()()()()()()()()()()()()20.950.950.950.9750.9750.9752222220.9750.0250.0250.9750.950.97520.95 1.645,16 1.746,15 1.753,16 2.12,15 2.131,1628.851527.49,16 6.91,15 6.26,1 5.02,1 3.84,27.382 5.99u t t t t χχχχχχχχ=============一、设123,,X X X 是来自总体~(0,3)X N 的样本。

记()2332i 1111,32i i i X X S X X====-∑∑,试确定下列统计量的分布:(1)3113i i X =∑;(2)23119i i X =⎛⎫⎪⎝⎭∑;(3)()23113i i X X=-∑;(4X解:(1)由抽样分布定理,311~(0,1)3i i X X N ==∑(2)因311~(0,1)3i i X N =∑,故223321111~(1)39i i i i X X χ==⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭∑∑(3)由抽样分布定理,()()()2223321131211~(2)3323i i i i S X X X X χ==-=⋅-=-∑∑(4)因()222~(0,1),~23X N S χ,X 与2S独立,故()~2X t 。

二、在某个电视节目的收视率调查中,随机调查了1000人,有633人收看了该节目,试根据调查结果,解答下列问题:(1)用矩估计法给出该节目收视率的估计量;(2)求出该节目收视率的最大似然估计量,并求出估计值;(3)判断该节目收视率的最大似然估计是否是无偏估计;(4)判断该节目收视率的最大似然估计是否是有效估计。

解:总体X 为调查任一人时是否收看,记为~(1,)X B p ,其中p 为收视率(1)因EX p =,而^E X X =,故收视率的矩估计量为^Xp =(2)总体X 的概率分布为()1()1,0,1xxf x p p x -=-=1111()(1)(1)(1)ln ()ln (1)ln(1)ln ()(1)01nniii ii i nx n x x x n X n n Xi L p p p pp p p L p nX p n X p d L p nX n X dp p p==---=∑∑=-=-=-=+---=-=-∏解得收视率p 的最大似然估计量为^Xp =现有一参量为1000的样本121000,,X X X ……,,且10001633ii X==∑则6330.6331000X ==,故收视率的极大似然估计值为0.633.(3)因E X p =,故^X p =是无偏估计(4)因()ln ()(1)1(1)d L p nX n X nX p dp p p p p -=-=---,又E X p=故收视率的最大似然估计X 是p 的有效估计。

重庆大学数理统计试题(四套)

重庆大学数理统计试题(四套)

X (4)分析随机变量 S
24 的分布。
2
二 ( . 20 分) 设总体分布 X 的密度函数为 f x; c x 未知,求 (1)参数 的矩估计量 ˆ1 ; 1 ˆ ; (2)参数 g 的极大似然估计 g ˆ 无偏性,有效性和相合性。 (3)试分析 g
4
四、某公司的考勤员试图证实星期一的缺勤是其他四个工作日缺勤的两倍,已有三 月的缺勤记录如下表所示: 星期 缺勤数 给定显著水平 一 二 304 176 ,请用检验证实。 三 139 四 141 五 130
五、(20 分)合成纤维抽丝工段第一导丝盘的速度 y 对丝的质量是很重要的因素。如 由生产记录得相关数据 ( xi , yi ) ,i 1,2,...,10 , 今发现它与电流的周波 x 有密切的关系, 计算得到 x 49.61 , y 16.86 , l xx 1.989 , l xy 0.674 l yy 0.244 。 (1)求第一导丝盘的速度 y 与电流的周波 x 的经验回归直线方程; (2)在显著水平 0.05 下,检验 y 与 x 是否有显著的线性关系; (3)求 ,并求回归系数 1 的置信度为 95% 的置信区间。
六、设组观测数据(xi , yi )(i =1,2,…, n) 满足 yi =β0+β1(x- x ) +εi , 1 n εi ~ N (0,σ 2) (i =1,2,…, n)(其中 x= X i )且 ε1,ε2,…,εn 相互独立。 n 1 ˆ , ˆ; (1) 求系数 β0,β1 的最小二乘估计量
2 2 2 (1)当 n=17 时,求常数 k 使得 P( X Y 1 2 k S X SY 2S X ,Y ) 0.95

重庆大学数理统计课程大作业上证指数与多因素的多元线性回归分析解析

重庆大学数理统计课程大作业上证指数与多因素的多元线性回归分析解析

上证指数与多因素的多元线性回归分析摘要中国的股票市场自1990年成立以来发展迅速,对我国经济的各个方面都产生了深远的影响,从1990年的100点到2007年的6124.17点,增长了60倍,平均年增长3.5倍,以及从2008年到2014年的3234.7点降低了1倍,可见虚拟经济增长和降低速度之快已经超出了人们的想象,为了研究指数增长与股票的一些基本因素的关系,建立了多元线性回归模型,来分析影响上证指数的因素的影响程度大小。

一、问题描述为探究影响上证指数的主要因素,文章选取十一个最具代表性经济指标。

股票市场作为金融市场的重要组成部分,不仅承担着融资和资源配置的资本媒介职能,同时作为经济发展的“晴雨表”也发挥着经济预测等功能。

金融危机过后,我国资本市场正处在关键的转型阶段,我国股票市场的走向都吸引了无数注视目光,甚至在世界范围内目光。

在实际经济运行中,影响股票指数的因素非常复杂。

宏观经济因素是股价波动的大环境,只有从分析宏观经济发展的大方向着手,才能把握住股票市场的总体变动趋势。

虽然现实生活中存在许多不可预测或无法量化的因素,统计模型也不能百分之百地预测指标的下跌或上涨,但可以提供一个基本的预测趋势。

如果将模型的定量分析和市场的定性分析相结合,一定会帮助股民更好地分析股市做出相对明智的决定,还能帮助人们及时发现我国经济的发展中出现的问题解决问题从而实现我国经济又快又好发展。

自2014年底上证指数从2200点到2015年5月底的5000点,涨速可谓迅速,股民数量呈指数形式上涨,人们在大街小巷谈论股票,在这一时段里,中国股市最受世界关注,但是2015年5月底上证指数跌幅巨大,致使大部分股民亏损严重,与上一段时间形成鲜明的对比。

股民亏损的原因有很多方面,其中一个很重要的方面是对股票的基本情况不够了解,不能区分哪些因素是主要的,哪些因素是次要的,同时股票指数可以反映经济发展的状况。

本文选取的数据是1993年到2014年的数据,来进行多元线性回归分析,一方面分析上证指数与相关因素的相关关系,另一方面,巩固老师讲的基本知识。

最新重庆大学数理统计试题2

最新重庆大学数理统计试题2

一、假设129,,X X X …,是来自总体()2~,X N μσ的简单随机样本,X 是样本均值,2S 是样本方差,求下列常数a 的值。

(1)()0.78P X a σμ<+=;(2)922113.49()15.51i i P X X a σ=⎛⎫<-≤= ⎪⎝⎭∑;(3)0.05X P a S μ⎛⎫->= ⎪⎝⎭。

解:(1)2~(,~(0,1)x x N N N σμx p a <=即2.34},(2.34),0.99x p a a a <=Φ==。

(2)222(1)~(1)n s n χσ--992222119221221:()(1)()11{3.49()15.51}(1){3.4915.51}(15.51)(3.49)10.950.10.85i i i i ii s x x n s x x n p x x an s p aa a a σσ===-⇒-=--<-≤=-<≤=Φ-Φ+=-==∑∑∑(3222(1)~(0,1),~(1)X n s N n χσ--~(1),t n -即()~(1)3(){}0.053()1{}0.053(){}0.951.86X t n sX p a sX p a s X p a s a μμμμ--->=--≤=-≤==二、设总体X 的密度函数()2,0()00,0x xe x f x x λλλ-⎧>=>⎨≤⎩其一个样本为12,,n X X X …,(1)求()1g λλ=的最大似然估计量T ;(2)验证T 是否为()1g λλ=的有效估计量,若是,写出信息量()I λ; (3)验证T 是否为()1g λλ=的相合估计量。

解:(1)122111()(,)()()niii nnnx x nii i I I i L f x x ex eλλλλλλ=--===∑===∏∏∏1111ln ()2ln ln 2ln ()01112212n ni ii i ni i n i i L n x x d n L x d x x n T Xλλλλλλλ=====+-=-===∴=∑∑∑∑(2)由(1)121220211ln (,,,)2()21,()221111()()222n n i i x d n L X X X X n X d T X c nE T E X EX x e dx λλλλλλλλ=+∞-=-=--==-====∑⎰ T 是1λ得无偏估计量因而T 是1λ的有偏估计量。

重庆大学数理统计试题答案版

重庆大学数理统计试题答案版

涉及到的有关分位数:()()()()()()()()()()()()20.950.950.950.9750.9750.9752222220.9750.0250.0250.9750.950.97520.95 1.645,16 1.746,15 1.753,16 2.12,15 2.131,1628.851527.49,16 6.91,15 6.26,1 5.02,1 3.84,27.382 5.99u t t t t χχχχχχχχ=============一、设123,,X X X 是来自总体~(0,3)X N 的样本。

记()2332i 1111,32i i i X X S X X====-∑∑,试确定下列统计量的分布:(1)3113i i X =∑;(2)23119i i X =⎛⎫⎪⎝⎭∑;(3)()23113i i X X=-∑;(4X解:(1)由抽样分布定理,311~(0,1)3i i X X N ==∑(2)因311~(0,1)3i i X N =∑,故223321111~(1)39i i i i X X χ==⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭∑∑(3)由抽样分布定理,()()()2223321131211~(2)3323i i i i S X X X X χ==-=⋅-=-∑∑(4)因()222~(0,1),~23X N S χ,X 与2S独立,故()~2X t 。

二、在某个电视节目的收视率调查中,随机调查了1000人,有633人收看了该节目,试根据调查结果,解答下列问题:(1)用矩估计法给出该节目收视率的估计量;(2)求出该节目收视率的最大似然估计量,并求出估计值;(3)判断该节目收视率的最大似然估计是否是无偏估计;(4)判断该节目收视率的最大似然估计是否是有效估计。

解:总体X 为调查任一人时是否收看,记为~(1,)X B p ,其中p 为收视率(1)因EX p =,而^E X X =,故收视率的矩估计量为^Xp =(2)总体X 的概率分布为()1()1,0,1xxf x p p x -=-=1111()(1)(1)(1)ln ()ln (1)ln(1)ln ()(1)01nniii ii i nx n x x x n X n n Xi L p p p pp p p L p nX p n X p d L p nX n X dp p p==---=∑∑=-=-=-=+---=-=-∏解得收视率p 的最大似然估计量为^Xp =现有一参量为1000的样本121000,,X X X ……,,且10001633ii X==∑则6330.6331000X ==,故收视率的极大似然估计值为0.633.(3)因E X p =,故^X p =是无偏估计(4)因()ln ()(1)1(1)d L p nX n X nX p dp p p p p -=-=---,又E X p=故收视率的最大似然估计X 是p 的有效估计。

重庆大学研究生数理统计课程设计大作业(化学化工类)

重庆大学研究生数理统计课程设计大作业(化学化工类)

β-葡聚糖对乳酸菌生长状况的影响一元线性回归模型分析摘要:在人们生活水平不断提高的今天,由于人们的饮食结构和生活环境的变化,一些营养素缺乏而引起的疾病相对减少,而冠心病,糖尿病等发病率则越来越高。

因此,对于这些疾病的预防和治疗受人们的关注,已成为医药和食品工作者研究的热点。

β-葡聚糖是用独特的工艺开发的一种新的产品,其来源于新鲜的食品啤酒酵母。

它是一种多糖,主要化学结构β-1,3 葡聚糖和β-1,6葡聚糖,其中前者具有抗肿瘤性质,而且能够极大地提高人体自然免疫力。

本文应用紫外-可见分光光度计测定加入不同量的β-葡聚糖标准溶液的吸光度。

在建立β-葡聚糖与吸光度之间的线性方程中,采用一元线性回归分析的分析方法,并建立分析β-葡聚糖对乳酸菌生长状况曲线模型。

关键字:β-葡聚糖吸光度一元线性回归分析生长状况曲线模型一、问题提出,问题分析设置对照实验,在实验“β-葡聚糖对乳酸菌生长状况的影响”中,实验通过设置不同的β-葡聚糖浓度,研究相同浓度不同量对乳酸菌生长的影响。

在实验中,由于加入的β-葡聚糖的量不同,通过测定培养基溶液吸光度不同,反映不同培养基中的乳酸菌的生长状况是不同的,通过各实验组的对照,加入的β-葡聚糖浓度与乳酸菌的生长是有关系的。

实验中β-葡聚糖的浓度为75g/L,加入的量设置依次为:0μL、10μL、30μL、45μL、60μL、75μL。

培养12h后,用752紫外可见分光光度计进行检测,测定结果对应的吸光度-加入量关系表(如表1所示)已知朗伯——比尔定律的数学表达式为A=kn, k为摩尔吸收系数,A为吸光度,n为吸光物质的量。

根据此定律设想铬离子浓度与其吸光度存在线性相关关系。

二、数据描述表2.1 β-葡聚糖加入量与其吸光度(β-葡聚糖浓度:75g/L ,培养时间12h )以上数据来自重庆大学本科生马晶晶在做毕业论文《β-葡聚糖对乳酸菌生长状况的影响》数据,实验数据利用用752紫外可见分光光度计测定,真实可靠。

重庆大学学年(秋)数理统计试题及答案

重庆大学学年(秋)数理统计试题及答案

重庆大学全日制学术型硕士研究生 《数理统计》(A )课程试卷2013-2014学年第一学期(秋)请保留四位小数,部分下侧分位数为:0.95 1.65u =,0.99 2.33u =,20.95(1) 3.841χ=,0.95(3,6)9.78f =一、(18分)设1X ,2X ,…,64X 是来自总体N (0,2σ)的样本,X ,2S 分别是样本均值和样本方差:(1)求参数c 满足{}0.1P X S c >⋅=;(2)求概率22122234{1}X X P X X +>+;(3)求322321(2)i i i D X X X +=⎡⎤+-⎢⎥⎣⎦∑。

(请写出计算过程)解:(1)~(1)t n-{}}0.1P X S c P c ∴>⋅=>=得0.95(63)c t = 故 1.650.20638c ==(2)2~(0,)X N σ22212(/)(/)~(2)X X σσχ∴+ 同理22234(/)(/)~(2)X X σσχ+2222223412122234(/)(/)(/)(/)/~(2,2)22X X X X X X F X X σσσσ+++∴=+ 22122234{1}{(2,2)1}X X P P F X X +>=>+ 且0.50.50.51(2,2)(2,2)1(2,2)F F F =⇒= 得2222121222223434{1}1{1}0.5X X X X P P X X X X ++>=-≤=++ (3)令2~(2,2)i i n i Y X X N μσ+=+,112n i i Y Y X n ===∑ 221()(1)ni Y i T Y Y n S =∴=-=-∑3232223211(2)[()]i i i i i D X X X DT D Y Y +==⎡⎤+-==-⎢⎥⎣⎦∑∑2~(0,2(11/))i Y YN n σ-+~(0,1)YN=3222422421[2(11/)4(11/)((32))256(11/32)i Y D n n D σσχσ=+=+=+∑二、(26分)设1X ,2X ,…,n X 是来自总体2~(2,)(0)X N σσ>的样本,{}0.95P X A <=。

重庆大学硕士研究生数理统计课外大作业

重庆大学硕士研究生数理统计课外大作业

重庆大学硕士研究生“数理统计”课外作业学生:学号:201510****专业:动力工程专业重庆大学动力工程学院二O一五年十二月学号201510******* 姓名**** 学院****学院专业****专业成绩一元线性回归分析在风力发电中的应用摘要:能源短缺和环境恶化日益严重,风能作为一种可再生的清洁能源,越来越受到世界各国的重视,风力发电的装机容量也越来越大。

风力机是风力发电机组重要的组成部分,实现风能向机械能的转化,机械能再通过直流发电机转发为电能,其中直流发电机输出的直流电压和风速紧密相关。

本文以课题研究中测得的实验数据为基础,对风力发电直流电输出和风速的线性相关关系进行计算分析,运用数理统计中一元线性回归分析及假设检验的相关知识,采用EXCEL软件进行辅助计算,最终得到了风力发电的直流电输出和风速的线性关系显著,对以后的课题研究具有一定的借鉴作用。

1 问题提出与分析在能源短缺和环境趋向恶化的今天,风能作为一种可再生的清洁能源,越来越受到世界各国的重视,也越来越多地被应用到风力发电中。

风力机和发电机是风力发电机组中将风能转化为电能的重要装置,它们不仅直接关系到输出电能的质量和效率,也影响着整电量输出和风速的相关性。

风力机是风力发电机组重要的组成部分,其实现了风动能到风轮机轴机械能的转化,机械能通过直流电动机转发为电能,其中直流电动机产生的直流电压和风力紧密相关。

风力发电的设计和评价和电量输出与风速的关系密不可分,其中对于数学知识要求很高。

本文以课题研究中实验测得的数据为基础,对风力发电直流电输出和风速是否存在线性关系进行分析,运用数理统计中一元线性回归及非参数检验的相关知识,结合EXCEL软件进行辅助计算分析,最终得到了风力发电的直流电输出和风速关系,为以后科研工作和风力发电的应用具有指导意义。

综上所述,对风力发电的直流电输出和风速的研究,具有理论与实践的重要意义。

2 数据描述本文以风力发电的直流输出和风速的关系为研究对象,采用实验中观察得出的直流电输出和风速的部分数值进行计算分析,风力发电的直流电输出y(单位:MW)和风速x(单位:nmile/h)的数据如表1所示。

最新概率论与数理统计模拟题 重庆大学

最新概率论与数理统计模拟题 重庆大学

一.填空题1.设,2.0)(,4.0)(,3.0)(===B A P B P A P 则=)(B A P ,B A ,中至少一个不发生的概率为2.设在一个学生宿舍某房间内住有6个同学,恰有4个同学生日是星期天的概率为3.设随机变量X 在区间[2,5]上服从均匀分布,对X 进行三次独立的观测中,刚好有两次的观测值大于3的概率为4.设X 分布如下:则关于λ的一元二次方程02=-+X X λλ有实根的概率为5.设随机变量X ~)10,0(2N ,则}{=>6.19X P 6.设随机变量X ~)001.0,5000(B ,根据泊松定理,则{}≈=2X P 7.设随机变量Y X ,独立并且具有相同分布)4.0,1(B ,则),max(Y X Z =的分布律为8.设随机变量X ~⎪⎩⎪⎨⎧<-≤≤>=-0,120,02,1],3,1[X X X Y U ,则=EY9.设)5.0;9,0;4,1(~),(N Y X ,则____~332-+Y X10.设621,,,X X X 是来自正态总体),0(2σN 的一个样本,则~)(2625242321X X X X X X Y ++++=11.设21,X X 为来自正态总体),(2σμN 的一个样本,若2120081X cX +是参数μ的一个无偏估计量,则____=c 12.设正态总体~X ),(2σμN ,若2σ已知,n X X X ,,,21 为样本,X 为样本均值,μ的置信度为α-1的置信区间为),n X n X σλσλ+-(,那么____=λ13.设投篮比赛中,甲,乙两人每次投中的概率分别为0.6和0.75,那么甲,乙两人各独立地投1次,恰有1人投中的概率是14.已知一批产品的次品率为4%,而非次品中有75%的优等品。

从这批产品中任取一件产品,则取到优等品的概率为15.已知测量某一距离时的随机误差X (单位:cm )的密度函数为R x e x f x ∈=--,2401)(3200)20(2π,则误差的绝对值不超过30cm 的概率为._____]1600)20([____,~4020___2=--X D X , 16.已知连续型随机变量X 的密度函数为⎩⎨⎧≤-=其它,01,1)(x x x f ,则X 的分布函数__________)(=x F ,概率.______}10{=<<X P 17.利用概率知识计算∑+∞=-=+04._______!4)1(k ke k k 18.设随机变量)5.0,1(~],6,0[~ΓY U X ,则._______)2,2cov(=+-Y X Y X 19.设4321,,,X X X X 为总体)1,0(N 的样本,则.______)255.19(232221=>+X X X P 20.设一批零件的长度(cm )服从正态分布)5.1,(2μN 。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

研究生课程考核试卷(适用于课程论文、提交报告)科目:数理统计教师:刘琼荪姓名: xxx 学号: 20150702xxx 专业:机械工程类别:学术上课时间: 2016 年 3 月至 2016 年 4 月考生成绩:卷面成绩平时成绩课程综合成绩阅卷评语:阅卷教师 (签名)我国上世纪70-90年代民航客运量回归分析摘要:中国民航从上实际50年代发展至今已有60多年的历史,这期间中国民航经历了曲折的发展。

随着改革开发以来,中国人民的生活水平日渐提高,出行坐乘飞机逐渐人们可选的交通方式。

我国民航客运量逐年提高,为了研究其历史变化趋势及其成因,现以民航客运量作为因变量y,假设以国民收入x1、消费额x2、铁路客运量x3、民航航线里程x4、来华旅游入境人数x5为影响民航客运量的主要因素。

利用SPSS和excel软件通过建立回归模型分析我国民航客运量主要受到其中哪些因素的影响,并就回归模型分析具体可能的成因。

关键词:民航客运量影响因素回归模型一、问题提出及问题分析2004年,民航行业完成运输总周转量230亿吨公里、旅客运输量1.2亿人、货邮运输量273万吨、通用航空作业7.7万小时。

截止2004年底,我国定期航班航线达到1200条,其中国内航线(包括香港、澳门航线)975条,国际航线225条,境内民航定期航班通航机场133个(不含香港、澳门),形成了以北京、上海、广州机场为中心,以省会、旅游城市机场为枢纽,其它城市机场为支干,联结国内127个城市,联结38个国家80个城市的航空运输网络。

民航机队规模不断扩大,截止至2004年底,中国民航拥有运输飞机754架,其中大中型飞机680架,均为世界上最先进的飞机。

2004年中国民航运输总周转量达到230亿吨公里(不包括香港、澳门特别行政区以及台湾省),在国际民航组织188个缔约国中名列第3位。

从上述事实可以看出我国民航的发展所取得的成果显著。

当前我国民航客运量相当巨大,而影响我国航运客运量的因素有很多,例如第三产业增加值(亿元),城市居民消费水平(绝对元),定期航班航线里程(万千里)等[1]。

为了研究过去的情况,从中国统计年鉴[2]得到1994年统计摘要,分析类似因素对我国航空客运量的影响。

二、数据描述如下为所得统计数据:表1 1978-1993年统计数据三、模型建立:(1)提出假设条件,明确概念,引进参数;参考相关书籍[3],设随机变量民航客运量为Y (万人),解释变量1X ,2X ,3X ,4X ,5X 分别为国民收入(亿元),消费额(亿元),铁路客运量(万人),民航航线里程(万公里),来华旅游入境人数(万人),且回归函数11225501155(|,,,)E Y X x X x X x x x βββ==⋅⋅⋅==++⋅⋅⋅+,称201155,0,Y x x E D DY βββεεεσ=++⋅⋅⋅++===,为多元线性回归模型,015,,,βββ⋅⋅⋅为回归系数,ε为随机误差。

125(,,,,),1,2,,5i i i i x x x y i ⋅⋅⋅=⋅⋅⋅为上述来自多元线性回归模型的样本值,满足:201155125,0,,1,2,,5,,,,i i i i i i y x x E D i βββεεεσεεε⎧=++⋅⋅⋅++===⋅⋅⋅⎨⋅⋅⋅⎩相互独立为了便于对模型进行参数估计、模型检验、变量选择等,有必要对模型作如下一些基本假定。

1. 解释变量1X ,2X ,3X ,4X ,5X 是可控制的、非随机变量,互不相关。

2. 随机误差项具有零均值和同方差的性质,即2,1,2,,5i D i εσ==⋅⋅⋅,并且125,,,εεε⋅⋅⋅相互独立,则有(),0,,,1,2,5i j Cov i j i j =≠=…,εε。

3. 随机变量误差项服从正态分布,即()2~0,,1,2,5i N i =…εσ (2)模型构建:由表1通过EXCEL 绘制变量,1,2,,5i X i =⋅⋅⋅对因变量Y 的关系散点图如下:图1 民航客运量与国民收入关系图图2 民航客运量与消费额关系图图3 民航客运量与铁路客运量关系图图4 民航客运量与民航航线里程关系图图5 民航客运量与来华旅游入境人数关系图由以上的散点图看出:y 与3x 存在非线性关系,但与其它几个变量基本是线性相关的。

所以首先考虑回归模型为多元线性模型。

四、模型求解。

采用最小二乘估计法求解模型参数,采用SPSS 软件计算,得到如下结果:表2 拟合过程小结RR 平方调整后的 R 平方标准估算的错误Durbin-Watson(U)1.999a.998.99749.492401.993模型摘要b模型a. 预测变量:(常量),x5, x3, x4, x2, x1b. 因变量:y表3 方差分析平方和自由度均方F显著性回归13818876.76952763775.3541128.303.000b残差24494.981102449.498总计13843371.75015b. 预测变量:(常量),x5, x3, x4, x2, x1ANOVA a模型1a. 因变量:y表4 回归过程统计量标准系数B标准错误贝塔容许VIF (常量)450.909178.078 2.532.030x2-.561.125-2.485-4.478.001.0011740.508x1.354.085 2.447 4.152.002.0011963.337x3-.007.002-.083-3.510.006.315 3.171x421.578 4.030.531 5.354.000.01855.488x5.435.052.5648.440.000.04025.1931a. 因变量:y系数a模型非标准化系数t显著性共线性统计图6 残差图则回归方程为12345450.9090.3540.5610.00721.5780.435y x x x x x=+--++五、模型分析检验(1)决定系数由决定系数2R=0.998看出回归方程高度显著。

(2)方差分析表123451128.303=0.000,,,yF P x x x x x=,值,这说明,整体上对有高度显著的影响。

(3)回归系数的显著性检验(t检验):回归系数的显著性检验由显著性一列看出自变量的回归系数都通过了t 检验(即收尾概率小于规定的显著性水平0.05),说明5个自变量对y 的影响显著。

其中3x 铁路客运量的显著性为0.006最大,但仍小于5%。

(4)检验残差序列的自相关性(D-W 检验):D-W=1.993≈2,所以认为模型不存在序列的自相关性。

(6)异方差检验从残差图看出所有点落在±2之间,没有明显变化趋势,所以认为()2~0,,1,2,5i N i =…εσ综上,认为用最小二乘估计的方法估计的模型理论上是有效的。

(7) 模型进一步分析虽然,模型通过了检验,但是由之前的图可知2x 与y 正相关,但2x (国民消费额)的回归系数是负值,显然是矛盾的,同时1x 和2x 的VIF 很大,4x ,5x 的VIF 也大于10,其原因是自变量之间的共线性,因而回归模型还要就共线性问题进行谈论。

如下表是各变量之间的相关系数:表5 相关系数表可以看出, y 与1x ,2x ,4x ,5x 的相关系数都在0.9以上,说明所选自变量与y 高度线性相关,验证之前的散点图。

用y 与自变量作多元线性回归是适合的。

另一方面,3x 与各变量的相关系数均小于0.5,而1x ,2x ,4x ,5x 之间的相关系数均达到0.9以上,所以应尝试解决它们之间的共线性。

首先剔除VIF 最大的1x ,计算剩余变量参与的回归方程。

结果如下:表6 统计量表可以看出,当前2x 的VIF 最大,同时2x 也没通过t 检验,其显著性0.233远大于0.05,故继续剔除2x 。

计算剩余参数的回归方程,结果如下:表7 统计量表表8 拟合过程小结表9 方差分析表平方和df均方FSig.回归13766977.58134588992.527720.839.000残差76394.169126366.181总计13843371.75015Anovab模型1可以看出三个变量的VIF 均小于10,且均通过了t 检验。

说明此回归模型不存在强多重共线性,回归系数也有合理的经济解释。

20.994R 说明回归方程高度显著,方差分析的结果也说明回归方程显著性高。

图7 残差直方图图8 残差正态P-P 图由P-P 图和直方图可知残差服从正态分布,所以模型是有效的[4]。

所以民航客运量的回归模型为:345591.8760.0126.4360.317y x x x =-++。

六、岭回归模型除了上述方法,在处理自变量之间存在强线性相关的情况时,可以采用岭回归进行估计(虽然牺牲了一定的无偏性)[5]。

采用SPSS 编写程序运行可得到如下岭回归结果。

表10 K值表R-SQUARE AND BETA COEFFICIENTS FOR ESTIMATED VALUES OF KK RSQ x1 x2 x3 x4 x5______ ______ ________ ________ ________ ________ ________.00000 .99823 2.447386 -2.48510 -.083140 .530538 .563537.02000 .99233 .187301 .092804 -.095611 .457966 .300920.04000 .99085 .215764 .162616 -.086464 .389117 .260362.06000 .98998 .228824 .190661 -.081056 .356915 .243273.08000 .98932 .235679 .205373 -.076926 .337619 .233855.10000 .98873 .239543 .214116 -.073407 .324407 .227824.12000 .98816 .241760 .219676 -.070252 .314569 .223561.14000 .98759 .242981 .223345 -.067345 .306809 .220327.16000 .98699 .243559 .225800 -.064628 .300426 .217741.18000 .98636 .243702 .227435 -.062066 .295009 .215585.20000 .98571 .243539 .228490 -.059635 .290298 .213730图9 岭迹图由上述结果,可知RSQ均大于0.98,取K=0.85,再进行岭回归,得岭回归模型:表11 岭回归统计表可以看出除了3x 的回归系数为负,其余均为正,同时各变量的显著性检验均通过。

相关文档
最新文档