应用数理统计孙荣恒_科学出版社_习题答案
应用数理统计复习题及答案()
应用数理统计复习题(2010)一 填空题 1设621,,,X X X 是总体)1,0(~N X 的一个样本,26542321)()(X X X X X X Y +++++=。
当常数C = 1/3 时,CY 服从2χ分布。
2 设统计量)(~n t X ,则~2X F(1,n) ,~12XF(n,1) 。
3 设n X X X ,,,21 是总体),(~2σu N X 的一个样本,当常数C = 1/2(n-1) 时,∑-=+-=11212)(n i i i X X C S 为2σ的无偏估计。
4 设)),0(~(2σεεβαN x y ++=,),,2,1)(,(n i y x i i =为观测数据。
对于固定的0x ,则0x βα+~ ()20201,x x N x n Lxx αβσ⎛⎫⎡⎤- ⎪⎢⎥++ ⎪⎢⎥ ⎪⎢⎥⎣⎦⎝⎭。
5.设总体X 服从参数为λ的泊松分布,1.9,2,2,2.1, 2.5为样本,则λ的矩估计值为ˆλ= 2.1 。
6.设总体212~(,),,,...,n X N X X X μσ为样本,μ、σ2 未知,则σ2的置信度为1-α的置信区间为 ()()()()222212211,11n Sn S n n ααχχ-⎡⎤--⎢⎥⎢⎥--⎢⎥⎣⎦。
7.设X 服从二维正态),(2∑μN 分布,其中⎪⎪⎭⎫⎝⎛=∑⎪⎪⎭⎫⎝⎛=8221,10μ令Y =X Y Y ⎪⎪⎭⎫ ⎝⎛=⎪⎪⎭⎫⎝⎛202121,则Y 的分布为 ()12,02TN A A A A μ⎛⎫= ⎪⎝⎭∑ 。
8.某试验的极差分析结果如下表(设指标越大越好):表1 因素水平表表2 极差分析数据表则(1)较好工艺条件应为22121A B C D E 。
(2)方差分析中总离差平方和的自由度为 7 。
(3)上表中的第三列表示 A B ⨯交互作用 。
9.为了估计山上积雪溶化后对河流下游灌溉的影响,在山上建立观测站,测得连续10年的观测数据如下表(见表3)。
《应用数理统计》第五章方差分析课后作业参考答案
第五章 方差分析课后习题参考答案5.1 下面给出了小白鼠在接种三种不同菌型伤寒杆菌后的存活日数:设小白鼠存活日数服从方差相等的正态分布,试问三种菌型的平均存活日数有无显著差异?(01.0=α)解:(1)手工计算解答过程 提出原假设:()3,2,10:0==i H i μ记167.2081211112=⎪⎪⎭⎫ ⎝⎛-=∑∑∑∑====r i n j ij ri n j ij T i iX n X S467.7011211211=⎪⎪⎭⎫ ⎝⎛-⎪⎪⎭⎫ ⎝⎛=∑∑∑∑====r i n j ij ri n j ij iA ii X n X n S7.137=-=A T e S S S当H成立时,()()()r n r F r n S r S F e A ----=,1~/1/本题中r=3经过计算,得方差分析表如下:查表得()()35.327,2,195.01==---F r n r F α且F=6.909>3.35,在95%的置信度下,拒绝原假设,认为不同菌型伤寒杆菌对小白鼠的存活日数有显著影响。
(2)软件计算解答过程组建效应检验Dependent Var iable: 存活日数a70.429235.215 6.903.004137.73727 5.101208.16729方差来源菌型误差总和平方和自由度均值F 值P 值R Squared = .338 (Adjusted R Squared = .289)a.从上表可以看出,菌种不同这个因素的检验统计量F 的观测值为6.903,对应的检验概率p 值为0.004,小于0.05,拒绝原假设,认为菌种之间的差异对小白鼠存活日数有显著影响。
5.2 现有某种型号的电池三批,他们分别是甲、乙、丙三个工厂生产的,为评论其质量,各随机抽取6只电池进行寿命试验,数据如下表所示:工厂 寿命(小时) 甲 40 48 38 42 45 乙 26 34 30 28 32 丙39 40 43 50 50试在显著水平0.05α=下,检验电池的平均寿命有无显著性差异?并求121323,μμμμμμ---及的95%置信区间。
应用数理统计课后习题参考答案
习题五1 某钢厂检查一月上旬内的五天中生产的钢锭重量,结果如下:(单位:k g)日期重旦量1 5500 5800 5740 57102 5440 5680 5240 56004 5400 5410 5430 54009 5640 5700 5660 570010 5610 5700 5610 5400试检验不同日期生产的钢锭的平均重量有无显著差异? ( =0.05)解根据问题,因素A表示日期,试验指标为钢锭重量,水平为 5.2假设样本观测值y j(j 123,4)来源于正态总体Y~N(i, ),i 1,2,...,5检验的问题:H。
:i 2 L 5, H i : i不全相等.计算结果:注释当=0.001表示非常显著,标记为*** '类似地,=0.01,0.05,分别标记为查表F0.95(4,15) 3.06,因为F 3.9496 F0.95(4,15),或p = 0.02199<0.05 ,所以拒绝H。
,认为不同日期生产的钢锭的平均重量有显著差异2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验解根据问题,设因素A表示催化剂,试验指标为化工产品的得率,水平为 4 .2假设样本观测值y j(j 1,2,..., nJ来源于正态总体Y~N(i, ), i 1,2,...,5 .其中样本容量不等,n分别取值为6,5,3,4 .日产量操作工查表 F O .95(3,14) 3.34,因为 F 2.4264 F °.95(3,14),或 p = 0.1089 > 0.05, 所以接受H 。
,认为在四种不同催化剂下平均得率无显著差异3试验某种钢的冲击值(kg Xm/cm2 ),影响该指标的因素有两个,一是含铜量 A ,另一个是温度试检验含铜量和试验温度是否会对钢的冲击值产生显著差异? ( =0.05 )解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用设因素A,B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为 12.2假设样本观测值y j (i 1,2,3, j 1,2,3,4)来源于正态总体 Y j ~N (j ,),i 1,2,3,j 1,2,3,4 .记i 为对应于A 的主效应;记 j 为对应于B j 的主效应;检验的问题:(1) H i 。
指数分布族的一致最优检验及样本容量的确定
指数分布族的一致最优检验及样本容量的确定赵丽棉;黄基廷【摘要】论述了指数分布族的一致最优检验是存在的,并给出一致最优检验及样本容量确定的方法步骤,求出了常见分布的一致最优检验.【期刊名称】《河池学院学报》【年(卷),期】2014(034)002【总页数】6页(P42-47)【关键词】指数分布族;检验函数;功效函数;一致最优检验【作者】赵丽棉;黄基廷【作者单位】河池学院数学与统计学院,广西宜州546300;河池学院数学与统计学院,广西宜州546300【正文语种】中文【中图分类】O212.10 引言设X=(X1,…,Xn)是从总体{Fθ(x),θ∈Θ}中抽取的简单样本,其中Θ为参数空间,检验问题为H0∶θ∈Θ0↔H1∶θ∈Θ1=Θ-Θ0.我们通过一个统计量在一个子样中的观察值来检验H0,则当观察到点X属于拒绝域 W 时,拒绝假设H0,否则接受H0,称称为非随机化检验。
在实际问题中,有些检验函数φ(x)除了0,1外还能取(0,1)内的值,如设X=(X1,…,Xn)是从一大批产品中抽得的样本,记G(X)为其中的次品数,当G(X)<c时认为这批产品合格;当G(X)>c时认为不合格;而当G(X)=c时可以定下(0,1)内的一个数r,作一次成功概率为r的随机试验,根据试验结果来决定这批产品是否合格,这种检验称为随机化检验。
由于子样观察值的出现带有随机性,因此判断会发生两种错误:第一,假设H0本来是对的,但由于观察值落入拒绝域W,错误地将H0否定了,这时犯的错误称为第一类错误;第二,假设H0本来是不对的,但由于观察值落入接受域,错误地将H0接受了,这时犯的错误称为第二类错误。
一个好的检验当然是使犯两种错误的概率尽可能小,最好全为零,但实际上这是不可能的,通常只能通过限制第一类错误的概率使第二类错误的概率达到最小。
用βφ(θ)=Pθ{用检验φ否定了H0}=Eθ[φ(X)](θ∈Θ)表示φ(x)的功效函数,则当θ∈Θ0时,βφ(θ)是犯第一类错误的概率;θ∈Θ1时,1 -βφ(θ)是犯第二类错误的概率。
(025200)专业学位研究生培养方案 - 上海师范大学数理学院
应用统计硕士(025200)专业学位研究生培养方案Master of Applied Statistics(简称MAS)一、培养目标和要求上海师范大学应用统计硕士专业学位旨在培养具备良好的职业道德和很强的社会责任心,拥有厚实的统计学理论基础与基本的金融投资业务知识,系统掌握数据收集、处理、分析与挖掘的知识与技能,擅长货币金融统计与计量分析,能够熟练运用现代统计方法和计算机软件处理分析各类数据并解决实际问题,能够在国家机关、金融投资类企事业单位、社会组织及科研教学部门从事统计调查、数据分析、决策支持和信息系统管理等工作的具有国际化视野的高层次统计应用专门人才。
二、学习年限采用全日制学习方式,学习年限为2年。
三、研究方向1、金融统计2、试验设计与分析3、面板(纵向)数据分析4、可靠性统计与生存分析四、课程设置与学分(一)必修课程(不少于28学分)1.学位公共课(不少于4学分)第一外国语(2学分)自然辩证法(2学分)2.学位基础课(不少于12学分)应用数理统计(Theory of Mathematical Statistics)3学分应用回归分析(Applied Regression Analysis)3学分常用统计方法(Applied Statistical Methods)3学分金融计量经济学(Financial Econometrics)3学分3.学位专业基础课(不少于12学分)金融时间序列分析(Analysis of Financial Time Series)3学分应用统计案例分析(案例分析)(Case Study of Applied Statistics)3学分统计分析与软件应用(Statistical Analysis and Software Applications)3学分金融数据挖掘(Financial Data Mining)3学分(二)选修课程(不少于10学分)可靠性统计(Statistics for Reliability)3学分现代试验设计与分析(Modern Experimental Design and Analysis)3学分空间统计与计量(Spatial Statistics and Econometrics)2学分货币金融统计学(Monetary and Financial Statistics)2学分高级投资组合与管理(Advanced Portfolio and Management)2学分中级金融风险管理(Intermediate Financial Risk Measurement)3学分金融计算与建模(Financial Computing and Modeling)2学分MA TLAB编程与量化分析(MA TLAB Program and Quantitative Analysis)3学分高维面板数据分析(High Dimensional Panel Data Analysis)3学分统计降维方法(Statistical Dimension Reduction Method)3学分Python数据分析(Python Data Analysis)3学分案例实务讲座(Lecture on case practice)3学分(三)专业实践(不少于5学分)本专业的实践环节包括实验教学、专家讲座、专业实习三个内容。
茆诗松数理统计学答案
茆诗松数理统计学答案【篇一:数理统计】txt>mathematical statistics课程代码:课程性质:专业基础理论课适用专业:统计开课学期:4总学时数: 56总学分数:3.5编写年月: 2007.5 修订年月:2007.7执笔:邱红兵一、课程的性质和目的?本课程以概率论为基础开设本课程的目的在于通过教与学,使学生掌握数理统计的基本思想、基本理论和一般方法,具有一定的解决随机现象的实际问题的能力,并为学习后续课程奠定必要的基础。
是对随机现象统计规律性归纳的研究,主要对随机现象统计资料进行收集、整理和推断分析。
本课程是数学类专业本科生的专业基础课。
本课程以概率论为基础,研究如何用有效的方式收集、整理和分析受到随机性影响的数据,从而为随机现象选择和检验数学模型,并在此基础上对随机现象的性质、特点和统计规律作出推断和预测,进而为决策提供依据和建议。
通过本课程的教学,使学生初步掌握处理随机现象的基本理论和方法,并能应用其解决一些简单实际问题。
包括如何进行参数估计,如何进行统计假设检验,如何研究变量之间的关系等。
培养学生运用概率统计方法分析问题和解决实际问题的能力,使学生初步建立统计思维方式。
同时为学习有关的后继课程打好必要的基础。
二、课程教学内容及学时分配统计推断两个基本问题:参数估计,假设检验;简单随机样本的分布;经验分布;样本的原点矩和中心矩,特别是样本均值、样本方差。
第一章抽样分布(12学时)本章内容:数理统计的基本概念:总体、样本、抽样、简单随机样本、统计量;顺序统计量;经验分布函数;几个重要分布:?分布,?分布,t分布和f分布;多元正态分布与正态二次型;抽样分布;分位数。
本章要求:1、理解总体、样本、抽样、简单随机样本、统计量的概念;2、理解顺序统计量及经验分布函数的概念;3、掌握?分布,t分布和f分布的定义,以及三种分布的性质; 224、掌握多元正态分布与正态二次型的定义及其性质;5、熟练抽样分布定理。
新版南京大学应用统计专硕考研真题考研经验考研参考书
经过一年的努力奋斗终于如愿以偿考到自己期望的学校,在这一年的时间内,我秉持着天将降大任于斯人也必先苦其心志劳其筋骨饿其体肤空乏其身的信念终于熬过了这段难熬却充满期待和自我怀疑的岁月。
可谓是痛并快乐着。
在这期间,我不止一次地怀疑自己有没有可能成功上岸,这样的想法,充斥在我的头脑中太多次,明知不可想这么多,但在休息时,思想放空的时候就会凭空冒出来,难以抵挡。
这对自己的心绪实在是太大的干扰,所以在此想跟大家讲,调整好心态,无论成功与否,付出自己全部的努力,到最后,总不会有那种没有努力过而与成功失之交臂的遗憾。
总之就是,付出过,就不会后悔。
在此,我终于可以将我这一年来的所有欣喜,汗水,期待,惶惑,不安全部写出来,一来是对这一重要的人生转折做一个回顾和告别,再有就是,希望我的这些经验,可以给大家以借鉴的作用。
无论是心态方面,考研选择方面,还是备考复习方面。
都希望可以跟大家做一个深入交流,否则这一年来的各种辛酸苦辣真是难吐难吞。
由于心情略微激动了些,所以开篇部分可能略显鸡汤,不过,认真负责的告诉大家,下面的内容将是满满的干货。
只是由于篇幅过长还望大家可以充满耐心的把它看完。
文章结尾会附赠我的学习资料供各位下载使用。
南京大学应用统计的初试科目为:(101)思想政治理论(204)英语二(303)数学三和(432)统计学。
参考书目为:1.《统计学》,贾俊平等,中国人民大学出版社。
2.《概率论与数理统计》,盛骤等编,高等教育出版社。
3.《概率论基础》李贤平编,高等教育出版社。
4.《应用数理统计》孙荣恒编,科学出版社。
5.《应用多元统计分析》高惠璇编,北大出版社。
先介绍一下英语现在就可以开始背单词了,识记为主(看着单词能想到其中文章即可,不需要能拼写)从前期复习到考试前每天坚持两到四篇阅读(至少也得一篇)11月到考试前一天背20篇英语范文(能默写的程度)。
那些我不熟悉的单词就整理到单词卡上,这个方法也是我跟网上经验贴学的,共整理了两本,每本50页左右,正面写英语单词,背面写汉语意思。
应用统计学课后习题与参考答案
应用统计学课后习题与参考答案应用统计学课后习题与参考答案应用统计学课后习题与参考答案第一章一、选择题1.一个统计总体(D)。
A.只能有一个标志B.只能有一个指标C.可以有多个标志D.可以有多个指标2.对100名职工的工资收入情况进行调查,则总体单位是(D)。
A.100名职工B.100名职工的工资总额C.每一名职工D.每一名职工的工资3.某班学生统计学考试成绩分别为65分、72分、81分和87分,这4个数字是(D)。
A.指标B.标志C.变量D.标志值4.下列属于品质标志的是(B)。
A.工人年龄B.工人性别C.工人体重D.工人工资5.某工业企业的职工数、商品销售额是(C)。
A.连续变量B.离散变量C.前者是离散变量,后者是连续变量D.前者是连续变量,后者是离散变量6.下面指标中,属于质量指标的是(C)。
A.全国人口数B.国内生产总值C.劳动生产率D.工人工资7.以下指标中属于质量指标的是(C)。
A.播种面积B.销售量C.单位成本D.产量8.下列各项中属于数量指标的是(B)。
A.劳动生产率B.产量C.人口密度D.资金利税率二、简答题1.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?总体是“所有的网上购物者”。
(2)“消费者在网上购物的原因”是定类变量、定序变量还是数值型变量?分类变量。
(3)研究者所关心的参数是什么?所有的网上购物者的月平均花费。
(4)“消费者每月在网上购物的平均花费是200元”是参数还是统计量?统计量。
(5)研究者所使用的主要是描述统计方法还是推断统计方法?推断统计方法。
2.要调查某商场销售的全部冰箱情况,试指出总体、个体是什么?试举若干品质标志、数量标志、数量指标和质量指标。
总体:该商店销售的所有冰箱。
总体单位:该商店销售的每一台冰箱。
品质标志:型号、产地、颜色。
数量标志:容量、外形尺寸;数量指标:销售量、销售额。
应用数理统计课后习题参考答案
习题五1试检验不同日期生产的钢锭的平均重量有无显著差异?(α=0.05) 解 根据问题,因素A 表示日期,试验指标为钢锭重量,水平为5.假设样本观测值(1,2,3,4)ij y j =来源于正态总体2~(,),1,2,...,5i i Y N i μσ= .检验的问题:01251:,:i H H μμμμ===L 不全相等 .计算结果:表5.1 单因素方差分析表注释: 当=0.001表示非常显著,标记为 ‘***’,类似地,= 0.01,0.05,分别标记为 ‘**’ ,‘*’ .查表0.95(4,15) 3.06F =,因为0.953.9496(4,15)F F =>,或p = 0.02199<0.05, 所以拒绝0H ,认为不同日期生产的钢锭的平均重量有显著差异.2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 试检验在四种不同催化剂下平均得率有无显著差异?(α=0.05)解根据问题,设因素A 表示催化剂,试验指标为化工产品的得率,水平为4 .假设样本观测值(1,2,...,)ij i y j n =来源于正态总体2~(,),1,2,...,5i i Y N i μσ= .其中样本容量不等,i n 分别取值为6,5,3,4 .检验的问题:012341:,:i H H μμμμμ===不全相等 .计算结果:表5.2 单因素方差分析表查表0.95(3,14) 3.34F =,因为0.952.4264(3,14)F F =<,或p = 0.1089 > 0.05,所以接受0H ,认为在四种不同催化剂下平均得率无显著差异 .3 试验某种钢的冲击值(kg ×m/cm2),影响该指标的因素有两个,一是含铜量A ,另试检验含铜量和试验温度是否会对钢的冲击值产生显著差异?(α=0.05) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用.设因素,A B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为12.假设样本观测值(1,2,3,1,2,3,4)ij yi j ==来源于正态总体2~(,),1,2,3,ij ij Y N i μσ=1,2,3,4j = .记i α⋅为对应于i A 的主效应;记j β⋅为对应于j B 的主效应;检验的问题:(1)10:i H α⋅全部等于零,11:i H α⋅不全等于零;(2)20:j H β⋅全部等于零,21:j H β⋅不全等于零; 计算结果:表5.3 双因素无重复试验的方差分析表查表0.95(2,6) 5.143F =,0.95(3,6) 4.757F =,显然计算值,A B F F 分别大于查表值,或p = 0.0005,0.0009 均显著小于0.05,所以拒绝1020,H H ,认为含铜量和试验温度都会对钢的冲击值产生显著影响作用.设每个工人在每台机器上的日产量都服从正态分布且方差相同 .试检验:(α=0.05)1) 操作工之间的差异是否显著? 2) 机器之间的差异是否显著?3) 它们的交互作用是否显著?解 根据问题,这是一个双因素等重复(3次)试验的问题,要考虑交互作用.设因素,A B 分别表示为机器和操作,试验指标为日产量,水平为12. 假设样本观测值(1,2,3,1,2,3,4)ijk y i j ==来源于正态总体2~(,),1,2,3,ij ij Y N i μσ= 1,2,3,4j =,1,2,3k = .记i α⋅为对应于i A 的主效应;记j β⋅为对应于j B 的主效应;记ij γ为对应于交互作用A B ⨯的主效应; 检验的问题:(1)10:i H α⋅全部等于零,11:i H α⋅不全等于零; (2)20:j H β⋅全部等于零,21:j H β⋅不全等于零; (3)30:ij H γ全部等于零,31:ij H γ不全等于零;计算结果:表5.4 双因素无重复试验的方差分析表查表0.95(3,24) 3.01F =,0.95(2,24) 3.4F =,0.95(6,24) 2.51F =,计算值 3.01,A F <3.4, 2.51B A B F F ⨯>>,或0.05A p >>,而,B A B p p ⨯均显著小于0.05,所以拒绝2030,H H ,接受10H ,认为操作工之间的差异显著,机器之间的差异不显著,它们之间的交互作用显著 . 5 某轴承厂为了提高轴承圈退火的质量,制定因素水平分级如下表所示因素 上升温度℃ 保温时间(h)出炉温度℃水平1 800 6 400 水平28208500试填好正交试验结果分析表并对试验结果进行直观分析和方差分析 .解 根据题意,这是一个3因素2水平的试验问题 .试验指标为硬度的合格率 .应选择正交表44(2)L 来安排试验,随机生成正交试验表如下:方差来源 自由度 平方和 均方 F 值 P 值 因素A 因素B 相互效应A ×B误差 总和3 2 6 24 352.750 27.167 73.5 41.333 144.750.917 13.583 12.250 1.7220.5323 7.8871 7.11290.6645 0.00233** 0.00192**由此可见第三号试验条件为:上升温度800℃、保温时间6h 、出炉温度500℃ . 直观分析需要计算K 值,计算结果如下:直观分析 由计算的K 值知,因素A 、B 、C 的极差分别为70,40,40,因此主次关系为A B C >=,B ,C 相当 .由于试验指标为硬度的合格率,应该是越大越好,所以各确定因素的水平分别是121,,A B C ,即最佳的水平组合是121A B C ,即最佳搭配为:上升温度800℃、保温时间8h 、出炉温度400℃.采用方差分析法,计算得下表:表5.7 方差分析表方差来源平方和 自由度 均方差 F 值 A 1225 1 1225 1 B 400 1 400 0.33 C 400 1 400 0.33 误差 1225 1 1225 总和32504如果显著性检验水平取0.1α=,则查表得0.9(1,1)39.9F =,显然计算的F 值1,0.33A B C F F F ===均小于查表值,所以认为三个因素对结果影响都显著 .6问应选用哪张正交表安排试验,并写出第8号试验的条件;如果9组试验结果为(单位:kg/100m 2):62.925,57.075,51.6,55.05,58.05,56.55,63.225,50.7,54.45,试对该正交试验结果进行直观分析和方差分析.解 该问题属于3因素3水平的试验问题,试验指标为水稻产量 .根据题意应选择正交表49(3)L 来安排试验,随机生成正交表如下:由表可知,第8号试验的条件:品种(A 3)珍珠矮11号,插值密度(B 2)3.75棵/100m 2,施肥量(C 1)0.75kg/100m 2纯氨; 直观分析需要计算K 值,计算结果如下:同上题进行直观分析,得出K 值的大小关系为:111312212223333132,,K K K K K K K K K >>>>>>由直观分析看出:本例较好的水平搭配是:113A B C 采用方差分析法,计算得下表:表5.10 方差分析表方差来源平方和自由度 均方差F 值A 1.759 2 0.879 0.0223B 65.861 2 32.931 0.8361C 6.660 2 3.330 0.0845 误差78.776 239.388 39.3880.9(2,2)9F =,所以认为三个因素对结果影响都不显著.7 在阿魏酸的合成工艺考察中,为了提高产量,选取了原料配比A ,吡啶量B 和反应时间C 三个因素,它们各取了7个水平如下:原料配比A :1.0,1.4,1.8,2.2,2.6,3.0,3.4 吡啶量B :10,13,16,19,22,25,28 反应时间C :0.5,1.0,1.5,2.0,2.5,3.0,3.5试选用合适的均匀设计表安排试验,并写出第7号试验的条件;如果7组试验的结果(收率)为:0.33,0.336,0.294,0.476,0.209,0.451,0.482,试对该均匀试验结果进行直观分析并通过回归分析发现可能更好的工艺条件.解 根据题意选择均匀设计表47(7)U 来安排试验,有3个因素,根据使用表,实验安排如:表5.11 试验安排表6 6 5 4 0.4517 7 7 7 0.482 所以第7号实验的条件为:原配料比3.4,吡啶量28ml,反应时间3.5h.通过直观分析,最好的实验条件是:原配料比3.4,吡啶量28ml,反应时间3.5h. 通过回归分析,最合适的实验条件是:原配料比2.6,吡啶量16ml,反应时间0.5h.习题六1 从某中学高二女生中随机选取8名,测得其升高、体重如下:1 2 3 4 5 6 78身高(cm)160 159 160 157 169 162 165 154体重(kg)49 46 53 41 49 50 48 43在绝对距离下,试用最短距离法和离差平方和法对其进行聚类分析.解由R软件,用最短距离(左)和差离平方和法(右)对题目进行聚类分析如下图6.1,表6.1和表6.2:最短距离法离差平方和法图6.1 聚类树形图表6.1 聚类附表(最短距离法)步骤聚类合并系数首次出现的阶段类别下一步组1 组2 组1 组21 1 6 5.000 0 0 22 1 2 10.000 1 0 43 4 8 13.000 0 0 74 1 7 13.000 2 0 55 1 3 13.000 4 0 66 1 5 17.000 5 0 7表6.2 聚类附表(离差平方和法)2 已知五个变量的距离矩阵为03674012340444401592343331).;2);3)036034022020401000⎛⎫⎛⎫⎛⎫⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭试用最短距离法和最长距离法对这些变量进行聚类,并画出聚类图和二分树.解 针对距离矩阵1),采用两种方法计算如下. ①最短距离法的聚类步骤如下:12345036740159036020w w w w w ⎛⎫ ⎪⎪ ⎪ ⎪⎪⎪⎝⎭a )将()236,1w w f h =合并为一类,,{}11456,,,,H w w w h =距离矩阵如下0743023060⎛⎫ ⎪⎪ ⎪ ⎪⎝⎭{}()457457),,,2b w w h w w f h ==合并为一类,{}2167,,,H w h h =距离矩阵如下:034030⎛⎫ ⎪⎪ ⎪⎝⎭{}()()1681689),,3,3c w h h w h f h f h ===合并为一类,最后,,聚类图和树状图如图6.2:图6.2 聚类图(左)与树状图(右)②最长距离法与最短距离法类似,步骤如下: a )()236,1w w f h =合并为一类,{}11456,,,,H w w w h =距离矩阵如下0746025090⎛⎫ ⎪⎪ ⎪ ⎪⎝⎭ {}(){}4574572167),,,2,,,b w w h w w f h H w h h ===合并为一类,距离矩阵如下:067090⎛⎫⎪⎪ ⎪⎝⎭{}()()1681689),,69c w h h w h f h f h ===合并为一类,最后,,,聚类图和树状图如图6.3:图6.3 聚类图(左)与树状图(右)(2)针对距离矩阵2)012340234034040⎛⎫ ⎪⎪ ⎪ ⎪⎪⎪⎝⎭①最短距离法的聚类步骤如下 a )()216,1w w f h =合并为一类,{}13456,,,,0342043040H w w w h =⎛⎫⎪⎪ ⎪ ⎪⎝⎭距离矩阵如下{}()367367),,,2b w h h w h f h ==合并为一类,{}24567,,,,H w w h h =聚类矩阵如下:043040⎛⎫⎪⎪ ⎪⎝⎭{}(){}()4784789879),,3,,4c w h h w h f h h w h f h ====合并为一类,最后,,聚类图和树状图如图6.4:图6.4 聚类图(左)与树状图(右)②由于本题数据的特殊性,最长距离法与最短距离法结果相同(略). (3)044440333022010⎛⎫ ⎪⎪ ⎪ ⎪⎪⎪⎝⎭最短距离法的聚类步骤如下a ) ()456,1w w f h =合并为一类,{}11236,,,,H w w w h =距离矩阵如下0444033020⎛⎫ ⎪⎪ ⎪ ⎪⎝⎭{}(){}36736724567),,,2,,,,b w h h w h f h H w w h h ===合并为一类,距离矩阵如下:044030⎛⎫⎪⎪ ⎪⎝⎭{}(){}()4784789879),,3,,4c w h h w h f h h w h f h ====合并为一类,最后,,,聚类图和树状图如图6.5:图6.5 聚类图(左)与树状图(右)由于本题数据的特殊性,最长距离法与最短距离法结果相同(略).3 在一项关于作物对土壤营养的反应的研究中,要测定土壤的总磷量和总氮量(占干物质重的百分比),今对10份土样测得数据如下:总氮量(%)0.120.63 1.19 2.30 1.29 0.73 0.52 0.33 0.61 0.470.66在绝对距离下,试用重心法对其进行聚类分析.解由R软件得到重心法聚类分析的结果如图6.6与表6.3:图6.6 聚类树形图表6.3 聚类过程记录表步骤聚类合并系数首次出现的阶段类别下一步组1 组2 组1 组21 1 8 .001 0 0 22 1 10 .002 1 0 43 6 9 .005 0 0 64 15 .010 2 0 75 2 4 .010 0 0 86 67 .027 3 0 77 1 6 .048 4 6 88 1 2 .459 7 5 99 1 3 2.572 8 0 04 1975年Dagnelie收集了11年的气象数据资料如下表变量年序x1x2x3x4其中:x 1—前一年11月12日的降水量;x 2—7月均温;x 3—7月降雨量;x 4—月日辐射,试对这四个气象因子进行主成分分析. 解 由R 软件分析得到如下表6.4,6.5:表6.4 各主成分的重要性:主成分1 主成分2 主成分3 主成分4 标准差 1.6103349 0.9890848 0.53407741 0.37854199 方差贡献率 0.6482947 0.2445722 0.07130967 0.03582351 累积贡献率0.64829470.89286680.964176491.00000000表6.5 因子荷载:主成分1 主成分2 主成分3 主成分4 X1 0.291 0.871 0.332 -0.214 X2 -0.506 0.425 -0.742 -0.111 X3 0.577 0.136 -0.418 0.688 X4-0.5710.2050.4040.685由于前两个主成分对应的累积贡献率已经达到89.287,因此选取主成分的数目为2.5 对某初中12岁的女生进行体检,测量其身高x 1、体重x 2、胸围x 3和坐高x 4,共测得58个样本,并算得1234(,,,)x x x x x ='的样本协方差为19.9410.5023.566.5919.7120.958.637.97 3.937.55S ⎛⎫ ⎪⎪= ⎪ ⎪ ⎪⎝⎭ 试进行样本主成分分析.解 首先计算样本的相关系数矩阵:10.484410.32240.887210.70330.59760.31251⎛⎫ ⎪ ⎪ ⎪ ⎪⎝⎭设相关系数矩阵的特征值和特征向量分别为d 和v 阵,计算得到0.0546000 0 0.312600= 000.96470 000 2.6681d ⎛⎫ ⎪ ⎪ ⎪ ⎪⎝⎭即四个特征值依次为:2.6681,0.9647,0.3126,0.0546,前两个主成分的累计贡献率为:90.8471%,因此提取主成分为2.四个特征根相应的特征向量为0.06000.70600.5333 0.4620 0.7317 0.17430.34040.5642=0.60570.19320.60400.48060.30690.65870.48460.4870v -⎛⎫ ⎪-⎪ ⎪--- ⎪-⎝⎭ 因此,两个主成分的表达式为:112340.060.73170.60570.3069z x x x x =+-- 212340.7060.17430.19320.6587z x x x x =-+-+6 比较因子分析和主成分分析模型的异同,阐明两者的关系. 解(1)提取公因子的方法主要有主成分法和公因子法.若采取主成分法,则主成分分析和因子分析基本等价,该法从解释变量的变异的角度出发,尽量使变量的方差能被主成分解释;而公因子法主要从解释变量的相关性角度,尽量使变量的相关程度能被公因子解释,当因子分析目的重在确定结构时则用到该法.(2)主成分分析和因子分析都是在多个原始变量中通过他们之间的内部相关性来获得新的变量,达到既减少分析指标个数,又能概括原始指标主要信息的目的.但他们各有其特点:主成分分析是将n 个原始变量提取m 个支配原始变量的公因子,和1个特殊因子,各因子之间可以相关或不相关.(3)统用降维的方法,但差异也很明显:主成分分析把方差划分为不同的正交成分,而因子分析则把方差化分为不同的起因因子;因子分析中的特征值的计算只能从相关系数矩阵出发,且必须把主成分划分为因子.(4)因子分析提取的公因子比主成分分析提取的主成分更具有可解释性.(5)两者分析的实质及重点不同.主成分的数学模型为Y AX =,因子分析的数学模型为X AF ε=+.因而可知主成分分析是实际上是线性变换,无假设检验,而因子分析是统计模型,某些因子模型是可以得到假设检验的;主成分分析主要综合原始数据的信息,而因子分析重在解释原始变量之间的关系.(6)SPSS 数据的实现:两者都通过“analyzedata reduction Factor ···”过程实现,但主成分分析主要使用“descriptires ”,“extraction ”,“stores ”对话框,而因子分析处使用这些外,还可使用“rotaction ”对话框进行因子旋转.7 试对第4题的变量作因子分析,并将结果和上面的结果进行比较. 解 用SPSS 分析,计算结果如下表6.6-6.8:表6.6 反应压缩比情况表 提取方法: 主成分法计算的相关系数矩阵的特征值和方差贡献率:表6.7 方差解释度提取方法: 主成分法表6.8 主成分矩阵8 为研究某一树种的叶片形态,选取50片叶测量其长度x 1(mm )和宽度x 2(mm ),按样本数据求得其平均值和协方差矩阵为:129048134,92,4845x x S ⎛⎫=== ⎪⎝⎭求出相关系数阵R ,并由R 出发作因子分析;解1)求相关系数矩阵:904810.7303,48900.73031S R ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭ 2)用R 软件求R 的特征根及其相应的特征向量,软件输出结果如下:$values[1] 2.99393809 0.07273809 $vectors[,1] [,2] [1,] 0.7071068 -0.7071068 [2,] 0.7071068 0.7071068122.9939,0.0727,λλ∴==12(),()0.7071,0.7071-0.7071,0.7071T Tηη==3) 求载荷矩阵A :1.22350.19071.22350.1907A -⎛⎫= ⎪⎝⎭4)22121.5333, 1.5333,h h == 0.98810.154*0.98810.154A -⎛⎫= ⎪⎝⎭12121,1,0.3043,0.3043u u v v ===-=,222222000011112,0,()0.9074,20i i iii i i i i i A u B v C u v D u v =========-===∑∑∑∑9 1981年,生物学家Grogan 和Wirth 对两种蠓虫Af 和Apf 根据其触角长度x 1和翼长x 2进行了分类,分类的数据资料如下:Af 1 2 3 4 5 6 7 8 x 1 1.24 1.36 1.38 1.38 1.38 1.40 1.48 1.54 x 2 1.27 1.74 1.64 1.82 1.90 1.70 1.82 1.82 Apf 1 2 3 4 5 6 x 1 1.14 1.18 1.20 1.26 1.28 1.30 x 2 1.78 1.96 1.86 2.00 2.00 1.96 (1)试建立Af 和Apf 的Fisher 判别模型;(2)对样本(1.24,1.80),(1.28,1.84),(1.40,2.04)进行判别分类. 解 (1)建立Fisher 判别模型991122121111(,)(1.42,1.75),(,)(1.23,1.93)99T TT T i i i i i i x x y y μμ======∑∑120.08480.1490.01980.0218,0.1490.39120.02180.039A A ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭12120.0080.0130.0130.0332A A n n ⎛⎫+== ⎪+-⎝⎭∑()120.19,0.18Tμμ-=-,()()121 1.325,1.842T μμ+= 1345.05135.42135.4283.33--⎛⎫= ⎪-⎝⎭∑, 带入Fisher 判别函数 ()12345.05135.42[(,)(1.325,1.84)]0.19,0.18135.4283.33Tx x -⎛⎫-- ⎪-⎝⎭1291.301741.336944.534x x =--(2)把三个样本(1.24,1.80),(1.28,1.84),(1.4,2.04)带入模型,得到结果:三个样本均属于Apf 类.10 在两个玉米品种之间进行判别:137玉米G 1和甜玉米G 2,选取的两个变量是:x 1—玉米果穗长;x 2—玉米果穗直径,两个类的样本容量为n 1=n 2=40,实际算得两个类的样本均值和样本协方差为:121218.5625.348.120 4.4589.661 3.720,,,5.98 4.12 4.458 4.350 3.720 3.410x x S S ⎛⎫⎛⎫⎛⎫⎛⎫==== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭试建立G 1,G 2的Bayes 类线性判别函数.解 因为已知两类的样本均值和样本协方差为:12(18.56,5.98),(25.34,4.12)T T x x ==,128.120 4.4589.661 3.720,4.458 4.350 3.720 3.410S S ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭可计算得到修正的公共协方差矩阵和逆矩阵12120.2280.1450.1450.0992A A n n ⎛⎫+== ⎪+-⎝⎭∑,15.6393.738.25147.38--⎛⎫= ⎪-⎝⎭∑()()()121216.78,1.86,21.95,5.052TTμμμμ-=-+= 带入Fisher 判别函数()112121(())()2T W x x μμμμ-=-+-∑ ()()12 5.6393.73[(,)21.95,5.05] 6.78,1.868.25147.38Tx x -⎛⎫=-- ⎪-⎝⎭1274.396.951141.29x x =-+-。
应用数学系研究生课程介绍(西安交通大学)
研究生课程介绍课程编码:091002课程名称:计算方法(A)Computational Methods (A)学分:3课内总学时数:72上机(实验)学时数:18课程内容简介:本课程讲授电子计算机上使用的各种基本的数值计算方法, 如插值法, 最小二乘法, 最佳一致逼近, 数值微积分, 方程求根法, 线性与非线性代数方程组解法, 矩阵特征值与特征向量求法, 常微分方程初值问题的解法, 求解数理方程定解问题的差分法, 有限元法等. 书中重点讨论了各种计算方法的构造原理和使用, 对稳定性, 收敛性, 误差估计等也作了适当讨论. 本课程适合于计算数学专业以外的理工科各专业研究生学习。
先修课:高等数学, 线性代数, C 语言或FORTRAN 语言参考书目:1. 邓建中,刘之行编, 计算方法,西安交通大学出版社,2002执笔人:梅立泉、李乃成、高静审定人:彭济根课程编码:091003课程名称:计算方法(B)Computational Methods (B)学分:3课内总学时数:54上机(实验)学时数:48课程内容简介:由于现代计算机技术的迅速发展,数值方法已成为科学研究的最重要的手段之一。
本课程在介绍数值计算的基本问题,包括浮点数、误差形成等的基础上,主要介绍:线性方程组的直接解法与迭代解法、离散数据的连续化处理(包括多项式插值、分段插值和最小二乘法)、数值积分和数值导数、非线性方程解法简介、常微分方程数值解法、以及最优化方法简介。
通过听课与相应的上机练习等途径,理解数值方法的形成原理,掌握最基本的数值方法,了解采用数值方法时应注意的主要问题,为以后在科研和工程技术工作中设计算法、应用数值软件进行数值计算奠定必要的基础。
先修课:高等数学、线性代数、算法语言(Fortran、C、C++、或Matlab 等)参考书目:1.凌永祥、陈明逵编,计算方法教程(第二版)西安交通大学出版社,2005执笔人:黄昌斌、苏剑、马军审定人:彭济根课程名称:工程优化方法及其应用Engineering Optimization Methods and Its Applications学分:2课内总学时数:40上机(实验)学时数:课程内容简介:讲述工程优化的数学基础,凸集、凸函数、凸规划的基本概念与基本理论;突出非线性规划各类算法的共性分析及其在计算机上可实现的步骤,并指出每类算法中所包含各种常用和著名算法;简介工程中常用到的几类特殊规划,如:线性规划、二次规划、几何规划和多目标规划的基本概念、常用和最新算法;简介工程优化设计应用实例(包括建立优化模型,根据模型特点构造或选用相适应的算法、计算流程图)。
应用数理统计课后答案
t
2 i
11
t
2
3406
.681
.
i 1
i 1
所以
bˆ
lt z lt t
496 .583 3406 .681
0.146
;
Aˆ z bˆ t 0.532 .
得 zˆ 0.532 0.146 t .
换 yˆ ezˆ , aˆ e Aˆ 1.73 , x 1 t
(参考数据:)
6-2. 解:检验问题 H0 :1 2 3
工厂
寿命
Ti
Ti
2
或 i
n
i
S
2 i
甲
40 48 38 42 45 (1600 2304 1444 1764 2025
213
45369 42.6
63.2
乙
26 34 30 28 32 676 1156 900 784 1024
xi
150 160 170 180 190 200 210 220 230 240 250 260
yi
56.9 58.3 61.6 64.6 68.1 71.3 74.1 77.4 80.2 82.6 86.4 89.7
(1)求 对 x 的线性回归方程,并问:每立方米混凝土中增加 1kg 水泥时,可提高的
(4)当 x0 225 时,0 的预测值为 yˆ0 10.28 0.304 225 78.68
由于 0 的1 预测区间为: ( yˆ0 (x0) , yˆ0 (x0) )
(
yˆ0
ˆ
t 12
(n
2)
1
1 n
《应用数理统计》第三章假设检验课后作业参考答案
第三章 假设检验课后作业参考答案3.1 某电器元件平均电阻值一直保持2.64Ω,今测得采用新工艺生产36个元件的平均电阻值为2.61Ω。
假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。
已知改变工艺前的标准差为0.06Ω,问新工艺对产品的电阻值是否有显著影响?(01.0=α)解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36/06.064.261.2/u 00-=-=-=nX σμ(3)否定域⎭⎬⎫⎩⎨⎧>=⎭⎬⎫⎩⎨⎧>⋃⎭⎬⎫⎩⎨⎧<=--21212αααu u uu u u V (4)给定显著性水平01.0=α时,临界值575.2575.2212=-=-ααuu ,(5) 2αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显著性影响。
3.2 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测得其寿命平均值为950(小时)。
已知这种元件寿命服从标准差100σ=(小时)的正态分布,试在显著水平0.05下确定这批元件是否合格。
解:{}01001:1000, H :1000X 950 100 n=25 10002.5V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得:拒绝域:本题中:0.950.950u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。
3.3某厂生产的某种钢索的断裂强度服从正态分布()2,σμN ,其中()2/40cm kg =σ。
现从一批这种钢索的容量为9的一个子样测得断裂强度平均值为X ,与以往正常生产时的μ相比,X 较μ大20(2/cm kg )。
设总体方差不变,问在01.0=α下能否认为这批钢索质量显著提高? 解:(1)提出假设0100::μμμμ>=H H , (2)构造统计量5.13/4020/u 00==-=nX σμ (3)否定域{}α->=1u u V(4)给定显著性水平01.0=α时,临界值33.21=-αu(5) α-<1u u ,在否定域之外,故接受原假设,认为这批钢索质量没有显著提高。
应用数理统计答案2
案 网
ww w. kh da w.
co
ln L(θ ) = ∑ [ln θ + ( θ − 1) ln xi ]
m
̂ =ξ θ (n)
课 后
n ∂ ln L(θ ) =− =0 θ ∂θ ⎧1 ⎧1 ⎪ n , ξ1 ,… , ξ n ≤ θ ⎪ n , ξ ( n ) ≤ θ ∵ L(θ ) = ⎨θ = ⎨θ ⎪ ⎪ 0, other ⎩ ⎩ 0, other 1 1 ≤ , L(θ ) ≤ L(ξ ( n ) ) n n θ ξ( n )
co
m
(3)
α2 = ∫
+∞
θ1
1 e θ2
2
−
x −θ1 θ2
n 1 ⋅ x 2 dx = A2 = ∑ X i2 = θ12 + 2θ 2 ξ n i =1
课 后
⎧ ⎪θ1 = ξ − S ∴⎨ ⎪ ⎩ θ2 = S
答
案 网
̂ = (ξ − θ ) 2 + 2θ ξ ∴ A2 = S + ξ = θ 2 2
−
1 2θ
2
( xi −θ )2
n
(6) L(θ ) = ∏ cθ c xi − ( c +1)
i =1
i =1
∂ ln L(θ ) nc ̂,所以由 = − = 0不能解出θ ∂θ θ
i =1
课 后
̂ =ξ L(θ ) ≤ L(ξ (1) ) ⇒ θ (1)
答
案 网
c − ( c +1) ̂ ,θ ≤ ξ1 ,… , ξ n L(θ ) = ∏ cθ xi
∑ x ∑ (N − x )
i
−
答
案 网
应用数理统计习题
考试方式:《应用数理统计》包括(1)在《实用统计方法》教材或这里所列的部分习题中完成5题(题目要至少分散在3章以上)写出计算程序计算结果,用doc 或pdf 文档发送到 zhang-hh@ ,占30%;(2)结合自己的专业,写一篇统计方法的应用,或介绍一些新的统计方法等小论文,篇幅不限,论文要标注参考文献,占70%。
《数据统计分析》包括(1)在《实用统计方法》教材或这里所列的部分习题中完成5题(题目要至少分散在3章以上)写出计算程序计算结果,用doc 或pdf 文档发送到zhang-hh@ ,占30%;(2)闭卷或开卷考试,占70%。
参考教材:《实用统计方法》 西安交通大学 梅长林等 科学出版社 2002。
部分习题第一章 多元回归分析1.4某种化工产品的得率Y 与反应温度1X ,反应时间2X 及某反应温度3X 有关。
设对于给定的1X ,2X ,3X ,得率Y 服从正态分布且方差为常数。
近得实验结果如下,其中1X ,2X ,3X 均为两水平变量且编码形式表达。
(1)对Y ,拟合以1X ,2X ,3X 为自变量的线性回归模型,求出回归参数估计值及残差。
(2)给定显著水平05.0=α,检验回归系数的显著性。
(3)对05.0=α,检验各自变量对Y 的影响的显著性。
1.7为了研究人们对某种品牌食品的喜爱程度Y 和该食品的水分含量1X ,甜度2X 的关系,,进行了一个完全随机化设计的小规模试验,得到下列数据:(1) 拟合回归模型i i i i X X Y εβββ+++=22110,写出回归方程,问其中的∧1β如何解释。
(2) 求出残差向量,分别作出残差关于拟合值∧Y , 1X , 2X 及1X 2X 的残差图及残差的正态概率图。
分析这些残差图并给出你的评述。
(3) 设误差项()16,2,1 =i i ε独立同分布于()2,0σN ,在01.0=α的水平上检验回归关系的显著性。
写出假设、检验准则及结论并求检验的p-值。
应用数理统计课后答案
1 n ˆ xi x n i 1 1 n 2 ˆ 2 ( xi x) 2 sn n i 1
则 , 2 的极大似然估计量:
1 n ˆ n X i X i 1 1 n 2 ˆ 2 ( X i X )2 Sn n i 1
1 e x, F (x) 0,
x 0, x 0.
(1) FY ( y) P{Y y} P{aX b y} P{ X
y b yb }(a 0) F ( ) a a
y b y b 当 0,即y b时,FY ( y ) 1 e a . a 当 y b 0,即y b时,F ( y ) 0. Y a
Xi
i 1
2
(t ) e i1
i ( eit 1)
2
根据特征函数的性质(5)得: X 1 X 2 ~ P(1 2 )
第二章 数理统计的基本概念
8.解:设 X 为样本,x 为样本的观测值。由于数据已经按照从小到大的顺序排列,
于是经验分布函数为:
0, 1 , 8 1 , 4 3 , 8 1 Fn ( x ) , 2 5 8 , 3, 4 7 , 8 1,
y
1 e y, FY ( y ) 0,
y 0, y 0.
14.证明:
Cov( , ) Cov(aX b, cY d ) acCov ( X , Y ) D( ) D(aX b) a 2 D( X )同理:D( ) c 2 D(Y )
由极大似然估计的不变性可知
ˆ Sn
《应用数理统计》吴翊 参考答案(前三章)
第一章 数理统计的基本概念P261.2 设总体X 的分布函数为()F x ,密度函数为()f x ,1X ,2X ,…,n X 为X 的子样,求最大顺序统计量()n X 与最小顺序统计量()1X 的分布函数与密度函数。
解:(){}{}()12nn i n F x P X x P X x X x X x F x =≤=≤≤≤=⎡⎤⎣⎦ ,,,.()()()()1n n n f x F x n F x f x -'=⎡⎤=⎡⎤⎣⎦⎣⎦.(){}{}1121i n F x P X x P X x X x X x =≤=->>> ,,,. {}{}{}121n P X x P X x P X x =->>>{}{}{}121111n P X x P X x P X x =-⎡-≤⎤⎡-≤⎤⎡-≤⎤⎣⎦⎣⎦⎣⎦()11nF x =-⎡-⎤⎣⎦()()()()1111n f x F x n F x f x -'=⎡⎤=⎡-⎤⎣⎦⎣⎦.1.3 设总体X 服从正态分布()124N ,,今抽取容量为5的子样1X ,2X ,…,5X ,试问: (i )子样的平均值X 大于13的概率为多少?(ii )子样的极小值(最小顺序统计量)小于10的概率为多少? (iii )子样的极大值(最大顺序统计量)大于15的概率为多少?解:()~124X N ,,5n =,4~125X N ⎛⎫∴ ⎪⎝⎭,. (i ){}{}()13113111 1.1210.86860.1314P X P X P φφ⎧⎫⎛⎫⎪⎪⎪>=-≤=-=-=-=-=. (ii )令{}min 12345min X X X X X X =,,,,,{}max 12345max X X X X X X =,,,,.{}{}{}min min 125101*********P X P X P X X X <=->=->>> ,,,{}{}{}5551111011101110i i i i P X P X P X ===->=-⎡-<⎤=-⎡-<⎤⎣⎦⎣⎦∏∏.()12~012X Y N -=,, {}{}121012*********X X P X P P P Y ---⎧⎫⎧⎫∴<=<=<-=<-⎨⎬⎨⎬⎩⎭⎩⎭ {}()111110.84130.1587P Y φ=-<=-=-=.{}[]5min 10110.158710.42150.5785P X ∴<=--≈-=.(iii ){}{}{}{}{}55max max 1251151151151515115115i i P X P X P X X X P X P X =>=-<=-<<<=-<=-⎡<⎤⎣⎦∏ ,,,.{}5max 1510.9331910.70770.2923P X ∴>=-≈-=.1.4 试证:(i )()()()22211nni i i i x a x x n x a ==-=-+-∑∑对任意实数a 成立。