应用数理统计3.1.pdf
2010新版北航研究生应用数理统计习题参考答案

n
xi 1
2
1
n
2n
e
2
(1 x )
, 1 xi ( i )
由 2 0 ,则似然函数为 1 的单调递增函数,且 - 1 xi ( i ) ,由极大似
ˆ min{x } 。 然估计定义可知, 1 的极大似然估计为 1 i
i
对 2 , ln L(1, 2 ) -n ln 2
- 2 , x1 ,x 2 ,…,x n 为来自总体的简单样本,求参数 1 及 2 的极大似然估计。
解:由 f ( x;1 , 2 ) 为概率密度函数可知, 2 0 。 似然函数为 L(1 , 2 ; x1 , x2 ,, xn )
1
2n
e
i 1
第 6 页 /第 23 页
北京航空航天大学
研究生应用数理统计
书后部分习题解答整理版
ˆ 0 min{xi } 。 x 0 的极大似然估计为 x
i
12. ( P81.11) )设总体 X 的概率密度函数为 f ( x;1 , 2 )
1
2
e
x 1
2
, - 1 x ,
2 1m
2
2 (n 1) S 2 n
2
( x 1 ) ( y 2 )
2 (m 1) S12m (n 1) S 2 n mn2
2
m
2
n
~ t (m n 2) 。
6. ( P80.1)设总体 X 服从两点分布 B(1, ) , 0 1 , x1 , x 2 ,…, x n 为简单随机样 本,⑴ 求 q( ) Var ( x ) ;⑵ 求 q( ) 的频率估计。
应用数理统计实验讲义2011-12-30

应⽤数理统计实验讲义2011-12-30⽬录绪⾔MATLAB基础知识⼀、MATLAB软件简介 (1)1、MATLAB的主要功能 (1)2、MATLAB的⼯作环境 (1)3、MATLAB的⼯作原理 (2)⼆、MATLAB⼊门 (2)1、数学运算符及特殊字符 (2)2、常⽤库函数 (2)3、命令⾏的编写 (3)4、变量与表达式 (3)5、M⽂件的建⽴、编写、保存与调⽤ (4)6、MATLAB的在线帮助 (4)7、路径的设置 (4)第⼀章数理统计的基本概念⼀、直⽅图与经验分布函数图的绘制 (5)⼆、常见的概率分布 (7)三、MATLAB为常见分布提供的五类函数 (7)1、概率密度函数 (7)2、累积分布函数 (8)3、逆累积分布函数 (8)4、随机数发⽣函数 (8)5、均值和⽅差 (8)四、常⽤的统计量 (9)第⼆章参数估计⼀、统计⼯具箱中的参数估计 (10)1、利⽤mle函数对概率分布中的参数进⾏估计 (10)第三章假设检验⼀、正态总体的参数假设检验 (13)(⼀)检验问题、检验统计量及拒绝域 (13)(⼆)参数假设检验函数 (14)(三)参数假设检验函数的格式说明及例题 (14)1、[h,p,ci,zval] = ztest(x,mu0,sigma,alpha,tail) (14)2、[h,p,ci,stats] = ttest(x,mu0,alpha,tail) (15)3、[h,p,ci,stats] = ttest2(x,y,alpha,tail) (16)4、[h,p,ci,stats] = vartest(x,sigma02,alpha,tail) (17)5、[h,p,ci,stats] = vartest2(x,y,alpha,tail) (18)⼆、⾮参数假设检验 (19)(⼀)各检验⽅法的功能与优缺点 (19)(⼆)⾮参数假设检验函数 (20)(三)⾮参数假设检验函数的格式说明及例题 (21)1、[h,p,stats] = chi2gof(x,name1,val1,name2,val2,...) (21)2、[table,chi2,p,label] = crosstab(x,y) (23)3、[h,p,ksstat,cv] = kstest(x,cdf,alpha,tail) (25)4、[h,p,lstat,cv]= lillietest(x,alpha,distr) (25)5、[h,p,jbstat,cv] = jbtest(x,alpha) (26)6、[h,p,ksstat] = kstest2(x,y,alpha,tail) (28)7、[p,h,stats] = ranksum(x,y,alpha) (28)8、normplot(x) (29)9、qqplot(x,y) (30)第四章回归分析⼀、线性回归模型 (33)⼆、回归分析中研究的主要问题 (33)三、回归分析函数 (34)(⼀)回归分析函数 (34)(⼆)回归分析函数的格式说明及例题 (34)1、[b,bint,r,rint,stats] = regress(y,X,alpha) (34)2、stepwise(X,y,inmodel,penter,premove) (43)3、多项式拟合 (polyfit)、多项式求值 (polyval)等函数 (47)第五章⽅差分析⼀、⽅差分析模型与假设检验⽅法 (51)(⼀)单因素⽅差分析数学模型 (51)1、单因素⽅差分析数学模型 (51)2、假设检验 (51)(⼆)双因素等重复试验⽅差分析 (51)1、双因素等重复试验⽅差分析的数学模型 (51)2、假设检验 (51)(三)双因素⽆交互作⽤的⽅差分析 (52)1、双因素⽆交互作⽤⽅差分析的数学模型 (52)2、假设检验 (52)⼆、⽅差分析函数 (53)(⼀)⽅差分析函数 (53)(⼆)⽅差分析函数的格式说明及例题 (53)1、[p,table,stats] = anova1(X,group) (53)2、c = multcompare(stats,param1,val1,param2,val2,...) (55)3、[p,table,stats] = anova2(X,reps) (57)附:Matlab 2007b PLP(注册码)18-41519-34649-39940-00621-01988-02577-01245-51575-44112-12966-44686-37374-43430-36283-64095-18584-34803-54175-05965-54469-56859-47170-56703-00300-00857-63903-48349-07297-57752-37962-48933-62342-43508-41646-31266-38461-54713-50260-57403-18654-13756-59612-18880最⼤似然估计──Maximum likelihood esti mates (MLE)置信区间──Confidence intervals (ci)Q-Q图──Quantile-quantile plot绪⾔MATLAB基础知识⼀、MATLAB软件简介1967年美国Mathwork公司推出了、基于矩阵运算的“Matrix Laboratory” (缩写为MATLAB) 的交互式软件包. MATLAB既是⼀种直观、⾼效的计算机语⾔, 同时⼜是⼀个科学计算平台. 它为数据分析和数据可视化、算法和应⽤程序开发提供了最核⼼的数学和⾼级图形⼯具. 根据它提供的500多个数学和⼯程函数, ⼯程技术⼈员和科学⼯作者可以在它的集成环境中交互或编程以完成各⾃的计算. MATLA-B⼀般⽤于线性代数、概率统计、图像处理、样条分析、信号处理、⼩波分析、振动理论、神经⽹络、⾃动控制、系统识别、算法优化和财政⾦融等各个⽅⾯.不过, MATLAB作为⼀种新的计算机语⾔, 要想运⽤⾃如, 充分发挥它的威⼒, 也需要系统的学习. 但由于使⽤MATLAB编程运算与⼈进⾏科学计算的思路和表达⽅式完全⼀致, 所以不像学习其他⾼级语⾔如Basic、Fortan和C语⾔等那样难于掌握. 下⾯的内容均是基于MATLAB7.5版本.1、MATLAB的主要功能(1) 数值计算功能(Numeric)(2) 符号计算功能(Symblic)(3) 图形和可视化功能 (Graphic)(4) MATLAB的活笔记本功能(Notebook)(5) 可视化建模和仿真功能(Simulink)2、MATLAB的⼯作环境MATLAB的⼯作环境主要包括:·【Command Window】命令窗⼝;·【File Editor】⽂本编辑窗⼝;·【Figure Window】图形窗⼝.图0-1MATLAB 6.x的命令窗、⽂本编辑窗、图形窗、菜单栏和⼯具栏MATLAB 7.5还包含⼏个辅助视窗, 组成其“桌⾯系统”. 它们分别为:·【Workspace】⼯作台窗⼝;·【Command History】指令历史纪录窗⼝;·【Current Directory】当前⽬录选择窗⼝.图0-2MATLAB 7.5的桌⾯系统和命令窗⼝3、MATLAB的⼯作原理(1) 语⾔结构:MATLAB语⾔ = 窗⼝命令 + M⽂件(2) 窗⼝命令:在MATLAB命令窗⼝中输⼊的MATLAB语句, 并直接执⾏它们完成相应的运算、绘图等.(3) M⽂件:在MATLAB⽂本编辑窗⼝中⽤MATLAB语句编写的磁盘⽂件, 扩展名为“.M”.⼆、MATLAB⼊门1、数学运算符及特殊字符数组的算术运算符: + - .* ./ .\ .^矩阵的算术运算符: + - * / \ ^关系运算符: < <= > >= = = ∽=逻辑运算符: & 与; | 或; ~ ⾮三种运算的顺序依次为: 算术运算、关系运算、逻辑运算.pi 数学常数, 即3.1415926535897....eps 系统的浮点 (Floating-ponit) 精确度. 在PC机上, 它等于522Inf 正⽆穷⼤, 定义为1 0ans 计算结果的默认变量名NaN 不定值, 由 Inf/Inf或0/0等运算产⽣2、基本库函数(1) 常⽤三⾓函数:sin, cos, tan, cot, sec, csc, asin, acos, atan, acot, asec, acsc等(2) 常⽤基本函数:sqrt(x)—开平⽅abs(x)—取绝对值exp(x)—以e为底的指数log(x)—⾃然对数log10(x)—以10为底的对数log2(x)—以2为底的对数sum(x)—求和prod(x)-求积max(x)—最⼤值min(x)—最⼩值fix(x)—对称取整sign(x)—符号函数length(x)—矩阵⾏数与列数中的最⼤值size(x)—矩阵的⾏数与列数注意: (1) 由于MATLAB是基于矩阵的运算,所以上⾯的x均表⽰矩阵, 数可看作是1×1的矩阵.(2) 对⾮向量型矩阵, 如不作特殊说明, 都是列优先.3、命令⾏的编写随时输⼊指令并按回车键, 即时给出结果;在指令最后不⽤任何符号并按回车键, 将显⽰最后结果;在指令最后⽤“; ”并按回车键, 将只计算但不显⽰最后结果.同时输⼊⼏条指令时, ⽤“, ”或“; ”隔开.【例0-1】数学运算符、特殊字符与基本库函数的应⽤>>3*(-5), 2/5, [1 2 3].*[2 4 5], [1 2 3]./[2 4 5], [2,4,5].^2ans = -15ans = 0.4000ans = 2 8 15ans = 0.5000 0.5000 0.6000ans = 4 16 25>> sin(pi/4), log(exp(1))ans = 0.7071ans = 14、变量与表达式在MATLAB中, 把由下标表⽰次序的标量的集合称为矩阵或数组. MATLAB是基于矩阵运算的, 因此其基本数据结构只有⼀个:矩阵. ⼀个数也是矩阵, 只不过它是1⾏×1列的矩阵. MATLAB中的变量可⽤来存放数据, 也可⽤来存放向量或矩阵, 并进⾏各种运算.变量命名的规则为:·变量名、函数名是要区分⼤⼩写字母的;·第⼀个字符必须是英⽂字母;·字符间不可留空格;·最多只能有31个字符 (只能有英⽂字母、数字和下连字符) .表达式由变量名、运算符和函数名等组成. 如x/sin(x), 其中x为变量名, /为运算符, sin为函数名.MATLAB语句有两种最常见形式: 1) 表达式; 2) 赋值语句: 变量 = 表达式.【例0-2】赋值语句的使⽤>> x=1; y=x/sin(x)y = 1.1884>> x=[pi/6,pi/4,pi/3,pi/2]; sin(x)ans =0.5000 0.7071 0.8660 1.0000>> x=0:0.1:2*pi; y=sin(x); plot(x,y)图0-3y=sin(x)的曲线图5、M ⽂件的建⽴、编写、保存与调⽤(1) 进⼊⽂本编辑窗⼝的⽅式: 在菜单栏“File ”下直接点击“新建…”进⼊⽂本编辑窗⼝. (2) M ⽂件的分类与格式:①命令⽂件: 由⼀系列MATLAB 语句组成, 运⾏时将⾃动执⾏⼀系列命令直⾄给出最后结果, ⽽不交互地等待键盘输⼊. 命令⽂件定义的变量为全局变量, 存放于内存.②函数⽂件: 第⼀⾏必须包含“function ”, 主要功能是建⽴⼀个函数. 函数⽂件定义的变量为局部变量.function 因变量名= 函数名(⾃变量名)注意: 函数⽂件要求函数名和⽂件名相同, 且函数名、⽂件名与变量名的命名规则⼀样. (3) 退出⽂本编辑窗⼝: 录⼊完毕, 存盘退出⽂本编辑窗⼝则可.【例0-3】已知1232,3,1x x x =-==, ⽽2112112122233,y z zz x y z z z x x =+?=??=-=+, 试求12,y y 的值. ·在⽂本编辑窗⼝中编写命令⽂件f0_3.m:x1=-2;x2=3;x3=1; z1=3*x1^2; z2=x2+x3; y1=z1+z2 y2=z1-z2·在命令窗⼝中运⾏命令⽂件f0_3.m:>> f0_3y1 = 16 y2 = 8【例0-4】求()lg f x =0,5,10x x x ===处的函数值.·在⽂本编辑窗⼝中编写函数⽂件f0_4.m:function y=f0_4(x)y=log10(sqrt((x-5).^2+(x-100).^2)); ·在命令窗⼝中调⽤函数⽂件f0_4.m:>>x=[0,5,10]; y=f0_4(x); y = 2.0005 1.9777 1.9549 6、MATLAB 的在线帮助 (1) 从菜单栏上的“help ”进⼊ (2) 其它命令窗⼝帮助clc —— 清除显⽰屏上的内容 clear —— 清除内存变量和函数what —— 列出当前⽬录下的M 、MAT 、MEX ⽂件 who ——列出当前⼯作空间 (Workspace) 的变量名7、路径的设置在保存M ⽂件时, MATLAB 的默认位置是C:\MATLAB6p5\work. 如果⽤户将编写的M ⽂件保存在E:\experiment ⽬录下, 则从MATLAB 窗⼝的“File ”菜单中单击⼦菜单“Save As …”, 选择E:\experiment, 再输⼊本M ⽂件的⽂件名, 按“保存”键返回则可.第⼀章数理统计的基本概念⼀、直⽅图与经验分布函数图的绘制hist(A,n)——对矩阵A 按列作统计频数直⽅图, n 为条形图的条数 ni=hist(A,n)——对矩阵A 按列得各划分区间内的统计频数注意: 当A 为向量时, 上述所有命令直接作⽤在向量上, ⽽不是列优先.[Fn,x0]=ecdf(x) —— 得到样本x 的经验分布函数值Fn, 当x 中有m 个不同的数 (记为向量x0) 时, 则Fn 的个数为m+1个ecdfhist(Fn,x0, m) —— 绘制数据x 的频率(密度)直⽅图, 其中Fn 与x0是由ecdf 函数得到的样本x 的经验分布函数值Fn 与分段点x0, m 为条形的个数, m 的默认值为10cdfplot(x) —— 绘制样本x 的经验分布函数图例如:>> x = [6 4 5 3 6 8 6 7 3 4]; >> [Fn,x0]=ecdf(x)Fn = 0 0.2000 0.4000 0.5000 0.8000 0.9000 1.0000 x0 = 3 3 4 5 6 7 8 >> cdfplot(x)图1-1 经验分布函数图【例1-1】(P 10例1.6)在齿轮加⼯中, 齿轮的径向综合误差i F ''?是个随机变量, 今对200件同样的齿轮进⾏测量, 测得i F ''?的数值 (mm) 如下, 求作i F ''?的频率密度直⽅图, 并作出i F ''?的经验分布函数图形.16 25 19 20 25 33 24 23 20 24 25 17 15 21 22 26 15 23 22 24 20 14 16 11 14 28 18 13 27 31 25 24 16 19 23 26 17 14 30 21 18 16 18 19 20 22 19 22 18 26 26 13 21 13 11 19 23 18 24 28 13 11 25 15 17 18 22 16 13 12 13 11 09 15 18 21 15 12 17 13 14 12 16 10 08 23 18 11 16 28 13 21 22 12 08 15 21 18 16 16 19 28 19 12 14 19 28 28 28 13 21 28 19 11 15 18 24 18 16 28 19 15 13 22 14 16 24 20 28 18 18 28 14 13 28 29 24 28 14 18 18 18 08 21 16 24 32 16 28 19 15 18 18 10 12 16 26 18 19 33 08 11 18 27 23 11 22 22 13 28 14 22 18 26 18 16 32 27 25 24 17 17 28 33 16 20 28 32 19 23 18 28 15 24 28 29 16 17 19 18·编写命令⽂件example1_6.m:F=[16 25 19 20 25 33 24 23 20 24 25 17 15 21 22 26 15 23 22 24.... 20 14 16 11 14 28 18 13 27 31 25 24 16 19 23 26 17 14 30 21.... 18 16 18 19 20 22 19 22 18 26 26 13 21 13 11 19 23 18 24 28.... 13 11 25 15 17 18 22 16 13 12 13 11 09 15 18 21 15 12 17 13....14 12 16 10 08 23 18 11 16 28 13 21 22 12 08 15 21 18 16 16.... 19 28 19 12 14 19 28 28 28 13 21 28 19 11 15 18 24 18 16 28.... 19 15 13 22 14 16 24 20 28 18 18 28 14 13 28 29 24 28 14 18.... 18 18 08 21 16 24 32 16 28 19 15 18 18 10 12 16 26 18 19 33.... 08 11 18 27 23 11 22 22 13 28 14 22 18 26 18 16 32 27 25 24....17 17 28 33 16 20 28 32 19 23 18 28 15 24 28 29 16 17 19 18];%(1)下⾯作频数直⽅图 figure(1) hist(F,8)title('频数直⽅图');xlabel('齿轮的径向综合误差(mm)'); %(2)下⾯作频率(密度)直⽅图 [Fn,x0]=ecdf(F); figure(2)ecdfhist(Fn,x0,8); title('频率(密度)直⽅图');xlabel('齿轮的径向综合误差(mm)'); %(3)下⾯作经验分布函数图 figure(3) cdfplot(F)title('经验分布函数图');xlabel('齿轮的径向综合误差(mm)'); ·运⾏命令⽂件example1_6.m:>> example1_6频数直⽅图齿轮的径向综合误差(mm)频率(密度)直⽅图齿轮的径向综合误差(mm)5101520253035齿轮的径向综合误差(mm)F (x )经验分布函数图图1-2⼆、常见的概率分布表1-1常⽤概率分布及代码1) 概率密度函数(分布名+pdf)2) (累积)分布函数(分布名+cdf)3) 逆(累积)分布函数(分布名+inv)4) 随机数发⽣器(分布名+rnd)5) 均值和⽅差(分布名+stat)1、概率密度函数表1-2概率密度函数(pdf)注意: Y=normpdf (X, mu, sigma)的sigma是指标准差, ⽽⾮.N的概率密度图.【例1-2】绘制标准正态分布(0,1)x=-4:0.1:4;y=normpdf(x,0,1);plot(x,y)title('N(0,1)的概率密度曲线图')图1-3 标准正态分布的概率密度图2、累积分布函数表1-3 累积分布函数(cdf)【例1-3>> P=normcdf (2,0,1)-normcdf(-2,0,1) ans = 0.9545 3、逆累积分布函数 (⽤于求分位点)表1-4 逆累积分布函数(inv)22(i) 0.9u ;(ii) 0.25(4)t ;(iii) 0.1(14,10)F ;(iv) 20.025(50)χ.>> u_alpha=norminv(0.9,0,1)不是平⽅u_alpha = 1.2816 >> t_alpha=tinv(0.25,4)t_alpha = -0.7407 >> F_alpha=finv(0.1,14,10)F_alpha = 0.4772>> X2_alpha=chi2inv(0.025,50)X2_alpha = 32.3574 4、随机数发⽣函数表1-5 随机数发⽣函数(rnd)5表1-6 常见分布的均值和⽅差函数(stat)注意: MATLAB 中的指数分布的概率密度函数是1,0 ()0,0xue xf x u x -?>?=??≤?.四、常⽤的统计量表1-7 常⽤统计量说明:(1) y=var(X) ——计算X 中数据的⽅差, 其中211var()()1ni i X x x n ==--∑. y=var(X, 1) ——211var(,1)()n i i X x x n ==-∑, 得到样本的⼆阶中⼼矩 (转动惯量).(2) C =cov(X) ——返回⼀个协⽅差矩阵, 其中输⼊矩阵X 的每列元素代表着⼀个随机变量的观测值. 如果X 为n ×m 的矩阵, 则C 为m ×m 的矩阵.(3) var(X)=diag(cov(X)), std(X)=sqrt(diag(cov(X))).作业: P 26-28 1.1, 1.12第⼆章参数估计参数估计包含两种常⽤⽅式: 点估计和区间估计.Matlab 统计⼯具箱给出了常⽤概率分布中参数的点估计 (采⽤最⼤似然估计法-MLE) 与区间估计, 另外还提供了部分分布的对数似然函数的计算功能. ⼀、统计⼯具箱中的参数估计1、利⽤mle 函数对概率分布中的参数进⾏估计格式: [phat,pci] = mle(data,'distribution',dist, 'alpha', alpha,'ntrials',n) 引号内照抄功能: 根据样本数据data, 给出由dist 指定分布的参数的MLE 估计与区间估计. 说明:(1) phat 与pci 中的“p ”为分布中的参数, 可表⽰多个参数;(2) phat 为参数的最⼤似然估计值, pci 为参数的置信⽔平为1α-的置信区间, 其中α由alpha 的取值确定;(3) dist 为总体分布的指定类型, 其取值为表1-1中的代码; (4) 当dist 为’norm ’时, phat 中的参数“p ”是指,µσ, ⽽⾮2,µσ.(5) alpha 为显著性⽔平, 取值在0-1之间. 0.05α=是默认值, 此时本选项可省略;(6) 'ntrials',n 只在dist 为bino (⼆项分布(,)b n p )时才选⽤, n 为(,)b n p 是的n, 此时待估参数为p.【例2-1】(书P 66习题2.3) 使⽤⼀测量仪器对同⼀值进⾏了12次独⽴测量, 其结果为 (单位: mm)232.50 232.48 232.15 232.52 232.53 232.30 232.48 232.05 232.45 232.60 232.47 232.30并设测量值2~(,)X N µσ, 试求2,µσ的最⼤似然估计与区间估计(0.05α=). (1) 问题分析:设总体X ──测量值, 且2~(,)X N µσ.今抽得⼀容量为12的样本, 本问题是求参数2,µσ的最⼤似然估计与置信⽔平为0.95的区间估计. (2) 问题求解:2,µσ的最⼤似然估计分别为: 2211??,()nMLE MLEi i X X X n µσ===-∑; µ的置信⽔平为1α-的置信区间为: 1212(1),(1)X n X n αα--??--;2σ的置信⽔平为1α-的置信区间为: 22**22122(1)(1),(1)(1)n S n S n n ααχχ-??--??--.·编写命令⽂件exercise2_3.m:x=[232.50, 232.48, 232.15, 232.52, 232.53, 232.30, 232.48, 232.05, 232.45, 232.60, 232.47, 232.30];[hat,ci]=mle(x,'distribution','norm') ·运⾏命令⽂件exercise2_3.m:>> exercise2_3hat = 232.4025 0.1598 pci (:,1)所有⾏第⼀列 ci = 232.2965 0.1182 232.5085 0.2834(3) 问题结果 :22??232.4025,0.15980.0255MLE MLE µσ===,µ的置信区间为[232.2965,232.5085],2σ的置信区间为22[0.1182,0.2834][0.0140,0.0803]=.【例2-2】(书P 69习题2.22) 随机地从⼀批零件中抽取16个, 测得长度 (单位: cm) 为:2.14 2.10 2.13 2.15 2.13 2.12 2.13 2.10 2.15 2.12 2.14 2.10 2.13 2.11 2.14 2.11设零件长度的分布为正态的, 试求总体均值的90%的置信区间: ①若0.01σ=(cm);②若σ未知.(1) 问题分析:设总体X ──零件长度, 则2~(,)X N µσ. 本问题是求参数µ的置信区间. (2) 问题求解:①若0.01σ=: µ的置信⽔平为1α-的置信区间为1212,X X αα--. ·编写函数⽂件zestimate.m:function muci=zestimate(x,sigma,alpha) n=length(x); xhat=mean(x);u_alpha=norminv(1-alpha/2,0,1); delta1=sigma/sqrt(n)*u_alpha; muci=[xhat-delta1,xhat+delta1]; ·调⽤函数⽂件zestimate.m: >> x=[2.14, 2.10, 2.13, 2.15, 2.13, 2.12, 2.13, 2.10, 2.15, 2.12, 2.14, 2.10, 2.13, 2.11, 2.14, 2.11]; >> sigma=0.01; >>alpha=0.1;>> muci=zestimate(x,sigma,alpha) muci = 2.1209 2.1291 ②若σ未知: µ的置信⽔平为1α-的置信区间为1212(1),(1)X n X n αα--??--. ·编写命令⽂件exercise2_22_2.m:x=[2.14, 2.10, 2.13, 2.15, 2.13, 2.12, 2.13, 2.10, 2.15, 2.12, 2.14, 2.10, 2.13, 2.11, 2.14, 2.11];[phat,pci]= mle(x,'distribution','norm','alpha',0.1); muci=pci(:,1)·运⾏命令⽂件exercise2_22_2.m:>> exercise2_22_2muci = 2.1175 2.1325 (3) 问题结果:①当0.01σ=时, µ的置信⽔平为0.90的置信区间为[2.1209, 2.1291]; ②当σ未知时, µ的置信⽔平为0.90的置信区间为[2.1175,2.1325].【例2-3】(书P 66例2.31) 对⼀批产品, 欲通过抽样检查其不合格率. 今抽取产品100件, 发现不合格品有4件, 求不合格率的0.95的双侧置信区间. (1) 问题分析:设总体1,0X ?=??本产品为不合格品本产品为合格品, 即~(1,)X b p .今抽得⼀容量为100的样本145100(1,0)x x x x ====== , 本问题即要求参数p 的双侧置信区间.(2) 问题求解:选⽤下列两种⽅法计算:①利⽤P 6522221212()(2)0n u p nX u p nX αα--+-++<近似计算(棣莫弗-拉普拉斯中⼼极限定理);②利⽤Matlab 中⼆项分布参数估计函数mle 计算 (借助F 分布). ·编写命令⽂件example2_31.m:alpha=0.05; n=100;%(1) 利⽤中⼼极限定理近似计算 u=norminv(1-alpha/2,0,1); a=n+u^2;b=-(2*n*(4/n)+u^2); c=n*(4/n)^2;p=[(-b-sqrt(b^2-4*a*c))/(2*a),(-b+sqrt(b^2-4*a*c))/(2*a)]%⼀元⼆次⽅程求根公式%(2) 利⽤mle 计算[pcat,pci]=mle([1,1,1,1,zeros(1,96)],'distribution','bino','ntrials',1) ·运⾏命令⽂件example2_31.m:>> example2_31p = 0.0157 0.0984%近似计算结果pcat = 0.0400 pci = 0.0110 0.0993%mle 计算结果(3) 问题结果:①利⽤中⼼极限定理得到p 的近似估计区间为[0.0157, 0.0984]; ②利⽤mle 得到p 的估计区间为[0.0110, 0.0993].作业: P 67-69 2.24, 2.25第三章假设检验假设检验分为两种: 参数假设检验与⾮参数假设检验. ⼀、正态总体的参数假设检验(⼀)检验问题、检验统计量及拒绝域表3-1的说明:对⼀个正态总体2~(,)X N µσ, 抽取样本12,,,n X X X ;对两个正态总体211~(,)X N µσ, 222~(,)Y N µσ, 且X 与Y 独⽴, 分别抽取样本112,,,n X X X 与212,,,n Y Y Y .表3-1 正态总体的参数假设检验其中, 22211*22*12(1)(1)2wn S n S S n n -+-=+-.(⼆)参数假设检验函数表3-2 统计⼯具箱中的参数假设检验函数 (test)(1) [h,p,ci,zval] = ztest(x,mu0,sigma,alpha,tail)中的sigma 是指标准差σ, ⽽⾮2σ; (2) [h,p,ci,stats] = vartest(x,sigma20,alpha,tail)中的sigma20是指20σ, ⽽⾮0σ.(三)参数假设检验函数的格式说明及例题1、[h,p,ci,zval] = ztest(x,mu0,sigma,alpha,tail) ⽅差已知时, 对单正态总体均值µ与实数0µ的关系进⾏Z 检验. 并可通过指定tail 的值来控制备择假设的类型. tail 的取值及表⽰意义如下: tail='both' 表⽰10:H µµ≠ (缺省值) ; tail='right'表⽰10:H µµ>;tail= 'left'表⽰10:H µµ<. (原假设则为00:H µµ≥)·输出变量含义:h ——如果h=0, 则接受0H ; 如果h=1, 则拒绝0H ⽽接受备择假设1H ;p ——在当前样本下拒绝0H 的最⼩显著性⽔平, 即犯第I 类错误的最⼩概率00(|拒绝为真)P H H ; ci ——均值µ的置信⽔平为1α-的置信区间; zval ——Z统计量X Z =的观测值.α是我们设定的显著性⽔平, p 是最⼩显著性⽔平, 因此当p<α时, 则拒绝0H ;当0µ落⼊ci 中, 则接受0H .【例3-1】(书P 76例3.4) ⼀台包装机装洗⾐粉, 额定标准重量为500g, 根据以往经验, 包装机的实际装袋重量服从正态分布2(,)N µσ, 其中15σ=g, 为检验包装机⼯作是否正常, 随机抽取9袋, 称得洗⾐粉净重数据如下 (单位: g) : 497 506 518 524 488 517 510 515 516若取显著性⽔平0.01α=, 问这包装机⼯作是否正常? (1) 问题分析:设总体X ──每袋洗⾐粉的重量, 2~(,)X N µσ, 且2215σ=已知. 今抽得⼀容量为9的样本, 本问题是检验假设: 00100:,:(500)H H µµµµµ=≠=.(2) 问题求解:选取检验统计量X u =, 则0H 的拒绝域为12||u u α->.>> x=[497,506,518,524,488,517,510,515,516]; >> [h,p,ci,zval]=ztest(x,500,15,0.01,'both')h = 0%接受00:500H µµ== p = 0.0432%0H为真条件下12||Z u α-=> 成⽴的最⼩的α值 (参照书P 84例3.7)ci = 497.2320 522.9903 %σ已知时µ的置信⽔平为0.95的双侧置信区间 zval = 2.0222%Z统计量X Z =的值.(3) 问题结果:由于h = 0, 故接受00:H µµ=, 即认为包装机⼯作正常.2、[h,p,ci,stats] = ttest(x,mu0,alpha,tail) ⽅差未知时, 对单正态总体均值进⾏t 检验. ·输出变量含义:stats 包含三个结果:tstat ——t统计量X t =;df ——t 分布的⾃由度; sd ——样本标准差.【例3-2】(书P 79例3.5) 某部门对当前市场的价格情况进⾏调查. 以鸡蛋为例, 所抽查的全省20个集市上, 售价分别为 (单位: 元/500克)3.05, 3.31, 3.34, 3.82, 3.30, 3.16, 3.84, 3.10, 3.90, 3.18, 3.88, 3.22, 3.28, 3.34, 3.62, 3.28, 3.30, 3.22, 3.54, 3.30.已知往年的平均售价⼀直稳定在3.25元/500克左右, 在显著性⽔平0.025α=下, 能否认为全省当前的鸡蛋售价明显⾼于往年? (1)问题分析:设总体X ──每500克的鸡蛋价格, 2~(,)X N µσ, 且2σ未知. 今抽得⼀容量为20的样本, 本问题是检验假设: 00100:,:( 3.25)H H µµµµµ=>=.(2) 问题求解:选取检验统计量X t =则0H 的拒绝域为1(1)t t n α->-.>> x=[3.05,3.31,3.34,3.82,3.30,3.16,3.84,3.10,3.90,3.18,...3.88,3.22,3.28,3.34,3.62,3.28,3.30,3.22,3.54,3.30]; >> [h,p,ci,stats]=ttest(x,3.25,0.025,'right')h = 1 p = 0.0114ci = 3.2731 Infstats = tstat: 2.4763 df: 19 sd: 0.2691 (3) 问题结果:由于h = 1, 故接受10:H µµ>, 即认为全省当前的鸡蛋售价明显⾼于往年.3、[h,p,ci,stats] = ttest2(x,y,alpha,tail) 两⽅差相等但未知时, 对两个正态总体均值关系进⾏t 检验. 并可通过指定tail 的值来控制备择假设的类型. tail 的取值及表⽰意义如下: tail='both' 表⽰112:H µµ≠ (缺省值) ; tail='right'表⽰112:H µµ>;tail= 'left'表⽰112:H µµ<. (原假设则为012:H µµ≥)·输出变量含义:stats 包含三个结果:tstat ——t统计量)X Y t =的值;df ——t 分布的⾃由度;sd——两样本的合并标准差w S =.【例3-3(1)】(书P 81例3.6) 某⼯⼚⽣产某种电器材料. 要检验原来使⽤的材料与⼀种新研制的材料的疲劳寿命有⽆显著性差异, 各取若⼲样品, 做疲劳寿命试验, 所得数据如下 (单位: ⼩时) :原材料: 40, 110, 150, 65, 90, 210, 270新材料: 60, 150, 220, 310, 380, 350, 250, 450, 110, 175⼀般认为, 材料的疲劳寿命服从对数正态分布, 并可以假定原材料疲劳寿命的对数ln X 与新材料疲劳寿命的对数ln Y 有相同的⽅差, 即可设21ln ~(,)X N µσ, 22ln ~(,)Y N µσ. 在显著性⽔平0.05α=下, 能否认为两种材料的疲劳寿命没有显著性差异? (1) 问题分析:设总体X ──原材料的疲劳寿命, 211ln ~(,)X N µσ;设总体Y ──新材料的疲劳寿命, 222ln ~(,)Y N µσ, 且22212σσσ==未知.今从两个总体中各抽得⼀样本, 本问题是检验假设: 012112:,:H H µµµµ=≠.(2) 问题求解:选取检验统计量X Y t =, 则0H 的拒绝域为112||(2)t t n n α->+-.>> x=[40,110,150,65,90,210,270];>> y=[60,150,220,310,380,350,250,450,110,175]; >> [h,p,ci,stats]=ttest2(log(x),log(y),0.05,'both')h = 0 p = 0.0626ci = -1.3095 0.0379stats = tstat: -2.0116 df: 15 sd: 0.6414 (3) 问题结果:由于h = 0, 故接受012:H µµ=, 即认为两种材料的疲劳寿命没有显著差异.【例3-3(2)】(浙⼤四版P 187例4) 做以下的实验以⽐较⼈对红光或绿光的反应时间(以s 计). 实验在点亮红光或绿光的同时, 启动计时器, 要求受试者见到红光或绿光点亮时, 就按下按钮, 切断计时器, 这就能测得反应时间. 测量的结果如下表:问能否认为⼈们对红光的反应要⽐绿光快? (显著性⽔平取0.05α=) (1) 问题分析(本题是配对数据检验):设(1,,8)i i i D X Y i =-= 是来⾃正态总体2(,)D D N µσ的样本, 2,D Dµσ均未知. 本问题是检验假设: 01:0,:0D D H H µµ≥<.(2) 问题求解:选取检验统计量D t =则0H 的拒绝域为1(1)t t n α->-.>> x=[0.30 0.23 0.41 0.53 0.24 0.36 0.38 0.51]; >> y=[0.43 0.32 0.58 0.46 0.27 0.41 0.38 0.61]; >> d=x-y; >> [h,p,ci,stats] = ttest(d,0,0.05,'left')h = 1 p = 0.0270ci = -Inf -0.0113stats = tstat: -2.3113 df: 7 sd: 0.0765 (3) 问题结果:由于h = 1, 故接受1:0D H µ<, 即认为⼈对红光的反应要⽐绿光快.4、[h,p,ci,stats] = vartest(x,sigma02,alpha,tail) 均值未知时, 对单正态总体⽅差进⾏2χ检验. 并可通过指定tail 的值来控制备择假设的类型. tail 的取值及表⽰意义如下: tail='both' 表⽰2210:H σσ≠ (缺省值) ; tail='right'表⽰2210:H σσ>;tail= 'left'表⽰2210:H σσ<. (原假设则为2200:H σσ≥)。
《应用数理统计》吴翊李永乐第三章假设检验课后作业

《应⽤数理统计》吴翊李永乐第三章假设检验课后作业第三章假设检验课后作业参考答案3.1 某电器元件平均电阻值⼀直保持2.64Ω,今测得采⽤新⼯艺⽣产36个元件的平均电阻值为2.61Ω。
假设在正常条件下,电阻值服从正态分布,⽽且新⼯艺不改变电阻值的标准偏差。
已知改变⼯艺前的标准差为0.06Ω,问新⼯艺对产品的电阻值是否有显著影响?(01.0=α)解:(1)提出假设64.2:64.2:10≠=µµH H , (2)构造统计量36/06.064.261.2/u 00-=-=-=nX σµ(3)否定域>=><=--21212αααu u uu u u V (4)给定显著性⽔平01.0=α时,临界值575.2575.2212=-=-ααuu ,(5) 2αu u <,落⼊否定域,故拒绝原假设,认为新⼯艺对电阻值有显著性影响。
3.2 ⼀种元件,要求其使⽤寿命不低于1000(⼩时),现在从⼀批这种元件中随机抽取25件,测得其寿命平均值为950(⼩时)。
已知这种元件寿命服从标准差100σ=(⼩时)的正态分布,试在显著⽔平0.05下确定这批元件是否合格。
解:{}01001:1000, H :1000X 950 100 n=25 10002.5V=u 0.05H x u αµµσµα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故⽤统计量:此题中:代⼊上式得:拒绝域:本题中:0.950.950u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信⽔平5下这批元件不合格。
3.3某⼚⽣产的某种钢索的断裂强度服从正态分布()2,σµN ,其中()2/40cm kg =σ。
现从⼀批这种钢索的容量为9的⼀个⼦样测得断裂强度平均值为X ,与以往正常⽣产时的µ相⽐,X 较µ⼤20(2/cm kg )。
[理学]研究生应用数理统计pdf课件第1章
![[理学]研究生应用数理统计pdf课件第1章](https://img.taocdn.com/s3/m/603deedb0408763231126edb6f1aff00bed570ce.png)
19 24 27 32
60
(3). 茎叶图 (Stemplot)
60 5+ 6 5 4+ 6 4 04 3+ 7 3 00011334 2+ 5 5 5 5 6 6 7 7 7 9 9 9 9 2 223333444 1+ 9
1. 分类变量的图表示
分类变量(Categorical Variable) 主要指 这种变量的各个取值没有大小、顺序的区别, 不能做数学运算。
如:性别变量、属性变量等
主要有饼图、条形图两种表示方法
例1.1.1 马萨诸塞州犯罪情况(1993年)
马萨诸塞州地方犯罪情况
33%
无新罪 新罪
67%
马萨诸塞州地方犯罪情况
参数估计 数理统计学最重要的内容之一 利用样本观察值去估计出总体的未知参数
直观上可以利用调查到的 n 个学生的月支出
x1 ,x2 ,…,xn 的算术平均 :
∑ x
=
1 n
n k =1
xk
去估计这所学校学生的平均月支出费用 µ 。
它的合理性在哪? 还有没有其它的办法? 这些不同的方法各有什么样的优缺点?
统计学的目的就是从样本去得出总体的信息。
总体
……..
样本
被研究的对象全体
具有代表性的 部分个体
定义1.1.1 X 是具有分布函数 F 的一个随机变量, 如果 X1,X2 ,…,Xn 是有同一分布函数 F 的 相互独立的随机变量,则称:
X1,X2 ,…,Xn 是从总体 F ( 总体 X ) 中得到 的容量为 n 的简单随机样本,简称为 样本。
Fn (x) =
0,
—k , n 1,
应用数理统计课件

P( AB ) P( A B ) P( A ) P( AB ) P( A ) P( A )P( B ) P( A )(1 P( B )) P( A )P( B )
其他类似可证.
注意 判断事件的独立性一般有两种方法:
① 由定义判断,是否满足公式;
② 由问题的性质从直观上去判断.
P ( A1A2…An) =P(A1)P(A2|A1)P(A3|A1A2)…P(An|A1A2…An-1) 乘法公式一般用于计算n个事件同时发生的概率 19
3. 全概率公式 设Ω是随机试验E的样本空间,事件组 A1,A2,…,An
满足:
(1) Ai Aj (i j);
n
(2)
i 1
Ai
, P( Ai )
A是B的子集,表示若事件A发生,事件B一定发生.
(2) A B(A B),
A与B的并(和).表示事件A,B至少有一个发生.
(3) A B(AB), A与B的交(积).表示事件A和B同时发生.
(4) A B , 表示事件A和B不能同时发生,称A与B互斥 (或互不相容).
(5) A B ,且A B .
(1) Ai Aj (i j);
n
(2)
i 1
Ai
, P( Ai )
0(i
1,2,, n)
则 对于任何一个正概率事件B,有
P(Aj | B)
P(Aj )P(B | Aj )
n
( j 1,2,..., n)
注:
P( Ai )P(B | Ai )
i 1
1.以上两个公式中的A1,A2,...,An可以看作是导致事件B
0(i
1,2,, n)
则 对于任何一个事件B,有
应用数理统计课件

SPSS在统计中的应用
数据输入与管理
SPSS提供了数据编辑器,方便用户输入和 管理数据。
描述性统计
SPSS可以进行描述性统计,包括频数、均 值、标准差等计算。
高级统计分析
SPSS支持多种高级统计分析方法,如回归 分析、因子分析、聚类分析等。
报告生成
SPSS可以将分析结果导出为各种格式的报 告,方便用户进行汇报和交流。
季节性指数
计算时间序列的季节性指数,通过比较不同时间段的数据,了解季 节性变化对整个序列的影响程度。
季节性图
绘制时间序列的季节性图,直观地展示时间序列的季节性规律和变 化趋势。
08 统计软件应用
Excel在统计中的应用
描述性统计
Excel提供了丰富的函数和工具,可以 进行平均数、中位数、众数、方差、标
应用数理统计课件
目录
CONTENTS
• 引言 • 概率论基础 • 统计推断 • 回归分析 • 方差分析 • 多元统计分析 • 时间序列分析 • 统计软件应用
01 引言
什么是应用数理统计
定义
应用数理统计是一门将数学原理和统 计方法应用于实际问题求解的学科。 它利用概率论和数理统计的理论,通 过对数据的收集、整理、分析和推断 ,为决策提供依据。
03 统计推断
点估计
总结词
点估计是一种用确定的数值对未知参数进行估计的方法。
详细描述
点估计的基本思想是用一个数值来近似表示未知参数的值。常见的点估计方法包括最大似然估计和最小二乘估计 等。这些方法通过构造适当的统计量,使得估计的参数值尽可能地接近真实值。
区间估计
总结词
区间估计是一种给出未知参数可能取值范围的方法。
核心概念
应用统计学:经济与管理中的数据分析(PDF)

x1
log
x2
log
xn
1 n
n i 1
log
xi
3-7
• 例:某钢厂2004年的钢产量为100万吨,2005年的钢产 量为110万吨,2006年为132吨,2007年为165吨。试求 该钢厂2005~2007年钢产量的年平均发展速度。
xG 3 x1 x2 x3 3 110%120%125% 118.17%
一、数值平均数:算术平均数(arithmetic mean)
• 定义:一个数据集的算术平均数,称为平均数, 也称为均值(mean)。
n
x
所有x值之和 观察值个数
xi
i 1
n
• 优点:最简单、最常用的数据集中趋势代表值。 • 缺点:容易受极端数值的影响。 • 均值的解释:数据集分布“质量中心”。
3-3
3-13
• 确定四分位数: • ① 以递增顺序排列原数据(即从小到大排列) • ② 计算项次数i
i p n 100
• 计算Q1,取p=25; • 计算Q2,取p=50; • 计算Q3,取p=75。 • ③ 若i为整数,则取第i、i+1项的平均值; • 若i为非整数,则取i向上取整。
3-14
§3.2 数据分布离散程度的测度 (Measures of Data Variation)
• 品质数据:异众比率 • 数量数据:极差 • 数量数据:四分位差 • 数量数据:方差 • 数量数据:标准差 • 数量数据:变异系数
一、品质数据:异众变化率(Variation Ratio)
• 定义:非众数组的频数占总频数的比例。 众数组的频数
合计
组中值(x i) 频数(f i)
775
应用数理统计_3版(孙荣恒编著)PPT模板

4.3.1正交表
3
4.3.2正交表的分析
2
§4.2*双因素方差分析
4.2.1数学模型 4.2.2方差分析
4
习题四
第五章线性回归模型
第五章线性回归模 型
§5.1线性模型 §5.2最小二乘法估计 §5.3检验、预测与控制 §5.4带有线性约束的线性回归模型 习题五
第五章线性回归模型
§5.2最小二乘法估计
5.2.1β的最小二乘 法估计
5.2.2最小二乘法估 计量的性质
5.2.3例子
第五章线性回归模型
§5.3检验、预测与控制
5.3.1线性 模型与回归 系数的检验
5.3.2预测 与控制
第五章线性回 归模型
§5.4带有线性约束的线性回归模 型
5.4.2βH的 性质
5.4.1拉格 朗日乘子法
5.4.3对假设 H0:Hβ=d的 检验
计
0 5
2.5.5先验分布
的选取
0 6
2.5.6最大后验
估计
第二章参数估计
§2.5贝叶斯(Bayes)估计
02
2.5.8离散型分布 中参数的贝叶斯估
计与极大似然估计
01
2.5.7贝叶斯区间
估计
第二章参数估计
§2.6截尾寿命试验中指数分布和几何分布的参数估计
A
2.6.1指数 分布中参 数的点估
计
B
§1.2多元 正态分布 与正态二
次型
§1.3抽 样分布
定理
§1.4分 位数
习题一
第二章参数估计
第二章参 数估计
0 1
§2.1点估计常用 方法
0 2
§2.2评价估计量 好坏的标准
工科研究生“应用数理统计”课程的教学大纲及教学日历

“应用数理统计”课程教学大纲(B)序号:课程编号:课程名称:应用数理统计/ Mathematical Statistics with Application学时:40学分:2责任教师:适用专业:材料物理与化学、材料科学与工程、材料学、材料加工工程、建筑技术科学、化学工程与技术、生物学、药剂学、采矿工程、矿物加工工程、安全技术及工程、资源综合利用工程、安全管理工程、环境科学与工程等.先修课程:高等数学(二)、线性代数.课程教材:杨虎,刘琼荪,钟波. 数理统计[M]. 北京: 高等教育出版社,2004年10月.参考资料:1. 孙荣恒. 应用数理统计[M]. 北京: 科学出版社, 2003年.2. Irwin Miller, Marylees Miller. 数理统计与应用[M]. 北京: 清华大学出版社(影印版), 2005年1月.3. 吴喜之. 统计学——从数据到结论(第二版)[M]. 北京:中国统计出版社,2006年10月.4. 杨虎, 刘琼荪, 钟波. 概率论和数理统计[M]. 重庆: 重庆大学出版社,2007年6月.一、课程的性质、目的和任务统计方法是现代工程、信息、社会和经济问题研究的基本方法,学习统计思想和运用统计方法已成为时代的要求。
数理统计是工科研究生的公共基础课,本课程的教学目标是使学生在掌握概率统计的基本理论知识和基本方法的基础上,随机性思维和统计数据分析能力得到培养,最终能理论联系实际,提高运用数理统计分析工具理解专业领域知识、从事深层次专业研究与应用的能力。
二、课程的教学内容和基本要求1.概率论基本知识(10学时)(1)明确概率论的研究对象、研究内容;(2)理解样本点、样本空间、随机事件、随机变量、概率分布的概念,理解这些概念在研究随机现象及其统计规律中的作用;(3)掌握一元随机变量分布的性质和计算方法;(4)理解多元随机变量的联合分布与边缘分布的概念,掌握边缘分布计算方法,在独立条件下会利用边缘分布求多元随机变量的联合分布;(5)理解随机变量数字特征的含义,掌握数字特征的基本性质,会计算数字特征;(6)掌握常见分布及其性质和数字特征,掌握正态分布的性质和计算方法。
应用数理统计习题答案

2214243.(1)[||]0.140(2)[||]0.144(,4),(,),(0,)[||]20.1800255(3){||0.1}2(10.9521.9615372tnE a D nnE aN a N a t a NnnE t t dtnP t Pnξξξξξξπ-+∞-==≤⇒=-≤=-==≤==≤=≤=Φ-≥=⇒≥⎰《应用数理统计》参考答案习题一0.51.(,0.5)(,){||0.1}0.9972.97442N a N anP a Pnξξξξ⇒-<=<==⇒=2242.(,4)(,)100||(1)(||)()0.90,0.330.20.2(2):P(||)N a N aa UP a U P Uaξξξξσξεε⇒--<=<==-≥≤挈比学夫不等式(5)(5)125515(3){15}1{15}1{15,15,,15}1215121[{}]221[1(1.5)]0.292P P P P ξξξξξξ>=-≤=-≤≤≤--=->=--Φ=1121212111()(1){}{,,,}{1,1,,1}()()(1)(1)k n n nn m nm n m n m ni i P k pq P M m P m m m P m m m pqpq q q ξξξξξξξ----======≤≤≤-≤-≤-≤-=-=---∑∑4.5. 6. 13.0)25(1}8.012138.012{}13{)54,12(~)1()4,12(~=Φ-=->-=>ξξξξP P N N (1)(1)1255511515(2){10}1{10}1{10,10,,10}1[{10}]1[1{10}]1210121[1{}]221[11(1)]0.579P P P P P P ξξξξξξξξ<=-≥=->>>=->=--≤--=--≤=--+Φ=6(1)0.001567.2800~(0.0015)(1){800}[{800}][0.0015]x E P P e dx e ξξξ∞-->=>==⎰6(6)30000.00156 4.56(2){3000}[{3000}][0.0015](1)x P P e dx e ξξ--<=<==-⎰1212(2){}{,,,}{1,1,,1}n n nn P K k P k k k P k k k ξξξξξξ==≥≥≥-≥+≥+≥+7.8.均值的和(差)等于和的均值,方差的和差都等于方差的和9.由中心极限定理:10.11.22222(1)(1)(1)()222~()()()[()](,)it itit n e n n e n e it i t t tn it it n n nn p t e t t ee n e e e N n λξλλξξλλλλλξλϕϕϕλξλ---+--∴=∴======∴12121233~(20,3),~(20,),~(20,)10151~(0,)2{||0.3}1220.67N N N N P P ξξξξξξξξξ-∴->=->=-Φ=2(),(),E a D ξξσ==121(0,1)(0,1)~(,)n n i i i ni i na a n N N N a n nξξσξσξ==--∴∴=∑∑∑22222222,(),()()(),(),(),(,)k k k k k k k k k k k k k kk k E a E a D E E a a a a E A a D A n a a A N a nξξξξξ===-=--∴==-∴22121212222(),()(),()0,()()()2,()()()2,i i E E a D D E D D D E E D ξξξξσξξξξξξσξξξξξξσ====∴-=-=+=∴-=-+-=13.14.15.16.2212221221,(),(),()()0,()()()(1),11[()](1)1niii ii i iniiniiE a E a D DnE D D DnDn D nDES n Dn nE ES Dn n nσξξξσξξξξξξξσξξξξξξξ=======∴-=-=+--===--==--∑∑∑222222222424222(1),11()(1)()2(1)21 ()2(1)() nsnns nE n Es On nns nD n Ds On n n χσσσσσσσ--=-⇒==+-=-⇒==+112323''' '2(121)(1)()()()()5231()(121)23023021AD E E E EA E E A AVar Aξξξξξξηξηηηηηξξξξξ⎛⎫⎪-+=-==⎪⎪⎝⎭=--=--⎛⎫⎛⎫⎪⎪==--=⎪⎪⎪⎪⎝⎭⎝⎭11223''''110(2)(,)111()()()()5231()(121)23023021BE E E EB E E B BVar Bξηηηξξξηηηηξξξξξ⎛⎫⎛⎫ ⎪===⎪ ⎪⎝⎭ ⎪⎝⎭∑=--=--⎛⎫⎛⎫⎪⎪==--=⎪⎪⎪⎪⎝⎭⎝⎭11222211()2822121(2)||2241128116xx xxe dx dxπ⎛⎫⎛⎫- ⎪⎪∞∞⎝⎭⎝⎭-∞-∞-=∑-⎛⎫⎛⎫∑==⎪ ⎪-⎝⎭⎝⎭⎰⎰17.18.21.22.()11223'122'111110(,),211151,1101221111111100130111100310110N A A AAA Aξηξηξηηθθ⎛⎫⎛⎫⎛⎫ ⎪⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪⎝⎭∑⎛⎫⎛⎫⎛⎫⎪==⎪ ⎪⎪⎝⎭⎝⎭⎪⎝⎭⎛⎫⎛⎫⎛⎫⎛⎫⎪⎪∑=-=⎪ ⎪⎪⎪⎝⎭⎝⎭⎪⎪⎝⎭⎝⎭‘=,由引理1.2.3,则-的联合分布为--11223''12111111~(,),1011111432111111121301111210.2N A A AA Aξηξξηξηθρρρρρρρρρηη⎛⎫⎛⎫⎛⎫ ⎪⎪ ⎪ ⎪-⎝⎭⎝⎭ ⎪⎝⎭∴∑⎛⎫⎛⎫+--⎛⎫⎛⎫⎪⎪∑=-=⎪ ⎪⎪⎪---⎝⎭⎝⎭⎪⎪-⎝⎭⎝⎭∴--=⇒=-==A,--时与独立2''44''22'''''' 44224(0,)(,)()()2()()()()()cov(,)(,)()() ()()2()()()2()nN IE A B tr A tr B tr ABE A E B tr A tr BA B E A B E A E Btr A tr B tr AB tr A tr B tr AB ζσζζζζσσζζζζσσζζζζζζζζζζζζσσσσσ=+=∴=-=+-=()11112222121122,1,1,0822177,122477yay y Qyba babθθθθθθθ--⎛⎫⎛⎫--=⎪⎪-⎝⎭⎝⎭⇒===-=⎛⎫⎪⎛⎫⎛⎫∴=∑== ⎪⎪ ⎪⎪⎝⎭⎝⎭⎪⎝⎭23.24.又 则令 则与 独立,则 与独立,且26.则2212221~(,),~(0,),~(1),(0,1)/(1)n n N a N n n ns n N T t n σξξξσξξχσξξ++----=-'11111(,,),(,,)111(,,),()11n n n ij n n n n i i i ia a B D nn n ξξθξσσσσδσσ⨯======-∑∑'2,0,D D D BD ===221(,)(,)1()n ni i nnB N a N I ηξθσσ===∑,i i i aξγσ-=2'11,()()()ni i i a D n ηγζγγξθξθσ=-==-=--∑∑B nηξ=ξηζ)1(~2-n χζ11(,)22U ξθθ-+(1)()121111221111()2201()121()()[1()]1[]21()()[()][]2(,)(1)()()[()()](1)[]n x n n n n n n n x f x other F x dx x f x nf x F x n x f x nf x F x n x f x y n n f x f y F y F x n n y x ξξθξξθθθθθ-------⎧-<<+⎪=⎨⎪⎩==-+∴=-=⋅⋅-+==⋅+-=--=⋅-⋅-⎰27.33.2222122222212222(0,),1()||2 ()()()()22(1)iyniniiY a NE d Y dynaD dE d E d Ennn nσξσσξσσσπσσσππ-∞-∞===-==-=-=-=⋅-=-∑⎰∑2222122122210.3(0,0.3),(0,)1010()(9)0.310()100.18{}0.30.3{(2}0.01iniiniiniN NPPξξξξχξξξ===--⨯<=<=∑∑∑222(2)(0,1),(1)0.3(9){0.9}0.9932nsN ntP Psnξχσξξξ--<=<=12121222221221212(3)(0,0.18),(0,0.18)(0,1),(0,1)0.18(1),()(1)0.18{()40}0.9N NN NPξξξξχχξξξξ+-+-+<=-224132244(4)~(1),~(0,0.12),10.73 {10.73}{}0.95NP Pξχξξξξ-<=<=34.《应用数理统计》参考答案2211222212222211(1)(0,),(0,)(1),()(1)11,()()(2)nn miii i n nniii nn mi i i i n N n N m n m m a b n m a b n m ξσξσξξχχσσσξξχ+==+=+==+--==++-∑∑∑∑∑∑222211112(2)(),(0,)(0,1),/(),n mni ii n i nniii i i m N n N t m c m n ξχξσσξξσσ+=+===∴=∑∑∑∑∑2222221121221(3)(),()()/(1,1),/nn mi i i i n ni i n mi i n n m n mF n m d nm ξξχχσσξσξσ+==+=+=+--∴=∑∑∑∑1. 由矩估计法2. (1) 由矩估计法(2)(3)(4)(5)818226212266174.00281610(74.002)88610 6.85710181ii i i a X x S x n S S n σ=-=--⎧===⎪⎪⎨⎪==⨯=-⎪⎩∴==⨯⨯=⨯--∑∑11'1202()33A x EX x dx θαξθθαξθθξ==-====∴=⎰111'101(1)2211A EX x x dx θαξθαθξθξθξ==+==+==+-∴=-⎰1211211122222221212222222121112()2x x n i i e xdx e x dx A X n A S S S θθθθθθαθθξθαθθξθξθξθθξθξθ--+∞--+∞==⋅=+==⋅===+∴=+==-+⎧=-⎪∴⎨=⎪⎩⎰∑⎰111(1)122Ni N NA x N NN ξξ=+===⋅⇒=∑11102()1A dx ξξθξ===⇒=-⎰2∞3.4.2()2{0},(){0}{}()0.7,110.7,0.525x aA X AP A P dxa aP a pp aξξξ--=<=<=--=<=Φ-=≈∴≈=-⎰设表示出现的次数,(1)11111(1)()ln()[ln ln(1)ln]ln()1[ln ln]ln ln0 ln lnniiniin ni ii iniiL c xL c xLc x n c xnnx n cθθθθθθθθθθθθθ-+=======+-+∂=+-=+-=∂=-∏∑∑∑∑1111221(2)()ln()[ln1)ln]ln()]0(ln)niniiniiniiLL xLxnxθθθθθ======+∂=+=∂=∑∑∑11()()()()11(3)()ln()lnln()11,,,,()0,0,11,()()nnin nn nnn nnnLL nL nLother otherL Lθθθθθθθθξξθξθθθθθξθξθξ====-∂=-=∂⎧⎧≤≤⎪⎪==⎨⎨⎪⎪⎩⎩≤≤=∏11()()()()11(3)()ln()lnln()11,,,,()0,0,11,()()nnin nn nnn nnnLL nL nLother otherL Lθθθθθθθθξξθξθθθθθξθξθξ====-∂=-=∂⎧⎧≤≤⎪⎪==⎨⎨⎪⎪⎩⎩≤≤=∏5.221()212212241(5)()()ln()[ln]22()2()ln()[022in xiniini iiLxLx xLθθθθθθθθθθθθθξθ--====-=-----∂==∂=∑∑(1)11(1)11(1)(1)(6)()ln()[ln ln(1)ln]ln()(),,,()()nc ciiniinc ci niL c xL c c c xL ncL c xL Lθθθθθθθθθθθξξθξθξ-+==-+===--+∂=-=∂=≤≤⇒=∏∑∏不能解出,所以由22111(7)()1)(1)ln()[2ln(2)ln(1)ln(1)]2ln()22]01inxiini iiniiL xL x xx nL nθθθθθθθθθθθξ-====--=+--+--∂=-=⇒=∂-∏∑∑(11max(1)~(,0)11(1)(),,,0(),()()nnniULL Lξθθθξξθθθξθθ==-=<<-=≤∏6.7.所以不唯一。
应用数理统计习题

考试方式:《应用数理统计》包括(1)在《实用统计方法》教材或这里所列的部分习题中完成5题(题目要至少分散在3章以上)写出计算程序计算结果,用doc 或pdf 文档发送到 zhang-hh@ ,占30%;(2)结合自己的专业,写一篇统计方法的应用,或介绍一些新的统计方法等小论文,篇幅不限,论文要标注参考文献,占70%。
《数据统计分析》包括(1)在《实用统计方法》教材或这里所列的部分习题中完成5题(题目要至少分散在3章以上)写出计算程序计算结果,用doc 或pdf 文档发送到zhang-hh@ ,占30%;(2)闭卷或开卷考试,占70%。
参考教材:《实用统计方法》 西安交通大学 梅长林等 科学出版社 2002。
部分习题第一章 多元回归分析1.4某种化工产品的得率Y 与反应温度1X ,反应时间2X 及某反应温度3X 有关。
设对于给定的1X ,2X ,3X ,得率Y 服从正态分布且方差为常数。
近得实验结果如下,其中1X ,2X ,3X 均为两水平变量且编码形式表达。
(1)对Y ,拟合以1X ,2X ,3X 为自变量的线性回归模型,求出回归参数估计值及残差。
(2)给定显著水平05.0=α,检验回归系数的显著性。
(3)对05.0=α,检验各自变量对Y 的影响的显著性。
1.7为了研究人们对某种品牌食品的喜爱程度Y 和该食品的水分含量1X ,甜度2X 的关系,,进行了一个完全随机化设计的小规模试验,得到下列数据:(1) 拟合回归模型i i i i X X Y εβββ+++=22110,写出回归方程,问其中的∧1β如何解释。
(2) 求出残差向量,分别作出残差关于拟合值∧Y , 1X , 2X 及1X 2X 的残差图及残差的正态概率图。
分析这些残差图并给出你的评述。
(3) 设误差项()16,2,1 =i i ε独立同分布于()2,0σN ,在01.0=α的水平上检验回归关系的显著性。
写出假设、检验准则及结论并求检验的p-值。
应用数理统计

历年整体式橱柜销售量与同期一级市场商品房销售量的关系研究摘要:客观现象之间总是普遍联系和相互依存,反映这些联系的数量关系分为确定性关系和不确定性关系,在不确定性关系中作为影响因素的变量称为自变量,受自变量取值影响的相应变量为因变量。
本文为研究历年整体式橱柜销售量与同期一级市场商品房销售量两者是否具有相关性,通过假设商品房销售量为自变量,橱柜销售量为因变量,再根据某城市统计部门提供的数据,通过线性回归分析对二者的关系进行分析,得出了历年整体式橱柜销售量与同期商品房一级市场销售量之间的相关性。
一、 提出问题调查历年整体式橱柜销售量与同期商品房一级市场销售量的相关信息,搜集记录相关资料数据,运用线性回归分析二者的关系。
二、搜集数据注:数据来自课本《工程经济学(第二版)》三、建立模型3.1原理:用来概括两类变数互变关系的线性方程称为线性回归方程。
这一方程的通式为x y 10ββ+= ,上式叫做y 依x 的直线回归。
其中x 是自变数y是依变数y 的估计值,0β是0=x 时的y值,即回归直线在y 轴上的截距,称为回归截距,1β是x每增加一个单位时,y 将平均地增加(01>β时)( 01<β时) 1β个单位数,称为回归系数或斜率。
要使x y 10ββ+=能够最好地代表Y 和X 在数量上的互变关系,根据最小平方原理,必须使min121012)()(Q x y y y Q nn=--=-=∑∑ββ,将Q 看成两个变数0β与1β的函数,应该选择0β与1β,使Q 得到最小值,必须求Q 对0β,1β的一阶偏导数,且令其等于零,即得:⎪⎩⎪⎨⎧=+=+∑∑∑∑∑xyx x yx n 21010ββββ,解得∑∑∑∑∑∑∑---=--=2221)())(()(1))((1x x y y x x x n xy x n xy βxy nxny110βββ-=-=∑∑。
解得的1β中分子∑--))((y y x x 是x 的的离均差与y 的离均差乘积总和,简称乘积和,可记为xy l ,分母是x 的离均差平方和,也可记为xx l 。
应用数理统计课件

目录
• 引言 • 基础知识 • 描述性统计方法 • 推断性统计方法 • 实验设计与数据分析案例
目录
• 质量控制与可靠性评估方法 • 总结与展望
01
引言
数理统计简介
01
定义
数理统计是应用概率论对数据 进行收集、整理、分析和推断
的数学学科。
02
发展历程
介绍数理统计的历史背景、发 展过程和重要里程碑。
假设检验原理及应用举例
01
原假设与备择假设
明确待检验的假设,设定原假设 和备择假设。
03
拒绝域与显著性水平
设定拒绝域和显著性水平,判断 原假设是否成立。
02
检验统计量
根据原假设选择合适的检验统计 量,如Z检验、t检验、χ²检验等
。
04
应用举例
通过实际案例展示假设检验的应 用,如检验两种不同教学方法的
01
数据清洗
去除异常值、缺失值和重复值,确 保数据质量。
推论性统计
运用假设检验、方差分析等方法, 推断实验结果的可靠性和有效性。
03
02
描述性统计
计算均值、中位数、标准差等指标 ,以描述数据的基本特征。
可视化展示
利用图表直观展示数据分布和趋势 ,便于理解和分析。
04
实际案例展示与讨论
案例一
某种新药的临床试验。通过 随机双盲对照实验,比较新 药与安慰剂对病患的疗效差 异,并运用统计方法进行数
效果是否有显著差异。
方差分析与回归分析简介
01
方差分析
02
回归分析
研究不同因素对观测变量影响的显著性,判断因素之间是否存在交互 作用。例如,分析不同品种、不同施肥量对农作物产量的影响。
应用数理统计讲义(2024版)

x (x1,
, xn ) Rn为随机向量X (X1,
,
X
)的联
n
合分布函数。
联合分布函数有下列性质:
1.
lim
xi
F
(
x1
,
, xn ) 0, i 1, 2,
,n
x1
,
lim ,xn
F
(
x1
,
, xn ) 1
F (x1, , xn ) [0,1]
2.对每个变元,F (x1, , xn ) ,右连续;
>0,若DX ,则有
P(| X EX | ) DX orP(| X EX | ) DX
2
2
6.许瓦兹(Schwarz)不等式
若EX 2 , EY 2 ,则
[E( XY )]2 EX 2EY 2
7.单调收敛定理
若0 X n X ,则
lim
n
EX n
EX .
§4 常用分布族
1
,
x
0,
0
, x 0.
其中参数n称为自由度。
推论 2分布具有下列性质:
(1)若X ~ 2 (n),则EX n, DX 2n;
(2)分布可加性:设X ,Y相互独立,且
X ~ 2 (m),Y ~ 2 (n),
则X Y ~ 2 (m n)
定理4 设X1, , X n是相互独立,且都服从正态分布N (0,1),则 随机变量
2r
(x
1 )( x 1 2
2
)
(x
2
2 2
)2
.
X (x1, x2 ), E( X ) (1, 2 ),
V D(X )
12
应用数理统计

应⽤数理统计解:(1)~()X Exp λ,则X 的概率密度为,0 (;)0,0x e x f x x λλλ-?>=?≤?故λ的似然函数为11()(),(0,1,2,,)niii nx x ni i L eex i n λλλλλ=--=∑==>=∏对数似然函数为1ln ()ln ni i L n x λλλ==-∑令1ln ()0n i i L x n λλλ=?=-=?∑解得11nii nxxλ∧====(2)~(,)X U a b ,X 的概率密度为1,(;,)0,a x b f x a b b a ?≤≤?=-其他由于12,,,n a x x x b ≤≤ ,等价于(1)(),n a x x b ≤≤。
作为a,b 的函数的似然函数为(1)()1,,()(,)0,n na x xb b a L a b ?≤≤?-=?其他于是对于满⾜条件(1)(),n a x x b ≤≤的任意a,b 有()(1)11(,)()()n nn L a b b a x x =≤-- 即(,)L a b 在(1)(),n a x b x ==时取到最⼤值()(1)()nn x x --。
故a,b 的极⼤似然估计值为(1)(),n a x b x == a,b 的极⼤似然估计量为(1)(),n a X b X == (3)θ的似然函数为1111()()()nnnii i i L xx θθθθθ--====∏∏,其中12(0,,,1)n x x x <<对数似然函数为1ln ()ln (1)(ln )nii L n x θθθ==+-∑ln nii nxθ==-∑故θ的极⼤似然估计量是1ln nii nXθ==-∑(4)β的似然函数是11111()()(1)![(1)!]ni i i knknnx x k k i in i i L x e x e k k βββββ=----==∑??== ?--??∏∏,其中,12(,,,0)n x x x >对数似然函数11ln ()ln ln[(1)!](1)ln n niii i L nk n n k x xβββ===--+--∑∑令1ln ()0ni i L nk x βββ=?=-=?∑i nkkxxβ===∑ 故β的极⼤似然估计量是?k Xβ= (5)a ,λ的似然函数为),,,(,),(21)(1)(11a x x x eee a L n nax n a x n ni a x ni i ni i i >∑=∑====+---=--∏λλλλλλλλ由上式易知,)1()()min(x x a i =≤,当)(!x a =时,),(a L λ取最⼤值,通过对数似然函数对λ求偏导,令其等于0,解得)1(111?x x a x naxnni i-=-=X x -=λ,a 的极⼤似然估计量为)1(?X a= (6)X 的分布律为m x p p C x X P x m xxm ,1,0,)1(}{=-==-故似然函数为∑-?∑=-===-=-=∏∏ni ini ii ii i x m n x ni x mx m x ni x mp pC p p Cp L 11)1()(])1([)(11对数似然函数)1ln()(ln )(ln )(ln 111p x m n p x Cp L ni i -∑-?+∑+====∑令01)(ln 11=-∑-?-∑===p x m n p x p L dp d n i ini i 解得p 的极⼤似然估计值mx nmx pni i =∑==1所以p 的极⼤似然估计量mXp=?解:因X 的概率因数为1{}(1)k P x k p p -==- (1,2,)k =∴P 的似然函数为: 111()(1)(1)(1)nii i nx x n ni L P p p p p p =--=∑??=-=--??∏对数似然函数1()()(1)ni令()0Ln p p= 1111011ni i n n x p p p =∴+-=--∑ 1px=, 所以p 的极⼤似然估计为1?px=.2.6 解: (1) 2.14 2.090.05R =-=故50.4299*0.050.214950.0215Rd σ===≈ (2) 分为三组2.14 2.10 2.152.13 2.12 2.102.13 2.10 2.152.12 2.14 2.132.11 2.14 2.102.11 2.15 2.10 1230.050.050.05R R R === 61(0.050.050.05)0.0530.3946*0.050.0197R R d σ=++====2E(X)=+1-/2=0.5D(X)=1/12(b-a)1/12()(1/)1/**0.50()0.5()()2()2/**0.5i E X E n X n n X E X X YE Y E X E X n n X θθθθθθθθθθθθ===≠=====∑(1)所以,是的⼀个有偏估计量偏差是-=-(2)取22所以,2是的⼀个⽆偏估计()()333333E E X X EX EX µµµµ=+=+=+= 21232()55E EX EX µµ=+= 31211()22E EX EX µµ=+= 所以,1?µ,2?µ,3?µ都是µ的⽆偏估计量。
数理统计应用数理统计

104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
291
292
293
294
记
1 n
s i 1
ni i
,i i
s
那么
yij i ij , 其中 nii 0. 〔效因模型〕
i 1
H0 : 1 2 s
等价于
H0 :1 2 s 0
s
1 ns
记总观察次数 n ni ,组平均值
i 1
yi ni
yij
j 1
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
大家有了上述SAS语言的根本知识后,将比较容易学习后面 的各类SAS过程.如果读者还需要进一步掌握复杂的SAS程序以 及较全面的SAS根底知识的话,可查阅以下参考文献:
565
SAS主要模块
SAS/Enterprise Reporter----数据转换和报表生成工具; SAS/IntrNet----网络效劳软件包; SAS/STAT----实用数理统计分析方法; SAS/QC----全面质量管理系列工具; SAS/ETS---计量经济学和时间序列分析方法; SAS/ACCESS----数据存取工具; SAS/CONNECT----远程网络连接工具包; SAS/OR----运筹决策优化及工程管理; SAS其他的解决方案;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 无偏性
定义 设 X ( X 1 ,, X n ) 为从某个总体{ F , }
中抽取的样本 , g( ) 是定义于参数空间 上的已知 ˆ(X ) g ˆ ( X 1 , , X n ) 是 g( ) 的一个估计量 函数. g , 如果
ˆ ( X )) g( ), , E ( g
所以消费者选用甲厂家的产品
9
ˆ1 ( X ) g ˆ 1 ( X 1 ,, X n ) 和 g ˆ2(X ) 定义 设 g ˆ 2 ( X 1 , , X n )是 g( ) 的两个不同的无偏估计 g , 如果
ˆ 1 ( X )) D ( g ˆ 2 ( X )), , D ( g
2
,EX
2 2 2
2
1 2 EX i X , n
n n1 2 故 EYi , n
2,
由大数定律,有
n 2 2 2 P lim S P lim Y 1, n n n 1
3. 设总体 X ~ Exp(1 ), x1 ,, xn 是样本, 试证 x 和 nx(1) 都是 的无偏估计 , 并比较其有效性.
18
1 1 2
ˆ ) E( ˆ ) ,即 ˆ 与 ˆ 为 的无偏估计 解 : 首先, E( . 1 2 1 2 ˆ )2 D( 1
2
n
ˆ ) ( n 1), 故 ˆ 比 ˆ 有效. D( 2 2 1
10
3. 相合性 意义
相合性被认为是对估计的一个最基本要求, 如
ˆ ( X ) 为 的 强相合估计(strong consistent 则称 n eatimation).
12
证明方法
弱相合性
强相合性
定理 1, 2
大数定律 是 的一个估计量,若
定理1 设
则
是 的弱相合估计.
13
证明见补充材料
定理2 若
分别是1, …, k 的相合 是 的弱相合估计.
ˆ ( X ) 为 g( ) 的一个无偏估计 则称 g , 否则称为有偏估计 .
6
含义
ˆ ( X ) 的正负偏差在概率上平 g 均起来为0.
① 无系统偏差
② 估计量在多此重复使用下接近真值
例 某工厂生产一种产品 , 从长期来看废品率稳定 在 p0 .某商店每日从该厂进货 , 每批 N 件, 每件 a 元.双 ˆ , 则商店付给工 方协定 : 若某日抽样 p0 的估计值为 p ˆ )a 元.这时 p ˆ 相对 p0 可能偏高也可能偏低 厂 N (1 p , ˆ 为 p0 的无偏估计 因而有一方要吃亏 .但从长远看 ,若 p , 则平均来说哪一方也不 吃亏.
估计, =g(1 , …, k )是1, …, k 的连
续函数,则
例 设 x1 ,, xn 是来自正态总体N ( , 2 ) 的样本,
试证:X , S 2 分别为 , 2 的相合估计 .
证:(1) 由大数定律,有
P lim X 1, n
根据定义,显然X 为 的相合估计 .
14
n 1 2 2 ( 2) S 2 ( X X ) , 设 Yi ( X i X ) , i n 1 i 1
2 则 E(Yi ) E( X i X )2 EX 2 2 E X X E X i i
其中,EX i2
4
问题:
ˆ , ˆ , ˆ 哪个好? 同样作为 的估计, 1 2 3
是否有评价估计量优劣 的标准?
回答: 有,而且标准不唯一。
在不同的标准下,同一参数的最优估计可能不同.
常用的评价标准:
无偏性, 有效性, 相合性, 渐近正态性.
5
点估计的优良性准则
ˆ( X ) 的平均值与 估计量 越近越好 ˆ( X ) ) | 越小越好 | E(
果一个估计量, 在样本量不断增大时,它都不
能把被估参数估计到任意指定的精度, 那么这 个估计是很值得怀疑的。 通常, 不满足相合性 要求的估计一般不予考虑。
相合性的精确描述
ˆ (X ) ˆ ( X ,, X ) 随着样本容量n 的增加, 估计量 n 1 n 与待估参数 的偏差越来越小 .
11
定义1 设 ∈Θ为未知参数, 是 的一个估计量,n是样本容量,若对任何一
个ε> 0,有 则称 为 参数的弱相合估计(weakly consistent estimation).
定义2 若对任何 , 有
ˆ (X ) P lim 1, n n
例如,从某城市居民年 收入的调查中,估计该 市 居民的年人均收入为 18250元,这是一个点估计 . 若估计年人均收入在 16350元到19850元之间,这 就是一个区间估计 .
3
点估计 定义 设 X ( X 1 ,, X n ) 为从某个总体中抽取的
ˆ(X ) g ˆ ( X 1 , , X n ) 是样本的函数 样本, g (统计量), ˆ ( X )作为g( )的估计, 称为点估计 用g (point estimation).
估计的方法
ˆ ( X )的取法有很多。 对同一个未知参数 g( ), 其估计g
例如,设 X 1 ,, X n 是取自总体F 的样本.设参数
E ( X ),则对 可作出如下估计:
1 ˆ ˆ m . ˆ 1 X ; 2 ( X (1) X ( n) ); 3 0.5 2
且至少存在一个 , 使严格不等号成立 , 则称 ˆ1( X ) 比 g ˆ 2 ( X ) 更有效. g
例 设 X 1 , , X n 为取自总体F 的一个样本 , 设总体 均值为 和方差为 2 都存在, 同作为总体均值为 ˆ X , ˆ X 的有效性. 的估计, 比较
无偏性保证从长远来看是公平的 .
7
例3.1.1 设 X 1 , , X n 是取自期望为 ,方差为 2 的总体的一个样本 .证明 : 样本方差 S 2 是 2 的无偏 估计.
证:
8
2. 有效性
ˆ, ˆ 对无偏估计 1 2
二阶中心矩(方差)越小越好
例如,甲乙两厂生产的电视机平均使用寿命都是 20年.甲厂的产品质量比较稳定,最低使用寿命18 年,最高22年;而乙厂的产品质量稳定性较差,最 低使用寿命10年,最高30年.如果你是消费者,选 用哪个厂家的产品? 方差大 稳定性差; 方差小 稳定性好
1 1 1 ˆ 1 x1 x 2 x3 ; (1) 2 3 6 1 1 1 ˆ 2 x1 x 2 x3 ; ( 2) 3 3 3 1 1 2 ˆ 3 x1 x 2 x3 . ( 3) 6 6 3
17
2. 设 x1 , , xn 是来自均匀总体 U ( , 1) 的一个样本 , 1 ˆ 1 n ˆ ˆ (1) 验证 1 x , 2 x(1) , 3 x( n ) 2 n1 n1 都是 的无偏估计 ; ( 2) 比较上述三个估计的有 效性.
根据定义, S 为 的相合估计 .
2 2
15
例 设 x1, x2 , …, xn 是来自均匀总体U(0, )
的样本,证明 x(n) 是 的相合估计.
证: 由次序统计量的分布,知 x(n)的p.d.f.为
由定理1可知,x(n)是 的相合估计.
16
§3.1 作业
1. 设 x1 , x2 , x3 是取自某均值为 的总体的样本, 试证下列统计量 的无偏估计 , 并指出当总体方差 存在时,哪一个估计的 有效性最差?
特别地,g( ) .
2
例如,X 1 ,, X n ~ N ( , 2 ),记 ( , 2 ),希望 利用样本对 ( , 2 ) 或其函数g( ) 的值作出估计 .
i.i.d.
参数估计 区间估计
点估计
用样本函数(统计量)的一个 具体数值去估计一个未知参数 用样本函数(统计量)的两个 值构成的区间去估计未知参数 的取值范围
浙江财经学院本科教学课程
应用数理统计
第三章 点估计(一)
§ 3.1 预备 § 3.2 矩估计 § 3.3 极大似然估计 § 3.5 Cramer-Rao不等式
1
§ 3.1 预备
参数估计问题:
参数估计 参数统计推断 假设检验
设分布族F { F , }, F 的分布形式已知,但其 分布与未知参数 有关. X 1 , , X n 是从总体F 中抽 出的简单随机样本,要 利用样本对未知参数的 函数 g( ) 作出估计.