应用数理统计第1章

合集下载

应用数理统计实验讲义2011-12-30

应用数理统计实验讲义2011-12-30

应⽤数理统计实验讲义2011-12-30⽬录绪⾔MATLAB基础知识⼀、MATLAB软件简介 (1)1、MATLAB的主要功能 (1)2、MATLAB的⼯作环境 (1)3、MATLAB的⼯作原理 (2)⼆、MATLAB⼊门 (2)1、数学运算符及特殊字符 (2)2、常⽤库函数 (2)3、命令⾏的编写 (3)4、变量与表达式 (3)5、M⽂件的建⽴、编写、保存与调⽤ (4)6、MATLAB的在线帮助 (4)7、路径的设置 (4)第⼀章数理统计的基本概念⼀、直⽅图与经验分布函数图的绘制 (5)⼆、常见的概率分布 (7)三、MATLAB为常见分布提供的五类函数 (7)1、概率密度函数 (7)2、累积分布函数 (8)3、逆累积分布函数 (8)4、随机数发⽣函数 (8)5、均值和⽅差 (8)四、常⽤的统计量 (9)第⼆章参数估计⼀、统计⼯具箱中的参数估计 (10)1、利⽤mle函数对概率分布中的参数进⾏估计 (10)第三章假设检验⼀、正态总体的参数假设检验 (13)(⼀)检验问题、检验统计量及拒绝域 (13)(⼆)参数假设检验函数 (14)(三)参数假设检验函数的格式说明及例题 (14)1、[h,p,ci,zval] = ztest(x,mu0,sigma,alpha,tail) (14)2、[h,p,ci,stats] = ttest(x,mu0,alpha,tail) (15)3、[h,p,ci,stats] = ttest2(x,y,alpha,tail) (16)4、[h,p,ci,stats] = vartest(x,sigma02,alpha,tail) (17)5、[h,p,ci,stats] = vartest2(x,y,alpha,tail) (18)⼆、⾮参数假设检验 (19)(⼀)各检验⽅法的功能与优缺点 (19)(⼆)⾮参数假设检验函数 (20)(三)⾮参数假设检验函数的格式说明及例题 (21)1、[h,p,stats] = chi2gof(x,name1,val1,name2,val2,...) (21)2、[table,chi2,p,label] = crosstab(x,y) (23)3、[h,p,ksstat,cv] = kstest(x,cdf,alpha,tail) (25)4、[h,p,lstat,cv]= lillietest(x,alpha,distr) (25)5、[h,p,jbstat,cv] = jbtest(x,alpha) (26)6、[h,p,ksstat] = kstest2(x,y,alpha,tail) (28)7、[p,h,stats] = ranksum(x,y,alpha) (28)8、normplot(x) (29)9、qqplot(x,y) (30)第四章回归分析⼀、线性回归模型 (33)⼆、回归分析中研究的主要问题 (33)三、回归分析函数 (34)(⼀)回归分析函数 (34)(⼆)回归分析函数的格式说明及例题 (34)1、[b,bint,r,rint,stats] = regress(y,X,alpha) (34)2、stepwise(X,y,inmodel,penter,premove) (43)3、多项式拟合 (polyfit)、多项式求值 (polyval)等函数 (47)第五章⽅差分析⼀、⽅差分析模型与假设检验⽅法 (51)(⼀)单因素⽅差分析数学模型 (51)1、单因素⽅差分析数学模型 (51)2、假设检验 (51)(⼆)双因素等重复试验⽅差分析 (51)1、双因素等重复试验⽅差分析的数学模型 (51)2、假设检验 (51)(三)双因素⽆交互作⽤的⽅差分析 (52)1、双因素⽆交互作⽤⽅差分析的数学模型 (52)2、假设检验 (52)⼆、⽅差分析函数 (53)(⼀)⽅差分析函数 (53)(⼆)⽅差分析函数的格式说明及例题 (53)1、[p,table,stats] = anova1(X,group) (53)2、c = multcompare(stats,param1,val1,param2,val2,...) (55)3、[p,table,stats] = anova2(X,reps) (57)附:Matlab 2007b PLP(注册码)18-41519-34649-39940-00621-01988-02577-01245-51575-44112-12966-44686-37374-43430-36283-64095-18584-34803-54175-05965-54469-56859-47170-56703-00300-00857-63903-48349-07297-57752-37962-48933-62342-43508-41646-31266-38461-54713-50260-57403-18654-13756-59612-18880最⼤似然估计──Maximum likelihood esti mates (MLE)置信区间──Confidence intervals (ci)Q-Q图──Quantile-quantile plot绪⾔MATLAB基础知识⼀、MATLAB软件简介1967年美国Mathwork公司推出了、基于矩阵运算的“Matrix Laboratory” (缩写为MATLAB) 的交互式软件包. MATLAB既是⼀种直观、⾼效的计算机语⾔, 同时⼜是⼀个科学计算平台. 它为数据分析和数据可视化、算法和应⽤程序开发提供了最核⼼的数学和⾼级图形⼯具. 根据它提供的500多个数学和⼯程函数, ⼯程技术⼈员和科学⼯作者可以在它的集成环境中交互或编程以完成各⾃的计算. MATLA-B⼀般⽤于线性代数、概率统计、图像处理、样条分析、信号处理、⼩波分析、振动理论、神经⽹络、⾃动控制、系统识别、算法优化和财政⾦融等各个⽅⾯.不过, MATLAB作为⼀种新的计算机语⾔, 要想运⽤⾃如, 充分发挥它的威⼒, 也需要系统的学习. 但由于使⽤MATLAB编程运算与⼈进⾏科学计算的思路和表达⽅式完全⼀致, 所以不像学习其他⾼级语⾔如Basic、Fortan和C语⾔等那样难于掌握. 下⾯的内容均是基于MATLAB7.5版本.1、MATLAB的主要功能(1) 数值计算功能(Numeric)(2) 符号计算功能(Symblic)(3) 图形和可视化功能 (Graphic)(4) MATLAB的活笔记本功能(Notebook)(5) 可视化建模和仿真功能(Simulink)2、MATLAB的⼯作环境MATLAB的⼯作环境主要包括:·【Command Window】命令窗⼝;·【File Editor】⽂本编辑窗⼝;·【Figure Window】图形窗⼝.图0-1MATLAB 6.x的命令窗、⽂本编辑窗、图形窗、菜单栏和⼯具栏MATLAB 7.5还包含⼏个辅助视窗, 组成其“桌⾯系统”. 它们分别为:·【Workspace】⼯作台窗⼝;·【Command History】指令历史纪录窗⼝;·【Current Directory】当前⽬录选择窗⼝.图0-2MATLAB 7.5的桌⾯系统和命令窗⼝3、MATLAB的⼯作原理(1) 语⾔结构:MATLAB语⾔ = 窗⼝命令 + M⽂件(2) 窗⼝命令:在MATLAB命令窗⼝中输⼊的MATLAB语句, 并直接执⾏它们完成相应的运算、绘图等.(3) M⽂件:在MATLAB⽂本编辑窗⼝中⽤MATLAB语句编写的磁盘⽂件, 扩展名为“.M”.⼆、MATLAB⼊门1、数学运算符及特殊字符数组的算术运算符: + - .* ./ .\ .^矩阵的算术运算符: + - * / \ ^关系运算符: < <= > >= = = ∽=逻辑运算符: & 与; | 或; ~ ⾮三种运算的顺序依次为: 算术运算、关系运算、逻辑运算.pi 数学常数, 即3.1415926535897....eps 系统的浮点 (Floating-ponit) 精确度. 在PC机上, 它等于522Inf 正⽆穷⼤, 定义为1 0ans 计算结果的默认变量名NaN 不定值, 由 Inf/Inf或0/0等运算产⽣2、基本库函数(1) 常⽤三⾓函数:sin, cos, tan, cot, sec, csc, asin, acos, atan, acot, asec, acsc等(2) 常⽤基本函数:sqrt(x)—开平⽅abs(x)—取绝对值exp(x)—以e为底的指数log(x)—⾃然对数log10(x)—以10为底的对数log2(x)—以2为底的对数sum(x)—求和prod(x)-求积max(x)—最⼤值min(x)—最⼩值fix(x)—对称取整sign(x)—符号函数length(x)—矩阵⾏数与列数中的最⼤值size(x)—矩阵的⾏数与列数注意: (1) 由于MATLAB是基于矩阵的运算,所以上⾯的x均表⽰矩阵, 数可看作是1×1的矩阵.(2) 对⾮向量型矩阵, 如不作特殊说明, 都是列优先.3、命令⾏的编写随时输⼊指令并按回车键, 即时给出结果;在指令最后不⽤任何符号并按回车键, 将显⽰最后结果;在指令最后⽤“; ”并按回车键, 将只计算但不显⽰最后结果.同时输⼊⼏条指令时, ⽤“, ”或“; ”隔开.【例0-1】数学运算符、特殊字符与基本库函数的应⽤>>3*(-5), 2/5, [1 2 3].*[2 4 5], [1 2 3]./[2 4 5], [2,4,5].^2ans = -15ans = 0.4000ans = 2 8 15ans = 0.5000 0.5000 0.6000ans = 4 16 25>> sin(pi/4), log(exp(1))ans = 0.7071ans = 14、变量与表达式在MATLAB中, 把由下标表⽰次序的标量的集合称为矩阵或数组. MATLAB是基于矩阵运算的, 因此其基本数据结构只有⼀个:矩阵. ⼀个数也是矩阵, 只不过它是1⾏×1列的矩阵. MATLAB中的变量可⽤来存放数据, 也可⽤来存放向量或矩阵, 并进⾏各种运算.变量命名的规则为:·变量名、函数名是要区分⼤⼩写字母的;·第⼀个字符必须是英⽂字母;·字符间不可留空格;·最多只能有31个字符 (只能有英⽂字母、数字和下连字符) .表达式由变量名、运算符和函数名等组成. 如x/sin(x), 其中x为变量名, /为运算符, sin为函数名.MATLAB语句有两种最常见形式: 1) 表达式; 2) 赋值语句: 变量 = 表达式.【例0-2】赋值语句的使⽤>> x=1; y=x/sin(x)y = 1.1884>> x=[pi/6,pi/4,pi/3,pi/2]; sin(x)ans =0.5000 0.7071 0.8660 1.0000>> x=0:0.1:2*pi; y=sin(x); plot(x,y)图0-3y=sin(x)的曲线图5、M ⽂件的建⽴、编写、保存与调⽤(1) 进⼊⽂本编辑窗⼝的⽅式: 在菜单栏“File ”下直接点击“新建…”进⼊⽂本编辑窗⼝. (2) M ⽂件的分类与格式:①命令⽂件: 由⼀系列MATLAB 语句组成, 运⾏时将⾃动执⾏⼀系列命令直⾄给出最后结果, ⽽不交互地等待键盘输⼊. 命令⽂件定义的变量为全局变量, 存放于内存.②函数⽂件: 第⼀⾏必须包含“function ”, 主要功能是建⽴⼀个函数. 函数⽂件定义的变量为局部变量.function 因变量名= 函数名(⾃变量名)注意: 函数⽂件要求函数名和⽂件名相同, 且函数名、⽂件名与变量名的命名规则⼀样. (3) 退出⽂本编辑窗⼝: 录⼊完毕, 存盘退出⽂本编辑窗⼝则可.【例0-3】已知1232,3,1x x x =-==, ⽽2112112122233,y z zz x y z z z x x =+?=??=-=+, 试求12,y y 的值. ·在⽂本编辑窗⼝中编写命令⽂件f0_3.m:x1=-2;x2=3;x3=1; z1=3*x1^2; z2=x2+x3; y1=z1+z2 y2=z1-z2·在命令窗⼝中运⾏命令⽂件f0_3.m:>> f0_3y1 = 16 y2 = 8【例0-4】求()lg f x =0,5,10x x x ===处的函数值.·在⽂本编辑窗⼝中编写函数⽂件f0_4.m:function y=f0_4(x)y=log10(sqrt((x-5).^2+(x-100).^2)); ·在命令窗⼝中调⽤函数⽂件f0_4.m:>>x=[0,5,10]; y=f0_4(x); y = 2.0005 1.9777 1.9549 6、MATLAB 的在线帮助 (1) 从菜单栏上的“help ”进⼊ (2) 其它命令窗⼝帮助clc —— 清除显⽰屏上的内容 clear —— 清除内存变量和函数what —— 列出当前⽬录下的M 、MAT 、MEX ⽂件 who ——列出当前⼯作空间 (Workspace) 的变量名7、路径的设置在保存M ⽂件时, MATLAB 的默认位置是C:\MATLAB6p5\work. 如果⽤户将编写的M ⽂件保存在E:\experiment ⽬录下, 则从MATLAB 窗⼝的“File ”菜单中单击⼦菜单“Save As …”, 选择E:\experiment, 再输⼊本M ⽂件的⽂件名, 按“保存”键返回则可.第⼀章数理统计的基本概念⼀、直⽅图与经验分布函数图的绘制hist(A,n)——对矩阵A 按列作统计频数直⽅图, n 为条形图的条数 ni=hist(A,n)——对矩阵A 按列得各划分区间内的统计频数注意: 当A 为向量时, 上述所有命令直接作⽤在向量上, ⽽不是列优先.[Fn,x0]=ecdf(x) —— 得到样本x 的经验分布函数值Fn, 当x 中有m 个不同的数 (记为向量x0) 时, 则Fn 的个数为m+1个ecdfhist(Fn,x0, m) —— 绘制数据x 的频率(密度)直⽅图, 其中Fn 与x0是由ecdf 函数得到的样本x 的经验分布函数值Fn 与分段点x0, m 为条形的个数, m 的默认值为10cdfplot(x) —— 绘制样本x 的经验分布函数图例如:>> x = [6 4 5 3 6 8 6 7 3 4]; >> [Fn,x0]=ecdf(x)Fn = 0 0.2000 0.4000 0.5000 0.8000 0.9000 1.0000 x0 = 3 3 4 5 6 7 8 >> cdfplot(x)图1-1 经验分布函数图【例1-1】(P 10例1.6)在齿轮加⼯中, 齿轮的径向综合误差i F ''?是个随机变量, 今对200件同样的齿轮进⾏测量, 测得i F ''?的数值 (mm) 如下, 求作i F ''?的频率密度直⽅图, 并作出i F ''?的经验分布函数图形.16 25 19 20 25 33 24 23 20 24 25 17 15 21 22 26 15 23 22 24 20 14 16 11 14 28 18 13 27 31 25 24 16 19 23 26 17 14 30 21 18 16 18 19 20 22 19 22 18 26 26 13 21 13 11 19 23 18 24 28 13 11 25 15 17 18 22 16 13 12 13 11 09 15 18 21 15 12 17 13 14 12 16 10 08 23 18 11 16 28 13 21 22 12 08 15 21 18 16 16 19 28 19 12 14 19 28 28 28 13 21 28 19 11 15 18 24 18 16 28 19 15 13 22 14 16 24 20 28 18 18 28 14 13 28 29 24 28 14 18 18 18 08 21 16 24 32 16 28 19 15 18 18 10 12 16 26 18 19 33 08 11 18 27 23 11 22 22 13 28 14 22 18 26 18 16 32 27 25 24 17 17 28 33 16 20 28 32 19 23 18 28 15 24 28 29 16 17 19 18·编写命令⽂件example1_6.m:F=[16 25 19 20 25 33 24 23 20 24 25 17 15 21 22 26 15 23 22 24.... 20 14 16 11 14 28 18 13 27 31 25 24 16 19 23 26 17 14 30 21.... 18 16 18 19 20 22 19 22 18 26 26 13 21 13 11 19 23 18 24 28.... 13 11 25 15 17 18 22 16 13 12 13 11 09 15 18 21 15 12 17 13....14 12 16 10 08 23 18 11 16 28 13 21 22 12 08 15 21 18 16 16.... 19 28 19 12 14 19 28 28 28 13 21 28 19 11 15 18 24 18 16 28.... 19 15 13 22 14 16 24 20 28 18 18 28 14 13 28 29 24 28 14 18.... 18 18 08 21 16 24 32 16 28 19 15 18 18 10 12 16 26 18 19 33.... 08 11 18 27 23 11 22 22 13 28 14 22 18 26 18 16 32 27 25 24....17 17 28 33 16 20 28 32 19 23 18 28 15 24 28 29 16 17 19 18];%(1)下⾯作频数直⽅图 figure(1) hist(F,8)title('频数直⽅图');xlabel('齿轮的径向综合误差(mm)'); %(2)下⾯作频率(密度)直⽅图 [Fn,x0]=ecdf(F); figure(2)ecdfhist(Fn,x0,8); title('频率(密度)直⽅图');xlabel('齿轮的径向综合误差(mm)'); %(3)下⾯作经验分布函数图 figure(3) cdfplot(F)title('经验分布函数图');xlabel('齿轮的径向综合误差(mm)'); ·运⾏命令⽂件example1_6.m:>> example1_6频数直⽅图齿轮的径向综合误差(mm)频率(密度)直⽅图齿轮的径向综合误差(mm)5101520253035齿轮的径向综合误差(mm)F (x )经验分布函数图图1-2⼆、常见的概率分布表1-1常⽤概率分布及代码1) 概率密度函数(分布名+pdf)2) (累积)分布函数(分布名+cdf)3) 逆(累积)分布函数(分布名+inv)4) 随机数发⽣器(分布名+rnd)5) 均值和⽅差(分布名+stat)1、概率密度函数表1-2概率密度函数(pdf)注意: Y=normpdf (X, mu, sigma)的sigma是指标准差, ⽽⾮.N的概率密度图.【例1-2】绘制标准正态分布(0,1)x=-4:0.1:4;y=normpdf(x,0,1);plot(x,y)title('N(0,1)的概率密度曲线图')图1-3 标准正态分布的概率密度图2、累积分布函数表1-3 累积分布函数(cdf)【例1-3>> P=normcdf (2,0,1)-normcdf(-2,0,1) ans = 0.9545 3、逆累积分布函数 (⽤于求分位点)表1-4 逆累积分布函数(inv)22(i) 0.9u ;(ii) 0.25(4)t ;(iii) 0.1(14,10)F ;(iv) 20.025(50)χ.>> u_alpha=norminv(0.9,0,1)不是平⽅u_alpha = 1.2816 >> t_alpha=tinv(0.25,4)t_alpha = -0.7407 >> F_alpha=finv(0.1,14,10)F_alpha = 0.4772>> X2_alpha=chi2inv(0.025,50)X2_alpha = 32.3574 4、随机数发⽣函数表1-5 随机数发⽣函数(rnd)5表1-6 常见分布的均值和⽅差函数(stat)注意: MATLAB 中的指数分布的概率密度函数是1,0 ()0,0xue xf x u x -?>?=??≤?.四、常⽤的统计量表1-7 常⽤统计量说明:(1) y=var(X) ——计算X 中数据的⽅差, 其中211var()()1ni i X x x n ==--∑. y=var(X, 1) ——211var(,1)()n i i X x x n ==-∑, 得到样本的⼆阶中⼼矩 (转动惯量).(2) C =cov(X) ——返回⼀个协⽅差矩阵, 其中输⼊矩阵X 的每列元素代表着⼀个随机变量的观测值. 如果X 为n ×m 的矩阵, 则C 为m ×m 的矩阵.(3) var(X)=diag(cov(X)), std(X)=sqrt(diag(cov(X))).作业: P 26-28 1.1, 1.12第⼆章参数估计参数估计包含两种常⽤⽅式: 点估计和区间估计.Matlab 统计⼯具箱给出了常⽤概率分布中参数的点估计 (采⽤最⼤似然估计法-MLE) 与区间估计, 另外还提供了部分分布的对数似然函数的计算功能. ⼀、统计⼯具箱中的参数估计1、利⽤mle 函数对概率分布中的参数进⾏估计格式: [phat,pci] = mle(data,'distribution',dist, 'alpha', alpha,'ntrials',n) 引号内照抄功能: 根据样本数据data, 给出由dist 指定分布的参数的MLE 估计与区间估计. 说明:(1) phat 与pci 中的“p ”为分布中的参数, 可表⽰多个参数;(2) phat 为参数的最⼤似然估计值, pci 为参数的置信⽔平为1α-的置信区间, 其中α由alpha 的取值确定;(3) dist 为总体分布的指定类型, 其取值为表1-1中的代码; (4) 当dist 为’norm ’时, phat 中的参数“p ”是指,µσ, ⽽⾮2,µσ.(5) alpha 为显著性⽔平, 取值在0-1之间. 0.05α=是默认值, 此时本选项可省略;(6) 'ntrials',n 只在dist 为bino (⼆项分布(,)b n p )时才选⽤, n 为(,)b n p 是的n, 此时待估参数为p.【例2-1】(书P 66习题2.3) 使⽤⼀测量仪器对同⼀值进⾏了12次独⽴测量, 其结果为 (单位: mm)232.50 232.48 232.15 232.52 232.53 232.30 232.48 232.05 232.45 232.60 232.47 232.30并设测量值2~(,)X N µσ, 试求2,µσ的最⼤似然估计与区间估计(0.05α=). (1) 问题分析:设总体X ──测量值, 且2~(,)X N µσ.今抽得⼀容量为12的样本, 本问题是求参数2,µσ的最⼤似然估计与置信⽔平为0.95的区间估计. (2) 问题求解:2,µσ的最⼤似然估计分别为: 2211??,()nMLE MLEi i X X X n µσ===-∑; µ的置信⽔平为1α-的置信区间为: 1212(1),(1)X n X n αα--??--;2σ的置信⽔平为1α-的置信区间为: 22**22122(1)(1),(1)(1)n S n S n n ααχχ-??--??--.·编写命令⽂件exercise2_3.m:x=[232.50, 232.48, 232.15, 232.52, 232.53, 232.30, 232.48, 232.05, 232.45, 232.60, 232.47, 232.30];[hat,ci]=mle(x,'distribution','norm') ·运⾏命令⽂件exercise2_3.m:>> exercise2_3hat = 232.4025 0.1598 pci (:,1)所有⾏第⼀列 ci = 232.2965 0.1182 232.5085 0.2834(3) 问题结果 :22??232.4025,0.15980.0255MLE MLE µσ===,µ的置信区间为[232.2965,232.5085],2σ的置信区间为22[0.1182,0.2834][0.0140,0.0803]=.【例2-2】(书P 69习题2.22) 随机地从⼀批零件中抽取16个, 测得长度 (单位: cm) 为:2.14 2.10 2.13 2.15 2.13 2.12 2.13 2.10 2.15 2.12 2.14 2.10 2.13 2.11 2.14 2.11设零件长度的分布为正态的, 试求总体均值的90%的置信区间: ①若0.01σ=(cm);②若σ未知.(1) 问题分析:设总体X ──零件长度, 则2~(,)X N µσ. 本问题是求参数µ的置信区间. (2) 问题求解:①若0.01σ=: µ的置信⽔平为1α-的置信区间为1212,X X αα--. ·编写函数⽂件zestimate.m:function muci=zestimate(x,sigma,alpha) n=length(x); xhat=mean(x);u_alpha=norminv(1-alpha/2,0,1); delta1=sigma/sqrt(n)*u_alpha; muci=[xhat-delta1,xhat+delta1]; ·调⽤函数⽂件zestimate.m: >> x=[2.14, 2.10, 2.13, 2.15, 2.13, 2.12, 2.13, 2.10, 2.15, 2.12, 2.14, 2.10, 2.13, 2.11, 2.14, 2.11]; >> sigma=0.01; >>alpha=0.1;>> muci=zestimate(x,sigma,alpha) muci = 2.1209 2.1291 ②若σ未知: µ的置信⽔平为1α-的置信区间为1212(1),(1)X n X n αα--??--. ·编写命令⽂件exercise2_22_2.m:x=[2.14, 2.10, 2.13, 2.15, 2.13, 2.12, 2.13, 2.10, 2.15, 2.12, 2.14, 2.10, 2.13, 2.11, 2.14, 2.11];[phat,pci]= mle(x,'distribution','norm','alpha',0.1); muci=pci(:,1)·运⾏命令⽂件exercise2_22_2.m:>> exercise2_22_2muci = 2.1175 2.1325 (3) 问题结果:①当0.01σ=时, µ的置信⽔平为0.90的置信区间为[2.1209, 2.1291]; ②当σ未知时, µ的置信⽔平为0.90的置信区间为[2.1175,2.1325].【例2-3】(书P 66例2.31) 对⼀批产品, 欲通过抽样检查其不合格率. 今抽取产品100件, 发现不合格品有4件, 求不合格率的0.95的双侧置信区间. (1) 问题分析:设总体1,0X ?=??本产品为不合格品本产品为合格品, 即~(1,)X b p .今抽得⼀容量为100的样本145100(1,0)x x x x ====== , 本问题即要求参数p 的双侧置信区间.(2) 问题求解:选⽤下列两种⽅法计算:①利⽤P 6522221212()(2)0n u p nX u p nX αα--+-++<近似计算(棣莫弗-拉普拉斯中⼼极限定理);②利⽤Matlab 中⼆项分布参数估计函数mle 计算 (借助F 分布). ·编写命令⽂件example2_31.m:alpha=0.05; n=100;%(1) 利⽤中⼼极限定理近似计算 u=norminv(1-alpha/2,0,1); a=n+u^2;b=-(2*n*(4/n)+u^2); c=n*(4/n)^2;p=[(-b-sqrt(b^2-4*a*c))/(2*a),(-b+sqrt(b^2-4*a*c))/(2*a)]%⼀元⼆次⽅程求根公式%(2) 利⽤mle 计算[pcat,pci]=mle([1,1,1,1,zeros(1,96)],'distribution','bino','ntrials',1) ·运⾏命令⽂件example2_31.m:>> example2_31p = 0.0157 0.0984%近似计算结果pcat = 0.0400 pci = 0.0110 0.0993%mle 计算结果(3) 问题结果:①利⽤中⼼极限定理得到p 的近似估计区间为[0.0157, 0.0984]; ②利⽤mle 得到p 的估计区间为[0.0110, 0.0993].作业: P 67-69 2.24, 2.25第三章假设检验假设检验分为两种: 参数假设检验与⾮参数假设检验. ⼀、正态总体的参数假设检验(⼀)检验问题、检验统计量及拒绝域表3-1的说明:对⼀个正态总体2~(,)X N µσ, 抽取样本12,,,n X X X ;对两个正态总体211~(,)X N µσ, 222~(,)Y N µσ, 且X 与Y 独⽴, 分别抽取样本112,,,n X X X 与212,,,n Y Y Y .表3-1 正态总体的参数假设检验其中, 22211*22*12(1)(1)2wn S n S S n n -+-=+-.(⼆)参数假设检验函数表3-2 统计⼯具箱中的参数假设检验函数 (test)(1) [h,p,ci,zval] = ztest(x,mu0,sigma,alpha,tail)中的sigma 是指标准差σ, ⽽⾮2σ; (2) [h,p,ci,stats] = vartest(x,sigma20,alpha,tail)中的sigma20是指20σ, ⽽⾮0σ.(三)参数假设检验函数的格式说明及例题1、[h,p,ci,zval] = ztest(x,mu0,sigma,alpha,tail) ⽅差已知时, 对单正态总体均值µ与实数0µ的关系进⾏Z 检验. 并可通过指定tail 的值来控制备择假设的类型. tail 的取值及表⽰意义如下: tail='both' 表⽰10:H µµ≠ (缺省值) ; tail='right'表⽰10:H µµ>;tail= 'left'表⽰10:H µµ<. (原假设则为00:H µµ≥)·输出变量含义:h ——如果h=0, 则接受0H ; 如果h=1, 则拒绝0H ⽽接受备择假设1H ;p ——在当前样本下拒绝0H 的最⼩显著性⽔平, 即犯第I 类错误的最⼩概率00(|拒绝为真)P H H ; ci ——均值µ的置信⽔平为1α-的置信区间; zval ——Z统计量X Z =的观测值.α是我们设定的显著性⽔平, p 是最⼩显著性⽔平, 因此当p<α时, 则拒绝0H ;当0µ落⼊ci 中, 则接受0H .【例3-1】(书P 76例3.4) ⼀台包装机装洗⾐粉, 额定标准重量为500g, 根据以往经验, 包装机的实际装袋重量服从正态分布2(,)N µσ, 其中15σ=g, 为检验包装机⼯作是否正常, 随机抽取9袋, 称得洗⾐粉净重数据如下 (单位: g) : 497 506 518 524 488 517 510 515 516若取显著性⽔平0.01α=, 问这包装机⼯作是否正常? (1) 问题分析:设总体X ──每袋洗⾐粉的重量, 2~(,)X N µσ, 且2215σ=已知. 今抽得⼀容量为9的样本, 本问题是检验假设: 00100:,:(500)H H µµµµµ=≠=.(2) 问题求解:选取检验统计量X u =, 则0H 的拒绝域为12||u u α->.>> x=[497,506,518,524,488,517,510,515,516]; >> [h,p,ci,zval]=ztest(x,500,15,0.01,'both')h = 0%接受00:500H µµ== p = 0.0432%0H为真条件下12||Z u α-=> 成⽴的最⼩的α值 (参照书P 84例3.7)ci = 497.2320 522.9903 %σ已知时µ的置信⽔平为0.95的双侧置信区间 zval = 2.0222%Z统计量X Z =的值.(3) 问题结果:由于h = 0, 故接受00:H µµ=, 即认为包装机⼯作正常.2、[h,p,ci,stats] = ttest(x,mu0,alpha,tail) ⽅差未知时, 对单正态总体均值进⾏t 检验. ·输出变量含义:stats 包含三个结果:tstat ——t统计量X t =;df ——t 分布的⾃由度; sd ——样本标准差.【例3-2】(书P 79例3.5) 某部门对当前市场的价格情况进⾏调查. 以鸡蛋为例, 所抽查的全省20个集市上, 售价分别为 (单位: 元/500克)3.05, 3.31, 3.34, 3.82, 3.30, 3.16, 3.84, 3.10, 3.90, 3.18, 3.88, 3.22, 3.28, 3.34, 3.62, 3.28, 3.30, 3.22, 3.54, 3.30.已知往年的平均售价⼀直稳定在3.25元/500克左右, 在显著性⽔平0.025α=下, 能否认为全省当前的鸡蛋售价明显⾼于往年? (1)问题分析:设总体X ──每500克的鸡蛋价格, 2~(,)X N µσ, 且2σ未知. 今抽得⼀容量为20的样本, 本问题是检验假设: 00100:,:( 3.25)H H µµµµµ=>=.(2) 问题求解:选取检验统计量X t =则0H 的拒绝域为1(1)t t n α->-.>> x=[3.05,3.31,3.34,3.82,3.30,3.16,3.84,3.10,3.90,3.18,...3.88,3.22,3.28,3.34,3.62,3.28,3.30,3.22,3.54,3.30]; >> [h,p,ci,stats]=ttest(x,3.25,0.025,'right')h = 1 p = 0.0114ci = 3.2731 Infstats = tstat: 2.4763 df: 19 sd: 0.2691 (3) 问题结果:由于h = 1, 故接受10:H µµ>, 即认为全省当前的鸡蛋售价明显⾼于往年.3、[h,p,ci,stats] = ttest2(x,y,alpha,tail) 两⽅差相等但未知时, 对两个正态总体均值关系进⾏t 检验. 并可通过指定tail 的值来控制备择假设的类型. tail 的取值及表⽰意义如下: tail='both' 表⽰112:H µµ≠ (缺省值) ; tail='right'表⽰112:H µµ>;tail= 'left'表⽰112:H µµ<. (原假设则为012:H µµ≥)·输出变量含义:stats 包含三个结果:tstat ——t统计量)X Y t =的值;df ——t 分布的⾃由度;sd——两样本的合并标准差w S =.【例3-3(1)】(书P 81例3.6) 某⼯⼚⽣产某种电器材料. 要检验原来使⽤的材料与⼀种新研制的材料的疲劳寿命有⽆显著性差异, 各取若⼲样品, 做疲劳寿命试验, 所得数据如下 (单位: ⼩时) :原材料: 40, 110, 150, 65, 90, 210, 270新材料: 60, 150, 220, 310, 380, 350, 250, 450, 110, 175⼀般认为, 材料的疲劳寿命服从对数正态分布, 并可以假定原材料疲劳寿命的对数ln X 与新材料疲劳寿命的对数ln Y 有相同的⽅差, 即可设21ln ~(,)X N µσ, 22ln ~(,)Y N µσ. 在显著性⽔平0.05α=下, 能否认为两种材料的疲劳寿命没有显著性差异? (1) 问题分析:设总体X ──原材料的疲劳寿命, 211ln ~(,)X N µσ;设总体Y ──新材料的疲劳寿命, 222ln ~(,)Y N µσ, 且22212σσσ==未知.今从两个总体中各抽得⼀样本, 本问题是检验假设: 012112:,:H H µµµµ=≠.(2) 问题求解:选取检验统计量X Y t =, 则0H 的拒绝域为112||(2)t t n n α->+-.>> x=[40,110,150,65,90,210,270];>> y=[60,150,220,310,380,350,250,450,110,175]; >> [h,p,ci,stats]=ttest2(log(x),log(y),0.05,'both')h = 0 p = 0.0626ci = -1.3095 0.0379stats = tstat: -2.0116 df: 15 sd: 0.6414 (3) 问题结果:由于h = 0, 故接受012:H µµ=, 即认为两种材料的疲劳寿命没有显著差异.【例3-3(2)】(浙⼤四版P 187例4) 做以下的实验以⽐较⼈对红光或绿光的反应时间(以s 计). 实验在点亮红光或绿光的同时, 启动计时器, 要求受试者见到红光或绿光点亮时, 就按下按钮, 切断计时器, 这就能测得反应时间. 测量的结果如下表:问能否认为⼈们对红光的反应要⽐绿光快? (显著性⽔平取0.05α=) (1) 问题分析(本题是配对数据检验):设(1,,8)i i i D X Y i =-= 是来⾃正态总体2(,)D D N µσ的样本, 2,D Dµσ均未知. 本问题是检验假设: 01:0,:0D D H H µµ≥<.(2) 问题求解:选取检验统计量D t =则0H 的拒绝域为1(1)t t n α->-.>> x=[0.30 0.23 0.41 0.53 0.24 0.36 0.38 0.51]; >> y=[0.43 0.32 0.58 0.46 0.27 0.41 0.38 0.61]; >> d=x-y; >> [h,p,ci,stats] = ttest(d,0,0.05,'left')h = 1 p = 0.0270ci = -Inf -0.0113stats = tstat: -2.3113 df: 7 sd: 0.0765 (3) 问题结果:由于h = 1, 故接受1:0D H µ<, 即认为⼈对红光的反应要⽐绿光快.4、[h,p,ci,stats] = vartest(x,sigma02,alpha,tail) 均值未知时, 对单正态总体⽅差进⾏2χ检验. 并可通过指定tail 的值来控制备择假设的类型. tail 的取值及表⽰意义如下: tail='both' 表⽰2210:H σσ≠ (缺省值) ; tail='right'表⽰2210:H σσ>;tail= 'left'表⽰2210:H σσ<. (原假设则为2200:H σσ≥)。

应用数理统计习题答案_西安交大(论文资料)

应用数理统计习题答案_西安交大(论文资料)

应用数理统计答案学号:姓名:班级:目录第一章数理统计的基本概念 (2)第二章参数估计 (14)第三章假设检验 (24)第四章方差分析与正交试验设计 (29)第五章回归分析 (32)第六章统计决策与贝叶斯推断 (35)对应书目:《应用数理统计》施雨著西安交通大学出版社第一章 数理统计的基本概念1.1 解:∵2(,)X N μσ∼ ∴ 2(,)n X N σμ∼∴)(0,1)X N μσ−∼分布∴(1)0.95P X P μ−<=<=又∵ 查表可得0.025 1.96u = ∴ 221.96n σ=1.2 解:(1) ∵ (0.0015)X Exp ∼∴ 每个元件至800个小时没有失效的概率为:8000.001501.2(800)1(800)10.0015x P X P X e dxe −−>==−<=−=∫∴ 6个元件都没失效的概率为: 1.267.2()P e e −−==(2) ∵ (0.0015)X Exp ∼∴ 每个元件至3000个小时失效的概率为:30000.001504.5(3000)0.00151x P X e dxe−−<===−∫∴ 6个元件没失效的概率为: 4.56(1)P e −=−1.4 解:ini n x n x ex x x P ni i 122)(ln 2121)2(),.....,(122=−−Π∑==πσμσ1.5证:∵21122)(na a x n x a x ni ni ii+−=−∑∑==∑∑∑===−+−=+−+−=ni i ni i ni i a x n x x naa x n x x x x 1222211)()(222a) 证:)(11111+=+++=∑n ni i n x x n x )(11)(1111n n n n n x x n x x x n n −++=++=++])()1(1 ))((12)[(11)](11[11)(11212111121211212112n n n i n n n i n i n i ni n n n i n i n in x x n n x x x x n x x n x x n x x n x x n S −+++−−+−−+=−+−−+=−+=++=+=+=+=++∑∑∑∑] )(11))1()((12)([112111212n n n n n n n n n x x n x n x x n x x n x x nS n −++−+−+−−++=++++])(11S [1 ])(1[nS 11212n 212n n n n n x x n n n x x n n n −+++=−+++=++ 1.6证明 (1) ∵22112211221()()()2()()()()()nni ii i nni i i i ni i X X X X X X X X X n X X X n X μμμμμ=====−=−+−=−+−−+−=−+−∑∑∑∑∑(2) ∵2221112221221()22ii i nn ni i i i i ni ni XX X X X nX X nX nX X nX =====−=−+=−+=−∑∑∑∑∑1.10 解: (1).∑∑====ni i n i i x E n x n E X E 11)(1)1()(p np n=⋅=1np mp x D n x n D X D ni in i i )1()(1)1()(121−===∑∑==))(1()(122∑=−=n i i x x n E S E)1(1)])1(1())1(([1)])()(())()(([1])()([1])([12222212212212p mp nn p m p mp n n p m p mp n n x E x D n x E x D n x nE x E n x x E n ni i i n i i n i i −−=+−−+−=+−+=−=−=∑∑∑=== 同理,(2). λ===∑∑==ni i n i i x E n x n E X E 11)(1)1()(λnx D n x n D X D ni in i i 1)(1)1()(121===∑∑==λnn x E x D n x E x D n x nE x E n S E ni i i n i i 1)])()(())()(([1])()([1)(2122122−=+−+=−=∑∑==(3). 2)(1)1()(11b a x E n x n E X E ni i n i i +===∑∑==na b x D nx n D X D ni ini i 12)()(1)1()(2121−===∑∑==12)(1)])()(())()(([1])()([1)(22122122a b nn x E x D n x E x D n x nE x E n S E ni i i n i i −⋅−=+−+=−=∑∑==(4). λ===∑∑==ni i n i i x E n x n E X E 11)(1)1()(nx D nx nD X D ni ini i 2121)(1)1()(λ===∑∑==221221221)])()(())()(([1])()([1)(λnn x E x D n x E x D n x nE x E n S E ni i i n i i −=+−+=−=∑∑==(5). μ===∑∑==ni ini i x E nx nE X E 11)(1)1()(nx D nx nD X D ni i ni i 2121)(1)1()(σ===∑∑==221221221)])()(())()(([1])()([1)(σ⋅−=+−+=−=∑∑==nn x E x D n x E x D n x nE x E n S E ni i i n i i1.11 解:由统计量的定义知,1,3,4,5,6,7为统计量,5为顺序统计量 1.17 证:),(~ λαΓX ∵xe x xf λαααλ−−Γ=∴1)()( 令kXY =ke ky k k e ky yf kyky ⋅Γ=⋅Γ=∴−−−−λαααλαααλαλ11)()( )()()(即 ),(~ky Y αΓ1.18 证:),(~ b a X β∵),()1()( 11b a B x xx f b a −−−=∴),(),( ),()1()( 11b a B b k a B b a B x x x X E b a k k +=−=∴∫∞+∞−−−),(),1()( b a B b a B X E +=∴ba a ab a b a b a a a a b a b a a a b b a b a b a +=Γ+Γ++ΓΓ=Γ++Γ+Γ+Γ=ΓΓ+Γ⋅++ΓΓ+Γ=)()()()()()()1()()1()()()()1()()1(),(),2()(2b a B b a B X E +=))(1()1()()()()2()()2(b a b a a a a b b a b a b a ++++=ΓΓ+Γ⋅++ΓΓ+Γ= 22)]([)()( X E X E X D −=∴2))(1())(1()1(b a b a ab ba ab a b a a a +++=+−++++= 1.19 解:∵ (,)X F n m ∼分布2212(1)022()((1))((1)()()()(1)()()n n m n mn m yn m y n mn nP Y y P X X y m myP X y n n n x x dx m mm ++−−+≤=+≤=<−Γ=+ΓΓ∫2222122221122()()()1((1()()11(1)(1)(,)n n m n m n m n m n m f y P Y y y y yy y yy B ++−−−−′=≤Γ=+ΓΓ−−−−=∴ 22(1)(,)n mn n Y X X m mβ=+∼分布1.20 解:∵ ()X t n ∼分布122212()()((2(1n n P Y y P X y P X xdxn ++−≤=≤=≤≤=+112211221212122()()()(1)()1()(1(()()n n n n n f y P Y y y y n y y nn n +++−−+−−′=≤Γ=+Γ=+ΓΓ∴ 2(1,)2nY X F =∼分布1.21 解: (1) ∵ (8,4)X N ∼分布∴ 4(8,)25X N ∼ 分布,即5(8)(0,1)2X N −∼ ∴ 样本均值落在7.88.2∼分钟之间的概率为:5(7.88)5(8)5(8.28)(7.88.2)()2220.383X P X P −−−≤≤=≤≤=(2) 样本均值落在7.58∼分钟之间的概率为:5(7.58)5(8)5(88)(7.58)(2225(8)(0 1.25)20.3944X P X P X P −−−≤≤=≤≤−=≤≤= 若取100个样品,样本均值落在7.58∼分钟之间的概率为:10(7.88)10(8)10(8.28)(7.88.2)(2222*(0.84130.5)0.6826X P X P −−−≤≤=≤≤=−= 单个样品大于11分钟的概率为:110.77340.2266P =−= 25个样品的均值大于9分钟的概率为210.97980.0202P =−= 100个样品的均值大于8.6分钟的概率为310.99870.0013P =−= 所以第一种情况更有可能发生1.23 解:(1) ∵ 2(0,)X N σ∼分布 ∴ 2(0,X N nσ∼分布∴ 22)(1)nXχσ∼∵ 222221()(ni i nXa X an X an σσ===∑∴ 21a n σ=同理 21b m σ=(2) ∵2(0,)X N σ∼分布 ∴222(1)X χσ∼分布由2χ分布是可加性得:2221()ni i X n χσ=∑∼()ninX c X t m ==∑∼ ∴c =(3) 由(2)可知2221()ni i X n χσ=∑∼2221122211(,)nni ii i n mn mi ii n i n X d Xnn dF n m XmXmσσ==++=+=+=∑∑∑∑∼∴ md n=1.25 证明:∵ 211(,)X N μσ∼分布 ∴ 2211((1)i X μχσ−∼∴ 1221111(()n i i X n μχσ=−∑∼同理 2222212(()n i i Y n μχσ=−∑∼ 1122222112211111222221122112()()(,)()()n n i i i i n n i i i i X n n X F n n Y n Y n μσμσμσμσ====−−=−−∑∑∑∑∼ 第二章 参数估计2.1 (1) ∵ ()X Exp λ∼分布∴ ()1E X λ=令 ˆ1X λ= 解得λ的矩估计为: ˆ1X λ= (2) ∵ (,)X U a b ∼分布∴ ()2a bE X +=2()()12b a D X −=令 1ˆˆ2ab A X +==22221ˆˆˆˆ()()1124n i i b a a b A X n =−++==∑ (22211n i i X X S n =−=∑)解得a 和b 的矩估计为:ˆˆaX bX =−=(3) 110()1E X x x dx θθθθ−=∗=+∫令 1ˆˆ1A X θθ==+∴ˆ1XXθ=− (4) 110()(1)!kk x kE X x x e dx k βββ−−=∗=−∫令ˆkX β= ∴ ˆkXβ=(5) 根据密度函数有2221()22()E X a aE X a λλλ=+=++根据矩估计有1222221ˆˆˆ22ˆˆˆa A X a a A S X λλλ+==++==+解得λ和a 的矩估计为:ˆˆaX λ==(6) ∵ (,)X B m p ∼ ∴ ()E X mp =令 1ˆmpA X == 解得p 的矩估计为:ˆXpm= 2.3解:∵ X 服从几何分布,其概率分布为:1()(1)k P X k p p −==−故p 的似然函数为: 1()(1)ni i x nnL p p p =−∑=−对数似然函数为:1ln ()ln ()ln(1)ni i L p n p x n p ==+−−∑令 1ln ()1()01nii L p n x n p p p =∂=−−=∂−∑ ∴ 1ˆpX= 2.4 解:由题知X 应服从离散均匀分布,⎪⎩⎪⎨⎧≤≤==其它01 1)(Nk N k x p2)(NX E =矩估计: 令 7102=∧N1420=∴∧N 极大似然估计:⎪⎩⎪⎨⎧≤≤=其它07101 1)(NN N L ∵要使)(N L 最大,则710=N710=∴∧N 2.5 解:由题中等式知:2196.196.196.1)025.01(025.0)(1S X +=+=∴+=+−Φ=∴=−Φ−∧∧∧−σμθσμμσθσμθ2.6 解:(1) 05.009.214.2=−=R ∵0215.005.04299.05=×==∴∧d Rσ(2)将所有数据分为三组如下所示:1x 2x 3x 4x5x 6x i R1 2.14 2.10 2.15 2.13 2.12 2.13 0.05 2 2.10 2.15 2.12 2.14 2.10 2.13 0.05 32.11 2.14 2.10 2.11 2.15 2.10 0.050197.005.03946.005.0)05.005.005.0(316=×==∴=++=∴∧d R R σ 2.7 解:(1)⎩⎨⎧+<<=其它 01x 1)(θθx f ∵ θθθθθθ≠+==+=++=∴∧21)()(2121)(X E E X E ∴ X =∧θ不是θ的无偏估计,偏差为21=−∧θθ(2) θ=−21(X E ∵ 21−=∴∧X θ是θ的无偏估计(3)22))(()())(()(θθθθ−+=−+=∧∧X E X D E D MSE41121+=n 2.8 证:由例2.24,令2211x a x a +=∧μ,则∧μ 为μ无偏估计应 满足121=+a a因此1μ,2μ,3μ都是μ的无偏估计)()()()(21)()(2513)()(95)9491)(()())(()()(1233212221212∧∧∧∧∧∧=∧<<===+=∴+==∑μμμμμμμD D D X D D X D D X D X D D a a X D X D a D i i i ∵∵2132121X X +=∴∧μ最有效2.9证: )(~λp X ∵ λλ==∴)( )(X D XEX ∵是λ=)(X E 的无偏估计,2*S 是λ=)( X D 的无偏估计)()1()())1((2*2*S E X E S X E αααα−+=−+∴λλααλ=−+=)1(∴2*)1(SX αα−+是λ的无偏估计2.10 解:因为2222((1))()(1)()(1)()1(1)()11(1)1E X S E X E S na E S n n a E S n n n a n nααααλαλαλαλλ∗∗+−=+−=+−−=+−−−=+−=− 所以 2(1)X S αα∗+−是λ的无偏估计量2.15 解:因为ˆθ是θ的有效估计量ˆˆˆ()()()E uE a b aE b a b u θθθ=+=+=+= 221ˆˆˆˆ()()()()D u D a b a D a D θθθ=+=≤ (其中,1ˆθ是θ的任意无偏估计量中的一个)所以 ˆu是u 的有效估计量 2.26 解: 因为总体服从正态分布,所以)01X U N μσ−=∼(,)对于给定的1α−,查标准正态分布表可得2u α,使得2()1P U u αα<=−即:22()1P X p X ααα−<<=−区间的长度2d L α=<,所以 22224u n L ασ>2.28 解:因为总体服从正态分布,所以)01X U N μσ−=∼(,), 222(1)nS V n χσ=−∼由因为U 和V 是相互独立的,所以(1)X T t n =−∼对于给定的1α−,查标t 分布表可得t α,使得 2()1P U t αα<=−,即:22()1P X X ααμα<<+=− 当30n =,35X =,15S =时,第一家航空公司平均晚点时间μ的95%的置信区间为:(29.3032,40.6968)对于给定的1α−,查标t 分布表可得t α,使得 ()1P U t αα>=−, 即:()1P X αμα<+=− 故μ的具有单侧置信上限的单侧置信区间为(,)X α−∞+ 所以经计算可得:第一家航空公司的单侧上限置信区间为(,39.7327)−∞第二种航空公司的单侧上限置信区间为(,36.3103)−∞所以选择第二家航空公司。

应用数理统计

应用数理统计

t1a/2 (n 1) t10.05/2 (15 1) t0.975 (14) 查表得 2.1448;
代入公式: St1a/2 (n 1) 得上限: =0.58+
1.3336 g2.1448
=1.24197
n 1
15 1
1.3336 g2.1448
下限: =0.58-
=-0.08197
n r
r QA 1Qe
> F1- r 1, n r , F1- 查表可得结果。
认为因素 A 对试验指标的影响是显著的,并找出最佳水平。
P191.习题 1.方差分析
P192.习题 3 正交试验设计——正交表的直观分析 本题应表示为 L16(43x26):9 个因子,前 3 个为 4 水平,后 6 个为 2 水平,共 16 次试验。 正交表记作: Ln (r1 r2 gggrm ) ;当 r1=r2=…=rn 时表示为 Ln(rm);

拒绝域:
X
2 n
>
X12
a
(m

1

l
)
其中 m 为数据的组数,l 为未知参数的个数。 例题:
3、秩和检验
①假设: H0 : F1(x) F2( x) ,H1:F1(x) F2 (x)
②将数据从小到大排列, ③算秩(限顺序),值一样时求几个数的平均值作为秩, ④算秩和,查表 P256.
注意将数的个数少的作为 n1 来计算秩和后,比较 R1 与 T1,T2 的关系。 ⑤拒绝域:X0={R1<T1 或 R1>T2}(T1<T2)
15 1
因此 a 的置信度为 0.95 的区间估计为(-0.08197, 1.24197)。

应用数理统计(基于MATLAB实现)第1章 数理统计的基本概念

应用数理统计(基于MATLAB实现)第1章  数理统计的基本概念
应用数理统计
第1章 数理统计的基本概念
数理统计的基本概念
目录 contents
1 总体与样本 2 样本经验分布函数 3 统计量与估计量 4 抽样分布
2024/4/19
PART 1
总体与样本
前言 数理统计学是探讨随机现象 统计规律性 的一门学科,它以概率论为理论基础, 研究如何以有效的方式收集、整理和分析 随机数据 ,从而对所研究对象进行 统计推断。
2024/4/19
1.2 从样本认识总体的方法 1 频数表
2 直方图
2024/4/19
1.2 从样本认识总体的方法
例3. 由于随机因素的影响,某铅球运动员的铅球出手高度可看成一个随机变量,现有一组出手高度的 统计数据(单位:cm)如下:
200
195
210
211
201
205
185
197
183
177
2024/4/19
引例
引例1:研究一批灯泡的寿命分布,需明确该批灯泡中每个灯泡的寿命长短。 引例2:研究某一湖泊的深度,需测量湖面上每处到湖底的深度。 总体:在数理统计中,我们把研究对象的全体所构成的集合称为总体,而把组成总体的每个元素称为个
体,总体中所包含个体的个数称为总体的容量.
这两张图是大家再熟悉不过的两个成语了:一叶知秋、盲人摸象。
参数
分布的数 字特征
某事件的 概率等
参数
2024/4/19
PART 3
样本的经验分布函数
3 样本经验分布函数 1 经验分布函数的定义
2024/4/19
3 样本经验分布函数 2 例题 例1.2.5
某食品厂生产午餐肉罐头,从生产线上随机抽取5只罐头,称其净重(单位:g)为: 351, 347, 355, 344, 351

应用统计学(第四版)第1章 绪论

应用统计学(第四版)第1章 绪论

劳动 作用于 劳动
资料
对象
管理费用
生产出
工业 产品
产量 质量 品种
销售 销 售 量
销售费用
价值形 成过程
工资 福利
V
折旧
+
费等
+
C2
产品制造成本 C1+C2+V
材料 费用
C1
利润 税金
M
工业总产值 C1+C2+V+M 实
现 M
财务费用
ቤተ መጻሕፍቲ ባይዱ
资金周转 过程
流动资产、长期投资、固定资产、无形资产、递延资产及其他资产 流动负债、长期负债、所有者权益、利润
统计研究 对象的特点
数量性
总体性
具体性
变异性 10
数量性:客观事物的数量方面的特征。 包括:(1) 数量多少;
(2) 现象之间的数量关系; (3) 质量互变的数量界限。
总体性:由许多各不相同的个别事物组成的具有某 一共同特征的整体。
具体性:客观存在的数量。即具体事物在一定时间、 地点、条件下的数量表现,是具体的、实实在在的, 有具体实物内容或计量单位的数据,不是抽象的量。
15
1.4.1 统计学的基本概念 1.总体、单位与样本 2.变量与统计标志 3.指标与指标体系
16
1. 总体、单位与样本
总体(统计总体的简称) :
是由客观存在的、具有某种共同性质的许多个别 事物构成的整体。
单位(总体单位的简称):
是指构成统计总体的每一个个别事物。也称为个体。
样本 : 是从总体中抽取的一部分总体单位(个体)的集合 。
17
总体的特性
同质性
变异性
大量性

天津大学研究生应用统计学第一章第二节课内容

天津大学研究生应用统计学第一章第二节课内容

总体p分位数
分位数
设p满足0 p 1,若x p 使P{ X x p } F ( x p ) p,则 1 称x p 为该分布的p分位数。当p 时,x 1 称为中位数。 2 2
样本p分位数与总体p分位数的关系
定理: 设总体X具有密度函数f ( x),x p 为p分位数(0 p 1), 若f ( x)在x x p处连续且不为零,则样 本p分位数x 渐
数理统计的应用
• 数理统计是应用性很强的学科。在工农业 生产、医药卫生、生物、环境、经济、管 理、金融、保险等领域发挥着重大作用。 • 软件: • Matlab、SPSS、 SAS、 • R软件 /bin/windows/base/
教学参考书
5
10
15
20
25
Cochran 分解定理 设X 1 , X 2 , , X n是独立同分布的随机变 量,X i 服从N(0, 1),i 1, 2, n,Qi(i 1, 2, k ) 是X 1 , X 2 , , X n的二次型,其秩为 ni . 如果Q1 Q2 Qn
当给定次序统计量的观测值 x(1) x(2) ... x(n) 时, 对任意实数x,
0, x x(1) , k Fn ( x) , x( k ) x x( k 1) , n 1, x( n ) x;
n ( x) 个数,则称 Fn ( x ) 为经验分布函数。 n
Rnn X ( n ) X (1)为极差. 称D
注 : X (1 ), X ( 2 ), , X ( n )不 独 立
2.经验分布函数 定义6.1.4 设 X1 ,, X n 是取自总体X的样本
用 n ( x ) 表示 ( X 1 , X 2 , , X n )中不超过 x Байду номын сангаас观测值的

应用数理统计课件

应用数理统计课件
证明 不妨设A,B独立,则
P( AB ) P( A B ) P( A ) P( AB ) P( A ) P( A )P( B ) P( A )(1 P( B )) P( A )P( B )
其他类似可证.
注意 判断事件的独立性一般有两种方法:
① 由定义判断,是否满足公式;
② 由问题的性质从直观上去判断.
P ( A1A2…An) =P(A1)P(A2|A1)P(A3|A1A2)…P(An|A1A2…An-1) 乘法公式一般用于计算n个事件同时发生的概率 19
3. 全概率公式 设Ω是随机试验E的样本空间,事件组 A1,A2,…,An
满足:
(1) Ai Aj (i j);
n
(2)
i 1
Ai
, P( Ai )
A是B的子集,表示若事件A发生,事件B一定发生.
(2) A B(A B),
A与B的并(和).表示事件A,B至少有一个发生.
(3) A B(AB), A与B的交(积).表示事件A和B同时发生.
(4) A B , 表示事件A和B不能同时发生,称A与B互斥 (或互不相容).
(5) A B ,且A B .
(1) Ai Aj (i j);
n
(2)
i 1
Ai
, P( Ai )
0(i
1,2,, n)
则 对于任何一个正概率事件B,有
P(Aj | B)
P(Aj )P(B | Aj )
n
( j 1,2,..., n)
注:
P( Ai )P(B | Ai )
i 1
1.以上两个公式中的A1,A2,...,An可以看作是导致事件B
0(i
1,2,, n)
则 对于任何一个事件B,有

应用统计方法第一章数理统计基本概念

应用统计方法第一章数理统计基本概念
Histogram and Empirical Distribution Function)
2020/4/16
27
一、 直方图(Histogram) 设 X1, X 2 , , X n 是总体 X 的一个样本,又设总体具有
概率密度 f ,如何用样本来推断 f ?注意到现在的样本 是一组实数,因此,一个直观的办法是将实轴划分为若 干小区间,记下诸观察值 X i 落在每个小区间中的个数, 根据大数定律中频率近似概率的原理,从这些个数来推 断总体在每一小区间上的密度。
i
1, 若X i 0, 若X i
(t j1, t j (t j1, t j
] ]
,
i
1,
2,L
,n
则 i 是独立同分布于两点分布: P{i x} p x (1 p)1x , x 0或1
其中 p P{X (t j1, t j )} ,
2020/4/16
32
由柯尔莫哥洛夫强大数定律,我们有
2020/4/16
17
(ⅰ)无放回时:
P{ X 1
1,
X2
1,
X3
1}
5 10000
4 9999
3 9998
(ⅱ)有放回时:
P{X 1
1,
X2
1,
X3
1}
555 10000 10000 10000
5
3
10000
2020/4/16
18
显然(ⅰ)中的抽样方式不是独立的,每次抽样的结果都 将影响下一次抽样的分布,这种抽样不是我们通常研究的 抽样。而(ⅱ)中的抽样,则是多次独立的抽样,它们是 同分布的,即我们通常称为的随机抽样(Random sample)。 这样得到的数据,即是我们常研究的简单随机样本(Simple random sample),或就直接称为样本。

应用数理统计(吴翊版)第一章)

应用数理统计(吴翊版)第一章)

“你不必吃完整头牛,才知道肉是老的” ——西方谚语。
2020/3/25
12
经n次试验得到n个数据——样本容量为n;
X1, X 2 ,..., X n ——一组数据,一个(容量为n的) 样本(子样);
样本所有可能取值的集合——样本空间(n维空 间的子集);
数据可以是数值或属性(但要用数值表示);
为什么要用数理统计?
实际中,数据量大(抽取的数据具有随机 性),试验具有破坏性(不可重复)。
2020/3/25
10
数理统计的研究范畴:应用广泛
传统上,有生物统计(遗传学、医药)、农业统计、 工业统计(民航统计)等;
现代,多元统计应用领域:通信、质量控制、气象、 地质勘探、市场预测与决策等。
数理统计的基本内容:数据采集(抽样理论、试验设计 等)与统计推断(估计、检验等)。
(3) 若总体X具有分布函数F(x),概率密度f(x), 则样本 (X1, X2 ,…, Xn )的分布函数及概率密度为:
n
F ( x1 , x2 , , xn ) F( xi ) i 1 n f ( x1 , x2 , , xn ) f ( xi )
(4) 获得简单随机样本的抽样方i法1 称为简单随机抽样.
当 x 3时, F(x) P{X x} 1
2020/3/25
ห้องสมุดไป่ตู้
(C)中国民航大学 理学院 张春晓
26
§1.4 统计量及其分布
在利用样本推断总体的性质时,往往不能直接利 用样本,而需要对它进行一定的加工,这样才能 有效地利用其中的信息,否则,样本只是呈现为 一堆“杂乱无章”的数据.
【例1.7】从某地区随机抽取50户农民,调查其人 均年收入情况,得到数据(单位:元)如下:

西安交大研究生课程之应用数理统计作业

西安交大研究生课程之应用数理统计作业

研究生教材《应用数理统计》——课后习题答案详解学号:3113312042姓名:齐以年班级:硕3079班目录第一章数理统计的基本概念 (1)第二章参数估计 (18)第三章假设检验 (36)第四章方差分析与正交试验设计 (46)第五章回归分析 (51)第六章统计决策与贝叶斯推断 (56)对应书目:《应用数理统计》施雨编著西安交通大学出版第一章 数理统计的基本概念1.1 解:∵ 2~(,)X N μσ∴ 2~(,)n X N σμ∴~(0,1)N 分布∴(1)0.95P X P μ-<=<=又∵ 查表可得0.025 1.96u = ∴ 221.96n σ=1.2 解:(1) ∵ ~(0.0015)X Exp∴ 每个元件至800个小时没有失效的概率为:8000.001501.2(800)1(800)10.0015x P X P X e dxe -->==-<=-=⎰∴ 6个元件都没失效的概率为: 1.267.2()P e e --==(2) ∵ ~(0.0015)X Exp∴ 每个元件至3000个小时失效的概率为:30000.001504.5(3000)0.00151x P X e dxe--<===-⎰∴ 6个元件没失效的概率为: 4.56(1)P e -=-1.3解:(1) X ={(x 1,x 2,x 3)|x k =0,1,2,…,k =1,2,3},p (x 1,x 2,x 3)=λx 1+x 2+x 3x 1!x 2!x 3!e −3λ,x k =0,1,2,…;k =1,2,3(2) X ={(x 1,x 2,x 3)|x k ≥0;k =1,2,3},f (x 1,x 2,x 3)=λ3e −λ(x 1+x 2+x 3), x k ≥0;k =1,2,3(3) X ={(x 1,x 2,x 3)|a ≤x k ≤b;k =1,2,3},f (x 1,x 2,x 3)=1(b−a)3, a ≤x k ≤b;k =1,2,3(4) X ={(x 1,x 2,x 3)|−∞<x k <+∞;k =1,2,3}=R 3,f (x 1,x 2,x 3)=1(2π)3/2e −12∑(x k −μ)23k=1,−∞<x k <+∞;k =1,2,31.4 解:ini n x n x ex x x P ni i 122)(ln 2121)2(),.....,(122=--∏∑==πσμσ1.5证:21122)(na a x n x a x n i ni i i +-=-∑∑==∑∑∑===-+-=+-+-=ni i ni i n i i a x n x x na a x n x x x x 1222211)()(2221.6证明 (1) ∵22112211221()()()2()()()()()nnii i i nni i i i ni i XX X X X X X X X n X X X n X μμμμμ=====-=-+-=-+--+-=-+-∑∑∑∑∑(2) ∵2221112221221()22ii i nn ni i i i i ni ni XX X X X nX X nX nX X nX =====-=-+=-+=-∑∑∑∑∑1.7证明:a) 证:)(11111+=+++=∑n n i i n x x n x)(11)(1111n n n n n x x n x x x n n -++=++=++b )证:221111()1nn n i i S x x n ++==-+∑ 221112211121111[()]11121[()()()()]11(1)n n n i n i nn n n n n i i n n i i x x x x n n n x x x x x x x x n n n +=++++===---+++=----+-+++∑∑∑221112112[()()((1))111() ]1n n n n n n n n n nS x x x x nx x n x n n x x n ++++=+---+-+++-+22n122n 11[nS ()] 111[S ()]11n n n n n x x n n n x x n n ++=+-++=+-++ 1.8证明:显然: Zm+n ̅̅̅̅̅̅̅=nX ̅+mY ̅m+nS Z2=1m +n[∑(X i −Z m+n ̅̅̅̅̅̅̅)2n i=1+∑(Y i −Z m+n ̅̅̅̅̅̅̅)2mi=1] =1m +n[∑X i 2ni=1−2Zm+n ̅̅̅̅̅̅̅∗nX ̅+∑Y i 2−2Z m+n ̅̅̅̅̅̅̅∗mY ̅+(m +n)mi=1Zm+n ̅̅̅̅̅̅̅2] 因为: nS X 2=∑X i 2n i=1−nX ̅2 nS Y 2=∑Y i 2n i=1−nY ̅2所以:S Z2=nS X2+nS Y2m+n+1m+n[nX̅2+nY̅2−(nX̅+mY̅)2m+n] =nS X2+nS Y2m+n+m∗n(n+m)2(X̅−Y̅)21.10解:(1).∑∑====niiniixEnxnEXE11)(1)1()(=1n∙n∙mp=mpnpmpxDnxnDXDniinii)1()(1)1()(121-===∑∑==))(1()(122∑=-=niixxnESE)1(1)])1(1())1(([1)])()(())()(([1])()([1])([12222212212212p mp nn p m p mp n n p m p mp n n x E x D n x E x D n x nE x E n x x E n n i i i n i i n i i --=+--+-=+-+=-=-=∑∑∑=== 同理,(2).λ===∑∑==ni i n i i x E n x n E X E 11)(1)1()(λnx D n x n D X D ni ini i 1)(1)1()(121===∑∑==λnn x E x D n x E x D n x nE x E n S E n i i i n i i 1)])()(())()(([1])()([1)(2122122-=+-+=-=∑∑==(3).2)(1)1()(11ba x E n x n E X E n i i n i i +===∑∑==na b x D nx n D X D ni in i i 12)()(1)1()(2121-===∑∑==12)(1)])()(())()(([1])()([1)(22122122a b n n x E x D n x E x D n x nE x E n S E ni i i n i i -⋅-=+-+=-=∑∑==(4).λ===∑∑==ni i n i i x E n x n E X E 11)(1)1()(nx D nx n D X D ni in i i 2121)(1)1()(λ===∑∑==221221221)])()(())()(([1])()([1)(λnn x E x D n x E x D n x nE x E n S E n i i i n i i -=+-+=-=∑∑==(5).μ===∑∑==ni i n i i x E n x n E X E 11)(1)1()(nx D nx n D X D ni in i i 2121)(1)1()(σ===∑∑==221221221)])()(())()(([1])()([1)(σ⋅-=+-+=-=∑∑==nn x E x D n x E x D n x nE x E n S E n i i i n i i1.11 解:由统计量的定义知,1,3,4,5,6,7为统计量,5为顺序统计量 1.12 解:顺序统计量:-4,-2.1,-2.1,-0.1,-0.1,0,0,1.2,1.2,2.01,2.22,3.2,3.21中位数Me=0 极差R=(3.21+4)=7.21 再抽一个样本2.7,则顺序统计量变为:-4,-2.1,-2.1,-0.1,-0.1,0,0,1.2,1.2,2.01,2.22,2.7,3.2,3.21 此时,样本中位数Me=(0+1.2)/2=0.61.13解: F 20x={ 0 , x <0620, 0≪x <11320, 1≪x <21620, 2≪x <31820, 3≪x <41 , x ≫41.14解:利用伽马分布的可加性 X~Γ(α,λ) 则Y =∑X i ~Γ(nα,λ)n i=1X ̅=Y nf Y (y )=λnαy nα−1Γ(nα)e −λy,y >0根据随机变量函数的概率密度公式得:f X ̅(x )=λnα(nx)nα−1Γ(nα)e −λnx∗n =λnαn nαx nα−1Γ(nα)e −λnx ,x >01.15解:运用顺序统计量的概率密度公式 (1) f (m)(x )=n!(m−1)!(n−m )![F (x )]m−1[1−F (x )]n−m f(x) 1≪m ≪n (2) f (k)(j)(x )=n!(k−1)!(j−k−1)!(n−j )![F (x )]k−1[F (y )−F (x )]j−k−1[1−F (y )]n−j f(x)f(y) 1≪k<j ≪n (3) 样本极差R =X (n)−X (1), 其中X (n)和X (1)的概率密度可由(1)得到,再根据函数关系可推出R 的概率密度函数 1.16解:X i −μσ~N(0,1)(X i −μσ)2~χ2(1)故:∑(X i −μσ)2~ni=1χ2(n )1.17 证:),(~ λαΓXx ex x f λαααλ--Γ=∴1)()( 令kXY =ke ky kke ky yf ky ky⋅Γ=⋅Γ=∴----λαααλαααλαλ11)()( )()()(即 ),(~ky Y αΓ1.18 证:),(~ b a X β),()1()( 11b a B x xx f b a ---=∴),(),( ),()1()( 11b a B b k a B b a B x x x X E b a k k +=-=∴⎰∞+∞---),(),1()( b a B b a B X E +=∴ba a ab a b a b a a a a b a b a a a b b a b a b a +=Γ+Γ++ΓΓ=Γ++Γ+Γ+Γ=ΓΓ+Γ⋅++ΓΓ+Γ=)()()()()()()1()()1()()()()1()()1(),(),2()(2b a B b a B X E +=))(1()1()()()()2()()2(b a b a a a a b b a b a b a ++++=ΓΓ+Γ⋅++ΓΓ+Γ= 22)]([)()( X E X E X D -=∴2))(1())(1()1(b a b a ab ba ab a b a a a +++=+-++++=1.19 解:∵ ~(,)X F n m 分布2212(1)022()((1))()(1)()()()(1)()()n n m n mn m yn m y n mn nP Y y P X X y m myP X y n n n x x dx m m m++--+≤=+≤=<-Γ=+ΓΓ⎰2222122221122()()()1()(1)()()11(1)(1)(,)n n m n m n mn m n mf y P Y y y y y y y yy B ++----'=≤Γ=+ΓΓ----=∴ 22(1)(,)n mn n Y X X m mβ=+分布1.20 解:∵ ~()X t n 分布122212()()(()2)n n P Y y P X y P X xdxn ++-≤=≤=≤≤Γ=+112211221212122()()()(1)()1()(1)()()()n n n n n f y P Y y y y n y y n n n+++--+--'=≤Γ=+Γ=+ΓΓ∴ 2~(1,)2nY X F =分布1.21 解: (1) ∵ ~(8,4)X N 分布∴ 4~(8,)25X N 分布,即5(8)~(0,1)2X N - ∴ 样本均值落在7.8~8.2分钟之间的概率为:5(7.88)5(8)5(8.28)(7.88.2)()2220.383X P X P ---≤≤=≤≤=(2) 样本均值落在7.5~8分钟之间的概率为:5(7.58)5(8)5(88)(7.58)()2225(8)(0 1.25)20.3944X P X P X P ---≤≤=≤≤-=≤≤=若取100个样品,样本均值落在7.5~8分钟之间的概率为:10(7.88)10(8)10(8.28)(7.88.2)()2222*(0.84130.5)0.6826X P X P ---≤≤=≤≤=-= 单个样品大于11分钟的概率为:P 1=1−0.9333=0.0667 25个样品的均值大于9分钟的概率为: P 2=1−0.9938=0.0062 100个样品的均值大于8.6分钟的概率为P 3=1−0.9987=0.0013 所以第一种情况更有可能发生1.22 解:μ=2.5 2σ=36 n=5 (1)44302<<s ⇔)955,625(22∈σns 而)1(~222-n ns χσ即 )4(36522χ∈s通过查表可得 P =0.1929(2)样本方差落在30~40的概率为0.1929 样品均值-x 落在1.3~3.5的概率即:P{1.3<-x <3.5} ⇔P{-0.4472<σμ)(--x n <0.3727}又σμ)(--x n ~N(0,1)查标准正态分布表可得:P{1.3<-x <3.5}=0.3179 由于样本均值与样本方差相互独立,故:这样两者同时成立的概率为P =0.1929⨯0.3179=0.06131.23 解:(1) ∵2~(0,)X N σ分布 ∴ 2~(0,)X N nσ分布∴ 22()~(1)nXχσ∵ 22221()()ni i a X an X an σσ===∑∴ 21a n σ=同理 21b m σ= (2) ∵ 2~(0,)X N σ分布 ∴222~(1)X χσ分布由2χ分布是可加性得:2221~()ni i X n χσ=∑()nic X t m ==∑ ∴c =(3) 由(2)可知2221~()ni i X n χσ=∑ 2221122211~(,)nni ii i n mn mi ii n i n X d Xnn dF n m XmXmσσ==++=+=+=∑∑∑∑∴ m d n =1.24证明:X n+1~N(μ,σ2) X̅~N(μ,σ2/n) X n+1−X ̅~N(0,n +1n σ2)X n+1−X̅√n +1nσ2~N(0,1)(n −1)S n∗2σ2~χ2(n −1) 所以:Y =X n+1−X ̅S n ∗√n n +1~t(n −1) 1.25 证明:∵ 211~(,)X N μσ分布∴2211()~(1)i X μχσ-∴ 1221111()~()n i i X n μχσ=-∑同理 2222212()~()n i i Y n μχσ=-∑ 1122222112211111222221122112()()~(,)()()n n i i i i n n i i i i X n n X F n n Y n Y n μσμσμσμσ====--=--∑∑∑∑第二章 参数估计2.1 (1) ∵ ~()X Exp λ分布∴ ()1E X λ=令 ˆ1X λ= 解得λ的矩估计为:ˆ1X λ= (2) ∵ (,)X U a b 分布∴ ()2a bE X +=2()()12b a D X -=令 1ˆˆ2ab A X +==22221ˆˆˆˆ()()1124n i i b a a b A X n =-++==∑ (22211n i i X X S n =-=∑)解得a 和b 的矩估计为:ˆˆaX bX =-=(3) 110()1E X x x dx θθθθ-=*=+⎰令 1ˆˆ1A X θθ==+ ∴ˆ1XXθ=- (4) 110()(1)!kk x kE X x x e dx k βββ--=*=-⎰令 ˆkX β=∴ ˆkXβ=(5) 根据密度函数有2221()22()E X a aE X a λλλ=+=++根据矩估计有1222221ˆˆˆ22ˆˆˆa A X aa A S X λλλ+==++==+解得λ和a 的矩估计为:ˆˆaX λ==(6) ∵ (,)X B m p∴ ()E X mp =令 1ˆmpA X == 解得p 的矩估计为:ˆX pm= 2.2解:(1)X 服从指数分布,λ的似然函数为:L (λ)=λn e −λ∑x i n i=1, x i>0,i =1,2,⋯,nlnL (λ)=nlnλ−λ∑x i ni=1∂lnL (λ)∂λ=nλ−∑x i ni=1解得:λ̂=1x̅(2)f (x )=1b−a,a <x <b似然函数为:L (a,b )=1(b −a)n,a <x i <b显然:a ̂=X (1) b ̂=X (n) (3)f (x )={θ x θ−1 ,0<x <10, 其他似然函数为:L (θ)=θn ∗∏x i θ−1ni=1,0<x i <1lnL (θ)=nlnθ+(θ−1)∑lnx i ni=1∂lnL (θ)∂θ=nθ+∑lnx i ni=1=0 解得:θ̂=−n ∑lnx in i=1(4) f (x )={βk(k−1)!x k−1e −βx ,x >00, x ≤0似然函数为:L (β)=(βk(k −1)!)n ∗∏x i k−1ni=1∗e −β∑x i n i=1 ,x i >0 i =1,2,⋯,n lnL (β)=nk ∗lnβ−n ∗ln (k −1)!+(k −1)∑lnx i ni=1−β∑x i ni=1∂lnL (β)∂β=nkβ−∑x i ni=1=0解得:θ̂=−kx̅(5) f (x )={λ x −λ(x−a),x >a 0, x ≤a似然函数为:L (a,λ)=λn x −λ∑(x i ni=1−a) ,x i >a,i =1,2,⋯,nlnL (a,λ)=n ∗lnλ−λ∑x i ni=1+nλa ∂lnL (a,λ)∂λ=nλ−∑(x i ni=1−a)=0 解得:a ̂=X (1) , λ̂=−1X ̅−X (1)(6) X~B(m , P)P {X =k }=(m k)P k(1−P)m−k ,k =0,1,⋯,m似然函数为:L (p )=(m k)n P ∑xi n i=1(1−P)∑(m−x i )n i=1,x i =0,1,2,⋯,nlnL (p )=n ∗ln (mk)+∑x i n i=1∗lnp +∑(m −x i )ni=1∗ln (1−p)∂lnL (p )∂p=∑x in i=1p−∑(m −x i )n i=11−p=0解得:p ̂=−X̅m2.3解:∵ X 服从几何分布,其概率分布为:1()(1)k P X k p p -==-故p 的似然函数为: 1()(1)ni i x nnL p p p =-∑=-对数似然函数为:1ln ()ln ()ln(1)ni i L p n p x n p ==+--∑令 1ln ()1()01nii L p n x n p p p=∂=--=∂-∑ ∴ 1ˆpX= 2.4 解:由题知X 应服从离散均匀分布,⎪⎩⎪⎨⎧≤≤==其它01 1)(Nk N k x pE (X )=N+12矩估计: 令N ̂+12=710 ∴N̂=1419 极大似然估计:⎪⎩⎪⎨⎧≤≤=其它07101 1)(NN N L要使)(N L 最大,则710=N710=∴∧N2.5 解:由题中等式知:2196.196.196.1)025.01(025.0)(1S X +=+=∴+=+-Φ=∴=-Φ-∧∧∧-σμθσμμσθσμθ2.6 解:(1) 05.009.214.2=-=R0215.005.04299.05=⨯==∴∧d Rσ(2)将所有数据分为三组如下所示:0197.005.03946.005.0)05.005.005.0(316=⨯==∴=++=∴∧d R R σ 2.7 解:(1)⎩⎨⎧+<<=其它 01x 1)(θθx f θθθθθθ≠+==+=++=∴∧21)()(2121)(X E E X E ∴ X =∧θ不是θ的无偏估计,偏差为21=-∧θθ(2) θ=-)21(X E 21-=∴∧X θ是θ的无偏估计(3) 22))(()())(()(θθθθ-+=-+=∧∧X E X D E D M S E41121+=n 2.8 证:由例2.24,令2211x a x a +=∧μ,则∧μ 为μ无偏估计应 满足121=+a a因此1μ,2μ,3μ都是μ的无偏估计)()()()(21)()(2513)()(95)9491)(()())(()()(1233212221212∧∧∧∧∧∧=∧<<===+=∴+==∑μμμμμμμD D D X D D X D D X D X D D a a X D X D a D i i i2132121X X +=∴∧μ最有效2.9 证: )(~λp X λλ==∴)( )(X D X EX 是λ=)(X E 的无偏估计,2*S 是λ=)( X D 的无偏估计 )()1()())1((2*2*S E X E S X E αααα-+=-+∴λλααλ=-+=)1(∴ 2*)1(SX αα-+是λ的无偏估计2.10 解:因为2222((1))()(1)()(1)()1(1)()11(1)1E X S E X E S na E S n n a E S n n n a n nααααλαλαλαλλ**+-=+-=+--=+---=+-=- 所以 2(1)X S αα*+-是λ的无偏估计量2.11证明:X~P (λ)假设T(X 1)为θ=e −2λ的无偏估计,即: E[T(X 1)]= θ, E [T (X1)]=∑T (X )∞x=0∗λx x!e−λ=e −2λ=∑T (X )∞x=0∗λx x!=e−λ=∑(−λ)xx!∞x=0=∑(−1)x λx x!∞x=0(泰勒展开)所以T (X 1)=(−1)X 1是θ=e −2λ的唯一无偏估计。

第1章应用数理统计

第1章应用数理统计

个体 —— 组成总体的每一个元素 即总体的每个数量指标,可看作随机 变量 X 的某个取值.用 X i 表示.
样本 —— 从总体中抽取的部分个体. 用 ( X 1 , X 2 , , X n ) 表示, n为样本容量 称 ( x1 , x2 ,, xn ) 为总体 X 的一个容量为n 的样本观测值,或称样本的一个实现.
例如 (1) 设总体X具有一个样本值 1,2,3, 则经验分布函数F3(x)的 观察值为
0, 1 3 , F3 ( x ) 2 , 3 1, 若x 1, 若1 x 2, 若2 x 3, 若x 3.
(2) 设总体F具有一个样本值 1,1,2, 则经验分布函数F3(x)的观 察值为
解 令
( x1 , x2 ,, x10 ) ( 210 , 243 , 185 , 240 , 215 , 228 , 196 , 235 , 200 , 199 )
1 则 x (230 243 185 240 215 10 228 196 235 200 199) 217.19
存在
(n) 0 满足 2 P{X (n)} ,
2
为 2 (n) 分布的上分位点。 则称 (n)
2
( n)
2
4. t分布
定义1.2.4 若随机变量T具有概率密度 n1 ( ) t 2 n2 1 2 f ( t ; n) (1 ) , t n n n ( ) 2 则称T 服从自由度为n的t分布,记为 T ~ t ( n)
样本空间 —— 样本所有可能取值的集合.
简单随机样本 若总体 X 的样本 ( X 1 , X 2 ,, X n ) 满足: (1) X 1 , X 2 ,, X n 与X 有相同的分布

应用数理统计课件第一章

应用数理统计课件第一章

1. SPSS
Statistical Package for the Social Science (社会科学统计软件包) Statistical Product and Service Solutions (统计产品与服务解决方案) 用户遍布于通讯、医疗、银行、证券、 保险、制造、商业、市场研究、科研教育 等多个领域和行业,是世界上应用最广泛 的专业统计软件。
《应用数理统计》
孙 平 东北大学数学系
plsun@
1. 预 备 知 识
2.参数 估计
4.方差 分析
3.假设 检验
5.回归 分析
第1章 预备知识
第1.1节 基本概念与主要内容 第1.2节 概率论基础 第1.3节 统计量与抽样分布
统计学 ( Statistics ) 是一门收集与分析数据, 并且根据数据进行推断的艺术与科学。 ———— 《大英百科全书》 统计学理论主要包含三个部分: 1.数据收集,2.数据分析,3.由数据做出决策。
0, x ≤ x(1) k — , x(k) < x ≤ x(k+1) n 1, x > x(n)
这个函数实际上是观察值 x1,…,xn中 小于 x 的频率,即 Fn (x) = { x1,…,xn中小于 x 的个数} / n
y

2/n 1/n O ○ x(1) x(2) x(3) x ○
可以证明,经验分布函数 Fn (x) 将依概率、 甚至是几乎处处收敛到 F (x) 。
回归与相关分析
数理统计学重要应用之一
讨论数值变量之间的效应关系问题 一元线性回归 比如说,想了解儿子身高与父亲身高之间的关系。 在每个被调查的家庭中同时获得这两个变量的 观察值,分析它们是否有某种(函数)关系,… 多元线性回归 例如,钢的去碳量与不同矿石、融化时间、 炼钢炉体积等等是否有关?关系如何?…

应用数理统计第一章数理统计的基本概念

应用数理统计第一章数理统计的基本概念
1.定义2
设 ( X1 , X 2 ,, X n )为总体 X 的一个
T 样本, ( X1, X 2 ,, X n ) 为 ( X1 , X 2, , X n )
的函数,且除依赖于样本外,不依赖于 任何其它的未知量。 则 T ( X1 , X 2 ,, X n ) 称为统计量.
23
例5 设X~N(μ,σ2),μ已知,σ>0未知, (X1,X2,…,Xn)为X的一个样本。则
总体:数量指标 X 所有可能值的全体 个体:数量指标 X 的每一个值 X 可以是一维,也可以是多维 例1 研究某厂生产的一批灯泡使用寿命 例2 研究北京理工大学学生的身高和体重
3
由于每个个体的出现是随机的, 所以相应的数量指标的出现也带有 随机性. 从而可以把这种数量指标
看作一个随机变量.
因此,随机变量的分布就是该数 量指标在总体中的分布.
13
总体(理论分布)?
样本
样本观察值
统计是从手中已有的资料—样本观察 值,去推断总体的情况---总体分布F(x) 的性质. 样本 是联系二者的桥梁
14
2 样本分布
(1)设总体X的分布函数 F ( x) P( X x)
( X1 , X 2 ,, X n ) 的联合分布函数
F x1 , x2 ,, xn P X1 x1 , X 2 x2 ,, X n xn
2
解:由于X N (, ), 其概率密度函数为
2
( x )2 1 f ( x; , 2 ) exp 2 2 2
17
因此,样本 ( X1, X 2 ,, X n ) 的联合概率密 度函数为
f ( xi ; , 2 )
i 1 n

应用数理统计课件

应用数理统计课件
应用数理统计课件
目录
• 引言 • 基础知识 • 描述性统计方法 • 推断性统计方法 • 实验设计与数据分析案例
目录
• 质量控制与可靠性评估方法 • 总结与展望
01
引言
数理统计简介
01
定义
数理统计是应用概率论对数据 进行收集、整理、分析和推断
的数学学科。
02
发展历程
介绍数理统计的历史背景、发 展过程和重要里程碑。
假设检验原理及应用举例
01
原假设与备择假设
明确待检验的假设,设定原假设 和备择假设。
03
拒绝域与显著性水平
设定拒绝域和显著性水平,判断 原假设是否成立。
02
检验统计量
根据原假设选择合适的检验统计 量,如Z检验、t检验、χ²检验等

04
应用举例
通过实际案例展示假设检验的应 用,如检验两种不同教学方法的
01
数据清洗
去除异常值、缺失值和重复值,确 保数据质量。
推论性统计
运用假设检验、方差分析等方法, 推断实验结果的可靠性和有效性。
03
02
描述性统计
计算均值、中位数、标准差等指标 ,以描述数据的基本特征。
可视化展示
利用图表直观展示数据分布和趋势 ,便于理解和分析。
04
实际案例展示与讨论
案例一
某种新药的临床试验。通过 随机双盲对照实验,比较新 药与安慰剂对病患的疗效差 异,并运用统计方法进行数
效果是否有显著差异。
方差分析与回归分析简介
01
方差分析
02
回归分析
研究不同因素对观测变量影响的显著性,判断因素之间是否存在交互 作用。例如,分析不同品种、不同施肥量对农作物产量的影响。

应用数理统计期末复习

应用数理统计期末复习

应用数理统计期末复习指导一、复习重点第一章 绪 论数理统计学是一门对客观不确定现象进行数据搜集、整理、表列和分析的科学,其目的是了解客观情况,探索数据内在结构及现象之间的规律性。

对搜集的全部数据加以整理来研究这些数据的特征,这称为描述统计。

建立在样本数据的基础上对总体的特征做出估计和推断,这称为推断统计。

数理统计学的发展大致经历了古典统计学、近代统计学和现代统计学三个阶段。

第二章第二章 数据的搜集、整理与描述统计表最主要的内容是指标名称与指标数值。

数据集中趋势的计量:(1)均值(算术平均数);(2)几何平均数;(3)中位数;(4)众数;(5)切尾均值。

离散趋势的计量:(1)极差,又称为全距。

极差是数据中最大值和最小值之差;(2)四分位差;(3)平均差,它是数据值与其均值之差绝对值的平均数;(4)方差和标准差。

方差是数据值与其均值离差平方和的平均数。

方差不仅可以用来反映值代表性的高低,而且也是数据离散趋势的最主要的统计数量特征;(5)离散系数。

第三章 概率基础凡是一个行动或过程会导致一毓可能的结果之一,但具体发生哪一个结果是不确定的,这种行动或过程统称为随机试验。

随机试验所有可能结果的集合称作样本空间。

随机试验的每一个可能的结果称为随机事件。

凡是必然发生的事件称为必然事件。

必然不发生的事件称为不可能事件。

如果事件A的发生必然导致事件B的发生,则称事件A包含于事件B,记作 。

两个事件A、B中至少有一个发生称为两个事件的并,记作 。

两个事件A、B中同时发生称为两个事件的交,记作 。

事件A发生而事件B不发生称为两个事件的差,记作A-B或 。

样本空间与事件A的差称为事件A的逆事件或对立事件,互补事件,记作 。

事件A与事件B不可能同时发生称两个事件互不相容或互斥,记 。

事件的运算满足: B A ⊂B A B A B A A A -Ω=ϕ=B A概率的古典定义:如果某一随时机试验的结果(基本事件)有限;而且各个结果出现的可能性相等,则某一事件A的概率为该事件所包含的基本事件数m 与样本空间中所包含的基本事件个数n 的比值,记为概率的公理化定义:(1)对于任何一个事件A,有 ;(2)对于必然事件 ,有 ;对于不可能事件 ,有 ; (3)对于两两互斥事件 ,有概率的加法规则: 概率的乘法规则:事件的独立性与互斥的区别:(1)互斥事件一定是相互依赖(不独立)的,但相互依赖的事件则不一定是互斥的。

应用数理统计教学大纲-北京理工大学研究生院

应用数理统计教学大纲-北京理工大学研究生院

《应用数理统计》教学大纲一、课程编码:22-025200-B01-17课内学时:48 学分: 3二、适用学科专业:应用统计三、先修课程:概率论与数理统计四、教学目标通过本课程的学习,使研究生:1、了解统计的发展史;2、掌握统计的基本概念,基本方法和基本理论;3、掌握统计机器学习的若干基本概念,基本方法和基本理论;4、能够理论和实际结合,提升处理实际数据分析问题能力.五、教学方式课堂讲授、案例讨论与分析。

六、主要内容及学时分配第1章大数据与统计学3学时§1.1 什么是数据§1.2 什么是大数据案例: 布罗德街的水井案例: 啤酒与尿布案例: 谷歌流感预测§1.3 什么是统计学第2章批判性数据思维3学时§2.1 试验设计和抽样方法案例:物理防晒完胜化学防晒案例:罗斯福将败给兰登案例:高考状元的典型特征§2.2 统计分析案例:一杯红酒可以代替一小时健身案例:巧克力可以减肥案例:统计学与杀婴母亲第3章描述性统计6学时§ 3.1 平均数中位数众数案例:平均数的发展史案例:平均工资的度量§ 3.2 统计图案例:丑图百讲§ 3.3 可视化案例:北京市空气质量报告第4章假设检验15学时§ 4.1 假设检验的基本思想案例:Neyman与Fisher关于假设检验的分歧§ 4.2 p值案例:美国统计学会关于p值的六条准则案例:很多心理学论文重复检验失败案例: 统计误差§ 4.3 Bayes检验案例: Bayes身世之谜§4.4列联表中的独立性检验案例:药效问题中的Simpson悖论案例:性别歧视问题中的Simpson悖论第5章Bayes方法6学时§ 5.1 Bayes公式案例:失联搜救中的Bayes分析§5.2 朴素Bayes案例:垃圾邮件过滤§ 5.3 Bayes网第6章回归分析9学时§6.1 线性回归案例:北京市空气质量预测案例:北京市房价预测§6.2 Logistic回归案例:互联网征信中的信用评分模型案例:基于UBI的车险数据分析§6.3 Lasso回归第7章文本挖掘与社交网络分析6学时§7.1文本挖掘案例:旧报纸里的英国§ 7.2 社交网络分析案例:社交网络中我的标签是否会影响我的社交圈案例:唐朝诗人之间社交关系分析七、考核与成绩评定课程论文结合平时作业和考勤,成绩以百分制衡量。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(3) 可列可加性:设A1, A2, … 是一列两两互不相容的事件,
即AiAj=,(ij), i , j=1, 2, …, 有
P( A1 A2 … )= P(A1) +P(A2)+ … . 则称P(A)为事件A的概率。
(1.1)
2.概率的性质
(1) 不可能事件概率为零:P()=0; (1.2) (2) 有限可加性:设A1,A2, …,An , 是n个两两互不相容的 事件,即AiAj= ,(ij), i , j=1, 2, …, n ,则有 P( A1 A2 … An)= P(A1) +P(A2)+…+ P(An); (1.3)
j1 j1


则称P(A),AF为域F上的概率测度,简称“ “概率” 。
满足公理 1和公理2的三元体 ( , F, P)称为概率空间。
1.3 条件概率及概率计算公式
一、条件概率
设A、B是 中的两个事件,即A、B F,则
P ( AB ) P ( B | A) , P ( A)
P ( A) 0
例 2、(蒲丰(Buffon)投针问题)1777年法国 科学家蒲丰提出了下列著名问题: 平面上画着一些平行线,它们 之间的距离都等于a,向此平面上任
a
x l

投一长度为l ( l < a )的针,试求此针与任一平行线相交的 概率。
可求得其概率
2 l P= a
利用蒙特-卡洛(Monte-Carlo)法可求得圆周率 的近似值。 (参见教材P.14)
(2) 取数问题
设有1~7七位数字,从中任
取三个不同的数字组成一个三位数,求这三 位数是偶数的概率。
(3)分配问题 把n个球随机地分配到m个
盒子中去,问每盒中至多有一球的 概率是多少?(nm,盒子足够大)
(4)配对问题 从五双不同的鞋
子中任意地取出四只,问其中至 少有两只成双的概率是多少?
例 3、设有n 个人,每个人都等可能地被分配到N个房
五、概率的公理化结构
公理 1 事件域公理
样本空间 的部分子集所组成的集合F若满足以下 三个条件: (F.1) F; (F.2) 若AF ,则 A= -A F; (F.3) 若有一列AiF, i=1,2,… , 则可列和
A
i=1

i
F.
则称其为 上的域(或代数),也称其为 上的事件域。 二元体 ( , F )称为可测空间。
河海大学研究生数学系列基础课程CAI
概率论 与数理统计
讲授: 夏乐天
本课程与其他数学基础课的关系
微积分
(高等数学)
线性代数

一.确定性数学

初等数学、高等数学(微积分)、线性代数等
二.随机数学---以概率论为代表
1. 非确定性现象: 彩票中奖 发大水 阴天等
2. 生活中的随机现象:抛硬币 掷骰子 赌博 出生性别等
概率论
第一章 事件与概率 第二章 随机变量及其分布 第三章 随机向量及其分布 第四章 随机变量的数字特征何特征函数 第五章 大数定律和中心极限定理

第一章 随机事件和概率
随机事件和样本空间 概率及其性质 条件概率、全概公式和贝叶斯公式

事件的独立性及贝努里概型
1.1 随机事件和样本空间
(3) 单调不减性:若事件BA,则P(B)≥ P(A) , 且 P(B-A)=P(B)-P(A);
(4) 互补性:P(A)=1- P(A),且P(A) 1 ;
(1.4)
(1.5)
(5) 加法公式:对任意两事件A、B,有 P(AB)=P(A)+P(B)-P(AB) (1.6)
公式(1.6)可推广到任意n个事件A1,A2,…,An的情形;
公理 2 概率公理 设( ,F)为可测空间,在事件域F
上定义一个实值函数P(A),AF,满足:
(1)非负性: P(A)0,对任意AF; (2)规范性: P( )=1;
(3)可列可加性:若有一列AiF, i=1, 2, …, AiAj=, 使得
P( A j ) P( A j )
1.包含关系: “A发生必导致 B发生”记为AB A= B A B且 B A. 2.和事件 : AB 3.积事件 : AB= AB 4.差事件、对立事件(余事件):A-B称为 A与B的差事件 B B称为B的对立事件; 易知A B AB;
5.互不相容性:AB= A、 B互为对立事件 AB= , 且AB= 6. 可分性:对任意两事件A、B,有A AB AB.
n
2048 4040 12000 24000
nH
1061 2048 6019 12012
fn(H)
0.5181 0.5069 0.5016 0.5005
1.定义 若对随机试验E所对应的样本空间 中的每一事件
A,均赋予一实数P(A),集合函数P(A)满足条件:
(1)非负性:对任一事件A,有P(A) ≥ 0; (2) 规范性: P( )=1;
A B A B,
k
AB A B
k
可推广 Ak Ak ,
A
k
k
Ak .
k
1.2 概率及其性质
一、频率
1.定义 事件A在n次重复试验中出现nA次,则比值 nA/n称为事件A在n次重复试验中出现的频率,记为fn(A). 即 f n(A)= nA/n.
2.频率的性质
(1) 非负性: fn(A) ≥0; (2) 规范性: fn()=1;
E6: 对一目标进行射击,直到命中为止,考虑其结果; E7: 在一批灯泡中任取一只,测其寿命。
2. 随机试验的特征
(1) 可在相同条件下重复进行; (2) 试验结果不止一个 ,但能确定所有的可能结果; (3) 一次试验之前无法确定具体是哪种结果出现。
二、样本空间
1、样本空间:所有试验结果组成的集合称为样本 空间,记为 ={}; 2、样本点: 样本空间的元素称为样本点,样本点即 试验结果,记为. 例如
P(A)=P(AB)+P(AB ) .

(个单调不减的事件序列,记
A
n 1
n
lim An
n
n

P(lim An ) lim P{ An }.
n
三、古典概型
1. 古典概型的特征 (1) 有限性:样本空间={1, 2 , … , n }; (2) 等可能性:P(i)=1/n, (i=1, 2, … , n). 古典概型也称为等可能概型。
例2、袋中有6只乒乓球,其中4白2红,现从中 取二次,每次取一只(分别考虑有放回和无放回
取球的情形)。求 (1) 全是白球的概率;
(2) 两球色相同的概率; (3) 至少一只白球的概率。
3.古典概型的几类基本问题 (1) 抽球问题
设袋中有N个球,其中有M 个白球,现从中任抽n个球,问这n个球中恰 有k个白球的概率是多少?
四.概率论的内容构成
本课程的内容在数学上属于概率论范畴,它由如下 三个部分所组成
基础部分 ---概率论: 古典概率 随机变量及其分布
分布函数 数字特征等 应用部分 ---数理统计: 统计量构造 参数估计 假设检验 回归分析等 深入部分 ---随机过程: 马尔可夫过程 平稳过程 随机分析等 本课程主要介绍应用部分,但需要回顾基础部分。
一、随机试验
1. 随机试验(简称“试验”)的例子
随机试验可表为E E1: 抛一枚硬币,分别用“H” 和“T” 表示出正面和反面; E2: 抛两枚硬币,考虑可能出现的结果; E3: 掷一颗骰子,考虑可能出现的点数i; E4: 掷两颗骰子,考虑可能出现的结果及点数之和;
E5: 记录电话交换台一分钟内接到的呼叫次数;
对应E1的样本空间为 ={H,T}; 对应E2的样本空间为 ={(H,H), (H, T), (T, H), (T, T)}; 对应E5的样本空间为 ={0, 1, 2, … };
三、随机事件
1.定义 试验中可能出现或可能不出现的事情叫
“随机事件”, 简称“事件”. 2.基本事件 : 不可能再分解的事件, 即试验的结果,
常记为“”. 3.两个特殊事件: 必然事件Ω、不可能事件.
任何事件均是某些样本点组成的集合. 例 对于试验E2与E5 ,以下A 、 B即为两个随机事件: A=“至少出一个正面” ={(H,H), (H, T), (T, H)}; B=“至少m次少于n次”={m, m+1, …, n-1}。
四、事件之间的关系
2. 古典概型的计算公式
A中所含样本点数 k k ( A ) = = P(A)= 中样本点总数 n n
设事件A中包含k个样本点(基本事件)
例1、做试验E:“将一枚硬币连抛2次” , 观测出正、反面的情形。
(1) 写出E的样本空间; (2) 设A1=“恰有一次出正面” ,求P(A1);
(3) 设A2=“至少出一次正面” ,求P(A2).
间中的任意一间去住(n N,房间足够大,大到住得下
所有的人),求下列事件的概率: (1)指定的n个房间每个房间各有一人;
(2)恰好有n个房间,每个房间各有一人。
例 4、某班级有n 个人(n365), 问至少有两个人的生日在同一天
的概率有多大?
n pn
10 0.12 20 0.41
实例
23 0.51 30 0.71 40 0.89 50 0.97
例 6、(De Mere问题)一颗骰子掷4次至少得一个六点
与两颗骰子掷24次至少得一个双六,这两件事,哪
一个有更多的机会遇到?
P1=1(5/6)4 = 0.5177;
P2=1(35/36)24 = 0.4914.
四、 几何概型
1. 几何概型的特征
相关文档
最新文档