第八章参数估计答案

合集下载

统计学第七章、第八章课后题答案

统计学第七章、第八章课后题答案

统计学复习笔记之南宫帮珍创作第七章第八章参数估计一、思考题1.解释估计量和估计值在参数估计中, 用来估计总体参数的统计量称为估计量.估计量也是随机变量.如样本均值, 样本比例、样本方差等.根据一个具体的样本计算出来的估计量的数值称为估计值. 2.简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值即是被估计的总体参数.(2)有效性:是指估计量的方差尽可能小.对同一总体参数的两个无偏估计量, 有更小方差的估计量更有效.(3)一致性:是指随着样本量的增年夜, 点估计量的值越来越接近被估总体的参数.3.怎样理解置信区间在区间估计中, 由样本统计量所构造的总体参数的估计区间称为置信区间.置信区间的论述是由区间和置信度两部份组成.有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间), 其实不说明置信度, 也不给出被调查的人数, 这是不负责的暗示.因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌.在公布调查结果时给出被调查人数是负责任的暗示.这样则可以由此推算出置信度(由后面给出的公式), 反之亦然.4.解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率.也就是说, 无穷次重复抽样所获得的所有区间中有95%(的区间)包括参数.不要认为由某一样本数据获得总体参数的某一个95%置信区间, 就以为该区间以0.95的概率覆盖总体参数.5.简述样本量与置信水平、总体方差、估计误差的关系.1.估计总体均值时样本量n为其中:2.样本量n与置信水平1-α、总体方差、估计误差E之间的关系为▪与置信水平成正比, 在其他条件不变的情况下, 置信水平越年夜, 所需要的样本量越年夜;▪与总体方差成正比, 总体的不同越年夜, 所要求的样本量也越年夜;▪与与总体方差成正比, 样本量与估计误差的平方成反比, 即可以接受的估计误差的平方越年夜, 所需的样本量越小.二、练习题1.从一个标准差为5的总体中采纳重复抽样方法抽出一个样本量为40的样本, 样本均值为25.1)样本均值的抽样标准差即是几多?2)在95%的置信水平下, 估计误差是几多?解: 1)已知σ = 5, n = 40, = 25∵∴2)已知∵2.某快餐店想要估计每位顾客午餐的平均花费金额, 在为期3周的时间里选取49名顾客组成了一个简单随机样本.1)假定总体标准差为15元, 求样本均值的抽样标准误差.2)在95%的置信水平下, 求估计误差.3)如果样本均值为120元, 求总体均值µ的95%的置信区间.解:1)已知σ = 15, n = 49∵∴2)已知∵3)已知 = 120∵ 置信区间为±E3.从一个总体中随机抽取n =100的随机样本, 获得 =104560, 假定总体标准差σ = 85414, 试构建总体均值µ的95%的置信区间.解:已知n =100, =104560, σ = 85414, 1-a=95% ,由于是正态总体, 且总体标准差已知.总体均值m在1-a置信水平下的置信区间为104560 ± 1.96×85414÷√1004.从总体中抽取一个n =100的简单随机样本, 获得 =81, s=12.要求:1)构建µ的90%的置信区间.2)构建µ的95%的置信区间.3)构建µ的99%的置信区间.解:由于是正态总体, 但总体标准差未知.总体均值m在1-a置信水平下的置信区间公式为81±×12÷√100 = 81±×????????4)= 25, σ = 3.5, n =60, 置信水平为95%5)=119, s =23.89, n =75, 置信水平为98%6)=3.149, s =0.974, n =32, 置信水平为90%解:∵∴ 1) 1-a=95% ,其置信区间为:25±1.96×3.5÷√602) 1-a=98% , 则a=0.02, a/2=0.01, 1-a/2=0.99,查标准正态分布表,可知:其置信区间为: 119±2.33×23.89÷√753) 1-a=90%,其置信区间为:3.149±1.65×0.974÷√325.利用下面的信息, 构建总体均值µ的置信区间:1)总体服从正态分布, 且已知σ = 500, n = 15, =8900, 置信水平为95%.解:N=15, 为小样本正态分布, 但σ已知.则1-a=95%, .其置信区间公式为∴置信区间为:8900±1.96×500÷√15=(8646.7 , 9153.2)2)总体不服从正态分布, 且已知σ = 500, n = 35, =8900,置信水平为95%.解:为年夜样本总体非正态分布, 但σ已知.则1-a=95%, .其置信区间公式为∴置信区间为:8900±1.96×500÷√35=(8733.9 9066.1)3)总体不服从正态分布, σ未知, n = 35, =8900, s =500, 置信水平为90%.解:为年夜样本总体非正态分布, 且σ未知, 1-a=90%,1.65.其置信区间为:8900±1.65×500÷√35=(8761 9039)4)总体不服从正态分布, σ未知, n = 35, =8900, s =500, 置信水平为99%.解:为年夜样本总体非正态分布, 且σ未知, 1-a=99%,2.58.其置信区间为:8900±2.58×500÷√35=(8681.9 9118.1)6.某年夜学为了解学生每天上网的时间, 在全校7500名学生中采用重复抽样方法随机抽取36人, 调查他们每天上网的时间, 获得下面的数据(单元:小时)(略).求该校年夜学生平均上网时间的置信区间, 置信水平分别为90%解:先求样本均值:= 3.32再求样本标准差:置信区间公式:7.从一个正态总体中随机抽取样本量为8的样本, 各样本值分别为:10, 8, 12, 15, 6, 13, 5, 11.求总体均值µ的95%置信区间.解:本题为一个小样本正态分布, σ未知.先求样本均值:= 80÷8=10再求样本标准差:于是 , 的置信水平为的置信区间是,已知, n = 8, 则,α/2=0.025, 查自由度为n-1 = 7的分布表得临界值所以, 置信区间为:10±2.45×3.4641÷√78.某居民小区为研究职工上班从家里到单元的距离, 抽取了由16个人组成的一个随机样本, 他们到单元的距离分别是:10, 3,14, 8, 6, 9, 12, 11, 7, 5, 10, 15, 9, 16, 13, 2.假设总体服从正态分布, 求职工上班从家里到单元平均距离的95%的置信区间.解:小样本正态分布, σ未知.已知, n = 16, , 则, α/2=0.025, 查自由度为n-1 = 15的分布表得临界值样本均值再求样本标准差:于是 , 的置信水平为的置信区间是?? ??????????????????±??×??÷√??9.从一批零件是随机抽取????个, 测得其平均长度是??????, 标准差是????.1)求确定该种零件平均长度的????August的置信区间.2)在上面估计中, 你使用了统计中的哪一个重要定理?请解释.解:)??这是一个年夜样天职布.已知N??????, ??????????????, S????????, α?? ????, .其置信区间为:149.5±1.96×1.93÷√36 2)中心极限定理论证:如果总体变量存在有限的平均数和方差, 那么, 不论这个总体的分布如何, 随着样本容量的增加, 样本均值的分布便趋近正态分布.在现实生活中, 一个随机变量服从正态分布未必很多, 可是多个随机变量和的分布趋于正态分布则是普遍存在的.样本均值也是一种随机变量和的分布, 因此在样本容量充沛年夜的条件下, 样本均值也趋近于正态分布, 这为抽样误差的概率估计理论提供了理论基础.10.某企业生产的袋装食品采纳自动打包机包装, 每袋标准重量为100克, 现从某天生产的一批产物中按重复抽样随机抽取50包进行检查, 测得每包重量如下:(略)已知食品包重服从正态分布, 要求:1)确定该种食品平均重量的95%的置信区间.2)如果规定食品重量低于100克属于分歧格, 确定该批食品合格率的95%的置信区间.解:1)本题为一个年夜样本正态分布, σ未知.已知N=50, µ=100, 1-α=0.95, .① 每组组中值分别为97、99、101、103、105, 即此50包样本平均值= (97+99+101+103+105)/5 = 101② 样本标准差为:③其置信区间为:101±1.96×1.666÷√502)∵ 分歧格包数(<100克)为2+3=5包, 5/50 = 10%(分歧格率), 即P = 90%.∴ 该批食品合格率的95%置信区间为:11.假设总体服从正态分布, 利用下面的数据构建总体均值μ的99%的置信区间.(略)解:样本均值样本标准差:尽管总体服从正态分布, 可是样本n=25是小样本, 且总体标准差未知, 应该用T统计量估计.1-α=0.99, 则α=0.01, α/2=0.005, 查自由度为n-1 =24的分布表得临界值的置信水平为的置信区间是,12.一家研究机构想估计在网络公司工作的员工每周加班的平均时间, 为此随机抽取了18个员工, 获得他们每周加班的时间数据如下(单元:小时):(略)假定员工每周加班的时间服从正态分布, 估计网络公司员工平均每周加班时间的90%的置信区间.解:① N = 18 < 30, 为小样本正态分布, σ未知.②样本均值样本标准差:=③ 1-α= 90%, α= 0.1, α/2= 0.05, 则查自由度为n-1 = 17的分布表得临界值④的置信水平为的置信区间是,13.利用下面的样本数据构建总体比例丌的置信区间:1)n =44, p = 0.51 , 置信水平为99%2)n =300, p = 0.82 , 置信水平为95%3)n =1150, p = 0.48, 置信水平为90%解: 1) 1-α= 99%, α= 0.01, α/2= 0.005, 1-α/2= 0.995, 查标准正态分布表, 则2)1-a=95%,3)1-a=90%,分别代入14.在一项家电市场调查中, 随机抽取了200个居民户, 调查他们是否拥有某一品牌的电视机, 其中拥有该品牌电视机的家庭占23%.求总体比例的置信区间, 置信水平分别为90%和95%.解: 1)置信水平90%, 1-a=90%, 1.65, N = 200, P = 23%.代入2)置信水平95%, 1-a=95%, , N = 200, P = 23%.代入15.一位银行的管理人员想估计每位顾客在该银行的月平均存款额.他假设所有顾客月存款额的标准差为1000元, 要求的估计误差在200元以内, 置信水平为99%.应选取多年夜的样本?解:已知 1-α = 99%, 则 2.58.E = 200, σ= 1000元.则N = (²×σ²)÷E²= (2.58²×1000²)÷200²≈167(得数应该是166.41, 不论小数后是几多, 都向上进位取整, 因此至少是167人)16.要估计总体比例丌, 计算下列条件下所需的样本量.1)E=0.02, 丌=0.40, 置信水平96%2)E=0.04, 丌未知, 置信水平95%3)E=0.05, 丌=0.55, 置信水平90%解: 1)已知 1-α = 96%, α/2 =0.02 , 则N = {²×丌(1-丌)}÷E²=2.06²×0.4×0.6÷0.02²≈25472)已知 1-α = 95%, α/2 =0.025 , 则丌未知,则取使丌(1-丌)最年夜时的0.5.N = {²×丌(1-丌)}÷E²=1.96²×0.5×0.5÷0.04²≈601 3)置信水平90%, 1-a=90%, 1.65,N = {²×丌(1-丌)}÷E²=1.65²×0.55×0.45÷0.05²≈27017.某居民小区共有居民500户, 小区管理者准备采纳一项新的供水设施, 想了解居民是否赞成.采用重复抽样方法随机抽取了50户, 其中有32户赞同, 18户反对.1)求总体中赞成该项改革的户数比例的置信区间(α=0.05)2)如果小区管理者预计赞成的比例能到达80%, 估计误差不超越10%, 应抽取几多户进行调查(α=0.05)解:1)已知N=50, P=32/50=0.64, α=0.05, α/2 =0.025 , 则置信区间:P±2)已知丌=0.8 , E = 0.1, α=0.05, α/2 =0.025 , 则N= ²丌(1-丌)/E²= 1.96²×0.8×0.2÷0.1²≈6218.根据下面的样本结果, 计算总体标准差σ的90%的置信区间:1)=21, S=2, N=502)=1.3, S=0.02, N=153)=167, S=31, N=22解:1)年夜样本, σ未知, 置信水平90%, 1-a=90%,21±1.65×2÷√502)小样本, σ未知, 置信水平90%, 1-a=90%, 则查自由度为n-1 = 14的分布表得临界值, = 1.3±1.761×0.02÷√153) 年夜样本, σ未知, 置信水平90%, 1-a=90%,167±1.65×31÷√2219.题目(略)1)构建第一种排队方式等候时间标准差的95%的置信区间2)构建第二种排队方式等候时间标准差的95%的置信区间3)根据1)和2)的结果, 你认为哪种排队方式更好?解:本题为小样本正态分布, σ未知, 应用公式,置信水平95%, 1-a=95%, 则查自由度为n-1 = 9的分布表得临界值1)= 7.15,其置信区间为7.15±2.31×0.48÷√102)= √0/9 = 0其置信区间为7.15±04)第二种排队方式更好.(19题是对总体方差的估计, 应该用卡方统计量进行估计, 20题是对两个总体参数的估计, 这二种类型老师未讲, 不是本次考试的内容, 不能用Z统计量像估计总体均值和比例那样去估计, 具体内容见书上P188――P194)第九章假设检验一、思考题1.假设检验和参数估计有什么相同点和分歧点?解:参数估计与假设检验是统计推断的两个组成部份.相同点:它们都是利用样本对总体进行某种推断.分歧点:推断的角度分歧.参数估计讨论的是用样本统计量估计总体参数的方法, 总体参数μ在估计前是未知的.而在假设检验中, 则是先对μ的值提出一个假设, 然后利用样本信息去检验这个假设是否成立.2.什么是假设检验中的显著性水平?统计显著是什么意思?解:显著性水平用α暗示, 在假设检验中, 它的含义是当原假设正确时却被拒绝的概率或风险, 即假设检验中犯弃真毛病的概率.它是由人们根据检验的要求确定的.(我理解的统计学意义, 统计显著是统计上专用的判定标准, 指在一定的概率原则下, 可以供认一种趋势或者合理性到达的水平, 到达为统计上水平显著, 达不到为统计上水平不显著)3.什么是假设检验中的两类毛病?解:弃真毛病(α毛病):当原假设为真时拒绝原假设, 所犯的毛病成为第I类毛病, 又称为弃真毛病.犯第I类毛病的概率常记作α.取伪毛病(β毛病):当原假设为假时没有拒绝原假设, 所犯的毛病称为第II类毛病, 又称取伪毛病.犯第II类毛病概率常记作β.发生第I类毛病的概率也常被用于检验结论的可靠性怀抱.假设检验中犯第I类毛病的概率被称为显著性水平, 记作α.4.两类毛病之间存在什么样的数量关系?在样本容量n一定的情况下, 假设检验不能同时做到犯α和β两类毛病的概率都很小.若减小α毛病, 就会增年夜犯β毛病的机会;若减小β毛病, 也会增年夜犯α毛病的机会.要使α和β同时变小只有增年夜样本容量.但样本容量增加要受人力、经费、时间等很多因素的限制, 无限制增加样本容量就会使抽样调查失去意义.因此假设检验需要慎重考虑对两类毛病进行控制的问题.5.解释假设检验中的P值.解:如果原假设为真, 所获得的样本结果会像实际观测结果那么极端或更极真个概率, 称为P值.也称为观察到的显著性水平.P值是反映实际观测到的数据与原假设H0之间纷歧致水平的一个概率值.P值越小, 说明实际观测到的数据与H0之间纷歧致水平就越年夜.6.显著性水平与P值有何区别?解:α(显著性水平)是一个判断的标准(当原假设为真, 却被拒绝的概率), 而P是实际统计量对应分位点的概率值(当原假设为真时, 所获得的样本观察结果或更极端结果呈现的概率).可以通过α计算置信区间, 然后与统计量进行比力判断, 也可以通过统计量计算对应的p值, 然后与α值比力判断.7.假设检验依据的基来源根基理是什么?解:假设检验利用的是小概率原理, 小概率原理是指发生概率很小的随机事件在一次试验中是几乎不成能发生的.根据这一原理, 可以先假设总体参数的某项取值为真, 也就是假设其发生的可能性很年夜, 然后抽取一个样本进行观察, 如果样本信息显示呈现了与事先假设相反的结果且与原假设分歧很年夜, 则说明原来假定的小概率事件在一次实验中发生了, 这是一个违背小概率原理的分歧理现象, 因此有理由怀疑和拒绝原假设;否则不能拒绝原假设.8. 你认为在单侧检验中原假设和备择假设的方向应该如何确定?解: 假设问题有两种情况, 一种是所考察的数值越年夜越好(左单侧检验或下限检验), 临界值和拒绝域均在左侧;另一种是数值越小越好(右单侧检验或上限检验), 临界值和拒绝域均在右侧.二、 练习题1. 已知某炼铁厂的含碳量服从正态分布N (4.55, 0.108²), 现在测定了9炉铁水, 其平均含碳量为4.484.如果估计方差没有变动, 可否认为现在生产的铁水平均含碳量为4.55(α=0.05)? 解: 已知μ0=4.55, σ²=0.108², N=9, =4.484,这里采纳双侧检验, 小样本, σ已知, 使用Z 统计.假定现在生产的铁水平均含碳量与以前无显著不同.则, α=0.05, α/2 =0.025 , 查表得临界值为计算检验统计量: = (4.484-4.55)/(0.108/√9) 决策:∵Z 值落入接受域, ∴在=0.05的显著性水平上接受H0. nx Z / σ - =μ0结论:有证据标明现在生产的铁水平均含碳量与以前没有显著不同, 可以认为现在生产的铁水平均含碳量为4.55.2. 一种元件, 要求其使用寿命不得低于700小时.现从一批这种元件中随机抽取36件, 测得其平均寿命为680小时.已知该元件寿命服从正态分布, σ=60小时, 试在显著性水平0.05下确定这批元件是否合格.解: 已知N=36, σ=60, =680, μ0=700这里是年夜样本, σ已知, 左侧检验, 采纳Z 统计量计算. 提出假设:假定使用寿命平均不低于700小时H0:μ≥700H1: μ < 700= 0.05, 左检验临界值为负, 查得临界值: -Z0.05=-1.645计算检验统计量: = (680-700)/(60/√36) = -2决策:∵Z 值落入拒绝域, ∴在=0.05的显著性水平上拒绝H0, 接受H1结论:有证据标明这批灯胆的使用寿命低于700小时, 为分歧格产物.3. 某地域小麦的一般生产水平为亩产250公斤, 其标准差是30公斤.现用一种化肥进行试验, 从25个小区抽样, 平均产量为n x Z / σ - = μ0270公斤.这种化肥是否使小麦明显增产(α=0.05)?解:已知μ0 =250, σ = 30, N=25, =270提出假设:假定这种化肥没使小麦明显增产.即 H0:μ≤250H1: μ>250计算统计量:Z = (结论:Z统计量落入拒绝域, 在α =0.05的显著性水平上, 拒绝H0, 接受H1.决策:有证据标明, 这种化肥可以使小麦明显增产.4.糖厂用自动打包机打包, 每包标准重量是100千克.每天开工后需要检验一次打包机工作是否正常.某日开工后测得9包重量(单元:千克)如下:(略)已知包重服从正态分布, 试检验该日打包机工作是否正常.(α =0.05)= 99.98提出假设, 假设打包机工作正常:即 H0:μ= 100H1: μ≠100计算统计量:决策:有证据标明这天的打包机工作正常.5. 某种年夜量生产的袋装食品, 按规定不得少于250克.今从一批该食品中任意抽取50袋, 发现有6袋低于250克.若规定不符合标准的比例超越5%就不得出厂, 问该批食品能否出厂(=0.05)?H0:丌≤5%H1:丌>5%(因为没有找到丌暗示的公式, 这里用P0暗示丌0)结论:因为Z 值落入拒绝域, 所以在=0.05的显著性水平上, 拒绝H0, 而接受H1.决策:有证据标明该批食品合格率不符合标准, 不能出厂. 6. 某厂家在广告中声称, 该厂生产的汽车轮胎在正常行驶条件下超越目前的平均水平25000公里.对一个由15个轮胎组成的随机样本做了试验, 获得样本均值和标准差分别为27000公里和5000公里.假定轮胎寿命服从正态分布, 问该厂家的广告是否真- = ns x t μ0实(=0.05)?解:N=15,H0:μ0 ≤25000H1:μ >25000结论:因为t 值落入接受域, 所以接受H0, 拒绝H1.决策:有证据标明, 该厂家生产的轮胎在正常行驶条件下使用寿命与目前平均水平25000公里无显著性不同, 该厂家广告不真实. 7. 某种电子元件的寿命x (单元:小时)服从正态分布.现测得16只元件的寿命如下:(略).问是否有理由认为元件的平均寿命显著地年夜于225小时(=0.05)? 解:= 241.5,H :μ??> ??创作时间:二零二一年六月三十日 - = ns x t - = ns x tμ0 μ0。

第八章区间估计习题答案

第八章区间估计习题答案

第八章区间估计习题答案第八章区间估计习题答案统计学中的区间估计是一种常用的方法,用于估计参数的范围。

在第八章中,我们学习了区间估计的基本原理和方法。

本文将回顾该章节的重点内容,并提供一些习题的答案,以帮助读者更好地理解和应用区间估计。

一、点估计与区间估计的区别在开始讨论区间估计之前,我们先来回顾一下点估计的概念。

点估计是通过样本数据来估计总体参数的一个具体值。

例如,我们可以使用样本均值来估计总体均值,使用样本方差来估计总体方差等。

点估计的优势在于简单直观,但它无法提供参数估计的精确程度。

区间估计则是通过样本数据来估计总体参数的一个范围。

与点估计相比,区间估计提供了更多的信息,可以反映参数估计的不确定性。

在进行区间估计时,我们需要选择一个置信水平(confidence level),通常选择95%或99%。

置信水平表示我们对于估计结果的信心程度,例如95%的置信水平意味着我们有95%的把握总体参数落在所构建的区间内。

二、区间估计的方法在第八章中,我们学习了两种常用的区间估计方法:正态分布区间估计和t分布区间估计。

1. 正态分布区间估计正态分布区间估计适用于大样本(样本容量大于30)或已知总体标准差的情况。

该方法的步骤如下:(1)计算样本均值和样本标准差;(2)根据置信水平选择相应的Z值,例如95%置信水平对应的Z值为1.96;(3)计算置信区间,公式为:样本均值± Z值 *(样本标准差/√n)。

2. t分布区间估计t分布区间估计适用于小样本(样本容量小于30)且未知总体标准差的情况。

该方法的步骤如下:(1)计算样本均值和样本标准差;(2)计算自由度,公式为:n-1,其中n为样本容量;(3)根据置信水平和自由度选择相应的t值,例如95%置信水平和自由度为10对应的t值为2.262;(4)计算置信区间,公式为:样本均值± t值 *(样本标准差/√n)。

三、习题答案1. 一家公司想要估计其员工的平均工资水平,从100名员工中随机抽取了20名员工,得到样本均值为5000元,样本标准差为1000元。

第八章 参数估计

第八章 参数估计
2

σ
即置信区间为[1446.16,2553.84] 显然我们有95%的把我说,总体平均值在1446.16 ~ 2553.84分之间
四、
σ
未知且大样本时总体平均数的区间估计
σ 未知但样本容量 n > 30 即大样本时,可用标准
正态分布近似地当作 t 分布,故此时的总体平均 数置信区间为
x ± zα sx
§8.2 总体平均数的区间估计
一、 样本取自总体方差已知的正态分布
如果总体服从正态分布 N ( µ , σ 2 ) ,且 σ 2 已知时, 且 已知时, 总体平均数的置信区间为: 总体平均数的置信区间为:
x ± z
α
2
σ
x
总体平均数区间估计的步骤: 总体平均数区间估计的步骤:
(1)确定置信水平,即可靠性或把握程度。一般来说对于估 确定置信水平,即可靠性或把握程度。 确定置信水平 计要求比较精确的话,置信程度也要求高些, 计要求比较精确的话,置信程度也要求高些,在社会经济 现象中通常用95% 现象中通常用 %就可以了 (2)根据置信度并利用标准正态分布表确定 z 值 根据置信度并利用标准正态分布表确定
二、 样本取自总体方差已知的非正态分布 在很多情况下,总体为非正态分布, 在很多情况下,总体为非正态分布,但由中心极限 定理, 足够大, 定理,当样本容量 n 足够大,无论总体服从什么分 的抽样分布将近似服从正态分布, 布, x 的抽样分布将近似服从正态分布,故可以用
x ± z α σ x 公式来近似求出总体平均的置信区间。 公式来近似求出总体平均的置信区间。
2
例8 − 2某职业介绍所的职员从某一职业的1000名申请者 中采用不重复抽样方式随机抽取了200名申请者,借此 估计1000名申请者考试的平均成绩,已知由200名申请者 构成的样本平均分 x = 78分,由已往经验已知总体方差 为90,但该职员不知总体服从何种分布,试求µ的90% 的置信区间?

应用统计学:参数估计习题及答案

应用统计学:参数估计习题及答案

简答题1、矩估计的推断思路如何?有何优劣?2、极大似然估计的推断思路如何?有何优劣?3、什么是抽样误差?抽样误差的大小受哪些因素影响?4、简述点估计和区间估计的区别和特点。

5、确定重复抽样必要样本单位数应考虑哪些因素?计算题1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。

要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少?3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。

根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。

现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少?4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。

试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545,P(t=3)=0.9973)5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下:试推断:(1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围(2)以同样条件推断其合格率的可能范围(3)比较两车间产品质量6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求:(1)计算样本合格品率及其抽样平均误差(2)以95.45%的概率保证程度对该批产品合格品率和合格品数量进行区间估计。

(3)如果极限误差为2.31%,则其概率保证程度是多少?7、某单位按重复抽样方式随机抽取40名职工,对其业务考试成绩进行检查,资料如下:68 89 88 84 86 87 75 73 72 6875 82 99 58 81 54 79 76 95 7671 60 91 65 76 72 76 85 89 9264 57 83 81 78 77 72 61 70 87(1)根据上述资料按成绩分成以下几组:60分以下、60-70分、70-80分、80-90分、90-100分。

计量经济学庞皓第二版第八章练习题及参考答案

计量经济学庞皓第二版第八章练习题及参考答案

第八章练习题及参考解答8.1 Sen 和Srivastava (1971)在研究贫富国之间期望寿命的差异时,利用101个国家的数据,建立了如下的回归模型:2.409.39ln3.36((ln 7))i i i i Y X D X =-+--(4.37) (0.857) (2.42) R 2=0.752其中:X 是以美元计的人均收入;Y 是以年计的期望寿命;Sen 和Srivastava 认为人均收入的临界值为1097美元(ln10977=),若人均收入超过1097美元,则被认定为富国;若人均收入低于1097美元,被认定为贫穷国。

括号内的数值为对应参数估计值的t-值。

1)解释这些计算结果。

2)回归方程中引入()ln 7i i D X -的原因是什么?如何解释这个回归解释变量? 3)如何对贫穷国进行回归?又如何对富国进行回归? 4)从这个回归结果中可得到的一般结论是什么? 练习题8.1参考解答: 1. 结果解释依据给定的估计检验结果数据,对数人均收入对期望寿命在统计上并没有显著影响,截距和变量()ln 7i i D X -在统计上对期望寿命有显著影响;同时,()()2.40 3.3679.39 3.36ln ((ln 7)) 1 2.409.39ln 0 i i i i i i i X D X D Y X D ⎧-+⨯+---==⎨-+=⎩富国时穷国时 表明贫富国之间的期望寿命存在差异。

2. 回归方程中引入()ln 7i i D X -的原因是从截距和斜率两个方面考证收入因素对期望寿命的影响。

这个回归解释变量可解释为对期望寿命的影响存在截距差异和斜率差异的共同因素。

3. 对穷国进行回归时,回归模型为12ln 1097i i i i i i Y X Y X αα=+≤,其中,为美元时的寿命; 对富国进行回归时,回归模型为12ln 1097i i i i i i Y X Y X ββ=+>,其中,为美元时的寿命;4. 一般的结论为富国的期望寿命药高于穷国的期望寿命,并且随着收入的增加,在平均意义上,富国的期望寿命的增加变化趋势优于穷国,贫富国之间的期望寿命的确存在显著差异。

概率论和数理统计(第三学期)第8章参数估计

概率论和数理统计(第三学期)第8章参数估计
n n 1
由契比雪夫不等式,有
P( S 2 ES2
n
n
)
DS
2
n

2 4
2 n 1 2
即 lim P( S 2 ES2 ) 0
n
n
n
(n 1)S 2
E
2
n n 1
ES2 2 n
故 lim P( S 2 2 ) 0
n
n
§8.3 参数的区间估计
定义
设是总体的未知参数,若 (1 1
6
S~2 1 1.20 0.162 0.85 0.162 0.30 0.162 6 0.45 0.162 0.82 0.162 0.12 0.162 1 1.042 0.692 0.142 0.612 0.982 0.282 6 1 2.99 6 0.498 2
n
p xi
1
p
1 xi
xi p i1
1
p
n
n xi
i1
i 1
n
令y xi,得: i 1 ln Lxi , p y ln p n yln1 p
由对数似然方程
d ln L y n y 0 dp p 1 p
解得
p
y n
1 n
n i 1
xi
x
因为这是惟一的解,所 以p的极大似然估计值为
二、顺序统计量法
定义
1
, 2
,
,
为总体
n
的一个样本,将它
们按大小次序排列,取 居中的一个数 (若n为偶
数时,则取居中两数的 平均值)记为~,称~为
样本中位数。

~
k
1
,
1 2
k

管理统计学习题参考答案第八章

管理统计学习题参考答案第八章

第八章1. 解:(1)假设检验的基本思想是,样本平均数与总体平均数出现差异不外乎两种可能:一是改革后的总体平均长度不变,但由于抽样的随机性使样本平均数与总体平均数之间存在抽样误差;二是由于工艺条件的变化,使总体平均数发生了显著的变化。

因此,可以这样推断:如果样本平均数与总体平均数之间的差异不大,未超出抽样误差范围,则认为总体平均数不变;反之,如果样本平均数与总体平均数之间的差异超出了抽样误差范围,则认为总体平均数发生了显著的变化。

根据样本平均数的抽样分布定理,有x Z σx μ±=或Z /σμx x ≤-。

当0=Z 时,表明样本均值等于总体均值,即μx =;当Z 很大时,表明样本均值离总体均值很远,即∆很大。

后一种情况是小概率事件。

在正常情况下,小概率事件是不会发生的,那么在一次抽样中小概率事件居然发生了,我们就有理由认为样本均值是不正常的,它与原总体相比,性质已经发生变化,应该拒绝接受原假设。

(2)假设检验的一般步骤包括:① 提出原假设和备择假设;对每个假设检验问题,一般可同时提出两个相反的假设:原假设和备择假设。

原假设又称零假设,是正待检验的假设,记为H 0;备择假设是拒绝原假设后可供选择的假设,记为H 1。

原假设和备择假设是相互对立的,检验结果二者必取其一。

接受H 0,则必须拒绝H 1;反之,拒绝H 0则必须接受H 1。

② 选择适当的统计量,并确定其分布形式;不同的假设检验问题需要选择不同的统计量作为检验统计量。

在例中,我们所用的统计量是Z ,在H 0为真时,N Z ~(0,1)。

③选择显著性水平α,确定临界值;显著性水平表示H 0为真时拒绝H 0的概率,即拒绝原假设所冒的风险,用α表示。

假设检验就是应用了小概率事件实际不发生的原理。

这里的小概率就是指α。

但是要小到什么程度才算小概率? 对此并没有统一的标准。

通常取α=0.1,0.05,0.01。

给定了显著性水平α,就可由有关的概率分布表查得临界值,从而确定H 0的接受区域和拒绝区域。

《概率论与数理统计》习题及答案第八章

《概率论与数理统计》习题及答案第八章

《概率论与数理统计》习题及答案第⼋章《概率论与数理统计》习题及答案第⼋章1. 设x.,x2,,%…是从总体X中抽岀的样本,假设X服从参数为兄的指数分布,⼏未知,给泄⼊〉0和显著性⽔平a(Ovavl),试求假设H o的⼒$检验统计量及否建域.解选统汁量*=2⼈⼯⼄=2如庆则Z2 -Z2(2n) ?对于给宦的显著性⽔平a,査z'分布表求出临界值加⑵",使加⑵2))=Q因z2 > z2 > 所以(F": (2/1)) => (/2 > /; (2n)),从⽽a = P{X2 > 加⑵“} n P{r > Za(2/0)可见仏:2>^的否定域为Z2>Z;(2?).2. 某种零件的尺⼨⽅差为O-2=1.21,对⼀批这类零件检查6件得尺⼨数据(毫⽶):,,,,,。

设零件尺⼨服从正态分布,问这批零件的平均尺⼨能否认为是毫⽶(a = O.O5).解问题是在/已知的条件下检验假设:“ = 32.50Ho的否定域为1“ l> u af2u0(n5 = 1.96 ,因1“ 1=6.77 >1.96,所以否泄弘,即不能认为平均尺⼨是亳⽶。

3. 设某产品的指标服从正态分布,它的标准差为b = 100,今抽了⼀个容量为26的样本,计算平均值1580,问在显著性⽔平a = 0.05下,能否认为这批产品的指标的期望值“不低于1600。

解问题是在b?已知的条件下检验假设://>1600的否定域为u < -u a/2,其中X-1600 r-r 1580-1600 c , “11 = ------------ V26 = ------------------- x 5.1 = —1.02.100 100⼀叫05 =—1.64.因为// =-1.02>-1.64 =-M005,所以接受H(>,即可以认为这批产品的指标的期望值“不低于1600.4. ⼀种元件,要求其使⽤寿命不低于1000⼩时,现在从这批元件中任取25件,测得其寿命平均值为950⼩时,已知该元件寿命服从标准差为o-=100 ⼩时的正态分布,问这批元件是否合格(<7=0.05)解设元件寿命为X,则X~N(“,IO。

《统计学概论》第八章课后练习题答案

《统计学概论》第八章课后练习题答案

《统计学概论》第八章课后练习答案一、思考题1.什么是相关系数?它与函数关系有什么不同?P237- P2382.什么是正相关、负相关、无线性相关?试举例说明。

P238- P2393.相关系数r的意义是什么?如何根据相关系数来判定变量之间的相关系数?P245 4.简述等级相关系数的含义及其作用?P2505.配合回归直线方程有什么要求?回归方程中参数a、b的经济含义是什么?P2566.回归系数b与相关系数r之间有何关系?P2587.回归分析与相关分析有什么联系与区别?P2548.什么是估计标准误差?这个指标有什么作用?P2619.估计标准误差与相关系数的关系如何?P258-P26410.解释判定系数的意义和作用。

P261二、单项选择题1.从变量之间相互关系的方向来看,相关关系可以分为()。

A.正相关和负相关B.直线关系与曲线关系C.单相关和复相关D.完全相关和不完全相关2.相关分析和回归分析相比较,对变量的要求是不同的。

回归分析中要求()。

A.因变量是随机的,自变量是给定的B.两个变量都是随机的C.两个变量都不是随机的D.以上三个答案都不对3.如果变量x与变量y之间的相关系数为-1,这说明两个变量之间是()。

A.低度相关关系B.完全相关关系C.高度相关关系D.完全不相关4.初学打字时练习的次数越多,出现错误的量就越少,这里“练习次数”与“错误量”之间的相关关系为()。

A.正相关B.高相关C.负相关D.低相关5.假设两变量呈线性关系,且两变量均为顺序变量,那么表现两变量相关关系时应选用()。

A.简单相关系数r B.等级相关系数r sC.回归系数b D.估计标准误差S yx6.变量之间的相关程度越低,则相关系数的数值()。

A.越大B.越接近0C.越接近-1 D.越接近17.下列各组中,两个变量之间的相关程度最高的是()。

A.商品销售额和商品销售量的相关系数是0.9B.商品销售额和商品利润率的相关系数是0.84C.产量与单位成本之间的相关系数为-0.94D.商品销售价格与销售量的相关系数为-0.918.相关系数r的取值范围是()。

第8章参数估计习题解答

第8章参数估计习题解答

∑ ( xi − µ )2
i =1
n
.
23.
设( ( X 1 , X 2 , L , X n ) )是抽自总体 X : N ( µ , σ ) 的随机样本, a , b 为常数,且
2
0<a<b , 则 随 机 区 间 ⎜
nσ 2 nσ 2 − a b
( X i − µ )2 n ( X i − µ )2 ⎞ ⎟ 的长度的数学期望为 ∑ b ,∑ a i =1 ⎝ i =1 ⎠ ⎛
i =1 i =1
.
22. 设 X 1 , X 2 ,L , X n 是来自总体 X 数 L( µ , σ ) =
2
− 1 e ∏ 2π i =1 σ n ( xi − µ )2 2σ
2
N ( µ , σ 2 ) 的样本,则有关于 µ 及 σ 2 的似然函
− n 2 − n 2 − 1 2σ
2
= (2π ) (σ 2 ) e
的分布函数 Φ ( x ) 的函数值:Φ (1.645) = 0.95 ,Φ (1.96) = 0.975 ,Φ (1.282) = 0.90 .则在 显著水平 α = 0.05 , E ( X ) 的置信区间为( A ).
A. (1.216, 2.784) .
B. (1.342,
2.658) .
C. (1.4872,
ˆ = 2X . D. θ 4
7.
设总体 X 的密度函数为 P ( x,
⎧θx θ −1 0 < x < 1 , θ > 0 , ( X 1 , X 2 ,L , X n ) θ) = ⎨ ⎩o 其它
为样本,记 Ak =
1 n k ∑ X i , k = 1,2.3 ,则以下结论中错误的是( A ). n i =1

参数估计方法

参数估计方法

第八章参数估计方法研究工作的目的在于了解总体特征的有关信息,因而用样本统计数估计相应总体参数,并由之进行统计推断。

总体特征的各种参数,在前几章主要涉及平均数、标准差等,并只从直观上介绍其定义和公式,未就其历,即参数估计(parameter estimation)的方法作讨论。

本章将简要介绍几种常用参数估计方法,即矩法、最小二乘法、极大似然法。

第五章述及参数的点估计(point estimation)和区间估计(interval estimation),本章讨论点估计方法。

区间估计是在点估计的基础上结合统计数的抽样分布而进一步作出的推论,有关内容将散见在其它各章。

第一节农业科学中的主要参数及其估计量的评选标准一、农业科学中的主要参数农业科学研究中需要估计的参数是多种多样的,主要包括总体数量特征值参数,例如,用平均数来估计品种的产量,用平均数差数来估计施肥等处理的效应;用百分数(或比例)来估计遗传分离比例、群体基因或基因型频率、2个连锁主基因间的重组率;通过变异来源的剖分,用方差来估计环境方差、遗传方差和表型方差,在此基础上以估计性状的遗传力等遗传参数;用标准误来估计有关统计数的抽样误差,如重组率的标准误、遗传抽样误差、遗传多样性误差、频率误差等。

在揭示变数间的相互关系方面,用相关系数来描述2个变数间的线性关系;用回归系数、偏回归系数等来描述原因变数变化所引起的结果变数的平均变化的数量,用通径系数来描述成分性状对目标性状的贡献程度等。

有关数量关系和数量变化方面的内容将在第9至11章介绍。

二、参数估计量的评选标准讨论参数估计方法前需要了解数学期望(expectation)的概念和评价估计方法优劣的标准。

(一) 数学期望在抽样分布中,已经讲述了从总体中抽出所有可能样本的样本平均数的平均数等于总体平均数,这里,样本平均数的平均数就是一种数学期望。

例如,一个大豆品种的含油量为20%,测定一次可能是大于20%,再测定可能小于20%,大量反复测定后平均结果为20%,这时20%便可看作为该大豆品种含油量的数学期望,而每单独测定一次所获的值只是1个随机变量。

讲座-8第八章 参数估计与假设检验基础学习文档

讲座-8第八章  参数估计与假设检验基础学习文档
(见表8-1)由于个体之间的差异,每次样本平均数不大可能恰好等于该地女学 生身高的总体均数( μ =165.70cm )。这种由个体变异产生的差异称为抽样误 差(sampling error)。在抽样研究中,抽样误差是不可避免的,但怎样估计抽 样误差的大小,这是进行统计推断必须考虑的问题。
从N(165.70 , 3.212) 抽到的100份随机样本的计算结果(n=20)
Path of Statistical inference
总体
抽样
样本
估计 参数: , ,
统计推断
获取统计量
如: x, s, p
探讨成年男性肺炎患者与男性健康成年的血红蛋白(g/dl)有无区别? 在这两个人群中随机抽取各10例:
组别 肺炎 健康
1 11.9 13.9
2 10.9 14.2
3 10.1 14.0
t 分布曲线(ν=9)
① 相同自由度时,∣t∣值越大,概率P 越小; ∣t∣值越小, 概率P 越大;
② 在相同∣t∣值时,同一自由度的双侧概率是单侧概率的两 倍。
归纳:
随机变量 X
N(μ, σ2)
均数 X
N(μ ,σ2/n )
Z X
Z 变换 Z X
n
标准正态分布 N(0, 12)
用途不同: 当资料呈正态分布时,标准差与均数结合可估计参考值范围,
计算 CV 等;标准误可用于估计参数的置信区间,进行假设检验。
与样本例数关系不同: 样本量足够大时,标准差趋向于稳定,标准误随例数的增加而减小,甚至
趋近于0,若样本量趋向总例数,则标准误接近0;
二者联系: 均为变异指标,若把总体中各样本均数看作一个变量,则标准误可称为样
p

贾俊平统计学第7版第八章例题课后习题

贾俊平统计学第7版第八章例题课后习题

贾俊平统计学第7版第⼋章例题课后习题第8章假设检验例题8.1由统计资料得知,1989 年某地新⽣⼉的平均体重为3190克,现从1990年的新⽣⼉中国机抽取100个,测得其平均体重为3210克,问1990年的新⽣⼉与1989年相⽐,体重有⽆显著差异?★解:从调查结果看,1990 年新⽣⼉的平均体重为3210克,⽐1989年新⽣⼉的平均体重3190克增加了20克,但这20克的差异可能源于不同的情况。

_种情况是,1990 年新⽣⼉的体重与1989年相⽐没有什么差别,20克的差异是由于抽样的随机性造成的;另⼀种情况是,抽样的随机性不可能造成20克这样⼤的差异,1990年新⽣⼉的体重与1989年新⽣⼉的体重相⽐确实有所增加。

上述问题的关键点是,20克的差异说明了什么?这个差异能不能⽤抽样的随机性来解释?为了回答这个问题,我们可以采取假设的⽅法。

假设1989年和1990年新⽣⼉的体重没有显著差异,如果⽤µo表⽰1989年新⽣⼉的平均体重,µ表⽰1990年新⽣⼉的平均体重,我们的假设可以表⽰为µ=µ或µ⼼=0,现要利⽤1990年新⽣⼉体重的样本信息检验上述假设是否成⽴。

如果成⽴,说明这两年新⽣⼉的体重没有显著差异;如果不成⽴,说明1990年新⽣⼉的体重有了明显增加。

在这⾥,问题是以假设的形式提出的,问题的解决⽅案是检验提出的假设是否成⽴。

所以假设检验的实质是检验我们关⼼的参数⼀1990 年的新⽣⼉总体平均体重是否等于某个我们感兴趣的数值。

例8.2某批发商欲从⼚家购进⼀批灯泡,根据合同规定灯泡的使⽤寿命平均不能低于1 000⼩时,已知灯泡燃烧寿命服从正态分布,标准差为200⼩时。

在总体中随机抽取了100个灯泡,得知样本均值为960⼩时,批发商是否应该购买这批灯泡?★解:这是⼀个单侧检验问题。

显然,如果灯泡的燃烧寿命超过了1 000⼩时,批发商是欢迎的,因为他⽤已定的价格(灯泡寿命为1 000⼩时的价格)购进了更⾼质量的产品。

第八章 参数估计习题

第八章 参数估计习题

第八章 参数估计习题一、 填空题1.设总体),(~2σμN X ,n X X X ,,,21 是来自X 的一个样本,参数2,σμ都是未知的,则μ的矩估计量为 。

2σ的矩估计量为 。

2.设总体),(~2σμN X ,其中2σ未知,μ已知,n X X X ,,,21 是来自X 的一个样本,做样本函数如下①∑=-ni i X n 12)(1μ,②21])([∑=-ni iXσμ,③∑=-n i i X X n 12)(1,④∑=--n i iX X n 12)(11,⑤∑=+--ni i i X X n 121)()1(21,这些样本函数中,是统计量的有 。

3.假设随机变量)1,(~μξN ,n X X X ,,,21 是来自ξ的样本,如果关于置信度是0.95的μ 的置信区间是(9.02,10.98),则样本容量______=n4.设某总体X 的密度函数为⎪⎩⎪⎨⎧<<-=其他,00,)(2);(2ααααx x x f ,对容量为n 的样本,参数α的矩估计量为 。

5.假设总体)81.0,(~μξN ,n X X X ,,,21 是来自ξ的样本,测得样本均值5=x ,则置信度是0.99的μ的置信区间是6.设n X X X ,,,21 是来自总体X 的样本,对总体方差进行估计时,常用的无偏估计量是。

7.设总体X 在区间],0[θ上服从均匀分布,则未知参数θ的矩法估计量为 。

二、选择题1.设n X X X ,,,21 是来自总体X 的样本,2)(,)(σμ==x D x E ,并且和是未知参数,下面结论中是错误的[ ]。

(A )X =1ˆμ是μ的无偏估计; (B )12ˆX =μ是μ的无偏估计; (C )21ˆˆμμ比有效; (C )21)(1∑=-ni i X n μ是2σ的 极大似然估计量。

2 在区间估计中αθθθ-=<<1)ˆˆ(21P 的正确含义是[ ] (A)θ以α-1的概率落在区间)ˆ,ˆ(21θθ内; (B)θ落在区间)ˆ,ˆ(21θθ以外的概率为α; (C)θ不落在区间)ˆ,ˆ(21θθ以外的概率为α; (D)随机区间)ˆ,ˆ(21θθ包含θ的概率为α-1。

概率统计第八章8.1-8.3

概率统计第八章8.1-8.3

在水平Ai下的试验结果yij与该水平下的指 标均值 i 一般总是有差距的,即有 yij = i +ij 误差。 (8.1.2)
其中i 表示水平Ai下的均值, ij为随机 (8.1.2)式称为试验结果 yij 的数据结
构式。
单因子方差分析的统计模型:
yij = i +ij ,1≤i≤r,1≤j≤m (8.1.3)
2
r
如果H0不成立,则

i 1
2 i
0
i 1
2 i
SA SE 所以, E E r 1 nr SA r 1 即H0不成立时, 有大于1的趋势。 SE n r
所以H0为真时的小概率事件应取在F值较大的一侧。
因此拒绝域为 c W={FF1 (fA ,fe)}, F 单侧检验
因子A A1 A2 ┆ Ar 试验数据 y11 y12 … y1m y21 y22 … y2m yr1 ┆ yr2 … yrm
记 yij 表示水平Ai下的第j次观察结果,则一共得如 下n=rm个试验结果: yij, i=1, 2,…, r , j=1, 2, …, m, 其中r为水平数,m为重复数。
yij y ( yij yi. ) ( yi. y ) (8.1.10)

1 m i. ij , m j 1
1 r 1 r m i. ij r i 1 n i 1 j 1
由于
yij yi. (i ij ) (i i ) ij i
T2 2 ST yij n i 1 j 1
r m
1 r 2 T2 S A Ti m i 1 n S e ST S A
(8.1.11) 所以 yij - yij 仅反映组内数据与组内平均的随机 误差,称为组内偏差(组内变差);而

第八章参数估计答案

第八章参数估计答案

第八章 参数估计答案一、1、122222()()()(())E X E X D X E X μμμμσ==⎧⎨==+=+⎩12221μμσμμ=⎧∴⎨=-⎩,^1^2222211ni i A XA X X Xn μσ=⎧==⎪∴⎨=-=-⎪⎩∑ 2、①③④⑤是统计量,①④⑤是2σ的无偏估计量①:2222111111(())()(2)n n n i i i i i i i E X X E X X n n n μμμμ===-=-=-+∑∑∑22221111(()2())(()(())2())n n i i i i i i i E X E X D X E X E X n n μμμμ===-+=+-+∑∑ 2222221111(2)n n i i n n σμμμσσ===+-+==∑∑∴①是2σ的无偏估计量④:2211()1ni i X X S n =-=-∑,22()E S σ=,∴④是2σ的无偏估计量 ③:22111()n i i n X X S n n=--=∑,222111()()n n n E S E S n n n σ---==, ∴③不是2σ的无偏估计量⑤:21(0,2)i i X X N σ+- ,令1i i i Y X X +=-,1,2,...,1i n =-2221111111(())()()2(1)2(1)2(1)nn ni i i i i i i E X X E Y E Y n n n +===-==---∑∑∑ 222211111(()(()))(20)(1)22(1)2(1)2(1)n ni i i i D Y E Y n n n n σσσ===+=+=-=---∑∑ ∴⑤不是2σ的无偏估计量 3、44、122()(;)()3xE X xf x dx x dx δδμδδδ∞-∞===-=⎰⎰13αμ∴=,α∴的矩估计量^133A X σ==5、10.99α-=,0.01α∴=,0.9σ==,5x = μ∴的置信区间:0.0050.00522,5,5Z Z αα⎛⎫⎛⎫-+= ⎪ ⎪⎝⎭⎝⎭x x 6、2S ; 6、(0,)X θ⋃ ,10()22E X θθμ+===,12θμ∴=, θ∴的矩估计量^122A X θ==二、1、D (用排除法); 2、D ; 3、D ;4、A ;5、C 5、A ,μ的置信区间:2(1)n α⎛⎫- ⎪⎝⎭X ,∴区间长度2(1)L n α=-, 1α-↓,α↑,2α↑,2(1)t n α-↓,L ∴↓三、1、将原题改为(;)(0,1,2,,0)!x e P x x x θθθθ-==<<+∞ (泊松分布)1)1()E X μθ==,1θμ∴=,^1A X θ∴==,即θ的矩估计量为X2)11112()(,)!!!!inn x i n ni i i i i n x e eL P x x x x x θθθθθθ--======∑∏∏112121ln ()ln ln ln(!!!)ln ln(!!!)nii nx n n i n i L ex x x x n x x x θθθθθ=-=∑=+-=--∑1ln ()nii X d L n d θθθ==-∑,令ln ()0d L d θθ=,得 11n i i x x n θ===∑ θ∴的最大似然估计值为x ,θ的最大似然估计量为X 2、1)11111()(,)()niii x x n nnii i L x eeθθθϕθθθ=-==∑===∏∏; 1ln ()ln nii xL n θθθ==--∑12ln ()ni i X d L n d θθθθ==-+∑,令ln ()0d L d θθ=,得 11n i i x x n θ===∑,∴θ的最大似然估计量为X2)1111111()()()n nn i i i i i E X E X E X n n n n nθθθ========∑∑∑X ∴是θ的无偏估计量 3、1)σ已知,5n =,0.05α=, 22.321.522.021.821.421.45x ++++==∴置信区间0.0250.02522,21.4,21.4Z Z αα⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭x x 2)σ未知,5n =,0.05α=,21.4x =,S == ∴置信区间0.0250.02522(1),(1)21.4(4),21.4(4)n n αα⎛⎫⎛⎫-+-= ⎪ ⎪⎝⎭⎝⎭x x 4、0.1α=,置信区间0.050.0522,,Z αα⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭x x x x0.050.052Z ≤,可求出n5、总体X 服从(01)-分布,X ⎧=⎨⎩1,废品0,否则1()E X P μ∴==,∴1P μ=, 6011114606015i i P X X =∴===⨯=∑ 四、1、将题目中()0D θ>改为 ()0D θ> ()0E θ= , 2222()()(())()E D E D θθθθθθ∴=+=+> ∴ 2θ不是2θ的无偏估计量 2、见一、填空题2,相合估计略去即可。

统计学第七章、第八章课后题答案

统计学第七章、第八章课后题答案

2.统计学复习笔记第七章参数估计解释估计量和估计值在参数佔汁中,用来估计总体参数的统计量称为估计量。

佔汁量也是随机变 量。

如样本均值,样本比例、样本方差等。

根据一个具体的样本汁算出来的佔计量的数值称为齟值。

简述评价估计量好坏的标准(1) 无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。

(2) 有效性:是指估计量的方差尽可能小。

对同一总体参数的两个无偏估 计ft ,有更小方差的佔计量更有效。

(3)-致性.是指随着样本量的增大,点佔计量的值越来越接近被估总体 的参数。

怎样理解置信区间在区间估计中,山样本统计量所构造的总体参数的估计区间称为置信区间。

置信区间的论述是山区间和置信度两部分组成。

有些新闻媒体报道一些调查结果 只给出白分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数, 这是不负贵的表现。

因为降低置信度可以使置信区间变窄(显得〃精确”),有误 导读者之嫌。

在公布调査结果时给出被调査人数是负责任的表现。

这样则可以山 此推算出置信度(山后面给出的公式),反之亦然。

4. 解释95%的置信区间的含义是什么置倍区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体 参数的概率。

也就是说,无穷次重复抽样所得到的所有区间中有95% (的区间) 包含参数。

不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区 间以的概率覆盖总体参数。

5. 简述样本量与置信水平、总体方差、估计误差的关系。

1.估计总体均值时样本fin 为 心呼!其中:EfJ样本量n 与置信水平1-a 、总体方差夕、佔计误差f 之间的关系为1. 2. 3. a 、与置信水平成正比,在其他条件不变的悄况下,置信水平越大,所需要的样本量越大;与总体方差成正比,总体的差异越大,所要求的样本量也越大;与与总体方差成正比,样本量与佔汁误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。

练习题从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40 1.的样本,样本均值为25。

参数估计习题解答

参数估计习题解答
譬如,若设 =0.281,则由上式知 是标准正态分布的分布的0.281分位数,查表得
=-0.58
6.甲、乙两个校对员彼此独立对同一本书的样稿进行校对,校完后,甲发现a个错字,乙发现b个错字,其中共同发现的错字有c个,试用矩法给出如下两个未知参数的估计:
(1)该书样稿的总错字个数;
(2)未被发现的错字数.
故N的矩估计量 ,其中 为样本均值,若 不是整数,可取大于 的最小整数代替
(2)总体均值E(X)= ,由于
,
故有E(X) ,即 ,从而参数的矩估计为
4.设总体密度函数如下, 是样本,试求未知参数的矩估计
解:(1)总体均值E(X)= ,即即 ,故参数 的矩估计为
(2)总体均值E(X)= = ,所以 ,从而参数 的矩估计
()
比较(*)和(* *)可知,当 是整数时,M的最大似然估计为 或 +1,而当 不为整数时,M的最大似然估计为 ,其中[a]为不超过a的最大整数,综合上述,M的最大似然估计为
譬如,在N=19,n=15,x=2场合. = ,由于 为整数,故M的最大似然估计为7或8.下面以实际计算加以佐证,几个L(M,2)= (x=2)如下表所示:
3
1
0
解:本题中,总体X为样品中石灰石的个数,且X服从参数 为的二项分布,即
又设 为样本,则其似然函数为(忽略常数)
,
对数似然函数为
将对数似然函数关于 求导并令其为0得到似然方程
解之得
由于
由二阶导数的性质知,p的最大似然估计为
11.在遗传学研究中经常要从截尾二项分布中抽样,其总体概率函数为
若已知, 是样本,试求p的最大似然估计.
因而: .这说明 是的无偏估计.
又由a+b=1知, ,从而

《概率论与数理统计》习题及答案 第八章

《概率论与数理统计》习题及答案 第八章

《概率论与数理统计》习题及答案第 八 章1.设12,,,n X X X 是从总体X 中抽出的样本,假设X 服从参数为λ的指数分布,λ未知,给定00λ>和显著性水平(01)αα<<,试求假设00:H λλ≥的2χ检验统计量及否定域. 解 00:H λλ≥选统计量 200122nii XnX χλλ===∑记212nii Xχλ==∑则22~(2)n χχ,对于给定的显著性水平α,查2χ分布表求出临界值2(2)n αχ,使22((2))P n αχχα≥=因 22χχ>,所以2222((2))((2))n n ααχχχχ≥⊃≥,从而 2222{(2)}{(2)}P n P n αααχχχχ=≥≥≥ 可见00:H λλ≥的否定域为22(2)n αχχ≥.2.某种零件的尺寸方差为21.21σ=,对一批这类零件检查6件得尺寸数据(毫米):32.56, 29.66, 31.64, 30.00, 21.87, 31.03。

设零件尺寸服从正态分布,问这批零件的平均尺寸能否认为是32.50毫米(0.05α=).解 问题是在2σ已知的条件下检验假设0:32.50H μ= 0H 的否定域为/2||u u α≥ 其中29.4632.502.45 6.771.1X u -==⨯=-0.0251.96u =,因|| 6.77 1.96u =>,所以否定0H ,即不能认为平均尺寸是32.5毫米。

3.设某产品的指标服从正态分布,它的标准差为100σ=,今抽了一个容量为26的样本,计算平均值1580,问在显著性水平0.05α=下,能否认为这批产品的指标的期望值μ不低于1600。

解 问题是在2σ已知的条件下检验假设0:1600H μ≥0H 的否定域为/2u u α<-,其中 158016005.1 1.02100X u -==⨯=-.0.051.64u -=-.因为0.051.02 1.64u u =->-=-,所以接受0H ,即可以认为这批产品的指标的期望值μ不低于1600.4.一种元件,要求其使用寿命不低于1000小时,现在从这批元件中任取25件,测得其寿命平均值为950小时,已知该元件寿命服从标准差为100σ=小时的正态分布,问这批元件是否合格?(0.05α=)解 设元件寿命为X ,则2~(,100)X N μ,问题是检验假设0:1000H μ≥. 0H 的否定域为0.05u u ≤-,其中95010005 2.5100X u -==⨯=-0.05 1.64u = 因为0.052.5 1.64u u =-<-= 所以否定0H ,即元件不合格.5.某批矿砂的5个样品中镍含量经测定为(%)X : 3.25,3.27,3.24,3.26,3.24设测定值服从正态分布,问能否认为这批矿砂的镍含量为3.25(0.01)α=?解 问题是在2σ未知的条件下检验假设0: 3.25H μ=0H 的否定域为 /2||(4)t t α>522113.252,(5)0.00017,0.0134i i X S X X S ===-⨯==∑0.005(4) 4.6041t =3.252 3.252.240.3450.013X t -==⨯=因为0.005||0.345 4.6041(4)t t =<=所以接受0H ,即可以认为这批矿砂的镍含量为3.25.6.糖厂用自动打包机打包,每包标准重量为100公斤,每天开工后要检验一次打包机工作是否正常,某日开工后测得9包重量(单位:公斤)如下: 99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.1,100.5 问该日打包机工作是否正常(0.05α=;已知包重服从正态分布)?解 99.98X =,92211(()) 1.478i i S X X ==-=∑, 1.21S =,问题是检验假设0:100H μ=0H 的否定域为/2||(8)t t α≥. 其中99.9810030.051.21X t -==⨯=-0.025(8) 2.306t =因为0.025||0.05 2.306(8)t t =<= 所以接受0H ,即该日打包机工作正常.7.按照规定,每100克罐头番茄汁中,维生素C 的含量不得少于21毫克,现从某厂生产的一批罐头中抽取17个,测得维生素C 的含量(单位:毫克)如下 22,21,20,23,21,19,15,13,16, 23,17,20,29,18,22,16,25.已知维生素C 的含量服从正态分布,试检验这批罐头的维生素含量是否合格。

(完整word版)参数估计习题参考答案

(完整word版)参数估计习题参考答案

参数估计习题参考答案班级:姓名:学号:得分一、单项选择题:1、关于样本平均数和总体平均数的说法,下列正确的是( B )(A)前者是一个确定值,后者是随机变量(B)前者是随机变量,后者是一个确定值(C)两者都是随机变量(D)两者都是确定值2、通常所说的大样本是指样本容量( A )(A)大于等于30 (B)小于30 (C)大于等于10 (D)小于103、从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,当样本容量增大时,样本均值的标准差将( B )(A)增加(B)减小(C)不变(D)无法确定4、某班级学生的年龄是右偏的,均值为20岁,标准差为4.45.如果采用重复抽样的方法从该班抽取容量为100的样本,那么样本均值的分布为(A )(A)均值为20,标准差为0.445的正态分布(B)均值为20,标准差为4.45的正态分布(C)均值为20,标准差为0.445的右偏分布(D)均值为20,标准差为4.45的右偏分布5. 区间估计表明的是一个( B )(A)绝对可靠的范围(B)可能的范围(C)绝对不可靠的范围(D)不可能的范围6. 在其他条件不变的情形下,未知参数的1-α置信区间,(A )A. α越大长度越小B. α越大长度越大C. α越小长度越小D. α与长度没有关系7. 甲乙是两个无偏估计量,如果甲估计量的方差小于乙估计量的方差,则称( D )(A)甲是充分估计量(B)甲乙一样有效(C)乙比甲有效(D)甲比乙有效8. 设总体服从正态分布,方差未知,在样本容量和置信度保持不变的情形下,根据不同的样本值得到总体均值的置信区间长度将( D )(A)增加(B)不变(C)减少(D)以上都对9.在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量( C )(A)增加9倍(B)增加8倍(C)为原来的2.25倍(D)增加2.25倍10设容量为16人的简单随机样本,平均完成工作时间13分钟,总体服从正态分布且标准差为3分钟。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第八章 参数估计答案
一、1、12
2
2
2
2()()()(())E X E X D X E X μμ
μμσ
==⎧⎨
==+=+⎩
12221μμσμμ=⎧∴⎨=-⎩,^
1^2222
211n
i i A X
A X X X
n μσ=⎧==⎪∴⎨=-=-⎪⎩
∑ 2、①③④⑤是统计量,①④⑤是2
σ的无偏估计量
①:22
22111
111(())()(2)n n n i i i i i i i E X X E X X n n n μμμμ===-=-=-+∑∑∑
22
2211
11(()2())(()(())2())n n i i i i i i i E X E X D X E X E X n n μμμμ===-+=+-+∑∑ 222222
11
11(2)n n i i n n σμμμσσ===+-+==∑∑
∴①是2
σ的无偏估计量
④:2211()1n
i i X X S n =-=-∑,22()E S σ=,∴④是2σ的无偏估计量 ③:2
2111()n i i n X X S n n
=--=∑,222111()()n n n E S E S n n n σ---==, ∴③不是2
σ的无偏估计量
⑤:21(0,2)i i X X N σ+- ,令1i i i Y X X +=-,1,2,...,1i n =-
22
21111111(())()()2(1)2(1)
2(1)n
n n
i i i i i i i E X X E Y E Y n n n +===-==---∑∑∑ 22
2211111(()(()))(20)(1)22(1)2(1)2(1)
n n
i i i i D Y E Y n n n n σσσ===+=+=-=---∑∑ ∴⑤不是2
σ的无偏估计量 3、4
4、12
2()(;)()3
x
E X xf x dx x dx δ
δ
μδδδ

-∞===-=⎰⎰
13αμ∴=,α∴的矩估计量^
133A X σ==
5、10.99α-=,0.01α∴=
,0.9σ==,5x = μ∴
的置信区间:0.0050.0052
2,5,5Z Z αα⎛⎫⎛⎫-
+
= ⎪ ⎪⎝⎭

⎭x x 6、2
S ; 6、(0,)X θ⋃ ,10()22
E X θθ
μ+==
=,12θμ∴=, θ∴的矩估计量^
122A X θ==
二、1、D (用排除法); 2、D ; 3、D ;4、A ;5、C 5、A ,μ
的置信区间:2(1)n α⎛⎫- ⎪⎝⎭
X ,∴
区间长度2(1)L n α=-, 1α-↓,α↑,
2
α
↑,2
(1)t n α-↓,L ∴↓
三、1、将原题改为(;)(0,1,2,,0)!
x e P x x x θ
θθθ-=
=<<+∞ (泊松分布)
1)1()E X μθ==,1θμ∴=,^
1A X θ∴==,即θ的矩估计量为X
2)1
1
1
12()(,)!
!!!
i
n
n x i n n
i i i i i n x e e
L P x x x x x θ
θ
θθθθ--====
==
∑∏∏
1
12121
ln ()ln ln ln(!!!)ln ln(!!!)n
i
i n
x n n i n i L e
x x x x n x x x θ
θθ
θθ=-=∑=+-=--∑
1ln ()n
i
i X d L n d θθθ==-∑,令ln ()0d L d θθ=,得 1
1n i i x x n θ===∑ θ
∴的最大似然估计值为x ,θ的最大似然估计量为X 2、1)1
1
11
1
()(,)()n
i
i
i x x n n
n
i
i i L x e
e
θ
θ
θϕθθθ
=-==∑
=
==∏∏; 1
ln ()ln n
i
i x
L n θθθ
==--

12ln ()n
i i X d L n d θθθθ==-+∑,令ln ()0d L d θθ=,得 1
1n i i x x n θ===∑,
∴θ的最大似然估计量为X
2)1111111
()()()n n
n i i i i i E X E X E X n n n n n
θθθ========∑∑∑
X ∴是θ的无偏估计量 3、
1)σ已知,5n =,0.05α=, 22.321.522.021.821.4
21.45
x ++++==

置信区间0.0250.0252
2,21.4,21.4Z Z αα⎛⎫⎛⎫= ⎪ ⎪⎝⎭

⎭x x 2)σ未知,5n =,0.05α=,21.4x =
,S == ∴
置信区间0.0250.02522(1),(1)21.4(4),21.4(4)n n αα⎛⎫⎛⎫
-+-= ⎪ ⎪⎝
⎭⎝⎭x x 4、0.1α=
,置信区间0.050.0522,,Z αα⎛⎫⎛⎫
= ⎪ ⎪⎝⎭

⎭x x x x
0.05
0.052Z ≤,可求出n
5、总体X 服从(01)-分布,
X ⎧=⎨⎩
1,废品
0,否则
1()E X P μ∴==,∴1P μ=, 6011114606015
i i P X X =∴===⨯=∑ 四、1、将题目中()0D θ>改为 ()0D θ
> ()0E θ= , 2
222()()(())()E D E D θθ
θθθθ∴=+=+> ∴ 2
θ
不是2
θ的无偏估计量 2、见一、填空题2,相合估计略去即可。

五、(1))96.18.2,96.18.2(⨯+
⨯-
n
X n
X 即(1498.27,1501.73)
(2)34.120,2,12
2
2
>><n u n u n
αασσ
000357.0,57.3,22
2
2
===ασ
ααu u n。

相关文档
最新文档