统计学第八章作业解答
统计学第七章、第八章课后题答案
统计学复习笔记之南宫帮珍创作第七章第八章参数估计一、思考题1.解释估计量和估计值在参数估计中, 用来估计总体参数的统计量称为估计量.估计量也是随机变量.如样本均值, 样本比例、样本方差等.根据一个具体的样本计算出来的估计量的数值称为估计值. 2.简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值即是被估计的总体参数.(2)有效性:是指估计量的方差尽可能小.对同一总体参数的两个无偏估计量, 有更小方差的估计量更有效.(3)一致性:是指随着样本量的增年夜, 点估计量的值越来越接近被估总体的参数.3.怎样理解置信区间在区间估计中, 由样本统计量所构造的总体参数的估计区间称为置信区间.置信区间的论述是由区间和置信度两部份组成.有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间), 其实不说明置信度, 也不给出被调查的人数, 这是不负责的暗示.因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌.在公布调查结果时给出被调查人数是负责任的暗示.这样则可以由此推算出置信度(由后面给出的公式), 反之亦然.4.解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率.也就是说, 无穷次重复抽样所获得的所有区间中有95%(的区间)包括参数.不要认为由某一样本数据获得总体参数的某一个95%置信区间, 就以为该区间以0.95的概率覆盖总体参数.5.简述样本量与置信水平、总体方差、估计误差的关系.1.估计总体均值时样本量n为其中:2.样本量n与置信水平1-α、总体方差、估计误差E之间的关系为▪与置信水平成正比, 在其他条件不变的情况下, 置信水平越年夜, 所需要的样本量越年夜;▪与总体方差成正比, 总体的不同越年夜, 所要求的样本量也越年夜;▪与与总体方差成正比, 样本量与估计误差的平方成反比, 即可以接受的估计误差的平方越年夜, 所需的样本量越小.二、练习题1.从一个标准差为5的总体中采纳重复抽样方法抽出一个样本量为40的样本, 样本均值为25.1)样本均值的抽样标准差即是几多?2)在95%的置信水平下, 估计误差是几多?解: 1)已知σ = 5, n = 40, = 25∵∴2)已知∵2.某快餐店想要估计每位顾客午餐的平均花费金额, 在为期3周的时间里选取49名顾客组成了一个简单随机样本.1)假定总体标准差为15元, 求样本均值的抽样标准误差.2)在95%的置信水平下, 求估计误差.3)如果样本均值为120元, 求总体均值µ的95%的置信区间.解:1)已知σ = 15, n = 49∵∴2)已知∵3)已知 = 120∵ 置信区间为±E3.从一个总体中随机抽取n =100的随机样本, 获得 =104560, 假定总体标准差σ = 85414, 试构建总体均值µ的95%的置信区间.解:已知n =100, =104560, σ = 85414, 1-a=95% ,由于是正态总体, 且总体标准差已知.总体均值m在1-a置信水平下的置信区间为104560 ± 1.96×85414÷√1004.从总体中抽取一个n =100的简单随机样本, 获得 =81, s=12.要求:1)构建µ的90%的置信区间.2)构建µ的95%的置信区间.3)构建µ的99%的置信区间.解:由于是正态总体, 但总体标准差未知.总体均值m在1-a置信水平下的置信区间公式为81±×12÷√100 = 81±×????????4)= 25, σ = 3.5, n =60, 置信水平为95%5)=119, s =23.89, n =75, 置信水平为98%6)=3.149, s =0.974, n =32, 置信水平为90%解:∵∴ 1) 1-a=95% ,其置信区间为:25±1.96×3.5÷√602) 1-a=98% , 则a=0.02, a/2=0.01, 1-a/2=0.99,查标准正态分布表,可知:其置信区间为: 119±2.33×23.89÷√753) 1-a=90%,其置信区间为:3.149±1.65×0.974÷√325.利用下面的信息, 构建总体均值µ的置信区间:1)总体服从正态分布, 且已知σ = 500, n = 15, =8900, 置信水平为95%.解:N=15, 为小样本正态分布, 但σ已知.则1-a=95%, .其置信区间公式为∴置信区间为:8900±1.96×500÷√15=(8646.7 , 9153.2)2)总体不服从正态分布, 且已知σ = 500, n = 35, =8900,置信水平为95%.解:为年夜样本总体非正态分布, 但σ已知.则1-a=95%, .其置信区间公式为∴置信区间为:8900±1.96×500÷√35=(8733.9 9066.1)3)总体不服从正态分布, σ未知, n = 35, =8900, s =500, 置信水平为90%.解:为年夜样本总体非正态分布, 且σ未知, 1-a=90%,1.65.其置信区间为:8900±1.65×500÷√35=(8761 9039)4)总体不服从正态分布, σ未知, n = 35, =8900, s =500, 置信水平为99%.解:为年夜样本总体非正态分布, 且σ未知, 1-a=99%,2.58.其置信区间为:8900±2.58×500÷√35=(8681.9 9118.1)6.某年夜学为了解学生每天上网的时间, 在全校7500名学生中采用重复抽样方法随机抽取36人, 调查他们每天上网的时间, 获得下面的数据(单元:小时)(略).求该校年夜学生平均上网时间的置信区间, 置信水平分别为90%解:先求样本均值:= 3.32再求样本标准差:置信区间公式:7.从一个正态总体中随机抽取样本量为8的样本, 各样本值分别为:10, 8, 12, 15, 6, 13, 5, 11.求总体均值µ的95%置信区间.解:本题为一个小样本正态分布, σ未知.先求样本均值:= 80÷8=10再求样本标准差:于是 , 的置信水平为的置信区间是,已知, n = 8, 则,α/2=0.025, 查自由度为n-1 = 7的分布表得临界值所以, 置信区间为:10±2.45×3.4641÷√78.某居民小区为研究职工上班从家里到单元的距离, 抽取了由16个人组成的一个随机样本, 他们到单元的距离分别是:10, 3,14, 8, 6, 9, 12, 11, 7, 5, 10, 15, 9, 16, 13, 2.假设总体服从正态分布, 求职工上班从家里到单元平均距离的95%的置信区间.解:小样本正态分布, σ未知.已知, n = 16, , 则, α/2=0.025, 查自由度为n-1 = 15的分布表得临界值样本均值再求样本标准差:于是 , 的置信水平为的置信区间是?? ??????????????????±??×??÷√??9.从一批零件是随机抽取????个, 测得其平均长度是??????, 标准差是????.1)求确定该种零件平均长度的????August的置信区间.2)在上面估计中, 你使用了统计中的哪一个重要定理?请解释.解:)??这是一个年夜样天职布.已知N??????, ??????????????, S????????, α?? ????, .其置信区间为:149.5±1.96×1.93÷√36 2)中心极限定理论证:如果总体变量存在有限的平均数和方差, 那么, 不论这个总体的分布如何, 随着样本容量的增加, 样本均值的分布便趋近正态分布.在现实生活中, 一个随机变量服从正态分布未必很多, 可是多个随机变量和的分布趋于正态分布则是普遍存在的.样本均值也是一种随机变量和的分布, 因此在样本容量充沛年夜的条件下, 样本均值也趋近于正态分布, 这为抽样误差的概率估计理论提供了理论基础.10.某企业生产的袋装食品采纳自动打包机包装, 每袋标准重量为100克, 现从某天生产的一批产物中按重复抽样随机抽取50包进行检查, 测得每包重量如下:(略)已知食品包重服从正态分布, 要求:1)确定该种食品平均重量的95%的置信区间.2)如果规定食品重量低于100克属于分歧格, 确定该批食品合格率的95%的置信区间.解:1)本题为一个年夜样本正态分布, σ未知.已知N=50, µ=100, 1-α=0.95, .① 每组组中值分别为97、99、101、103、105, 即此50包样本平均值= (97+99+101+103+105)/5 = 101② 样本标准差为:③其置信区间为:101±1.96×1.666÷√502)∵ 分歧格包数(<100克)为2+3=5包, 5/50 = 10%(分歧格率), 即P = 90%.∴ 该批食品合格率的95%置信区间为:11.假设总体服从正态分布, 利用下面的数据构建总体均值μ的99%的置信区间.(略)解:样本均值样本标准差:尽管总体服从正态分布, 可是样本n=25是小样本, 且总体标准差未知, 应该用T统计量估计.1-α=0.99, 则α=0.01, α/2=0.005, 查自由度为n-1 =24的分布表得临界值的置信水平为的置信区间是,12.一家研究机构想估计在网络公司工作的员工每周加班的平均时间, 为此随机抽取了18个员工, 获得他们每周加班的时间数据如下(单元:小时):(略)假定员工每周加班的时间服从正态分布, 估计网络公司员工平均每周加班时间的90%的置信区间.解:① N = 18 < 30, 为小样本正态分布, σ未知.②样本均值样本标准差:=③ 1-α= 90%, α= 0.1, α/2= 0.05, 则查自由度为n-1 = 17的分布表得临界值④的置信水平为的置信区间是,13.利用下面的样本数据构建总体比例丌的置信区间:1)n =44, p = 0.51 , 置信水平为99%2)n =300, p = 0.82 , 置信水平为95%3)n =1150, p = 0.48, 置信水平为90%解: 1) 1-α= 99%, α= 0.01, α/2= 0.005, 1-α/2= 0.995, 查标准正态分布表, 则2)1-a=95%,3)1-a=90%,分别代入14.在一项家电市场调查中, 随机抽取了200个居民户, 调查他们是否拥有某一品牌的电视机, 其中拥有该品牌电视机的家庭占23%.求总体比例的置信区间, 置信水平分别为90%和95%.解: 1)置信水平90%, 1-a=90%, 1.65, N = 200, P = 23%.代入2)置信水平95%, 1-a=95%, , N = 200, P = 23%.代入15.一位银行的管理人员想估计每位顾客在该银行的月平均存款额.他假设所有顾客月存款额的标准差为1000元, 要求的估计误差在200元以内, 置信水平为99%.应选取多年夜的样本?解:已知 1-α = 99%, 则 2.58.E = 200, σ= 1000元.则N = (²×σ²)÷E²= (2.58²×1000²)÷200²≈167(得数应该是166.41, 不论小数后是几多, 都向上进位取整, 因此至少是167人)16.要估计总体比例丌, 计算下列条件下所需的样本量.1)E=0.02, 丌=0.40, 置信水平96%2)E=0.04, 丌未知, 置信水平95%3)E=0.05, 丌=0.55, 置信水平90%解: 1)已知 1-α = 96%, α/2 =0.02 , 则N = {²×丌(1-丌)}÷E²=2.06²×0.4×0.6÷0.02²≈25472)已知 1-α = 95%, α/2 =0.025 , 则丌未知,则取使丌(1-丌)最年夜时的0.5.N = {²×丌(1-丌)}÷E²=1.96²×0.5×0.5÷0.04²≈601 3)置信水平90%, 1-a=90%, 1.65,N = {²×丌(1-丌)}÷E²=1.65²×0.55×0.45÷0.05²≈27017.某居民小区共有居民500户, 小区管理者准备采纳一项新的供水设施, 想了解居民是否赞成.采用重复抽样方法随机抽取了50户, 其中有32户赞同, 18户反对.1)求总体中赞成该项改革的户数比例的置信区间(α=0.05)2)如果小区管理者预计赞成的比例能到达80%, 估计误差不超越10%, 应抽取几多户进行调查(α=0.05)解:1)已知N=50, P=32/50=0.64, α=0.05, α/2 =0.025 , 则置信区间:P±2)已知丌=0.8 , E = 0.1, α=0.05, α/2 =0.025 , 则N= ²丌(1-丌)/E²= 1.96²×0.8×0.2÷0.1²≈6218.根据下面的样本结果, 计算总体标准差σ的90%的置信区间:1)=21, S=2, N=502)=1.3, S=0.02, N=153)=167, S=31, N=22解:1)年夜样本, σ未知, 置信水平90%, 1-a=90%,21±1.65×2÷√502)小样本, σ未知, 置信水平90%, 1-a=90%, 则查自由度为n-1 = 14的分布表得临界值, = 1.3±1.761×0.02÷√153) 年夜样本, σ未知, 置信水平90%, 1-a=90%,167±1.65×31÷√2219.题目(略)1)构建第一种排队方式等候时间标准差的95%的置信区间2)构建第二种排队方式等候时间标准差的95%的置信区间3)根据1)和2)的结果, 你认为哪种排队方式更好?解:本题为小样本正态分布, σ未知, 应用公式,置信水平95%, 1-a=95%, 则查自由度为n-1 = 9的分布表得临界值1)= 7.15,其置信区间为7.15±2.31×0.48÷√102)= √0/9 = 0其置信区间为7.15±04)第二种排队方式更好.(19题是对总体方差的估计, 应该用卡方统计量进行估计, 20题是对两个总体参数的估计, 这二种类型老师未讲, 不是本次考试的内容, 不能用Z统计量像估计总体均值和比例那样去估计, 具体内容见书上P188――P194)第九章假设检验一、思考题1.假设检验和参数估计有什么相同点和分歧点?解:参数估计与假设检验是统计推断的两个组成部份.相同点:它们都是利用样本对总体进行某种推断.分歧点:推断的角度分歧.参数估计讨论的是用样本统计量估计总体参数的方法, 总体参数μ在估计前是未知的.而在假设检验中, 则是先对μ的值提出一个假设, 然后利用样本信息去检验这个假设是否成立.2.什么是假设检验中的显著性水平?统计显著是什么意思?解:显著性水平用α暗示, 在假设检验中, 它的含义是当原假设正确时却被拒绝的概率或风险, 即假设检验中犯弃真毛病的概率.它是由人们根据检验的要求确定的.(我理解的统计学意义, 统计显著是统计上专用的判定标准, 指在一定的概率原则下, 可以供认一种趋势或者合理性到达的水平, 到达为统计上水平显著, 达不到为统计上水平不显著)3.什么是假设检验中的两类毛病?解:弃真毛病(α毛病):当原假设为真时拒绝原假设, 所犯的毛病成为第I类毛病, 又称为弃真毛病.犯第I类毛病的概率常记作α.取伪毛病(β毛病):当原假设为假时没有拒绝原假设, 所犯的毛病称为第II类毛病, 又称取伪毛病.犯第II类毛病概率常记作β.发生第I类毛病的概率也常被用于检验结论的可靠性怀抱.假设检验中犯第I类毛病的概率被称为显著性水平, 记作α.4.两类毛病之间存在什么样的数量关系?在样本容量n一定的情况下, 假设检验不能同时做到犯α和β两类毛病的概率都很小.若减小α毛病, 就会增年夜犯β毛病的机会;若减小β毛病, 也会增年夜犯α毛病的机会.要使α和β同时变小只有增年夜样本容量.但样本容量增加要受人力、经费、时间等很多因素的限制, 无限制增加样本容量就会使抽样调查失去意义.因此假设检验需要慎重考虑对两类毛病进行控制的问题.5.解释假设检验中的P值.解:如果原假设为真, 所获得的样本结果会像实际观测结果那么极端或更极真个概率, 称为P值.也称为观察到的显著性水平.P值是反映实际观测到的数据与原假设H0之间纷歧致水平的一个概率值.P值越小, 说明实际观测到的数据与H0之间纷歧致水平就越年夜.6.显著性水平与P值有何区别?解:α(显著性水平)是一个判断的标准(当原假设为真, 却被拒绝的概率), 而P是实际统计量对应分位点的概率值(当原假设为真时, 所获得的样本观察结果或更极端结果呈现的概率).可以通过α计算置信区间, 然后与统计量进行比力判断, 也可以通过统计量计算对应的p值, 然后与α值比力判断.7.假设检验依据的基来源根基理是什么?解:假设检验利用的是小概率原理, 小概率原理是指发生概率很小的随机事件在一次试验中是几乎不成能发生的.根据这一原理, 可以先假设总体参数的某项取值为真, 也就是假设其发生的可能性很年夜, 然后抽取一个样本进行观察, 如果样本信息显示呈现了与事先假设相反的结果且与原假设分歧很年夜, 则说明原来假定的小概率事件在一次实验中发生了, 这是一个违背小概率原理的分歧理现象, 因此有理由怀疑和拒绝原假设;否则不能拒绝原假设.8. 你认为在单侧检验中原假设和备择假设的方向应该如何确定?解: 假设问题有两种情况, 一种是所考察的数值越年夜越好(左单侧检验或下限检验), 临界值和拒绝域均在左侧;另一种是数值越小越好(右单侧检验或上限检验), 临界值和拒绝域均在右侧.二、 练习题1. 已知某炼铁厂的含碳量服从正态分布N (4.55, 0.108²), 现在测定了9炉铁水, 其平均含碳量为4.484.如果估计方差没有变动, 可否认为现在生产的铁水平均含碳量为4.55(α=0.05)? 解: 已知μ0=4.55, σ²=0.108², N=9, =4.484,这里采纳双侧检验, 小样本, σ已知, 使用Z 统计.假定现在生产的铁水平均含碳量与以前无显著不同.则, α=0.05, α/2 =0.025 , 查表得临界值为计算检验统计量: = (4.484-4.55)/(0.108/√9) 决策:∵Z 值落入接受域, ∴在=0.05的显著性水平上接受H0. nx Z / σ - =μ0结论:有证据标明现在生产的铁水平均含碳量与以前没有显著不同, 可以认为现在生产的铁水平均含碳量为4.55.2. 一种元件, 要求其使用寿命不得低于700小时.现从一批这种元件中随机抽取36件, 测得其平均寿命为680小时.已知该元件寿命服从正态分布, σ=60小时, 试在显著性水平0.05下确定这批元件是否合格.解: 已知N=36, σ=60, =680, μ0=700这里是年夜样本, σ已知, 左侧检验, 采纳Z 统计量计算. 提出假设:假定使用寿命平均不低于700小时H0:μ≥700H1: μ < 700= 0.05, 左检验临界值为负, 查得临界值: -Z0.05=-1.645计算检验统计量: = (680-700)/(60/√36) = -2决策:∵Z 值落入拒绝域, ∴在=0.05的显著性水平上拒绝H0, 接受H1结论:有证据标明这批灯胆的使用寿命低于700小时, 为分歧格产物.3. 某地域小麦的一般生产水平为亩产250公斤, 其标准差是30公斤.现用一种化肥进行试验, 从25个小区抽样, 平均产量为n x Z / σ - = μ0270公斤.这种化肥是否使小麦明显增产(α=0.05)?解:已知μ0 =250, σ = 30, N=25, =270提出假设:假定这种化肥没使小麦明显增产.即 H0:μ≤250H1: μ>250计算统计量:Z = (结论:Z统计量落入拒绝域, 在α =0.05的显著性水平上, 拒绝H0, 接受H1.决策:有证据标明, 这种化肥可以使小麦明显增产.4.糖厂用自动打包机打包, 每包标准重量是100千克.每天开工后需要检验一次打包机工作是否正常.某日开工后测得9包重量(单元:千克)如下:(略)已知包重服从正态分布, 试检验该日打包机工作是否正常.(α =0.05)= 99.98提出假设, 假设打包机工作正常:即 H0:μ= 100H1: μ≠100计算统计量:决策:有证据标明这天的打包机工作正常.5. 某种年夜量生产的袋装食品, 按规定不得少于250克.今从一批该食品中任意抽取50袋, 发现有6袋低于250克.若规定不符合标准的比例超越5%就不得出厂, 问该批食品能否出厂(=0.05)?H0:丌≤5%H1:丌>5%(因为没有找到丌暗示的公式, 这里用P0暗示丌0)结论:因为Z 值落入拒绝域, 所以在=0.05的显著性水平上, 拒绝H0, 而接受H1.决策:有证据标明该批食品合格率不符合标准, 不能出厂. 6. 某厂家在广告中声称, 该厂生产的汽车轮胎在正常行驶条件下超越目前的平均水平25000公里.对一个由15个轮胎组成的随机样本做了试验, 获得样本均值和标准差分别为27000公里和5000公里.假定轮胎寿命服从正态分布, 问该厂家的广告是否真- = ns x t μ0实(=0.05)?解:N=15,H0:μ0 ≤25000H1:μ >25000结论:因为t 值落入接受域, 所以接受H0, 拒绝H1.决策:有证据标明, 该厂家生产的轮胎在正常行驶条件下使用寿命与目前平均水平25000公里无显著性不同, 该厂家广告不真实. 7. 某种电子元件的寿命x (单元:小时)服从正态分布.现测得16只元件的寿命如下:(略).问是否有理由认为元件的平均寿命显著地年夜于225小时(=0.05)? 解:= 241.5,H :μ??> ??创作时间:二零二一年六月三十日 - = ns x t - = ns x tμ0 μ0。
统计学课后答案(第3版)第8章方差分析习题答案
第八章 方差分析习题答案一、单选1.D ;2.B ;3.A ;4.C ;5.C ;6.C ;7.C ;8.A ;9.B ;10.A二、多选1.ACE ;2.ABD ;3.BE ;4.AD ;5.BCE6.ABCD ;7.ABCDE ;8.ABCE ;9.ACD ;10.ABD三、计算分析题1、运用EXCEL 进行单因素方差分析,有:方差分析:单因素方差分析SUMMARY组 观测数 求和 平均 方差列 1 5 1.21 0.242 2.45E-05列 2 5 1.38 0.276 0.00226列 3 5 1.31 0.262 1.35E-05方差分析差异源 SS df MS F P-value F crit 组间 0.00292 2 0.00146 1.906005 0.191058 3.885294 组内 0.009192 12 0.000766总计 0.012112 14由于P 值=1.906005>05.0=α,不拒绝原假设,没有证据表明3个总体的均值之间有显著差异。
(或用F 值判断,有同样结论)2、运用EXCEL 进行单因素方差分析,有:方差分析:单因素方差分析SUMMARY组 观测数 求和 平均 方差列 1 5 222 44.4 28.3列 2 5 150 30 10列 3 5 213 42.6 15.8方差分析差异源 SS df MS F P-value F crit 组间 615.6 2 307.8 17.06839 0.00031 3.885294 组内 216.4 12 18.03333总计 832 14由于由于P 值=0.00031<05.0=α,拒绝原假设,表明3个总体的均值之间有显著差异。
(或用F 值判断,有同样结论)进一步用LSD 方法见教材P2063、(1)按行依次为:420、2、1.478(第一行);27、142.07(第二行);4256(第三行)。
(2)由于P 值=0.245946>05.0=α,不拒绝原假设,没有证据表明3种方法组装产品数量有显著差异。
大学统计学第八章课后题答案
第八章 相关与回归分析 6. 相 关 系 数 计 算 表 (1) ()()åååååå-´å--=y yx x n n yx xy 2222nr 91.0132336030268679642621148164262122-»´-=-´´-´´-´= |r|=0.91 即 191.08.0<£ 所以,产量和单位成本存在高度负相关关系(2) ()82.133********211481621222-»-=-´´-´=å--=ååååx x n y x xy n b =-=åånx b ny a ()37.7737.67162182.16426=+=´-- 产量和单位成本之间的回归方程为: x y 82.137.77-=Ù 产量每增加1000件,单位成本平均下降1元 (3)当x=6 时, 单位成本: 45.66682.137.77=´-=Ùy (元) 年份序号 产量/千件x 单位成本/元y xy x 2 y 2 1 2 73 146 4 5329 2 3 72 216 9 5184 3 4 71 284 16 5041 4 3 73 219 9 5329 5 4 69 276 16 4761 6 5 68 340 25 4624 合 计 21 426 1481 79 30268 7. 相 关 系 数 计 算 表 序号 汽车使用年限/年x 年维修费用/元y xy x 2 y 2 1 2 400 800 4 160000 2 2 540 1080 4 291600 3 3 520 1560 9 270400 4 4 640 2560 16 409600 5 4 740 2960 16 547600 65 600 3000 25 360000 7 5 800 4000 25 640000 86 700 4200 36 490000 9 6 760 4560 36 577600 10 6 900 5400 36 810000 11 8 840 6720 64 705600 12 9 1080 9720 81 1166400 合 计 608520465603526428800()()åååååå-´å--=y yx x n n yx xy 2222n r=89.045552006244752064288001235212852060465601285206022»´=-´´-´´-´|r|=0.89 即 189.08.0<£所以,汽车使用年限与其维修费用间存在高度正相关关系(2) ()15.766244752035212852060465601260222==-´´-´=å--=ååååxx n y x xy n b =-=åån x b n y a 25.32975.380710126015.76128520=-=´- 汽车使用年限与其维修费用的回归方程为: x y 15.7625.329+=Ù(3) 当x=15时, 维修费用为: 5.14711515.7625.329=´+=Ùy8. (1) 相 关 系 数 计 算 表 序号 母亲身高/厘米x 女儿身高/厘米y xy x 2y 21 158 159 25122 24964 25281 2 159 160 25440 25281 256003 160 160 25600 25600 256004 161 163 26243 25921 265695 161 159 25599 25921 252816 155 154 23870 24025 237167 162 159 25758 26244 25281 8 157 158 24806 24649 24964 9 162 160 25920 26244 25600 10 150 157 23550 22500 24649 合计1585 1589251908251349252541()()åååååå-´å--=yy x x n n y x xy 2222nr=158915852225254110251349101589158525190810-´´-´´-´655.0»|r|=0.655 所以,母亲与女儿之间的关系为显著正相关(2) ()41.012655152513491015891585251908101585222»=-´´-´=å--=ååååxx n y x xy n b =-=åånx b n y a 915.93985.649.15810158541.0101589=-=´- 母亲与女儿之间的回归方程为: x y 41.0915.93+=Ù(3) 当x=170时, 女儿的身高为: 615.16317041.0915.93=´+=Ùy 9.(1) 由题知 n=9 å=546x å=260y å=16918xy 343622=åx()92.01114210302343629260546169189546222»=-´´-´=å--=ååååx x n yx xy n b =-=åånx b ny a 92.26954692.09260-=´-银行存款余额的直线回归方程: x y 92.092.26+-=Ù(2) 当x=400时,银行存款余额08.34140092.092.26=´+-=Ùy。
统计学贾俊平_第四版课后习题答案第八章
姓名:潘方 学号:1106026 班级:金融一班8.2 解:根据题目的分析,本题采用左单侧检验:已知:μ0=700,x =680,σ=60, n=36,α=0.05则z α=1.645 其过程为: H 0:μ≥700 H 1:μ<700 x z ==-2 因为|z|>|z α|,Z 值位于拒绝域,故拒绝原假设,说明这批产品不合格。
因为2=Z ,且为左单侧检验,则()05.0022750132.0977249868.01=<=-=αP8.4 解:由excel 计算得:x =99.9778 S =1.21221H 0:μ=100 H 1:μ≠100 x t =-0.055 这是一个双侧检验,当α=0.05,自由度n -1=9时,得()29t α=2.262。
因为t <|2t α|,t 值位于接受区域,故接受原假设,说明打包机工作正常。
因为|Z|=0.055,且为双侧检验,由excel 得: P=0.95734>(α=0.05)8.9解:该题样本为,大样本,方差2σ已知、且不等,因此采用z 统计量 已知, 05.0=α、即96.12/=αZ ,811=n , 642=n ,σA=63*63 2σB=57*57 0:211≠-μμH 0:210=-μμH , ()()96.15.0645781630102010702222<≈+--=+---=BB A AB A B A n n x x Z σσμμ 因为|z|<|z α|,Z 值位于接受区域,故接受原假设,两厂生产材料抗压强度相同。
因为5.0=Z ,则()=-⨯=691462461.012P 0.617075078()05.0=>α8.13 解:此题为两个总体比例之差的假设H 0:π1≥π2;H 1:π1<π 2 α=0.05,即z α=1.6451100021==n n ,00945.0110001041==p ,01718.0110001892==pp p d z --=0.009450.017180--=-5 因为|z|>|z α|,Z 值位于拒绝域,故拒绝原假设,说明用阿司匹林可以降低心脏病发生率。
演示文稿统计学第五版第八章课后习题答案
8.6 某厂家在广告中声称,该厂生产的汽车轮胎在正常行驶条件下寿命 超过25000公里的目前平均水平。对一个由15个轮胎组成的随机样本做 了试验,得到样本均值和标准差分别为27000和5000公里。假定轮胎 寿命服从正态分布,问该厂的广告是否真实? (α=0.05)
解:N=15,x=27000,S=5000 小样本正态分布,σ未知,用t统计量计算。
x 解:已知 =241.5,S=98.726,N=16
小样本正态分布,σ未知,t统计量
右侧检验,α=0.05,自由度N-1=15,即 =1.75t3
HH
:μ≤225
0:μ>225
1
t x - 241.5 - 225 0.67
S/ n 98.726/ 16
结决论策::因有为证t据值落表入明接,受元域件,平所均以接寿受命与2,2拒5小绝 时H无0 。显著性H差1异,不能认为元件的
=n2134
p1=20.98%, p=2 9.7%
ZZ=11.218.6%4/50.028=4.03>1.645
决结论策::调在查α数=据0.能05支的持水“平吸上烟拒绝者容。易H 0患慢性气管炎”
这种观点。
第20页,共23页。
8.12 为了控制贷款规模,某商业银行有个内部要求,平均每项贷款数额不 能超过60万元。随着经济的发展,贷款规模有增大的趋势。银行经理想了 解在同样项目条件 下,贷款的平均规模是否明显地超过60万元,还是维持
,
2 A
632
。从B2 A厂5生7产2的材料中随机抽取81个样品,测
得 x A 1070kg/cm2 ;从B厂生产的材料中随机抽取64个样品,测
得 xB 1020kg/cm2 。根据以上调查结果,能否认为A、B两厂生产的材料平均
统计学第八章课后习题答案
8.1解:建立假设: H0:μ=4.55;H1:μ≠4.55这是双侧检验,并且方差已知,检验的统计量 Z 值为:=-1.833而=1.96>|-1.833|,因此不能拒绝原假设,即可认为现在生产的铁水平均含碳量为 4.558.2解:建立假设: H0:μ≥700;H1:μ<700这是左侧检验,并且方差已知,检验统计量 Z 为:Z==-2而-=-1.645>-2,因此拒绝原假设,即在显著性水平 0.05 下这批元件是不合格的。
8.3解:建立假设: H0:μ≤250;H1:μ>250这是右侧检验,并且方差已知,检验的统计量 Z 值为:Z==3.33 而=1.645<3.33,因此拒绝原假设,即这种化肥使小麦明显增产。
8.4解:建立假设: H0:μ=100;H1:μ≠1009/108.055.4484.4−=Z Z 025.036/60700680−Z 05.025/30250270−Z05.0由样本数据可得: ==99.978S===1.212这是双侧检验,并且方差未知,又是小样本,故采用 t 统计量,检验统计量的值为: t==-0.054而(8)=2.306>|-0.054|,因此不拒绝原假设,即该日打包机工作正常8.5、由题意先建立假设,显然不符合标准的比例越小越好,由于采用的是产品质量抽查,即使总体不合标准的比例没有超过5%,属于合格范围,采用右单侧检验。
P=6/50=12%属于单侧检验,当α=0.05时,有,因此拒绝原假设,即认为该批食品不能出厂n X ni ix∑==195.100....7.983.99+++1)(12−−∑=n x ni i x 8)978.995.100(...978.99-7.98978.99-3.99222−+++)()(9/2122.1100-978.99t025.0%5:%,5:1>≤ππH H o 27.250%)51(%5%5%12=−−−=Z 27.2645.105.0<=Z8.6、由题意建立假设:单侧检验,并且方差未知,n=15,属于小样本,故采用t 统计量,检验统计量的值为:α=0.05,,因此不能拒绝原假设,认为该厂家的广告不真实8.7、建立假设:,由样本数据可以得出,这是单侧检验,并且方差未知,是小样本,因此采用t 检验量,检验统计量的值为25000:,25000:10>≤μμH H 549.115/50002500027000/0=−=−=n s x t μ549.1761.1)14(05.0>=t 225,22510>≤H H 5.24116170485 (2121012801591)=++++++==∑=nxx ni i7.9815)5.241170(....)5.241280()5.241159(12221=−++−+−=−=∑=n xs ni in s x t /μ−=669.016/7.982255.241=−=通过查表可得出,,因此不能拒绝原假设,没有理由认为元件的平均寿命显著地大于225小时。
《统计学》-第8章-习题答案
第八章时间序列分析思考与练习1.举例说明时间序列的含义时间序列是同一现象在不同时间上的相继观察值排列而成的序列,一般包括两个基本要素,反映客观现象特征的数值以及观测值所属的时间。
例如,2000年1月份-2013年12月份的社会消费品零售总额当月值,1978年-2013年的当年GDP不变价增速等,均是时间序列。
2.时间序列分析的目的是什么?根据时间序列数据,进行时间序列分析,较为精确地找出该序列的内在统计特征和发展规律性,尽可能多地从中提取出我们所需要的信息,并对未来进行预测。
3.时间序列分析方法有哪几类?第一、数据图法,采用图形直接观察序列的总体趋势和周期变化以及异常点、升降转折点等;第二、指标法,通过计算一系列核心指标来反映所研究序列的动态特征,核心指标如发展速度、增长速度、平均指标、变异指标等;第三、模型法,对给定的时间序列,根据统计理论和数学方法,建立描述该序列的适应统计模型,并进行预测或控制,比如时间序列分解预测模型、指数平滑法、ARMA模型等。
4.根据影响因素,通常将时间序列分解为哪几种成分?根据时间序列的影响因素,通常将时间序列的构成成分区分为长期趋势、季节变动、循环变动和不规则变动四种。
一个时间序列往往是以下几类变化形式的叠加或耦合。
a. 长期趋势(T)。
长期趋势是指时间序列朝着一定的方向持续上升或下降,或停留在t某一水平上的倾向,它反映了客观事物的主要变化趋势。
例如,随着资金和劳动力的增加,技术的不断进步以及劳动生产率的不断提高,我国的经济不断增长,呈向上发展趋势。
b. 季节变动(S)。
季节变动指一年或更短的时间之内,由于受某种固定周期性因素的t影响而呈现出有规律的周期性波动。
比如,多数商品的销售量随季节交替出现的周期性波动。
c. 循环变动(C)。
通常是指周期为一年以上的有规律的波动。
比如经济发展周期等。
t循环变动与季节变动不同,它的波动周期较长,周期的长短不一,变动的规则性和稳定性较差。
贾俊平第四版统计学-第八章假设检验练习答案教学教材
贾俊平第四版统计学- 第八章假设检验练习答案第八章假设检验练习答案•选择题1. 第一类错误,第二类错误,一,2. 第一类,第二类,原假设,不拒绝3.(1)H。
:220,H i:220(2)第一类错误是指新方法不能降低成本但被采用,导致成本上升;第二类错误是指新方法能够降低成本,但没有采用。
4.失学儿童中女孩所占的比例(或男孩所占的比例*);H。
:3,H1:43(或H 0:4* 1, Hz P(1).n三•计算题1.解:H°: 4.55, H1 4.55总体服从正态分布,总体含碳量的标准差b =0.108,n=9,检验统计量为z X 0 4.484 4.55 d------ 0 1.833 /、n 0.108/ .9不拒绝原假设结论:在显著性水平a =0.05下,样本提供的证据不足以推翻“现在生产的铁水平均含碳量为4.55”的说法。
2. H0: 6.7,H1: 6.7n=200>30大样本,总体标准差未知,X 7.25, s 2.5a=0.05,双侧检验,临界值为Z o.o25 1.96,因为z>-1.96,未落入拒绝域检验统计量为z 需需 3-11=0.01,右侧检验,临界值为Z o.oi 2.33。
因为z=3.11>Z o.oi ,落入拒绝域,所以拒绝原假设。
结论:在显著性水平a =0.01下,认为“如今每个家庭每天看电视的平均时间比十年前增加了3. 解:H 0: 60, H 1: 60n=7<30小样本,总体标准差未知,经计算 x 65, s 11.34域,所以不拒绝原假设。
结论:在显著性水平a =0.01下,样本提供的证据还不足以推翻“促销活动无效” 的说法。
4. H 0: 30%,H 1: 30%n 0 400* 0.3 120 5,且 n (10) 400* 0.7 280 5,大样本,经计算样本比例为 P=100/400=0.25 p0 0.25 0.30 检验统计量为z r 1 0 1 2.1820*(1 0) 0.30*0.70x n \ 400 =0.05,双侧检验,临界值为Z 0.025 1.96。
统计学第八章课后题及答案解析
第八章一、单项选择题1.时间数列的构成要素是()A.变量和次数 B.时间和指标数值C.时间和次数 D.主词和时间2.编制时间数列的基本原则是保证数列中各个指标值具有()A.可加性 B.连续性C.一致性 D.可比性3.相邻两个累积增长量之差,等于相应时期的()A.累积增长量 B.平均增长量C.逐期增长量 D.年距增长量4.统计工作中,为了消除季节变动的影响可以计算()A.逐期增长量 B.累积增长量C.平均增长量 D.年距增长量5.基期均为前一期水平的发展速度是()A.定基发展速度 B.环比发展速度C.年距发展速度 D.平均发展速度6.某企业2003年产值比1996年增长了1倍,比2001年增长了50%,则2001年比1996年增长了()A.33% B.50%C.75% D.100%7.关于增长速度以下表述正确的有()A.增长速度是增长量与基期水平之比 B.增长速度是发展速度减1C.增长速度有环比和定基之分 D.增长速度只能取正值8.如果时间数列环比发展速度大体相同,可配合()A.直线趋势方程 B.抛物线趋势方程C.指数曲线方程 D.二次曲线方程二、多项选择题1.编制时间数列的原则有()A.时期长短应一致 B.总体范围应该统一C.计算方法应该统一 D.计算价格应该统一E.经济内容应该统一2.发展水平有()A.最初水平 B.最末水平C.中间水平 D.报告期水平E.基期水平3.时间数列水平分析指标有()A.发展速度 B.发展水平C.增长量 D.平均发展水平E.平均增长量4.测定长期趋势的方法有()A.时距扩大法 B.移动平均法C.序时平均法 D.分割平均法E.最小平方法三、填空题1.保证数列中各个指标值的_______是编制时间数列的最主要规则。
2.根据采用的基期不同,增长量可以分为逐期增长量和_______增长量两种。
3.累积增长量等于相应的_______之和。
两个相邻的_______之差,等于相应时期的逐期增长量。
统计学第八章课后作业答案
第八章练习题
一、单项选择
(1)当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于( )。
A.相关关系
B.函数关系
C.回归关系
D.随机关系
(2)相关系数的取值范围是( )。
A. 0≤r ≤1
B. -1<r <1
C. -1≤r ≤1
D. -1≤r ≤0
(3)一元线性回归方程y=12+3.6x,如x每增加1个单位,则y平均增加( )。
A. 12个单位
B. 15.6个单位
C. 3.6个单位
D. 8.4个单位
(4)一元线性回归方程中的两个变量( )。
A.都是随机变量
B.地位是对等的
C.都是给定的量
D.一个是自变量,另一个是因变量
二、多项选择题
(5)相关系数表明两变量之间的关系( )。
A.线性关系
B.因果关系
C.变异关系
D.相关方向
E.相关的密切程度
(6)如果两个变量之间的相关系数是1,则这两个变量是( )。
A.负相关关系
B.正相关关系
C.完全相关关系
D.不完全相关关系
E.零相关
(7)在一元线性回归分析中( )。
A.自变量是可控变量,因变量是随机变量
B.两个变量不是对等的关系
C.利用回归方程,两个变量可以相互推算
D.根据回归系数可判定相关的方向
E.自变量是随机变量,因变量是可控变量
(8)利用一元线性回归方程,可以( )。
A.进行两个变量的互相推算
B.用自变量推算因变量
C.用因变量推算自变量
D.确定两个变量的变动关系
E.研究两个变量之间的密切程度。
统计学课后习题答案 第8章的习题答案
1. 解:根据题意建立原假设和备择假设:01:700;:700H H μμ≥<2x Z ===- 由于-2<-1.645,所以Z Z α<-,Z 值位于原假设0H 的拒绝域,所以拒绝0H ,即在显著性水平0.05下该批元件不合格。
2. 根据题意建立原假设和备择假设:01:250;:250H H μμ≤>20 3.336x t ====,0.05(24) 1.7109t =, 由于0.05(24),.t t t t α>>所以t 值位于原假设H 0,即在显著性水平0.05下该种化肥使得水稻明显增产。
3. 解:已知 0620.157,0.155,0.05, 1.96.400p p Z αα===== 根据题意建立原假设和备择假设:01:0.157;:0.157H P H P =≠0.10995P Z ===- -0.10995>-1.96,所以Z 值位于原假设H 0的接受域。
即在显著性水平0.05下随机调查的结果支持该市老年人口比重为15.7%。
4. 解:已知 09,100,99.98, 1.2122n x s μ====。
根据题意建立原假设和备择假设:01:100;:100H H μμ=≠0.020.04950.4041x t -====- -0.0495>-2.306,所以t 位于原假设H 0的接受域,即在显著性水平0.05下,打包机打包正常。
5. 解:已知00.05200,20,208.5,30,(19) 1.7291n x S t μ=====。
根据题意建立原假设和备择假设:01:200;:200H H μμ≤>8.5 1.2676.7083x t ==== t t α<,所以t 值位于原假设H 0的接受域,即在显著性水平0.05下,接受原假设,即在特定时间内每小时经过该地的汽车数量小于200辆。
6. 解:已知015,40,14.5, 2.3,0.05, 1.645n x S Z αμα======。
统计学第五版第八章课后习题答案王永
n1 n2 11000
合并比例 x1 x 2 293 p 0.0133 n1 n2 22000
p1=0.95%, p2=1.72% 临界值(s):
Z =) ( 1 2 ) 1 1) P (1 P ) n n 2 1
解:已知μ =250,σ =30,N=25, x =270,α =0.05 右侧检验 ∵小样本,σ 已知 ∴采用Z统计量 Z ∵α =0.05,∴ =1.645 H 0 :μ ≤250 H1 :μ >250 计算统计量:
x / n
Z
=(270-250)/(30/5)=3.33
结论: Z统计量落入拒绝域,在α=0.05的显著性水平上,拒绝 H 0 ,接 受 H1 。
决策:有证据表明,这种化肥可以使小麦明显增产。
8.4 糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验 一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下: 99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.1,100.5 已知包重服从正态分布,试检验该日打包机工作是否正常 (α=0.05) 。
甲法: 31 34 29 32 35 38 34 30 29 32 31 26 乙法: 26 24 28 29 30 29 32 26 31 29 32 28 两总体为正态总体,且方差相同。问两种方法的装配时 间有无显著差别(α =0.05)? 解: 正态总体,小样本,σ²未知但相同,独立样本t检验 0 : 甲 - = 0 H 乙 甲 H1 : - 乙≠ 0
2 2
5 1.96
nB
决策:在α = 0.05的水平上拒绝 H 0 。 结论:可以认为A、B两厂生产的材料平均抗压强度不相同。
《统计学概论》第八章课后练习题答案
《统计学概论》第八章课后练习答案一、思考题1.什么是相关系数?它与函数关系有什么不同?P237- P2382.什么是正相关、负相关、无线性相关?试举例说明。
P238- P2393.相关系数r的意义是什么?如何根据相关系数来判定变量之间的相关系数?P245 4.简述等级相关系数的含义及其作用?P2505.配合回归直线方程有什么要求?回归方程中参数a、b的经济含义是什么?P2566.回归系数b与相关系数r之间有何关系?P2587.回归分析与相关分析有什么联系与区别?P2548.什么是估计标准误差?这个指标有什么作用?P2619.估计标准误差与相关系数的关系如何?P258-P26410.解释判定系数的意义和作用。
P261二、单项选择题1.从变量之间相互关系的方向来看,相关关系可以分为()。
A.正相关和负相关B.直线关系与曲线关系C.单相关和复相关D.完全相关和不完全相关2.相关分析和回归分析相比较,对变量的要求是不同的。
回归分析中要求()。
A.因变量是随机的,自变量是给定的B.两个变量都是随机的C.两个变量都不是随机的D.以上三个答案都不对3.如果变量x与变量y之间的相关系数为-1,这说明两个变量之间是()。
A.低度相关关系B.完全相关关系C.高度相关关系D.完全不相关4.初学打字时练习的次数越多,出现错误的量就越少,这里“练习次数”与“错误量”之间的相关关系为()。
A.正相关B.高相关C.负相关D.低相关5.假设两变量呈线性关系,且两变量均为顺序变量,那么表现两变量相关关系时应选用()。
A.简单相关系数r B.等级相关系数r sC.回归系数b D.估计标准误差S yx6.变量之间的相关程度越低,则相关系数的数值()。
A.越大B.越接近0C.越接近-1 D.越接近17.下列各组中,两个变量之间的相关程度最高的是()。
A.商品销售额和商品销售量的相关系数是0.9B.商品销售额和商品利润率的相关系数是0.84C.产量与单位成本之间的相关系数为-0.94D.商品销售价格与销售量的相关系数为-0.918.相关系数r的取值范围是()。
贾俊平统计学第7版 第八章例题课后习题
第8章假设检验例题8.1由统计资料得知,1989 年某地新生儿的平均体重为3190克,现从1990年的新生儿中国机抽取100个,测得其平均体重为3210克,问1990年的新生儿与1989年相比,体重有无显著差异?★解:从调查结果看,1990 年新生儿的平均体重为3210克,比1989年新生儿的平均体重3190克增加了20克,但这20克的差异可能源于不同的情况。
_种情况是,1990 年新生儿的体重与1989年相比没有什么差别,20克的差异是由于抽样的随机性造成的;另一种情况是,抽样的随机性不可能造成20克这样大的差异,1990年新生儿的体重与1989年新生儿的体重相比确实有所增加。
上述问题的关键点是,20克的差异说明了什么?这个差异能不能用抽样的随机性来解释?为了回答这个问题,我们可以采取假设的方法。
假设1989年和1990年新生儿的体重没有显著差异,如果用μo表示1989年新生儿的平均体重,μ表示1990年新生儿的平均体重,我们的假设可以表示为μ=μ或μ心=0,现要利用1990年新生儿体重的样本信息检验上述假设是否成立。
如果成立,说明这两年新生儿的体重没有显著差异;如果不成立,说明1990年新生儿的体重有了明显增加。
在这里,问题是以假设的形式提出的,问题的解决方案是检验提出的假设是否成立。
所以假设检验的实质是检验我们关心的参数一1990 年的新生儿总体平均体重是否等于某个我们感兴趣的数值。
例8.2某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于1 000小时,已知灯泡燃烧寿命服从正态分布,标准差为200小时。
在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡?★解:这是一个单侧检验问题。
显然,如果灯泡的燃烧寿命超过了1 000小时,批发商是欢迎的,因为他用已定的价格(灯泡寿命为1 000小时的价格)购进了更高质量的产品。
因此,如果样本均值超过1000小时,他会购进这批灯泡。
统计学第8章习题答案
统计学第8章习题答案⼀、选择题1、若回归直线⽅程中的回归系数0=b 时,则相关系数( C ) A 、1=r B 、1-=r C 、0=r D 、r ⽆法确定2、下列不属于相关关系的现象是( C )A 、利息与利率B 、居民收⼊与储蓄存款C 、电视机产量与鸡蛋产量D 、某种商品的销售额与销售价格 3、当8.0=r 时,下列说法正确的是( D ) A 、80%的点都集中在⼀条直线的周围 B 、80%的点⾼度相关C 、其线性程度是4.0=r 时的两倍D 、两变量⾼度正线性相关4、在因变量的总离差平⽅和中,如果回归平⽅和所占的⽐重⼤,剩余平⽅和所占的⽐重⼩,则两变量之间( A )A 、相关程度⾼B 、相关程度低C 、完全相关D 、完全不相关 5、在直线回归⽅程bx a y +=∧中,回归系数b 表⽰( D ) A 、当0=x 时y 的平均值B 、x 变动⼀个单位时y 的变动总量C 、y 变动⼀个单位时x 的平均变动量D 、x 变动⼀个单位时y 的平均变动量6、可决系数2R 的值越⼤,则回归⽅程( B ) A 、拟合程度越低 B 、拟合程度越⾼C 、拟合程度可能⾼,也可能低D 、⽤回归⽅程进⾏预测越不准确7、如果两个变量Y X ,相关系数r 为负,说明( C )A 、Y ⼀般⼩于XB 、X ⼀般⼩于YC 、随着⼀个变量增加,另⼀个变量减少D 、随着⼀个变量减少,另⼀个变量也减少8、已知x 与y 之间存在负相关关系,指出下列回归⽅程中肯定错误的是( C ) A 、x y 82.020--=∧B 、x y 82.1300-=∧C 、x y 75.0150+-=∧D 、x y 42.090-=∧9、若协⽅差)()(y y x x --∑⼤于0,则x 与y 之间的关系是( A )A 、正相关B 、负相关C 、⾼度相关D 、低度相关10、由同⼀资料计算的相关系数r 与回归系数b 之间的关系是( D )A 、r ⼤,b 也⼤B 、r ⼩,b 也⼩C 、r 和b 同值D 、r 和b 的正负号相同 11、回归平⽅和指的是( B ) A 、2)(∑-Y YiB 、2)(∑-∧Y Y iC 、2)(∑∧-i i Y Y D 、2)(∑-X X i12、居民收⼊和储蓄额之间的相关系数可能是( B ) A 、9247.0- B 、9247.0 C 、5362.1- D 、5362.1 13、下列关系中属于负相关的有( D )A 、总成本与原材料消耗量B 、合理范围内的施肥量与农产品C 、居民收⼊与消费⽀出D 、产量与单位产品成本14、某研究⼈员发现,举重运动员的体重与他能举起的重量之间的相关关系为0.6,则( A )A 、体重越重,运动员平均能举起的重量越多B 、平均来说,运动员能举起其体重60%的重量C 、如果运动员体重增加10公⽄,则可多举6公⽄D 、举重能⼒的60%归因于其体重15、对于有线性相关关系的两变量建⽴的有意义的直线回归⽅程bx a y +=∧中,回归系数b ( A )A 、可能⼩于0B 、只能是正数C 、可能为0D 、只能是负数 16、可决系数可以说明回归⽅程的( C ) A 、有效度 B 、显著性⽔平 C 、拟合优度 D 、相关性17、样本较⼩时,回归估计置信区间的上下限( A ) A 、是对称地落在回归直线两侧的两条喇叭形曲线 B 、是对称地落在回归直线两侧的两条直线 C 、是区间越来越宽的两条直线 D 、是区间越来越宽的两条曲线18、由最⼩⼆乘法得到的回归直线,要求满⾜因变量的( D ) A 、平均值与其估计值的离差平⽅和最⼩ B 、实际值与其平均值的离差平⽅和最⼩ C 、实际值与其估计值的离差和为0D 、实际值与其估计值的离差平⽅和最⼩ 19、在相关分析中,正确的是( D )A 、相关系数既可测定直线相关,也可测定曲线相关B 、相关系数既不可测定直线相关,也不可测定曲线相关C 、相关系数不可测定直线相关,只可测定曲线相关D 、相关系数不可测定曲线相关,只可测定直线相关 20、⼀个由100⼈组成的25~64岁男⼦的样本,测得其⾝⾼与体重的相关系数r 为0.4671,则下列选项中不正确的是( D )A 、较⾼的男⼦趋于较重B 、⾝⾼与体重存在低度正相关C 、体重较重的男⼦趋于较⾼D 、46.71%的较⾼男⼦趋于较重21、在⼀元线性回归模型中,样本回归函数可以表⽰为( C ) A 、i i x x y E βα+=)|( B 、i i x y ∧∧∧+=βα C 、i i i e x y ++=∧∧∧βα D 、i i i u x y ++=∧βα22、收⼊⽔平与受教育程度之间的相关系数r 为0.6314,这种相关肯定属于( D ) A 、显著相关 B 、负相关 C 、⾼度相关 D 、正相关23、如果两个变量之间完全相关,则以下结论中正确的是( B ) A 、相关系数r 等于0 B 、可决系数2r 等于1C 、回归系数b ⼤于0D 、回归系数b 等于124、机床的使⽤年限与维修费⽤之间的相关系数是0.7213,合理范围内施肥量与粮⾷亩产量之间的相关系数为0.8521,商品价格与需求量之间的相关系数为-0.9345;则( A ) A 、商品价格与需求量之间的线性相关程度最⾼ B 、商品价格与需求量之间的线性相关程度最低 C 、施肥量与粮⾷亩产量之间的线性相关程度最⾼D 、机床的使⽤年限与维修费⽤之间的线性相关程度最⾼25、对估计的回归⽅程i i X Y ∧∧∧+=βα进⾏假设检验,0H :0=β,1H :0≠β。
统计学答案第八章【精选文档】
三、选择题1 某厂生产的化纤纤度服从正态分布,纤维的纤度的标准均值为1。
40.某天测得25根纤维的纤度的均值x=1。
39,检验与原来设计的标准均值相比是否有所变化,要求的显著性水平为α=0。
05,则下列正确的假设形式是()。
A。
H0:μ=1。
40,H1:μ≠1.40 B。
H0:μ≤1。
40,H1:μ>1。
40C。
H0:μ〈1。
40,H1:μ≥1。
40 D. H0:μ≥1.40,H1:μ<1。
402 某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为()。
A。
H0:π≤0.2,H1:π>0.2 B。
H0:π=0.2,H1:π≠0.2C。
H0:π≥0。
3,H1:π<0.3 D. H0:π≥0.3,H1:π<0。
33 一项新的减肥计划声称:在计划实施的第一周内,参加者的体重平均至少可以减轻8磅。
随机抽取40位参加该项计划的样本,结果显示:样本的体重平均减少7磅,标准差为32磅,则其原假设和备择假设是()。
A。
H0:μ≤8,H1:μ〉8 B. H0:μ≥8,H1:μ〈8C. H0:μ≤7,H1:μ〉7D. H0:μ≥7,H1:μ〈74 在假设检验中,不拒绝原假设意味着()。
A。
原假设肯定是正确的 B.原假设肯定是错误的C。
没有证据证明原假设是正确的D。
没有证据证明原假设是错误的5 在假设检验中,原假设和备择假设().A.都有可能成立B.都有可能不成立C.只有一个成立而且必有一个成立D。
原假设一定成立,备择假设不一定成立6 在假设检验中,第一类错误是指().A。
当原假设正确时拒绝原假设B。
当原假设错误时拒绝原假设C。
当备择假设正确时拒绝备择假设D。
当备择假设不正确时未拒绝备择假设7 在假设检验中,第二类错误是指().A。
当原假设正确时拒绝原假设B。
当原假设错误时未拒绝原假设C。
当备择假设正确时未拒绝备择假设 D.当备择假设不正确时拒绝备择假设8 指出下列假设检验哪一个属于右侧检验().A。
统计学_贾俊平第四版第八章课后答案(目前最全)
8.2 一种元件,要求其使用寿命不得低于700小时。
现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。
已知该元件寿命服从正态分布,=60小时,试在显著性水平0.05下确定这批元件是否合格。
解:H0:μ≥700;H1:μ<700已知:=680 =60由于n=36>30,大样本,因此检验统计量:==-2当α=0.05,查表得=1.645。
因为z<-,故拒绝原假设,接受备择假设,说明这批产品不合格。
8.38.4 糖厂用自动打包机打包,每包标准重量是100千克。
每天开工后需要检验一次打包机工作是否正常。
某日开工后测得9包重量(单位:千克)如下:99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5已知包重服从正态分布,试检验该日打包机工作是否正常(a=0.05)?解:H0:μ=100;H1:μ≠100经计算得:=99.9778 S=1.21221检验统计量:==-0.055当α=0.05,自由度n-1=9时,查表得=2.262。
因为<,样本统计量落在接受区域,故接受原假设,拒绝备择假设,说明打包机工作正常。
8.5 某种大量生产的袋装食品,按规定不得少于250克。
今从一批该食品中任意抽取50袋,发现有6袋低于250克。
若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(a=0.05)?解:解:H0:π≤0.05;H1:π>0.05已知:p=6/50=0.12检验统计量:==2.271当α=0.05,查表得=1.645。
因为>,样本统计量落在拒绝区域,故拒绝原假设,接受备择假设,说明该批食品不能出厂。
8.68.7 某种电子元件的寿命x(单位:小时)服从正态分布。
现测得16只元件的寿命如下:159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命显著地大于225小时(a=0.05)?解:H0:μ≤225;H1:μ>225经计算知:=241.5 s=98.726检验统计量:==0.669当α=0.05,自由度n-1=15时,查表得=1.753。
统计学第五版(贾俊平)第八章课后习题答案
统计学第五版(贾俊平)第⼋章课后习题答案《统计学》第⼋章课后练习题8.4解:由题意知,µ=100,α=0.05,n=9<30,故选⽤t统计量。
经计算得:x =99.9778,s=1.2122,进⾏检验的过程为:H0:µ=100H1:µ≠100t=s n =1.21229=?0.0549当α= 0.05,⾃由度n-1= 8,查表得tα2(8)=2.3060,因为t< tα2,样本统计量落在接收域,所以接受原假设H0,即打包机正常⼯作。
⽤P值检测,这是双侧检验,故:P=2×1?0.5215=0.957,P值远远⼤于α,所以不能原假设H0。
8.7解:由题意知,µ=225,α=0.05,n=16<30,故选⽤t统计量。
经计算得:x =241.5,s=98.7259,进⾏检验的过程为:H0:µ≤225H1:µ>225t=s n =98.725916=0.6685当α= 0.05,⾃由度n-1= 15,查表得tα(15)=2.1314,这是⼀个右单侧检验,因为t即元件平均寿命没有显著⼤于225⼩时。
⽤P值检测,这是右单侧检验,故:P=1?0.743=0.257,P值远远⼤于α,所以不能拒绝原假设H0。
8.9,解:由题意得σA2=632,σB2=572,x A=1070,x B=1020,n A=81,n B=64,故选⽤z统计量。
进⾏检验的过程为:H0:µA?µB=0H1: µA?µB≠0Z=A B A BσA A +σBB=632+572=5当α=0.05时,zα2=1.96,因为Z>zα2,所以拒绝原假设H0,,即A、B两⼚⽣产的材料平均抗压强度不相同。
⽤P值检测,这是双侧检验,故:P=2×1?0.9999997=0.0000006,P值远远⼩于α,所以拒绝原假设H0,8.13解:建⽴假设为:H0: π1=π2H1: π1≠π2由题意得:p 1=10411000=0.00945,n 1=11000,p 2=18911000=0.01718,n 2=11000 p =p 1n 1+p 2n 2n 1+n 2=0.00945×11000+0.01718×1100011000+11000=0.01332 z =p ?p p (1?p )(n 1+n2) =0.00945?0.017180.01332×(1?0.01332)×(11000+11000)=?5 当α=0.05,z α/2=1.96,这是⼀个左单侧检验,因为 z > z α/2 ,样本统计量落⼊拒绝域,所以拒绝原假设H 0,接受备择假设H 1,即服⽤阿司匹林可以降低⼼脏病发⽣率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章 相关与回归分析
6.解:x 为企业某产品的产量,y 为该产品的单位成本
(1)n=6,xy ∑=1481,21x =∑,426y =∑,279x
=∑,230268y =∑ 相关系数:
n xy x y
-﹣0.91
即可以从相关系数可以看出,该企业产品产量与单位成本之间存在高度线性负相关关系
(2)22 1.82()n xy x y
b n x x -==--∑∑∑∑∑ 77.37y x a y bx b n n
=-=-=∑∑ 故回归直线方程为 ˆy
=77.37-1.82x b 的含义:产量每增加1000件时,单位成本平均下降1.82元
(3)假设产量为6000件,估计单位成本ˆy
=66.45 7. 解: x 为汽车使用年限,y 为汽车的年维修费用
(1)由题已知n=12,xy ∑=46560,60x =∑,8520y =∑,
2352x =∑,26428800y =∑ 相关系数:
n xy x y - 所以,从相关系数可知,该企业汽车的使用年限与维修费用之间呈高度线性正相关关系
(2)b=22()n xy x y
n x x -=-∑∑∑∑∑76.15 a=329.25y x y bx b n n
-=-=∑∑ 回归直线方程:ˆy
=329.25+76.15x (3)当设车使用年限为15年时,维修费用估计ˆy
=1471.5 8. 解:x 为母亲身高,y 为女儿身高
由题已知 n=10,xy ∑=251908,60x =∑,1589y =∑,
2251349x =∑,2252541y =∑
相关系数:
n xy x y
- 所以,从相关系数可以得知母亲与女儿身高之间存在显著线性正相关关系
9.解:由题可知
(1)n=9, xy ∑=16918,546x =∑,260y =∑,234362x
=∑ b=22()n xy x y
n x x -=-∑∑∑∑∑0.92 a=y x y bx b n n
-=-=∑∑﹣27.2055 回归方程为:ˆy
=﹣27.2055+0.92x 回归系数的含义:当某市历年人均收入增加1元时,年末银行存款余额平均增加0.92万元
(2)当2007年人均收入为400元,该年末银行存款余额ˆy
=341.08(万元)。