统计学第八章题目

合集下载

统计学第七章、第八章课后题答案

统计学第七章、第八章课后题答案

统计学复习笔记之南宫帮珍创作第七章第八章参数估计一、思考题1.解释估计量和估计值在参数估计中, 用来估计总体参数的统计量称为估计量.估计量也是随机变量.如样本均值, 样本比例、样本方差等.根据一个具体的样本计算出来的估计量的数值称为估计值. 2.简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值即是被估计的总体参数.(2)有效性:是指估计量的方差尽可能小.对同一总体参数的两个无偏估计量, 有更小方差的估计量更有效.(3)一致性:是指随着样本量的增年夜, 点估计量的值越来越接近被估总体的参数.3.怎样理解置信区间在区间估计中, 由样本统计量所构造的总体参数的估计区间称为置信区间.置信区间的论述是由区间和置信度两部份组成.有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间), 其实不说明置信度, 也不给出被调查的人数, 这是不负责的暗示.因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌.在公布调查结果时给出被调查人数是负责任的暗示.这样则可以由此推算出置信度(由后面给出的公式), 反之亦然.4.解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率.也就是说, 无穷次重复抽样所获得的所有区间中有95%(的区间)包括参数.不要认为由某一样本数据获得总体参数的某一个95%置信区间, 就以为该区间以0.95的概率覆盖总体参数.5.简述样本量与置信水平、总体方差、估计误差的关系.1.估计总体均值时样本量n为其中:2.样本量n与置信水平1-α、总体方差、估计误差E之间的关系为▪与置信水平成正比, 在其他条件不变的情况下, 置信水平越年夜, 所需要的样本量越年夜;▪与总体方差成正比, 总体的不同越年夜, 所要求的样本量也越年夜;▪与与总体方差成正比, 样本量与估计误差的平方成反比, 即可以接受的估计误差的平方越年夜, 所需的样本量越小.二、练习题1.从一个标准差为5的总体中采纳重复抽样方法抽出一个样本量为40的样本, 样本均值为25.1)样本均值的抽样标准差即是几多?2)在95%的置信水平下, 估计误差是几多?解: 1)已知σ = 5, n = 40, = 25∵∴2)已知∵2.某快餐店想要估计每位顾客午餐的平均花费金额, 在为期3周的时间里选取49名顾客组成了一个简单随机样本.1)假定总体标准差为15元, 求样本均值的抽样标准误差.2)在95%的置信水平下, 求估计误差.3)如果样本均值为120元, 求总体均值µ的95%的置信区间.解:1)已知σ = 15, n = 49∵∴2)已知∵3)已知 = 120∵ 置信区间为±E3.从一个总体中随机抽取n =100的随机样本, 获得 =104560, 假定总体标准差σ = 85414, 试构建总体均值µ的95%的置信区间.解:已知n =100, =104560, σ = 85414, 1-a=95% ,由于是正态总体, 且总体标准差已知.总体均值m在1-a置信水平下的置信区间为104560 ± 1.96×85414÷√1004.从总体中抽取一个n =100的简单随机样本, 获得 =81, s=12.要求:1)构建µ的90%的置信区间.2)构建µ的95%的置信区间.3)构建µ的99%的置信区间.解:由于是正态总体, 但总体标准差未知.总体均值m在1-a置信水平下的置信区间公式为81±×12÷√100 = 81±×????????4)= 25, σ = 3.5, n =60, 置信水平为95%5)=119, s =23.89, n =75, 置信水平为98%6)=3.149, s =0.974, n =32, 置信水平为90%解:∵∴ 1) 1-a=95% ,其置信区间为:25±1.96×3.5÷√602) 1-a=98% , 则a=0.02, a/2=0.01, 1-a/2=0.99,查标准正态分布表,可知:其置信区间为: 119±2.33×23.89÷√753) 1-a=90%,其置信区间为:3.149±1.65×0.974÷√325.利用下面的信息, 构建总体均值µ的置信区间:1)总体服从正态分布, 且已知σ = 500, n = 15, =8900, 置信水平为95%.解:N=15, 为小样本正态分布, 但σ已知.则1-a=95%, .其置信区间公式为∴置信区间为:8900±1.96×500÷√15=(8646.7 , 9153.2)2)总体不服从正态分布, 且已知σ = 500, n = 35, =8900,置信水平为95%.解:为年夜样本总体非正态分布, 但σ已知.则1-a=95%, .其置信区间公式为∴置信区间为:8900±1.96×500÷√35=(8733.9 9066.1)3)总体不服从正态分布, σ未知, n = 35, =8900, s =500, 置信水平为90%.解:为年夜样本总体非正态分布, 且σ未知, 1-a=90%,1.65.其置信区间为:8900±1.65×500÷√35=(8761 9039)4)总体不服从正态分布, σ未知, n = 35, =8900, s =500, 置信水平为99%.解:为年夜样本总体非正态分布, 且σ未知, 1-a=99%,2.58.其置信区间为:8900±2.58×500÷√35=(8681.9 9118.1)6.某年夜学为了解学生每天上网的时间, 在全校7500名学生中采用重复抽样方法随机抽取36人, 调查他们每天上网的时间, 获得下面的数据(单元:小时)(略).求该校年夜学生平均上网时间的置信区间, 置信水平分别为90%解:先求样本均值:= 3.32再求样本标准差:置信区间公式:7.从一个正态总体中随机抽取样本量为8的样本, 各样本值分别为:10, 8, 12, 15, 6, 13, 5, 11.求总体均值µ的95%置信区间.解:本题为一个小样本正态分布, σ未知.先求样本均值:= 80÷8=10再求样本标准差:于是 , 的置信水平为的置信区间是,已知, n = 8, 则,α/2=0.025, 查自由度为n-1 = 7的分布表得临界值所以, 置信区间为:10±2.45×3.4641÷√78.某居民小区为研究职工上班从家里到单元的距离, 抽取了由16个人组成的一个随机样本, 他们到单元的距离分别是:10, 3,14, 8, 6, 9, 12, 11, 7, 5, 10, 15, 9, 16, 13, 2.假设总体服从正态分布, 求职工上班从家里到单元平均距离的95%的置信区间.解:小样本正态分布, σ未知.已知, n = 16, , 则, α/2=0.025, 查自由度为n-1 = 15的分布表得临界值样本均值再求样本标准差:于是 , 的置信水平为的置信区间是?? ??????????????????±??×??÷√??9.从一批零件是随机抽取????个, 测得其平均长度是??????, 标准差是????.1)求确定该种零件平均长度的????August的置信区间.2)在上面估计中, 你使用了统计中的哪一个重要定理?请解释.解:)??这是一个年夜样天职布.已知N??????, ??????????????, S????????, α?? ????, .其置信区间为:149.5±1.96×1.93÷√36 2)中心极限定理论证:如果总体变量存在有限的平均数和方差, 那么, 不论这个总体的分布如何, 随着样本容量的增加, 样本均值的分布便趋近正态分布.在现实生活中, 一个随机变量服从正态分布未必很多, 可是多个随机变量和的分布趋于正态分布则是普遍存在的.样本均值也是一种随机变量和的分布, 因此在样本容量充沛年夜的条件下, 样本均值也趋近于正态分布, 这为抽样误差的概率估计理论提供了理论基础.10.某企业生产的袋装食品采纳自动打包机包装, 每袋标准重量为100克, 现从某天生产的一批产物中按重复抽样随机抽取50包进行检查, 测得每包重量如下:(略)已知食品包重服从正态分布, 要求:1)确定该种食品平均重量的95%的置信区间.2)如果规定食品重量低于100克属于分歧格, 确定该批食品合格率的95%的置信区间.解:1)本题为一个年夜样本正态分布, σ未知.已知N=50, µ=100, 1-α=0.95, .① 每组组中值分别为97、99、101、103、105, 即此50包样本平均值= (97+99+101+103+105)/5 = 101② 样本标准差为:③其置信区间为:101±1.96×1.666÷√502)∵ 分歧格包数(<100克)为2+3=5包, 5/50 = 10%(分歧格率), 即P = 90%.∴ 该批食品合格率的95%置信区间为:11.假设总体服从正态分布, 利用下面的数据构建总体均值μ的99%的置信区间.(略)解:样本均值样本标准差:尽管总体服从正态分布, 可是样本n=25是小样本, 且总体标准差未知, 应该用T统计量估计.1-α=0.99, 则α=0.01, α/2=0.005, 查自由度为n-1 =24的分布表得临界值的置信水平为的置信区间是,12.一家研究机构想估计在网络公司工作的员工每周加班的平均时间, 为此随机抽取了18个员工, 获得他们每周加班的时间数据如下(单元:小时):(略)假定员工每周加班的时间服从正态分布, 估计网络公司员工平均每周加班时间的90%的置信区间.解:① N = 18 < 30, 为小样本正态分布, σ未知.②样本均值样本标准差:=③ 1-α= 90%, α= 0.1, α/2= 0.05, 则查自由度为n-1 = 17的分布表得临界值④的置信水平为的置信区间是,13.利用下面的样本数据构建总体比例丌的置信区间:1)n =44, p = 0.51 , 置信水平为99%2)n =300, p = 0.82 , 置信水平为95%3)n =1150, p = 0.48, 置信水平为90%解: 1) 1-α= 99%, α= 0.01, α/2= 0.005, 1-α/2= 0.995, 查标准正态分布表, 则2)1-a=95%,3)1-a=90%,分别代入14.在一项家电市场调查中, 随机抽取了200个居民户, 调查他们是否拥有某一品牌的电视机, 其中拥有该品牌电视机的家庭占23%.求总体比例的置信区间, 置信水平分别为90%和95%.解: 1)置信水平90%, 1-a=90%, 1.65, N = 200, P = 23%.代入2)置信水平95%, 1-a=95%, , N = 200, P = 23%.代入15.一位银行的管理人员想估计每位顾客在该银行的月平均存款额.他假设所有顾客月存款额的标准差为1000元, 要求的估计误差在200元以内, 置信水平为99%.应选取多年夜的样本?解:已知 1-α = 99%, 则 2.58.E = 200, σ= 1000元.则N = (²×σ²)÷E²= (2.58²×1000²)÷200²≈167(得数应该是166.41, 不论小数后是几多, 都向上进位取整, 因此至少是167人)16.要估计总体比例丌, 计算下列条件下所需的样本量.1)E=0.02, 丌=0.40, 置信水平96%2)E=0.04, 丌未知, 置信水平95%3)E=0.05, 丌=0.55, 置信水平90%解: 1)已知 1-α = 96%, α/2 =0.02 , 则N = {²×丌(1-丌)}÷E²=2.06²×0.4×0.6÷0.02²≈25472)已知 1-α = 95%, α/2 =0.025 , 则丌未知,则取使丌(1-丌)最年夜时的0.5.N = {²×丌(1-丌)}÷E²=1.96²×0.5×0.5÷0.04²≈601 3)置信水平90%, 1-a=90%, 1.65,N = {²×丌(1-丌)}÷E²=1.65²×0.55×0.45÷0.05²≈27017.某居民小区共有居民500户, 小区管理者准备采纳一项新的供水设施, 想了解居民是否赞成.采用重复抽样方法随机抽取了50户, 其中有32户赞同, 18户反对.1)求总体中赞成该项改革的户数比例的置信区间(α=0.05)2)如果小区管理者预计赞成的比例能到达80%, 估计误差不超越10%, 应抽取几多户进行调查(α=0.05)解:1)已知N=50, P=32/50=0.64, α=0.05, α/2 =0.025 , 则置信区间:P±2)已知丌=0.8 , E = 0.1, α=0.05, α/2 =0.025 , 则N= ²丌(1-丌)/E²= 1.96²×0.8×0.2÷0.1²≈6218.根据下面的样本结果, 计算总体标准差σ的90%的置信区间:1)=21, S=2, N=502)=1.3, S=0.02, N=153)=167, S=31, N=22解:1)年夜样本, σ未知, 置信水平90%, 1-a=90%,21±1.65×2÷√502)小样本, σ未知, 置信水平90%, 1-a=90%, 则查自由度为n-1 = 14的分布表得临界值, = 1.3±1.761×0.02÷√153) 年夜样本, σ未知, 置信水平90%, 1-a=90%,167±1.65×31÷√2219.题目(略)1)构建第一种排队方式等候时间标准差的95%的置信区间2)构建第二种排队方式等候时间标准差的95%的置信区间3)根据1)和2)的结果, 你认为哪种排队方式更好?解:本题为小样本正态分布, σ未知, 应用公式,置信水平95%, 1-a=95%, 则查自由度为n-1 = 9的分布表得临界值1)= 7.15,其置信区间为7.15±2.31×0.48÷√102)= √0/9 = 0其置信区间为7.15±04)第二种排队方式更好.(19题是对总体方差的估计, 应该用卡方统计量进行估计, 20题是对两个总体参数的估计, 这二种类型老师未讲, 不是本次考试的内容, 不能用Z统计量像估计总体均值和比例那样去估计, 具体内容见书上P188――P194)第九章假设检验一、思考题1.假设检验和参数估计有什么相同点和分歧点?解:参数估计与假设检验是统计推断的两个组成部份.相同点:它们都是利用样本对总体进行某种推断.分歧点:推断的角度分歧.参数估计讨论的是用样本统计量估计总体参数的方法, 总体参数μ在估计前是未知的.而在假设检验中, 则是先对μ的值提出一个假设, 然后利用样本信息去检验这个假设是否成立.2.什么是假设检验中的显著性水平?统计显著是什么意思?解:显著性水平用α暗示, 在假设检验中, 它的含义是当原假设正确时却被拒绝的概率或风险, 即假设检验中犯弃真毛病的概率.它是由人们根据检验的要求确定的.(我理解的统计学意义, 统计显著是统计上专用的判定标准, 指在一定的概率原则下, 可以供认一种趋势或者合理性到达的水平, 到达为统计上水平显著, 达不到为统计上水平不显著)3.什么是假设检验中的两类毛病?解:弃真毛病(α毛病):当原假设为真时拒绝原假设, 所犯的毛病成为第I类毛病, 又称为弃真毛病.犯第I类毛病的概率常记作α.取伪毛病(β毛病):当原假设为假时没有拒绝原假设, 所犯的毛病称为第II类毛病, 又称取伪毛病.犯第II类毛病概率常记作β.发生第I类毛病的概率也常被用于检验结论的可靠性怀抱.假设检验中犯第I类毛病的概率被称为显著性水平, 记作α.4.两类毛病之间存在什么样的数量关系?在样本容量n一定的情况下, 假设检验不能同时做到犯α和β两类毛病的概率都很小.若减小α毛病, 就会增年夜犯β毛病的机会;若减小β毛病, 也会增年夜犯α毛病的机会.要使α和β同时变小只有增年夜样本容量.但样本容量增加要受人力、经费、时间等很多因素的限制, 无限制增加样本容量就会使抽样调查失去意义.因此假设检验需要慎重考虑对两类毛病进行控制的问题.5.解释假设检验中的P值.解:如果原假设为真, 所获得的样本结果会像实际观测结果那么极端或更极真个概率, 称为P值.也称为观察到的显著性水平.P值是反映实际观测到的数据与原假设H0之间纷歧致水平的一个概率值.P值越小, 说明实际观测到的数据与H0之间纷歧致水平就越年夜.6.显著性水平与P值有何区别?解:α(显著性水平)是一个判断的标准(当原假设为真, 却被拒绝的概率), 而P是实际统计量对应分位点的概率值(当原假设为真时, 所获得的样本观察结果或更极端结果呈现的概率).可以通过α计算置信区间, 然后与统计量进行比力判断, 也可以通过统计量计算对应的p值, 然后与α值比力判断.7.假设检验依据的基来源根基理是什么?解:假设检验利用的是小概率原理, 小概率原理是指发生概率很小的随机事件在一次试验中是几乎不成能发生的.根据这一原理, 可以先假设总体参数的某项取值为真, 也就是假设其发生的可能性很年夜, 然后抽取一个样本进行观察, 如果样本信息显示呈现了与事先假设相反的结果且与原假设分歧很年夜, 则说明原来假定的小概率事件在一次实验中发生了, 这是一个违背小概率原理的分歧理现象, 因此有理由怀疑和拒绝原假设;否则不能拒绝原假设.8. 你认为在单侧检验中原假设和备择假设的方向应该如何确定?解: 假设问题有两种情况, 一种是所考察的数值越年夜越好(左单侧检验或下限检验), 临界值和拒绝域均在左侧;另一种是数值越小越好(右单侧检验或上限检验), 临界值和拒绝域均在右侧.二、 练习题1. 已知某炼铁厂的含碳量服从正态分布N (4.55, 0.108²), 现在测定了9炉铁水, 其平均含碳量为4.484.如果估计方差没有变动, 可否认为现在生产的铁水平均含碳量为4.55(α=0.05)? 解: 已知μ0=4.55, σ²=0.108², N=9, =4.484,这里采纳双侧检验, 小样本, σ已知, 使用Z 统计.假定现在生产的铁水平均含碳量与以前无显著不同.则, α=0.05, α/2 =0.025 , 查表得临界值为计算检验统计量: = (4.484-4.55)/(0.108/√9) 决策:∵Z 值落入接受域, ∴在=0.05的显著性水平上接受H0. nx Z / σ - =μ0结论:有证据标明现在生产的铁水平均含碳量与以前没有显著不同, 可以认为现在生产的铁水平均含碳量为4.55.2. 一种元件, 要求其使用寿命不得低于700小时.现从一批这种元件中随机抽取36件, 测得其平均寿命为680小时.已知该元件寿命服从正态分布, σ=60小时, 试在显著性水平0.05下确定这批元件是否合格.解: 已知N=36, σ=60, =680, μ0=700这里是年夜样本, σ已知, 左侧检验, 采纳Z 统计量计算. 提出假设:假定使用寿命平均不低于700小时H0:μ≥700H1: μ < 700= 0.05, 左检验临界值为负, 查得临界值: -Z0.05=-1.645计算检验统计量: = (680-700)/(60/√36) = -2决策:∵Z 值落入拒绝域, ∴在=0.05的显著性水平上拒绝H0, 接受H1结论:有证据标明这批灯胆的使用寿命低于700小时, 为分歧格产物.3. 某地域小麦的一般生产水平为亩产250公斤, 其标准差是30公斤.现用一种化肥进行试验, 从25个小区抽样, 平均产量为n x Z / σ - = μ0270公斤.这种化肥是否使小麦明显增产(α=0.05)?解:已知μ0 =250, σ = 30, N=25, =270提出假设:假定这种化肥没使小麦明显增产.即 H0:μ≤250H1: μ>250计算统计量:Z = (结论:Z统计量落入拒绝域, 在α =0.05的显著性水平上, 拒绝H0, 接受H1.决策:有证据标明, 这种化肥可以使小麦明显增产.4.糖厂用自动打包机打包, 每包标准重量是100千克.每天开工后需要检验一次打包机工作是否正常.某日开工后测得9包重量(单元:千克)如下:(略)已知包重服从正态分布, 试检验该日打包机工作是否正常.(α =0.05)= 99.98提出假设, 假设打包机工作正常:即 H0:μ= 100H1: μ≠100计算统计量:决策:有证据标明这天的打包机工作正常.5. 某种年夜量生产的袋装食品, 按规定不得少于250克.今从一批该食品中任意抽取50袋, 发现有6袋低于250克.若规定不符合标准的比例超越5%就不得出厂, 问该批食品能否出厂(=0.05)?H0:丌≤5%H1:丌>5%(因为没有找到丌暗示的公式, 这里用P0暗示丌0)结论:因为Z 值落入拒绝域, 所以在=0.05的显著性水平上, 拒绝H0, 而接受H1.决策:有证据标明该批食品合格率不符合标准, 不能出厂. 6. 某厂家在广告中声称, 该厂生产的汽车轮胎在正常行驶条件下超越目前的平均水平25000公里.对一个由15个轮胎组成的随机样本做了试验, 获得样本均值和标准差分别为27000公里和5000公里.假定轮胎寿命服从正态分布, 问该厂家的广告是否真- = ns x t μ0实(=0.05)?解:N=15,H0:μ0 ≤25000H1:μ >25000结论:因为t 值落入接受域, 所以接受H0, 拒绝H1.决策:有证据标明, 该厂家生产的轮胎在正常行驶条件下使用寿命与目前平均水平25000公里无显著性不同, 该厂家广告不真实. 7. 某种电子元件的寿命x (单元:小时)服从正态分布.现测得16只元件的寿命如下:(略).问是否有理由认为元件的平均寿命显著地年夜于225小时(=0.05)? 解:= 241.5,H :μ??> ??创作时间:二零二一年六月三十日 - = ns x t - = ns x tμ0 μ0。

统计学第八章练习题答案

统计学第八章练习题答案

第八章 练习题参考答案一、填空题8.1.1 函数关系、相关关系函数关系、相关关系8.1.2 因变量、自变量因变量、自变量8.1.3 函数关系函数关系8.1.4 相关关系相关关系8.1.5 涉及变量涉及变量8.1.6 单相关单相关8.1.7 偏相关偏相关8.1.8 密切程度密切程度8.1.9 表现形态表现形态8.1.10 相关的方向相关的方向8.1.11 相关的性质相关的性质8.1.12 正相关正相关8.1.13 负相关负相关8.1.14 虚假相关虚假相关8.1.15 相关分析相关分析8.1.16 回归分析回归分析8.1.17 相关系数相关系数8.1.18 偏相关系数偏相关系数8.1.19 复相关系数复相关系数8.1.20 最小二乘法最小二乘法8.1.21 估计标准差估计标准差8.1.22 各回归系数、整个回归方程各回归系数、整个回归方程8.1.23 t检验、F检验。

检验。

8.1.24 线性相关线性相关8.1.25 回归系数回归系数1二、单项选择题题号题号 8.2.1 8.2.2 8.2.3 8.2.4 8.2.5 8.2.6 8.2.7 8.2.8 答案答案 A B B C B B C A 题号题号 8.2.98.2.10 8.2.11 8.2.12 8.2.13 8.2.14 8.2.15 8.2.16 答案答案BABCABAC三、多项选择题题号题号 8.3.1 8.3.28.3.3 8.3.4 8.3.5 8.3.6 8.3.7 8.3.8 答案答案 AC ABC BCD AB CD ABC BCD ACD 题号题号 8.3.9 8.3.10 8.3.11 8.3.12 8.3.13 8.3.14 8.3.15 ———— 答案答案 AC ABCDABCDABDACABCD————四、判断改错题8.4.1 (√)(√)8.4.2 (×,函数关系)(×,函数关系) 8.4.3 (×,偏相关)(×,偏相关) 8.4.4 (×,密切程度)(×,密切程度) 8.4.5 (√)(√)8.4.6 (×,具有密切联系的统计方法)(×,具有密切联系的统计方法) 8.4.7 (√)(√) 8.4.8 (√)(√)8.4.9 (×,只能认为变量之间不存在线性相关关系)(×,只能认为变量之间不存在线性相关关系) 8.4.10 (√)(√) 8.4.11 (×,01y x b b e=++)8.4.12 (√)(√)8.4.13 (×,残差平方和达到最小)(×,残差平方和达到最小) 8.4.14 (√)(√)8.4.15 (×,方差为21ˆvar()xxL s b =)8.4.16 (√)(√)8.4.17 (×,回归线的代表性)(×,回归线的代表性) 8.4.18 (×,t 检验)检验) 8.4.19 (×,回归平方和)(×,回归平方和) 8.4.20 (√)(√) 8.4.21 (√)(√)8.4.22 (×,一个因变量)(×,一个因变量) 8.4.23 (×,随机变量)(×,随机变量) 8.4.24 (√)(√)8.4.25 (×,2210x x y b b b ++=)五、简答题8.5.1 答:相关关系是指变量之间客观存在的非严格确定的依存关系;函数关系是指变量之间存在的严格确定的依存关系。

统计学第8章的习题答案

统计学第8章的习题答案

1. 解:根据题意建立原假设和备择假设:01:700;:700H H μμ≥<2x Z ===- 由于-2<-1.645,所以Z Z α<-,Z 值位于原假设0H 的拒绝域,所以拒绝0H ,即在显著性水平0.05下该批元件不合格。

2. 根据题意建立原假设和备择假设:01:250;:250H H μμ≤>20 3.336x t ====,0.05(24) 1.7109t =, 由于0.05(24),.t t t t α>>所以t 值位于原假设H 0,即在显著性水平0.05下该种化肥使得水稻明显增产。

3. 解:已知 0620.157,0.155,0.05, 1.96.400p p Z αα===== 根据题意建立原假设和备择假设:01:0.157;:0.157H P H P =≠0.10995P Z ===- -0.10995>-1.96,所以Z 值位于原假设H 0的接受域。

即在显著性水平0.05下随机调查的结果支持该市老年人口比重为15.7%。

4. 解:已知 09,100,99.98, 1.2122n x s μ====。

根据题意建立原假设和备择假设:01:100;:100H H μμ=≠0.020.04950.4041x t -====- -0.0495>-2.306,所以t 位于原假设H 0的接受域,即在显著性水平0.05下,打包机打包正常。

5. 解:已知00.05200,20,208.5,30,(19) 1.7291n x S t μ=====。

根据题意建立原假设和备择假设:01:200;:200H H μμ≤>8.5 1.2676.7083x t ==== t t α<,所以t 值位于原假设H 0的接受域,即在显著性水平0.05下,接受原假设,即在特定时间内每小时经过该地的汽车数量小于200辆。

6. 解:已知015,40,14.5, 2.3,0.05, 1.645n x S Z αμα======。

统计学第五版课后练答案

统计学第五版课后练答案

统计学第五版课后练答案(7-8章)(总11页)-本页仅作为预览文档封面,使用时请删除本页-第七章 参数估计(1)x σ==(2)2x z α∆= 1.96=某快餐店想要估计每位顾客午餐的平均花费金额。

在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(1)假定总体标准差为15元,求样本均值的抽样标准误差。

x σ==(2)在95%的置信水平下,求估计误差。

x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=×=(3)如果样本均值为120元,求总体均值 的95%的置信区间。

置信区间为:22x z x z αα⎛-+ ⎝=()120 4.2,120 4.2-+=(,)22x z x z αα⎛-+ ⎝=104560±=(,) 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。

要求:大样本,样本均值服从正态分布:2,x N n σμ⎛⎫ ⎪⎝⎭或2,s x N n μ⎛⎫⎪⎝⎭置信区间为:22x z x z αα⎛-+ ⎝= (1)构建μ的90%的置信区间。

2z α=0.05z =,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(,)(2)构建μ的95%的置信区间。

2z α=0.025z =,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(,) (3)构建μ的99%的置信区间。

2z α=0.005z =,置信区间为:()81 2.576 1.2,81 2.576 1.2-⨯+⨯=(,)(1)2x z α±=25 1.96±=(,) (2)2x z α±=119.6 2.326±=(,)(3)2x z α±=3.419 1.645±=(,)(1)2x z α±=8900 1.96±=(,)(2)2x z α±=8900 1.96±=(,)(3)2x z α±=8900 1.645±=(,) (4)2x z α±=8900 2.58±=(,)某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36解:(1)样本均值x =,样本标准差s=1α-=,t=2z α=0.05z =,2x z α±=3.32 1.645±=(,)1α-=,t=2z α=0.025z =,2x zα±3.32 1.96±=(,)1α-=,t=2z α=0.005z =,2x z α±3.32 2.76±(,)x t α±=10 2.365±某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是: 10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。

统计学第五版第八章课后习题答案

统计学第五版第八章课后习题答案
0.025
决策: ∵Z值落入接受域, ∴在α=0.05的显著水平上接受 H 0 。
结论:有证据表明现在生产的铁水平均含碳量与以前没有显著差 异,可以认为现在生产的铁水平均含碳量为4.55。
8.2 一种元件,要求其使用寿命不得低于700小时。现从一批这种 元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿 命服从正态分布,σ=60小时,试在显著性水平0.05下确定这批元 件是否合格。
甲法:31 34 29 32 35 38 34 30 29 32 31 26 乙法:26 24 28 29 30 29 32 26 31 29 32 28 两总体为正态总体,且方差相同。问两种方法的装配时 间有无显著差别(α =0.05)? 解: 正态总体,小样本,σ²未知但相同,独立样本t检验 H 0 : 甲 -乙 = 0 H1 : 甲 - 乙 ≠ 0
由Excel制表得:
由图可知:
已知:α = 0.05,n1 = n2=12 2 2 x甲 =31.75 x乙 =28.67 S甲=10.20 S乙 =6.06 t=1.72 t∈(-1.72,1.72)接受,否则拒绝。 t=(31.75-28.67)/(8.08* 0.41)=0.93 0.93∈(-1.72,1.72) 决策:在α = 0.05的水平上接受H 0 。 结论: 两种方法的装配时间无显著不同。
σ²≤100 H 1 : σ²>100 α= 0.05,n=9,自由度= 9 - 1 = 8, S² =215.75, x =63 采用χ²检验 临界值(s): χ² =15.5 )S 2 (9 - 1) * 215.75 2 (n - 1 17.26 15.5 检验统计量: 2 100 决策:在 a = 0.05的水平上拒绝 H 0 结论: σ²>100

统计学第八章课后题及答案解析

统计学第八章课后题及答案解析

第八章一、单项选择题1.时间数列的构成要素是()A.变量和次数 B.时间和指标数值C.时间和次数 D.主词和时间2.编制时间数列的基本原则是保证数列中各个指标值具有()A.可加性 B.连续性C.一致性 D.可比性3.相邻两个累积增长量之差,等于相应时期的()A.累积增长量 B.平均增长量C.逐期增长量 D.年距增长量4.统计工作中,为了消除季节变动的影响可以计算()A.逐期增长量 B.累积增长量C.平均增长量 D.年距增长量5.基期均为前一期水平的发展速度是()A.定基发展速度 B.环比发展速度C.年距发展速度 D.平均发展速度6.某企业2003年产值比1996年增长了1倍,比2001年增长了50%,则2001年比1996年增长了()A.33% B.50%C.75% D.100%7.关于增长速度以下表述正确的有()A.增长速度是增长量与基期水平之比 B.增长速度是发展速度减1C.增长速度有环比和定基之分 D.增长速度只能取正值8.如果时间数列环比发展速度大体相同,可配合()A.直线趋势方程 B.抛物线趋势方程C.指数曲线方程 D.二次曲线方程二、多项选择题1.编制时间数列的原则有()A.时期长短应一致 B.总体范围应该统一C.计算方法应该统一 D.计算价格应该统一E.经济内容应该统一2.发展水平有()A.最初水平 B.最末水平C.中间水平 D.报告期水平E.基期水平3.时间数列水平分析指标有()A.发展速度 B.发展水平C.增长量 D.平均发展水平E.平均增长量4.测定长期趋势的方法有()A.时距扩大法 B.移动平均法C.序时平均法 D.分割平均法E.最小平方法三、填空题1.保证数列中各个指标值的_______是编制时间数列的最主要规则。

2.根据采用的基期不同,增长量可以分为逐期增长量和_______增长量两种。

3.累积增长量等于相应的_______之和。

两个相邻的_______之差,等于相应时期的逐期增长量。

统计学第八章课后习题答案

统计学第八章课后习题答案

8.1解:建立假设: H0:μ=4.55;H1:μ≠4.55这是双侧检验,并且方差已知,检验的统计量 Z 值为:=-1.833而=1.96>|-1.833|,因此不能拒绝原假设,即可认为现在生产的铁水平均含碳量为 4.558.2解:建立假设: H0:μ≥700;H1:μ<700这是左侧检验,并且方差已知,检验统计量 Z 为:Z==-2而-=-1.645>-2,因此拒绝原假设,即在显著性水平 0.05 下这批元件是不合格的。

8.3解:建立假设: H0:μ≤250;H1:μ>250这是右侧检验,并且方差已知,检验的统计量 Z 值为:Z==3.33 而=1.645<3.33,因此拒绝原假设,即这种化肥使小麦明显增产。

8.4解:建立假设: H0:μ=100;H1:μ≠1009/108.055.4484.4−=Z Z 025.036/60700680−Z 05.025/30250270−Z05.0由样本数据可得: ==99.978S===1.212这是双侧检验,并且方差未知,又是小样本,故采用 t 统计量,检验统计量的值为: t==-0.054而(8)=2.306>|-0.054|,因此不拒绝原假设,即该日打包机工作正常8.5、由题意先建立假设,显然不符合标准的比例越小越好,由于采用的是产品质量抽查,即使总体不合标准的比例没有超过5%,属于合格范围,采用右单侧检验。

P=6/50=12%属于单侧检验,当α=0.05时,有,因此拒绝原假设,即认为该批食品不能出厂n X ni ix∑==195.100....7.983.99+++1)(12−−∑=n x ni i x 8)978.995.100(...978.99-7.98978.99-3.99222−+++)()(9/2122.1100-978.99t025.0%5:%,5:1>≤ππH H o 27.250%)51(%5%5%12=−−−=Z 27.2645.105.0<=Z8.6、由题意建立假设:单侧检验,并且方差未知,n=15,属于小样本,故采用t 统计量,检验统计量的值为:α=0.05,,因此不能拒绝原假设,认为该厂家的广告不真实8.7、建立假设:,由样本数据可以得出,这是单侧检验,并且方差未知,是小样本,因此采用t 检验量,检验统计量的值为25000:,25000:10>≤μμH H 549.115/50002500027000/0=−=−=n s x t μ549.1761.1)14(05.0>=t 225,22510>≤H H 5.24116170485 (2121012801591)=++++++==∑=nxx ni i7.9815)5.241170(....)5.241280()5.241159(12221=−++−+−=−=∑=n xs ni in s x t /μ−=669.016/7.982255.241=−=通过查表可得出,,因此不能拒绝原假设,没有理由认为元件的平均寿命显著地大于225小时。

贾俊平统计学第7版第八章例题课后习题

贾俊平统计学第7版第八章例题课后习题

第8章假设检验例题由统计资料得知,1989 年某地新生儿的平均体重为3190克,现从1990年的新生儿中国机抽取100个,测得其平均体重为3210克,问1990年的新生儿与1989年相比,体重有无显着差异★解:从调查结果看,1990 年新生儿的平均体重为3210克,比1989年新生儿的平均体重3190克增加了20克,但这20克的差异可能源于不同的情况。

_种情况是,1990 年新生儿的体重与1989年相比没有什么差别,20克的差异是由于抽样的随机性造成的;另一种情况是,抽样的随机性不可能造成20克这样大的差异,1990年新生儿的体重与1989年新生儿的体重相比确实有所增加。

上述问题的关键点是,20克的差异说明了什么这个差异能不能用抽样的随机性来解释为了回答这个问题,我们可以采取假设的方法。

假设1989年和1990年新生儿的体重没有显着差异,如果用μo表示1989年新生儿的平均体重,μ表示1990年新生儿的平均体重,我们的假设可以表示为μ=μ或μ心=0,现要利用1990年新生儿体重的样本信息检验上述假设是否成立。

如果成立,说明这两年新生儿的体重没有显着差异;如果不成立,说明1990年新生儿的体重有了明显增加。

在这里,问题是以假设的形式提出的,问题的解决方案是检验提出的假设是否成立。

所以假设检验的实质是检验我们关心的参数一1990 年的新生儿总体平均体重是否等于某个我们感兴趣的数值。

例某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于1 000小时,已知灯泡燃烧寿命服从正态分布,标准差为200小时。

在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡★解:这是一个单侧检验问题。

显然,如果灯泡的燃烧寿命超过了1 000小时,批发商是欢迎的,因为他用已定的价格(灯泡寿命为1 000小时的价格)购进了更高质量的产品。

因此,如果样本均值超过1000小时,他会购进这批灯泡。

统计学课后习题答案(全章节)(精品).docx

统计学课后习题答案(全章节)(精品).docx

第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。

3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。

(2)制作茎叶图,并与直方图进行比较。

1.已知下表资料:25 20 10 500 2.5 30 50 25 1500 7.5 35 80 40 2800 14 40 36 18 1440 7.2 4514 7 630 3. 15 合 计200100687034. 35_y xf 6870根据频数计算工人平均日产量:〒=金^ =北* = 34.35 (件)£f 200结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。

统计学第八章题目

统计学第八章题目

一.单项选择题1、用于测定两个变量之间密切程度的方法是〔 D 〕.A、定性判断B、相关表C、相关图D、相关系数2、产品产量与单位成本的相关系数是—0.95,单位成本与利润率的相关系数是0.90,产量与利润的相关系数是0.08,因此〔 C〕.A、产量与利润的相关程度最高B、单位成本与利润率的相关程度最高C、产量与单位成本的相关程度最高D、无法判断哪对变量的相关程度最高3、相关系数的取值X围是〔 D 〕.A、0≤r≤1B、-1≤r≤0C、r>0D、-1≤r≤14、变量x与y之间的负相关是指〔C 〕.A、x值增大时y值也随之增大B、x值减少时y值也随之减少C、x值增大时y值随之减少,或x值减少时y值随之增大D、y的取值几乎不受x取值的影响5、两个变量之间的相关关系称为〔 B 〕.A、复相关B、单相关C、曲线相关D、直线相关6、、正方形的边长与周长的相关系数为〔 A 〕.A、1B、-1C、0D、无法计算7、在一元线性回归方程中,回归系数b的含义是< B >.A 、当x=0时,y 的平均值B 、当x 变动一个单位时,y 的平均变动数额C 、当x 变动一个单位时,y 增加的总数额D 、当y 变动一个单位时,x 的平均变动数额8、常用的求解一元线性回归方程的方法是< B >.A 、相关系数法B 、最小平方法C 、误差绝对值最小法D 、误差和最小法9、下列回归方程与相关系数的对应式中,错误的是〔 C 〕A 、89.0,5.2170ˆ-=-=r x yB 、94.0,8.35ˆ-=--=r x yC 、78.0,5.036ˆ-=+=r x yD 、98.0,9.25ˆ=+-=r x y 10、已知变量x 与y 线性相关,x 与y 的协方差为-60,x 的方差为64,y的方差为去100,则二者的相关系数的值为〔 B 〕.A 、0.75B 、-0.75C 、0.1D 、-0.111、已知变量x 与y 高度线性相关,x 与y 的协方差为-60,x 的方差为64,y 的方差为去100,则建立的y 依x 回归方程中的回归系数b的值为〔 B 〕.A 、0.94B 、-0.94C 、0.6D 、-0.612、若相关系数为正值,则回归系数的值〔 B 〕.A 、为负B 、为正C 、视a 的符号而定D 、不能确定13、回归估计标准误差是说明〔 C 〕的指标.A 、平均数代表性B 、现象之间相关程度C、回归直线代表性D、抽样误差平均程度14、已知变量x与y线性相关,x与y的协方差为-60,x的方差为100,y的方差为去64,建立了y依x的回归方程,则回归估计标准误差的值可能为〔 A 〕.A.-3.8B.0C.4.7D.8.915、进行回归分析,要求两个变量〔 C 〕.A、都是随机的B、都不是随机的C、一个是随机的,一个是给定的D、随机或不随机都可以二.多项选择题1.呈相关关系的各变量之间〔 A、B、D 〕A.一定存在严格的依存关系B.存在关系,但不确定C.存在着明显的因果关系D.存在着不固定的依存关系D.以上说法都不对2.直线积差相关系数可以表明两个变量之间的〔D、E 〕A.线性相关程度 B 因果关系 C.变异程度D.相关方向E.曲线相关密切程度3.可用来判断变量之间相关方向的指标有〔A、B〕A.相关系数B.回归系数C.回归方程参数D.估计标准误差E.x,y的平均数4.如果相关系数为0,则两变量〔 A、D 〕A.无直线相关B.呈负线性相关C.呈正线性相关D.可能存在曲线相关E.无线性相关,也无非线性相关5.回归系数和相关系数〔 A、C 〕A.一个为正值,另一个肯定也为正值B.一个为正值,另一个肯定为负值C.前者的取值X围为〔-∞,∞〕,后者的取值X围为〔-1,1〕D.前者的取值X围为〔-1,1〕,后者的取值X围为〔-∞,∞〕E.两者没有关系6.估计标准误差是反映〔 A、C、D 〕的指标.A.回归方程代表性B.自变量数列的离散程度C.因变量数列的离散程度D.因变量估计值的可靠程度E.因变量数列的集中程度7.相关系数的绝对值的大小〔 B、C〕A、和回归系数的绝对值呈反向关系B、和回归系数的绝对值呈正向关系C、和回归估计标准误差呈反向关系D、和回归估计标准误差呈正向关系E、和回归系数的绝对值没有关系8.若所有的观测点都落在回归直线上,则〔A、B、D〕A、相关系数可能为+1B、相关系数可能为-1C、两变量之间呈线性函数关系D、两变量之间呈完全相关关系E、相关系数可能为0.859.建立一元回归方程是为了〔 A 、B 〕A 、确定两个变量之间的数量关系B 、用自变量推算因变量C 、用于两个变量互相推算 D 、确定两个变量的相关程度E 、以上说法都对10.成本依产量回归方程bx a y+=ˆ中〔 A 、C 、D 〕 A 、x 代表产量 B 、y 代表产量 C 、b 叫作回归系数D 、b 代表x 增加一个单位时,y 平均增加b 个单位E 、b 代表y 增加一个单位时,x 平均增加b 个单位11.用最小平方法拟合的趋势线,必须满足〔 B 、D 〕A 、∑=-0)ˆ(yy B 、∑-)ˆ(y y 最小 C 、∑-)ˆ(y y 最大 D 、2)ˆ(∑-yy 最小 E 、2)ˆ(∑-y y 最大 三、判断题1.施肥量与收获率是正相关关系.〔 ×〕2.计算相关系数的两个变量都是随机变量.< × >3.当直线相关系数为0时,表明两个变量之间存在负相关关系.〔 ×〕4.若直线回归方程为ŷ=17+2.5X,则变量X 与Y 之间存在负相关关系.〔 ×〕5.计算相关系数是测定相关系数的唯一方法.〔×〕6.利用一个回归方程,两个变量可以互相推算.〔 ×〕7.回归估计标准误差指的就是实际值y 与估计值yˆ的平均误差程度.〔 √ 〕8.回归系数b 和相关系数r 都可以用来判断现象之间相关的密切程度.〔√〕9.在一元回归分析中,两个变量是对等的关系,不需要区分自变量和因变量.〔×〕10.回归估计标准误差的值越大,表明回归方程的代表性越低.〔√〕四、简答题1.相关关系与函数关系有何区别与联系?答:<1>区别:具有相关关系的变量之间的数量关系不确定,而具有函数关系的变量之间的数量关系是确定的.〔2〕__函数关系往往通过相关关系表现出来,相关关系也常常借助函数关系的方式进行研究.由于认识局限和测量误差等原因,确定性的函数关系在实际中往往表现为相关关系;反之,当人们对事物的内部规律了解得更深刻的时候,相关关系又可能转化为确定性的函数关系.2.简述相关关系的判别方法.答:〔1〕按现象相关的因素多少划分为单相关和负相关;〔2〕按现象之间的相关方向划分正相关与负相关;〔3〕按现象之间相关的形式划分为直线相关与曲线相关;〔4〕按现象之间相关的程度划分为不相关、完全相关和不完全相关.3.说明相关系数的取值X围与其判断标准.答:〔1〕相关系数的值在-1和+1之间,其绝对值越接近1,表示相关程度越高;〔2〕相关系数大于0,表示正相关;相关系数小于0,表示负相关. 〔3〕相关系数等于0,表示两个变量之间不存在直线相关,但并不表明两变量之间没有其他形式的相关关系.〔4〕|r| =1,表示存在完全直线相关;0<|r|<0.3,表示存在微弱直线相关;0.3≤|r|<0.5,表示存在低度直线相关;0.5≤|r|<0.8,表示存在显著直线相关;0.8≤|r|<1,表示存在高度直线相关.4.什么是估计标准误差?有什么作用?答:估计标准误差:是因变量的实际值与估计值得标准差,即以回归直线为中心反映各实际值与估计值之间的平均误差程度.作用:可以衡量回归方程的代表性大小.越小Sy,表明实际观测点与所拟合的回归线的离差越小,即回归线有较强的代表性;反之,其越大,表明实际观测点与所拟合的回归线的离差越大,即回归线的代表性较差.5.应用相关分析与回归分析应注意哪些问题?答:应用相关分析时,判断现象之间是否存在依存关系是相关分析的起始点.只有存在相互依存关系,才有必要和可能进行相关分析.应用回归分析时,回归分析是近似地表示变量间的平均变化关系.6.相关分析与回归分析有何区别?答:〔1〕相关分析不说明谁是自变量,谁是因变量;而回归分析必须首先要确定谁是自变量,谁是因变量,不能颠倒.〔2〕相关分析中每一个变量都是随机的;回归分析中的自变量是一般变量,因变量是随机变量.五、综合题1.在其他条件不变的情况下,某种商品的需求量〔y 〕与该商品的价格〔x 〕有关.现对给定时期内的价格与需求量进行观察,得到如下所示的一组数据:要求:(1) 计算价格与需求量之间的简单相关系数,并说明相关方向和程度;解:相关系数r==---∑∑∑∑∑∑∑2222)()(y y n x x n y x xy n 364816369680883692005677655640---=-0.854属于负相关;属于高度直线相关.(2) 拟合需求量对价格的回归直线,并解释回归系数的实际含义.解:设,bx a y +=^则,b=∑∑∑∑∑--22)(x x n yx xy n =883692005677655640--=121.3- a=---x b y=73.89=-∑∑n x b n y 则x y 121.373.89^-=该方程表明,该商品的价格每增加1元,商品的需求量就降3.121吨;该商品价格为0时,其固定的需求量为89.73吨.2.某地区家计调查资料显示,每户平均年收入为8800元,方差为4500元,每户平均年消费支出为6000元,均方差60元,支出对收入的回归系数为0.8.要求:(1) 计算相关系数;(2) 拟合支出对收入的回归方程.解:〔1〕设年收入为x,年消费支出为y,则,由题可知:设收入与消费支出之间的回归方程为: 则104088008.06000-=⨯-=-=x b y a所以,收入与消费支出之间的回归方程为: <2>回归系数b=0.8 =-x 8800,6000=-y .回归方程为 bx a y +=^ a=---x b y 可得a=1040即支出对收入的回归方程为x y 8.01040^+-= 3.下面是一个企业的广告费支出与销售额资料:单位:万元要求:〔1〕计算广告费支出与销售额间的相关系数;<2>若下月投资700万元的广告费,估计销售额的区间X 围是多少?设 用x y 分别表示广告费、销售额:由题意得;2500=∑x 25000=∑y由广告费与销售额可建立一元线性回归方程则 bx a y+=ˆ ∑∑∑∑∑--=x x n n b xy x y22)(2 =62500001450000525002500138000005-⨯⨯-⨯ =6.5 a=y - b x =5.652500525000⨯-=1750 y ˆ=1750+6.5x 当x=700时,yˆ=1750+6.5⨯700=6300〔万元〕 所以销售额的区间X 围是6300万元.4.检查五位学生"统计学原理〞的学习时间成绩如下所示:广告费 销售额 广告费 1 销售额 0.817265 1(1)计算学习时数与学习成绩之间的相关系数;解:学习时数和学习成绩之间的相关系数为:0.955779009 如图所示:(2)建立学习成绩〔y 〕与学习时间〔x 〕的直线回归方程;解:直线回归方程为:4.202.5ˆ+=x y 如图所示:(3)解释回归系数的含义; 660 750 1070 15 90解:回归系数是指X 每变化一个单位,y 的平均变化值本题是指学习成绩每增加一个小时,y 的平均变化值为5.2分.(4)计算回归估计标准误差.解:回归标准误差计算得: 6.53197264如图所示:5.根据某地区历年人均收入〔元〕与商品销售额〔万元〕资料计算的有关数据如下;〔x 代表人均收入,y 代表销售额〕n=9,546=∑x , 260=∑y , 343622=∑x ,16918=∑xy要求:建立以商品销售额为因变量的直线回归方程,并解释回归系数的含义.解:设=^y a+bx则,b=∑∑∑∑∑--22)(x x n y x xy n =2546343629260546169189-⨯⨯-⨯=1114210302=0.925 a=---x b y =nx b n y ∑∑- =228.279546925.09260-=⨯- 所以,=^y =-27.228+0.925x回归系数的含义:该方程表明人均收入每增加1元,商品销售额平均增加0.925万元.当人均收入为0时,商品销售额为-27.228万元.所有,翻版必究.。

贾俊平统计学第7版第八章例题课后习题

贾俊平统计学第7版第八章例题课后习题

贾俊平统计学第7版第⼋章例题课后习题第8章假设检验例题8.1由统计资料得知,1989 年某地新⽣⼉的平均体重为3190克,现从1990年的新⽣⼉中国机抽取100个,测得其平均体重为3210克,问1990年的新⽣⼉与1989年相⽐,体重有⽆显著差异?★解:从调查结果看,1990 年新⽣⼉的平均体重为3210克,⽐1989年新⽣⼉的平均体重3190克增加了20克,但这20克的差异可能源于不同的情况。

_种情况是,1990 年新⽣⼉的体重与1989年相⽐没有什么差别,20克的差异是由于抽样的随机性造成的;另⼀种情况是,抽样的随机性不可能造成20克这样⼤的差异,1990年新⽣⼉的体重与1989年新⽣⼉的体重相⽐确实有所增加。

上述问题的关键点是,20克的差异说明了什么?这个差异能不能⽤抽样的随机性来解释?为了回答这个问题,我们可以采取假设的⽅法。

假设1989年和1990年新⽣⼉的体重没有显著差异,如果⽤µo表⽰1989年新⽣⼉的平均体重,µ表⽰1990年新⽣⼉的平均体重,我们的假设可以表⽰为µ=µ或µ⼼=0,现要利⽤1990年新⽣⼉体重的样本信息检验上述假设是否成⽴。

如果成⽴,说明这两年新⽣⼉的体重没有显著差异;如果不成⽴,说明1990年新⽣⼉的体重有了明显增加。

在这⾥,问题是以假设的形式提出的,问题的解决⽅案是检验提出的假设是否成⽴。

所以假设检验的实质是检验我们关⼼的参数⼀1990 年的新⽣⼉总体平均体重是否等于某个我们感兴趣的数值。

例8.2某批发商欲从⼚家购进⼀批灯泡,根据合同规定灯泡的使⽤寿命平均不能低于1 000⼩时,已知灯泡燃烧寿命服从正态分布,标准差为200⼩时。

在总体中随机抽取了100个灯泡,得知样本均值为960⼩时,批发商是否应该购买这批灯泡?★解:这是⼀个单侧检验问题。

显然,如果灯泡的燃烧寿命超过了1 000⼩时,批发商是欢迎的,因为他⽤已定的价格(灯泡寿命为1 000⼩时的价格)购进了更⾼质量的产品。

《统计学原理》教材课后习题参考答案

《统计学原理》教材课后习题参考答案
1.设立假设。原假设为 备择假设为
2.给定显著性水平。取显著性水平 ,由于是双侧检验,因此需要确定上下两个临界值 和 。查表得到 ,所以。拒绝区间为小于-1.96或者大于1.96。
3.检验统计量
4.检验判断。
由于z的实际值在-1.96和1.96之间,没有落入拒绝区间,所以接受原假设,认为净重是符合规定
(五)计算题
1.因为2000年计划完成相对数是110%,所以
实际产值=
2000年计划产值比1999年增长8%,
所以1999年的计划产值=
那么2000年实际产值比1999年计划产值增长=
2.(1)
从第四年第四季度到第五年第三季度这一年的时间,实际上这一年的产量达到

这一题规定年末产量应达到170,所以提前时间按照水平法来算。
3..根据题意,样本的平均数和标准差为
根据样本信息,计算统计量
4.检验判断。因为 ,所以在显著性水平0.01下,拒绝原假设,也就是说,含量是超过规定界限
第九章相关与回归
(一)判断题
1.×2.√3.√4.√5.×6.×7.×8.×
(二)单项选择题
1.① 2.① 3.③ 4.④ 5.④6.②7.②8.④
2.由题意
=8.89
3.由题意
令这个数为a。则
4.由题意
5.
销售额
售货员人数
组中值
20000-30000
30000-40000
40000-50000
50000-60000
60000-70000
70000-80000
80000以上
8
20
40
100
82
10
5
25000
35000

统计学第五版第八章课后习题答案王永

统计学第五版第八章课后习题答案王永

n1 n2 11000
合并比例 x1 x 2 293 p 0.0133 n1 n2 22000
p1=0.95%, p2=1.72% 临界值(s):
Z =) ( 1 2 ) 1 1) P (1 P ) n n 2 1



解:已知μ =250,σ =30,N=25, x =270,α =0.05 右侧检验 ∵小样本,σ 已知 ∴采用Z统计量 Z ∵α =0.05,∴ =1.645 H 0 :μ ≤250 H1 :μ >250 计算统计量:
x / n
Z
=(270-250)/(30/5)=3.33
结论: Z统计量落入拒绝域,在α=0.05的显著性水平上,拒绝 H 0 ,接 受 H1 。
决策:有证据表明,这种化肥可以使小麦明显增产。
8.4 糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验 一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下: 99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.1,100.5 已知包重服从正态分布,试检验该日打包机工作是否正常 (α=0.05) 。
甲法: 31 34 29 32 35 38 34 30 29 32 31 26 乙法: 26 24 28 29 30 29 32 26 31 29 32 28 两总体为正态总体,且方差相同。问两种方法的装配时 间有无显著差别(α =0.05)? 解: 正态总体,小样本,σ²未知但相同,独立样本t检验 0 : 甲 - = 0 H 乙 甲 H1 : - 乙≠ 0
2 2
5 1.96
nB
决策:在α = 0.05的水平上拒绝 H 0 。 结论:可以认为A、B两厂生产的材料平均抗压强度不相同。

贾平凹统计学第四版 第八章课后答案

贾平凹统计学第四版 第八章课后答案

8.01 已知某炼铁厂的含碳量服从正态分布N(4.55, 0.108),现在测定了9炉铁水,其平均含碳量为4.484。

如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4.55 (a=0.05) 。

H0: = 4.55H1: ¹ 4.55= 0.05 n = 9临界值(s): -1.96,1.96 在-1.96~1.96之间接受;否则拒绝检验统计量: =(4.484-4.55)/(0.33/3 )= -0.6 -0.6∈(-1.96,1.96)决策:在 = 0.05的水平上接受H0结论: 有证据表明现在生产的铁水平均含碳量为4.558.02 一种元件,要求其使用寿命不得低于700小时。

现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。

已知该元件寿命服从正态分布,s=60小时,试在显著性水平a=0.05下确定这批元件是否合格。

H0: <700H1: ≥700= 0.05 n = 36临界值(s):1.645 <1.645接受;否则拒绝检验统计量: =(680-700)/(60/6)=-2 -2<1.645决策:在 = 0.05的水平上接受H0结论: 有证据表明元件不合格8.03 某地区小麦的一般生产水平为亩产250公斤,其标准差为30公斤。

现用一种化肥进行试验,从25个小区抽样结果,平均产量为270公斤。

问这种化肥是否使小麦明显增产?(a=0.05) H0: ≤250H1: >250= 0.05 n = 25临界值(s):1.645 <1.645接受;否则拒绝检验统计量: =(270-250)/(30/5)=3.33 3.33>1.645决策:在 = 0.05的水平上拒绝H0结论: 有证据表明这种化肥使小麦明显增产8.04 糖厂用自动打包机打包,每包标准重量是100公斤。

每天开工后需要检验一次打包机工作是否正常。

某日开工后测得9包重量如下:99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5已知包重服从正态分布,试检验该日打包机工作是否正常?(a=0.05)H0: =100H1: ≠100= 0.05 n = 9 s=1.21 =99.98临界值(s): -2.31,2.31 在-2.31~2.231之间接受;否则拒绝检验统计量: =(99.98-100)/(1.21/3)=0.50 0.50∈(-2.31,2.31)决策:在 = 0.05的水平上接受H0结论: 有证据表明试检验该日打包机工作正常8.05 某种大量生产的袋装食品,按规定不得少于250克。

国开作业实用卫生统计学-第八章 自测练习01参考(含答案)

国开作业实用卫生统计学-第八章 自测练习01参考(含答案)

题目:以下关于非参数检验的描述错误的是?()。

选项A:应用非参数检验时不考虑被研究对象的分布类型
选项B:非参数检验方法不依赖于总体的分布类型
选项C:非参数检验的检验效能高于参数检验
选项D:非参数检验的犯第二类错误的概率高于参数检验
答案:非参数检验的检验效能高于参数检验
题目:以下检验方法中,不属于非参数检验方法的是?()
选项A:T检验
选项B:H检验
选项C:χ2检验
选项D:Z检验
答案:Z检验
题目:多个样本均数比较的假设检验,若总体方差不等且分布呈偏态,宜选用以下哪项统计推断方法?()
选项A:Z检验
选项B:F检验
选项C:H检验
选项D:t检验
答案:H检验
题目:多组资料比较的秩和检验,确定P值时,可利用查表法的情况正确的是?( )
选项A:组数3,每组例数≤5
选项B:组数≤3,每组例数≤5
选项C:组数3,每组例数5
选项D:组数≤3,每组例数5
答案:组数≤3,每组例数≤5
题目:完全随机设计的两样本比较秩和检验,其检验统计量T是( )。

选项A:以例数较小者秩和为T
选项B:以秩和较小者秩和为T
选项C:以秩和较大者秩和为T
选项D:以例数较大者秩和为T
答案:以例数较小者秩和为T
题目:完全随机设计的多个样本比较秩和检验(Kruskal-Wallis法)其检验统计量是()。

选项A:以例数较小者秩和为T
选项B:以例数较大者秩和为T
选项C:其统计量为H
选项D:以秩和较小者秩和为T
答案:以例数较小者秩和为T。

统计学_贾俊平第四版第八章课后答案(目前最全)

统计学_贾俊平第四版第八章课后答案(目前最全)

8.2 一种元件,要求其使用寿命不得低于700小时。

现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。

已知该元件寿命服从正态分布,=60小时,试在显著性水平0.05下确定这批元件是否合格。

解:H0:μ≥700;H1:μ<700已知:=680 =60由于n=36>30,大样本,因此检验统计量:==-2当α=0.05,查表得=1.645。

因为z<-,故拒绝原假设,接受备择假设,说明这批产品不合格。

8.38.4 糖厂用自动打包机打包,每包标准重量是100千克。

每天开工后需要检验一次打包机工作是否正常。

某日开工后测得9包重量(单位:千克)如下:99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5已知包重服从正态分布,试检验该日打包机工作是否正常(a=0.05)?解:H0:μ=100;H1:μ≠100经计算得:=99.9778 S=1.21221检验统计量:==-0.055当α=0.05,自由度n-1=9时,查表得=2.262。

因为<,样本统计量落在接受区域,故接受原假设,拒绝备择假设,说明打包机工作正常。

8.5 某种大量生产的袋装食品,按规定不得少于250克。

今从一批该食品中任意抽取50袋,发现有6袋低于250克。

若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(a=0.05)?解:解:H0:π≤0.05;H1:π>0.05已知:p=6/50=0.12检验统计量:==2.271当α=0.05,查表得=1.645。

因为>,样本统计量落在拒绝区域,故拒绝原假设,接受备择假设,说明该批食品不能出厂。

8.68.7 某种电子元件的寿命x(单位:小时)服从正态分布。

现测得16只元件的寿命如下:159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命显著地大于225小时(a=0.05)?解:H0:μ≤225;H1:μ>225经计算知:=241.5 s=98.726检验统计量:==0.669当α=0.05,自由度n-1=15时,查表得=1.753。

统计学各章习题及答案

统计学各章习题及答案

统计学习题目录第一章绪论 _________________________________________________ 2第二章数据的收集与整理 _____________________________________ 4第三章统计表与统计图 _______________________________________ 6第四章数据的描述性分析 _____________________________________ 8第五章参数估计 ____________________________________________ 12第六章假设检验 ____________________________________________ 16第七章方差分析 ____________________________________________ 20第八章非参数检验 __________________________________________ 23第九章相关与回归分析 ______________________________________ 26第十章多元统计分析 ________________________________________ 30第十一章时间序列分析 ______________________________________ 34第十二章指数 ______________________________________________ 37第十三章统计决策 __________________________________________ 41第十四章统计质量管理 ______________________________________ 44第一章绪论习题一、单项选择题1. 推断统计学研究(D)。

A.统计数据收集的方法B.数据加工处理的方法C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法2. 在统计史上被认为有统计学之名而无统计学之实的学派是( D )。

国开作业实用卫生统计学-第八章 完全随机设计数值变量资料的秩和检验 自测练习40参考(含答案)

国开作业实用卫生统计学-第八章 完全随机设计数值变量资料的秩和检验 自测练习40参考(含答案)

题目:下面四个秩和检验结果错误的是?()选项A:n1=10,n2=10,T1=55,T2=155,查的T0.05=78~132,P0.05选项B:n1=9,n2=13,T1=58,T2=195,查的T0.05=73~134,P0.05选项C:配对设计, n=12,T+=7,T-=71,查的T0.05=13~65,P0.05选项D:配对设计,n=8,T+=12,T-=24,查的T0.05=3~33,P0.05答案:配对设计,n=8,T+=12,T-=24,查的T0.05=3~33,P0.05题目:两样本比较的秩和检验中,备择假设是?()选项A:差值总体的中位数不等于零选项B:两个样本的总体分布不同选项C:两个样本的样本分布相同选项D:两个样本的总体均数不同答案:两个样本的总体分布不同题目:多个样本的秩和检验的无效假设是指?()选项A:多个样本的总体均数不相同选项B:多个样本的总体分布不相同选项C:多个样本的总体分布相同选项D:多个样本的总体均数相同答案:多个样本的总体分布相同题目:多样本比较的秩和检验中,各样本所含相同数值的个数较多时(相同秩),应对H值进行校正,计算Hc。

一般规定相同秩的个数超过所占总数的多少比例时就需要校正?()选项A:35%选项B:15%选项C:25%选项D:45%答案:25%题目:对完全随机两样本比较的秩和检验,描述不正确的是?()选项A:遇有相同数据,若不在同一组,按顺序编秩选项B:两组数据统一由小到大编秩选项C:遇有相同数据,若不在同一组,取其平均秩次选项D:遇有相同数据,若在同一组,按顺序编秩答案:遇有相同数据,若不在同一组,按顺序编秩题目:多个样本均数比较的秩和检验有正态近似法一种计算方法选项A:对选项B:错答案:错题目:完全随机设计的两样本比较秩和检验有两种计算方法:查表法和正态近似法。

其中查表法适用于小样本资料(n£50)。

若n50超出查表范围时,则采用正态近似法的Z检验公式,因为大样本时统计量T值经变换后服从标准正态分布。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一.单项选择题1、用于测定两个变量之间密切程度的方法是( D )。

A、定性判断B、相关表C、相关图D、相关系数2、产品产量与单位成本的相关系数是—,单位成本与利润率的相关系数是,产量与利润的相关系数是,因此( C)。

A、产量与利润的相关程度最高B、单位成本与利润率的相关程度最高C、产量与单位成本的相关程度最高D、无法判断哪对变量的相关程度最高3、相关系数的取值范围是( D )。

A、0≤r≤1B、-1≤r≤0C、r>0D、-1≤r ≤14、变量x与y之间的负相关是指( C )。

A、x值增大时y值也随之增大B、x值减少时y值也随之减少C、x值增大时y值随之减少,或x值减少时y值随之增大D、y的取值几乎不受x取值的影响5、两个变量之间的相关关系称为( B )。

A、复相关B、单相关C、曲线相关D、直线相关6、、正方形的边长与周长的相关系数为( A )。

A、1B、-1C、0D、无法计算7、在一元线性回归方程中,回归系数b 的含义是( B )。

A 、当x=0时,y 的平均值B 、当x 变动一个单位时,y 的平均变动数额C 、当x 变动一个单位时,y 增加的总数额D 、当y 变动一个单位时,x 的平均变动数额8、常用的求解一元线性回归方程的方法是( B )。

A 、相关系数法B 、最小平方法C 、误差绝对值最小法D 、误差和最小法9、下列回归方程与相关系数的对应式中,错误的是( C )A 、89.0,5.2170ˆ-=-=r x yB 、94.0,8.35ˆ-=--=r x yC 、78.0,5.036ˆ-=+=r x yD 、98.0,9.25ˆ=+-=r x y 10、已知变量x 与y 线性相关,x 与y 的协方差为-60,x 的方差为64,y 的方差为去100,则二者的相关系数的值为( B )。

A 、B 、C 、D 、11、已知变量x 与y 高度线性相关,x 与y 的协方差为-60,x的方差为64,y 的方差为去100,则建立的y 依x 回归方程中的回归系数b 的值为( B )。

A 、B 、C 、D 、12、若相关系数为正值,则回归系数的值( B )。

A 、为负B 、为正C 、视a 的符号而定D 、不能确定13、回归估计标准误差是说明( C )的指标。

A、平均数代表性B、现象之间相关程度C、回归直线代表性D、抽样误差平均程度14、已知变量x与y线性相关,x与y的协方差为-60,x的方差为100,y的方差为去64,建立了y依x的回归方程,则回归估计标准误差的值可能为( A )。

15、进行回归分析,要求两个变量( C )。

A、都是随机的B、都不是随机的C、一个是随机的,一个是给定的D、随机或不随机都可以二.多项选择题1.呈相关关系的各变量之间( A、B、D )A.一定存在严格的依存关系B.存在关系,但不确定C.存在着明显的因果关系D.存在着不固定的依存关系D.以上说法都不对2.直线积差相关系数可以表明两个变量之间的(D、E )A.线性相关程度 B 因果关系 C.变异程度D.相关方向E.曲线相关密切程度3.可用来判断变量之间相关方向的指标有(A、B)A.相关系数B.回归系数C.回归方程参数D.估计标准误差,y的平均数4.如果相关系数为0,则两变量( A、D )A.无直线相关B.呈负线性相关C.呈正线性相关D.可能存在曲线相关E.无线性相关,也无非线性相关5.回归系数和相关系数( A、C )A.一个为正值,另一个肯定也为正值B.一个为正值,另一个肯定为负值C.前者的取值范围为(-∞,∞),后者的取值范围为(-1,1)D.前者的取值范围为(-1,1),后者的取值范围为(-∞,∞)E.两者没有关系6.估计标准误差是反映( A、C、D )的指标。

A.回归方程代表性B.自变量数列的离散程度C.因变量数列的离散程度D.因变量估计值的可靠程度E.因变量数列的集中程度7.相关系数的绝对值的大小( B、C)A、和回归系数的绝对值呈反向关系B、和回归系数的绝对值呈正向关系C、和回归估计标准误差呈反向关系D、和回归估计标准误差呈正向关系E、和回归系数的绝对值没有关系8.若所有的观测点都落在回归直线上,则(A、B、D)A、相关系数可能为+1B、相关系数可能为-1C 、两变量之间呈线性函数关系D 、两变量之间呈完全相关关系E 、相关系数可能为9.建立一元回归方程是为了( A 、B )A 、确定两个变量之间的数量关系B 、用自变量推算因变量C 、用于两个变量互相推算 D 、确定两个变量的相关程度E 、以上说法都对10.成本依产量回归方程bx a y+=ˆ中( A 、C 、D ) A 、x 代表产量 B 、y 代表产量 C 、b 叫作回归系数D 、b 代表x 增加一个单位时,y 平均增加b 个单位E 、b 代表y 增加一个单位时,x 平均增加b 个单位11.用最小平方法拟合的趋势线,必须满足( B 、D )A 、∑=-0)ˆ(yy B 、∑-)ˆ(y y 最小 C 、∑-)ˆ(y y 最大 D 、2)ˆ(∑-yy 最小 E 、2)ˆ(∑-y y 最大三、判断题1.施肥量与收获率是正相关关系。

( ×)2.计算相关系数的两个变量都是随机变量。

( × )3.当直线相关系数为0时,表明两个变量之间存在负相关关系。

( ×)4.若直线回归方程为ŷ=17+,则变量X 与Y 之间存在负相关关系。

( ×)5.计算相关系数是测定相关系数的唯一方法。

(×)6.利用一个回归方程,两个变量可以互相推算。

(×)7.回归估计标准误差指的就是实际值y与估计值yˆ的平均误差程度。

(√)8.回归系数b和相关系数r都可以用来判断现象之间相关的密切程度。

(√)9.在一元回归分析中,两个变量是对等的关系,不需要区分自变量和因变量。

(×)10.回归估计标准误差的值越大,表明回归方程的代表性越低。

(√)四、简答题1.相关关系与函数关系有何区别与联系答:(1)区别:具有相关关系的变量之间的数量关系不确定,而具有函数关系的变量之间的数量关系是确定的。

(2)联系:函数关系往往通过相关关系表现出来,相关关系也常常借助函数关系的方式进行研究。

由于认识局限和测量误差等原因,确定性的函数关系在实际中往往表现为相关关系;反之,当人们对事物的内部规律了解得更深刻的时候,相关关系又可能转化为确定性的函数关系。

2.简述相关关系的判别方法。

答:(1)按现象相关的因素多少划分为单相关和负相关;(2)按现象之间的相关方向划分正相关与负相关;(3)按现象之间相关的形式划分为直线相关与曲线相关;(4)按现象之间相关的程度划分为不相关、完全相关和不完全相关。

3.说明相关系数的取值范围及其判断标准。

答:(1)相关系数的值在-1和+1之间,其绝对值越接近1,表示相关程度越高;(2)相关系数大于0,表示正相关;相关系数小于0,表示负相关。

(3)相关系数等于0,表示两个变量之间不存在直线相关,但并不表明两变量之间没有其他形式的相关关系。

(4)|r| =1,表示存在完全直线相关;0<|r|<,表示存在微弱直线相关;≤|r|<,表示存在低度直线相关;≤|r|<,表示存在显著直线相关;≤|r|<1,表示存在高度直线相关。

4.什么是估计标准误差有什么作用答:估计标准误差:是因变量的实际值与估计值得标准差,即以回归直线为中心反映各实际值与估计值之间的平均误差程度。

作用:可以衡量回归方程的代表性大小。

越小Sy,表明实际观测点与所拟合的回归线的离差越小,即回归线有较强的代表性;反之,其越大,表明实际观测点与所拟合的回归线的离差越大,即回归线的代表性较差。

5.应用相关分析与回归分析应注意哪些问题答:应用相关分析时,判断现象之间是否存在依存关系是相关分析的起始点。

只有存在相互依存关系,才有必要和可能进行相关分析。

应用回归分析时,回归分析是近似地表示变量间的平均变化关系。

6.相关分析与回归分析有何区别答:(1)相关分析不说明谁是自变量,谁是因变量;而回归分析必须首先要确定谁是自变量,谁是因变量,不能颠倒。

(2)相关分析中每一个变量都是随机的;回归分析中的自变量是一般变量,因变量是随机变量。

五、综合题1.在其他条件不变的情况下,某种商品的需求量(y)与该商品的价格(x)有关。

现对给定时期内的价格与需求量进行观察,得到如下所示的一组数据:要求:(1)计算价格与需求量之间的简单相关系数,并说明相关方向和程度;解:相关系数r==---∑∑∑∑∑∑∑2222)()(y y n x x n yx xy n 364816369680883692005677655640---=属于负相关;属于高度直线相关.(2) 拟合需求量对价格的回归直线,并解释回归系数的实际含义。

解:设,bx a y +=^则,b=∑∑∑∑∑--22)(x x n y x xy n =883692005677655640--=121.3- a=---x b y =73.89=-∑∑n x b n y 则x y 121.373.89^-=该方程表明,该商品的价格每增加1元,商品的需求量就降吨;该商品价格为0时,其固定的需求量为吨。

2.某地区家计调查资料显示,每户平均年收入为8800元,方差为4500元,每户平均年消费支出为6000元,均方差60元,支出对收入的回归系数为。

要求:(1) 计算相关系数;(2) 拟合支出对收入的回归方程。

解:(1)设年收入为x ,年消费支出为y ,则,由题可知:60,4500,6000,8800====y x y x σσ设收入与消费支出之间的回归方程为:8.0,ˆ=+=b bx a y则104088008.06000-=⨯-=-=x b y a所以,收入与消费支出之间的回归方程为:x y 8.01040ˆ+-=(2)回归系数b= =-x 8800,6000=-y 。

回归方程为 bx a y +=^ a=---x b y 可得a=1040即支出对收入的回归方程为x y 8.01040^+-= 3.下面是一个企业的广告费支出与销售额资料:单位:万元要求:(1)计算广告费支出与销售额间的相关系数;广告费 1 销售额 1(2)若下月投资700万元的广告费,估计销售额的区间范围是多少设 用x y 分别表示广告费、销售额: 由题意得;2500=∑x 25000=∑y14500002=∑x 13800000=∑xy由广告费与销售额可建立一元线性回归方程则 bx a y+=ˆ ∑∑∑∑∑--=xx n n b xy x y 22)(2=62500001450000525002500138000005-⨯⨯-⨯ =a=y - b x =5.652500525000⨯-=1750 y ˆ=1750+ 当x=700时,yˆ=1750+⨯=6300(万元) 所以销售额的区间范围是6300万元。

相关文档
最新文档