《统计学》-第7章-习题答案
梁前德《统计学》(第二版)学习指导与习题训练答案:07第七章 假设检验与方差分析 习题答案
旗开得胜1第七章 假设检验与方差分析 习题答案一、名词解释用规范性的语言解释统计学中的名词。
1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。
2. 原假设:又叫零假设或无效假设,是待检验的假设,表示为 H 0,总是含有等号。
3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。
4. 单侧检验:备择假设符号为大于或小于时的假设检验。
5. 显著性水平:原假设为真时,拒绝原假设的概率。
6. 方差分析:是检验多个总体均值是否相等的一种统计分析方法。
二、填空题根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。
1. u ,nx σμ0-,标准正态; ),(),(2/2/+∞--∞nz nz σσααY2. 参数检验,非参数检验3. 弃真,存伪4. 方差旗开得胜25. 卡方, F6. 方差分析7. t ,u8. nsx 0μ-,不拒绝9. 单侧,双侧10.新产品的废品率为5% ,0.01 11.相关,总变异,组间变异,组内变异12.总变差平方和=组间变差平方和+组内变差平方和 13.连续,离散 14.总体均值 15.因子,水平 16.组间,组内 17.r-1,n-r18. 正态,独立,方差齐三、单项选择从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。
1.B 2.B 3. B 4.A 5.C 6.B 7.C 8.A 9.D 10.A 11.D 12.C四、多项选择从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。
1.AC 2.A 3.B 4.BD 5. AD五、判断改错对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。
1. 在任何情况下,假设检验中的两类错误都不可能同时降低。
( ×)样本量一定时2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t检验均可使用,且两者检验结果一致。
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第7章 参数估计)【圣才出品】
第7章参数估计7.1 考点归纳【知识框架】【考点提示】(1)置信区间的含义理解(选择题、简答题考点);(2)估计量的三个评价标准(判断题、填空题、简答题考点);(3)区间估计的步骤(简答题考点)、总体参数的区间估计选择恰当的统计量(计算题考点);(4)必要样本容量的影响因素、计算(简答题、计算题考点)。
【核心考点】考点一:参数估计的基本原理1.置信区间(1)置信水平为95%的置信区间的含义:用某种方法构造的所有区间中有95%的区间包含总体参数的真值。
(2)置信度愈高(即估计的可靠性愈高),则置信区间相应也愈宽(即估计准确性愈低)。
(3)置信区间的特点:置信区间受样本影响,具有随机性,总体参数的真值是固定的。
一个特定的置信区间“总是包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题。
2.评价估计量的标准(1)无偏性:估计量抽样分布的期望值等于被估计的总体参数,即E(θ∧)=θ。
(2)有效性:估计量的方差尽可能小。
(3)一致性:随着样本量的增大,估计量的值越来越接近被估计总体的参数。
【提示】本考点常见考查方式:①直接考查置信水平为95%的置信区间的含义;②置信度、估计可靠性、置信区间的关系及应用;③置信区间的特点;④给出估计量的具体含义,判断体现了什么标准;⑤直接回答估计量的三个评价标准及具体含义(简答题)。
考点二:一个总体参数的区间估计表7-1 一个总体参数的区间估计【总结】一个总体参数的估计及所使用的分布见图7-1:图7-1 一个总体参数的估计及所使用的分布【真题精选】设总体X~N(μ,σ2),σ2已知,样本容量和置信水平固定,对不同的样本观测值,μ的置信区间的长度()。
[对外经济贸易大学2018研]A.变长B .变短C .保持不变D .不能确定 【答案】C【解析】在正态总体方差已知的条件下,μ的置信区间为/2x z ±ασ所以置信区间长度为/22Z α,当样本容量和置信水平固定时,置信区间长度保持不变。
《统计学原理》第七章习题 河南电大 贾天骐解析
《统计学原理》第七章习题河南电大 贾天骐一.判断题部分题目1: 负相关指的是因素标志与结果标志的数量变动方向是下降的。
( )答案:×题目2: 相关系数为+1时,说明两变量完全相关;相关系数为-1时,说明两个变量不相关。
( )答案: √题目3: 只有当相关系数接近+1时,才能说明两变量之间存在高度相关关系。
( )答案: ×题目4: 若变量的值增加时,变量的值也增加,说明与之间存在正相关关系;若变量的值减少时,变量的值也减少,说明与之间存在负相关关系。
( )答案: ×题目5: 回归系数和相关系数都可以用来判断现象之间相关的密切程度。
( )答案: ×题目6: 根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。
( )答案: √题目7: 回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。
( )答案: ×题目8: 在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。
( )答案: ×题目9: 产品产量随生产用固定资产价值的减少而减少,说明两个变量之间存在正相关关系。
( )答案: √题目10: 计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。
( )答案: ×题目11: 完全相关即是函数关系,其相关系数为±1。
( )答案:√题目12: 估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。
( )答案 ×二.单项选择题部分题目1:当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于( )。
A.相关关系B.函数关系C.回归关系D.随机关系答案:B题目2:现象之间的相互关系可以归纳为两种类型,即( )。
A.相关关系和函数关系B.相关关系和因果关系C.相关关系和随机关系D.函数关系和因果关系答案:A题目3:在相关分析中,要求相关的两变量( )。
《统计学原理》课后习题答案
第一章练习题参考答案一.单项选择题1.B;2.A;3.B;4.C;5.D;6.A;7.C;8.C;9.C;10.A;11.C;12.C。
二.多项选择题1.ABDE;2.ACD;3.BCD;4.ACD;5.ACDE;6.ACE;7.AD;8.ABC;9.ACD;10.AD;11.BCDE;12.ABCDE;13.AC。
三.判断题1.×;2.×;3.×;4.×;5.√;6.×;7.×;8.√;9.×;10.√。
第二章练习题参考答案一.单项选择题1.C;2.C;3.D;4.B;5.D;6.D;7.B;8.D;9.B;10.B;11.A;12.C;13.D。
二.多项选择题1.CE;2.ACE;3.CE;4.BCD;5.ABCE;6.BC;7.BCD;8.ABD;9.ABD;10.ACDE;11.ABCE;12.ABE。
三.判断题1.×;2.√;3.×;4.×;5.×;6.×;7.√;8.×;9.×;10.×。
第三章练习题参考答案一.单项选择题1.B;2.C;3.C;4.C;5.D;6.B;7.B;8.B;9.D;10.B;11.A;12.B;13.D;14.A。
二.多项选择题1.AB;2.AC;3.AB;4.ABC;5.AB;6.ABD;7.ABC;8.ACE;9.BD;10.ABDE。
三.判断题1.√;2.×;3.×;4.×;5.√;6.×;7.√;8.√;9.×;10.×。
四.计算分析题1.解:(1)按职称编制的分配数列2.解:编制单项式变量数列3.解:(1)编制组距式变量数列。
(2直方图(略)第四章练习题参考答案一.单项选择题1.C;2.D;3.B;4.D;5.C;6.A;7.C;8.C;9.B;10.C;11.B;12.D;13.A;14.D;15.16.B;17.B;18.D;19.C;20.C;21.D;22.B;23.C;24.C;25.B。
《统计学》(贾俊平第七版)课后题及答案-统计学课后答案第七版
第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
第四版统计学课后习题答案
第四版统计学课后习题答案《统计学》第四版统计课后思考题答案第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
统计学第七章、第八章课后题答案
统计学复习笔记第七章 参数估计一、 思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3. 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。
5. 简述样本量与置信水平、总体方差、估计误差的关系。
1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=▪ 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪ 与总体方差成正比,总体的差异越大,所要求的样本量也越大;▪ 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
大学统计学第七章练习题及标准答案
第7章 参数估计练习题7.1 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。
(1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,边际误差是多少? 解:⑴已知25,40,5===x n σ样本均值的抽样标准差79.0410405≈===nx σσ ⑵已知5=σ,40=n ,25=x ,410=x σ,%951=-α 96.1025.02==∴Z Z α边际误差55.1410*96.12≈==nZ E σα 7.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求边际误差;(3) 如果样本均值为120元,求总体均值μ的95%的置信区间。
解.已知.根据查表得2/αz =1.96 (1)标准误差:14.24915===nX σσ(2).已知2/αz =1.96所以边际误差=2/αz *=ns 1.96*4915=4.2(3)置信区间:)(2.124,8.11596.149151202=*±=±ns Z x α7.3 从一个总体中随机抽取100=n 的随机样本,得到104560=x ,假定总体标准差85414=σ,构建总体均值μ的95%的置信区间。
96.12=∂Z144.1674110085414*96.12==⋅∂nZ σ856.87818144.16741104560.2=-=-∂nZ x σ144.121301144.16741104560.2=+=+∂nZ x σ置信区间:(87818.856,121301.144)7.4 从总体中抽取一个100=n 的简单随机样本,得到81=x ,12=s 。
(1) 构建μ的90%的置信区间。
(2) 构建μ的95%的置信区间。
(3) 构建μ的99%的置信区间。
《统计学原理》第七章习题河南电大贾天骐
《统计学原理》第七章习题河南电大贾天骐一.判断题部分题目1:负相关指的是因素标志与结果标志的数量变动方向是下降的。
()答案:×题目2:相关系数为+1时,说明两变量完全相关;相关系数为-1时,说明两个变量不相关。
()答案:√题目3:只有当相关系数接近+1时,才能说明两变量之间存在高度相关关系。
()答案:×题目4:若变量x的值增加时,变量y的值也增加,说明x与y之间存在正相关关系;若变量x的值减少时,y变量的值也减少,说明x与y之间存在负相关关系。
()答案:×题目5:回归系数和相关系数都可以用来判断现象之间相关的密切程度。
()答案:×题目6:根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。
()答案:√题目7:回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。
()答案:×题目8:在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。
()答案:×题目9:产品产量随生产用固定资产价值的减少而减少,说明两个变量之间存在正相关关系。
()答案:√题目10:计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。
()答案:×题目11:完全相关即是函数关系,其相关系数为±1。
()答案:√题目12:估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。
()答案×二.单项选择题部分题目1:当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。
A.相关关系B.函数关系C.回归关系D.随机关系答案:B题目2:现象之间的相互关系可以归纳为两种类型,即()。
A.相关关系和函数关系B.相关关系和因果关系C.相关关系和随机关系D.函数关系和因果关系答案:A题目3:在相关分析中,要求相关的两变量()。
A.都是随机的B.都不是随机变量C.因变量是随机变量D.自变量是随机变量答案:A题目4:测定变量之间相关密切程度的指标是()。
《统计学》课后练习题答案
3.4统计图的规范
3.5如何用Excel做统计图
习题
一、单项选择题
1.统计表的结构从形式上看包括()、横行标题、纵栏标题、数字资料四个部分。(知识点3.1答案:D)
A.计量单位B.附录C.指标注释D.总标题
2.如果统计表中数据的单位都一致,我们可以把单位填写在()。(知识点3.1答案:C)
A.指标B.标志C.变量D.标志值
8.以一、二、三等品来衡量产品质地的优劣,那么该产品等级是()。(知识点:1.7答案:A)
A.品质标志B.数量标志C.质量指标D.数量指标
9.()表示事物的质的特征,是不能以数值表示的。(知识点:1.7答案:A)
A.品质标志B.数量标志C.质量指标D.数量指标
10.在出勤率、废品量、劳动生产率、商品流通费用额和人均粮食生产量五个指标中,属于数量指标的有几个()。(知识点:1.7答案:B)
1.统计调查方案的主要内容是( )( )( )( )( )。(知识点2.2答案:ABCDE)
A.调查的目的B.调查对象C.调查单位D.调查时间E.调查项目
2.全国工业普查中( )( )( )( )( )。(知识点2.2答案:ABCE)
A.所有工业企业是调查对象B.每一个工业企业是调查单位C.每一个工业企业是报告单位
频数f
(棵)
频率
(%)
向上累积
向下累积
频数(棵)
频率(%)
频数(棵)
频率(%)
80-90
8
7.3
8
7.3
110
100.0
90-100
9
8.2
17
15.5
102
92.7
100-110
生物统计学(第3版)杜荣骞 课后习题答案 第七章 拟合优度检验
第七章拟合优度检验7.12000年在5 760 295名成年人群中和1 596 734名儿童群体中严重CDH(先天性心脏病)和其他程度CDH的流行病学患者数如下表[36]:尚存活的成年人 2 205 21 358 23 563尚存活的儿童 2 316 16 663 18 979 合计 4 521 38 021 42 542检验在尚存活的成年人和儿童中受损害的程度,差异是否显著?答:这是2×2列联表χ2检验,使用程序如下:options linesize=76 nodate;data;do a=1 to 2;do b=1 to 2;input case @@;output;end;end;cards;2205 213582316 16663;proc freq formchar(1,2,7)='|-+';weight case;tables a*b/cellchi2 expected nocol norow nopercent chisq;title '2*2 Contingency Table Test';run;程序运行结果见下表:2*2 Contingency Table TestTABLE OF A BY BA BFrequency |Expected |Cell Chi-Square| 1| 2| Total---------------+--------+--------+1 | 2205 | 21358 | 23563| 2504.1 | 21059 || 35.72 | 4.2474 |---------------+--------+--------+2 | 2316 | 16663 | 18979| 2016.9 | 16962 || 44.347 | 5.2733 |---------------+--------+--------+Total 4521 38021 42542STATISTICS FOR TABLE OF A BY BStatistic DF Value Prob------------------------------------------------------Chi-Square 1 89.588 0.001Likelihood Ratio Chi-Square 1 89.070 0.001Continuity Adj. Chi-Square 1 89.289 0.001Mantel-Haenszel Chi-Square 1 89.586 0.001Fisher's Exact Test (Left) 2.21E-21(Right) 1.000(2-Tail) 4.20E-21Phi Coefficient -0.046Contingency Coefficient 0.046Cramer's V -0.046Sample Size = 42542从“A×B列联表的统计量”部分可以得出,连续性矫正的χ2显著性概率P=0.001,P <0.01,故拒绝H0,在尚存活的成年人和儿童中受损害的程度差异极显著。
《统计学原理》教材课后习题参考答案
2.给定显著性水平。取显著性水平 ,由于是双侧检验,因此需要确定上下两个临界值 和 。查表得到 ,所以。拒绝区间为小于-1.96或者大于1.96。
3.检验统计量
4.检验判断。
由于z的实际值在-1.96和1.96之间,没有落入拒绝区间,所以接受原假设,认为净重是符合规定
(五)计算题
1.因为2000年计划完成相对数是110%,所以
实际产值=
2000年计划产值比1999年增长8%,
所以1999年的计划产值=
那么2000年实际产值比1999年计划产值增长=
2.(1)
从第四年第四季度到第五年第三季度这一年的时间,实际上这一年的产量达到
则
这一题规定年末产量应达到170,所以提前时间按照水平法来算。
3..根据题意,样本的平均数和标准差为
根据样本信息,计算统计量
4.检验判断。因为 ,所以在显著性水平0.01下,拒绝原假设,也就是说,含量是超过规定界限
第九章相关与回归
(一)判断题
1.×2.√3.√4.√5.×6.×7.×8.×
(二)单项选择题
1.① 2.① 3.③ 4.④ 5.④6.②7.②8.④
2.由题意
=8.89
3.由题意
令这个数为a。则
4.由题意
5.
销售额
售货员人数
组中值
20000-30000
30000-40000
40000-50000
50000-60000
60000-70000
70000-80000
80000以上
8
20
40
100
82
10
5
25000
35000
统计学课后习题答案第七章相关分析与回归分析
第七章相关分析与回归分析一、单项选择题1.相关分析是研究变量之间的A.数量关系B.变动关系C.因果关系D.相互关系的密切程度2.在相关分析中要求相关的两个变量A.都是随机变量B.自变量是随机变量C.都不是随机变量D.因变量是随机变量3.下列现象之间的关系哪一个属于相关关系A.播种量与粮食收获量之间关系B.圆半径与圆周长之间关系C.圆半径与圆面积之间关系D.单位产品成本与总成本之间关系4.正相关的特点是A.两个变量之间的变化方向相反B.两个变量一增一减C.两个变量之间的变化方向一致D.两个变量一减一增5.相关关系的主要特点是两个变量之间A.存在着确定的依存关系B.存在着不完全确定的关系C.存在着严重的依存关系D.存在着严格的对应关系6.当自变量变化时, 因变量也相应地随之等量变化,则两个变量之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系7.当变量X值增加时,变量Y值都随之下降,则变量X和Y之间存在着A.正相关关系B.直线相关关系C.负相关关系D.曲线相关关系8.当变量X值增加时,变量Y值都随之增加,则变量X和Y之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系9.判定现象之间相关关系密切程度的最主要方法是A.对现象进行定性分析B.计算相关系数C.编制相关表D.绘制相关图10.相关分析对资料的要求是A.自变量不是随机的,因变量是随机的B.两个变量均不是随机的C.自变量是随机的,因变量不是随机的D.两个变量均为随机的11.相关系数A.既适用于直线相关,又适用于曲线相关B.只适用于直线相关C.既不适用于直线相关,又不适用于曲线相关D.只适用于曲线相关12.两个变量之间的相关关系称为A.单相关B.复相关C.不相关D.负相关13.相关系数的取值范围是≤r≤1 ≤r≤0≤r≤1 D. r=014.两变量之间相关程度越强,则相关系数A.愈趋近于1B.愈趋近于0C.愈大于1D.愈小于115.两变量之间相关程度越弱,则相关系数A.愈趋近于1B.愈趋近于0C.愈大于1D.愈小于116.相关系数越接近于-1,表明两变量间A.没有相关关系B.有曲线相关关系C.负相关关系越强D.负相关关系越弱17.当相关系数r=0时,A.现象之间完全无关B.相关程度较小B.现象之间完全相关 D.无直线相关关系18.假设产品产量与产品单位成本之间的相关系数为,则说明这两个变量之间存在A.高度相关B.中度相关C.低度相关D.显着相关19.从变量之间相关的方向看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和无相关20.从变量之间相关的表现形式看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和无相关21.物价上涨,销售量下降,则物价与销售量之间属于A.无相关B.负相关C.正相关D.无法判断22.配合回归直线最合理的方法是A.随手画线法B.半数平均法C.最小平方法D.指数平滑法23.在回归直线方程y=a+bx中b表示A.当x增加一个单位时,y增加a的数量B.当y增加一个单位时,x增加b的数量C.当x增加一个单位时,y的平均增加量D.当y增加一个单位时, x的平均增加量24.计算估计标准误差的依据是A.因变量的数列B.因变量的总变差C.因变量的回归变差D.因变量的剩余变差25.估计标准误差是反映A.平均数代表性的指标B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动生产率(千元)和工人工资(元)之间存在回归方程y=10+70x,这意味着年劳动生产率每提高一千元时,工人工资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为1000件时,其生产成本为30000元,其中固定成本6000元,则总生产成本对产量的一元线性回归方程为:=6+ =6000+24x=24000+6x =24+6000x29.用来反映因变量估计值代表性高低的指标称作A.相关系数B.回归参数C.剩余变差D.估计标准误差二、多项选择题1.下列现象之间属于相关关系的有A.家庭收入与消费支出之间的关系B.农作物收获量与施肥量之间的关系C.圆的面积与圆的半径之间的关系D.身高与体重之间的关系E.年龄与血压之间的关系2.直线相关分析的特点是A.相关系数有正负号B.两个变量是对等关系C.只有一个相关系数D.因变量是随机变量E.两个变量均是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量x与y之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的一元线性回归方程为y=,则A.单位成本与产量之间存在着负相关B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加元D.产量为1千件时,单位成本为元E.产量每增加1千件,单位成本平均减少元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.非线性相关7.判断现象之间有无相关关系的方法有A.对现象作定性分析B.编制相关表C.绘制相关图D.计算相关系数E.计算估计标准误差8.当现象之间完全相关的,相关系数为B.-1 E.-9.相关系数r =0说明两个变量之间是A.可能完全不相关B.可能是曲线相关C.肯定不线性相关D.肯定不曲线相关E.高度曲线相关10.下列现象属于正相关的有A.家庭收入愈多,其消费支出也愈多B.流通费用率随商品销售额的增加而减少C.产量随生产用固定资产价值减少而减少D.生产单位产品耗用工时,随劳动生产率的提高而减少E.工人劳动生产率越高,则创造的产值就越多11.直线回归分析的特点有A.存在两个回归方程B.回归系数有正负值C.两个变量不对等关系D.自变量是给定的,因变量是随机的E.利用一个回归方程,两个变量可以相互计算12.直线回归方程中的两个变量A.都是随机变量B.都是给定的变量C.必须确定哪个是自变量,哪个是因变量D.一个是随机变量,另一个是给定变量E.一个是自变量,另一个是因变量13.从现象间相互关系的方向划分,相关关系可以分为A.直线相关B.曲线相关C.正相关D.负相关E.单相关14.估计标准误差是A.说明平均数代表性的指标B.说明回归直线代表性指标C.因变量估计值可靠程度指标D.指标值愈小,表明估计值愈可靠E.指标值愈大,表明估计值愈可靠15.下列公式哪些是计算相关系数的公式16.用最小平方法配合的回归直线,必须满足以下条件A.?(y-y c )=最小值B.?(y-y c )=0C.?(y-y c )2=最小值D.?(y-y c )2=0E.?(y-y c )2=最大值17.方程y c =a+bx222222)()(.)()())((...))((.y y n x x n y x xy n r E y y x x y y x x r D L L L r C L L L r B n y y x x r A xx xy xy yy xx xy yx ∑-∑⋅∑-∑∑⋅∑-∑=-∑⋅-∑--∑===--∑=σσA.这是一个直线回归方程B.这是一个以X为自变量的回归方程C.其中a是估计的初始值D.其中b是回归系数是估计值18.直线回归方程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动方向D.其数值大小不受计量单位的影响E. 其数值大小受计量单位的影响19.相关系数与回归系数存在以下关系A.回归系数大于零则相关系数大于零B.回归系数小于零则相关系数小于零C.回归系数等于零则相关系数等于零D.回归系数大于零则相关系数小于零E.回归系数小于零则相关系数大于零20.配合直线回归方程的目的是为了A.确定两个变量之间的变动关系B.用因变量推算自变量C.用自变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21.若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在的所有理论值同它的平均值一致和y是函数关系与y不相关与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;而回归分析中自变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;而相关分析中自变量是给定的数值,因变量是随机的C.相关系数有正负号;而回归系数只能取正值D.相关分析中的两个变量是对等关系;而回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出一个相关系数;而回归分析中根据两个变量只能计算出一个回归系数三、填空题1.研究现象之间相关关系称作相关分析。
管理统计学第7章习题解答
管理统计学第7章习题解答习题7.11、 随机地从一批钉子中抽取10枚,测得长度(单位:cm )如下:2.11,2.14,2.10,2.13,2.15,2.13,2.12,2.14,2.12,2.13试求这批钉子长度总体均值μ及方差σ2的矩估计值,并求样本方差s 2 .解:X μ∧==101110i i X =∑=2.127;2σ∧=10211()10i i X X =-∑=0.014182=0.000201;1022211()0.014940.000229i i s X X ==-==∑.2、 设总体X 服从几何分布,其分布律为: P (X=k )=(1-p )k-1p ,k=1,2,……,其中p 为未知参数,(X 1,X 2,…,X n)是取自总体X 的一个样本,求p 的矩估计. 解:EX =1111(1)(1)k k k k k p p p k p ∞∞--==-=-∑∑.设11()k k f x kx∞-==∑,|x|<1. 01()1x k k x f x dx x x∞===-∑⎰,/21()()1(1)x f x x x ∴==--.EX =1(1)pf p p -=,1p EX =,1p X∧∴=.3、 设总体X 的概率密度为22(),0,()0,.x x f x θθθ⎧-<<⎪=⎨⎪⎩其他其中θ>0,(X 1,X 2,…,X n)是取自总体X 的一个样本,试求未知参数θ的矩估计. 解:EX =22()()3x f x dx xx dx θθθθ∞-∞=-=⎰⎰,θ=3EX, 3X θ∧=. 4、设( X 1,X 2,…,X n)是取自总体X 的一个样本,求下述各总体的概率密度函数中的未知参数θ的最大似然估计.(1).1,01,()0,.x x f x θθ≤≤=⎪⎩其他解:似然函数为 L(θ)= 1/21111()()nnnn ii i i i f x x x θθθθ=====∏∏ (0≤x i ≤1,i=1,2,…,n) ,1ln ()ln 1)ln 2nii nL x θθθ==+∑ (0≤x i ≤1,i=1,2,…,n) , 令 1ln ()ln 022nii d L n xd θθθθ==+=,从中解得 221(ln )ni i n x θ∧==∑ ,此即为θ的最大似然估计.(2)22,0,()0,.x xe x f x θθ-⎧>⎪=⎨⎪⎩其他解:似然函数为 L(θ)=221111()2(2)()ni ii nnn x x n iii i i i f x x e x eθθθθ=--===∑==∏∏∏(0<x i ,i=1,2,…,n) ,211ln ()ln 2ln nni i i i L n x x θθθ===+-∑∑(0<x i ,i=1,2,…,n) , 令 21ln ()0n i i d L n x d θθθ==-=∑,从中解得 21nii nx θ∧==∑ ,此即为θ的最大似然估计.5、设总体X 服从二项分布B(m,p),其中m 已知,p 为未知参数,(X 1,X 2,…,X n)是取自总体X 的一个样本求p 的矩估计和最大似然估计. 解:EX =mp,p=EX/p,11ni i X p X m mn ∧===∑.6、设总体X 服从指数分布Exp (λ),概率密度函数为,0,()0,0.x e x f x x λλ-⎧>=⎨≤⎩(X 1,X 2,…,X n )是取自总体X 的一个样本.求未知参数λ的矩估计与最大似然估计.解:EX =1/λ, 所以λ的矩估计1Xλ∧=.再求λ的最大似然估计.似然函数为 L(λ)=111()niii nnx x nii i f x eeλλλλ=--==∑==∏∏(0<x i ,i=1,2,…,n) ,1ln ()ln nii L n x λλλ==-∑ (0<x i ,i=1,2,…,n) ,令1ln ()0ni i d L n x d λλλ==-=∑,从中解得1X λ∧= ,此即为θ的最大似然估计.习题7.21、设(X 1,X 2,…,X 6)是取自总体X 的一个样本,θ=E(X)为待估参数.问下列点估计中哪些是θ的无偏估计?1123456(23456)/6X X X X X X θ∧=+++++2123456(23456)/21X X X X X X θ∧=+++++3123456()/6X X X X X X θ∧=+++++解:1121(23456)66E θθθθθθθθθ∧=+++++=≠;21(23456)21E θθθθθθθθ∧=+++++=,3E θθ∧=. 2θ∧,3θ∧是θ的无偏估计.2、设随机变量X ~P (λ),(X 1,X 2,…,X n)是取自X 的一个样本.试证211(1)ni i i X X n λ∧==-∑是参数λ2的无偏估计. 解:2221111(){()()}{()[()]()}n n i i i i i i i E E X E X D X E X E X n n λ∧===-=+-∑∑2221111{}n n i i n n λλλλλ===+-==∑∑所以211(1)ni i i X X n λ∧==-∑是参数λ2的无偏估计.3、设随机变量X ~11(,)22U θθ-+,试证X θ∧=是参数θ的无偏估计.解:EX=θ,()()E E X EX θθ∧===,所以X θ∧=是参数θ的无偏估计.4、设总体X 的数学期望为μ,(X 1,X 2,…,X n)是取自X的一个样本.a 1,a 2,…,a n 是任意常数,验证111()/(0)nnni i i i i i i a X a a ===≠∑∑∑是μ的无偏估计.解:E 111111()/()/()/nnnnnniiiiiiiii i i i i i a X a a EX a a a μμ=========∑∑∑∑∑∑,所以11()/n niiii i a X a ==∑∑是μ的无偏估计.5、设第1题中的总体X 的方差Var(X)存在.问θ的哪个无偏估计较为有效?解:2291(149162536)21441DX DXD θ∧=+++++=≈0.21DX ,36DXD θ∧=≈0.17DX ,32D D θθ∧∧<,3θ∧∴较2θ∧有效.习题7.31、测试某种清漆的干燥时间,随机抽取12个样品,其干燥时间(以小时计)分别为6.0,5.7,5.8,6.5,7.0,6.3,5.6,6.1,5.0,6.2,5.9,6.4设干燥时间总体服从正态分布N(μ,σ2),对以下两种情况分别求μ的95%置信区间.(1)若由以往经验知σ=0.5(小时);(2)若σ为未知.解:(1)X =6.0417,s =0.5071,α=0.05,126.041712X u nα-±=±=(5.7588,6.3246);(2)12(X t n nα-±-=0.956.041712t±=(5.7195,6.3639).2、包糖机某日开工包了10包糖,称得的重量(单位:g )分别为505,515,520,525,510,485,490,505,500,495假设糖包重量服从正态分布,试求糖包平均重量的95%置信区间.解:X =505,s =12.9099,α=0.05,12(1)tn α--=0.975(9) 2.2622t =,1(X tn nα-±-50510±=505±9.2354=(495.765,514.235).3、为估计一批钢索所能承受的平均张力,从其中随机抽样做了9次试验.由试验结果算得张力的样本均值为6720kg/cm 2, 样本标准差s 为220 kg/cm 2.设张力服从正态分布,试求钢索所能承受平均张力的95%置信区间. 解:X =6720,s =220,α=0.05,1(1)tn α--=0.975(8) 2.3060t =,12(X t n nα-±-6720±169.11)=(6550.89,6889.11).4、设炮弹初速服从正态分布,随机地取9发炮弹做试验,得炮弹初速度样本标准差为11(m/s ),分别求炮弹初速度的方差σ2和标准差σ的90%置信区间. 解:σ2的置信区间22221/2/2(1)(1),(1)(1)n S n S n n ααχχ-⎛⎫-- ⎪--⎝⎭=22811811,15.507 2.733⎛⎫⨯⨯ ⎪⎝⎭=(62.42,354.19);σ的置信区间22221/2/2(1)(1)(1)(1)n S n S n n ααχχ-----=(7.90,18.82).5、对某农作物两个品种A,B 计算了8个地区的亩产量(单位:kg )如下:品种A 430,435,280,465,420,465,375,395品种B 400,395,290,455,385,410,380,330假定两个品种的亩产量分别服从正态分布N(μ1,σ2)和N(μ2,σ2), 试求两个品种平均亩产量之差μ1-μ2的95%置信区间. 解:置信区间12121211(2)X Y t n n S n n α-⎛-±+-+ ⎝,X =408.125, Y =380.625,s 1=60.3524,s 2=50.3869,112(2)t n n α-+-=t 0.975(14)=2.1448,222112212(1)(1)2wn S n S S n n -+-=+-=273642.412272538.83973090.6259514wS⨯+⨯==,12121211(2)X Y t n n S n n αω-⎛-±+-+ ⎝=27.5±2.1448×55.5934×0.5=(-32.12,87.12)6、随机地从甲批导线中抽取4根,从乙批导线中抽取5根,测得其电阻(单位:Ω)分别为甲批导线: 0.142, 0.143, 0.137, 0.143 乙批导线: 0.138, 0.140, 0.136, 0.140, 0.142设两批导线电阻分别服从N(μ1,σ2)和 N(μ2,σ2),并且它们相互独立,试求μ1-μ2的95%置信区间. 解:置信区间12121211(2)X Y t n n S n n α-⎛-±+-+ ⎝,X=0.14125, Y =0.1392,s 1=0.002872,s 2=0.002280,112(2)t n n α-+-=t 0.975(7)=2.3646,222112212(1)(1)2wn S n S S n n -+-=+-=30.00000840.0000050.0000067⨯+⨯=,12121211(2)X Y t n n S n n αω-⎛-±+-+ ⎝=0.00205±0.0039=(-0.002,0.006)7、两台机床加工同一种零件,从中分别随机抽取6个和9个零件,测量其长度,并计算出 两个样本的方差分别为S 12=0.245(mm)2, S 22=0.357(mm)2.假定各台机床所加工的零件长度总体都服从正态分布.试求两个总体方差之比σ12/σ22的置信水平为95%的置信区间.解:置信区间222212121/212/212//,(1,1)(1,1)S S S S F n n F n n αα-⎛⎫ ⎪----⎝⎭=0.9750.0250.245/0.3570.245/0.3570.245/0.3570.245/0.357,,(5,8)(5,8) 4.821/6.76F F ⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭=(0.142,4.639),8、有两位化验员甲、乙,他们独立地对某种聚合物的含氯量用相同的方法各作了10次测定,其测定值的样本方差依次为0.5419和0.6065,设甲、乙测得的数据总体分别服从方差依次为σ12和σ22的正态分布,试求σ12/σ22的置信水平为95%的置信区间. 解:置信区间222212121/212/212//,(1,1)(1,1)S S S S F n n F n n αα-⎛⎫ ⎪----⎝⎭=0.9750.0250.5419/0.60650.5419/0.60650.5419/0.60650.5419/0.6065,,(9,9)(9,9) 4.031/4.03F F ⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭=(0.222,3.601)9、设某种电器零件的电阻(单位:Ω)服从正态分布N(μ,σ2).从这种零件中随机抽取15只,测得电阻为:3.0,2.7,2.9,2.8,3.1,2.6,2.5,2.8,2.4,2.9,2.7,2.6,3.2,3.0,2.8. 试求:(1)电阻均值μ的95%单侧置信下限; 解:1(X tn nα---=0.952.815t-=2.8-1.7613×15=2.698.(2)电阻方差σ2的95%单侧置信上限.解:22/2(1)(1)n S n αχ--=220.05140.2236(14)χ⨯=2140.22366.571⨯=0.1065.10、试求第6题中,μ1-μ2的置信水平为95%的单侧置信下限. 解:1121211(2)X Y t n n S n n α---+-+.X =0.14125, Y =0.1392,112(2)t n n α-+-=t 0.95(7)=1.8946,0.0000060.00245Sω==,1121211(2)X Y t n n S n n αω-⎛--+-+ ⎝=-0.001复习题七1、 总体X 服从区间(0,b )上的均匀分布,(1.3,0.6,1.7,2.2,0.3,1.1)是来自总体的一组样本值,试用矩法估计总体均值,总体方差及参数b.解:EX X ∧==1.2,52211()6i i DX S X X ∧===-∑=0.407,2b EX =,2b X∧∴==2.4.2、 设总体X 服从Γ分布,其概率密度为1,0,()()0,0,xx e x f x x ααλλα--⎧>⎪=Γ⎨⎪≤⎩(X 1,X 2,…,X n )是取自总体X 的一个样本,试求α及λ的矩估计. 解:0()()x E X x e dx ααλλα+∞-=Γ⎰=01()()()xx e d x αλλλλα+∞-Γ⎰=(1)()ααλαλΓ+=Γ.12121()()()xE X x e d x ααλλλλα+∞++-=Γ⎰=22(2)(1)()αααλαλΓ++=Γ,DX=EX 2-(EX )2=2αλ.2EX DXαλαλ=⎧⎨=⎩,2()EX DX EX DXλα⎧=⎪⎪⎨⎪=⎪⎩,221211()1()ni i ni i XX X n X X X n αλ∧=∧=⎧=⎪⎪-⎪⎪⎨⎪=⎪⎪-⎪⎩∑∑.3、设总体X 服从几何分布,其分布律为: P (X=k )=(1-p )k-1p ,k=1,2,……,其中p 为未知参数,(X 1,X 2,…,X n)是取自总体X 的一个样本,求p 的最大似然估计.解:L(p)=1111()(1)(1)ni i i nnx nx nii i i P Xx p p p p =--==∑==-=-∏∏对数似然函数为:1ln ()ln ()ln(1)n ii L p n p x n p ==+--∑,对p 求导并令其为0:1()ln ()1ni i x n d L p n dp p p=-∑=--=0,解得:11nii np xx ∧===∑4、 设总体X 服从区间[0,θ]上的均匀分布,(X 1,X 2,…,X n )是取自总体X 的一个样本,求未知参数θ的最大似然估计. 解:1,0;()0,x f x θθ⎧<<⎪=⎨⎪⎩其它。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。
2.答:相关和回归都是研究现象及变量之间相互关系的方法。
相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。
3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。
复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。
偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。
4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。
根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。
总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。
两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。
第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。
5.最小二乘法是在根据样本数据估计样本回归方程时,采用残差平方和作为衡量总偏差的尺度,找到使得残差平方和最小的回归系数0ˆβ和1ˆβ的取值的估计方法。
根据微积分中求极小值的原理,可知欲使残差平方和Q 达到最小,Q 对0ˆβ和1ˆβ的偏导数必须等于零。
6.答:总离差平方和是因变量的实际观测值和样本均值的离差平方和;回归平方和是因变量的理论回归值与样本均值的离差平方和;残差平方和是实际观测值与理论回归值的离差平方和。
三者之间的关系是:总离差平方和= 回归平方和+ 残差平方和。
7.答:判定系数R2是回归平方和占总离差平方和的比例,它是对估计的回归模型拟合程度的度量。
它可以解释为:在因变量的离差中,可以由自变量所解释的部分。
R2越接近于1,表明回归平方和占总离差平方和的比例越大,回归直线与各观测点越接近,回归直线的拟合程度就越好;反之,R2越接近于0,回归直线的拟合程度就越差。
8.答:一元回归模型中,估计标准误差是对各观测数据在回归直线周围分散程度的一种度量值,它是对随机误差项tu 的标准差σ的估计。
它反映了用样本回归方程估计因变量Y时平均误差的大小。
9.答:在多元线性回归方程中,F 检验是对回归方程整体显著性的检验,其原假设为所有回归系数全部为零,即只要其中有一个自变量的回归系数不显著为零,其F 检验就能通过,即该方程整体上是显著的。
但是这并不意味着每个自变量与因变量的关系都显著。
而t 检验是对每个回归系数的显著性单独进行检验,它主要用于检验每个自变量对因变量的影响是否显著非零。
10.答:在一元线性回归模型中,不同的模型都仅包含一个自变量,如果使用的样本容量也一样,判定系数便可以直接作为评价拟合程度的尺度。
然而在多元线性回归模型中,不同模型所包含的自变量个数未必相同,如果在模型中额外增加一个自变量,即使这个自变量没有经济意义,在统计上也不显著,2R 仍可能会变大,至少不会下降,因此为了避免增加自变量而高估2R ,需要对多元线性回归方程的判定系数进行修正,其计算公式为:11)1(122---*--=p n n R R a 。
11.答:(1)人均GDP 与人均消费水平的散点图如下:由散点图可以看出二者之间呈线性正相关关系。
(2)根据样本相关系数公式∑∑∑----=22)()())((Y Y X X Y Y X X r tttt计算可得,人均GDP 与人均消费水平之间的线性相关系数。
(3)各地人均国内生产总值和人均消费水平的有关数据如下表:地区 人均国内生产总值X (元) 人均消费水平(元)X 2 Y 2 XY北京 22460 7326 504451600 53670276 164541960 辽宁 11226 4490 126023076 20160100 50404740 上海 34547 11546 1193495209 133310116 398879662 江西 4851 2396 23532201 5740816 11622996 河南 5444 2208 29637136 4875264 12020352 贵州 2662 1608 7086244 2585664 4280496 陕西 4549 2035 20693401 4141225 9257215合计 85739316091904918867 224483461 651007421已知n =7,∑X =85739,∑Y =31609,∑2X =1904918867,∑XY =651007421,因此根据公式7-9计算可得,,。
估计的一元线性回归方程为:X Y309.0693.734ˆ+=。
其中,0.309表示人均国内生产总值每增加1元,人均消费水平平均增加0.309元;734.693表示与人均国内生产总值无关的人均消费水平平均为734.693元。
(4)根据判定系数公式∑∑∑∑---=--==22222)()ˆ(1)()ˆ(Y Y Y Y Y Y Y Y SSTSSRR tt t计算可得,。
其意义为,在人均消费水平的离差中,有99.6%可以由人均消费水平与人均GDP 之间的线性回归方程来解释,该方程的拟合程度较好。
(5)第1步:提出假设H 0:01=β,即两个变量之间的线性关系不显著。
H 1:01≠β,即两个变量之间的线性关系显著。
第2步:计算检验统计量 根据公式MSEMSRn SSE SSR F =-=)2/(1/计算可得,。
第3步:做出决策在α=0.05的显著性水平下,查F 分布表(分子自由度为1、分母自由度为5),得到临界值F α=6.61。
由于F>F α,因此拒绝H 0,即两个变量之间的线性关系是显著的。
(6)根据回归方程计算可得,,即预测该地区人均消费水平平均为2279.693元。
12.答:啤酒广告费用和销售量的有关数据如下表:啤酒品牌广告费X (万元) 销售量Y (万箱)X 2Y 2XYA 120.0 36.3 14400.00 1317.69 4356.00B 68.7 20.7 4719.69 428.49 1422.09C 100.1 15.9 10020.01 252.81 1591.59D 76.6 13.2 5867.56 174.24 1011.12E 8.7 8.1 75.69 65.61 70.47F 1.0 7.1 1.00 50.41 7.10G 21.5 5.6 462.25 31.36 120.40H 1.4 4.4 1.96 19.36 6.16I 5.3 4.4 28.09 19.36 23.32J 120.0 36.3 2.8918.49 7.31合计40512035579.14 2377.82 8615.56已知n =10,∑X =405,∑Y =120,∑2X =35579.14,∑XY =8615.56,因此根据公式7-9计算可得,,。
估计的一元线性回归方程为:X Y196.0062.4ˆ+=。
13.答:(1) 表7-11 不同广告费用的方差分析表 方差来源df SS MS F Significance F回归11602708.60 1602708.60 399.102.17E-09残差 10 40158.07 4015.81总计 11 1642866.67(2),因此汽车销售量的变差中有97.6%是由广告费用的变动引起的。
(3),即销售量与广告费用之间的相关系数为0.988。
(4)估计的回归方程为:ˆ363.689 1.42YX =+ 其中,1.42表示广告费用每增加1个单位,汽车销售量平均增加1.42个单位;363.689表示广告费用为0时汽车销售量平均为363.689个单位。
(5)F 检验,提出原假设和备择假设:H 0:01=β;H 1:01≠β。
由表7-11可知,F 统计量为399.10,其精确的显著性水平p 值为2.17×10-9,远小于显著性水平α=0.05,因此拒绝H 0,认为两个变量之间的线性关系是显著的。
14.计算过程可参考11和12题,具体过程略。
答:(1)以航班正点率为自变量,顾客投诉次数为因变量得到的回归方程为:ˆY430.19 4.70X =-,其中-4.7表示航班正点率每提高1%,投诉次数平均下降4.70次;430.19没有明确的实际意义,也可以解释为当航班正点率为0时,顾客平均投诉次数为430.19次。
(2)t 检验,提出假设: 01:0H β=;11:0H β≠,t 统计量为-4.96,显著性水平α为0.05,自由度为8,查t 分布表,找到相应的临界值2(102) 2.306t α-=,由于2t t α>,则能够拒绝0H ,表明自变量X 对因变量Y 的影响是显著的。
(3)X=80带入样本回归方程,得到顾客平均投诉次数为54次。
15.答:(1)回归方程为ˆY348.9414.41X =+,其中,14.41表示当广告费每增加1万元时,销售量平均会增加14.41辆;与广告费无关的销售量平均为348.94。
(2)SSR= 755456,SSE= 37504,判定系数210.95SSR SSER SST SST==-=,其统计含义:在销售量的离差中,有95%可以由广告费和销售量之间的线性回归方程来解释;或者说在销售量的变动中,有95%是由广告费用因素决定的,说明该方程的拟合程度较好。
(3)在一元线性回归中,相关系数r 的平方就等于判定系数,而相关系数的r 与回归系数1β的正负号是相同的。
所以相关系数0.97r ==。
(4)将广告费用X=1000带入所得回归方程中得汽车销售量Y=14758.94辆。
(568.47=辆,其统计含义,根据广告费用对汽车销售量进行估计时,平均的估计误差为68.47辆。