统计学习题答案 第8章 相关与回归分析【精选文档】
《统计学概论》第八章课后练习题答案
《统计学概论》第八章课后练习答案一、思考题1.什么是相关系数?它与函数关系有什么不同?P237- P2382.什么是正相关、负相关、无线性相关?试举例说明。
P238- P2393.相关系数r的意义是什么?如何根据相关系数来判定变量之间的相关系数?P245 4.简述等级相关系数的含义及其作用?P2505.配合回归直线方程有什么要求?回归方程中参数a、b的经济含义是什么?P2566.回归系数b与相关系数r之间有何关系?P2587.回归分析与相关分析有什么联系与区别?P2548.什么是估计标准误差?这个指标有什么作用?P2619.估计标准误差与相关系数的关系如何?P258-P26410.解释判定系数的意义和作用。
P261二、单项选择题1.从变量之间相互关系的方向来看,相关关系可以分为()。
A.正相关和负相关B.直线关系与曲线关系C.单相关和复相关D.完全相关和不完全相关2.相关分析和回归分析相比较,对变量的要求是不同的。
回归分析中要求()。
A.因变量是随机的,自变量是给定的B.两个变量都是随机的C.两个变量都不是随机的D.以上三个答案都不对3.如果变量x与变量y之间的相关系数为-1,这说明两个变量之间是()。
A.低度相关关系B.完全相关关系C.高度相关关系D.完全不相关4.初学打字时练习的次数越多,出现错误的量就越少,这里“练习次数”与“错误量”之间的相关关系为()。
A.正相关B.高相关C.负相关D.低相关5.假设两变量呈线性关系,且两变量均为顺序变量,那么表现两变量相关关系时应选用()。
A.简单相关系数r B.等级相关系数r sC.回归系数b D.估计标准误差S yx6.变量之间的相关程度越低,则相关系数的数值()。
A.越大B.越接近0C.越接近-1 D.越接近17.下列各组中,两个变量之间的相关程度最高的是()。
A.商品销售额和商品销售量的相关系数是0.9B.商品销售额和商品利润率的相关系数是0.84C.产量与单位成本之间的相关系数为-0.94D.商品销售价格与销售量的相关系数为-0.918.相关系数r的取值范围是()。
统计学课后习题答案-相关分析与回归分析
、 单项选择题1. 相关分析是研究变量之间的 A. 数量关系 C •因果关系2. 在相关分析中要求相关的两个变量3. 下列现象之间的关系哪一个属于相关关系?A. 播种量与粮食收获量之间关系 C •圆半径与圆面积之间关系 D. 单位产品成本与总成本之间关系 4. 正相关的特点是A •两个变量之间的变化方向相反 C. 两个变量之间的变化方向一致 5. 相关关系的主要特点是两个变量之间A. 存在着确定的依存关系 C. 存在着严重的依存关系 B. 存在着不完全确定的关系 D. 存在着严格的对应关系6.当自变量变化时 , 因变量也相应地随之等量变化 ,则两个变量 之间存在着A. 直线相关关系B.负相关关系C.曲线相关关系 D.正相关关系 7. 当变量 X 值增加时 ,变量 Y 值都随之下降 ,则变量 X 和 Y 之间存 在着 A. 正相关关系 C.负相关关系D.曲线相关关系8. 当变量 X 值增加时 ,变量 Y 值都随之增加 ,则变量 X 和 Y 之间存 在着 A. 直线相关关系 B.负相关关系 C.曲线相关关系 D.正相关关系9. 判定现象之间相关关系密切程度的最主要方法是 A. 对现象进行定性分析 B.计算相关系数C.编制相关表 D.绘制相关图10. 相关分析对资料的要求是A. 自 变量不是随机的,因变量是随机的B. 两个变量均不是随机的C. 自变量是随机的,因变量不是随机的D. 两个变量均为随机的 11. 相关系数第七章相关分析与回归分析B.变动关系D. 相互关系的密切程度 A. 都是随机变量C. 都不是随机变量B. 自变量是随机变量 D. 因变量是随机变量B •圆半径与圆周长之间关系B.两个变量一增一减 D. 两个变量一减一增 B.直线相关关系A.既适用于直线相关,又适用于曲线相关B.只适用于直线相关C.既不适用于直线相关,又不适用于曲线相关D.只适用于曲线相关12.两个变量之间的相关关系称为C. 不相关D.负相关B.-1w rw 0 D. r=0 ,则相关系数 B.愈趋近于0D. 愈小于 1 ,则相关系数 B.愈趋近于0D. 愈小于116. 相关系数越接近于- 1,表明两变量间C. 负相关关系越强 D.负相关关系越弱17. 当相关系数 r=0 时 , A. 现象之间完全无关 B.相关程度较小 B. 现象之间完全相关D.无直线相关关系18. 假设产品产量与产品单位成本之间的相关系数为 -0.89,则说明这两个变量之间存在A.高度相关 B.中度相关 C. 低度相关D.显著相关19. 从变量之间相关的方向看可分为 A. 正相关与负相关 B.直线相关和曲线相关C. 单相关与复相关D.完全相关和无相关20. 从变量之间相关的表现形式看可分为 A. 正相关与负相关 B.直线相关和曲线相关C. 单相关与复相关D.完全相关和无相关21. 物价上涨 ,销售量下降 ,则物价与销售量之间属于 A. 无相关 B.负相关 C.正相关D.无法判断22. 配合回归直线最合理的方法是 A.随手画线法 B.半数平均法 C.最小平方法D.指数平滑法A.单相关B.复相关 13. 相关系数的取值范围是 A.-1W r < 1C.OW rw 114. 两变量之间相关程度越强 A.愈趋近于1 C.愈大于115. 两变量之间相关程度越弱 A.愈趋近于1 A. 没有相关关系B. 有曲线相关关系23.在回归直线方程y= a+ bx 中 b 表示A.当x增加一个单位时,y增加a的数量B.当y增加一个单位时,x增加b的数量C.当x增加一个单位时,y的平均增加量D.当y增加一个单位时,x的平均增加量24.计算估计标准误差的依据是A.因变量的数列C.因变量的回归变差25.估计标准误差是反映A.平均数代表性的指标B.因变量的总变差D.因变量的剩余变差B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中 ,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动生产率(千元)和工人工资(元)之间存在回归方程 y=10+70x, 这意味着年劳动生产率每提高一千元时,工人工资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为 1000件时,其生产成本为 30000元,其中固定成本6000元,则总生产成本对产量的一元线性回归方程为:A.y=6+0.24xB.y=6000+24xC.y=24000+6xD.y=24+6000x29.用来反映因变量估计值代表性高低的指标称作A.相关系数G剩余变差B.回归参数D.估计标准误差、多项选择题1.下列现象之间属于相关关系的有A.家庭收入与消费支出之间的关系B.农作物收获量与施肥量之间的关系C.圆的面积与圆的半径之间的关系D.身高与体重之间的关系2.直线相关分析的特点是A.相关系数有正负号C.只有一个相关系数E.年龄与血压之间的关系B.两个变量是对等关系D. 因变量是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量 x 与 y 之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的一元线性回归方程为y=85-5.6x,则B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加 5.6元D.产量为 1 千件时,单位成本为 79.4 元E.产量每增加1千件,单位成本平均减少 5.6元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.非线性相关16用最小平方法配合的回归直线 A . (y-y c )=最小值 C. (y-y c )2=最小值 E.(y-y c )2=最大值D.计算相关系数 8•当现象之间完全相关的A.0B.— 1E.计算估计标准误差 ,相关系数为C.1D.0.5E. — 0.59•相关系数r =0说明两个变量之间是 A •可能完全不相关 B •可能是曲线相关 C.肯定不线性相关 D.肯定不曲线相关E. 高度曲线相关 10下列现象属于正相关的有A. 家庭收入愈多,其消费支出也愈多B. 流通费用率随商品销售额的增加而减少D. 生产单位产品耗用工时,随劳动生产率的提高而减少E. 工人劳动生产率越高,则创造的产值就越多 11直线回归分析的特点有 A •存在两个回归方程 B •回归系数有正负值C. 两个变量不对等关系D. 自变量是给定的,因变量是随机的E. 利用一个回归方程,两个变量可以相互计算 12直线回归方程中的两个变量C. 必须确定哪个是自变量,哪个是因变量D. 一个是随机变量,另一个是给定变量E. 一个是自变量,另一个是因变量13. 从现象间相互关系的方向划分,相关关系可以分为 A.直线相关 B.曲线相关 D. 负相关 E.单相关14. 估计标准误差是A. 说明平均数代表性的指标B. 说明回归直线代表性指标C. 因变量估计值可靠程度指标D. 指标值愈小,表明估计值愈可靠C.正相关Ar D.r(x x)(y y)B rL xyC.rL xyL yyL xy LXX(X X)(y y) Er■(X X)2 (y y)2n xy x y、n x 2 ( x)2 、n y 2 ( y)217 方程 y c=a+bx,必须满足以下条件B. (y-y c)=02A.这是一个直线回归方程B.这是一个以X为自变量的回归方程C.其中a是估计的初始值D.其中b是回归系数E.y c是估计值18直线回归方程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动方向D.其数值大小不受计量单位的影响E.其数值大小受计量单位的影响19相关系数与回归系数存在以下关系A.回归系数大于零则相关系数大于零B.回归系数小于零则相关系数小于零C.回归系数等于零则相关系数等于零D.回归系数大于零则相关系数小于零E.回归系数小于零则相关系数大于零20配合直线回归方程的目的是为了A.确定两个变量之间的变动关系B.用因变量推算自变量C.用自变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在B.y的所有理论值同它的平均值一致C.x和y是函数关系D.x与y不相关E.x与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;而回归分析中自变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;而相关分析中自变量是给定的数值,因变量是随机的C.相关系数有正负号;而回归系数只能取正值D.相关分析中的两个变量是对等关系;而回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出一个相关系数;而回归分析中根据两个变量只能计算出一个回归系数三、填空题1.__________________________________________________ 研究现象之间相关关系称作相关分析。
统计学第八章课后题及答案解析
第八章一、单项选择题1.时间数列的构成要素是()A.变量和次数 B.时间和指标数值C.时间和次数 D.主词和时间2.编制时间数列的基本原则是保证数列中各个指标值具有()A.可加性 B.连续性C.一致性 D.可比性3.相邻两个累积增长量之差,等于相应时期的()A.累积增长量 B.平均增长量C.逐期增长量 D.年距增长量4.统计工作中,为了消除季节变动的影响可以计算()A.逐期增长量 B.累积增长量C.平均增长量 D.年距增长量5.基期均为前一期水平的发展速度是()A.定基发展速度 B.环比发展速度C.年距发展速度 D.平均发展速度6.某企业2003年产值比1996年增长了1倍,比2001年增长了50%,则2001年比1996年增长了()A.33% B.50%C.75% D.100%7.关于增长速度以下表述正确的有()A.增长速度是增长量与基期水平之比 B.增长速度是发展速度减1C.增长速度有环比和定基之分 D.增长速度只能取正值8.如果时间数列环比发展速度大体相同,可配合()A.直线趋势方程 B.抛物线趋势方程C.指数曲线方程 D.二次曲线方程二、多项选择题1.编制时间数列的原则有()A.时期长短应一致 B.总体范围应该统一C.计算方法应该统一 D.计算价格应该统一E.经济内容应该统一2.发展水平有()A.最初水平 B.最末水平C.中间水平 D.报告期水平E.基期水平3.时间数列水平分析指标有()A.发展速度 B.发展水平C.增长量 D.平均发展水平E.平均增长量4.测定长期趋势的方法有()A.时距扩大法 B.移动平均法C.序时平均法 D.分割平均法E.最小平方法三、填空题1.保证数列中各个指标值的_______是编制时间数列的最主要规则。
2.根据采用的基期不同,增长量可以分为逐期增长量和_______增长量两种。
3.累积增长量等于相应的_______之和。
两个相邻的_______之差,等于相应时期的逐期增长量。
统计学 8相关与回归分析
第二、显示x与y之间的相关密切程度
C ov(x,y)越 大 x与 y之 间 的 相 关 程 度 越 高 C ov(x,y)越 小 x与 y之 间 的 相 关 程 度 越 低
•
P
(二 ) (四 ) (xx)y (y)
A 图 ((x y x y))
2020/6/27 (x x )y ( y )偏大 (p p )q ( q )偏小 18
二、相关系数
[无线性相关]
xx
Y
• •
A图
•
•
• •
•
•
• •
• •
Y
B图
yy
• • •• ••• • •• •• • •
X
X
A 图 : x x 0 ( x x ) ( y y ) 0 C o v ( x , y ) 0
B 图 : y y 0 ( x x ) ( y y ) 0 C o v ( x , y ) 0
2020/6/27
x与y之间无直线相关
19
二、相关系数
[归纳] Cov(x,y)的作用 第一、显示x与y之间的相关方向
xyxy
2020/6/27
n
结 论 : (xx)(yy) xy x y n
23
二、相关系数
[r的简捷计算公式]
(x x )2 (x 2 2 x x x 2 )
x22x x x2x22xxnx2 n
x2
2(x)2 n
nnx2
x2 (x)2
n
结 论 :(xx)2x2(x)2 n
统计学第五版第八章课后习题答案
由Excel制表得:
由图可知:
已知:α= 0、05,n1 = n2=12
=31、75 =28、67 =10、20 =6、06 t=1、72 t∈(-1、72,1、72)接受,否则拒绝。 t=(31 、75-28、67)/(8、08* 0、41)=0、93 0、 93∈(-1、72,1、72)
决策:在α= 0、05得水平上接受 。
已知包重服从正态分布,试检验该日打包机工作就是否正常 ( α
=0、) 。 解:
如图所示:
本题采用单样本t检验。
:μ=100 :μ≠100基
本统计量:
α=0、05,N=9, =99、978,
S=1、2122, =0、4041 检验结果: t=-0、005,自由度f=8, 双侧检验P=0、996,单侧检验P=0、498
:μ≥700
:μ<700
∵α=0、05∴
=-1、645
计算检验统计量: =(680-700)/(60/6)=-2
决策: ∵Z值落入拒绝域,
∴在α=0、05得显著水平上拒绝 ,接受 。
结论: 有证据表明这批灯泡得使用寿命低于700小时,为不合格产品。
8、3 某地区小麦得一般生产水平为亩产250公斤,其标准差为30 公斤。现用一种化肥进行试验,从25个小区抽样,平均产量为270
决策:在 α= 0、05得水平上拒绝 。
结论: 服用阿司匹林可以降低心脏病发生率。
8、14 某工厂制造螺栓,规定螺栓口径为7、0cm,方差为0、03cm。 今从一批螺栓中抽取80个测量其口径,得平均值为6、97cm,方差为 0、0375cm。假定螺栓口径为正态分布,问这批螺栓就是否达到规 定得要求 (a=0、05)?
双侧检验
统计学第八章练习题答案
第八章练习题参考答案一、填空题8.1.1 函数关系、相关关系8.1.2 因变量、自变量8.1.3 函数关系8.1.4 相关关系8.1.5 涉及变量8.1.6 单相关8.1.7 偏相关8.1.8 密切程度8.1.9 表现形态8.1.10 相关的方向8.1.11 相关的性质8.1.12 正相关8.1.13 负相关8.1.14 虚假相关8.1.15 相关分析8.1.16 回归分析8.1.17 相关系数8.1.18 偏相关系数8.1.19 复相关系数8.1.20 最小二乘法8.1.21 估计标准差8.1.22 各回归系数、整个回归方程8.1.23 t检验、F检验。
8.1.24 线性相关8.1.25 回归系数二、单项选择题三、多项选择题四、判断改错题8.4.1 (√)8.4.2 (×,函数关系) 8.4.3 (×,偏相关) 8.4.4 (×,密切程度) 8.4.5 (√)8.4.6 (×,具有密切联系的统计方法) 8.4.7 (√) 8.4.8 (√)8.4.9 (×,只能认为变量之间不存在线性相关关系) 8.4.10 (√) 8.4.11 (×,01y x ββε=++)8.4.12 (√)8.4.13 (×,残差平方和达到最小) 8.4.14 (√)8.4.15 (×,方差为21ˆvar()xxL σβ=) 8.4.16 (√)8.4.17 (×,回归线的代表性) 8.4.18 (×,t 检验) 8.4.19 (×,回归平方和) 8.4.20 (√) 8.4.21 (√)8.4.22 (×,一个因变量) 8.4.23 (×,随机变量) 8.4.24 (√)8.4.25 (×,2210x x y βββ++=)五、简答题8.5.1 答:相关关系是指变量之间客观存在的非严格确定的依存关系;函数关系是指变量之间存在的严格确定的依存关系。
大学统计学第八章课后题答案
第八章 相关与回归分析 6. 相 关 系 数 计 算 表 (1) ()()åååååå-´å--=y yx x n n yx xy 2222nr 91.0132336030268679642621148164262122-»´-=-´´-´´-´= |r|=0.91 即 191.08.0<£ 所以,产量和单位成本存在高度负相关关系(2) ()82.133********211481621222-»-=-´´-´=å--=ååååx x n y x xy n b =-=åånx b ny a ()37.7737.67162182.16426=+=´-- 产量和单位成本之间的回归方程为: x y 82.137.77-=Ù 产量每增加1000件,单位成本平均下降1元 (3)当x=6 时, 单位成本: 45.66682.137.77=´-=Ùy (元) 年份序号 产量/千件x 单位成本/元y xy x 2 y 2 1 2 73 146 4 5329 2 3 72 216 9 5184 3 4 71 284 16 5041 4 3 73 219 9 5329 5 4 69 276 16 4761 6 5 68 340 25 4624 合 计 21 426 1481 79 30268 7. 相 关 系 数 计 算 表 序号 汽车使用年限/年x 年维修费用/元y xy x 2 y 2 1 2 400 800 4 160000 2 2 540 1080 4 291600 3 3 520 1560 9 270400 4 4 640 2560 16 409600 5 4 740 2960 16 547600 65 600 3000 25 360000 7 5 800 4000 25 640000 86 700 4200 36 490000 9 6 760 4560 36 577600 10 6 900 5400 36 810000 11 8 840 6720 64 705600 12 9 1080 9720 81 1166400 合 计 608520465603526428800()()åååååå-´å--=y yx x n n yx xy 2222n r=89.045552006244752064288001235212852060465601285206022»´=-´´-´´-´|r|=0.89 即 189.08.0<£所以,汽车使用年限与其维修费用间存在高度正相关关系(2) ()15.766244752035212852060465601260222==-´´-´=å--=ååååxx n y x xy n b =-=åån x b n y a 25.32975.380710126015.76128520=-=´- 汽车使用年限与其维修费用的回归方程为: x y 15.7625.329+=Ù(3) 当x=15时, 维修费用为: 5.14711515.7625.329=´+=Ùy8. (1) 相 关 系 数 计 算 表 序号 母亲身高/厘米x 女儿身高/厘米y xy x 2y 21 158 159 25122 24964 25281 2 159 160 25440 25281 256003 160 160 25600 25600 256004 161 163 26243 25921 265695 161 159 25599 25921 252816 155 154 23870 24025 237167 162 159 25758 26244 25281 8 157 158 24806 24649 24964 9 162 160 25920 26244 25600 10 150 157 23550 22500 24649 合计1585 1589251908251349252541()()åååååå-´å--=yy x x n n y x xy 2222nr=158915852225254110251349101589158525190810-´´-´´-´655.0»|r|=0.655 所以,母亲与女儿之间的关系为显著正相关(2) ()41.012655152513491015891585251908101585222»=-´´-´=å--=ååååxx n y x xy n b =-=åånx b n y a 915.93985.649.15810158541.0101589=-=´- 母亲与女儿之间的回归方程为: x y 41.0915.93+=Ù(3) 当x=170时, 女儿的身高为: 615.16317041.0915.93=´+=Ùy 9.(1) 由题知 n=9 å=546x å=260y å=16918xy 343622=åx()92.01114210302343629260546169189546222»=-´´-´=å--=ååååx x n yx xy n b =-=åånx b ny a 92.26954692.09260-=´-银行存款余额的直线回归方程: x y 92.092.26+-=Ù(2) 当x=400时,银行存款余额08.34140092.092.26=´+-=Ùy。
2015年《统计学》第八章 相关与回归分析习题及满分答案
2015年《统计学》第八章相关与回归分析习题及满分答案一、单选题1.相关分析研究的是( A )A、变量间相互关系的密切程度B、变量之间因果关系C、变量之间严格的相依关系D、变量之间的线性关系2.若变量X的值增加时,变量Y的值也增加,那么变量X和变量Y之间存在着(A )。
A、正相关关系B、负相关关系C、直线相关关系D、曲线相关关系3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着(B)。
A、正相关关系B、负相关关系C、直线相关关系D、曲线相关关系4.相关系数等于零表明两变量(B)。
A.是严格的函数关系B.不存在相关关系C.不存在线性相关关系D.存在曲线线性相关关系5.相关关系的主要特征是(B)。
A、某一现象的标志与另外的标志之间的关系是不确定的B、某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是确定的关系C、某一现象的标志与另外的标志之间存在着严格的依存关系D、某一现象的标志与另外的标志之间存在着不确定的直线关系6.时间数列自身相关是指( C )。
A、两变量在不同时间上的依存关系B、两变量静态的依存关系C、一个变量随时间不同其前后期变量值之间的依存关系D、一个变量的数值与时间之间的依存关系7.如果变量X和变量Y之间的相关系数为负1,说明两个变量之间(D)。
A、不存在相关关系B、相关程度很低C、相关程度很高D、完全负相关8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间(C)。
A、无相关B、存在正相关C、存在负相关D、无法判断是否相关9.相关分析对资料的要求是(A)。
A.两变量均为随机的B.两变量均不是随机的C、自变量是随机的,因变量不是随机的D、自变量不是随机的,因变量是随机的10.回归分析中简单回归是指(D)。
A.时间数列自身回归B.两个变量之间的回归C.变量之间的线性回归D.两个变量之间的线性回归11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为10 00时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程为( A )A. y=6000+24xB. y=6+0.24xC. y=24000+6xD. y=24+6000x12.直线回归方程中,若回归系数为负,则(B) A.表明现象正相关B.表明现象负相关C.表明相关程度很弱D.不能说明相关方向和程度二、多项选择题1.下列属于相关关系的有(ABD )。
统计学第八章课后习题答案
8.1解:建立假设: H0:μ=4.55;H1:μ≠4.55这是双侧检验,并且方差已知,检验的统计量 Z 值为:=-1.833而=1.96>|-1.833|,因此不能拒绝原假设,即可认为现在生产的铁水平均含碳量为 4.558.2解:建立假设: H0:μ≥700;H1:μ<700这是左侧检验,并且方差已知,检验统计量 Z 为:Z==-2而-=-1.645>-2,因此拒绝原假设,即在显著性水平 0.05 下这批元件是不合格的。
8.3解:建立假设: H0:μ≤250;H1:μ>250这是右侧检验,并且方差已知,检验的统计量 Z 值为:Z==3.33 而=1.645<3.33,因此拒绝原假设,即这种化肥使小麦明显增产。
8.4解:建立假设: H0:μ=100;H1:μ≠1009/108.055.4484.4−=Z Z 025.036/60700680−Z 05.025/30250270−Z05.0由样本数据可得: ==99.978S===1.212这是双侧检验,并且方差未知,又是小样本,故采用 t 统计量,检验统计量的值为: t==-0.054而(8)=2.306>|-0.054|,因此不拒绝原假设,即该日打包机工作正常8.5、由题意先建立假设,显然不符合标准的比例越小越好,由于采用的是产品质量抽查,即使总体不合标准的比例没有超过5%,属于合格范围,采用右单侧检验。
P=6/50=12%属于单侧检验,当α=0.05时,有,因此拒绝原假设,即认为该批食品不能出厂n X ni ix∑==195.100....7.983.99+++1)(12−−∑=n x ni i x 8)978.995.100(...978.99-7.98978.99-3.99222−+++)()(9/2122.1100-978.99t025.0%5:%,5:1>≤ππH H o 27.250%)51(%5%5%12=−−−=Z 27.2645.105.0<=Z8.6、由题意建立假设:单侧检验,并且方差未知,n=15,属于小样本,故采用t 统计量,检验统计量的值为:α=0.05,,因此不能拒绝原假设,认为该厂家的广告不真实8.7、建立假设:,由样本数据可以得出,这是单侧检验,并且方差未知,是小样本,因此采用t 检验量,检验统计量的值为25000:,25000:10>≤μμH H 549.115/50002500027000/0=−=−=n s x t μ549.1761.1)14(05.0>=t 225,22510>≤H H 5.24116170485 (2121012801591)=++++++==∑=nxx ni i7.9815)5.241170(....)5.241280()5.241159(12221=−++−+−=−=∑=n xs ni in s x t /μ−=669.016/7.982255.241=−=通过查表可得出,,因此不能拒绝原假设,没有理由认为元件的平均寿命显著地大于225小时。
统计学课后习题答案
第四章 统计描述某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%.试分别计算产量、成本、劳动生产率的计划完成程度. 解产量的计划完成程度=%5.112100%4045100%=⨯=⨯计划产量实际产量即产量超额完成%.成本的计划完成程=84%.96100%5%-18%-1100%-1-1≈⨯=⨯计划降低百分比实际降低百分比即成本超额完成%.劳动生产率计划完=85%.101100%8%110%1100%11≈⨯++=⨯++计划提高百分比实际提高百分比即劳动生产率超额完成%.某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%,在五年中,该矿实际开采原煤情况如下(单位:万吨)试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间. 解本题采用累计法:(1)该煤矿原煤开采量五年计划完成=100%⨯数计划期间计划规定累计数计划期间实际完成累计 =75%.12610210253574=⨯⨯ 即:该煤矿原煤开采量的五年计划超额完成%.(2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划. 我国1991年和1994年工业总产值资料如下表:要求:(1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中;(2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)(3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几 解(1)(2)是比例相对数;1991年轻工业与重工业之间的比例=96.01.144479.13800≈;1994年轻工业与重工业之间的比例=73.04.296826.21670≈(3)%37.251%)451(2824851353≈-+即,94年实际比计划增长%.某乡三个村2000年小麦播种面积与亩产量资料如下表:要求:(1)填上表中所缺数字;(2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量.解(1)(2))(75.72840013065015082012070011斤=⨯+⨯+⨯==∑∑==k i iki iiff xx(3)两种不同品种的玉米分别在五块地上试种,产量资料如下:已知生产条件相同,对这两种玉米品种进行分析比较,试计算并说明哪一种品种的亩产量更稳定一些解田块总面积总产量平均亩产量=即: 由于是总体数据,所以计算总体均值: 计算表格乙品种下面分别求两块田地亩产量的标准差:要比较两种不同玉米的亩产量的代表性,需要计算离散系数:<甲σv 乙σv ,∴甲品种的亩产量更稳定一些.两家企业生产相同的产品,每批产品的单位成本及产量比重资料如下: 甲企业乙企业试比较两个企业哪个企业的产品平均单位成本低,为什么解∴乙企业的产品平均单位成本更低.某粮食储备库收购稻米的价格、数量及收购额资料如下:要求:(1)按加权算术平均数公式计算稻米的平均收购价格;(2)按加权调和平均数公式计算稻米的平均收购价格.解(1))(02.19000915011元≈==∑∑==k i iki iiff xx (2))(02.190009150400030002000360031502400m H 元≈=++++==∑∑xm x已知我国1995年—1999年末总人口及人口增长率资料:试计算该期间我国人口平均增长率. 解计算过程如下:按照平均增长率的公式可知:1-平均发展速度平均增长率=所以,1995年—1999年期间我国人口平均增长率=96.91-1204861253604≈‰某单位职工按月工资额分组资料如下: 根据资料回答问题并计算: (1)它是一个什么数列(2)计算工资额的众数和中位数;(3)分别用职工人数和人数所占比重计算平均工资.结果一样吗(4)分别计算工资的平均差和标准差. 解(1)是等距分组数列 (2)d f f f f f f L M m m m m m m ⨯-+--+≈+--)()(1110下限公式:即:59.54821000)30134()37134(371345000)()(1110≈⨯-+--+=⨯-+--+≈+--df f f f f f L M m m m m m m(注:用上限公式算出的结果与上述结果相同) (注:用上限公式算出的结果与上述结果相同) (3))(22.5343236107500306500134550037450025350011元≈⨯+⨯+⨯+⨯+⨯==∑∑==k i iki iiff xx (元)2.53434.24%7500 71%.12650078%.56550068%.15450059%.103500x 1111≈⨯+⨯+⨯+⨯+⨯=⋅==∑∑∑∑====ki ki iii k i iki iiff x ff x两者结果一样.(忽略小数点位数的保留对结果造成的影响)(4)平均差 92.65411≈-=∑∑==ki iki iidff x xM标准差 33.923)(12≈-=∑=Nf X XKi i iσ某市甲、乙两商店把售货员按其人均年销售额分组,具体资料如下:要求:(1)分别计算这两个商场售货员的人均销售额; (2)通过计算说明哪个商场人均销售额的代表性大解(1) 423001260011===∑∑==k i iki iiff xX 甲(2)05.1030030300)(12≈=-=∑=Nf X XKi i i甲甲σ >甲σv 乙σv ,∴乙商场销售额的代表性大.第五章 统计抽样袋中装有5只同样大小的球,编号为1,2,3,4,5,从中同时取出3只球,求取出的最大号X 的分布律及其分布函数并画出其图形.解先求X 的分布律:由题知,X 的可能取值为3,4,5,且2345{5}/6/10P X C C ===,∴X 的分布律为:⎪⎪⎭⎫ ⎝⎛10/610/310/1543, 由(){}i i ix xF x P X x p ≤=≤=∑得:设X 的密度函数为求: (1)常数c ;(2)X 的分布函数()F x ; (3){13}P X <≤. 解(1)24241()0(32)018f x dx dx c x dx dx c +∞+∞-∞-∞==+++=⎰⎰⎰⎰(2)当2x ≤时,()00xF x dt -∞==⎰;当24x <<时,22211()()0(32)(310)1818xxF x f t dt dt t dt x x -∞-∞==++=+-⎰⎰⎰当4x ≥时,24241()()0(32)0118xx F x f t dt dt t dt dt -∞-∞==+++=⎰⎰⎰⎰.故分布函数 (3)21{13}=(3)(1)(33310)04/918P X F F <≤-=+⨯--= 随机变量,X Y 相互独立,又(2)XP ,1(8,)4YB ,试求(2)E X Y -和(2)D X Y -.解(2)()2()2222E X Y E X E Y -=-=-⨯=-一本书排版后一校时出现错误处数X 服从正态分布(200,400)N , 求: (1)出现错误处数不超过230的概率;(2)出现错误处数在190~210的概率. 解(200,400)X N(1)200230200(230)()2020X P X P --∴≤=≤ (2) 190200200210200(190210)()202020X P X P ---∴≤≤=≤≤某地区职工家庭的人均年收入平均为12000元,标准差为2000元.若知该地区家庭的人均年收入服从正态分布,现采用重复抽样从总体中随机抽取25户进行调查,问出现样本均值等于或超过12500元的可能性有多大 解对总体而言,2(12000,2000)XN∴样本均值22000(12000,)25xN某商场推销一种洗发水.据统计,本年度购买此种洗发水的有10万人,其中3万6千人是女性.如果按重复抽样方法,从购买者中抽出100人进行调查,问样本中女性比例超过50%的可能性有多大解总体比例 3.6=36%10π=万万(1)(,)p N nπππ-∴即2(0.36,0.048)pN第八章 相关分析和回归分析某店主分析其店面的经营情况时,收集了连续10天的访问量数据(单位:天)和当天营业额数据(单位:元)如下.对以上访问量和营业额数据作相关分析.解相关分析(1)画访问量和营业额数据的散点图,如下所示从图上可以看出,访问量和营业额数据是简单线性正的不完全相关. (2)计算相关系数计算访问量和营业额的简单线性相关系数为,大于,说明访问量和营业额之间存在较高的线性关系.某饮料广告费投入为x,产品销售数量为y,根据收集2年的月度数据 资料,计算得到以下结果:∑=-6546)(2x x i,∑=-5641)(2y y i375=x ,498=y ,6054))((=--∑y y x x i i(1)计算相关系数,并初步判断x 与y 之间的关系; (2)用最小二乘法估计模型回归系数,并写出模型结果; (3)说明所计算的回归系数的经济意义;(4)计算模型可决系数,并用其说明模型的拟合效果. 解最小二乘法的计算(一元)(1)计算相关系数,并初步判断x 与y 之间的关系;计算x 与y 相关系数为r=,说明两者的简单线性相关程度非常高,因此可以初步判断x 与y 呈现线性关系.(2)用最小二乘法估计模型回归系数,并写出模型结果;记模型为:i i x y 10ˆˆˆββ+=,将以上结果代入最小二乘法的计算公式,得到=1ˆβ,=0ˆβ. 因此,产品销售数量为y 对广告费投入为x 的模型为i i x y92484.01852.151ˆ+= (3)说明所计算的回归系数的经济意义;=1ˆβ表示当广告费投入每增加1个单位,产品销售数量会增加个单位. (4)计算模型可决系数,并用其说明模型的拟合效果.由于模型为一元线性回归模型,根据一元线性回归模型中可决系数为模型因变量和自变量简单线性相关系数的平方的关系,可得模型的可决系数R 2=(r)2=2=.可决系数接近1,说明模型拟合的非常好.第九章 统计指数某市场上四种蔬菜的销售资料如下:(1) 根据综合指数编制规则,将上表所缺空格填齐; (2) 用拉氏公式编制四种蔬菜的销量总指数和价格总指数; (3) 用帕氏公式编制四种蔬菜的销量总指数和价格总指数; (4) 建立适当的指数体系,对蔬菜销售额的变动进行因素分析.解 %p q p q L %pq pq L p q 11.1092282431227.1072282390220010001======∑∑∑∑)拉氏:(即 ()⎩⎨⎧+=⨯=元175********.10727.10712.115%%计算表明: 四种蔬菜的销量增长了 %,使销售额增加了 162元;四种蔬菜的价格上长了 %,使销售额增加了175元;两因素共同影响,使销售额增长了%, 销售额增加了337元. 结论:某厂三种产品的产量情况如下表:试分析出厂价格和产量的变动对总产值的影响. 解第一步:计算三个总产值:24200064000101100081350000=⨯+⨯+⨯=∑p q(万元);25080064800101020081500001=⨯+⨯+⨯=∑pq (万元);2637005480011102005.81500011=⨯+⨯+⨯=∑pq (万元);第二步:建立指标体系即⎪⎩⎪⎨⎧-+-=-⨯=)250800263700()242000250800(242000263700250800263700242000250800242000263700 第三步:分析结论.计算结果表明:由于出厂价上涨了%,使总产值增加了8800元;由于产量提高了%,使总产值增加了12900元;两因素共同作用,使总产值上升了%,增加了21700元.若给出题中四种蔬菜的资料如下:(1) 编制四种蔬菜的算术平均指数; (2) 编制四种蔬菜的调和平均指数;(3) 把它们与上题计算的拉氏指数和帕氏指数进行比较,看看有何种关系什么条件下才会有这种关系的呢 (4)解(1)(2) (3)算术平均指数的结果与拉氏指数相等——以基期的总值指标为权数. 调和平均指数的结果与帕氏指数相等——以报告期的总值指标为权数.某地区2005年农副产品收购总额为1 360亿元,2006年比上年的收购总额增长了12%,农副产品价格指数为105%;试考虑:2006年与2005年相比较(1) 农副产品收购总额增长了百分之几农民共增加多少收入 (2)(3) 农副产品收购量增加了百分之几农民增加了多少收入 (4)(5) 由于农副产品收购价格提高了5%,农民又增加了多少收入 (6) 验证以上三者之间有何等关系解已知:农民交售农副产品增加收入亿元, 与去年相比增长幅度为12%; 农副产品收购数量增长 %, 农民增加收入 亿元; 农副产品收购价格上涨 %, 农民增加收入 亿元.显然,有:⎩⎨⎧+=⨯=(亿元)5.727.902.16300.10567.10600.112%%%可见,分析结论是协调一致的.某企业生产的三种产品的有关资料如下:(1) 根据上表资料计算相关指标填入上表(见绿色区域数字); (2) 计算产品产量总指数及由于产量增长而增加的总成本;(3)计算单位成本总指数及由于单位成本变动而增减的总成本.解建立指数体系:结论:计算结果表明:由于产量总指数增加了37%(=%-1),而使总成本增加了37元,由于单位成本总指数下降了%(=%-1),使总成本减少了元.两个因素共同影响使总成本上升了%,增加了元.9.8某商场的销售资料如下:(1)根据上表资料计算相关指标填入上表(见绿色区域数字);(2)计算商品销售量总指数及由于销量变化而增减的销售额;(3)计算商品价格总指数及由于价格变动而增减的销售额.解建立指数体系:计算结果表明:由于商品销量总指数下降了%(=%),而使销售额减少了万元,由于商品价格总指数下降了%(=%),使销售额减少了万元.两个因素共同影响使销售总额下降了%(=%),减少了54万元.某乡力图通过推广良种和改善田间耕作管理来提高粮食生产水平,有关生产情况如下表所示:(1) 该乡粮食平均亩产提高了百分之几由此增产粮食多少吨 (2)(3) 改善田间耕作管理使平均亩产提高多少增产粮食多少吨 (4)(5) 推广良种使平均亩产提高多少增产粮食多少吨 (6)解计算的相关数据(∑∑∑110100110100x f x f x f x f x f x f )见上表中绿色区域数字;从而有:建立指数体系: ⎪⎩⎪⎨⎧-+=-⨯=)()-(10011001假假假假x x x x x x x x x x x x 即 ()()⎪⎩⎪⎨⎧-+-=-⨯=000 657 48000 737 49000 478 46000 657 48000 478 46000 737 4948.40548.417 32.38748.40532.38748.417 即 ()⎩⎨⎧+=⨯=公斤 000 080 1000 179 2000 259 3 %22.102 %69.104%01.107分析结论: 计算结果表明(1)该乡粮食平均亩产提高了%(=%-1),由此增产粮食3 259吨; (2)由于改善田间管理,使平均亩产提高了%,粮食增产2 179吨; (3)由于推广优良品种,使平均亩产提高了%,粮食增产1 080吨.第十章 时间序列分析某公司2009年末有职工250人,10月上旬的人数变动情况是:10月4日新招聘12名大学生上岗,6日有4名老职工退休离岗,8日有3名青年职工应征入伍,同日又有3名职工辞职离岗,9日招聘7名销售人员上岗.试计算该公司10月上旬的平均在岗人数. 解)(25610256010518252516524750212232)7334262(1)334262(2)4262(2)12250(3250人==++++=++++⨯+---+⨯---+⨯-+⨯++⨯==∑∑iii fxf x 答:该公司10月上旬的平均在岗人数为256人. 某银行2009年部分月份的现金库存额资料如下:要求:(1)该时间序列属于哪一种时间序列.(2)分别计算该银行该年第一、二季度和上半年的平均现金库存额. 解(1) 该时间序列属于动态时点时间序列; (2) 第一季度平均现金库存额:)(4803144032520450480250014224321万元==+++=-+++=x x x x x ; 第二季度平均现金库存额:)(5673170032580600550252014227324万元==+++=-+++=x x x x x ; 上半年平均现金库存额:)(52363140625806005505204504802500172 (2)721万元==++++++=-+++=x x x x 某企业08年上半年的产量和单位成本资料如下:试计算该企业08年上半年的产品平均单位成本.解答:该企业08年上半年的产品平均单位成本为元. 某企业有关资料如下,计算该企业一季度人均月销售额.解 该企业一季度月平均销售额:)(33.12331201501003321万元=++=++=a a a a ;该企业一季度月平均职工人数:)(1133211611012021003224321人=+++=+++=b b b b b ; 该企业一季度人均月销售额:)/(091.111333.123人万元===ba c .某市2001~2005年的地区生产总值如下表:(1) 按平均发展速度估计2002~2004年的地区生产总值. (2) 按此5年的平均发展速度预测2008年和2010年的GDP.解(1)2002~2006年泉州市地区生产总值的平均发展速度为:%12.11399316264==v ; 按平均发展速度估计2002~2004年的地区生产总值分别为:11437%)12.113(9931270%)12.113(9931123%12.11399332=⨯=⨯=⨯(将计算结果填入上表绿色区域内);(2)按此5年的平均发展速度预测2008年和2010年的GDP 分别为:2008年地区GDP 预测值)(23541312.116263亿元=⨯=; 2010年地区GDP 预测值)(7.30111312.116265亿元=⨯=.我国某地区2001年~ 2006年税收总额如下:试计算:(1)环比发展速度和定基发展速度; (2)环比增长速度和定基增长速度; (3)增长1%绝对值;(4)用水平法计算平均增长速度;(5)分析表中所列资料反映的趋势特征,拟配合适的趋势模型,并预测2007年该地区的税收收入.解(1)~(3)相关计算结果填入下表(见绿色区域数字):(4) 用水平法计算平均发展速度和平均增长速度:平均发展速度%44.1161644.11404.22821603855====v ; 则平均增长速度%44.161%44.1161=-=-=v ;。
第八章 相关分析与回归分析习题答案
第八章 相关分析与回归分析习题参考答案一、名词解释函数关系:函数关系亦称确定性关系,是指变量(现象)之间存在的严格确定的依存关系。
在这种关系中,当一个或几个相互联系的变量取一定的数值时,必定有另一个且只有一个变量有确定的值与之对应。
相关关系:是指变量(现象)之间存在着非严格、不确定的依存关系。
在这种关系中,当一个或几个相互联系的变量取一定的数值时,可以有另一变量的若干数值与之相对应。
这种关系不能用完全确定的函数来表示。
相关分析:相关分析主要是研究两个或者两个以上随机变量之间相互依存关系的方向和密切程度的方法,直线相关用相关系数表示,曲线相关用相关指数表示,多元相关用复相关系数表示。
回归分析:回归分析是研究某一随机变量关于另一个(或多个)非随机变量之间数量关系变动趋势的方法。
其目的在于根据已知非随机变量来估计和预测随机变量的总体均值。
单相关:单相关是指仅涉及两个变量的相关关系。
复相关:复相关是指一个变量对两个或者两个以上其他变量的相关关系。
正相关:正相关是指两个变量的变化方向是一致的,当一个变量的值增加(或减少)时,另一变量的值也随之增加(或减少)。
负相关:负相关是指两个变量的变化方向相反,即当一个变量的值增加(或减少)时,另一个变量的值会随之减少(或增加)。
线性相关:如果相关的两个变量对应值在直角坐标系中的散点图近似呈一条直线,则称为线性相关。
非线性相关:如果相关的两个变量对应值在直角坐标系中的散点图近似呈现出某种曲线形式,则为非线性相关。
相关系数:相关系数是衡量变量之间线性相关密切程度及相关方向的统计分析指标。
取值在-1到1之间。
两个变量之间的简单样本相关系数的计算公式为:()()niix x y y r --∑二、单项选择1.B;2.D;3.D;4.C;5.A;6.D 。
三、判断题(正确的打“√”,错误的打“×”) 1.×; 2.×; 3.√; 4.×; 5.×; 6.×; 7.×; 8.√. 四、简答题1、什么是相关关系?相关关系与函数关系有什么区别?答:相关关系,是指变量(现象)之间存在着非严格、不确定的依存关系。
统计学习题答案 第8章 相关与回归分析【精选文档】
6.表中给出y 对2x 和3x 回归的结果:
离差来源 平方和(SS ) 自由度(df ) 平方和的均值(MSS ) 来自回归(ESS ) 65965 来自残差(RSS ) 总离差(TSS ) 66042 14
(1) 该回归分析中样本容量是多少? (2) 计算RSS ;
(3) ESS 和RSS 的自由度是多少? (4) 计算可决系数和修正的可决系数;
(5) 怎样检验2x 和3x 对y 是否有显著影响?根据以上信息能否确定2x 和3x 各自对
y 的贡献为多少?
解:(1)该回归分析中样本容量是14+1=15
(2)计算RSS=66042-65965=77
ESS 的自由度为k —1=2,RSS 的自由度 n-k=15—3=12 (3)计算:可决系数 2
65965/660420.9988R == 修正的可决系数 2151
1(10.9988)0.9986153
R -=-
⨯-=- (4)检验X2和X3对Y 是否有显著影响
/(1)65965/232982
5140.11/()77/12 6.4166
ESS k F RSS n k -=
===-
(5) F 统计量远比F 临界值大,说明X2和X3联合起来对Y 有显著影响,但并不能确定X2和X3各自对Y 的贡献为多少。
7. 在计算一元线性回归方程时,已得到以下结果:
试根据此结果,填写下表的空格:
来 源 平方和 自由度 方差 来自回归 2179.56
来自残差 99。
11 22 总离差平方和
2278。
67。
统计学第八章课后作业答案
第八章练习题
一、单项选择
(1)当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于( )。
A.相关关系
B.函数关系
C.回归关系
D.随机关系
(2)相关系数的取值范围是( )。
A. 0≤r ≤1
B. -1<r <1
C. -1≤r ≤1
D. -1≤r ≤0
(3)一元线性回归方程y=12+3.6x,如x每增加1个单位,则y平均增加( )。
A. 12个单位
B. 15.6个单位
C. 3.6个单位
D. 8.4个单位
(4)一元线性回归方程中的两个变量( )。
A.都是随机变量
B.地位是对等的
C.都是给定的量
D.一个是自变量,另一个是因变量
二、多项选择题
(5)相关系数表明两变量之间的关系( )。
A.线性关系
B.因果关系
C.变异关系
D.相关方向
E.相关的密切程度
(6)如果两个变量之间的相关系数是1,则这两个变量是( )。
A.负相关关系
B.正相关关系
C.完全相关关系
D.不完全相关关系
E.零相关
(7)在一元线性回归分析中( )。
A.自变量是可控变量,因变量是随机变量
B.两个变量不是对等的关系
C.利用回归方程,两个变量可以相互推算
D.根据回归系数可判定相关的方向
E.自变量是随机变量,因变量是可控变量
(8)利用一元线性回归方程,可以( )。
A.进行两个变量的互相推算
B.用自变量推算因变量
C.用因变量推算自变量
D.确定两个变量的变动关系
E.研究两个变量之间的密切程度。
统计学原理第八章_相关与回归参考答案
第八章 相关与回归参考答案一、单项选择题1-5:D C D C B 6-10:A B B C B 11-15:B B C C C二、多项选择题1.BD2.AD3.AB4.AD5.AC6.AD7.BC 8.ABCD 9.AB 10.ACD 11.AD三、判断题1-5:×√××× 6-10:×√××√五、计算题1.Σy=604,Σx=94,Σy 2=36968,Σx 2=920,Σxy=5564(1)相关系数∑∑-∑∑-∑∑-∑=2222)()(y y n x x n y x xy n r =-0.85二者间高度负相关。
(2)设bx a y +=ˆ()∑-∑∑-∑=∑x x n y x xy n b 22 =-3.12 73.89=-=b a回归直线为 x y 12.373.89ˆ-=回归系数 b=-3.12的含义为价格每增加1元,需求量将平均减少3.12吨。
2.设用x 、y 分别表示收入、支出,bx a y +=ˆ则8800= 45002=σx 6000=y 60=σy b=0.8(1)因为σσxy r b = 所以,6045008.0⨯=⨯=σσy x b r =0.89 (2)104088008.06000-=⨯-=-=x b y a回归直线为 x y 8.01040ˆ+-=3. 设用x 、y 分别表示广告费、销售额Σy=25000,Σx=2500,Σy 2=135000000,Σx 2=1450000,Σxy=13800000(1)相关系数∑∑-∑∑-∑∑-∑=2222)()(y y n x x n y x xy n r =0.92(2)设bx a y +=ˆ()∑-∑∑-∑=∑x x n y x xy n b 22 =6.5 1750=-=x b y a回归直线为 x y 5.61750ˆ+=估计标准误差S y ˆ=22-∑∑∑--n xy b y a y =718.80 当x=700时,y f ˆ=1750 + 6.5×700=6300若概率保证程度为95.45%,销售额的区间为:[6300-2×718.80,6300+2×718.80]即[4862.4,7737.6]万元4. 设用x 、y 分别表示学习时间和成绩由已知,有∑xy =2740 ∑x =40 ∑y =310 ∑2x =3702y ∑=20700 (1)n xy x y -=0.9558二者为高度正相关(2)设 y = a+bx b= ()∑∑∑∑∑--x x n yx xy n 22 =25274040310537040⨯-⨯⨯-= 5.2 a= y - b x = 3105- 405.25⨯ = 20.4 ∴ y = 20.4 + 5.2x(3) 回归系数表示学习时间每增加1小时,成绩平均增加5.2分。
大学统计学 ch8相关与回归分析
6 250.1 24 54 6 111.8 242 6 564.5 542
204.6 91.68 471
0.9846
(两者为高度正相关)
4 相关系数的显著性检验 检验两个变量之间是否存在线性相关关系,等价 于对回归系数b的检验。 步骤: 提出假设:H0: ;H1: 0 计算检验统计量:
x a y n b n nxy xy b 2 2 n x ( x )
解联立方程,得到
x a y n b n nxy xy b 2 2 n x ( x )
1 xy n x y xy x y b 2 2 1 2 2 x x x n ( x )
第八章
相关与回归分析
变量间的相关关系 一元线性回归模型
多元线性回归模型
非线性回归模型
第一节 变量间的相关关系
一、相关关系的概念
相关关系是指客观现象间确实存在的数量上不 是严格对应的依存关系。
变量之间关系 相关关系 因果关系
互为因果关系 随机性 依存关 系
共变关系
函数关系
确定性依存关系
二、相关关系的类型
令
Q ( y y ) 2 ( y a bx) 2
ˆ ) 2 min (y y
则
Q 2 ( y a bx)(1) 0 a Q 2 ( y a bx)( x) 0 b
解联立方程,得到
y na b x 2 xy a x b x
1、相关分析中,x与y对等,回 归分析中,x与y要确定自变量和 因变量; 2、相关分析中x,y均为随机变量 ,回归分析中,只有y为随机变量 3、相关分析测定相关程度和方向 ,回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以用 回归模型进行预测和控制。
应用回归分析,第8章课后习题参考答案
第8章 非线性回归思考与练习参考答案8.1 在非线性回归线性化时,对因变量作变换应注意什么问题?答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式。
如:(1) 乘性误差项,模型形式为e y AK L αβε=, (2) 加性误差项,模型形式为y AK L αβε=+ 。
对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。
一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。
8.2为了研究生产率与废料率之间的关系,记录了如表8.15所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。
表8.15生产率x (单位/周) 1000 2000 3000 3500 4000 4500 5000 废品率y (%)5.26.56.88.110.2 10.3 13.0解:先画出散点图如下图:5000.004000.003000.002000.001000.00x12.0010.008.006.00y从散点图大致可以判断出x 和y 之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。
(1)二次曲线 SPSS 输出结果如下:Model Summary.981.962.942.651R R SquareAdjusted R SquareStd. Error of the EstimateThe independent variable is x.ANOVA42.571221.28650.160.0011.6974.42444.2696Regression Residual TotalSum of Squares dfMean SquareF Sig.The independent v ariable is x .Coefficients-.001.001-.449-.891.4234.47E-007.0001.4172.812.0485.843 1.3244.414.012x x ** 2(Constant)B Std. E rror Unstandardized Coefficients BetaStandardizedCoefficients tSig.从上表可以得到回归方程为:72ˆ 5.8430.087 4.4710yx x -=-+⨯ 由x 的系数检验P 值大于0.05,得到x 的系数未通过显著性检验。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6.表中给出y 对2x 和3x 回归的结果:
离差来源 平方和(SS ) 自由度(df ) 平方和的均值(MSS ) 来自回归(ESS ) 65965 来自残差(RSS ) 总离差(TSS ) 66042 14
(1) 该回归分析中样本容量是多少? (2) 计算RSS ;
(3) ESS 和RSS 的自由度是多少? (4) 计算可决系数和修正的可决系数;
(5) 怎样检验2x 和3x 对y 是否有显著影响?根据以上信息能否确定2x 和3x 各自对
y 的贡献为多少?
解:(1)该回归分析中样本容量是14+1=15
(2)计算RSS=66042-65965=77
ESS 的自由度为k —1=2,RSS 的自由度 n-k=15—3=12 (3)计算:可决系数 2
65965/660420.9988R == 修正的可决系数 2151
1(10.9988)0.9986153
R -=-
⨯-=- (4)检验X2和X3对Y 是否有显著影响
/(1)65965/232982
5140.11/()77/12 6.4166
ESS k F RSS n k -=
===-
(5) F 统计量远比F 临界值大,说明X2和X3联合起来对Y 有显著影响,但并不能确定X2和X3各自对Y 的贡献为多少。
7. 在计算一元线性回归方程时,已得到以下结果:
试根据此结果,填写下表的空格:
来 源 平方和 自由度 方差 来自回归 2179.56
来自残差 99。
11 22 总离差平方和
2278。
67。