贾俊平第四版统计学-第十一章一元线性回归练习答案

合集下载

贾俊平《统计学》章节题库-第十一章至第十二章(圣才出品)

贾俊平《统计学》章节题库-第十一章至第十二章(圣才出品)
2 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台

5.根据下面的散点图,可以判断两个变量之间存在( )。
A.正线性相关关系 B.负线性相关关系 C.非线性关系 D.函数关系 【答案】B 【解析】在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变 量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,则称为负线性相 关关系。
1 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台

3.下面的假定中,哪个属于相关分析中的假定( )。 A.两个变量之间是非线性关系 B.两个变量都是随机变量 C.自变量是随机变量,因变量不是随机变量 D.一个变量的数值增大,另一个变量的数值也应增大 【答案】B 【解析】在进行相关分析时,对总体主要有以下两个假定:①两个变量之间是线性关系; ②两个变量都是随机变量。
【答案】C 【解析】在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变
5 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台

量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,即 x 值增大时 y 值随之变小,或 x 值变小时 y 值随之增大,则称为负相关。
12.如果相关系数 r=0,则表明两个变量之间( )。 A.相关程度很低 B.不存在任何关系 C.不存在线性相关关系 D.存在非线性相关关系 【答案】C 【解析】相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。如 果相关系数 r=0,说明两个变量之间不存在线性相关关系。
13.设产品产量与产品单位成本之间的线性相关系数为-0.87,这说明二者之间存在着 ( )。
2.下面的各问题中,哪个不是相关分析要解决的问题( )。 A.判断变量之间是否存在关系 B.判断一个变量数值的变化对另一个变量的影响 C.描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系 【答案】B 【解析】相关分析就是对两个变量之间线性关系的描述与度量,它主要解决的问题包括: ①变量之间是否存在关系;②如果存在关系,它们之间是什么样的关系;③变量之间的关系 强度如何;④样本所反映的变量之间的关系能否代表总体变量之间的关系。

统计学贾俊平第四版课后习题答案

统计学贾俊平第四版课后习题答案

3.3 某百货公司连续40天的商品销售额如下:单位:万元41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42363737493942323635要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。

1、确定组数: ()lg 40lg() 1.60206111 6.32lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(49-25)÷6=4,取54.8 一项关于大学生体重状况的研究发现.男生的平均体重为60kg ,标准差为5kg ;女生的平均体重为50kg ,标准差为5kg 。

请回答下面的问题: (1)是男生的体重差异大还是女生的体重差异大?为什么?女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。

(2)以磅为单位(1ks=2.2lb),求体重的平均数和标准差。

都是各乘以2.21,男生的平均体重为60kg×2.21=132.6磅,标准差为5kg ×2.21=11.05磅;女生的平均体重为50kg×2.21=110.5磅,标准差为5kg×2.21=11.05磅。

(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间?计算标准分数:Z1=x xs-=55605-=-1;Z2=x xs-=65605-=1,根据经验规则,男生大约有68%的人体重在55kg一65kg之间。

(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间?计算标准分数:Z1=x xs-=40505-=-2;Z2=x xs-=60505-=2,根据经验规则,女生大约有95%的人体重在40kg一60kg之间。

统计学第四版贾俊平人大-回归与时间序列stata

统计学第四版贾俊平人大-回归与时间序列stata

回归分析与时间序列一、一元线性回归11。

1 (1)编辑数据集,命名为linehuigui1.dat输入命令scatter cost product,xlabel(#10,grid) ylabel(#10,grid),得到如下散点图,可以看到,产量和生产费用是正线性相关的关系。

(2)输入命令regcost product,得到如下图:可得线性函数(product为自变量,cost为因变量):y=0。

4206832x+124。

15,即β0=124。

15,β1=0。

4206832(3)对相关系数的显著性进行检验,可输入命令pwcorr cost product,sig star (.05) print(。

05),得到下图:可见,在α=0。

05的显著性水平下,P=0。

0000<α=0。

05,故拒绝原假设,即产量和生产费用之间存在显著的正相关性。

11。

2 (1)编辑数据集,命名为linehuigui2。

dat输入命令scatterfenshu time,xlabel(#4, grid) ylabel(#4,grid),得到如下散点图,可以看到,分数和复习时间是正线性相关的关系。

2)输入命令cor fenshu time计算相关系数,得下图:可见,r=0.8621,可见分数和复习时间之间存在高度的正相关性。

11.3 (1)(2)对于线性回归方程y=10-0。

5x,其中β0=10,表示回归直线的截距为10;β1=—0.5,表示x变化一单位引起y的变化为—0.5。

(3)x=6时,E(y)=10-0.5*6=7.11.4(1)R2=SSRSST =SSRSSR+SSE=3636+4=0.9,判定系数R2测度了回归直线对观测数据的拟合程度,即在分数的变差中,有90%可以由分数与复习时间之间的线性关系解释,或者说,在分数取值的变动中,有90%由复习时间决定。

可见,两者之间有很强的线性关系.(2)估计标准误差S e=√SSEn−2=√418−2=0.25分,即根据复习时间来估计分数时,平均的估计误差为0.25分.11.5 (1)编辑数据集,命名为linehuigui3。

统计学第四版答案(贾俊平)

统计学第四版答案(贾俊平)

统计学第四版答案(贾俊平)第1章统计和统计数据1.1 指出下⾯的变量类型。

(1)年龄。

(2)性别。

(3)汽车产量。

(4)员⼯对企业某项改⾰措施的态度(赞成、中⽴、反对)。

(5)购买商品时的⽀付⽅式(现⾦、信⽤卡、⽀票)。

详细答案:(1)数值变量。

(2)分类变量。

(3)数值变量。

(4)顺序变量。

(5)分类变量。

1.2 ⼀家研究机构从IT从业者中随机抽取1000⼈作为样本进⾏调查,其中60%回答他们的⽉收⼊在5000元以上,50%的⼈回答他们的消费⽀付⽅式是⽤信⽤卡。

(1)这⼀研究的总体是什么?样本是什么?样本量是多少?(2)“⽉收⼊”是分类变量、顺序变量还是数值变量?(3)“消费⽀付⽅式”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。

(2)数值变量。

(3)分类变量。

1.3 ⼀项调查表明,消费者每⽉在⽹上购物的平均花费是200元,他们选择在⽹上购物的主要原因是“价格便宜”。

(1)这⼀研究的总体是什么?(2)“消费者在⽹上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的⽹上购物者”。

(2)分类变量。

1.4 某⼤学的商学院为了解毕业⽣的就业倾向,分别在会计专业抽取50⼈、市场营销专业抽取30、企业管理20⼈进⾏调查。

(1)这种抽样⽅式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。

(2)100。

第3章⽤统计量描述数据为7.2分钟,标准差为1.97分钟,第⼆种排队⽅式的等待时间(单位:分钟)如下:5.56.6 6.7 6.87.1 7.3 7.4 7.8 7.8(1)计算第⼆种排队时间的平均数和标准差。

(2)⽐两种排队⽅式等待时间的离散程度。

(3)如果让你选择⼀种排队⽅式,你会选择哪⼀种?试说明理由。

详细答案:(1)(岁);(岁)。

(2);。

第⼀中排队⽅式的离散程度⼤。

一元线性回归模型习题及答案

一元线性回归模型习题及答案

一元线性回归模型一、单项选择题1、变量之间的关系可以分为两大类__________。

AA 函数关系与相关关系B 线性相关关系和非线性相关关系C 正相关关系和负相关关系D 简单相关关系和复杂相关关系 2、相关关系是指__________。

DA 变量间的非独立关系B 变量间的因果关系C 变量间的函数关系D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________。

AA 都是随机变量B 都不是随机变量C 一个是随机变量,一个不是随机变量D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________。

CA 01ˆˆˆt tY X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+5、参数β的估计量ˆβ具备有效性是指__________。

B A ˆvar ()=0βB ˆvar ()β为最小C ˆ()0ββ-= D ˆ()ββ-为最小 6、对于01ˆˆi i iY X e ββ=++,以σˆ表示估计标准误差,Y ˆ表示回归值,则__________。

B A ii ˆˆ0Y Y 0σ∑=时,(-)=B 2ii ˆˆ0Y Y σ∑=时,(-)=0 C ii ˆˆ0Y Y σ∑=时,(-)为最小 D 2iiˆˆ0Y Yσ∑=时,(-)为最小 7、设样本回归模型为i 01i iˆˆY =X +e ββ+,则普通最小二乘法确定的i ˆβ的公式中,错误的是__________。

DA ()()()i i 12i X X Y -Y ˆX X β--∑∑= B ()i i i i 122i i n X Y -X Y ˆn X -X β∑∑∑∑∑=C i i 122iX Y -nXY ˆX -nX β∑∑= D i i i i12xn X Y -X Y ˆβσ∑∑∑=8、对于i 01i iˆˆY =X +e ββ+,以ˆσ表示估计标准误差,r 表示相关系数,则有__________。

贾俊平第四版统计学-第十一章一元线性回归练习题

贾俊平第四版统计学-第十一章一元线性回归练习题

第十一章一元线性回归练习题一.选择题1.具有相关关系的两个变量的特点是( ) A .一个变量的取值不能由另一个变量唯一确定B .一个变量的取值由另一个变量唯一确定C .一个变量的取值增大时另一个变量的取值也一定增大D .一个变量的取值增大时另一个变量的取值肯定变小 2.下面的各问题中,哪个不是相关分析要解决的问题A .判断变量之间是否存在关系B .判断一个变量数值的变化对另一个变量的影响C .描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系3.根据下面的散点图,可以判断两个变量之间存在( )A. 正线性相关关系B. 负线性相关关系C. 非线性关系D. 函数关系 4.下面的陈述哪一个是错误的( )A.相关关系是度量两个变量之间线性关系强度的统计量 B .相关系数是一个随机变量 C .相关系数的绝对值不会大于1 D .相关系数不会取负值5.根据你的判断,下面的相关系数取值哪一个是错误的( ) A. -0.86 B. 0.78 C. 1.25 D. 06.如果相关系数r=0,则表明两个变量之间( ) A.相关程度很低 B. 不存在任何关系C .不存在线性相关关系 D.存在非线性关系 7.下列不属于相关关系的现象是( )A. 银行的年利息率与贷款总额B.居民收入与储蓄存款C.电视机的产量与鸡蛋产量D.某种商品的销售额与销售价格8.设产品产量与产品单位成本之间的线性相关系数为-0.87,这说明二者之间存在着( ) A. 高度相关 B.中度相关 C.低度相关 D.极弱相关 9.在回归分析中,被预测或被解释的变量称为( ) A.自变量 B.因变量 C.随机变量 D.非随机变量10. 对两变量的散点图拟合最好的回归线,必须满足一个基本的条件是( ) A. 2ˆ()yy ∑-最小 B. 2)(y y ∑-最大C.2ˆ()yy ∑-最大 D. 2)(ˆy y∑-最小11. 下列哪个不属于一元回归中的基本假定( )A.误差项i ε服从正态分布B. 误差项i ε的期望值为0C. 误差项i ε相互独立D. 对于所有的X ,方差都相同12.如果两个变量之间存在着负相关,指出下列回归方程中哪个肯定有误( ) A.x y 75.025ˆ-= B. x y 86.0120ˆ+-= C. x y 5.2200ˆ-= D. x y 74.034ˆ--=13.对不同年份的产品成本拟合的直线方程为,75.1280ˆx y -=y 表示产品成本,x 表示不同年份,则可知( )A.时间每增加一个单位,产品成本平均增加1.75个单位B. 时间每增加一个单位,产品成本平均下降1.75个单位C.产品成本每变动一个单位,平均需要1.75年时间D. 产品成本每减少一个单位,平均需要1.75年时间 14.在回归分析中,F 检验主要是用来检验( )A .相关关系的显著性 B.回归系数的显著性 C. 线性关系的显著性D.估计标准误差的显著性15.说明回归方程拟合优度的统计量是( )A. 相关系数B.回归系数C. 判定系数D. 估计标准误差16.已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R 2=( ) A.97.08% B.2.92% C.3.01% D. 33.25% 17. 判定系数R2值越大,则回归方程( )A 拟合程度越低B 拟合程度越高C 拟合程度有可能高,也有可能低D 用回归方程进行预测越不准确 18. 居民收入与储蓄额之间的相关系数可能是( ) A -0.9247 B 0.9247 C -1.5362 D 1.536219.在对一元回归方程进行显著性检验时,得到判定系数R 2=0.80,关于该系数的说法正确的是( )A.该系数越大,则方程的预测效果越好B. 该系数越大,则由回归方程所解释的因变量的变差越多C. 该系数越大,则自变量的回归对因变量的相关关系越显著D.该回归方程中自变量与因变量之间的相关系数可能小于0.8 20.下列方程中肯定错误的是( )A. x y48.015ˆ-=,r=0.65 B. x y 35.115ˆ--=, r= - 0.81 C. x y85.025ˆ+-=, r=0.42 D. x y 56.3120ˆ-=, r= - 0.96 21. 若两个变量存在负相关关系,则建立的一元线性回归方程的判定系数R 2的取值范围是( )A.【0,1】B. 【-1,0】C. 【-1,1】D.小于0的任意数二.填空题1.当从某一总体中抽取了一样本容量为30的样本,并计算出某两个变量的相关系数为0.8时,我们是否可认为这两个变量存在着强相关性( ) ,理由是( )。

贾俊平《统计学》(第5版)章节题库-第十一章至第十四章【圣才出品】

贾俊平《统计学》(第5版)章节题库-第十一章至第十四章【圣才出品】

2.下面的各问题中,哪个不是相关分析要解决的问题( )。 A.判断变量之间是否存在关系 B.判断一个变量数值的变化对另一个变量的影响 C.描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系 【答案】B 【解析】相关分析就是对两个变量之间线性关系的描述与度量,它主要解决的问题包括: ①变量之间是否存在关系;②如果存在关系,它们之间是什么样的关系;③变量之间的关系 强度如何;④样本所反映的变量之间的关系能否代表总体变量之间的关系。
9.根据你的判断,下面的相关系数取值哪一个是错误的( )。 A.-0.86 B.0.78 C.1.25 D.0
4 / 166
圣才电子书

【答案】C
十万种考研考证电子书、题库视频学习平台
【解析】相关系数 r 的取值范围是[-1,1]。
10.下面关于相关系数的陈述中哪一个是错误的( )。 A.数值越大说明两个变量之间的关系就越强 B.仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系 C.只是两个变量之间线性关系的一个度量,不一定意味着两个变量之间一定有因果关 系 D.绝对值不会大于 l 【答案】A 【解析】相关系数的性质有:①r 的取值范围是[-1,1];②r 具有对称性;③r 的数值
6 / 1பைடு நூலகம்6
圣才电子书 十万种考研考证电子书、题库视频学习平台
【答案】C 【解析】在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变
5 / 166
圣才电子书 十万种考研考证电子书、题库视频学习平台

量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,即 x 值增大时 y 值随之变小,或 x 值变小时 y 值随之增大,则称为负相关。

贾俊平第四版统计学-第十一章一元线性回归练习答案

贾俊平第四版统计学-第十一章一元线性回归练习答案

第十一章一元线性回归练习题答案二.填空题 1. 不能;因为该相关系数为样本计算出的相关系数,它的大小受样本数据波动的影响,它是否显著尚需检验;t 检验;2.图1;不能;因为图1反映的是线性相关关系,图2反映的是非线性性相关关系,相关系数只能反映线性相关变量间的相关性的强弱,不能反映非线性相关性的强弱。

三.计算题1.(1) SSR 的自由度是1,SSE 的自由度是18。

(2)2418/6080220/1/==-=SSE SSR F(3)判定系数%14.57140802===SST SSR R 在y 的总变差中,由57.14%的变差是由于x 的变动说引起的。

(4)7559.05714.02-=-=-=R r相关系数为-0.7559。

(5)线性关系显著和:线性关系不显著和y x y x H 10H :因为414.424=>=αF F,所以拒绝原假设,x 与y 之间的线性关系显著。

2.(1)方差分析表df SS MS F Significance F回归分析 1 425 425 85 0.017 残差 15 75 5 - - 总计16500---(2)判定系数%8585.05004252====SST SSR R表明在维护费用的变差中,有85%的变差可由使用年限来解释。

(3)9220.085.02===R r二者相关系数为0.9220,属于高度相关(4)x y248.1388.6ˆ+= 分布;显著。

的自由度为t n r n r t 2);12||2---=回归系数为1.248,表示每增加一个单位的产量,该行业的生产费用将平均增长1.248个单位。

(5)线性关系显著性检验:线性关系显著:生产费用和产量之间性关系不显著生产费用和产量之间线10:H H因为Significance F=0.017<05.0=α,所以线性关系显著。

(6)348.3120248.1388.6248.1388.6ˆ==⨯++=x y当产量为10时,生产费用为31.348万元。

统计学一元线性回归课后习题答案 ppt课件

统计学一元线性回归课后习题答案 ppt课件

2)=2.2281由于t=7.435453>t(12-2)=2.2281,
拒绝H0,产量与生产费用之间存在着显著的正线性
相关关系
统计学一元线性回归课后习题答案
11.2 学生在期末考试之前用于复习的时间(单位:小时)和考 试分数(单位:分)之间是否有关系?为研究这一问题,一位 研究者抽取了由8名学生构成的一个随机样本,取得的数据如 下:
81444968681133169213057950372ssr提出假设提出假设人均消费水平不人均人均消费水平不人均gdpgdp乊间的线性关系丌显著线性关系丌显著计算检验统计量计算检验统计量f确定显著性水平确定显著性水平005005并根据分子自由度并根据分子自由度11和分母自和分母自由度7722找出临界值找出临界值ff661661作出决策
人均GDP为5 000元时,人均消费水平95%的
置信区间为[1990.7491统5计,学一2元5线6性5回.4归6课3后9习9题]答案
解:根据前面的计算结果,已知n=7,t(7-2)=2.5706
n
se
yiy ˆi2
i 1
SSE305795.034361159.007
n2 n2
5
预测区间为
2 2 7 8 .1 0 7 8 2 .5 7 0 6 * 6 1 1 5 9 .0 0 71 + 1 5 0 0 0 4 5 1 5 .5 7 1 4 2
复习 时间X
考试 分数Y
20 16 34 23 27 32 18 22 64 61 84 70 88 92 72 77
统计学一元线性回归课后习题答案
要求:(1)绘制复习时间和考试分数的散点图,判断二者之 间的关系形态。
分数
100 90 80 70 60 50 40 30 20 10 0

贾俊平《统计学》配套题库 【课后习题】详解 第11章~第12章【圣才出品】

贾俊平《统计学》配套题库  【课后习题】详解  第11章~第12章【圣才出品】

第11章一元线性回归一、思考题1.解释相关关系的含义,说明相关关系的特点。

答:变量之间存在的不确定的数量关系,称为相关关系。

相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个。

对这种关系不确定的变量是不能用函数关系进行描述的。

2.相关分析主要解决哪些问题?答:相关分析就是对两个变量之间线性关系的描述与度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本所反映的变量之间的关系能否代表总体变量之间的关系。

3.相关分析中有哪些基本假定?答:在进行相关分析时,对总体主要有以下两个假定:(1)两个变量之间是线性关系;(2)两个变量都是随机变量。

4.简述相关系数的性质。

答:相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。

若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;若是根据样本数据计算的,则称为样本相关系数,记为r 。

相关系数的性质:(1)r 的取值范围在-1~+1之间,即-1≤r ≤1。

若0<r ≤1,表明x 与y 之间存在正线性相关关系;若-1≤r <0,表明x 与y 之间存在负线性相关关系;若r =+1,表明x 与y 之间为完全正线性相关关系;若r =-1,表明x 与y 之间为完全负线性相关关系。

可见当|r |=1时,y 的取值完全依赖于x ,二者之间即为函数关系;当r =0时,说明y 的取值与x 无关,即二者之间不存在线性相关关系。

(2)r 具有对称性。

x 与y 之间的相关系数xy r 和y 与x 之间的相关系数yx r 相等,即xy r =yx r 。

(3)r 数值大小与x 和y 的原点及尺度无关。

改变x 和y 的数据原点及计量尺度,并不改变r 数值大小。

(4)r 仅仅是x 与y 之间线性关系的一个度量,它不能用于描述非线性关系。

统计学(贾5)课后练答案(11-14章)

统计学(贾5)课后练答案(11-14章)

第11章 一元线性回归分析11.1(1)散点图(略),产量与生产费用之间正的线性相关关系。

(2)920232.0=r(3) 检验统计量2281.24222.142=>=αt t ,拒绝原假设,相关系数显著。

11.2 (1)散点图(略)。

(2) 8621.0=r11.3 (1)0ˆβ表示当0=x 时y 的期望值。

(2)1ˆβ表示x 每变动一个单位y 平均下降0.5个单位。

(3) 7)(=y E 11.4 (1)%902=R (2)1=e s11.5 一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态: (2)计算线性相关系数,说明两个变量之间的关系强度。

(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

(2)x 运送距离(km )y 运送时间(天)x 运送距离(km )Pearson 相关性 1.949(**) 显著性(双侧)0.000 N10 10 y 运送时间(天)Pearson 相关性 .949(**) 1显著性(双侧) 0.000 N**. 在 .01 水平(双侧)上显著相关。

有很强的线性关系。

(3)模型非标准化系数标准化系数 t显著性B标准误Beta1(常量)0.1180.3550.3330.748x运送距离(km)a. 因变量: y运送时间(天)回归系数的含义:每公里增加0.004天。

(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。

(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。

(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

(4)计算判定系数,并解释其意义。

(5)检验回归方程线性关系的显著性(a=0.05)。

(6)如果某地区的人均GDP为5 000元,预测其人均消费水平。

(7)求人均GDP为5 000元时,人均消费水平95%的置信区间和预测区间。

一元线性回归习题答案

一元线性回归习题答案

一元线性回归习题答案一元线性回归是统计学中常用的一种回归分析方法,用于研究两个变量之间的关系。

在实际应用中,我们常常需要根据给定的数据集来建立一元线性回归模型,并通过该模型来预测或解释变量之间的关系。

本文将通过一些习题来解答一元线性回归的相关问题。

假设我们有一组数据集,包含了自变量x和因变量y的取值。

我们的目标是建立一个线性回归模型,用于预测y在给定x值时的取值。

首先,我们需要计算相关系数r来衡量x和y之间的线性关系强度。

相关系数的取值范围为-1到1,接近1表示正相关,接近-1表示负相关,接近0表示无相关。

接下来,我们可以使用最小二乘法来估计回归方程的参数。

最小二乘法的基本思想是通过最小化误差平方和来确定回归方程的参数。

回归方程的一般形式为y = a + bx,其中a为截距,b为斜率。

我们可以通过计算公式来求解a和b的值。

在实际计算中,我们可以使用统计软件或编程语言来进行计算。

例如,使用Python中的scikit-learn库可以很方便地进行一元线性回归分析。

以下是一个使用Python进行一元线性回归的示例代码:```pythonimport numpy as npfrom sklearn.linear_model import LinearRegression# 定义自变量和因变量的取值x = np.array([1, 2, 3, 4, 5])y = np.array([2, 4, 6, 8, 10])# 将自变量转换为二维数组X = x.reshape(-1, 1)# 创建线性回归模型model = LinearRegression()# 拟合数据model.fit(X, y)# 输出回归方程的参数print("截距a =", model.intercept_)print("斜率b =", model.coef_)```运行以上代码,我们可以得到回归方程的参数值。

统计学第四版(贾俊平)课后思考题答案

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。

它也是有类别的,但这些类别是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。

统计学第十一章课后习题答案

统计学第十一章课后习题答案

11.1(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。

散点图如下:从上图,可以看出产量与生产费用的关系为正的线性相关关系。

(2)计算产量与生产费用之间的线性相关系数。

r=0.920232(3)对相关系数的显著性进行检验(a=0.05),并说明二者之间的关系系数。

假设:H o:ρ=0,H1:ρ≠0计算检验的统计量:t=|r|=|0.92-232|=7.435当a=0。

05时,t(12-2)=2.228。

由于检验统计量t=7.435>t=2.228,拒绝原假设。

表明产量与生产费用之间的线性关系显著。

11.2(1)散点图如下:(2)r=0.8621,正相关11.3(1)=10表示当X=0时Y的期望值为10(2)=-0.5表示X每增加1个单位,Y平均下降0.5个单位。

(3)X=6时,E(Y)=10-0.5x6=711.4.(1),表示,在因变量y取值的变差中,有90%可以由x与y之间的线性关系来解释。

(2)。

表示,当用x来预测y时,平均的预测误差为0.5.11.5(1)散点图如下:(2)r=0.9489,因为r>0.8,所以运送时间与运送距离有较强的正线性关系。

(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

得到的回归方程为,回归系数表示运送距离每增加1公里,运送时间平均增加0.003585天。

11.6(1)散点图如下:从上图可知,人均gdp和人均消费水平为正相关关系(2) r=0.998128,具有非常强的正线性关系。

(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

得到的回归方程为:。

回归系数表示人均GDP每增加1元,人均消费水平平均增加0.308683元。

(4)判定系数,表明在人均消费水平的变差中,有99.6259%是由人均GDP决定的。

(5)首先提出如下假设:由于significant F<,拒绝原假设,表明人均GDP与人均消费水平之间的线性关系显著。

贾俊平《统计学》复习笔记课后习题详解及典型题详解 第11章~第12章【圣才出品】

贾俊平《统计学》复习笔记课后习题详解及典型题详解  第11章~第12章【圣才出品】
3 / 97
圣才电子书 十万种考研考证电子书、题库视频学习平台
4 / 97
圣才电子书 十万种考研考证电子书、题库视频学习平台

图 11-1 不同形态的散点图
(4)相关系数
通过散点图可以判断两个变量之间有无相关关系,并对变量间的关系形态作出大致的描
有所差异。样本相关系数是总体相关系数的一致估计量。样本相关系数记为 r,其计算公式
为:
r
n xy x y
n x2 ( x)2 n y2 ( y)2
按照上述计算公式计算的相关系数也称为线性相关系数,或 Pearson 相关系数。 ②相关系数的性质 a.r 的取值范围在-1~+1 之间,即-1≤r≤1。若 0<r≤1,表明 x 与 y 之间存在正 线性相关关系;若-1≤r<0,表明 x 与 y 之间存在负线性相关关系;若 r=+1,表明 x 与
5 / 97
圣才电子书 十万种考研考证电子书、题库视频学习平台

y 之间为完全正线性相关关系;若 r=-1,表明 x 与 y 之间为完全负线性相关关系。可见当 |r|=1 时,y 的取值完全依赖于 x,二者之间即为函数关系;当 r=0 时,说明 y 的取值与 x 无关,即二者之间不存在线性相关关系。|r|→1 说明两个变量之间的线性关系越强;|r|→0 说明两个变量之间的线性关系越弱。
b.r 具有对称性。x 与 r 之间的相关系数 rxy 和 y 与 x 之间的相关系数 ryx 相等,即 rxy =ryx。
c.r 数值大小与 x 和 y 的原点及尺度无关。改变 x 和 y 的数据原点及计量尺度,并不 改变 r 的数值大小。
述,但不能准确反映变量之间的关系强度。需要计算相关系数来准确度量两个变量之间的关
系强度。

统计学贾俊平_第四版课后习题答案

统计学贾俊平_第四版课后习题答案

统计学贾俊平_第四版课后习题答案3.3 某百货公司连续40天的商品销售额如下:单位:万元41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。

1、确定组数:()lg 40lg() 1.60206111 6.32lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(49-25)÷6=4,取54.8 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。

请回答下面的问题:(1)是男生的体重差异大还是女生的体重差异大?为什么?女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。

(2)以磅为单位(1ks=2.2lb),求体重的平均数和标准差。

都是各乘以2.21,男生的平均体重为60kg×2.21=132.6磅,标准差为5kg ×2.21=11.05磅;女生的平均体重为50kg×2.21=110.5磅,标准差为5kg×2.21=11.05磅。

(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间?计算标准分数:Z1=x xs-=55605-=-1;Z2=x xs-=65605-=1,根据经验规则,男生大约有68%的人体重在55kg一65kg之间。

(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间?计算标准分数:Z1=x xs-=40505-=-2;Z2=x xs-=60505-=2,根据经验规则,女生大约有95%的人体重在40kg一60kg之间。

一元线性回归模型习题和答案解析

一元线性回归模型习题和答案解析
33、计量经济模型中的被解释变量一定是__________。C
A.控制变量B.政策变量
C.内生变量D.外生变量
二、多项选择题
1、指出下列哪些现象是相关关系__________。ACD
A家庭消费支出与收入B商品销售额与销售量、销售价格
C物价水平与商品需求量D小麦高产与施肥量
E学习成绩总分与各门课程分数
回归变差(回归平方和)
剩余变差(残差平方和)
估计标准误差
样本决定系数
相关系数
显著性检验
t检验
经济预测
点预测
区间预测
拟合优度
残差
四、简答
1、在计量经济模型中,为什么会存在随机误差项?
答:①模型中被忽略掉的影响因素造成的误差;②模型关系认定不准确造成的误差;③变量的测量误差;④随机因素。这些因素都被归并在随机误差项中考虑。因此,随机误差项是计量经济模型中不可缺少的一部分。
A
B
C
D
E
17、调整后的判定系数 的正确表达式有__________。BCD
A B
C D
E
18、对总体线性回归模型进行显著性检验时所用的F统计量可表示为__________。BC
A B
C D
E
三、名词解释
函数关系与相关关系
线性回归模型
总体回归模型与样本回归模型
最小二乘法
高斯-马尔可夫定理
总变量(总离差平方和)
A
B
C
D
7、设样本回归模型为 ,则普通最小二乘法确定的 的公式中,错误的是__________。D
A
B
C
D
8、对于 ,以 表示估计标准误差,r表示相关系数,则有__________。D

统计学第十一章一元线性回归课后作业

统计学第十一章一元线性回归课后作业

第十一章 一元线性回归1.1.(1)产量与生产费用之间正的线性相关关系。

(2)920232.0=r 。

(3)检验统计量2281.24222.142=>=αt t ,拒绝原假设,相关系数显著。

2.8621.0=r 5. (1)(2)9489.0=r 。

(3)x y 00358.01181.0ˆ+=。

回归系数00358.0ˆ1=β表示运送距离每增加1公里,运送时间平均增加0.00358天。

6.(1)二者之间为高度的正线性相关关系。

(2)998128.0=r ,二者之间为高度的正线性相关关系。

(3)估计的回归方程为:x y 308683.06928.734ˆ+=。

回归系数308683.0ˆ1=β表示人均GDP 每增加1元,人均消费水平平均增加0.308683元。

(4)判定系数996259.02=R。

表明在人均消费水平的变差中,有99.6259%是由人均GDP 决定的。

(5)检验统计量61.6692.1331=>=αF F ,拒绝原假设,线性关系显著。

(6)1078.22785000308683.06928.734ˆ5000=⨯+=y (元)。

7.(1)数据散点图如下:00.20.40.60.811.21.46570758085航班正点率(%)投诉率(次/10万名乘客)(2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,两者之间存在着一定的负相关关系。

(3)设投诉率为Y ,航班正点率为X建立回归方程 12i i i Y X u ββ=++估计参数为 ^6.01780.07i i Y X =-(4)参数的经济意义是航班正点率每提高一个百分点,相应的投诉率(次/10万名乘客)下降0.07。

(5)航班按时到达的正点率为80%,估计每10万名乘客投诉的次数可能为:4187.08007.00178.6ˆ=⨯-=iY (次/10万) 8.Excel 输出的结果如下Multiple R 0.7951 R Square 0.6322 Adjusted R Square 0.6117 标准误差 2.6858观测值 20 方差分析dfSS MS F Significance F 回归分析 1 223.1403 223.1403 30.93322.79889E-05残差 18 129.8452 7.2136总计 19 352.9855Coefficients标准误差t Stat P-value Lower 95%Upper 95%Intercept 49.3177 3.8050 12.9612 0.0000 41.3236 57.3117 X Variable 10.24920.04485.5618 0.0000 0.15510.34349.(1)方差分析表中所缺的数值如下方差分析表变差来源 df SS MS F Significance F 回归 1 1422708.6 1422708.6 354.277 2.17E-09 残差 10 40158.07 4015.807 — — 总计 111642866.67———(2)%60.868660.067.164286660.14227082====SSTSSR R。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十一章一元线性回归练习题答案
二.填空题 1. 不能;因为该相关系数为样本计算出的相关系数,它的大小受样本数据波动的影响,它是否显著尚需
检验;t 检验;
2.
图1;不能;因为图1反映的是线性相关关系,图2反映的是非线性性相关关系,相关系数只能反映
线性相关变量间的相关性的强弱,不能反映非线性相关性的强弱。

三.计算题
1.(1) SSR 的自由度是1,SSE 的自由度是18。

(2)2418
/6080220/1/==-=
SSE SSR F
(3)判定系数%14.57140
802
===
SST SSR R 在y 的总变差中,由57.14%的变差是由于x 的变动说引起的。

(4)7559.05714.02-=-=-=R r
相关系数为-0.7559。

(5)线性关系显著和:线性关系不显著
和y x y x H 10H :
因为414.424=>=αF F
,所以拒绝原假设,x 与y 之间的线性关系显著。

2.(1)
方差分析表
df SS MS F Significance F
回归分析 1 425 425 85 0.017 残差 15 75 5 - - 总计
16
500



(2)判定系数%8585.0500
425
2
====
SST SSR R
表明在维护费用的变差中,有85%的变差可由使用年限来解释。

(3)9220.085.02===R r
二者相关系数为0.9220,属于高度相关
(4)
x y
248.1388.6ˆ+= 分布;显著。

的自由度为t n r n r t 2);12
||2
---=
回归系数为1.248,表示每增加一个单位的产量,该行业的生产费用将平均增长1.248个单位。

(5)线性关系显著性检验:
线性关系显著
:生产费用和产量之间性关系不显著生产费用和产量之间线10:H H
因为Significance F=0.017<05.0=α,所以线性关系显著。

(6)
348.3120248.1388.6248.1388.6ˆ==⨯++=x y
当产量为10时,生产费用为31.348万元。

相关文档
最新文档