14练习题解答:第十四章 多元回归分析汇总
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十四章 多元回归分析
练习题:
1.为了研究某社区1500名居民的受教育年数(X )与收入(Y )的关系,随机抽取了20人进行调查,得到下表的结果。
根据统计结果, (1)画出散点图;
(2)X 与Y 之间是否呈直线关系?求出回归方程。 (3)计算X 与Y 的决定系数。
(4)在0.05的显著性水平下,作回归系数的显著性检验。
解:
(1)散点图:
(2)从散点图可以看出,受教育年数与收入呈现出线性相关的关系; 根据上表数据计算可得:
20n =,231X =∑,29950Y =∑,415900XY =∑,6918450X Y =∑∑,
2
3045X
=∑, 2()53361X =∑,259122500Y =∑,2()897002500Y =∑
根据一元线性回归方程Y a bX '=+回归直线的斜率b 和截距a 的计算公式可知:
2
2
2
()()()()()185.64
()()()X X Y Y n XY X Y b X X n X X ---=
==--∑∑∑∑∑∑∑
()-646.66Y b X a Y bX n
-=-=
=∑∑ 所以,回归方程是Y a bX
'=+=-646.66+185.64X
(3
)()()0.954n XY X Y r -=
决定系数20.910R r ==
(4)回归系数的检验:
研究假设1H :0b ≠(即0B ≠) 虚无假设0H :0b =(即0B =) 用F 检验法:
22122
2/(2)
(1)/1r df r n F r df r -==
-- df 1=k =1
df 2=n -k -1=20-1-1=18
其中,k 表示自变量的个数,将 20.910r =代入上式可得:182F =
在0.05的显著性水平下,从F 分布表可知df 1=1,df 2=18时。否定域是:F ≥4.41。因为F=182在否定域内,所以可否定虚无假设,接受研究假设。研究结论是:在0.05的显著性水平下,该社区居民的受教育年数(X )与收入(Y )呈线性相关的,且教育年数每增加一年,收入增加185.64元。
2.子女的受教育水平(Y )往往受到父母的受教育水平(X 1,X 2)以及家庭经济条件(X 3)的影响,我们对某单位10个人进行了调查,得到如下表格:
根据数据统计:
(1)求出各X 变量的回归系数,写出回归方程。 (2)计算X 与Y 的决定系数。
解:
(1)变量X 3为定序变量,对其重新赋值:“上”=3,“中”=2,“下”=1。 计算各个变量之间的积距相关系数为:
1y r =0.920,2y r =0.886,3y r =0.600,11r =1,12r =21r =0.848,13r =31r =0.719,23r =32r =0.545
将之代入下列方程组:
11221331y r B B r B r =++ 21122332y r B r B B r =++
31132233y r B r B r B =++
计算可得:
1B =0.672, 2B =0.360, 3B =-0.079
根据上表计算可得:
Y =13.70,y S =3.59;1X =9.80,1S =2.97;
2X =9.30,2S =2.41;3X =2.10,3S =0.74。
将之代入公式:
111
(
)y S b B S =
222
(
)y S b B S =
333
(
)y S b B S =
112233a Y b X b X b X =---
可得: a =1.54,1b =0.81, 2b =0.54, 3b =-0.38
(2)决定系数:
2123112233
0.6720.920+0.3600.886-0.0790.600=0.88980.90
y y y y R B r B r B r =++=⨯⨯⨯≈g
3.根据武汉市初中生日常行为状况调查的数据(data9),用SPSS 分析初中生平时每天做作业时间(1x ),看电视时间(2x ),睡觉时间(3x )对其目前学习成绩的影响(目前成绩在班级中的大致水平y ),并对结果进行解释。
解:《武汉市初中生日常行为状况调查问卷》: C2 你的成绩目前在本班大致属于
1)上等 2)中上等 3)中等 4)中下等 5)下等
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间
大约为(请填写具体时间,没有则填“0”) 平时(非节假日):
1)做作业_______小时 2)看电视_______小时 8)睡觉_______小时
“C2 你的成绩目前在本班大致属于?”这个题目的选项在data9中,“上等”赋值为“1”,“中上等”赋值为“2”,“中等”赋值为“3”,“中下等”赋值为“4”,“下等” 赋值为“5”,为了便于分析,通过Transform-Recode into Different Variables 命令将“下等”赋值为“1”,“中下等”赋值为
“2”,“中等”赋值为“3”,“中上等”赋值为“4”,“上等”赋值为“5”,生成新变量“成绩层次(cjcc)”。SPSS的操作步骤如下:
○1打开武汉市初中生日常行为状况调查的数据data9。
○2依次点击Anal yze→Regression→Linear,打开如图14-1(练习)所示的对话框。
图14-1(练习)Linear回归主对话框
○3将自变量“做作业时间c11a1”、“看电视时间c11a2”和“睡觉时间c11a8”放在Independent(s)框口,将因变量“成绩层次(cjcc)”放置在Dependent框中。Method栏中选择强制进入法Enter。○4点击按钮OK,SPSS依次输出下列结果。
表14-1(练习)纳入线性回归模型的变量
表14-2(练习)模型概况