卢淑华—相关与回归分析练习题
回归分析练习题(有标准答案)
![回归分析练习题(有标准答案)](https://img.taocdn.com/s3/m/a5c8e3a88662caaedd3383c4bb4cf7ec4afeb63e.png)
回归分析练习题(有答案)作者:日期:1.1回归分析的基本思想及其初步应用一、选择题1.某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为均值为2,数据y 的平均值为3,则()A .回归直线必过点(2,3)C 点(2,3)在回归直线上方B.回归直线一定不过点(2,3)D 点(2,3)在回归直线下方y bx a ,已知:数据x 的平2.在一次试验中,测得(x, y)的四组值分别是A (1,2),B(2,3),C(3,4),D(4,5),则丫与X 之间的回归直线方程为()A.$x1B .$ x 2C$2x1D.$ x 13.在对两个变量x ,y 进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释;③求线性回归方程;④求未知参数;②收集数据(X j 、y i ),i 1,2,…,n ;⑤根据所搜集的数据绘制散点图)如果根据可行性要求能够作岀变量A.①②⑤③④Bx, y 具有线性相关结论,则在下列操作中正确的是(C.②④③①⑤D .②⑤④③①.③②④⑤①4.下列说法中正确的是()B人的知识与其年龄具有相关关系D 根据散点图求得的回归直线方程都是有意义的A.任何两个变量都具有相关关系C.散点图中的各点是分散的没有规律5.给出下列结论:2 2(1)在回归分析中,可用指数系数R 的值判断模型的拟合效果,R 越大,模型的拟合效果越好;(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;(3)在回归分析中,可用相关系数r 的值判断模型的拟合效果,较合适带状区域的宽度越窄,说明模型的拟合精度越高.A.y 平均增加1.5个单位B.A. 1B )个..2r 越小,模型的拟合效果越好;(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比y 平均增加2个单位C.y 平均减少1.5个单位C.3DD.y 平均减少2个单位.4以上结论中,正确的有(6.已知直线回归方程为y7.2 1.5x ,则变量x 增加一个单位时()下面的各图中,散点图与相关系数r 不符合的是()\ 1V ||一1,— 1 < r<(>■r?■* ■■■■* ■..* .**打4X(7UV1)D.'8.一位母亲记录了儿子39岁的身高,由此建立的身高与年龄的回归直线方程为据此可以预测这个孩子10岁时的身高,则正确的叙述是(A.身高一定是145.83cm C.身高低于145.00cm BD)7.19x 73.93,.身高超过146.00cm身高在145.83cm左右9.(A)预报变量在x轴上,解释变量在y轴上(B)解释变量在x轴上,预报变量在y轴上(C)(D)在画两个变量的散点图时,下面哪个叙述是正确的()可以选择两个变量中任意一个变量在x轴上可以选择两个变量中任意一个变量在y轴上10.两个变量y与x的回归模型中,通常用R2来刻画回归的效果,则正确的叙述是(22)A.R越小,残差平方和小2B.R越大,残差平方和大2c.R于残差平方和无关D.R越小,残差平方和大211.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是()A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.802 2C.模型3的相关指数R为0.50 D.模型4的相关指数R为0.2512.回归直线上相应位置的差异的是A.总偏差平方和B.C.回归平方和13.回归直线方程为残差平方和D.相关指数R2在回归分析中,代表了数据点和它在()工人月工资(元)依劳动生产率(千元)变化的60 90x,下列判断正确的是()A.劳动生产率为1000元时,工资为50元B.劳动生产率提高1000元时,工资提高150元C.劳动生产率提高1000元时,工资提高90元D.劳动生产率为1000元时,工资为90元14.下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①② E.①②③ C.①②④ D.①②③④15.已知回归直线的斜率的估计值为中心为(4,5),则回归直线方程为()1.23,样本点的A.$ 1.23x 4B.$ 1.23x 5C.$ 1.23x 0.08D.y 0.08x 1.2316.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数果好的模型是 __________.17.在回归分析中残差的计算公式为 ____________.18.线性回归模型y bx a e(a和b为模型的未知参数)中,e称为_________________.19.若一组观测值(X1,yJ(X2,y2)…(Xn,y“)之间满足yi=bXi+a+e(i=1、2.…n)若恒为0,则氏为______________R2的值分别约为0.96和0.85,则拟合效20.调查某市出租车使用年限x 和该年支出维修费用y (万元),得到数据如下:使用年限x 维修费用y(求线性回归方程;n22.233.845.556. 567.0(2)由(1)中结论预测第10年所支出的维修费用.i 1(X i x) (y iy).n(X ii 1x)2bx21.以下是某地搜集到的新房屋的销售价格闵屋面积Ey 和房屋的面积x 的数据:11524.Q1102 1. CIB-413G29.21口丘22t 肖年愉梧(1)画岀数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150m2时的销售价格(4)求第2个点的残差。
第5章相关分析和回归分析作业答案1
![第5章相关分析和回归分析作业答案1](https://img.taocdn.com/s3/m/c988aa94c8d376eeafaa3123.png)
第5章相关分析和回归分析作业答案1.当变量x按一定数值变化时,变量y也近似地按固定数值变化,这表明变量x和变量y之间存在着( 3 )①完全相关关系②复相关关系③直线相关关系④没有相关关系2.单位产品成本与其产量的相关:单位产品成本与单位产品原材料消耗量的相关( 2)①前者是正相关,后者是负相关②前者是负相关,后者是正相关③两者都是正相关④两者都是负相关3.相关系数r的取值范围( 2 )①-∞<r<+∞②-1≤r≤+1③<r<1 ④0≤r≤+14.当所有观测值都落在回归直线上,则x与y之间的相关系数( 4 )①.②1③1 ④15.相关分析与回归分析,在是否需要确定自变量和因变量的问题上( 1 )①前者无须确定,后者需要确定②前者需要确定,后者勿需确定③两者均需确定④两者都无需确定6.—元线性回归模型的参数有( 2 )①一个②两个③三个④三个以上7.直线相关系数的绝对值接近1时,说明两变量相关关系的密切程度是( 1 )①完全相关②微弱相关③无线性相关④高度相关8.年劳动生产率x(千元)和工人工资y(元)之间的回归方程为10+7,这意味着年劳动生产率每提高1千元时,工人工资平均( 1 )①增加70元②减少70元③增加80元④减少80元9.下面的几个式子中,错误的是(1,3)①40-1.6x 0.89 (说明:正相关,x前面的系数应该为正值)②5-3.8x 0.94③36-2.4x 0.96④36+3.8x 0.9810.相关系数r与回归系数b的关系可以表达为( 1 )①*σσy②*③* ④*11.下列关系中,属于正相关关系的有( 1 )①合理限度内,施肥量和平均单产量之间的关系②产品产量与单位产品成本之间的关系③商品的流通费用与销售利润之间的关系.④流通费用率与商品销售量之间的关系12.直线相关分析与直线回归分析的联系表现为( 1)①相关分析是回归分析的基础②回归分析是相关分析的基础③相关分析是回归分析的深入④相关分析与回归分析互为条件13.如果估计标准误差,则表明( 1)①全部观测值和回归值都相等②回归值等于Y 、③全部观测值与回归值的离差之和为零④全部观测值都落在回归直线上14.进行相关分析,要求相关的两个变量( 1 )。
社会统计学课后题答案(卢淑华)
![社会统计学课后题答案(卢淑华)](https://img.taocdn.com/s3/m/1011923476a20029bc642d73.png)
《社会统计学》课程练习题〔1〕答案一、略 二、〔1〕对立事件 〔2〕互不相容事件 〔3〕互不相容事件 〔1〕对立事件 三、)(28.516200182525400)(5252004025504000元元=⨯++==⨯-+=M M d)(91.29040091.690)(91.690200226575600)(00.4002001510252001331元元元=-=-==⨯-+==⨯-+=Q Q Q Q Q)(66.225509245092410050924001001005260032760000)(2222元====-=-=∑∑σσNNb n bn i i ii四、〔1〕极差R=1529-65=1464〔百元〕〔2〕将数据从小到大排序:65 92 106 118 122 135 148 174 185 1529)74.25(102.5-176.75Q )(75.17625.0)174185(174Q )(5.10275.0)92106(92Q 25.84)110(375.241103131百元四分互差百元百元的位置的位置===⨯-+==⨯-+==+⨯==+=Q Q〔3〕)(92.42164.178017101026742495204)(222百元==-=-=∑∑NNx xi iσ32.010032)(15.08012)/(4.08032)/(4.010040)(12.010012)(6.02012)/(15.08012)/(2.010020)(8.010080)(==================AC P B A P A C P C P AB P B A P A B P B P A P六、633.0101157154)()()()(375.0415101)()()/(214.0715101)()()/(101)(157)(154)(=-+=-+=+=⨯===⨯=====AB P B P A P B A P A P AB P A B P B P AB P B A P AB P B P A P七、〔1〕10口井皆产油的概率为:0000059.07.03.0)10(0101010===C P ξ (2) 10口井皆不产油的概率为:02825.07.03.0)0(100010===C P ξ 〔3〕该公司赢利的时机为:85069.07.03.07.03.01)2(91110100010=--=≥C C P ξ1465.071828.28!24)2(4442=⨯====--e x P λ 九、6022.0!137.1!037.1)1()0()10(37.137.1137.10=+==+==≤≤=--e e x P x P x P λ 十、。
相关回归分析练习题.doc
![相关回归分析练习题.doc](https://img.taocdn.com/s3/m/9955b7f4a5e9856a5712603b.png)
相关回归分析双变量相关分析某班级12名女大学牛的体重与肺活量的数据如下,试分析两者有无直线相关关系。
序号体重(kg)肺活量(L)142 2.55242 2.2346 2.75446 2.4546 2.8650 2.81750 3.418503」952 3.461052 2.851158 3.512583注:首先将这组数据通过任何一种方式输入SPSS中。
其次,做散点图来判断两变量间是否存在直线相关。
只有从图形上明确两变量间存在线性相关趋势,才能继续做后面的分析。
(1)操作步骤图像一旧对话框一散点图一简单分布,自变量体重,因变量肺活量即可得到散点图。
分析一相关一双变量,选择体重和肺活量,选择要进行的统计量即可。
(2)散点图(3)输出结果描述性统计量(4)简单解释结果(包括直线相关程度是多大,是否显著?)根据输出结果,我们可以得到:体重与肺活量之间的Pearson相关系数为0.749,属于中度相关。
二、现已测得20名糖尿病人的血糖(y)、胰岛素(xl)及生长激素(x2)的测量数据,见数据pcorr.sav。
请分析糖尿病人血糖浓度与生长激素间有无相关关系。
注:从医学上來讲,血糖浓度和朕岛素间存在着密切的关系,如杲忽略唳岛素的影响來分析,必然会得岀错误的结论。
因此,这里需要控制朕岛索影响的情况下进行偏相关分析。
建议与不考虑胰岛素影响的情况下相关性进行比较。
(1)操作步骤(2)输岀结果描述性统计量a.(3)简单解释结果通过上述统计分析我们可以得到如下结论:在无控制变量时,血糖和生长素之间的相关性为0.638,为中度相关,与胰岛素的相关性为-0.840,为高度相关。
在控制变量胰岛素时,血糖和生长素的相关性为()・2,低度相关。
三、简单线性回归方程以练习一的数据为例(即12名女犬学生的体重与肺活量),试求肺活量对体重的直线回归方程并做相关的检验。
(1)操作步骤。
分析一回归一线性,因变量为肺活量,自变量为体重。
然后选择需要统计的统计量即可。
卢淑华—相关与回归分析练习题
![卢淑华—相关与回归分析练习题](https://img.taocdn.com/s3/m/e831a1968762caaedd33d4cf.png)
第十一章 等级相关练习题1.某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。
2.以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma 系数和肯德尔相关系数τc 。
3.以下为两位评判员对10名参赛人名次的打分。
试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。
4.青年歌手大奖赛评委会对10名决赛选手的演唱水平(X )和综合素质(Y )进行打分,评价结果如下表(表中已先将选手按演唱水平作了次序排列)所示,试计算选手的演唱水平和综合素质间的斯皮尔曼等级相关系数。
(10分)5.下面是对50名被调查者的英语成绩和法语成绩的抽样调查:求Gamma 系数。
解:41.0164390164390=+-=+-=d s d s n n n n G y x a=b 54.479y=a+bx=-54.479+0.659x n n -=-∑∑斯皮尔曼相关系数2s 26d r 1-0.94n(n -1)==∑【皮尔逊相关系数:0.889,斯皮尔曼相关系数:0.94,回归方程:Y=-54.48+0.66X 】1.赛马迷们会认为,在圆跑道上进行的赛马比赛中,某些起点位置上的马会特别有利。
在有八匹马的比赛中,位置1是内侧最靠近栏杆的跑道,位置8是外侧离栏杆最远的跑道。
请从赛马的结果中判断起点位置与赛马获胜是否有关。
(α=0.05)7. 甲、乙两位评酒员对10种品牌白酒的主观排序如下表,计算两个等级相关系数,问两位评酒员对白酒的评价意见具有一定的相关性吗?(α= 0.05)第十二章回归与相关一、填空1.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。
自变量是作为(变化根据)的变量,因变量是随(自变量)的变化而发生相应变化的变量。
2.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是(随机性)变量。
社会统计学课后题答案(卢淑华)
![社会统计学课后题答案(卢淑华)](https://img.taocdn.com/s3/m/1011923476a20029bc642d73.png)
《社会统计学》课程练习题〔1〕答案一、略 二、〔1〕对立事件 〔2〕互不相容事件 〔3〕互不相容事件 〔1〕对立事件 三、)(28.516200182525400)(5252004025504000元元=⨯++==⨯-+=M M d)(91.29040091.690)(91.690200226575600)(00.4002001510252001331元元元=-=-==⨯-+==⨯-+=Q Q Q Q Q)(66.225509245092410050924001001005260032760000)(2222元====-=-=∑∑σσNNb n bn i i ii四、〔1〕极差R=1529-65=1464〔百元〕〔2〕将数据从小到大排序:65 92 106 118 122 135 148 174 185 1529)74.25(102.5-176.75Q )(75.17625.0)174185(174Q )(5.10275.0)92106(92Q 25.84)110(375.241103131百元四分互差百元百元的位置的位置===⨯-+==⨯-+==+⨯==+=Q Q〔3〕)(92.42164.178017101026742495204)(222百元==-=-=∑∑NNx xi iσ32.010032)(15.08012)/(4.08032)/(4.010040)(12.010012)(6.02012)/(15.08012)/(2.010020)(8.010080)(==================AC P B A P A C P C P AB P B A P A B P B P A P六、633.0101157154)()()()(375.0415101)()()/(214.0715101)()()/(101)(157)(154)(=-+=-+=+=⨯===⨯=====AB P B P A P B A P A P AB P A B P B P AB P B A P AB P B P A P七、〔1〕10口井皆产油的概率为:0000059.07.03.0)10(0101010===C P ξ (2) 10口井皆不产油的概率为:02825.07.03.0)0(100010===C P ξ 〔3〕该公司赢利的时机为:85069.07.03.07.03.01)2(91110100010=--=≥C C P ξ1465.071828.28!24)2(4442=⨯====--e x P λ 九、6022.0!137.1!037.1)1()0()10(37.137.1137.10=+==+==≤≤=--e e x P x P x P λ 十、。
第七章相关回归分析思考题及练习题
![第七章相关回归分析思考题及练习题](https://img.taocdn.com/s3/m/420a8c91fe4733687e21aaf1.png)
第七章 思考题及练习题(一)填空题1、 1、 在相关关系中,把具有因果关系相互联系的两个变量中起影响作用的变量称为 __________ ,把另一个说明观察结果的变量称为2、 2、 现象之间的相关关系按相关的程度分有 _____________ 相关、-相关和 目关;按相关的方向分有 目关和-目关;按相关的形式分有 目关和 目关;按 影响因素的多少分有 目关和 相关。
3、 3、 对现象之间变量关系的研究中,对于变量之间相互关系密切程度的研究,称为 ________ 研究变量之间关系的方程式,根据给定的变量数值以推断另一变量的可能值,则称为 ________ 。
4、 4、 完全相关即是 __________ 系,其相关系数为 ________ 。
5、 5、 在相关分析中,要求两个变量都是 __________ 在回归分析中,要求自变量是 _______ ,因变量是 _______ 。
6、 6、 相关系数是在 ____________ 相关条件下用来说明两个变量相关________ 的统计分析指标。
7、 7、 相关系数的变动范围介于 _________ 与 _______ 间,其绝对值愈接近于 _______ ,两个变量之间线性相关程度愈高;愈接近于 _________ , 两个变量之间线性相关程度愈低。
当 _________ 寸表示两变量正相关;______ 时表示两变量负相关。
8 8、 当变量x 值增加,变量y 值也增加,这是 _________ 目关关系;当变量X 值减少,变量y 值也减少,这是 __________ 目关关系9、 ___________________________________________________ 在判断现象之间的相关关系紧密程度时,主要用 _______________________ 行一般性判断,用 _ 行数量上的说明。
10、 在回归分析中,两变量不是对等的关系,其中因变量是 _________变量,自变量是 ________ 。
回归分析练习题(有答案)
![回归分析练习题(有答案)](https://img.taocdn.com/s3/m/9bf9766f7c1cfad6195fa7ae.png)
回归分析的基本思想及其初步应用一、选择题 1. 某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为y bx a =+,已知:数据x 的平均值为2,数据y 的平均值为3,则 ( )A .回归直线必过点(2,3)B .回归直线一定不过点(2,3)C .点(2,3)在回归直线上方D .点(2,3)在回归直线下方2. 在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则Y 与X 之间的回归直线方程为( )A .yx 1=+ B .y x 2=+ C .y 2x 1=+ D.y x 1=-3. 在对两个变量x ,y 进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释; ②收集数据(i x 、i y ),1,2i =,…,n ;③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图如果根据可行性要求能够作出变量,x y 具有线性相关结论,则在下列操作中正确的是( ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③①4. 下列说法中正确的是( )A .任何两个变量都具有相关关系B .人的知识与其年龄具有相关关系C .散点图中的各点是分散的没有规律D .根据散点图求得的回归直线方程都是有意义的5. 给出下列结论:(1)在回归分析中,可用指数系数2R 的值判断模型的拟合效果,2R 越大,模型的拟合效果越好; (2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好; (3)在回归分析中,可用相关系数r 的值判断模型的拟合效果,r 越小,模型的拟合效果越好; (4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,正确的有( )个.A .1B .2C .3D .4 6. 已知直线回归方程为2 1.5y x =-,则变量x 增加一个单位时()A.y 平均增加1.5个单位B.y 平均增加2个单位C.y 平均减少1.5个单位D.y 平均减少2个单位7. 下面的各图中,散点图与相关系数r 不符合的是( )8. 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归直线方程为ˆ7.1973.93yx =+,据此可以预测这个孩子10岁时的身高,则正确的叙述是( )A .身高一定是145.83cmB .身高超过146.00cmC .身高低于145.00cmD .身高在145.83cm 左右9. 在画两个变量的散点图时,下面哪个叙述是正确的( ) (A)预报变量在x 轴上,解释变量在y 轴上 (B)解释变量在x 轴上,预报变量在y 轴上(C)可以选择两个变量中任意一个变量在x 轴上 (D)可以选择两个变量中任意一个变量在y 轴上10. 两个变量y 与x 的回归模型中,通常用2R 来刻画回归的效果,则正确的叙述是( )A. 2R 越小,残差平方和小B. 2R 越大,残差平方和大C. 2R 于残差平方和无关 D. 2R 越小,残差平方和大 11. 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果最好的模型是( )A.模型1的相关指数2R 为B.模型2的相关指数2R 为C.模型3的相关指数2R 为 D.模型4的相关指数2R 为12. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A.总偏差平方和 B.残差平方和 C.回归平方和 D.相关指数R 213.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为ˆ6090y x =+,下列判断正确的是( ) A.劳动生产率为1000元时,工资为50元 B.劳动生产率提高1000元时,工资提高150元 C.劳动生产率提高1000元时,工资提高90元 D.劳动生产率为1000元时,工资为90元14. 下列结论正确的是( )①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A.①② B.①②③ C.①②④ D.①②③④15. 已知回归直线的斜率的估计值为,样本点的中心为(4,5),则回归直线方程为( ) A. 1.234y x =+ B. 1.235y x =+ C. 1.230.08y x =+ D.0.08 1.23y x =+二、填空题16. 在比较两个模型的拟合效果时,甲、乙两个模型的相关指数2R 的值分别约为和,则拟合效果好的模型是 .17. 在回归分析中残差的计算公式为 .18. 线性回归模型y bx a e =++(a 和b 为模型的未知参数)中,e 称为 .19. 若一组观测值(x 1,y 1)(x 2,y 2)…(x n ,y n )之间满足y i =bx i +a+e i (i=1、2.…n)若e i 恒为0,则R 2为_____三、解答题20. 调查某市出租车使用年限x 和该年支出维修费用y (万元),得到数据如下:(2)由(1)中结论预测第10年所支出的维修费用.(121()()()ni i i ni i x x y y b x x a y bx==⎧-⋅-⎪⎪=⎨-⎪⎪=-⎪⎩∑∑)21. 以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;150m时的销售价格.(3)据(2)的结果估计当房屋面积为2(4)求第2个点的残差。
第八章相关与回归分析习题参考答案
![第八章相关与回归分析习题参考答案](https://img.taocdn.com/s3/m/133bc91158fafab069dc02a1.png)
二、计算与分析题1.根据下列资料编制直线回归方程并计算估计标准误差。
(1)已知8.29.0362522====a r y x σσ解:b=x bx a Y r xy 08.18.2ˆ,08.1569.0+=+==⨯=σσ62.281.01612=-=-≈r S y y σ(2)已知X 、Y 两变量,,是的两倍,求相关系数r=?6.1=xxxy L L y σx σ解:r=8.026.1==yyxx xy L L L 2.某家俱厂生产家俱的总成本与木材耗用量有关,根据记录资料如下表:月份1234567木材耗电量(千米) 2.4 2.1 2.3 1.9 1.9 2.1 2.4总成本(千克)3.12.62.92.72.83.03.2(1)建立以总成本为因变量的回归直线方程。
(2)计算回归方程的估计标准误差。
(3)计算相关系数,判断其相关程度。
解:(1)=a+bx=1.27+0.768x (2)=1592.022=-∑-∑-∑=n xy b y a Y S y(3)r==0.754yxbσσ3、广告的作用测定:在现代营销战中,广告的作用功不可没。
受娃娃哈集团的委托,时代统计调查事务所调查研究了1995-2004年期间的娃娃哈集团的广告投入力度与平均销量的问题。
其有数据资料整理如下表所示。
年份广告费用(万元)平均销量(百万箱)19951996199719981999200020012002200320048912151617181921238.0010.4010.6712.3514.2315.5416.4218.7019.5022.87问题是:(1)分析娃娃哈集团平均销量的变动规律。
(2)测算广告费用与平均销量之间的相关关系与密切程度。
(3)建立广告费用与平均销量之间的回归方程,并预测当广告费用为25万元时,其平均销量水平。
(4)从统计角度简述直线趋势方程与线性回归方程的不同之处。
解:(1)娃娃哈集团平均销量的大致呈线性变动规律。
社会统计学课后题答案(卢淑华)
![社会统计学课后题答案(卢淑华)](https://img.taocdn.com/s3/m/4a4e73cc5901020206409c79.png)
《社会统计学》课程练习题(1)答案一、略 二、(1)对立事件 (2)互不相容事件 (3)互不相容事件 (1)对立事件 三、)(28.516200182525400)(5252004025504000元元=⨯++==⨯-+=M M d)(91.29040091.690)(91.690200226575600)(00.4002001510252001331元元元=-=-==⨯-+==⨯-+=Q Q Q Q Q)(66.225509245092410050924001001005260032760000)(2222元====-=-=∑∑σσNNb n bn i i ii四、(1)极差R=1529-65=1464(百元)(2)将数据从小到大排序:65 92 106 118 122 135 148 174 1851529)74.25(102.5-176.75Q )(75.17625.0)174185(174Q )(5.10275.0)92106(92Q 25.84)110(375.241103131百元四分互差百元百元的位置的位置===⨯-+==⨯-+==+⨯==+=Q Q(3))(92.42164.178017101026742495204)(222百元==-=-=∑∑NNx xi iσ五、32.010032)(15.08012)/(4.08032)/(4.010040)(12.010012)(6.02012)/(15.08012)/(2.010020)(8.010080)(==================AC P B A P A C P C P AB P B A P A B P B P A P六、633.0101157154)()()()(375.0415101)()()/(214.0715101)()()/(101)(157)(154)(=-+=-+=+=⨯===⨯=====AB P B P A P B A P A P AB P A B P B P AB P B A P AB P B P A P七、(1)10口井皆产油的概率为:0000059.07.03.0)10(0101010===C P ξ (2) 10口井皆不产油的概率为:02825.07.03.0)0(100010===C P ξ (3)该公司赢利的机会为:85069.07.03.07.03.01)2(91110100010=--=≥C C P ξ八、1465.071828.28!24)2(4442=⨯====--e x P λ 九、6022.0!137.1!037.1)1()0()10(37.137.1137.10=+==+==≤≤=--e e x P x P x P λ 十、。
(完整版)第十二章相关和回归分析练习试题
![(完整版)第十二章相关和回归分析练习试题](https://img.taocdn.com/s3/m/a14a695bcc22bcd127ff0c71.png)
第十二章相关与回归分析一、填空1. 如果两变量的相关系数为0,说明这两变量之间__ 。
2.相关关系按方向不同,可分为_____ 和________ 。
3. 相关关系按相关变量的多少,分为和复相关。
4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。
自变量是作为(变化根据)的变量,因变量是随(自变量)的变化而发生相应变化的变量。
5.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是(随机性)变量。
6.变量间的相关程度,可以用不知Y与 X有关系时预测 Y的全部误差 E1,减去知道 Y与 X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是(削减误差比例)。
7.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个1)实际观察值 Y 围绕每个估计值 Y c是服假定:从();(2)分布中围绕每个可能的 Y c 值的()是相同的。
7. 已知:工资(元)倚劳动生产率(千元)的回归方程为yc 10 80x,因此,当劳动生产率每增长 1 千元,工资就平均增加 80 元。
8.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为(回归方程),并据以进行估计和预测。
这种分析方法,通常又称为(回归分析)。
9.积差系数 r 是(协方差)与 X 和 Y 的标准差的乘积之比。
二、单项选择1.欲以图形显示两变量 X 和 Y 的关系,最好创建( D )。
A 直方图 B 圆形图 C 柱形图 D 散点图2.在相关分析中,对两个变量的要求是(A )。
A 都是随机变量B 都不是随机变量C 其中一个是随机变量,一个是常数D 都是常数3.相关关系的种类按其涉及变量多少可分为()。
A. 正相关和负相关B. 单相关和复相关C. 线性相关和非线性相关D. 不相关、不完全相关、完全相关4.关于相关系数,下面不正确的描述是(B )。
社会统计学习题 卢淑华
![社会统计学习题 卢淑华](https://img.taocdn.com/s3/m/3bbe7a48c5da50e2534d7f3b.png)
1、P58习题十五人数户数0 1 2 3 4 5 6 7 8 417 240 366 222 134 63 39 24 21(1)试作频率统计表,直方图和折线图(2)试求均值和标准差2、P59习题十六设以下是七十二名离婚者的婚龄的统计(见下表)。
(1)试作频率统计表、直方图和折线图(2)试求众值、中位值和均值,并做简单讨论。
(3)试求四分互差和标准差。
婚龄人数1-3 4-6 7-9 10-12 13-15 16-18 19-21 22-24 25-27 28-30 5 10 20 14 9 4 3 2 4 13、P59习题十七设以下是1209名抽烟者年龄的统计(见下表)年龄人数21-24 25-34 35-44 45-54 55-64 65岁以上212 273 257 226 152 89(1)试作频率统计表、直方图和折线图(2)试求四分互差。
4、P72例10某年级共有学生一百名,其中来自广东省的有二十五名,来自广西省的有十名,问任抽一名,来自两广的概率是多少?5、P73例12根据某市职业代际流动的统计,服务性行业代际向下流动的概率为0.07,静止不流动的概率为0.85,求服务性行业代际向上流动的概率是多少?6、P75例13为了呀牛父代文化程度对子代文化程度的影响,某大学统计出学生中父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而父母双方都具有大学文化程度的占10%,问学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少?7、P75例14某地对外国旅游者旅游动机进行了调查,发现旅游者处于游览名胜的概率为0.219;处于异族文化的吸引占0.509;而两种动机兼而有之的占0.102.问旅游动机为游览名胜或为异族文化吸引的概率是多少?8、P76例16根据统计结果,在自然生育情况下,男婴出生的概率为22/43;女婴出生的概率为21/43.某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?两名孕妇都生女婴的概率是多少?其中一名孕妇生男婴、一名孕妇生女婴的概率是多少?9、P77例17某居民楼共十二户,其中直系家庭为两户,问访问两户都是直系家庭的概率是多少?10、P78例18某居民楼共二十户,其中直系家庭为两户,问访问第二户才是直系家庭的概率是多少?11、P78例20设居民楼共有住户一千户,其中核心家庭占60%,问访谈中散户都是核心家庭的概率是多少?12、P83例2210人抓阄,其中共有2张球票,问第2个人抓到球票的概率?13、P85例23设出口商标为Made in China的产品,其中有50%为上海厂的产品;30%为北京厂得产品;20%为天津厂的产品。
第8章《相关与回归》练习题
![第8章《相关与回归》练习题](https://img.taocdn.com/s3/m/3ae402dad15abe23482f4d62.png)
第八章《相关与回归分析》练习题一、单项选择题1、两线性相关变量的相关图形是一条:A 、平行于X 轴的直线B 、平行于Y 轴的直线C 、 倾斜的直线D 、倾斜450且过原点的直线2、若估计标准误S 等于因变量的标准差,则说明回归方程:A 、很有意义B 、毫无价值C 、计算有误D 、问题不成立3、某校经济管理类的学生学习统计学的时间(x)与考试成绩(у)之间建立回归方程уC = a + b x。
经计算,方程为уC = 20 -0.8x,该方程的计算:A 、a 值是明显不对的B 、b 值是明显不对的C 、a 值和b 值都是不对的D 、a 值和b 值都是正确的4、已知某工厂产品产量和成本费用有直线关系,在这条直线上,当产量为1千吨时,其成本费用为3万元,其中不随产量变化的费用为6000元,则成本费用对产量的回归直线方程是:A 、уC = 24 + 6000xB 、уC = 24000 + 6x C 、уC = 6000 + 2.4xD 、уC = 0.6+ 2.4x 5、相关与回归分析时,在是否需要确定自变量和因变量的问题上:A 、前者勿需确定,后者需要确定B 、前者需要确定,后者勿需确定C 、两者均需确定D 、两者都勿需确定 6、判定系数的值越大,则回归直线A 、拟合程度越低B 、拟合程度越高C 、偏离原始数据定越远D 、进行预测越不准确 7、相关分析是研究:A 、变量之间的数量关系B 、变量之间的变动关系C 、变量之间机互关系间密切程度D 、变量之间的因果关系8、下面的几个式子中,错误的是:A 、Y= -40 + 1.6 X r =0.89B 、Y= -5 – 3.8X r = -0.94C 、Y= 36 –2.4 X r = 0.96D 、Y= – 36 + 3.8 X r= 0.989、如果估计标准误差0/ x y S ,则表明A 、全部观察值和回归值都不相等B 、回归值代表性小C 、全部观察值和回归值的离差之积为零D 、全部观察值都落在回归直线上二、多项选择题1、判定系数越大,说明:A 、观察值的离散程度也越大B 、回归估计愈准确C 、估计标准误的越大D 、回归系数也越大E 、相关系数的绝对值也越大 2、在回归分析中,确定直线回归方程的两个变量必须是A 、一个自变量,一个因变量B 、均为随机变量C 、一个是随机变量,一个是可控制变量D 、对等关系E 、不对等关系3、下列现象之间属于相关关系的有:A 、家庭收入与消费支出之间的关系B 、农作物收获量与施肥量之间的关系C 、圆的面积与圆的半径之间的关系D 、身高与体重之间的关系E 、年龄与血压之间的关系4、直线相关分析与直线回归分析的区别在于A 、相关的两个变量都是随机的,而回归分析中自变量是给定的数值,因变量是随机的B 、回归分析中的两个变量都是随机的,而相关中的自变量是给定的数值,因变量是随机的C 、相关系数有正负号,而回归系数只能取正值D 、相关的两个变量是对等关系,而回归分析中的两个变量不是对等关系E 、相关分析中根据两个变量只能计算出一个相关系数,而回归分析中根据两个变量可以计算出两个回归系数5、确定直线回归方程必须满足的条件是: A 、现象间确定存在数量上的相互依存关系 B 、相关系数r 必须等于1C 、相关现象必须均属于随机现象D 、现象间存在着较为密切的直线相关关系E 、相关数列的项数必须足够多.6、相关系数r 的大小与回归估计标准误差x y S /值的大小表现为:A 、变化方向一致B 、各自完全独立变化C 、变化方向相反D 、时而发生一致变化,时而又发生反向变化E 、二者都受y 大小的影响7、当两个现象完全相关时,下列统计指标值可能为:A 、r=1B 、r=0C 、r=-1D 、x y S /=0E 、x y S /=1三、判断改错题1、估计标准误差是以回归直线为中心反映各观察值与估计值平均数之间的离差程度的大小。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十一章 等级相关练习题1.某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。
2.以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma 系数和肯德尔相关系数τc 。
3.以下为两位评判员对10名参赛人名次的打分。
试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。
4.青年歌手大奖赛评委会对10名决赛选手的演唱水平(X )和综合素质(Y )进行打分,评价结果如下表(表中已先将选手按演唱水平作了次序排列)所示,试计算选手的演唱水平和综合素质间的斯皮尔曼等级相关系数。
(10分)5.下面是对50名被调查者的英语成绩和法语成绩的抽样调查:求Gamma 系数。
解:41.0164390164390=+-=+-=d s d s n n n n G y x a=b 54.479y=a+bx=-54.479+0.659x n n -=-∑∑斯皮尔曼相关系数2s 26d r 1-0.94n(n -1)==∑【皮尔逊相关系数:0.889,斯皮尔曼相关系数:0.94,回归方程:Y=-54.48+0.66X 】1.赛马迷们会认为,在圆跑道上进行的赛马比赛中,某些起点位置上的马会特别有利。
在有八匹马的比赛中,位置1是内侧最靠近栏杆的跑道,位置8是外侧离栏杆最远的跑道。
请从赛马的结果中判断起点位置与赛马获胜是否有关。
(α=0.05)7. 甲、乙两位评酒员对10种品牌白酒的主观排序如下表,计算两个等级相关系数,问两位评酒员对白酒的评价意见具有一定的相关性吗?(α= 0.05)第十二章回归与相关一、填空1.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。
自变量是作为(变化根据)的变量,因变量是随(自变量)的变化而发生相应变化的变量。
2.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是(随机性)变量。
3.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为(回归方程),并据以进行估计和预测。
这种分析方法,通常又称为(回归分析)。
4.已知:工资(元)倚劳动生产率(千元)的回归方程为xyc8010+=,因此,当劳动生产率每增长1千元,工资就平均增加80 元。
5.积差系数r是(协方差)与X和Y的标准差的乘积之比。
二、单项选择1.相关分析和回归分析相辅相成,又各有特点,下面正确的描述有(D )。
A在相关分析中,相关的两变量都不是随机的;B在回归分析中,自变量是随机的,因变量不是随机的;C在回归分析中,因变量和自变量都是随机的;D在相关分析中,相关的两变量都是随机的。
2. 一元一次回归方程Y=a+bx中的a表示( )。
A. 斜率B. 最小平均法C. 回归直线D. 截距3.在回归分析中,对于没有明显因果关系的两变量( )A.可给定自变量数值估计因变量的可能值B.可给定因变量值推出自变量值C.可以都是随机变量D.可以都是非随机变量4.回归分析中的两个变量( ) A.都是随机变量 B.关系是对等的C.都是给定的量 D.一个是自变量,一个是因变量5.回归估计的估计标准误差的计量单位与( )相同A.自变量 B.因变量 C.两个变量 D.相关系数6.某校对学生的考试成绩和学习时间的关系进行测定,建立了考试成绩倚学习时间的直线回归方程为: yc=180-5x,该方程明显有误,错误在于( )A. a值的计算有误,b值是对的B. b值的计算有误,a值是对的C. a值和b值的计算都有误D. 自变量和因变量的关系搞错了7.估计标准误与相关系数的关系是( )A.估计标准误越大,相关系数越小B.估计标准误越大,相关系数越大C.估计标准误与相关系数没有任何关系D.估计标准误与相关系数没有必然的联系8.测定现象之间有无相关关系的方法是()A.编制相关表B.绘制相关图C.对客观现象做定性分析D.计算估计标准误E.配合回归方程9.回归分析的特点有( )A.两个变量是不对等的B.必须区分自变量和因变量C.两上变量都是随机的D.因变量是随机的E.自变量是可以控制的量F.回归系数只有一个10.直线回归分析中( )A.自变量是可控制量,因变量是随机的B.两个变量不是对等的关系C.利用一个回归方程,两个变量可以互相推算D.根据回归系数可判定相关的方向E.对于没有明显因果关系的两个线性相关变量可求得两个回归方程11.在直线回归方程yc=a+bx 中( )A.必须确定自变量和因变量,即自变量是给定的,因变量是随机的B.回归系数既可以是正值,也可以是负值C.一个回归方程既可以由自变量推算因变量的估计值,也可以由因变量的值计算自变量的值D.两个变量都是随机的E.两个变量存在线性相关关系,而且相关程度显著12.直线回归方程yc=a+bx 中的b 称为回归系数,回归系数的作用是( )A.可确定两变量之间因果的数量关系B.可确定两变量的相关方向C.可确定两变量相关的密切程度D.可确定因变量的实际值与估计值的变异程度E.可确定当自变量增加一个单位时,因变量的平均增加量13.当所有的观察值y都落在直线bxayc+=上时,则x与y之间的相关系数为(B)。
A、r=0B、r=1C、-1<r<1D、0<r<114.回归直线方程XC=c+dY,其中Y为自变量,则( )A.可以根据Y值推断XB.可以根据X值推断YC.可以互相推断D.不能进行推断15.对于有线性相关关系的两变量建立的直线回归方城Y=a+bx中,回归系数b (B )。
A.肯定是正数B.显著不为0 C.可能为0 D.肯定为负数16.年劳动生产率x(千元)和工人工资y(元)之间的回归方程为y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均()A.增加70元B.减少70元C.增加80元D.减少80元17产量X(千件)与单位成本Y(元)之间的回归方程为Y=77-3X,这表示产量每提高1000件,单位成本平均( )A.增加3元B.减少3000元C.增加3000元D.减少3元18.两变量X和Y的相关系数为0.8,则其回归直线的判定系数为(C )。
A 0.50 B 0.80 C 0.64 D 0.90 19.在完成了构造与评价一个回归模型后,我们可以( D )。
A 估计未来所需样本的容量B 计算相关系数和判定系数C 以给定的因变量的值估计自变量的值D 以给定的自变量的值估计因变量的值20.对相关系数的显著性检验,通常采用的是(①)① T检验② F检验③ Z 检验21.回归估计标准误差的计量单位与( )A.自变量相同B.因变量相同C.相关系数相同D.自变量、因变量及相关系数均不同22.在回归分析中,两个变量(D )。
A 都是随机变量B 都不是随机变量C 自变量是随机变量D 因变量是随机变量23.已知变量X和Y之间的关系如图所示,则变量X和Y的相关系数为(D )。
A、0.29B、-0.86C、1.04D、0.9124.一元线性回归模型和多元线性回归模型的区别在于只有一个(B )。
A 因变量B 自变量C 相关系数D 判定系数25.以下指标恒为正的是(D )。
A 相关系数r B 截距a C 斜率b D 复相关系数26.对两变量进行回归分析时,( )A.前提是两变量之间存在较高的相关关系B.其中任一变量都可以成为自变量或因(依)变量C.两变量都是随机变量D.一变量是随机变量,另一变量是非随机变量E.一变量是自变量,另一变量是因(依)变量三、多项选择1.判定现象之间有无相关系数的方法是(ABC )。
A、对客观现象作定性分析B、编制相关表C、绘制相关图D、计算相关系数E、计算估计标准误2.回归分析和相关分析的关系是(ABE )。
A 回归分析可用于估计和预测B 相关分析是研究变量之间的相互依存关系的密切程度C 回归分析中自变量和因变量可以互相推导并进行预测D 相关分析需区分自变量和因变量E 相关分析是回归分析的基础3.关于积差系数,下面正确的说法是(ABCD )。
A 积差系数是线性相关系数B 在积差系数的计算公式中,变量X和Y是对等关系C 积差系数具有PRE性质D 在积差系数的计算公式中,变量X和Y都是随机的4.关于皮尔逊相关系数,下面正确的说法是(ACE )。
A 皮尔逊相关系数是线性相关系数B 积差系数能够解释两变量间的因果关系C r公式中的两个变量都是随机的D r的取值在1和0之间E 皮尔逊相关系数具有PRE性质,但这要通过r2加以反映5.简单线性回归分析的特点是(ABE )。
A 两个变量之间不是对等关系B 回归系数有正负号C 两个变量都是随机的D 利用一个回归方程,两个变量可以互相推算E 有可能求出两个回归方程6.反映某一线性回归方程y=a+bx好坏的指标有(ABD )。
A 相关系数B 判定系数C b的大小D 估计标准误E a的大小7.模拟回归方程进行分析适用于(ACDE )。
A 变量之间存在一定程度的相关系数B 不存在任何关系的几个变量之间C 变量之间存在线性相关D 变量之间存在曲线相关E 时间序列变量和时间之间8.判定系数r2=80%和含义如下(ABC )。
A 自变量和因变量之间的相关关系的密切程度B 因变量y的总变化中有80%可以由回归直线来解释和说明C 总偏差中有80%可以由回归偏差来解释D 相关系数一定为0.64E 判定系数和相关系数无关9.以下指标恒为正的是(BC )。
A 相关系数B 判定系数C 复相关系数D 偏相关系数E 回归方程的斜率10.一元线性回归分析中的回归系数b 可以表示为(BC )。
A 两个变量之间相关关系的密切程度B 两个变量之间相关关系的方向C 当自变量增减一个单位时,因变量平均增减的量D 当因变量增减一个单位时,自变量平均增减的量E 回归模型的拟合优度11.关于回归系数b ,下面正确的说法是(AE )。
A b 也可以反映X 和Y 之间的关系强度。
;B 回归系数不解释两变量间的因果关系;C b 公式中的两个变量都是随机的;D b 的取值在1和-1之间;E b 也有正负之分。
12、如果两个变量之间有一定的相关性,则以下结论中正确的是 ( ①②③ )①、回归系数b 的绝对值大于零 ②、判定系数2R 大于零 ③、相关系数r 的绝对值大于0.3 13、当所有的观察值都落在回归直线x yββ10+=上时,下述备选答案成立的有(②③ )①r=0 ② ∣r ∣= 1 ③s y =014、配合回归直线方程对资料的要求是( ) 。
A 、因变量是给定的数值,自变量是随机的B 、自变量是可控变量,因变量是随机的C 、自变量和因变量都是随机的D 、自变量和因变量都不是随机的 15、在回归直线方程中,b 表示( ) 。