社会统计学习题和答案--相关与回归分析

合集下载

社会统计学答案

社会统计学答案

一、单选题 (共5题,60.0分)1、西方统计学认为近代统计学之父的是()。

1.威廉·配弟2.阿道夫·凯特勒3.海尔曼·康令4.约翰·格朗特标准答案:B2、为了检验两个总体的方差是否相等,所使用的变量抽样分布是()。

1.F分布2.Z分布3.t分布4.方差分布标准答案:A3、在中国台湾的一项《夫妻对电视传播媒介观念差距的研究》中,访问了30对夫妻,其中丈夫所受教育X(以年为单位)的数据如下: 18 20 16 6 16 17 12 14 16 18 14 14 16 9 20 18 12 15 13 16 16 2l 2l 9 16 20 14 14 16 16 ,问10.5年的教育在第几百分位数上?1.第10个百分位数上3.第15个百分位数上4.第20个百分位数上标准答案:A4、身高和体重之间的关系是()。

1.函数关系2.无相关3.共变关系4.严格的依存关系标准答案:C5、抽样调查中,无法消除的误差是()。

1.登记性误差2.系统性误差3.随机误差4.责任心误差标准答案:C1.2.无关系4.不存在线性相关标准答案:D5、某市连续五年人口增长数是稳定的,五年里其人口环比增长速度()。

1.降低的2.提高的3.稳定不变的4.先升后降的标准答案:A一、单选题 (共5题,60.0分)1、抽样调查中,无法消除的误差是()。

1.登记性误差2.系统性误差3.随机误差4.责任心误差标准答案:C2、在中国台湾的一项《夫妻对电视传播媒介观念差距的研究》中,访问了30对夫妻,其中丈夫所受教育X(以年为单位)的数据如下: 18 20 16 6 16 17 12 14 16 18 14 14 16 920 18 12 15 13 16 16 2l 2l 9 16 20 14 14 16 16 ,问10.5年的教育在第几百分位数上?1.第10个百分位数上2.第5个百分位数上3.第15个百分位数上4.第20个百分位数上标准答案:A一、单选题 (共5题,60.0分)1、两变量的线性相关系数为0,表明两变量之间()。

统计学原理第九章(相关和回归)习题答案

统计学原理第九章(相关和回归)习题答案

第九章相关与回归一.判断题部分题目1:负相关指的是因素标志与结果标志的数量变动方向是下降的。

()答案:X题目2:相关系数为+1时,说明两变量完全相关;相关系数为-1 时,说明两个变量不相关。

()答案:V题目3:只有当相关系数接近+1 时,才能说明两变量之间存在高度相关关系。

()答案:X题目4:若变量x的值增加时,变量y的值也增加,说明x与y之间存在正相关关系;若变量x的值减少时,y变量的值也减少,说明x与y之间存在负相关关系。

()答案:X题目5:回归系数和相关系数都可以用来判断现象之间相关的密切程度。

()答案:X题目6:根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。

()答案:V题目7:回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。

()答案:X题目8:在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。

()答案:X题目9:产品产量随生产用固定资产价值的减少而减少,说明两个变量之间存在正相关关系。

()答案:V题目10:计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。

()答案:X题目11:完全相关即是函数关系,其相关系数为± 1。

()答案:V题目12:估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。

()答案X二.单项选择题部分题目1:当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。

A. 相关关系B. 函数关系C. 回归关系D. 随机关系答案:B题目2:现象之间的相互关系可以归纳为两种类型,即()。

A. 相关关系和函数关系B. 相关关系和因果关答案: C题目 5:相关系数的取值范围是 ( ) 。

-1<r <0 答案: CC. 越接近于 0D. 在 0.5 和 0.8 之间答案: C题目 7: 若物价上涨 ,商品的需求量相应减少 , 则物价与商品需求量之间的 关系为 ( ) 。

社会统计学试题及答案

社会统计学试题及答案

社会统计学试题及答案一、单项选择题(每题2分,共20分)1. 社会统计学中,用来描述一组数据集中趋势的指标是()。

A. 众数B. 中位数C. 均值D. 方差答案:C2. 以下哪个选项不属于描述统计学的内容?()A. 数据收集B. 数据整理C. 数据分析D. 数据预测答案:D3. 在统计学中,用来衡量数据离散程度的指标是()。

A. 标准差B. 均值C. 众数D. 中位数答案:A4. 以下哪个概念不是社会统计学的研究对象?()A. 人口数量B. 收入水平C. 股票价格D. 家庭结构答案:C5. 社会统计学中,用来衡量两个变量之间相关关系的强度的指标是()。

A. 相关系数B. 回归系数C. 标准差D. 方差答案:A6. 以下哪个选项不是社会统计学中常用的数据收集方法?()A. 问卷调查B. 观察法C. 实验法D. 文献分析答案:C7. 在统计学中,用来衡量数据集中程度的指标是()。

A. 标准差B. 均值C. 众数D. 中位数答案:B8. 以下哪个选项是社会统计学中常用的数据整理方法?()A. 频数分布表B. 回归分析C. 假设检验D. 相关分析答案:A9. 社会统计学中,用来描述一组数据分布形态的指标是()。

A. 偏度B. 峰度C. 均值D. 方差答案:A10. 以下哪个概念是社会统计学中用来描述数据的离散程度的?()A. 标准差B. 均值C. 众数D. 中位数答案:A二、多项选择题(每题3分,共15分)1. 社会统计学中,用来描述一组数据的指标包括()。

A. 均值B. 众数C. 方差D. 标准差E. 中位数答案:ABDE2. 以下哪些是社会统计学中常用的数据分析方法?()A. 描述性分析B. 推断性分析C. 回归分析D. 假设检验E. 相关分析答案:ABCDE3. 社会统计学中,用来衡量数据离散程度的指标包括()。

A. 标准差B. 方差C. 偏度D. 峰度E. 极差答案:ABE4. 以下哪些是社会统计学中常用的数据收集方法?()A. 问卷调查B. 观察法C. 实验法D. 文献分析E. 访谈法答案:ABDE5. 社会统计学中,用来描述一组数据分布形态的指标包括()。

统计学7-10章课后作业答案

统计学7-10章课后作业答案

第7章 相关与回归分析1、设销售收入x 为自变量,销售成本y 为因变量。

现已根据某百货公司某年12个月的有关资料计算出以下数据(单位:万元):2()425053.73ix x -=∑ 647.88x =2()262855.25iy y -=∑549.8y =()()334229.09iix x y y --=∑(1)拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释。

(2)计算可决系数和回归估计的标准误差。

(3)对回归系数进行显著性水平为5%的显著性检验。

(4)假定下年一月销售收入为800万元,利用拟合的回归方程预测销售成本,并给出置信度为95%的预测区间。

解:(1)定性分析可知,销售收入影响销售成本,以销售收入为自变量,销售成本为因变量拟合线性回归方程i i i y x u αβ=++,采用最小二乘法估计回归参数得:22()()(,)334229.09ˆ0.7863()425053.73ii xix x y y Cov x y x x βσ--===≈-∑∑ˆˆ549.80.7863647.8840.372y x αβ=-=-⨯= 因此,拟合的回归方程为:ˆˆˆ40.3720.7863i i iy x x αβ=+=+ 其中,回归系数β表示自变量每变动一个单位,因变量的平均变量幅度。

在此,表示销售收入每增加1万元,销售成本平均增加0.7863万元。

(2)可决系数22222[()()]334229.090.9998()()425053.73262855.25i i i i x x y y SSR R SST x x y y --===≈-⋅-⨯∑∑∑ (本问接下来的计算不做要求:为计算回归系数的标准误差,根据离差平方和分解,可知:2222222[()()]ˆˆˆˆˆˆ()[()()]()()334229.09262811.68425053.73i i i iiix x y y SSR y y x x x x x x αβαββ--=-=+-+=-=-==∑∑∑∑∑22ˆ()()262855.25262811.6843.57i i SSE SST SSR y y yy =-=---=-=∑∑因此有ˆ()0.0032S β===≈) (3)陈述假设:01:0 :0H H ββ=≠在原假设成立的前提下,构造t 检验统计量245.598t ===在5%的双侧检验显著性水平下,查自由度为10的t 分布表,得临界值0.025(10) 2.228t t =<,因此拒绝原假设。

回归分析练习题与参考标准答案

回归分析练习题与参考标准答案

回归分析练习题与参考答案————————————————————————————————作者:————————————————————————————————日期:1 下面是7个地区2000年的人均国内生产总值(GDP)与人均消费水平的统计数据:地区人均GDP/元人均消费水平/元北京辽宁上海江西河南贵州陕西 224601122634547485154442662454973264490115462396220816082035求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。

(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。

(3)求出估计的回归方程,并解释回归系数的实际意义。

(4)计算判定系数,并解释其意义。

(5)检验回归方程线性关系的显著性(0.05α=)。

(6)如果某地区的人均GDP为5000元,预测其人均消费水平。

(7)求人均GDP为5000元时,人均消费水平95%的置信区间与预测区间。

解:(1)可能存在线性关系。

(2)相关系数:系数a模型非标准化系数标准系数t Sig.相关性B 标准误差试用版零阶偏部分1 (常量) 734.693 139.540 5.265 .003人均GDP .309 .008 .998 36.492 .000 .998 .998 .998 a. 因变量: 人均消费水平有很强的线性关系。

(3)回归方程:734.6930.309y x=+系数a模型非标准化系数标准系数t Sig.相关性B 标准误差试用版零阶偏部分1 (常量) 734.693 139.540 5.265 .003人均GDP .309 .008 .998 36.492 .000 .998 .998 .998 a. 因变量: 人均消费水平回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。

统计学高教版相关与回归分析课后习题答案

统计学高教版相关与回归分析课后习题答案

第7章 相关与回归分析课后习题答案7.2 (1)数据散点图如下:(2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,两者之间存在着一定的负相关关系。

(3)设投诉率为Y ,航班正点率为X建立回归方程 12i i i Y X u ββ=++估计参数为 ^6.01780.07i i Y X =-(4)参数的经济意义是航班正点率每提高一个百分点,相应的投诉率(次/10万名乘客)下降0.07。

(5)航班按时到达的正点率为80%,估计每10万名乘客投诉的次数可能为: 4187.08007.00178.6ˆ=⨯-=i Y (次/10万)7.3 由Excel 回归输出的结果可以看出:(1)回归结果为^23332.993090.0716190.1687270.179042i i i i Y X X X =+++(2)由Excel 的计算结果已知:1234,,,ββββ对应的 t 统计量分别为0.51206、4.853871、4.222811、3.663731 ,其绝对值均大于临界值0.025(224) 2.101t -=,所以各个自变量都对Y 有明显影响。

由F=58.20479, 大于临界值0.05(41,224) 3.16F --=,说明模型在整体上是显著的。

7.6(1)用Excel 输入Y 和X 数据,生成2X 和3X 的数据,用Y 对X 、2X 、3X 回归,估计参数结果为^231726.737.8796468740.00895 3.7124906i i Y X X E X =-+-+- t =(-1.9213) (2.462897) (-2.55934) (3.118062)20.973669R = 20.963764R =(2)检验参数的显著性:当取0.05α=时,查t 分布表得0.025(124) 2.306t -=,与t 统计量对比,除了截距项外,各回归系数对应的t 统计量的绝对值均大于临界值,表明在这样的显著性水平下,回归系数显著不为0。

统计学课后习题答案第七章相关分析与回归分析报告

统计学课后习题答案第七章相关分析与回归分析报告

统计学课后习题答案第七章相关分析与回归分析报告第七章相关分析与回归分析一、单项选择题1.相关分析是研究变量之间的A.数量关系B.变动关系C.因果关系D.相互关系的密切程度2.在相关分析中要求相关的两个变量A.都是随机变量B.自变量是随机变量C.都不是随机变量D.因变量是随机变量3.下列现象之间的关系哪一个属于相关关系?A.播种量与粮食收获量之间关系B.圆半径与圆周长之间关系C.圆半径与圆面积之间关系D.单位产品成本与总成本之间关系4.正相关的特点是A.两个变量之间的变化方向相反B.两个变量一增一减C.两个变量之间的变化方向一致D.两个变量一减一增5.相关关系的主要特点是两个变量之间A.存在着确定的依存关系B.存在着不完全确定的关系C.存在着严重的依存关系D.存在着严格的对应关系6.当自变量变化时, 因变量也相应地随之等量变化,则两个变量之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系7.当变量X值增加时,变量Y值都随之下降,则变量X和Y之间存在着A.正相关关系B.直线相关关系C.负相关关系D.曲线相关关系8.当变量X值增加时,变量Y值都随之增加,则变量X和Y之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系9.判定现象之间相关关系密切程度的最主要方法是A.对现象进行定性分析B.计算相关系数C.编制相关表D.绘制相关图10.相关分析对资料的要求是A.自变量不是随机的,因变量是随机的B.两个变量均不是随机的C.自变量是随机的,因变量不是随机的D.两个变量均为随机的11.相关系数A.既适用于直线相关,又适用于曲线相关B.只适用于直线相关C.既不适用于直线相关,又不适用于曲线相关D.只适用于曲线相关12.两个变量之间的相关关系称为A.单相关B.复相关C.不相关D.负相关13.相关系数的取值围是A.-1≤r≤1B.-1≤r≤0C.0≤r≤1D. r=014.两变量之间相关程度越强,则相关系数A.愈趋近于1B.愈趋近于0C.愈大于1D.愈小于115.两变量之间相关程度越弱,则相关系数A.愈趋近于1B.愈趋近于0C.愈大于1D.愈小于116.相关系数越接近于-1,表明两变量间A.没有相关关系B.有曲线相关关系C.负相关关系越强D.负相关关系越弱17.当相关系数r=0时,A.现象之间完全无关B.相关程度较小B.现象之间完全相关 D.无直线相关关系18.假设产品产量与产品单位成本之间的相关系数为-0.89,则说明这两个变量之间存在A.高度相关B.中度相关C.低度相关D.显著相关19.从变量之间相关的方向看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和无相关20.从变量之间相关的表现形式看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和无相关21.物价上涨,销售量下降,则物价与销售量之间属于A.无相关B.负相关C.正相关D.无法判断22.配合回归直线最合理的方法是A.随手画线法B.半数平均法C.最小平方法D.指数平滑法23.在回归直线方程y=a+bx中b表示A.当x增加一个单位时,y增加a的数量B.当y增加一个单位时,x增加b的数量C.当x增加一个单位时,y的平均增加量D.当y增加一个单位时, x的平均增加量24.计算估计标准误差的依据是A.因变量的数列B.因变量的总变差C.因变量的回归变差D.因变量的剩余变差25.估计标准误差是反映A.平均数代表性的指标B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动生产率(千元)和工人工资(元)之间存在回归方程y=10+70x,这意味着年劳动生产率每提高一千元时,工人工资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为1000件时,其生产成本为30000元,其中固定成本6000元,则总生产成本对产量的一元线性回归方程为:A.y=6+0.24xB.y=6000+24xC.y=24000+6xD.y=24+6000x29.用来反映因变量估计值代表性高低的指标称作A.相关系数B.回归参数C.剩余变差D.估计标准误差二、多项选择题1.下列现象之间属于相关关系的有A.家庭收入与消费支出之间的关系B.农作物收获量与施肥量之间的关系C.圆的面积与圆的半径之间的关系D.身高与体重之间的关系E.年龄与血压之间的关系2.直线相关分析的特点是A.相关系数有正负号B.两个变量是对等关系C.只有一个相关系数D.因变量是随机变量E.两个变量均是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量x与y之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的一元线性回归方程为y=85-5.6x,则A.单位成本与产量之间存在着负相关B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加5.6元D.产量为1千件时,单位成本为79.4元E.产量每增加1千件,单位成本平均减少5.6元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.非线性相关7.判断现象之间有无相关关系的方法有A.对现象作定性分析B.编制相关表C.绘制相关图D.计算相关系数E.计算估计标准误差8.当现象之间完全相关的,相关系数为A.0B.-1C.1D.0.5E.-0.59.相关系数r =0说明两个变量之间是A.可能完全不相关B.可能是曲线相关C.肯定不线性相关D.肯定不曲线相关E.高度曲线相关10.下列现象属于正相关的有A.家庭收入愈多,其消费支出也愈多B.流通费用率随商品销售额的增加而减少C.产量随生产用固定资产价值减少而减少D.生产单位产品耗用工时,随劳动生产率的提高而减少E.工人劳动生产率越高,则创造的产值就越多11.直线回归分析的特点有A.存在两个回归方程B.回归系数有正负值C.两个变量不对等关系D.自变量是给定的,因变量是随机的E.利用一个回归方程,两个变量可以相互计算12.直线回归方程中的两个变量A.都是随机变量B.都是给定的变量C.必须确定哪个是自变量,哪个是因变量D.一个是随机变量,另一个是给定变量E.一个是自变量,另一个是因变量13.从现象间相互关系的方向划分,相关关系可以分为A.直线相关B.曲线相关C.正相关D.负相关E.单相关14.估计标准误差是A.说明平均数代表性的指标B.说明回归直线代表性指标C.因变量估计值可靠程度指标D.指标值愈小,表明估计值愈可靠E.指标值愈大,表明估计值愈可靠15.下列公式哪些是计算相关系数的公式16.用最小平方法配合的回归直线,必须满足以下条件A.∑(y-y c )=最小值B.∑(y-y c )=0C.∑(y-y c )2=最小值D.∑(y-y c )2=0E.∑(y-y c )2=最大值17.方程y c =a+bx222222)()(.)()())((...))((.y y n x x n y x xy n r E y y x x y y x x r D L L L r C L L L r B n y y x x r A xx xy xy yy xx xy yx ∑-∑?∑-∑∑?∑-∑=-∑?-∑--∑===--∑=σσA.这是一个直线回归方程B.这是一个以X为自变量的回归方程C.其中a是估计的初始值D.其中b是回归系数E.y c是估计值18.直线回归方程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动方向D.其数值大小不受计量单位的影响E. 其数值大小受计量单位的影响19.相关系数与回归系数存在以下关系A.回归系数大于零则相关系数大于零B.回归系数小于零则相关系数小于零C.回归系数等于零则相关系数等于零D.回归系数大于零则相关系数小于零E.回归系数小于零则相关系数大于零20.配合直线回归方程的目的是为了A.确定两个变量之间的变动关系B.用因变量推算自变量C.用自变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21.若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在B.y的所有理论值同它的平均值一致C.x和y是函数关系D.x与y不相关E.x与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;而回归分析中自变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;而相关分析中自变量是给定的数值,因变量是随机的C.相关系数有正负号;而回归系数只能取正值D.相关分析中的两个变量是对等关系;而回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出一个相关系数;而回归分析中根据两个变量只能计算出一个回归系数三、填空题1.研究现象之间相关关系称作相关分析。

社会统计学试题及答案

社会统计学试题及答案

社会统计学试题及答案一、选择题1. 社会统计学是研究和分析社会现象和社会问题的科学方法。

下列哪项不是社会统计学的研究对象?A. 人口B. 社会经济C. 政治D. 音乐答案:D2. 下列哪项是进行社会统计学研究时常用的数据收集方法?A. 实地调研B. 实验研究C. 文献研究D. 理论推导答案:A3. 下列哪项不是社会统计学常用的数据分析方法?A. 描述统计B. 回归分析C. 实证研究D. 主观评价答案:D二、简答题1. 什么是抽样调查?请简要描述抽样调查的步骤。

抽样调查是根据一定的抽样原则和抽样方法,从总体中选出少部分元素进行调查的方法。

抽样调查的步骤包括:定义研究目标和调查问题、确定研究对象和总体范围、选择适当的抽样方法、制定抽样方案、实施调查、数据收集和分析、得出结论并进行推断。

2. 什么是社会统计指标?请举例说明一个社会统计指标。

社会统计指标是用于衡量和描述社会现象、问题或变量的量化指标。

例如,人口增长率是一个常用的社会统计指标,用于表示某一地区或国家人口数量在某一时期内的增长速度。

三、论述题社会统计学在社会科学研究中的应用社会统计学作为一门综合性的学科,广泛应用于社会科学研究中。

它通过收集、分析和解释社会数据,提供了量化的研究工具和方法,对社会现象和问题进行客观的测量和评估。

首先,社会统计学在人口学研究中发挥了重要作用。

通过对人口数量、结构、分布等进行统计分析,可以揭示出不同地区、不同群体的人口变化趋势和特点。

人口统计数据还为制定人口政策、规划资源分配等提供了科学的依据。

其次,社会统计学在社会经济学研究中具有重要意义。

通过对收入分布、贫富差距、就业率等指标的统计分析,可以帮助我们了解社会经济现象和问题,并为政府和决策者提供制定经济政策的依据。

此外,社会统计学在社会学、教育学、卫生学等学科中也得到了广泛的应用。

它帮助研究者揭示社会结构、社会关系、社会变迁等方面的规律,为社会科学研究提供了重要的数据支持。

统计学原理-第六章--相关与回归分析习题

统计学原理-第六章--相关与回归分析习题

第六章相关与回归分析习题一、填空题1.现象之间的相关关系按相关的程度分为、和;按相关的形式分为和;按影响因素的多少分为和。

2.两个相关现象之间,当一个现象的数量由小变大,另一个现象的数量,这种相关称为正相关;当一个现象的数量由小变大,另一个现象的数量,这种相关称为负相关。

3.相关系数的取值范围是。

4.完全相关即是关系,其相关系数为。

5.相关系数,用于反映条件下,两变量相关关系的密切程度和方向的统计指标。

6.直线相关系数等于零,说明两变量之间;直线相关系数等1,说明两变量之间;直线相关系数等于—1,说明两变量之间。

7.对现象之间变量的研究,统计是从两个方面进行的,一方面是研究变量之间关系的,这种研究称为相关关系;另一方面是研究关于自变量和因变量之间的变动关系,用数学方程式表达,称为。

8.回归方程y=a+bx中的参数a是,b是。

在统计中估计待定参数的常用方法是。

9. 分析要确定哪个是自变量哪个是因变量,在这点上它与不同。

10.求两个变量之间非线性关系的回归线比较复杂,在许多情况下,非线性回归问题可以通过化成来解决。

11.用来说明回归方程代表性大小的统计分析指标是。

二、单项选择题1.下面的函数关系是( )A销售人员测验成绩与销售额大小的关系B圆周的长度决定于它的半径C家庭的收入和消费的关系D数学成绩与统计学成绩的关系2.相关系数r的取值范围( )A -∞<r<+∞B -1≤r≤+1C -1<r<+1D 0≤r≤+13.年劳动生产率z(干元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( )A增加70元B减少70元C增加80元D减少80元4.假设要证明两变量之间线性相关程度是高的,则计算出的相关系数应接近于( )A+1 B 0 C 0.5 D [1]5.回归系数和相关系数的符号是一致的,其符号均可用来判断现象( )A线性相关还是非线性相关B正相关还是负相关C完全相关还是不完全相关D单相关还是复相关6.某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建立线性回归方程y =a+b x。

社会统计学复习题(有答案)

社会统计学复习题(有答案)

社会统计学课程期末复习题一、填空题(计算结果一般保留两位小数)1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标.2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。

3、在回归分析中,各实际观测值y 与估计值y ˆ的离差平方和称为 剩余 变差。

4、平均增长速度= 平均发展速度 -1(或100%)。

5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。

6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。

7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。

8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为100%7%A 100% 1.06%100%6%-=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为100%10%100% 4.76%100%5%+=-=+B 产品产量计划超额完成程度 。

9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。

10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值);四个部分组成。

11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。

社会统计学习题和问题详解--相关与回归分析报告

社会统计学习题和问题详解--相关与回归分析报告

第十二章 相关与回归分析第一节 变量之间的相关关系相关程度与方向·因果关系与对称关系 第二节 定类变量的相关双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb与τc系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数第四节 定距变量的相关分析相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归可线性化的非线性函数·实例分析(二次曲线指数曲线)一、填空1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。

2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。

3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。

4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。

自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。

5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。

这种分析方法,通常又称为( 回归分析 )。

6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。

二、单项选择1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。

相关与回归分析-社会统计学

相关与回归分析-社会统计学

第十一章非参数检验第一节符号检验符号检验的方法·符号检验的特点和作用第二节配对符号秩检验配对符号秩检验的方法·配对符号秩检验的效力第三节秩和检验秩和检验的方法·秩和检验的近似第四节游程检验游程的概念·游程检验的方法·差符号游程检验第五节累计频数检验累计频数检验的方法·累计频数检验的应用一、填空1.非参数检验,泛指“对分布类型已知的总体进行参数检验”()的所有检验方法。

2.符号检验的零假设就是配对观察结果的差平均起来等于().3.理论研究表明,对于配对样本非正态分布的差值d,()是最佳检验。

4.秩和检验检验统计量U是U1和U2中较( )的一个。

5.秩尺度之统计量的均值和标准差只取决于( ).6.()常被用作经验分布与理论分布的比较.7.绝对值相等的值,应将它们的秩( ).8.符号检验,在分布自由检验中称为( )。

9.符号检验和配对符号秩检验,都只适用于( )样本。

10.数据序列ABBABAAABABBABBAAAAAB的总游程数是()二、单项选择1.下列检验中,不属于非参数统计的方法的是( )。

A 总体是否服从正态分布B 总体的方差是否为某一个值C 样本的取得是否具有随机性D 两组随机变量之间是否相互独立2.下列情况中,最适合非参数统计的方法是()。

A 反映两个大学新生成绩的差别B 反映两个大学新生家庭人均收入的差别C 反映两个大学三年级学生对就业前景的看法差别D反映两个大学在校生消费水平的差别3.不属于非参数检验的是( )。

A符号检验B游程检验C累计频数检验 D F检验4.在累计频数检验中,卡方的自由度为()。

A n1B 2C n2D n1+n25.配对符号秩检验的效力()。

A 小于符号检验B 大于t检验C 介于符号检验与t检验之间D 无法与符号检验及t检验比较6.如果我们说非参数检验的效力是80%,下列哪种解释正确.( )。

A 如果用参数检验需要100个数据,那么在同等的检验效力下,非参数检验只要80个数据;B如果用非参数检验需要100个数据,那么在同等的检验效力下,参数检验只要80个数据;C如果用参数检验需要100个数据,那么在同等的检验效力下,非参数检验只要20个数据;D如果用非参数检验需要100个数据,那么在同等的检验效力下,参数检验只要20个数据;7.对于秩和检验,U1、U2和n1、n2的关系是()。

统计学习题答案 第8章 相关与回归分析【精选文档】

统计学习题答案 第8章 相关与回归分析【精选文档】

6.表中给出y 对2x 和3x 回归的结果:
离差来源 平方和(SS ) 自由度(df ) 平方和的均值(MSS ) 来自回归(ESS ) 65965 来自残差(RSS ) 总离差(TSS ) 66042 14
(1) 该回归分析中样本容量是多少? (2) 计算RSS ;
(3) ESS 和RSS 的自由度是多少? (4) 计算可决系数和修正的可决系数;
(5) 怎样检验2x 和3x 对y 是否有显著影响?根据以上信息能否确定2x 和3x 各自对
y 的贡献为多少?
解:(1)该回归分析中样本容量是14+1=15
(2)计算RSS=66042-65965=77
ESS 的自由度为k —1=2,RSS 的自由度 n-k=15—3=12 (3)计算:可决系数 2
65965/660420.9988R == 修正的可决系数 2151
1(10.9988)0.9986153
R -=-
⨯-=- (4)检验X2和X3对Y 是否有显著影响
/(1)65965/232982
5140.11/()77/12 6.4166
ESS k F RSS n k -=
===-
(5) F 统计量远比F 临界值大,说明X2和X3联合起来对Y 有显著影响,但并不能确定X2和X3各自对Y 的贡献为多少。

7. 在计算一元线性回归方程时,已得到以下结果:
试根据此结果,填写下表的空格:
来 源 平方和 自由度 方差 来自回归 2179.56
来自残差 99。

11 22 总离差平方和
2278。

67。

(完整版)《社会统计学》样题附答案

(完整版)《社会统计学》样题附答案

华南农业大学期末考试试卷(A卷)学年第学期考试科目:社会统计学考试类型:(开卷)考试时间:120 分钟一、单项选择题(请将正确选项的序号填在答题纸相应的位置。

)1.社会统计中的变量一般分四个层次,其中最高层次的变量是。

A、定类变量B、定序变量C、定距变量D、定比变量2.标准正态分布的均值一定。

A、等于1B、等于-1C、等于0D、不等于03.计算中位值时,对于未分组资料,先把原始资料按大小顺序排列成数列,然后用公式确定中位值所在位置。

A、n/2B、(n-1)/2C、(n+2)/2D、(n+1)/24.下列统计指标中,对极端值的变化最不敏感的是。

A、众值B、中位值C、四分位差D、均值5.如果原假设是总体参数不小于某一数值,即大于和等于某一数值,应采用的检验是。

A、两端检验B、右端检验C、左端检验D、无法判断6.在一个右偏的分布中,大于均值的数据个数将。

A、不到一半B、等于一半C、超过一半D、视情况而定7.下列关于“回归分析和相关分析的关系”的说法中不正确的是。

A、回归分析可用于估计和预测B、相关分析是研究变量之间的相互依存关系的密切程度C、相关分析不需区分自变量和因变量D、回归分析是相关分析的基础8.假定男性总是与比自己年轻3岁的女性结婚,那么夫妻年龄之间的积距相关系数r为。

A、-1 < r< 0B、0 < r< 1C、r = 1D、r = -19.“4、6、8、10、12、26”这组数据的集中趋势宜用测量。

A、众值B、中位值C、均值D、平均差10.某校期末考试,全校语文平均成绩为80分,标准差为4.5分,数学平均成绩为87分,标准差为9.5分。

某学生语文得了83分,数学得了92分,从相对名次的角度看,该生的成绩考得更好。

A、数学B、语文C、两门课程一样D、无法判断二、多项选择题(多选、错选均不得分,漏选得部分分。

请将正确选项的序号填在答题纸相应的位置。

)1.下列变量中属于定类层次的是。

统计学课后习题答案第七章相关分析与回归分析

统计学课后习题答案第七章相关分析与回归分析

统计学课后习题答案第七章相关分析与回归分析第七章相关分析与回归分析⼀、单项选择题1.相关分析是研究变量之间的A.数量关系B.变动关系C.因果关系D.相互关系的密切程度2.在相关分析中要求相关的两个变量A.都是随机变量B.⾃变量是随机变量C.都不是随机变量D.因变量是随机变量3.下列现象之间的关系哪⼀个属于相关关系?A.播种量与粮⾷收获量之间关系B.圆半径与圆周长之间关系C.圆半径与圆⾯积之间关系D.单位产品成本与总成本之间关系4.正相关的特点是A.两个变量之间的变化⽅向相反B.两个变量⼀增⼀减C.两个变量之间的变化⽅向⼀致D.两个变量⼀减⼀增5.相关关系的主要特点是两个变量之间A.存在着确定的依存关系B.存在着不完全确定的关系C.存在着严重的依存关系D.存在着严格的对应关系6.当⾃变量变化时, 因变量也相应地随之等量变化,则两个变量之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系7.当变量X值增加时,变量Y值都随之下降,则变量X和Y之间存A.正相关关系B.直线相关关系C.负相关关系D.曲线相关关系8.当变量X值增加时,变量Y值都随之增加,则变量X和Y之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系9.判定现象之间相关关系密切程度的最主要⽅法是A.对现象进⾏定性分析B.计算相关系数C.编制相关表D.绘制相关图10.相关分析对资料的要求是A.⾃变量不是随机的,因变量是随机的B.两个变量均不是随机的C.⾃变量是随机的,因变量不是随机的D.两个变量均为随机的11.相关系数A.既适⽤于直线相关,⼜适⽤于曲线相关B.只适⽤于直线相关C.既不适⽤于直线相关,⼜不适⽤于曲线相关D.只适⽤于曲线相关12.两个变量之间的相关关系称为A.单相关B.复相关C.不相关D.负相关13.相关系数的取值范围是A.-1≤r≤1B.-1≤r≤0C.0≤r≤114.两变量之间相关程度越强,则相关系数A.愈趋近于1B.愈趋近于0C.愈⼤于1D.愈⼩于115.两变量之间相关程度越弱,则相关系数A.愈趋近于1B.愈趋近于0C.愈⼤于1D.愈⼩于116.相关系数越接近于-1,表明两变量间A.没有相关关系B.有曲线相关关系C.负相关关系越强D.负相关关系越弱17.当相关系数r=0时,A.现象之间完全⽆关B.相关程度较⼩B.现象之间完全相关 D.⽆直线相关关系18.假设产品产量与产品单位成本之间的相关系数为-0.89,则说明这两个变量之间存在A.⾼度相关B.中度相关C.低度相关D.显著相关19.从变量之间相关的⽅向看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和⽆相关20.从变量之间相关的表现形式看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和⽆相关21.物价上涨,销售量下降,则物价与销售量之间属于A.⽆相关B.负相关C.正相关D.⽆法判断22.配合回归直线最合理的⽅法是A.随⼿画线法B.半数平均法C.最⼩平⽅法D.指数平滑法23.在回归直线⽅程y=a+bx中b表⽰A.当x增加⼀个单位时,y增加a的数量B.当y增加⼀个单位时,x增加b的数量C.当x增加⼀个单位时,y的平均增加量D.当y增加⼀个单位时, x的平均增加量24.计算估计标准误差的依据是A.因变量的数列B.因变量的总变差C.因变量的回归变差D.因变量的剩余变差25.估计标准误差是反映A.平均数代表性的指标B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动⽣产率(千元)和⼯⼈⼯资(元)之间存在回归⽅程y=10+70x,这意味着年劳动⽣产率每提⾼⼀千元时,⼯⼈⼯资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为1000件时,其⽣产成本为30000元,其中固定成本6000元,则总⽣产成本对产量的⼀元线性回归⽅程为:A.y=6+0.24xB.y=6000+24xC.y=24000+6xD.y=24+6000x29.⽤来反映因变量估计值代表性⾼低的指标称作A.相关系数B.回归参数C.剩余变差D.估计标准误差⼆、多项选择题1.下列现象之间属于相关关系的有A.家庭收⼊与消费⽀出之间的关系B.农作物收获量与施肥量之间的关系C.圆的⾯积与圆的半径之间的关系D.⾝⾼与体重之间的关系E.年龄与⾎压之间的关系2.直线相关分析的特点是A.相关系数有正负号B.两个变量是对等关系C.只有⼀个相关系数D.因变量是随机变量E.两个变量均是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量x与y之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的⼀元线性回归⽅程为y=85-5.6x,则A.单位成本与产量之间存在着负相关B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加5.6元D.产量为1千件时,单位成本为79.4元E.产量每增加1千件,单位成本平均减少5.6元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.⾮线性相关7.判断现象之间有⽆相关关系的⽅法有A.对现象作定性分析B.编制相关表C.绘制相关图D.计算相关系数E.计算估计标准误差 8.当现象之间完全相关的,相关系数为A.0B.-1C.1D.0.5E.-0.5 9.相关系数r =0说明两个变量之间是A.可能完全不相关B.可能是曲线相关C.肯定不线性相关D.肯定不曲线相关E.⾼度曲线相关10.下列现象属于正相关的有A.家庭收⼊愈多,其消费⽀出也愈多B.流通费⽤率随商品销售额的增加⽽减少C.产量随⽣产⽤固定资产价值减少⽽减少D.⽣产单位产品耗⽤⼯时,随劳动⽣产率的提⾼⽽减少E.⼯⼈劳动⽣产率越⾼,则创造的产值就越多 11.直线回归分析的特点有A.存在两个回归⽅程B.回归系数有正负值C.两个变量不对等关系D.⾃变量是给定的,因变量是随机的E.利⽤⼀个回归⽅程,两个变量可以相互计算 12.直线回归⽅程中的两个变量A.都是随机变量B.都是给定的变量C.必须确定哪个是⾃变量,哪个是因变量D.⼀个是随机变量,另⼀个是给定变量E.⼀个是⾃变量,另⼀个是因变量13.从现象间相互关系的⽅向划分,相关关系可以分为A.直线相关B.曲线相关C.正相关D.负相关E.单相关 14.估计标准误差是A.说明平均数代表性的指标B.说明回归直线代表性指标C.因变量估计值可靠程度指标D.指标值愈⼩,表明估计值愈可靠E.指标值愈⼤,表明估计值愈可靠 15.下列公式哪些是计算相关系数的公式16.⽤最⼩平⽅法配合的回归直线,必须满⾜以下条件A.∑(y-y c )=最⼩值B.∑(y-y c )=0C.∑(y-y c )2=最⼩值D.∑(y-y c )2=0E.∑(y-y c )2=最⼤值 17.⽅程y c =a+bx222222)()(.)()())((...))((.y y n x x n yx xy n r E y y x x y y x x r D L L L r C L L L r B n y y x x r A xx xy xyyy xx xy y x ∑-∑?∑-∑∑?∑-∑=-∑?-∑--∑===--∑=σσA.这是⼀个直线回归⽅程B.这是⼀个以X为⾃变量的回归⽅程C.其中a是估计的初始值D.其中b是回归系数E.y c是估计值18.直线回归⽅程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动⽅向D.其数值⼤⼩不受计量单位的影响E. 其数值⼤⼩受计量单位的影响19.相关系数与回归系数存在以下关系A.回归系数⼤于零则相关系数⼤于零B.回归系数⼩于零则相关系数⼩于零C.回归系数等于零则相关系数等于零D.回归系数⼤于零则相关系数⼩于零E.回归系数⼩于零则相关系数⼤于零20.配合直线回归⽅程的⽬的是为了A.确定两个变量之间的变动关系B.⽤因变量推算⾃变量C.⽤⾃变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21.若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在B.y的所有理论值同它的平均值⼀致C.x和y是函数关系D.x与y不相关E.x与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;⽽回归分析中⾃变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;⽽相关分析中⾃变量是给定的数值,因变量是随机的C.相关系数有正负号;⽽回归系数只能取正值D.相关分析中的两个变量是对等关系;⽽回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出⼀个相关系数;⽽回归分析中根据两个变量只能计算出⼀个回归系数三、填空题1.研究现象之间相关关系称作相关分析。

《社会统计学》课程第二次作业参考答案.docx

《社会统计学》课程第二次作业参考答案.docx

《社会统计学》课程第二次作业参考答案第五章置信区间5-28 2003年,在一项对高校扩招的态度调查中,10所北京市院校对高校扩招的态度数据如下表(分数越高态度越积极):院校名态度平均值标准差人数北京外国语学院 3.81 0. 67 48中国人民公安大学 4. 32 0. 55 50中国青年政治学院 4. 08 0. 68 52北京农学院 3. 98 0. 65 50北京大学 3. 58 0. 64 50清华大学 3. 78 0.71 49北方交通大学 4. 26 0. 66 50北京航空航天大学 4. 12 0. 74 42对外经济贸易大学 3. 88 0. 57 48北京医学院 4. 07 0. 63 44求:1)中国人民公安大学、清华大学、北京大学的总体平均态度分的95%置信区间;2)中国人民公安大学和北京大学的总体平均态度分之差的95%置信区间;3)清华大学和北京大学的总体平均态度分之差的95%置信区间。

(提示:要先从S求得1,(X-X)2)答:(1)中国人民公安大学:// = X ±t0.025 ~^= « 4.32 ± 2.021^ « 4.32 ±0.156 Qn A/50依此类推,同样的方法计算得:清华大学:3.78±0.204;北京大学:3.58±0.182(2)中国人民公安大学与北京大学差异:先根据公式S2 = '(1X)2计算为(X _壬)2 :n-1公安大学:Z(X1 —文1)2 =$2(“ —1) = 0.552x49 = 14.8225北京大学:Z(X2—文2)2 = S22(«-!) = 0.642 x49 = 20.0704因此’联合方差为:俨冒+嘗心。

5df=49+49=98,查表得如)25王 1.98(4.32-3.58)±1.98x Jo.35605“1 一“2 =(拓-X2)±to,O25S p(3)清华大学:S(Xi - Ji)2 = Si 2(«-!) = 0.712x48 = 24.1968北京大学:S(X 2 - J 2)2 = S22 («-!) = 0.642 x 49 = 20.0704$2 =工(山-壬1)2+工(上-壬2)2 " ("1 — 1) + ("2 - 1)dfM8+49=97,查表得 to.o25^1.98—+ -1- « (3.78-3.58)±1.98xj0.45636n\ "2注意:本题由于样本量比较大,关于t 值我们通过查表无法获得精确值,只能用其他值近似地估计一下, 由于每个人取的估计值可能会有所出入,所以可能会有点偏差(但不应相差过大),而书上的答案可能是 通过软件去计算的,所以我们的答案可能也不一定和它相同。

社会统计学课后题答案(卢淑华)【精选文档】

社会统计学课后题答案(卢淑华)【精选文档】

《社会统计学》课程练习题(1)答案一、略 二、(1)对立事件 (2)互不相容事件 (3)互不相容事件 (1)对立事件 三、)(28.516200182525400)(5252004025504000元元=⨯++==⨯-+=M M d)(91.29040091.690)(91.690200226575600)(00.4002001510252001331元元元=-=-==⨯-+==⨯-+=Q Q Q Q Q)(66.225509245092410050924001001005260032760000)(2222元====-=-=∑∑σσNNb n bn i i ii四、(1)极差R=1529-65=1464(百元)(2)将数据从小到大排序:65 92 106 118 122 135 148 174 185 1529)74.25(102.5-176.75Q )(75.17625.0)174185(174Q )(5.10275.0)92106(92Q 25.84)110(375.241103131百元四分互差百元百元的位置的位置===⨯-+==⨯-+==+⨯==+=Q Q(3))(92.42164.178017101026742495204)(222百元==-=-=∑∑NNx xi iσ32.010032)(15.08012)/(4.08032)/(4.010040)(12.010012)(6.02012)/(15.08012)/(2.010020)(8.010080)(==================AC P B A P A C P C P AB P B A P A B P B P A P六、633.0101157154)()()()(375.0415101)()()/(214.0715101)()()/(101)(157)(154)(=-+=-+=+=⨯===⨯=====AB P B P A P B A P A P AB P A B P B P AB P B A P AB P B P A P七、(1)10口井皆产油的概率为:0000059.07.03.0)10(0101010===C P ξ (2) 10口井皆不产油的概率为:02825.07.03.0)0(100010===C P ξ (3)该公司赢利的机会为:85069.07.03.07.03.01)2(91110100010=--=≥C C P ξ1465.071828.28!24)2(4442=⨯====--e x P λ 九、6022.0!137.1!037.1)1()0()10(37.137.1137.10=+==+==≤≤=--e e x P x P x P λ 十、。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十二章 相关与回归分析第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数 第三节 定序变量的相关分析同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数第四节 定距变量的相关分析相关表与相关图·积差系数的导出与计算·积差系数的性质 第五节 回归分析线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归可线性化的非线性函数·实例分析(二次曲线指数曲线)一、填空1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。

2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。

3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。

4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。

自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。

5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。

这种分析方法,通常又称为( 回归分析 )。

6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。

二、单项选择1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。

A 直线正相关B 直线负相关C 曲线正相关D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5~0、8之间时,表示( C )。

A 无相关B 低度相关C 中等相关D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。

A 在相关分析中,相关的两变量都不就是随机的;B在回归分析中,自变量就是随机的,因变量不就是随机的;C在回归分析中,因变量与自变量都就是随机的;D在相关分析中,相关的两变量都就是随机的。

4.关于相关系数,下面不正确的描述就是( B )。

≤r1时,表示两变量不完全相关;A当0≤B当r=0时,表示两变量间无相关;C两变量之间的相关关系就是单相关;D如果自变量增长引起因变量的相应增长,就形成正相关关系。

5.欲以图形显示两变量X与Y的关系,最好创建( D )。

A 直方图B 圆形图C 柱形图D 散点图6.两变量X与Y的相关系数为0、8,则其回归直线的判定系数为( C )。

A 0、50B 0.80C 0、64D 0、907.在完成了构造与评价一个回归模型后,我们可以( D )。

A 估计未来所需样本的容量B 计算相关系数与判定系数C 以给定的因变量的值估计自变量的值D 以给定的自变量的值估计因变量的值8.两变量的线性相关系数为0,表明两变量之间( D )。

A 完全相关B 无关系C 不完全相关D 不存在线性相关9.身高与体重之间的关系就是( C )。

A 函数关系B 无关系C 共变关系D 严格的依存关系10.在相关分析中,对两个变量的要求就是( A )。

A 都就是随机变量B 都不就是随机变量C 其中一个就是随机变量,一个就是常数D 都就是常数11.在回归分析中,两个变量( D )。

A 都就是随机变量B 都不就是随机变量C 自变量就是随机变量D 因变量就是随机变量12.一元线性回归模型与多元线性回归模型的区别在于只有一个( B )。

A 因变量B 自变量C 相关系数D 判定系数13.以下指标恒为正的就是( D )。

A 相关系数rB 截距aC 斜率bD 复相关系数14.下列关系中,属于正相关关系得就是( A )。

A 身高与体重B 产品与单位成本C 正常商品的价格与需求量D 商品的零售额与流通费率三、多项选择1.关于积差系数,下面正确的说法就是( ABCD )。

A 积差系数就是线性相关系数B 积差系数具有PRE性质C 在积差系数的计算公式中,变量X与Y就是对等关系D 在积差系数的计算公式中,变量X与Y都就是随机的2.关于皮尔逊相关系数,下面正确的说法就是( )。

A 皮尔逊相关系数就是线性相关系数B 积差系数能够解释两变量间的因果关系C r公式中的两个变量都就是随机的D r的取值在1与0之间E 皮尔逊相关系数具有PRE性质,但这要通过r2加以反映3.简单线性回归分析的特点就是( ABE )。

A 两个变量之间不就是对等关系B 回归系数有正负号C 两个变量都就是随机的D 利用一个回归方程,两个变量可以互相推算E 有可能求出两个回归方程4.反映某一线性回归方程y=a+bx好坏的指标有( ABD )。

A 相关系数B 判定系数C b的大小D 估计标准误E a的大小5.模拟回归方程进行分析适用于( ACDE )。

A 变量之间存在一定程度的相关系数B 不存在任何关系的几个变量之间C 变量之间存在线性相关D 变量之间存在曲线相关E 时间序列变量与时间之间6.判定系数r2=80%与含义如下( ABC )。

A 自变量与因变量之间的相关关系的密切程度B 因变量y的总变化中有80%可以由回归直线来解释与说明C 总偏差中有80%可以由回归偏差来解释D 相关系数一定为0、64E 判定系数与相关系数无关7.回归分析与相关分析的关系就是( ABE )。

A 回归分析可用于估计与预测B 相关分析就是研究变量之间的相互依存关系的密切程度C 回归分析中自变量与因变量可以互相推导并进行预测D 相关分析需区分自变量与因变量E 相关分析就是回归分析的基础8.以下指标恒为正的就是( BC )。

A 相关系数B 判定系数C 复相关系数D 偏相关系数E 回归方程的斜率9.一元线性回归分析中的回归系数b可以表示为(BC)A 两个变量之间相关关系的密切程度B 两个变量之间相关关系的方向C 当自变量增减一个单位时,因变量平均增减的量D 当因变量增减一个单位时,自变量平均增减的量E 回归模型的拟合优度10.关于回归系数b,下面正确的说法就是( )。

A b也可以反映X与Y之间的关系强度。

;B 回归系数不解释两变量间的因果关系;C b公式中的两个变量都就是随机的;D b 的取值在1与-1之间;E b 也有正负之分。

四、名词解释1.消减误差比例变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关系时预测Y 的误差1E ,再将其化为比例来度量。

将削减误差比例记为PRE 。

2. 确定性关系当一个变量值确定后,另一个变量值夜完全确定了。

确定性关系往往表现成函数形式。

3.非确定性关系在非确定性关系中,给定了一个变量值,另一个变量值还可以在一定范围内变化。

4.因果关系变量之间的关系满足三个条件,才能断定就是因果关系。

1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不就是由其她因素形成的,即因变量的变化就是由自变量的变化引起的;3)两个变量的产生与变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。

5.单相关与复相关单相关只涉及到两个变量,所以又称为二元相关。

三个或三个以上的变量之间的相关关系则称为复相关,又称多元相关。

6.正相关与负相关正相关与负相关:正相关就是指一个变量的值增加时,另一变量的值也增加;负相关就是指一个变量的值增加时,另一变量的值却减少。

7.散点图散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X 与Y 的相互关系,即得相关图,又称散点图。

8.皮尔逊相关系数r皮尔逊相关系数就是协方差与两个随机变量X 、Y 的标准差乘积的比率。

9.同序对在观察X 序列时,如果瞧到i j X X <,在Y 中瞧到的就是i j Y Y <,则称这一配对就是同序对。

10.异序对在观察X 序列时,如果瞧到i j X X <,在Y 中瞧到的就是i j Y >Y ,则称这一配对就是异序对。

11.同分对如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅就是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i j Y =Y (此时X 序列中无i j X =X ),则这个配对仅就是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。

五、判断题1.由于削减误差比例的概念不涉及变量的测量层次,因此它的优点很明显,用它来定义相关程度可适用于变量的各测量层次。

( √ )2.不管相关关系表现形式如何,当r =1时,变量X 与变量Y 都就是完全相关。

( √ )3.不管相关关系表现形式如何,当r=0时,变量X与变量Y都就是完全不相关。

( ×)4.通过列联表研究定类变量之间的关联性,这实际上就是通过相对频数条件分布的比较进行的。

而如果两变量间就是相关的话,必然存在着Y的相对频数条件分布相同,且与它的相对频数边际分布相同。

( ×)5.如果众数频数集中在条件频数分布列联表的同一行中, 系数便会等于0,从而无法显示两变量之间的相关性。

( √)6.从分析层次上讲,相关分析更深刻一些。

因为相关分析具有推理的性质,而回归分析从本质上讲只就是对客观事物的一种描述,知其然而不知其所以然。

( ×)六、计算题1.对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表;③指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。

2.已知十名学生身高与体重资料如下表,(1)根据下述资料算出身高与体重的皮尔逊相关系数与斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。

【皮尔逊相关系数:0、889,斯皮尔曼相关系数:0、94,回归方程:Y=-54、48+0、66X】3.假定有不同文化程度的35~45岁育龄妇女100人的生育情况如下表,求文化程度与平均生育数的相关系数r。

相关文档
最新文档