说明回归直线拟合程度的统计量

合集下载

计量经济学试题

计量经济学试题

试题一一、单项选择题1.回归分析中使用的距离是点到直线的垂直坐标距离。

最小二乘准则指的是( D )A .使︱^1()n i t Y t Y =-∑︱达到最小值 B.使min ︱^i Y i y -︱达到最小值 C.使ma x ︱^t Y t y -︱达到最小值 D.使^21()n tt Y t Y =-∑达到最小值2.在一元线性回归模型中,样本回归方程可表示为( C )A .01t t t Y a a X u =++B .(/)t t i Y E Y X u =+C. ^^^01t X t Y a a =+ D. 01(/)t t E Y X a a X =+ 3.将内生变量的前期值作解释变量,这样的变量称为(D )A.虚拟变量B.控制变量C.政策变量D.滞后变量4.若回归模型中的随机误差项存在异方差性,则估计模型参数应采用(B )A .普通最小二乘法B .加权最小二乘法 C.广义差分法 D.工具变量法5.书籍DW 统计量的值接近于2,则样本回归模型残差的一阶自相关系数近似等于(A )A.0B.-1C.1D.0.56.在线性回归模型中,若解释变量X1和X2的观测值成比例,即有X1=kX2,其中k 为非零常熟,则该模型中存在(B )A.方差非齐性B.多重共线性C.序列相关D.设定误差7.计量经济模型分为单方程模型和(C )A.随机方程B.行为方程C.联立方程D.非随机方程8.样本数据的质量问题,可以概括为完整性、准确性、可比性和(B )A.时效性B.一致性C. 广泛性D.系统性9.时间序列资料中,大多存在序列相关问题,对于分布滞后模型,这种序列相关问题就转化为( B )A.异方差问题B.多重共线性问题C.随机解释变量问题D.设定误差问题10.根据判定系数R2与F统计量的关系可知,当R2=1时有( D )A.F=-1 B.F=0 C.F=1 D.F=∞二、多选题1.关于虚拟变量,下列表述正确的有(ABCD)A.是质的因素的数量化B. 取值为1和0C.代表质的因素D.在有些情况下可代表数量因素E.代表数量因素2.对于经典线性回归模型,回归系数的普通最小二乘估计量具有的优良性有(ABC)A.无偏性B.线性性C.方差最小性D.确定性E.误差最小性3.经济计量模型的应用方向是(ABD)A.用于经济预测B.用于结构分析C.仅用于经济政策评价D.用于经济政策评价E.仅用于经济预测、结构分析4.计量经济模型中存在多重共线性的主要原因是(C D E)A.模型中存在异方差B.模型中存在虚拟变量C.经济变量相关的共同趋势D.滞后变量的引入E.样本资料的限制5.对于有限分布滞后模型,对它应用最小二乘法估计是存在的困难是(A D E)A.产生多重共线性B.产生异方差C.产生自相关D. 损失自由度E.最大滞后期K较难确定6.对于德宾—瓦森(DW)检验,下列结论中正确的是( ABD)。

回归分析时间序列分析答案

回归分析时间序列分析答案

回归分析时间序列分析答案一、单项选择题1、下面的关系中不是相关关系的是(D )A、身高与体重之间的关系B、工资水平与工龄之间的关系C、农作物的单位面积产量与降雨量之间的关系D、圆的面积与半径之间的关系2、具有相关关系的两个变量的特点是(A )A、一个变量的取值不能由另一个变量唯一确定B、一个变量的取值由另一个变量唯一确定C、一个变量的取值增大时另一个变量的取值也一定增大D、一个变量的取值增大时另一个变量的取值肯定变小3、下面的假定中,哪个属于相关分析中的假定(B)A、两个变量之间是非线性关系B、两个变量都是随机变量C、自变量是随机变量,因变量不是随机变量D、一个变量的数值增大,另一个变量的数值也应增大4、如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称这两个变量之间为(A )A、完全相关关系B、正线性相关关系C、非线性相关关系D、负线性相关关系 5、根据你的判断,下面的相关系数取值哪一个是错误的( C )A、–0.86B、0.78C、1.25D、0x6、某校经济管理类的学生学习统计学的时间()与考试成绩(y)之间建立线性回归方程yx=a+b。

经计算,方程为y =200—0.8x,该方程参数的计算(C) ccA a值是明显不对的B b值是明显不对的C a值和b值都是不对的D a值和b值都是正确的 7、在回归分析中,描述因变量y如何依赖于自变量x和误差项ε的方程称为(B)A、回归方程B、回归模型C、估计回归方程D、经验回归方程,,,x,,8、在回归模型y=中,ε反映的是(C ) 01A、由于x的变化引起的y的线性变化部分B、由于y的变化引起的x的线性变化部分C、除x和y的线性关系之外的随机因素对y的影响D、由于x和y的线性关系对y的影响9、如果两个变量之间存在负相关关系,下列回归方程中哪个肯定有误(B),,A、=25–0.75xB、= –120+ 0.86x yy,,C、=200–2.5xD、= –34–0.74x yy10、说明回归方程拟合优度的统计量是(C )A、相关系数B、回归系数C、判定系数D、估计标准误差211、判定系数R是说明回归方程拟合度的一个统计量,它的计算公式为(A ) SSRSSRSSESSTA、 B、 C、 D、 SSTSSESSTSSR12、为了研究居民消费(C)与可支配收入(Y)之间的关系,有人运用回归分析的方法,得到以下方程:在该方程中0.76的含义是(B ) LnC,2.36,0.76LnY,A、可支配收入每增加1元,消费支出增加0.76元B、可支配收入每增加1%,消费支出增加0.76%C、可支配收入每增加1元,消费支出增加76%D、可支配收入每增加1%,消费支出增加76%13、年劳动生产率z(千元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均(A)A增加70元 B减少70元 C增加80元 D减少80元14、下列回归方程中哪个肯定有误(A),,A、y=15–0.48x,r=0.65B、y= –15 - 1.35x,r=-0.81,,C、yy=-25+0.85x,r=0.42D、=120–3.56x,r=-0.96215、若变量x与y之间的相关系数r=0.8,则回归方程的判定系数R为(C )A、0.8B、0.89C、0.64D、0.40 16、对具有因果关系的现象进行回归分析时(A)A、只能将原因作为自变量B、只能将结果作为自变量C、二者均可作为自变量D、没有必要区分自变量二、多项选择题1(下列哪些现象之间的关系为相关关系(ACD)A家庭收入与消费支出关系 B圆的面积与它的半径关系C广告支出与商品销售额关系 D单位产品成本与利润关系E在价格固定情况下,销售量与商品销售额关系2(相关系数表明两个变量之间的(DE)A线性关系 B因果关系 C变异程度 D相关方向 E相关的密切程度3、如下的现象属于负相关的有(BCD)。

统计学练习题(含作业及非官方答案)(1)

统计学练习题(含作业及非官方答案)(1)

一、单项选择题1.根据样本计算的用于推断总体特征的概括性度量值称作(参数)A.参数B.总体C.样本D.统计量2.只能归于某一类别的非数字型数据称为(分类数据)A.分类数据B.顺序数据C.数值型数据D.数值型变量3.只能归于某一有序类别的非数字型数据称为(顺序数据)A.分类数据B.顺序数据C.数值型数据D.数值型变量4.用来描述样本特征的概括性数字度量称为(统计量)A.参数B.统计量C.变量D.变量值5.为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是(整群抽样)A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样6.为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生进行调查,这种调查方法是(分层抽样)A.简单随机抽样B.整群抽样C.系统抽样D.分层抽样7.经验法则表明,当一组数据对称分布时,在平均数加减1个标准差的范围之内大约有(68%)A.68%B.95%C.99%D.100%8.经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围内大约有(95%)A.68%B.95%C.99%D.100%9.离散系数的主要用途是(比较多组数据的离散程度)A.反映一组数据的离散程度B.反映一组数据的平均水平C.比较多组数据的离散程度D.比较多组数据的平均水平10.比较两组数据的离散程度最适合的统计量是(离散系数)A.极差B.平均差C.标准差D.离散系数11.峰态通常是与标准正态分布相比较而言的,如果一组数据服从标准正态分布,则峰态系数的值(等于0)A.等于0B.大于0C.小于0D.等于112.如果峰态系数k>0,表明该组数据是(尖峰分布)A.尖峰分布B.扁平分布C.左偏分布D.右偏分布13.某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,则该组数据的中位数是(赞成)A.赞成B.69C.中立D.2214.某班共有25名学生,期未统计学课程的考试分数分别为68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,那么该班考试分数的下四分位数和上四分位数分别是(64.5和78.5)A.64.5和78.5B.67.5和71.5C.64.5和71.5D.64.5和67.515.某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72、63.1、54.7、54.3、29、26.9、25、23.9、23、20,该组数据的中位数为(27.95)A.28.46B.30.20C.27.95D.28.1216.一组数据的离散系数为0.4,平均数为20,则标准差为(8)A.80B.0.02C.4D.8 方差:1)(122--=∑=nxxsnii;离散系数:xsvs=17.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为(µ)A.µB.XC.2σ D.n2σ18. 根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的方差为(n2σ)A.µB.XC.2σ D.n2σ19.假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布(近似正态分布)A.服从非正态分布B.近似正态分布C.服从均匀分布D.服从2χ分布20.总体均值为50,标准差为8,从此总体中随机抽取容量为64的样本,则样本均值的抽样分布的均值和标准误差分别为(50,1)A.50,8B.50,1C.50,4D.8,821.当正态总体的方差未知时,在大样本条件下,估计总体均值使用的分布是(正态分布)A.正态分布B.t分布C.2χ分布 D.F分布22.当正态总体的方差未知时,在小样本条件下,估计总体均值使用的分布是(t分布)A.正态分布B.t分布C.2χ分布 D.F分布23.根据两个匹配的小样本估计两个总体均值之差时,使用的分布是(t分布)A.正态分布B.t分布C.2χ分布 D.F分布24.估计两个总体方差比的置信区间时,使用的分布是(F分布)A.正态分布B.t分布C.2χ分布 D.F分布25.一种零件的标准长度5cm,要检验某天生产的零件是否符合标准要求,建立的原假设和备择假设应为(H0:µ=5,H1: µ≠5)A.H0:µ=5,H1: µ≠5B.H0:µ≠5,H1: µ=5C.H0:µ≤5,H1: µ≥5D.H0:µ≥5,H1: µ≤526.一项研究表明,中学生中吸烟的比例高达30%,为检验这一说法是否属实,建立的原假设和备择假设应为(H0:π=30%,H1:π≠30%)A.H0:µ=30%,H1: µ≠30%B.H0:π=30%,H1:π≠30%C.H0:π≥30%,H1:π≤30%D. H0:π≤30%,H1:π≥30%27.列联分析是利用列联表来研究(两个分类变量的关系)A.两个分类变量的关系B.两个数值型变量的关系C.一个分类变量和一个数值型变量的关系D.两个数值型变量的分布28.设R 为列联表的行数,C 为列联表的列数,则2χ分布的自由度为((R-1)×(C-1))A.RB.CC.R×CD.(R-1)×(C-1) 29.方差分析的主要目的是判断(分类型自变量对数值型因变量的影响是否显著) A.各总体是否存在方差B.各样本数据之间是否有显著差异C.分类型自变量对数值型因变量的影响是否显著D.分类型因变量对数值型自变量的影响是否显著30.组间误差是衡量不同水平下各样本数据之间的误差,它(既包括随机误差,又包括系统误差)A.只包括随机误差B.只包括系统误差C.既包括随机误差,又包括系统误差D.有时包括随机误差,有时包括系统误差 31.组内误差是衡量某一水平下样本数据之间的误差,它(只包括随机误差)A.只包括随机误差B.只包括系统误差C.既包括随机误差,又包括系统误差D.有时包括随机误差,有时包括系统误差 32.单因素方差分析是指只涉及(一个分类型自变量)A.一个分类型自变量B.一个数值型自变量C.两个分类型自变量D.两个数值型因变量33.双因素方差分析涉及(两个分类型自变量)A.两个分类型自变量B.两个数值型自变量C.两个分类型因变量D.两个数值型因变量34.在方差分析中,数据的误差用平方和来表示的,其中反映一个样本中各观测值误差大小的平方和称为(组内平方和) A.组间平方和 B.组内平方和 C.总平方和 D.水平项平方和 35.在方差分析中,数据的误差用平方和来表示的,其中反映各个样本均值之间误差大小的平方和称为(组间平方和) A.误差项平方和 B.组内平方和 C.组间平方和 D.总平方和 36.如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,称为两个变量之间为(完全相关关系)A.完全相关关系B.正线性相关关系C.非线性相关关系D.负线性相关关系37.如果相关系数r =0,则表明两个变量之间(不存在线性相关关系)A.相关程度很低B.不存在任何关系C.不存在线性相关关系D.存在非线性相关关系 38.在一元线性回归方程中,回归系数iβ的实际意义是(当x变量1个单位时,y 增加的总数量)A.当x=0时,y 的平均变动数量B.当x 变动1个单位时,y 的平均变动数量C.当x 变动1个单位时,y 增加的总数量D.当y 变动1个单位时,x 的平均变动数量39.对不同年份的产品成本拟合的直线方程为x y 75.1280-=,回归系数75.11-=β表示(时间每增加1个单位,产品成本平均下降1.75个单位)A.时间每增加1个单位,产品成本平均增加1.75个单位B.时间每增加1个单位,产品成本平均下降1.75个单位C.产品成本每变动1个单位,平均需要1.75年时间D.时间每减少1个单位,产品成本平均增加1.75个单位 40.说明回归方程拟合优度的统计量是(判定系数)A.相关系数B.回归系数C.判定系数D.估计标准误差 41.各实际观测值(yi )与回归值(i yˆ)的离差平方和称为(残差平方和)A.总变差平方和B.残差平方和C.回归平方和D.判定系数 42.回归平方和占总平方和的比例称为(判定系数)A.相关系数B.回归系数C.判定系数D.估计标准误差 43.若两个变量存在负线性相关关系,则建立的一元线性回归方程的判定系数R2的取值范围是([0,1])A.[0,1]B.[-1,0]C.[-1,1]D.小于0的任意数 44.若变量x 与y 之间的相关系数r =0,则下列结论中正确的是(判定系数R2=0)A.判定系数R2=1B.判定系数R2=0C.回归系数1ˆ1=βD.估计标准误差se =045.在多元线性回归方程k k i x x y βββˆˆˆˆ110+++=Λ中,回归系数i βˆ表示(其他变量不变的条件下,自变量xi 变动1个单位时,因变量y 的平均变动额为i βˆ)A.自变量xi 变动1个单位时,因变量y 的平均变动额为i βˆB.其他变量不变的条件下,自变量xi 变动1个单位时,因变量y 的平均变动额为i βˆC.其他变量不变的条件下,自变量xi 变动1个单位时,因变量y 的变动总额为i βˆD.因变量y 变动1个单位时,因变量xi 的变动总额为i βˆ46.设在多元线性回归方程k k i x x y βββˆˆˆˆ110+++=Λ中,若自变量xi 的回归系数i βˆ的取值接近0,这表明(自变量xi 对因变量y 的影响不显著)A.因变量y 对自变量xi 的影响不显著B.因变量y 对自变量xi 的影响显著C.自变量xi 对因变量y 的影响不显著D.自变量xi 对因变量y 的影响显著47.指数平滑法适合于预测(平稳序列)A.平稳序列B.非平稳序列C.有趋势成分的序列D.有季节成分的序列48.移动平均法适合于预测(平稳序列)A.平稳序列B.非平稳序列C.有趋势成分的序列D.有季节成分的序列49.用最小二乘法拟合直线趋势方程为t b b Y 10ˆ+=,若1b 为负数,表明该现象随着时间的推移呈现(下降趋势)A.上升趋势B.下降趋势C.水平趋势D.随机波动 50.对某一时间序列拟合的直线趋势方程为x b b Y t 10ˆ+=,如果b1的值等于0,则表明该序列(没有趋势)A.没有趋势B.有上升趋势C.有下降趋势 D ,有非线性趋势二、简答题1.简要区别描述统计与推断统计?答:描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等方法。

《数据分析与SPSS软件应用》试卷及答案

《数据分析与SPSS软件应用》试卷及答案

《数据分析与SPSS软件应用》试卷及答案一、填空题(每空2分,共20分)1. 统计分析所使用的数据按照其测量精度,可以分为四种类型,分别是定性数据、定序数据、和。

2. SPSS中可以进行变量转换的命令有。

3. 多选项二分法是将设置为一个SPSS变量,而多选项分类法是将设置为SPSS变量。

4. 进行两独立样本群均值比较前,首先要验证的是。

5. 协方差分析中,对协变量的要求是数值型,多个协变量间互相独立和。

6. 多配对样本的柯克兰Q检验适用的数据类型为。

7. 衡量定距变量间的线性关系常用相关系数。

8.常用来刻画回归直线对数据拟合程度的检验统计量指标为。

二、选择题(每小题2分,共20分)1. 在SPSS中,以下哪种不属于SPSS的基本运行方式?()A 完全窗口菜单方式B 批处理命令方式C 程序运行方式D 混合运行方式2. 设置变量属性时,不属于SPSS提供的变量类型的是()A 数值型B 科学计数型C 分数型D 字符型3. 数据的描述统计分析结果显示偏度值为-1.3,则下列对数据分布状态说法正确的是()A 左偏B 正偏C 与正态分布一致D 可能存在极大值4. 若原假设与备择假设为:,则:()A 应使用右侧单尾检验B 应使用左侧单尾检验C 应使用双尾检验D 无法检验5. 下列哪个不是单因素方差分析的基本假定?()A 各总体的均值相等B 各总体相互独立C 样本来自于正态总体D 各总体的方差相等6. 两个配对样本的Wilcoxon符号秩检验所对应的参数检验方法是?()A 两个独立总体均值差的检验B 两个配对总体均值差的检验C 一个总体均值的检验D 单因素方差分析7. 皮尔逊简单相关系数为1,说明()A 两变量之间不存在线性相关关系B 两变量之间是负相关关系C 两变量之间存在完全的线性相关关系D 两变量之间具有高度相关性8.下列说法正确的是()A回归分析是以变量之间存在函数关系为前提的B回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法C 回归分析中自变量个数只能为一个D 回归分析是反应确定性问题的统计分析方法9.以下关于聚类分析的叙述中错误的是()A 聚类分析的目的在于将事物按其特性分成几个聚类,使同一类内的事物具有高度相似性B 不同聚类的事物则具有高度的异质性C 对于衡量相似性,只能使用距离的工具D 建立聚类的方法,有层次聚类法和快速聚类法10. 关于因子分析,错误的说法是()A 适用于多变量、大样本B 原变量间不必要存在高度的相关性C定类和定序变量不适合做因子分析D 因子得分可以作为新变量存储在数据表格中三、判断题(每小题2分,共20分)1. SPSS中可将”.”用于变量命名,且”.”可以位于变量名末尾。

社会统计学期末复习训练及部分答案1

社会统计学期末复习训练及部分答案1

社会统计学期末复习训练及部分答案一、单项选择题1.为了解IT 行业从业者收入水平,某研究机构从全市IT 行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。

此处800人是( B )A .样本 B. 总体 C. 统计量 D. 变量2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为( C )A .频率B. 累积频数C. 累积频率D. 比率3.离散系数的主要目的是( D ) A .反映一组数据的平均水平 B .比较多组数据的平均水平 C .反映一组数据的离散程度 D .比较多组数据的离散程度4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( B )A. 50%的数据B. 68%的数据C. 95%的数据D. 99%的数据5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为( A )A. 39.19B. 28.90 C .19.54 D .27.956.用样本统计量的值直接作为总体参数的估计值,这种方法称为( A )A .点估计B .区间估计C .有效估计D .无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。

如果要检验该说法是否正确,则假设形式应该为( C )A .0H :π≥0.1;1H :π<0.1B .0H :π≤0.1;1H :π>0.1C .0H :π=0.1;1H :π≠0.1D .0H :π>0.1;1H :π≤0.18.下面哪一项不是方差分析中的假定( ) A .每个总体都服从正态分布 B .观察值是相互独立的 C .各总体的方差相等D .各总体的方差等于09.判断下列哪一个不可能是相关系数( D ) A .-0.9 B .0C .0.5D .1.210.用于说明回归方程中拟合优度的统计量主要是( C )A. 相关系数B. 离散系数C. 回归系数D. 判定系数11.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。

广药统计学简答

广药统计学简答

简述众数、中位数和均值的特点及应用场合众数:不受极端值影响、具有不惟一性、数据分布偏斜程度较大且有明显峰值时应用中位数:不受极端值影响、数据分布偏斜程度较大时应用平均数:易受极端值影响、数学性质优良、数据对称分布或接近对称分布时应用简述用excel进行回归的具体步骤,写出excel输出的回归结果包括几个部分第1步:选择【工具】下拉菜单第2步:选择【数据分析】选项第3步:在分析工具中选择【回归】,选择【确定】第4步:当对话框出现时在【Y值输入区域】设置框内键入Y的数据区域在【X值输入区域】设置框内键入X的数据区域在【置信度】选项中给出所需的数值在【输出选项】中选择输出区域在【残差】分析选项中选择所需的选项写出用excel进行方差分析的操作步骤第1步:选择【工具】下拉菜单,选择【数据分析】选项第2步:在分析工具中选择【单因素方差分析】,选择【确定】第3步:当对话框出现时在【输入区域】方框内输入数据单元格在【a】方框输入题目所需提示的a在【置信度】选项中给出所需的数值在【输出选项】中选择输出区域回归分析主要解决哪些方面的问题?1.从一组样本数据出发,确定变量之间的数学关系;2.对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的;3.利用所求的关系式,根据一个或几个变量的取值来估计与预测另一个变量的值,并给出可靠程度;季节指数的计算的基本步骤1.计算移动平均值,并将其结果进行“中心化”处理。

将移动平均的结果再进行一次2项的移动平均,即得出“中心化移动平均值”(CMA)2.计算移动平均的比值,也称为季节比率,将序列的各观察值除以相应的中心化移动平均值,然后再计算出各比值的季度(或月份)平均值,即季节指数3.季节指数调整,各季节指数的平均数应等于1或100%,若根据第2步计算的季节比率的平均值不等于1时,则需要进行调整。

具体方法是:将第2步计算的每个季节比率的平均值除以它们的总平均值什么是季节指数,它起到什么作用,举一个例子说明1刻画序列在一个年度内各月或季的典型季节特征2以其平均数等于100%为条件而构成3反映某一月份或季度的数值占全年平均数值的大小4如果现象的发展没有季节变动,则各期的季节指数应等于100%5季节变动的程度是根据各季节指数与其平均数(100%)的偏差程度来测定例子:在市场销售中,一些商品如电风扇、冷饮、四季服装等往往受季节影响而出现销售的 淡季和旺季,回归分析中误差项与残差项的区别与联系1. 误差项8是随机变量2. 反映了除x 和y 之间的线性关系之外的随机因素对y 的影响,是不能由x 和y 之间的线性关系所解释的变异性3. 残差定义为*七—^)4. 联系为可以用残差的代数式来估计误差项写出判定系数的计算公式,并说明判定系数的意义?1. 回归平方和占总误差平方和的比例2. 反映回归直线的拟合程度3. 取值范围在:0, 1 :之间4. R2 -1,说明回归方程拟合的越好;R2—0,说明回归方程拟合的越差5. 判定系数等于相关系数的平方1 — n i = E (y —y I i i =1 i =1请根据你的了解,写出1个误用统计学方法的例子,并说明应该如何正确应用 方法?比如用平均工资代表某一地区的典型收入,平均房价代表某一地区的典型房价。

计量经济学习题01讲解

计量经济学习题01讲解

、单项选择题21?已知含有截距项的三元线性回归模型估计的残差平方和为 ' e t=800,估计用样本容量为n =24,则随机误差项u t 的方差估计量为() A. 33.33 B.40C.38.092、如果模型中出现随机解释变量并且与随机误差项相关时, 最常用的估计方法 是() A. 普通最小二乘法 B.加权最小二乘法C.差分法D.工具变量法3?最小二乘准则是指使()达到最小值的原则确定样本回归方程。

4、下图中“ { ”所指的距离是()A.随机误差项B.残差C.Y 的离差D.£的离差5?已知模型的形式为y =打「YX • u,在用实际数据对模型的参数进行估计的 时候,测得DW 统计量为0.6453,则广义差分变量是()Ay t -0.6453y t4, X t -0.6453(2B y t -0.6774y», x t -0.6774x t 一C. y t —y t 斗,X t-X t.D.y t -0.05y t4,X t -0.05XzD.36.36c max Y t -Y?nB •送 Y t _Y t 壬n 2D.' Y -Yt = 1—叮?梯6、对模型Yi= B 0+ B 1X1i+ B 2X2i+卩i 进行总体显著性检验,如果检验结果总 体线性关系显著,则不可能( )A. B 仁0, B 2=0B. B 1工 0, B 2=0C. B 1=0B 2工0D. B 1工0, B 2工07?在多元线性回归中,判定系数 R A 2随着解释变量数目的增加而( )A.增加B •减少 C.不变 D.变化不定 8.反映由模型中解释变量所解释的那部分离差大小的是 ()o A.总体平方和B.回归平方和C. 残差平方和29. 设k 为回归模型中的参数个数(包括截距项),n 为样本容量,ESS 为残差平 方和,RSS 为回归平方和。

则对总体回归模型进行显著性检验时构造的 F 统计 量为()。

奥鹏北语14秋《统计学》作业3满分答案

奥鹏北语14秋《统计学》作业3满分答案

14秋《统计学》作业3
一,单选题
1. 设有4组容量相同的样本,即n=8相关系数分别为:r1=0.65,r2=0.74,r3=0.89,r4=0.92,若取显著性水平α=0.05进行检验,哪一个相关系数在统计上是不显著的?()。

A. r1
B. r2
C. r3
D. r4
正确答案:A
2. 计算标准差时,如果从每个变量值中减去任意数,计算结果与原标准差相比较()。

A. 变大
B. 不变
C. 可能变小
D. 少了一个A值
正确答案:B
3. 设产品产量与产品单位成本之间的简单相知系数为-0.86,这说明二者之间存在()。

A. 高度相关
B. 中度相关
C. 低度相关
D. 极弱相关
正确答案:A
4. 说明回归直线拟合程度的统计量主要是()。

A. 相关系数
B. 回归系数
C. 判定系数
D. 估计标准误差
正确答案:C
5. 在单因素方差分析中,若Q=20,Q2=10,r=4,n=20,则F值为()。

A. 2
B. 6.33
C. 2.375
D. 5.33
正确答案:D
6. 在双因素方差分析中,计算FA统计量,其分子与分母的自由度各为()。

A. r-1,s-1
B. r-1,(r-1)(s-1)
C. s-1,(r-1)(s-1)。

统计学期末知识点总结

统计学期末知识点总结

1.多重共线性:当回归模型中存在两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性。

2.相关关系:变量之间存在的不确定的数量关系,称为相关关系。

3.五个相关关系:正线性相关,负线性相关,完全正线性相关,完全负线性相关,非线性相关,不相关。

若 0<r≤1,表明 x 与 y 之间存在正线性相关关系;若-1≤r <0,表明 x 与 y 之间存在负线性相关关系;若 r=+1,表明 x 与 y 之间为完全正线性相关关系;若 r=-1,表明 x 与 y 之间为完全负线性相关关系。

|r|→1 说明两个变量之间的线性关系越强;|r|→0 说明两个变量之间的线性关系越弱。

4.回归直线的拟合优度:回归直线与各观测点的接近程度称为回归直线对数据的拟合优度。

判定系数 R2测度了回归直线对观测数据的拟合程度。

5.最小二乘估计法:通过使因变量的观测值 yi 与估计值yi ∧之间的离差平方和,即残差平方和,达到最小来估计β0和β1的方法。

6. F 检验和 t 检验各有什么作用:F 检验是检验自变量 x 和因变量 y 之间的线性关系是否显著;t 检验是检验自变量对因变量的影响是否显著,也就是回归系数的检验。

7.8.正态分布—Z分布:大样本或小样本总体标准差σ已知。

9.N-1的T分布:小样本σ未知。

10.参数估计:点估计与区间估计11.置信区间:由样本统计量所构造的总体参数的估计区间。

12.置信水平:置信区间中包含总体参数真值的次数所占的比例。

置信水平越大,所需的样本量也就越大,置信区间越宽。

13.评价估计量的标准:无偏性:是指估计量抽样分布的数学期望等于被估计的总体参数有效性:是指对同一参数的两个无偏估计量,有更小方差的估计量越有效。

一致性:是指随着样本量n的增大,估计量的值越来越接近总体参数的真值。

14.样本量越大,样本均值的抽样标准差就越小。

15.总体数据的方差越大,估计时所需的样本量越大。

16.数据概括性度量:(数据分布特征的测量)集中趋势,离散程度,分布形态(偏态与峰态)17.三个分布:对称分布—众数=中位数=平均数左偏分布—平均数<中位数<众数右偏分布—众数<中位数<平均数18.标准分数的用途:①变量值与其平均数的离差除以标准差后的值称为标准分数,用Z表示。

练习--相关与回归分析

练习--相关与回归分析

第十一章 相关与回归分析一、填空题1. 社会经济现象间的关系分为两种类型:一种是 ,另一种是 。

2. 在相关关系中,当给定一个X 值时,Y 值不是唯一确定的,而可能同时出现几个不同的数值并在一定范围内围绕其 上下波动。

3. 按相关的程度可分为 、 和 。

4. 相关系数的取值在 之间,其绝对值在 之间属于中度相关。

5. 回归分析就是根据变量X 与Y 之间的关系,建立两个变量之间的直线关系近似表达式进行 和 的。

6. 直线回归中总变差等于 和 之和。

7. 回归系数b 与相关系数r 的符号应 ,当b 大于0时,表明两变量是 。

8. 在相关分析中,要求两个变量都是随机的,而在回归分析中,要求自变量是 ,因变量是 。

9. 设变量x 与y 之间的相关系数r = - 0.92, 这说明这两个变量之间存在着 相关。

10. 在线性回归分析中,只涉及一个自变量的回归称为 ;涉及多个自变量的回归称为 。

二、 判断题1. 如果变量x 与y 之间的相关系数r = 0,表明这两个变量之间不存在任何相关关系。

( )2. 设两个变量的一元线性回归方程为c Y = -10 + 0.5x,由此可以判定这两个变量之间存在着负相关关系。

( )3. 在其他条件不变的情况下,可决系数2R 越大,估计标准误差X Y S .也越大,回归直线的拟合程度就越低。

( )4. 如果回归系数为零,则相关系数必为零。

( )5. 对相关系数进行显著性检验,即检验总体相关系数ρ是否为零。

若ρ=0表示变量X 与Y 间存在线性相关关系。

( )6. 回归变差反映的是由于x 与y 之间的线性关系而引起的y 的变差。

( )7. 相关系数r 与可决系数2R 的取值范围是一致的。

( )8. 相关关系侧重于考察变量之间的关系密切程度,回归分析则侧重于考察变量之间的数量变化规律。

( )9. 我国的GDP 与印度的人口之间的相关系数大于0.8,因此两者具有高度正相关关系。

( )10. 拟合回归直线的目的在于用直线上的点来代表所有的相关点。

计量经济学试卷汇总含答案

计量经济学试卷汇总含答案

选择题(单选题1-10 每题1 分,多选题11-15 每题2 分,共20 分)1、在多元线性回归中,判定系数R2随着解释变量数目的增加而BA. 减少B•增加C.不变 D •变化不定2 、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近1,则表明模型中存在CA•异方差性 B •序列相关C.多重共线性D •拟合优度低3 、经济计量模型是指DA .投入产出模型B .数学规划模C.模糊数学模型D.包含随机方程的经济数学模型4 、当质的因素引进经济计量模型时,需要使用DA. 外生变量B. 前定变量C.内生变量D.虚拟变量5、将内生变量的前期值作解释变量,这样的变量称为DA.虚拟变量B.控制变量C.政策变量D.滞后变量6、根据样本资料已估计得出人均消费支出丫对人均收入X的回归模型Ln 丫=5+,这表明人均收入每增加1%,人均消费支出将预期增加BA. % B . %C. 5% D . % 7、对样本相关系数r,以下结论中错误的是DA .越接近于1 , 丫与X之间线性相关程度越高B. 越接近于0 , 丫与X之间线性相关程度越弱C. -1 < r < 1D .若r=0,则X与丫独立8、当DW>4-d L,则认为随机误差项sA .不存在一阶负自相关B .无一阶序列相关C.存在一阶正自相关D.存在一阶负自相关9、如果回归模型包含二个质的因素,且每个因素有两种特征,则回归模型中需要引入A .一个虚拟变量B.两个虚拟变量C .三个虚拟变量D .四个虚拟变量10、线性回归模型-一…上J,-L ----- 「中,检验H。

:i =0 (i=12,…,k )时,所用的统计量t i .服从var(i )(n-k+1) (n-k-2)(n-k-1) (n-k+2)11、对于经典的线性回归模型,各回归系数的普通最小二乘法估计量具有的优良特性有ABCA .无偏性B .有效性C. 一致性 D .确定性 E .线性特性12、经济计量模型主要应用于ABCDA .经济预测B .经济结构分析C .评价经济政策D .政策模拟13、常用的检验异方差性的方法有ABC、A •戈里瑟检验B •戈德菲尔德-匡特检验C •怀特检验D • DW检验E •方差膨胀因子检测14、对分布滞后模型直接采用普通最小二乘法估计参数时,会遇到的困难有BCEA •不能有效提高模型的拟合优度B •难以客观确定滞后期的长度C •滞后期长而样本小时缺乏足够自由度D •滞后的解释变量存在序列相关问题E•解释变量间存在多重共线性问题15、常用的检验自相关性的方法有BCDA .特征值检验B .偏相关系数检验C.布罗斯—戈弗雷检验 D . DW检验E .怀特检验二、判断正误(正确打V,错误打X,每题1分,共10分,答案填入下表)1、在存异方差情况下采用的普通最小二乘回归估计是有偏估计2、DW统计量的值接近于2,则样本回归模型残差的一阶自相关系数近似等于03、方差膨胀因子检测法可以检测模型的多重共线性4、设有样本回归直线丫。

第二章习题及答案计量经济学

第二章习题及答案计量经济学

第二章 简单线性回归模型一、单项选择题(每题2分): 1、回归分析中定义的( )。

A 、解释变量和被解释变量都是随机变量B 、解释变量为非随机变量,被解释变量为随机变量C 、解释变量和被解释变量都为非随机变量D 、解释变量为随机变量,被解释变量为非随机变量2、最小二乘准则是指使( )达到最小值的原则确定样本回归方程。

A 、1ˆ()nt tt Y Y=-∑B 、1ˆn t tt Y Y =-∑ C 、ˆmax t tY Y - D 、21ˆ()n t t t Y Y =-∑3、下图中“{”所指的距离是( )。

A 、随机误差项B 、残差C 、i Y 的离差D 、ˆiY的离差 4、参数估计量ˆβ是iY 的线性函数称为参数估计量具有( )的性质。

A 、线性 B 、无偏性 C 、有效性 D 、一致性5、参数β的估计量βˆ具备最佳性是指( )。

A 、0)ˆ(=βVarB 、)ˆ(βVar 为最小C 、0ˆ=-ββD 、)ˆ(ββ-为最小 6、反映由模型中解释变量所解释的那部分离差大小的是( )。

A 、总体平方和 B 、回归平方和 C 、残差平方和 D 、样本平方和7、总体平方和TSS 、残差平方和RSS 与回归平方和ESS 三者的关系是( )。

A 、RSS=TSS+ESS B 、TSS=RSS+ESS C 、ESS=RSS-TSS D 、ESS=TSS+RSS 8、下面哪一个必定是错误的( )。

A 、 i i X Y 2.030ˆ+= ,8.0=XY rB 、 i i X Y 5.175ˆ+-= ,91.0=XY rC 、 i i X Y 1.25ˆ-=,78.0=XY rD 、 i i X Y 5.312ˆ--=,96.0-=XY r9、产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为ˆ356 1.5YX =-,这说明( )。

A 、产量每增加一台,单位产品成本增加356元B 、产量每增加一台,单位产品成本减少1.5元C 、产量每增加一台,单位产品成本平均增加356元D 、产量每增加一台,单位产品成本平均减少1.5元10、回归模型i i i X Y μββ++=10,i = 1,…,n 中,总体方差未知,检验010=β:H 时,所用的检验统计量1ˆ11ˆβββS -服从( )。

线性回归习题

线性回归习题

第9章一元线性回归练习题一.选择题1.具有相关关系的两个变量的特点是()A.一个变量的取值不能由另一个变量唯一确定B.一个变量的取值由另一个变量唯一确定C.一个变量的取值增大时另一个变量的取值也一定增大D.一个变量的取值增大时另一个变量的取值肯定变小2.下面的各问题中,哪个不是相关分析要解决的问题A.判断变量之间是否存在关系B.判断一个变量数值的变化对另一个变量的影响C.描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系3.根据下面的散点图,可以判断两个变量之间存在()A.正线性相关关系B. 负线性相关关系C. 非线性关系D. 函数关系4.下面的陈述哪一个是错误的()A. 相关系数是度量两个变量之间线性关系强度的统计量B.相关系数是一个随机变量C.相关系数的绝对值不会大于1D.相关系数不会取负值5.根据你的判断,下面的相关系数取值哪一个是错误的()A. -0.86B. 0.78C. 1.25D. 06.如果相关系数r=0,则表明两个变量之间()A.相关程度很低B. 不存在任何关系C.不存在线性相关关系D.存在非线性关系7.下列不属于相关关系的现象是()A.银行的年利息率与贷款总额B.居民收入与储蓄存款C.电视机的产量与鸡蛋产量D.某种商品的销售额与销售价格8.设产品产量与产品单位成本之间的线性相关系数为-0.87,这说明二者之间存在着()A. 高度相关B.中度相关C.低度相关D.极弱相关9.在回归分析中,被预测或被解释的变量称为()A.自变量B.因变量C.随机变量D.非随机变量10.对两变量的散点图拟合最好的回归线,必须满足一个基本的条件是()A.2ˆ()yy∑-最小B.2)(ˆyy∑-最大C.2ˆ()yy∑-最大D.2)(ˆyy∑-最小11. 下列哪个不属于一元回归中的基本假定()A.误差项i ε服从正态分布B. 对于所有的X ,方差都相同C. 误差项i ε相互独立D. 0)ˆ=-i i yy E ( 12.如果两个变量之间存在着负相关,指出下列回归方程中哪个肯定有误( )A.x y75.025ˆ-= B. x y 86.0120ˆ+-= C. x y 5.2200ˆ-= D. x y 74.034ˆ--= 13.对不同年份的产品成本拟合的直线方程为,75.1280ˆx y-=y 表示产品成本,x 表示不同年份,则可知( )A.时间每增加一个单位,产品成本平均增加1.75个单位B. 时间每增加一个单位,产品成本平均下降1.75个单位C.产品成本每变动一个单位,平均需要1.75年时间D. 产品成本每减少一个单位,平均需要1.75年时间 14.在回归分析中,F 检验主要是用来检验( )A .相关关系的显著性 B.回归系数的显著性 C. 线性关系的显著性D.估计标准误差的显著性15.说明回归方程拟合优度的统计量是( )A. 相关系数B.回归系数C. 判定系数D. 估计标准误差16.已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R 2=( ) A.97.08% B.2.92% C.3.01% D. 33.25% 17. 判定系数R2值越大,则回归方程( )A 拟合程度越低B 拟合程度越高C 拟合程度有可能高,也有可能低D 用回归方程进行预测越不准确 18. 居民收入与储蓄额之间的相关系数可能是( ) A -0.9247 B 0.9247 C -1.5362 D 1.536219.在对一元回归方程进行显著性检验时,得到判定系数R 2=0.80,关于该系数的说法正确的是( )A. 该系数越大,则方程的预测效果越好B. 该系数越大,则由回归方程所解释的因变量的变差越多C. 该系数越大,则自变量的回归对因变量的相关关系越显著D. 该回归方程中自变量与因变量之间的相关系数可能小于0.8 20.下列方程中肯定错误的是( )A. x y48.015ˆ-=,r=0.65 B. x y 35.115ˆ--=, r= - 0.81 C. x y85.025ˆ+-=, r=0.42 D. x y 56.3120ˆ-=, r= - 0.96 21. 若两个变量存在负相关关系,则建立的一元线性回归方程的判定系数R 2的取值范围是( )A.【0,1】B. 【-1,0】C. 【-1,1】D.小于0的任意数二. 填空题1.当从某一总体中抽取了一样本容量为30的样本,并计算出某两个变量的相关系数为0.8时,我们是否可认为这两个变量存在着强相关性(不能 ) ,理由是(因为该相关系数为样本计算出的相关系数,它的大小受样本数据波动的影响,它是否显著尚需检验 )。

应用心理硕士心理学专业综合(推断统计)模拟试卷4(题后含答案及解析)

应用心理硕士心理学专业综合(推断统计)模拟试卷4(题后含答案及解析)

应用心理硕士心理学专业综合(推断统计)模拟试卷4(题后含答案及解析)题型有:1. 单项选择题 2. 多项选择题 3. 简答题单项选择题下列各题的备选答案中,只有一个是符合题意的。

1.心理学家使用协方差分析是为了( )。

A.控制与实验目的无关的方差B.使总方差最小化C.使总方差最大化D.使协方差最小化正确答案:A解析:注意,即使用了协方差分析,总方差也是不变的。

知识模块:推断统计2.当一个实验( )时,我们才能得到交互作用。

A.因变量多于一个B.自变量多于一个C.因变量有多于一个的水平D.自变量有多于两个的水平正确答案:B解析:交互作用:当一个因素的水平在另一个因素的不同水平上变化趋势不一致时,我们称这两个因素之间存在交互作用。

知识模块:推断统计3.二因素设计的房查分析中,交互作用的效应是F(2,44)=2.91,由此可知( )A.研究中有48名被试B.一个因素有两个水平,另一个因素有三个水平C.一个因素对因变量的作用在另一个因素的不同水平有变化D.其主效应是不显著的正确答案:B解析:此题不知道是组间设计,或是组内设计还是混合设计,所以被试人数无法得知,故A错。

从交互效应值看不出主效应值的情况,故D错。

df(AB)=(p 一1)(q一1)=2,所以可知一个变量是两个水平,另一个变量是三个水平。

F(2,44)=2.91到底是否显著,在查表之前不能确定,所以不知道交互作用是否显著,所以C不能选。

知识模块:推断统计4.你做了一个3×4的组间方差分析,结果两个主效应显著,没有显著的交互作用,你是否要接下去作简单效应分析?( )A.是的,只分析一个因素B.是的,分析两个因素C.不需要,只需要用事后检验分别比较各行和列的均值D.不需要,只需要用事后检验比较各单位格的均值正确答案:C解析:交互作用不显著,就不需要作简单效应分析,所以A、B都错。

因素的主效应显著时,若处理水平数大于2,就需要做事后检验,这就是C。

用样本可决系数检验回归方程的拟合优度

用样本可决系数检验回归方程的拟合优度

用样本可决系数检验回归方程的拟合优度1、总离差平方和的分解拟合优度:是指回归直线对观测值的拟合程度。

显然若观测值离回归直线越近,则拟合程度越好,相对X 对Y 的解释程度越强;反之则拟合程度差。

TSS (总离差平方和)=RSS (回归平方和)+ E SS (残差平方和)∑ (Y i -Y -) 2= ∑ (ˆi Y -Y -) 2 + ∑ (Y i - ˆi Y )2 =∑ (ˆiY -Y -) 2 +∑ (ˆi u )2 自由度 1n - 1 2n - (为什么?)TSS 为总离差平方和,反映因变量波动的大小;RSS 为回归平方和,反映由模型中解释变量计算出来的拟合值ˆiY 的波动; ESS 为残差平方和,反映样本观测值与估计值偏离的大小,也是模型中因变量总的波动中不能通过回归模型解释的那部分。

被解释变量Y 总的变动(差异)=解释变量X 引起的变动(差异)+除X 以外的其它因素引起的变动(差异)2、样本可决系数度量拟合优度的统计量是样本可决系数r 2(确定系数、判定系数):r 2= RSS TSS = 1ESS TSS-=22ˆ()()i iY Y Y Y ----∑∑=22ˆi iy y∑∑=2212ˆi ix yβ∑∑=222()i i i i x y x y ∑∑∑所以r 2的取值范围是 [0,1]。

对于一组数据,TSS 是不变的,所以RSS ↑(↓),ESS ↓(↑)。

拟合优度r 2越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。

观察点在回归直线附近越密集。

RSS :旧指回归平方和(regression sum of squares ),现指残差平方和(sum of squared residuals )ESS :旧指残差平方和(error sum of squares 或sum of squared errors ),现指回归平方和(explained sum of squares )3、样本相关系数定义:是变量X 与Y 之间线性相关程度的度量指标。

相关分析和回归分析要注意的要点,自己整理的,很全面

相关分析和回归分析要注意的要点,自己整理的,很全面

回归分析与相关分析的联系:研究在专业上有一定联系的两个变量之间是否存在直线关系以及如何求得直线回归方程等问题,需进行直线相关和回归分析。

从研究的目的来说,若仅仅为了了解两变量之间呈直线关系的密切程度和方向,宜选用线性相关分析;若仅仅为了建立由自变量推算因变量的直线回归方程,宜选用直线回归分析。

从资料所具备的条件来说,作相关分析时要求两变量都是随机变量(如:人的身长与体重、血硒与发硒);作回归分析时要求因变量是随机变量,自变量可以是随机的,也可以是一般变量(即可以事先指定变量的取值,如:用药的剂量)。

在统计学教科书中习惯把相关与回归分开论述,其实在应用时,当两变量都是随机变量时,常需同时给出这两种方法分析的结果;另外,若用计算器实现统计分析,可用对相关系数的检验取代对回归系数的检验,这样到了化繁为简的目的。

回归分析和相关分析都是研究变量间关系的统计学课题,它们的差别主要是:1、在回归分析中,y被称为因变量,处在被解释的特殊地位,而在相关分析中,x与y处于平等的地位,即研究x与y的密切程度和研究y与x的密切程度是一致的;2、相关分析中,x与y都是随机变量,而在回归分析中,y是随机变量,x可以是随机变量,也可以是非随机的,通常在回归模型中,总是假定x是非随机的;3、相关分析的研究主要是两个变量之间的密切程度,而回归分析不仅可以揭示x对y的影响大小,还可以由回归方程进行数量上的预测和控制。

1.为什么要对相关系数进行显著性检验?在对实际现象进行分析时,往往是利用样本数据计算相关系数()作为总体相关系数()的估计值,但由于样本相关系数具有一定的随机性,它能否说明总体的相关程度往往同样本容量有一定关系。

当样本容量很小时,计算出的不一定能反映总体的真实相关关系,而且,当总体不相关时,利用样本数据计算出的也不一定等于零,有时还可能较大,这就会产生虚假相关现象。

为判断样本相关系数对总体相关程度的代表性,需要对相关系数进行显著性检验。

2018年中国海洋大学432统计学考研真题参考答案

2018年中国海洋大学432统计学考研真题参考答案

2018年中国海洋大学432统计学考研真题参考答案一、填空题(20分,每题2分)1.样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为( )。

【答案】样本量【解析】样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。

2.一组样本数据为3,3,1,5,13,12,11,9,7,这组数据的中位数是( )。

【答案】7【解析】中位数是一组数据排序后处于中间位置上的变量值。

根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,最后确定中位数的具体数值。

3.已知一批产品的次品率为4%,从中有放回地抽取5个。

则5个产品中没有次品的概率为( )。

【答案】0.815【解析】有放回抽样,每次抽到正品的概率为96%,故5个产品中没次品的概率为0.965=0.815。

4.从均值为200、标准差为50的总体中抽取容量为100的简单随机样本,样本均值的期望值是( )。

【答案】200【解析】由中心极限定理可知:从均值为μ、方差为σ2(有限)的任意一个总体中抽取样本量为n 的样本,当样本量n 充分大时,样本均值X _服从均值为μ,方差为σ2/n 的正态分布,故样本均值的期望为200。

5.若边际误差E =5,σ=40,要估计总体均值μ的95%的置信区间所需的样本量为( )。

【答案】246【解析】置信水平为95%,已知Z 0.025=1.96,则边际误差为:21.965E Z α=⨯=⨯= 故可求得n =246。

6.组内平方和除以相应的自由度的结果称为( )。

【答案】组内方差【解析】由于各误差平方和的大小与观测值的多少有关,为了消除观测值多少对误差平方和大小的影响,需要将其平均,也就是用各平方和除以它们所对应的自由度,这一结果称为均方,也称为方差。

SSE 的均方也称为组内均方或组内方差,记为MSE 。

7.在假设检验中,第一类错误是指( )。

【答案】弃真错误【解析】第一类错误是原假设H 0为真却被我们拒绝了,犯这种错误的概率用α表示,所以也称α错误或弃真错误。

管理统计学 第4次

管理统计学 第4次

A 型题:1.A.当x=0时y 的期望值B.x 变动一个单位时y 的变动总额C.y 变动一个单位时x 的平均变动量D.x 变动一个单位时y 的平均变动量2. 用最小二乘法确定直线回归方程的原则是各观察点A.距直线的纵向距离相等B.距直线的纵向距离的平方和最小C.与直线的垂直距离相等D.与直线的垂直距离的平方和最小3. 以下结论中正确的是 错误:正确答案为:DA.相关系数r 在0.3以下,相关无显著意义。

B.相关系数|r| 在0.9以上,相关有极显著意义。

C.相关系数满足0<|r|<1,相关无显著意义。

D.E.以上结论均不正确。

4. F 检验不能用于 错误:正确答案为:CA.两样本方差的比较B.回归系数的假设检验C.两个样本频率的比较D.两个样本均数的比较E.多个样本均数的比较5. 计算估计标准误差的依据是A.因变量的方差B.因变量的总变差C.因变量的回归变差D.因变量的剩余变差6. 估计标准误差是反映 错误:正确答案为:DA.平均数代表性指标B.序时平均数代表指标C.现象之间相关关系的指标D.回归直线代表性指标7. 对同一资料,当处理组数为2时的方差分析的结果与t 检验的结果A.方差分析的结果更可靠B.t检验的结果更可靠C.理论上不同D.E.8. 单因素方差分析中,必然有A.SSE<SSAB.MSA<MSEC.MST=MSA+MSED.SST=SSA+SSEE.以上都不对9. 对于同一批数据,在单因素方差分析和双因素方差分析中,其各自的总离差平方和SSTA.是相同的B.可能相同,可能不同C.单因素的SST大D.单因素的SST小10. 在回归分析中,估计标准误差的计算公式是错误:正确答案为:CA. B. C. D.11. 如果对简单线性回归模型进行假设检验的结果是不能拒绝H0,这就意味着A.该模型有应用价值B.该模型无应用价值C.该模型求解错误D.X与Y之间一定无关E.尚无充分证据说明X与Y之间有线性关系12. 单因素k水平方差分析中,计算F统计量,其分子与分母的自由度各为A.k,nB.k-1,n-1C.k-1,n-kD.n-k,k-113. 对X,Y两个变量进行相关分析,以下说法正确的是错误:正确答案为:DA.样本直线相关系数=1时,说明X,Y之间一定有相关关系。

华东理工大学应用统计学(新)作业及期末复习题

华东理工大学应用统计学(新)作业及期末复习题

应用统计学(新)复习题一、多选(共计25分,每题2.5分,每题答案完全一样得满分,少选、多选、错选均不得分。

)1、在假设检验中,若检验结果是接受零假设H,则下面结论正确的是A.零假设一定成立B,根据样本值尚不能推翻零假设C.不能保证零假设为真D.不可能会犯第二类错误E.备择假设一定成立参考答案:【B;C;E】2、按计量尺度不同,统计数据可分为三类即()A.时间序列数据B.实验数据C.分类数据D.顺序数据E.数值型数据参考答案:[C;D;E]3、普查是()A.全面调查B.非全面调查C. 一次性调查D.专门调查E.经常性调查参考答案:【A;C;D】4、某产品的单位成本与工人劳动生产率之间的回归直线方程为y=30.0.6x,则()。

A.0.6为回归系数B.30是回归直线在纵轴的截距C.劳动生产率每增加一单位,单位成本平均上升0.6元D.劳动生产率每增加一单位,单位成本平均下降0.6元E.-0.6为回归系数参考答案:[B;D;E]5、抽样调查的特点有()A.抽选调查单位时必须遵守随机原则B.抽选出的单位有典型意义C.抽选出的单位是重点单位D.使用部分单位的指标数值去推断和估计总体的指标数值E.通常会产生偶然的代表性误差,但这类误差事先可以控制和计算参考答案:[A;D;E]6、具有相关关系的是()A.工号和工作效率C.子女身高和父母身高D.收入水平与消费量E.人口与物价水平参考答案:[B;C;D]7、下列数据属于时点数的有()A.流动资金平均余额20万B.储蓄存款余额500万C.商品销售额80万D.固定资产300万E.企业职工人数2000人参考答案:【A;B;D;E】8、抽样估计中的抽样误差()A.是不可避免要产生的B.是可以通过改进调查方法来消除的C.是可以事先计算出来的D.只能在调查结束之后才能计算E.其大小是可以控制的参考答案:【A;C;E】9、统计研究运用各种专门的方法,包括A.大量观察法B.统计分组法C.综合指标法D.统计模型法E.统计推断法参考答案:【A;B;C;D;E】10、工资(元)对劳动生产率(千元)的回归方程为y=10+70x,这意味着A.劳动生产率等于1000元,工资提高7o元B.劳动生产率每增加1000元,工资增长70元C.劳动生产率不变,工资为80元D.劳动生产率增加1000元,工资平均提高70元E.劳动生产率减少500元,工资平均减少35元参考答案:【D;E】二、判断(共计25分,每题2.5分)11、强度相对指标的数值是用复名数来表示的,因此都可以计算它的正指标和逆指标。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

说明回归直线拟合程度的统计量
回归直线拟合程度的统计量可以用来衡量实际数据和回归拟合直线之间的相关性。

常用的统计量有:
1、R方:R方是反映回归模型对样本数据拟合程度好坏的统计量,R^2越大,拟合程度越好。

R方的取值范围在0~1之间,R^2=1时,表示拟合程度最好,也就是说,所有样本点都落在回归直线上。

2、平均绝对偏差(Mean Absolute Deviation,MAD):MAD是衡量实际数据和拟合曲线之间差异的一种统计量,它表示样本数据和拟合曲线之间的平均绝对偏差。

MAD的取值范围在0~正无穷。

MAD越小,表示拟合程度越好。

3、均方根误差(Root Mean Square Error,RMSE):RMSE是衡量实际数据和拟合曲线之间差异的一种统计量,它表示样本数据和拟合曲线之间的均方根误差。

RMSE的取值范围在0~正无穷。

RMSE越小,表示拟合程度越好。

相关文档
最新文档