统计学(整理主要题目1)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学考试题型
(单项选择题名词解释简答题计算题)
二.简答题
1.简要区别描述统计与推断统计 P2
描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的统计方法。
2.一组数据的分布特征可以从哪几个方面进行测度?P94
(1)集中趋势:众数、平均值、中位数;(2)离散程度:方差、标准差、异众比率、四分位差、极差、平均差、离散系数;(3)数据分布的形状:偏态、峰态
χ统计量的计算步骤?P143
3.在列联分析中,简述2
提出假设;观察频数,计算f0-fe;计算(f0-fe)平方;计算(f0-fe)平方/fe;计算X2=∑(f0-fe)平方/fe;统计决策:比较检验的临界值,若小于,不能拒绝原假设,若大于,则拒绝。
4.简述单因素方差分析的基本步骤?P241
提出假设、构造检验的统计量(计算各样本均值;计算全部观测值的总均值;计算各误差平方和:总平方和SST、组间平方和SSA、组内平方和SSE;均方=平方和/自由度,计算统计量F=MSA/MSE~F(k-1,n-k))、统计决策:大于,则拒绝;小于则不拒绝。
5.简述双因素方差分析的基本步骤?P253
提出假设(分别对行因素和列因素提);构造检验的统计量(分别确定检验行因素和列因素的统计量);统计决策(分别)
6.简述方差分析的基本思路和原理?P237
为分析分类型自变量对数值型因变量的影响,需对数据误差来源的分析入手。
图形描述(散点图:均值连接而成的折线),仅从散点图还不能提供充分的证据证明因变量之间有显著差异,需要有更准确的方法来检验,从而进行方差分析。而判断均值之间是否有差异需借助方差。同一总体下,样本的观测值不同,存在随机因素造成的随机误差(组内误差);而不同总体之间的观测值也不同,存在组间误差。所以用方差分析来进行误差分析。原理:基本假定:每个总体都服从正态分布;各个总体方差相同;观测值是独立的。基于假定成立条件下,要分析自变量对因变量是否有影响,就转化为检验自变量的各个水平(总体)的均值是否相等。
χ分布、t分布、F分布及正态分布之间的关系? 第六章
7.简述2
这三个分布都是由正态分布变形得到的,在实际中用来做假设检验。
如果随机变量X服从t(n)分布,则X平方服从F(1,n)的F分布
卡方分布用于总体方差的区间估计;t分布用于正态总体小样本且方差未知的均值区间估计;F分布用于两个总体方差比的区间估计。
8.回归分析主要解决哪几方面的问题?P274
(1)从一组样本数据出发,确定变量之间的数学关系式;
(2)对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的;
(3)利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测的可靠程度。
9.回归分析与相关分析的区别?
1、在回归分析中,y被称为因变量;而在相关分析中,x与y处于平等的地位,即研究x与y的密切程度和研究y与x的密切程度是一致的;
2、相关分析中,x与y都是随机变量,而在回归分析中,y是随机变量,x可以是随机变量,也可以是非随机的,通常在回归模型中,总是假定x是非随机的;
3、相关分析的研究主要是两个变量之间的密切程度,而回归分析不仅可以揭示x对y的影响大小,还可以由回归方程进行数量上的预测和控制。
10.简述一元线性关系的检验步骤?P283
11.什么叫指数?指数有什么作用?+1 P363
指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。广义上讲,任何两个数值对比形成的相对数都可以称为指数;狭义上将,指数是用于测定多个项目在不同场合下综合变动的一种相对数。作用:1、综合反映社会经济现象总变动方向及变动幅度2、分析现象总变动中各因素变动的影响方向及影响程度3、反映同类现象变动趋势。
12.简述回归系数b的检验步骤P306
提出假设。H0:=0;H1:=/0。计算检验的统计量t;做出统计决策。给定显著性水平,根据自由度=n-k-1,查t分布表。若绝对值大于,则拒绝;若小于,则不拒绝原假设。
三.名词解释
1.拉氏价格指数:在计算一组商品价格指数时将作为权数的同度量因素(销售量)固定在基期计算的指数。
2.帕氏价格指数:在计算一组商品价格指数时将作为权数的同度量因素(销售量)固定在报告期计算的指数。
3.集中趋势:是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。
4.置信区间:由样本统计量所构造的总体参数的估计区间。
5.置信水平:也称为置信度或置信系数,它是将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例。
6.弃真错误:原假设为真却在检验中将原假设放弃,用“啊发错误”表示,啊发表示其概率。
7.取伪错误:原假设为伪却在检验中未拒绝原假设,用“贝塔错误”表示,贝塔表示其概率。
8.多重共线性:回归模型中两个或两个以上的自变量彼此相关。
9.趋势:时间序列在长期内呈现出某种持续向上或持续下降的变动,趋势可以是线性的,也可以是非线性的。
10.线性趋势:
11.回归方程:描述因变量y的期望值如何依赖于自变量x的方程。一元线性回归方程的形式为E(y)= + x。
12.最小二乘估计:使因变量的观察值yi与估计值yi^之间的离差平均和达到最小来估计贝塔0和贝塔1的方法,也称最小平方法。
13.判定系数:回归平方和占总平方和的比例,用R^2表示,它是对估计的回归方程拟合优度的度量。
14.估计标准误差:度量各实际观测点在直线周围的散布状况的一个统计量,是均方残差(MSE)的平方根,用Se表示。
15.残差:因变量的观测值yi与根据估计的回归方程求出的预测值yi^之差,用e表示。对