统计建模课程复习与练习(1)剖析知识讲解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《统计建模》复习题

1.统计建模的主要步骤有哪些?

1明确问题 2数据收集 3数据预处理 4模型构建 5模型估计 6模型检验 7结果分析8撰写论文

2.试列举至少5个常用的统计数据库?例如,中经网统计数据库。

1国家统计数据库2中国经济网数据中心3 OECD数据库4国研网数据库5国家发改委6世界银行7中国统计年鉴、WIND数据库、BvD数据库

3.试列举至少4项国内广泛使用的微观数据库?并简要说明。

1.CHIP数据(中国农村和城市居民家庭收入分配)

2.CHNS(中国健康与营养调查)

3.CHARLS(中国健康与养老追踪调查)

4.CFPS(中国家庭动态调查)

5.CHFS(China Health and Fertility Survey )中国健康与生育调查

4.常见的模型估计方法有哪些?试列举之。

最小二乘(OLS)法、极大似然估计、广义矩(GMM)法、分位数回归方法、贝叶斯估计

5.在完成统计模型的参数估计后,通常需要进行哪几类检验?试列举之。

定性检验,T检验,f检验,拟合优度检验,预测精度检验

6.著名统计学家博克斯(George Box)说过:所有的模型都是错的,但其中有一些

模型是有用的!你对这句话如何理解?

模型只能是客观世界的一种近似,是现实的简单化或理想化。有用的模型能抓住并凸显现象中与分析目的最相关的特征,能抓住问题的本质。

7.简述结构方程模型和普通回归模型的区别?

结构方程模型,是一种建立、估计和检验多个变量之间的因果关系模型的方法。

模型中既包含有可观测的显变量,也可能包含无法直接观测的潜变量。

普通回归模型属于单方程模型方法,结构方程模型属于联立方程模型方法,回归分析只能处理显性变量,而结构方程模型可以发现潜在变量。普通回归一般只有一个因变量,而且是单向的,SEM则是可单,可双,普通回归是基础,SEM是后来的发展和完善

8.和普通回归模型相比,结构方程模型有哪些优点?

1允许回归方程的自变量含有测量误差

2可以同时处理多个因变量

3.可以在一个模型中同时处理因素的测量和因素之间的结构。

4.允许更具弹性的模型设定。

9.结构方程模型的构建包括哪几步?

1.模型假设: SEM是一种验证性的方法,必须有理论支撑。在进行模型估计之前,

要先根据理论分析或以往研究成果来设定初始理论模型。

2.模型识别: 确定所设定的模型是否能够对其估计求解。

3.模型估计: 极大似然法(Maximum likelihood)和广义最小二乘法(Generalized

least square)

4.模型评价: 对模型的整体和参数的估计值进行评价。如果模型拟合效果不佳,对

模型进行修正后重新估计和评价。

10.观察变量、潜在变量

测量变量:也叫观察变量或显变量(显示变量),是可以直接测量的指标。

潜变量:无法直接观测,其测量是通过一个或几个可观察指标来间接完成的。11.测量模型、结构模型、

测量模型

典型的SEM模型图示

12.外生变量、内生变量

外生变量:在模型或系统中,只影响其他变量,而不受其它变量的影响。

在路径图中,只有指向其他变量的箭头,没有箭头(不考虑残差项)指向它的变量

内生变量:在模型或系统中,受其他变量(外生变量或内生变量)的影响,而不受其它变量的影响。

在路径图中,有其它变量的箭头指向它。

13.因果关系、相关关系

因果关系:一个变量对另外一个变量的直接影响。用单向箭头表示。

相关关系:双向曲线箭头表示。但这种相关关系不代表有因果关系。

因果关系需要更严密的证明。例如,常吃鱼的学生学习成绩更好。二者是相关关系,但不一定具有因果关系。

14.直接效应、间接效应和总效应

直接效应:反映原因变量(外生变量或内生变量)对结果变量(内生变量)的直接影响。其大小等于原因变量到结果变量的路径系数。

间接效应:反映原因变量通过一个或者多个中间变量对结果变量所产生的影响。

间接效应是所有从原始变量出发,通过中间变量,结束于结果变量的路径系数乘积之和。

总效应:原因变量对结果变量效应的总和,包括直接效应和间接效应。

15.饱和模型与非饱和模型

预设模型(Default model):所建立的模型。

饱和模型(Saturated model):对参数间关系最无限制的模型,各个变量间都假设相关或有因果关系。

独立模型(Independence model):指模型中所有变量完全独立。只估计观测变量的方差。也叫零模型。

如果“预设模型”拟合的比“独立模型”还差,就应该拒绝预设模型。通常预设模型的拟合优度在独立模型和饱和模型之间。

16.简述内生变量和外生变量的区别。

内生变量是由模型系统决定的,同时也对模型系统产生影响,外生变量影响系统但不受系统影响.外生变量一般是经济变量,条件变量,政策变量,虚变量

17.简述路径系数和载荷系数的区别。:

潜变量与潜变量间的回归系数称为路径系数,潜变量与可观测变量间的回归系数称为载荷系数。

18.在结构方程模型中,Default model(预设模型)、Saturated model(饱和模

型)、 Independence model(独立模型)三类模型有什么区别,并举例说明。

预设模型(Default model):所建立的模型。

饱和模型(Saturated model):对参数间关系最无限制的模型,各个变量间都假设相关或有因果关系。

独立模型(Independence model):指模型中所有变量完全独立。只估计观测变量的方差。也叫零模型。

相关文档
最新文档