统计建模课程复习与练习(1)剖析知识讲解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《统计建模》复习题
1.统计建模的主要步骤有哪些?
1明确问题 2数据收集 3数据预处理 4模型构建 5模型估计 6模型检验 7结果分析8撰写论文
2.试列举至少5个常用的统计数据库?例如,中经网统计数据库。
1国家统计数据库2中国经济网数据中心3 OECD数据库4国研网数据库5国家发改委6世界银行7中国统计年鉴、WIND数据库、BvD数据库
3.试列举至少4项国内广泛使用的微观数据库?并简要说明。
1.CHIP数据(中国农村和城市居民家庭收入分配)
2.CHNS(中国健康与营养调查)
3.CHARLS(中国健康与养老追踪调查)
4.CFPS(中国家庭动态调查)
5.CHFS(China Health and Fertility Survey )中国健康与生育调查
4.常见的模型估计方法有哪些?试列举之。
最小二乘(OLS)法、极大似然估计、广义矩(GMM)法、分位数回归方法、贝叶斯估计
5.在完成统计模型的参数估计后,通常需要进行哪几类检验?试列举之。
定性检验,T检验,f检验,拟合优度检验,预测精度检验
6.著名统计学家博克斯(George Box)说过:所有的模型都是错的,但其中有一些
模型是有用的!你对这句话如何理解?
模型只能是客观世界的一种近似,是现实的简单化或理想化。有用的模型能抓住并凸显现象中与分析目的最相关的特征,能抓住问题的本质。
7.简述结构方程模型和普通回归模型的区别?
结构方程模型,是一种建立、估计和检验多个变量之间的因果关系模型的方法。
模型中既包含有可观测的显变量,也可能包含无法直接观测的潜变量。
普通回归模型属于单方程模型方法,结构方程模型属于联立方程模型方法,回归分析只能处理显性变量,而结构方程模型可以发现潜在变量。普通回归一般只有一个因变量,而且是单向的,SEM则是可单,可双,普通回归是基础,SEM是后来的发展和完善
8.和普通回归模型相比,结构方程模型有哪些优点?
1允许回归方程的自变量含有测量误差
2可以同时处理多个因变量
3.可以在一个模型中同时处理因素的测量和因素之间的结构。
4.允许更具弹性的模型设定。
9.结构方程模型的构建包括哪几步?
1.模型假设: SEM是一种验证性的方法,必须有理论支撑。在进行模型估计之前,
要先根据理论分析或以往研究成果来设定初始理论模型。
2.模型识别: 确定所设定的模型是否能够对其估计求解。
3.模型估计: 极大似然法(Maximum likelihood)和广义最小二乘法(Generalized
least square)
4.模型评价: 对模型的整体和参数的估计值进行评价。如果模型拟合效果不佳,对
模型进行修正后重新估计和评价。
10.观察变量、潜在变量
测量变量:也叫观察变量或显变量(显示变量),是可以直接测量的指标。
潜变量:无法直接观测,其测量是通过一个或几个可观察指标来间接完成的。11.测量模型、结构模型、
测量模型
典型的SEM模型图示
12.外生变量、内生变量
外生变量:在模型或系统中,只影响其他变量,而不受其它变量的影响。
在路径图中,只有指向其他变量的箭头,没有箭头(不考虑残差项)指向它的变量
内生变量:在模型或系统中,受其他变量(外生变量或内生变量)的影响,而不受其它变量的影响。
在路径图中,有其它变量的箭头指向它。
13.因果关系、相关关系
因果关系:一个变量对另外一个变量的直接影响。用单向箭头表示。
相关关系:双向曲线箭头表示。但这种相关关系不代表有因果关系。
因果关系需要更严密的证明。例如,常吃鱼的学生学习成绩更好。二者是相关关系,但不一定具有因果关系。
14.直接效应、间接效应和总效应
直接效应:反映原因变量(外生变量或内生变量)对结果变量(内生变量)的直接影响。其大小等于原因变量到结果变量的路径系数。
间接效应:反映原因变量通过一个或者多个中间变量对结果变量所产生的影响。
间接效应是所有从原始变量出发,通过中间变量,结束于结果变量的路径系数乘积之和。
总效应:原因变量对结果变量效应的总和,包括直接效应和间接效应。
15.饱和模型与非饱和模型
预设模型(Default model):所建立的模型。
饱和模型(Saturated model):对参数间关系最无限制的模型,各个变量间都假设相关或有因果关系。
独立模型(Independence model):指模型中所有变量完全独立。只估计观测变量的方差。也叫零模型。
如果“预设模型”拟合的比“独立模型”还差,就应该拒绝预设模型。通常预设模型的拟合优度在独立模型和饱和模型之间。
16.简述内生变量和外生变量的区别。
内生变量是由模型系统决定的,同时也对模型系统产生影响,外生变量影响系统但不受系统影响.外生变量一般是经济变量,条件变量,政策变量,虚变量
17.简述路径系数和载荷系数的区别。:
潜变量与潜变量间的回归系数称为路径系数,潜变量与可观测变量间的回归系数称为载荷系数。
18.在结构方程模型中,Default model(预设模型)、Saturated model(饱和模
型)、 Independence model(独立模型)三类模型有什么区别,并举例说明。
预设模型(Default model):所建立的模型。
饱和模型(Saturated model):对参数间关系最无限制的模型,各个变量间都假设相关或有因果关系。
独立模型(Independence model):指模型中所有变量完全独立。只估计观测变量的方差。也叫零模型。