虚拟变量(哑变量):
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2015/4/22 13:43:00虚拟变量(哑变量):
虚拟变量设置的原则
在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定:
(1)如果回归模型有截距项
有m种互斥的属性类型,在模型中引入(m-1)个虚拟变量。
(2)如果回归模型无截距项,有m个特征,设置m个虚拟变量
注意共线性问题引入的哑变量无线性关系否则R2=1(统计问题思考)
因该做那些假设(模型成立的前提)
线性关系,相互独立,残差正态分布是多元线性回归模型应用前提。一定要进行假设的检验。
1散点图初步判断
2处理好属性数据;
3选择回归方式;
4对结果进行解释,小心R2
非参数检验。
任何模型有前提;判断可用否;还需要那些假设,对假设进行检验。
方差分析
主成分分析,因子分析,减少考虑的自变量个数。
leslie `离散的微分方程`刻画年龄组变化的离散模型logistic人口下降
参数估计低,中,高三种不同估计值对模型进行估算。