wind数据库使用介绍及s数据处理结合论文
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Wind数据库介绍及stata数据处理
——民营上市企业事先财务能力对 多元化选择的实证影响
论文结构
1、提出疑问:多元化选择的契机是否和事先财务能力水平 有关?什么样的?
2、逻辑分析:国内外学者研究结论、从利益最大化、代理 理论、防御型假说及反面论证
3、得出假设:事先财务状况差的企业相比财务状况好的企 业来说更倾向于选择多元化战略。(5个具体假设)
固定资产投资
3、 截至2011年底,浙江省283家上市公司中有232家民营 企业,占浙江省上市公司的82%。
2001-2009年深沪两市上市公司,剔除金融类和年份不足的上市公司。 沪深股票——市场类——全部A股(非金融)
因变量:代理成本(管理费用率 总资产周转率)
财务分析—盈利能力—运营能力 自变量:媒体监督(有无被媒体曝光 曝光为1 没曝光为0) 公司研究—重大事项—违规 第一大股东持股比
媒体监督、公司治理、代理成本
样本数据查询分析、如何详用wind
1、 2011年,浙江省民营经济总量预计达到19872亿元,占 浙江省地区生产总值的62.1%;
浙江省GNP,浙江省民营GNP,浙江省国营GNP。
宏观、中国宏观数据、国民经济核算、GNP(省);国有资 产总量
2、 限额以上投资8563亿元,占全省总量的59.9%;外贸出 口1299亿美元,占到全省总量的60%。
解释:后金融危机时期,leve项的p值显示非常显著,说明资产负债率越低,偿债能力 越强的企业越倾向多元化选择。假设2不成立。 但是从相关性检验来看,roa、pg与d正相关,leve、tato、fcf与d负相关,即除了leve之 外,3、4、5均符合,经济意义解释就是,资产周转率越低,运营能力越差的企业越倾 向多元化选择,假设3成立;净利润增长率越低,发展能力越差的企业越倾向多元化, 假设4成立;自由现金流量越少的企业越倾向多元化选择,假设5成立。
2、偿债能力强的企业无论在金融危机时期还是后金融危机时期,均倾向 于多元化战略选择,这一点于假设不符合。原因可能是,偿债能力越 强的企业具有更多举债的空间,可为多元化发展提供资金来源,为多 元化战略的探索提供支撑。
异方差问题的处理
P值为0.71,可以接受同方差假设,不存在异方差问题。
P值为0.03<0.05,显著,接受原假设,存在异方差问题。
2、命令 xtlogit(回归)estat clas(模型正确 解释变量的概率) hetpob(处理异方差)
模型拟合度较高, prob>chi2值小于 0.1
解释:金融危机时期,可以看到在5%的显著性水平上,leve项结果显著,Z绝对值 >2,p<0.05。即资产负债率越低,偿债能力越强的企业越倾向进行多元化选择。 表明假设2不成立。 第1、3、4、5,说明在95%的显著性水平上不显著。(将显著性水平放宽至10%) 但是结合相关性分析来看,d与roa leve tato pg fcf 均呈负相关。即1、2、3、5基 本符合,经济意义上解释就是,资产报酬率越低,盈利能力越差的企业越倾向多 元化,假设1成立;资产周转率越低,运营能力越差,越倾向多元化,越倾向多 元化,假设3成立;企业自由现金流越少,企业越倾向多元化,假设5成立。
打开wind操作 结果见文件夹【原始数据】 解释模型之后在详细解释为 何选取07-12年指标
根据模型处理数据
本文模型:
Logit模型 非线性 不
适用我们通 常用的OLS 回归
Stata软件 实现
阶段划分
金融危机时期07-09年
后金融危机时期10-12年
哑变量 量 化了的质 变
面板数 据
进一步用 EXCEL处理数 据,导入
解释变量(自变量)
财务能力
名义变量
盈利能力 偿债能力 运营能力
发展能力 现金流量
控制变量
操作变量
资产报酬率roa
资产负债率leve
总资产周转率
tato
公司规模size
பைடு நூலகம்
净现金增长率pg
自由现金流量fcf
被解释变量 (因)
是否进行多元化
(虚拟变量) D=1 多元化 D=0专一化
潜变量
显变量
股票代码前三位相同
控制变量 产权性质(国营 民营 ) 现金流量 规模(主营业务收入) 销售增长率 总资产负债率 资产收益率 行业类别:其他行业 0 垄断行业 1:自来水、电力、公交、烟草、石油、天然气、
电信、铁路运输、包括银行等等 快速消费品行业2:个护、家庭护理、品牌包装食品饮料、
烟酒行业等 品种分析 9891个样本 需要分工采集
作为反映企业成长能力的净利润增长率,浙江民营企业也存在巨大的差异,正负 增长不同,增速不同,尽管同处于金融危机时期,但表现出来的成长性却有着巨 大的差异。 后金融危机时期同理,各指标在企业之间差距较大。
实证分析
单变量检验 (各变量在组内的均值差异)
说明多元化企 业和非多元化 企业的确存在 事先财务能力 上的差异,企 业是否选择多 元化与企业财 务能力有关
表示专一化,反之则 反
操作步骤及注意要点
股票 数据浏览器 地域类 上市时间 股东指标 财务指标(roa leve tato pg fcf)。。结果见
EXCEL 注意事项:一定要先弄清样本选取的条件(避免多次返工)
如果找不到需要选择的指标怎么办(巧用搜索leve fcf) 少量的数据可以在结果导入EXCEL后巧用EXCEL操作 wind中有的可以条件筛选,有的不行
数据浏览器—沪深股票指标—股东指标—大股东持股比(第 一名)
两职是否合一
数据浏览器—沪深股票指标—基本资料—公司资料—管理 层—董事长、总经理
董事会、监事会规模 右击—品种分析 独立董事比例 基本资料—公司资料—管理层—独立董事数 管理层薪酬 公司研究—重要持股人—高管持股 管理层持股比 公司研究—高管薪酬—管理层报酬统计
答案结果见图片文件夹原始数据【新建数据】
实证分析
1、描述性统计分析(数据表明分析,实证分析前提,描述样本的各变量 ) 特征及其所代表的总体的特征以及发现其数据的内在大致规律
命令 xtdes、xtsum 2、结果
金 融 危 机 时 期
后 金 融 危 机 时 期
3、解释
该分析主要是解释两个时期内,样本企业的各类财务指标在整体上的差异。 反映盈利能力总资产利润率的取值范围在-20.9085—178.8745之间,差异较大; 反映偿债能力的指标,企业之间相差较大,采取的融资方式有着较大的差异,资 产负债率最高达88.41%,具有巨大的财务风险; 代表营运能力的总资产周转率的差异并不是很大,平均值为0.89; 企业的自由现金流相差巨大,现金流状况较差的企业,自由现金流量竟低至4324.39百万元,而现今管理水平较好的公司的自由现金流量可以为3160.224百万 元,企业间差异明显;
4、选取样本 、指标选取、定义变量、建立模型 5、实证分析(stata、spass) 6、得出结论
样本选取
筛选条件: 1、浙江省+上市民营企业+2006至2012年 2、剔除ST、PT公司 3、剔除上市年限小于三年的公司 4、剔除财务数据缺失或异常公司
说明:至15年止,浙江省有298家上市企业,论文以06-12年数据为样本, 则需筛选出上市时间为06年及以前上市的企业,而得出的企业数量只 有接近100家。与本文178个样本数量不符合。
产生差异的原因是06-12年期间由于国家宏观经济政策等原因,企业 的性质(国营变民营)、企业被并购、上市企业退市等原因,使得在 本文条件下和现今条件下得出不一致的样本数量。为追求客观性,突 出重新研究的目的性,以现今条件下得出的数据为基准对本文重新研 究。筛选06年及以前上市的民营企业
指标选取+定义变量
该命令解释的是logit模型用logit回归(相较于OLS)准确预测的比率,可 以看到金融危机时期90.99%,后金融危机时期90.54%。
结论
1、处于经济周期的不同阶段,事先财务能力对于多元化选择的影响是有 差异的。在金融危机时期,盈利能力差的企业倾向多元化而在后金融 危机时期却没有明显的多元化战略倾向。原因可能是,企业为了生存, 不得不寻找更多的获利机会,同时单一行业所受的风险较大,加之金 融危机的冲击,导致企业跨越多个行业进行经营,以求分散风险。在 后金融危机时期,发展能力弱的企业倾向多元化,而其在金融危机时 期却没有明显倾向。原因可能是,在度过金融危机时期之后,发展能 力差的企业为了摆脱困境,会倾向与扩张进行投资。
实证分析
1、变量相关性检验 2、结果
危 机 时 期
后 金 融 危 机 时 期
实证分析
1、回归分析(目的,为什么这里不进行多重共线性检验)
差异解释:对于线性回归一般需要考虑自变量间的共线性,但是这里是logit模型非线性, 所以从经济意义上考虑不进行多重共线性检验。而logit模型会涉及异方差问题,所以这 里对模型进行logit回归后再解决异方差问题。
1、为什么是一个logit模型(二值选择模型) 2、为什么是非线性的,所以用logit回归 3、用stata处理logit模型(stata的适用范围) 4、关于面板数据(截面数据 长面板 短面板 T小N大) 5、演示操作如何用excel操作小样本面板数据 (stata只识别数值型)
大样本数据可以直接用stata命令
——民营上市企业事先财务能力对 多元化选择的实证影响
论文结构
1、提出疑问:多元化选择的契机是否和事先财务能力水平 有关?什么样的?
2、逻辑分析:国内外学者研究结论、从利益最大化、代理 理论、防御型假说及反面论证
3、得出假设:事先财务状况差的企业相比财务状况好的企 业来说更倾向于选择多元化战略。(5个具体假设)
固定资产投资
3、 截至2011年底,浙江省283家上市公司中有232家民营 企业,占浙江省上市公司的82%。
2001-2009年深沪两市上市公司,剔除金融类和年份不足的上市公司。 沪深股票——市场类——全部A股(非金融)
因变量:代理成本(管理费用率 总资产周转率)
财务分析—盈利能力—运营能力 自变量:媒体监督(有无被媒体曝光 曝光为1 没曝光为0) 公司研究—重大事项—违规 第一大股东持股比
媒体监督、公司治理、代理成本
样本数据查询分析、如何详用wind
1、 2011年,浙江省民营经济总量预计达到19872亿元,占 浙江省地区生产总值的62.1%;
浙江省GNP,浙江省民营GNP,浙江省国营GNP。
宏观、中国宏观数据、国民经济核算、GNP(省);国有资 产总量
2、 限额以上投资8563亿元,占全省总量的59.9%;外贸出 口1299亿美元,占到全省总量的60%。
解释:后金融危机时期,leve项的p值显示非常显著,说明资产负债率越低,偿债能力 越强的企业越倾向多元化选择。假设2不成立。 但是从相关性检验来看,roa、pg与d正相关,leve、tato、fcf与d负相关,即除了leve之 外,3、4、5均符合,经济意义解释就是,资产周转率越低,运营能力越差的企业越倾 向多元化选择,假设3成立;净利润增长率越低,发展能力越差的企业越倾向多元化, 假设4成立;自由现金流量越少的企业越倾向多元化选择,假设5成立。
2、偿债能力强的企业无论在金融危机时期还是后金融危机时期,均倾向 于多元化战略选择,这一点于假设不符合。原因可能是,偿债能力越 强的企业具有更多举债的空间,可为多元化发展提供资金来源,为多 元化战略的探索提供支撑。
异方差问题的处理
P值为0.71,可以接受同方差假设,不存在异方差问题。
P值为0.03<0.05,显著,接受原假设,存在异方差问题。
2、命令 xtlogit(回归)estat clas(模型正确 解释变量的概率) hetpob(处理异方差)
模型拟合度较高, prob>chi2值小于 0.1
解释:金融危机时期,可以看到在5%的显著性水平上,leve项结果显著,Z绝对值 >2,p<0.05。即资产负债率越低,偿债能力越强的企业越倾向进行多元化选择。 表明假设2不成立。 第1、3、4、5,说明在95%的显著性水平上不显著。(将显著性水平放宽至10%) 但是结合相关性分析来看,d与roa leve tato pg fcf 均呈负相关。即1、2、3、5基 本符合,经济意义上解释就是,资产报酬率越低,盈利能力越差的企业越倾向多 元化,假设1成立;资产周转率越低,运营能力越差,越倾向多元化,越倾向多 元化,假设3成立;企业自由现金流越少,企业越倾向多元化,假设5成立。
打开wind操作 结果见文件夹【原始数据】 解释模型之后在详细解释为 何选取07-12年指标
根据模型处理数据
本文模型:
Logit模型 非线性 不
适用我们通 常用的OLS 回归
Stata软件 实现
阶段划分
金融危机时期07-09年
后金融危机时期10-12年
哑变量 量 化了的质 变
面板数 据
进一步用 EXCEL处理数 据,导入
解释变量(自变量)
财务能力
名义变量
盈利能力 偿债能力 运营能力
发展能力 现金流量
控制变量
操作变量
资产报酬率roa
资产负债率leve
总资产周转率
tato
公司规模size
பைடு நூலகம்
净现金增长率pg
自由现金流量fcf
被解释变量 (因)
是否进行多元化
(虚拟变量) D=1 多元化 D=0专一化
潜变量
显变量
股票代码前三位相同
控制变量 产权性质(国营 民营 ) 现金流量 规模(主营业务收入) 销售增长率 总资产负债率 资产收益率 行业类别:其他行业 0 垄断行业 1:自来水、电力、公交、烟草、石油、天然气、
电信、铁路运输、包括银行等等 快速消费品行业2:个护、家庭护理、品牌包装食品饮料、
烟酒行业等 品种分析 9891个样本 需要分工采集
作为反映企业成长能力的净利润增长率,浙江民营企业也存在巨大的差异,正负 增长不同,增速不同,尽管同处于金融危机时期,但表现出来的成长性却有着巨 大的差异。 后金融危机时期同理,各指标在企业之间差距较大。
实证分析
单变量检验 (各变量在组内的均值差异)
说明多元化企 业和非多元化 企业的确存在 事先财务能力 上的差异,企 业是否选择多 元化与企业财 务能力有关
表示专一化,反之则 反
操作步骤及注意要点
股票 数据浏览器 地域类 上市时间 股东指标 财务指标(roa leve tato pg fcf)。。结果见
EXCEL 注意事项:一定要先弄清样本选取的条件(避免多次返工)
如果找不到需要选择的指标怎么办(巧用搜索leve fcf) 少量的数据可以在结果导入EXCEL后巧用EXCEL操作 wind中有的可以条件筛选,有的不行
数据浏览器—沪深股票指标—股东指标—大股东持股比(第 一名)
两职是否合一
数据浏览器—沪深股票指标—基本资料—公司资料—管理 层—董事长、总经理
董事会、监事会规模 右击—品种分析 独立董事比例 基本资料—公司资料—管理层—独立董事数 管理层薪酬 公司研究—重要持股人—高管持股 管理层持股比 公司研究—高管薪酬—管理层报酬统计
答案结果见图片文件夹原始数据【新建数据】
实证分析
1、描述性统计分析(数据表明分析,实证分析前提,描述样本的各变量 ) 特征及其所代表的总体的特征以及发现其数据的内在大致规律
命令 xtdes、xtsum 2、结果
金 融 危 机 时 期
后 金 融 危 机 时 期
3、解释
该分析主要是解释两个时期内,样本企业的各类财务指标在整体上的差异。 反映盈利能力总资产利润率的取值范围在-20.9085—178.8745之间,差异较大; 反映偿债能力的指标,企业之间相差较大,采取的融资方式有着较大的差异,资 产负债率最高达88.41%,具有巨大的财务风险; 代表营运能力的总资产周转率的差异并不是很大,平均值为0.89; 企业的自由现金流相差巨大,现金流状况较差的企业,自由现金流量竟低至4324.39百万元,而现今管理水平较好的公司的自由现金流量可以为3160.224百万 元,企业间差异明显;
4、选取样本 、指标选取、定义变量、建立模型 5、实证分析(stata、spass) 6、得出结论
样本选取
筛选条件: 1、浙江省+上市民营企业+2006至2012年 2、剔除ST、PT公司 3、剔除上市年限小于三年的公司 4、剔除财务数据缺失或异常公司
说明:至15年止,浙江省有298家上市企业,论文以06-12年数据为样本, 则需筛选出上市时间为06年及以前上市的企业,而得出的企业数量只 有接近100家。与本文178个样本数量不符合。
产生差异的原因是06-12年期间由于国家宏观经济政策等原因,企业 的性质(国营变民营)、企业被并购、上市企业退市等原因,使得在 本文条件下和现今条件下得出不一致的样本数量。为追求客观性,突 出重新研究的目的性,以现今条件下得出的数据为基准对本文重新研 究。筛选06年及以前上市的民营企业
指标选取+定义变量
该命令解释的是logit模型用logit回归(相较于OLS)准确预测的比率,可 以看到金融危机时期90.99%,后金融危机时期90.54%。
结论
1、处于经济周期的不同阶段,事先财务能力对于多元化选择的影响是有 差异的。在金融危机时期,盈利能力差的企业倾向多元化而在后金融 危机时期却没有明显的多元化战略倾向。原因可能是,企业为了生存, 不得不寻找更多的获利机会,同时单一行业所受的风险较大,加之金 融危机的冲击,导致企业跨越多个行业进行经营,以求分散风险。在 后金融危机时期,发展能力弱的企业倾向多元化,而其在金融危机时 期却没有明显倾向。原因可能是,在度过金融危机时期之后,发展能 力差的企业为了摆脱困境,会倾向与扩张进行投资。
实证分析
1、变量相关性检验 2、结果
危 机 时 期
后 金 融 危 机 时 期
实证分析
1、回归分析(目的,为什么这里不进行多重共线性检验)
差异解释:对于线性回归一般需要考虑自变量间的共线性,但是这里是logit模型非线性, 所以从经济意义上考虑不进行多重共线性检验。而logit模型会涉及异方差问题,所以这 里对模型进行logit回归后再解决异方差问题。
1、为什么是一个logit模型(二值选择模型) 2、为什么是非线性的,所以用logit回归 3、用stata处理logit模型(stata的适用范围) 4、关于面板数据(截面数据 长面板 短面板 T小N大) 5、演示操作如何用excel操作小样本面板数据 (stata只识别数值型)
大样本数据可以直接用stata命令