税收数据分析基础(周四新)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 检验统计量
SSTSSE/p FSSE/np1~Fp,np1
• 拒绝域
FFp,np1,1
2010年
Coefficients: Estimate Std. Error t value Pr(>|t|)
(Intercept) -37.61387 412.91220 -0.091 0.928 gdp0 0.17975 0.02292 7.843 1.19e-08
动力购进价格指数) • 固定资产投资价格指数
CPI与PPI(一)
CPI与PPI(二)
价格传导
原材料
农业生产 资料
生产资料
生活资料
农产品
食品
1991年——2011年各种价格指数(以1991年为基数)
最终消费之居民消费
统计范围:
食品 衣着 居住 家庭设备、用品及服务 医疗保健 交通和通信支出 文教娱乐用品及服务 银行中介服务消费 保险服务消费 其他
三大需求对GDP的贡献率
税收与经济:微观层面
Tax incidence Ramsey Rule
税收超额负担
税收与经济:宏观层面
Revenue
宏观税负 F=Tax/GDP
D
拉弗曲线
Tax rate
统计学的基本概念
随机性与规律性 概率与分布 总体与样本
概率与分布
计算概率方法:
等可能事件 相对频数 主观概率
例二:工业增加值与国内增值税
Coefficients: Estimate Std. Error t value Pr(>|t|)
税收数据分析基础(周四新)
GDP:概念
一国(经济体)在某一时期之内(通常是一
年),各个生产单位所生产出来的最终商品和劳 务的市场价值。
时间
空间
对象
单价:2元 收入:200万 工资支出:50万 利息支出:5万 税金:15万
收入:300万 成本支出:120万 工资支出:40万 税金:30万
生产者
工厂
GDP?
百度文库消费者
消费支出:380万 工资收入:145万 利息收入:5万 税金:10万 利润收入:240万
税收收入: 55万
工资:55万
政府
GDP:核算方法
总产出=总收入
总产出=总支出
GDP:衡量
名义GDP:当年价格计算 实际GDP:按照某个基期价格计算 GDP平减指数
1978年——2011年中国GDP增长图
消费函数理论:
绝对收入假说 相对收入假说 持久收入假说 理性预期假说
相关指标:
平均消费倾向 边际消费倾向 恩格尔系数
最终消费之政府消费
瓦格纳法则 替代-规模效应
理论
投资
乘数原理 加速原理
进出口
国际贸易理论
绝对优势 比较优势 H-O理论 Leontief悖论 动态贸易理论
进出口与GDP核算 进出口与消费、投资 的关系
税收收入 11672.65 2033.206 3088.047 2965.898 0.96
经济数据:标准化
经济数据:异常值
经验法则 切比雪夫法则
密度函数
Skewness=1.27 Kurtosis=1.07
一元线性回归:模型
因果效应:
一个经济变量与另一个或几个 变量之间具有因果关系。
其他条件不变
Multiple R-squared: 0.6648 F-statistic: 57.51 on 1 and 29 DF, p-value: 2.324e-08
T检验
• 假设 H 0:i 0vsH 1 :i 0
• 检验统计量
T
ˆi
v x%ˆ
~ tnp1
• 拒绝域
T tnp1,1/2
F检验
• 假设 H 0 :i 0 ivs H 1 :i 0 i
GDP:缺陷
无分配考量 无效率考量 无环境考量 未充分考量
替代方案:
绿色GDP HDI(Human Development Index)
价格指数
• GDP平减指数 • 居民消费价格指数(CPI) • 商品零售价格指数 • 工业生产者出厂价格指数(工业品出厂价
格指数)(PPI) • 工业生产者购进价格指数(原材料、燃料、
参数估计
点估计 区间估计
假设检验
第I类错误 第II类错误 显著性水平
统计工具
经济数据:描述
经济数据:特征(一)
盒型图(boxplot)
经济数据:特征(二)
经济数据:特征(三)
极差 中位数 均值 标准差 变异系数
GDP 52604.45 12582 16820.68 13216.29 0.79
一元线性回归:假设
随机误差项与解释变量直接不相关。
随机误差项在不同样本点之间是独立 的,不存在序列相关。
随机误差项服从0均值、同方差的正 态分布。
例一:GDP与税收收入
模型拟合
Coefficients: Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.33466 512.94487 0.020 0.984 gdp 0.18297 0.02413 7.583 2.32e-08
gdp 0.18336 0.01451 12.64 1.51e-13
Multiple R-squared: 0.8419, Adjusted Rsquared: 0.8366 F-statistic: 159.7 on 1 and 30 DF, p-value: 1.51e-13
引申二:删除异常点
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -323.30893 285.21591 -1.134 0.26
g
0.18060 0.01328 13.601 1.34e-13
Residual standard error: 960.7 on 27 degrees of freedom Multiple R-squared: 0.8726, Adjusted R-squared: 0.8679 F-statistic: 185 on 1 and 27 DF, p-value: 1.343e-13
Multiple R-squared: 0.6796 F-statistic: 61.51 on 1 and 29 DF, p-value 1.195e-08
残差分析(一)
残差分析(二)
引申一:过原点回归
Coefficients: Estimate Std. Error t value Pr(>|t|)
SSTSSE/p FSSE/np1~Fp,np1
• 拒绝域
FFp,np1,1
2010年
Coefficients: Estimate Std. Error t value Pr(>|t|)
(Intercept) -37.61387 412.91220 -0.091 0.928 gdp0 0.17975 0.02292 7.843 1.19e-08
动力购进价格指数) • 固定资产投资价格指数
CPI与PPI(一)
CPI与PPI(二)
价格传导
原材料
农业生产 资料
生产资料
生活资料
农产品
食品
1991年——2011年各种价格指数(以1991年为基数)
最终消费之居民消费
统计范围:
食品 衣着 居住 家庭设备、用品及服务 医疗保健 交通和通信支出 文教娱乐用品及服务 银行中介服务消费 保险服务消费 其他
三大需求对GDP的贡献率
税收与经济:微观层面
Tax incidence Ramsey Rule
税收超额负担
税收与经济:宏观层面
Revenue
宏观税负 F=Tax/GDP
D
拉弗曲线
Tax rate
统计学的基本概念
随机性与规律性 概率与分布 总体与样本
概率与分布
计算概率方法:
等可能事件 相对频数 主观概率
例二:工业增加值与国内增值税
Coefficients: Estimate Std. Error t value Pr(>|t|)
税收数据分析基础(周四新)
GDP:概念
一国(经济体)在某一时期之内(通常是一
年),各个生产单位所生产出来的最终商品和劳 务的市场价值。
时间
空间
对象
单价:2元 收入:200万 工资支出:50万 利息支出:5万 税金:15万
收入:300万 成本支出:120万 工资支出:40万 税金:30万
生产者
工厂
GDP?
百度文库消费者
消费支出:380万 工资收入:145万 利息收入:5万 税金:10万 利润收入:240万
税收收入: 55万
工资:55万
政府
GDP:核算方法
总产出=总收入
总产出=总支出
GDP:衡量
名义GDP:当年价格计算 实际GDP:按照某个基期价格计算 GDP平减指数
1978年——2011年中国GDP增长图
消费函数理论:
绝对收入假说 相对收入假说 持久收入假说 理性预期假说
相关指标:
平均消费倾向 边际消费倾向 恩格尔系数
最终消费之政府消费
瓦格纳法则 替代-规模效应
理论
投资
乘数原理 加速原理
进出口
国际贸易理论
绝对优势 比较优势 H-O理论 Leontief悖论 动态贸易理论
进出口与GDP核算 进出口与消费、投资 的关系
税收收入 11672.65 2033.206 3088.047 2965.898 0.96
经济数据:标准化
经济数据:异常值
经验法则 切比雪夫法则
密度函数
Skewness=1.27 Kurtosis=1.07
一元线性回归:模型
因果效应:
一个经济变量与另一个或几个 变量之间具有因果关系。
其他条件不变
Multiple R-squared: 0.6648 F-statistic: 57.51 on 1 and 29 DF, p-value: 2.324e-08
T检验
• 假设 H 0:i 0vsH 1 :i 0
• 检验统计量
T
ˆi
v x%ˆ
~ tnp1
• 拒绝域
T tnp1,1/2
F检验
• 假设 H 0 :i 0 ivs H 1 :i 0 i
GDP:缺陷
无分配考量 无效率考量 无环境考量 未充分考量
替代方案:
绿色GDP HDI(Human Development Index)
价格指数
• GDP平减指数 • 居民消费价格指数(CPI) • 商品零售价格指数 • 工业生产者出厂价格指数(工业品出厂价
格指数)(PPI) • 工业生产者购进价格指数(原材料、燃料、
参数估计
点估计 区间估计
假设检验
第I类错误 第II类错误 显著性水平
统计工具
经济数据:描述
经济数据:特征(一)
盒型图(boxplot)
经济数据:特征(二)
经济数据:特征(三)
极差 中位数 均值 标准差 变异系数
GDP 52604.45 12582 16820.68 13216.29 0.79
一元线性回归:假设
随机误差项与解释变量直接不相关。
随机误差项在不同样本点之间是独立 的,不存在序列相关。
随机误差项服从0均值、同方差的正 态分布。
例一:GDP与税收收入
模型拟合
Coefficients: Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.33466 512.94487 0.020 0.984 gdp 0.18297 0.02413 7.583 2.32e-08
gdp 0.18336 0.01451 12.64 1.51e-13
Multiple R-squared: 0.8419, Adjusted Rsquared: 0.8366 F-statistic: 159.7 on 1 and 30 DF, p-value: 1.51e-13
引申二:删除异常点
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -323.30893 285.21591 -1.134 0.26
g
0.18060 0.01328 13.601 1.34e-13
Residual standard error: 960.7 on 27 degrees of freedom Multiple R-squared: 0.8726, Adjusted R-squared: 0.8679 F-statistic: 185 on 1 and 27 DF, p-value: 1.343e-13
Multiple R-squared: 0.6796 F-statistic: 61.51 on 1 and 29 DF, p-value 1.195e-08
残差分析(一)
残差分析(二)
引申一:过原点回归
Coefficients: Estimate Std. Error t value Pr(>|t|)