第十届华为杯全国研究生数学建模竞赛获奖论文
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
L( p) = f ( p)αg( p)υ,α ≥0,υ≥0
当α≥0,υ≥1 时,Ls(p)=pαL(p)υ即为另一派生洛伦兹曲线模型,在满足(9) 式条件的基础上,我们构造以下模型来拟合表 1 中数据:
L( p) = pα (tan(p*pi/4))υ, α≥0, υ≥1
利用参数变换把模型转变成无约束型:
pj
0.0780 0.1340 0.1760 0.2230 0.2650 0.3090 0.3500 0.4360 0.5280 0.6160 0.6960 0.7610 0.8130 0.8910 0.9470 0.9900 1.0000
Lj
0.0059 0.0165 0.0276 0.0436 0.0611 0.0828 0.1061 0.1647 0.2413 0.3279 0.4188 0.5024 0.5772 0.7071 0.8216 0.9453 1.0000
i 1,2,,9 ,最后的点是 p10 0.95 。如果收入分配的真实洛伦兹曲线为 l ( p ) ,
且若 l ( p ) 存在,则(6)表示的是 l ( p ) 曲线上的坐标点,即 l ( pi ) xi ;(7)表示
l ( p ) 曲线上的点,即 l ( pi ) Li 。
-4-
图1 其中横轴表示人口比例,纵轴表示总收入比例。显然,图中曲线位置越高,所 代表的收入分配越平等。其中 45 线可以理解为平等收入线,这时,任何低收 入端人口比例为 p 的人口拥有的总收入比例也是 p ,从而必定是完全平等的收 入分配。因此定义 45 线与 L( p ) 之间面积的 2 倍为基尼系数。于是基尼系数定 义为
(6) (7)
其中 xi 是收入区间点,满足 0 x1 x2 xn xn 1 ,通常 xn 1 理解为充分大的 正数。 n 通常不大,例如 n 10 。很多国家只提供(7)式描述的数据。经济学界 只能利用这种稀疏的信息进行收入分配分析。记 p0 0 ,则 [ xi , xi 1 ) 中人口比例 为 pi pi 1 。 例如图1中 “+” 中标出的点表示了形如(7)的数据点, 其中 pi i /10 ,
参赛密码 (由组委会填写)
第十届华为杯全国研究生数学建模竞 赛
学
校 上海工程技术大学
10856015
参赛队号
1. 徐小剑 队员姓名 2. 谭英花 3. 徐 彪
-1-
参赛密码 (由组委会填写)
第十届华为杯全国研究生数学建模竞赛
题 目
中等收入定位与人口度量模型研究
摘
要:
中等收入人口比重是反映收入分配格局的重要指标,这一人口比重越大, 意味着收入分配结构越合理,称之为“橄榄型”收入分配格局,这种收入格局 下,社会的差距不大,有利于社会的稳定。本文主要是明确中等收入群体的含 义,对题目提到的测定中等收入群体的现有方法进行改进,对一系列收入数据 进行定量描述,分析一定时间内某个区域的中等收入人口的变化,最后提出题 目提到的方法之外的方法对中等收入人口进行测算。 对于问题 1,本文在满足(9)式的基础上,构建关于 L( p, ) 的新模型,即 L(p) = pα (tan(p*pi/4))υ , 其中α≥0, υ≥1。 利用 Mathematica 编制程序, 应用 lsqnonlin 非线性最小二乘拟合函数,求解模型参量,拟合出洛伦兹曲线,并对参考文献 中的 10 个模型进行拟合。然后,采用均方误差(MSE, mean squared error)的 方法,对新建的模型与来自参考文献中的 10 个模型进行拟合精度的比较, RESNORM 值反映新建模型的拟合精度较好,高于部分模型。 对于问题 2,改进方法一,用部分排序法对收入空间法进行改进,其原理在 于,中等收入是一个变化的区间,随着收入水平的提高,中等收入人口的比重 会有所变化,一般而言是增加,那么中等收入人口的比例范围也应有所增加, 而不是一个固定的区间,将范围依次确定为 75%~125%、75%~150%,从而实 现纵向比较。但该方法改进有限,文章又提出改进方法二,用模糊分析法进行 改进,让收入人口的收入比例随即在区间[(1-a)*S1,(1+a)*S1]内变化。对于人
1
(q )dq
实践中通过入户调查获得家庭收入与消费等数据, 如果可以得到这类数据, 则可以使用例如 Kernel 法估计收入分配的统计分布。 我国统计部门也进行这种 调查,但数据不对外公开,而只是在统计年鉴上发布所谓的分组数据(世界上很 多国家也如此),这种数据的完整形式为
-5-
pi , xi , i 1,2,, n pi , Li , i 1,2,, n
二、符号说明
G k 基尼系数 中等收入群体收入比例系数 R S1 中等收入群体区间 中等收入群体收入比例
三、模型的建立和求解
3.1 问题一 3.1.1 模型建立与求解 本题主要是构造一个满足(9)式的新模型 L( p, ) ,该模型能很好的拟合上 述分组数据,误差较小,即根据已有的数据拟合洛伦兹曲线。 根据参考文献[3],洛伦兹曲线模型的一般式为:
f ( x) ,其中 x 0 表示收入(仅考虑正的收入), x0 是众数点,m 是中位数点,
是平均收入。收入分配经验分析说明,收入分配曲线一般是所谓正偏的,即峰 值点向左偏,右端拖一个长尾巴,且通常有
x0 m
记对应的分布函数为 F ( x) ,则 p F ( x) 表示收入低于或等于 x 的人口比例。由 于 F (m) 1 2 ,(1)式意味着收入大于或等于平均收入的人口一定不到半数,因 此是少数。 记收入低于或等于 x 的人口群体拥有收入占总收入的比例为 L( p ) ,则应有
-6-
反映经济规律。请在现有参考文献中(文献[4]的参考文献部分列出了大部分有 关的文献)找出至少 10 种模型,与你们提出的模型进行比较。通过比较,说明 你们的模型不差。 二、研究可否改进上述提到的收入空间法,这时需要研究确定中等收入的 范围、中等收入人口的范围的科学方法,以克服中等收入区间取法的任意性; 研究可否改进上述提到的人口空间法,例如研究在各年中 p1 与 p2 取不同的值 时,纵向比较各年中等收入人口与收入的变动的方法。 三、利用最后表二至表五所附 A, B 两个地区前后两个不同年份的收入分 配分组数据,请研究:(1) 对各地区、各年份的中等收入的数量(或范围)、中 等收入人口的数量或范围进行定量描述,说明中等收入人口的变化趋势;(2)比 较两个地区的中等收入人口、收入等变化情况。 四、 除二题中所述方法外, 提出中等收入人口的定义、原理及经济学意义, 并提出与之相应的中等收入人口的测算方法、模型或指数,说明其经济学意义。
-2-
口分布法的改进,主要考虑不同社会发展阶段,中等收入人群的比重是不一样 的,除去固定比重的局限,选择不同的参数值对应的人口比例区间进行计算, 同时可以结合基尼系数 G 帮助选择。 对于问题 3,首先对收入分配的真实数据进行简单的描述统计。利用问题 2 中部分排序法具体化中等收入人口的三个比例: 75%~125% 、 75%~150% 、 50%-150%, 对此分别算出各个地区各个年份的中等收入群体, 并结合收入分布, 画出收入分布间距密度图,进行纵向比较。其次通过 Matlab 软件使用多项式插 值法曲线拟合 L(p)曲线方程,计算出基尼系数,进行地区横向比较。 对于问题 4,建立了“模糊界定法”新模型,在文中收入空间发、人口空 间法的基础上,根据每一群体洛伦兹曲线的不同,变动和优化上下界限,重新 选定中等收入群体,以实现对收入空间法、人口空间法固有缺陷的修正。 关键词:中等收入人口;Mathematica;部分排序法;模糊分析法;
x j 1
999.00 1499.00 1999.00 2499.00 2999.00 3499.00 3999.00 4999.00 5999.00 6999.00 7999.00 8999.00 9999.00 11999.00 14999.00 24999.00 25000.00
fj
0.0780 0.0560 0.0420 0.0470 0.0420 0.0440 0.0410 0.0860 0.0920 0.0880 0.0800 0.0650 0.0520 0.0780 0.0560 0.0430 0.0100
-3-
一、问题的重述
居民收入分配关系到广大民众的生活水平, 分配公平程度是广泛关注的话 题。其中中等收入人口比重是反映收入分配格局的重要指标,这一人口比重越 大,意味着收入分配结构越合理,称之为“橄榄型”收入分配格局。在这种收 入分配格局下,收入差距不大,社会消费旺盛,人民生活水平高,社会稳定。 一般经济发达国家都具有这种分配格局。直观上,收入处于中间部分人口增加, 则收入分配格局向好的方向转化。于是基本问题回答什么是中间部分,即确定 中等收入群体。 一个国家的收入分配可以用统计分布表示,下图是某收入分配的密度函数
L( p )
0
1
x
tf (t )dt , p F ( x)
(2)
L( p ) 称之为收入分配的洛伦兹曲线。显然,如果 L1 ( p ) 与 L2 ( p ) 是两个不同收入
分配的洛伦兹曲线,若对任何 p (0,1) 都有 L1 ( p ) L2 ( p ) ,则 L1 ( p ) 对应的收入 分配显然更优,因为在 L1 ( p ) 中,任何低收入端人口拥有的总收入比例更大。 下 图中红色曲线是某收入分配的洛伦兹曲线。
经济学界采用所谓的洛伦兹曲线模型 L( p, ) 拟合上述数据(7),其中 是一 组参数,使用非线性最小二乘法求解
min L( pi , ) Li
i 1
n
2
(8)
ˆ ( p ) 作为近似的洛伦兹曲线 确定其中参数向量 的估计值 ˆ ,然后用 L( p,ˆ) L
来进行收入分配分析,显然,这时就能通过(4)、(5)式确定相应的统计密度与分 布的估计。 L( p, ) 是定义在 [0,1] 区间上、取值于 [0,1] 区间的函数,满足
G 1 2 L( p )dp
0
1
பைடு நூலகம்
(3)
L( p ) 与 f ( x) 具有关系 L( p ) x
(4)
f ( x)
1 L( p)
(5)
其中 p F ( x) 。记 F ( x) 的反函数为 F 1 ( p ) ,则洛伦兹曲线可以表示为
L( p )
F
0
1
p
α= exp(a),υ= 1+exp(b)
相当于把模型中的参变量变成 a、b,参变量无约束条件,即化为无约束非线性 最小二乘问题。
-7-
表1 收入分配分组数据
xj
0.00 1000.00 1500.00 2000.00 2500.00 3000.00 3500.00 4000.00 5000.00 6000.00 7000.00 8000.00 9000.00 10000.00 12000.00 15000.00
L(0, ) 0 , L(1, ) 1 , L( p, ) 0 , L( p, ) 0
即 L( p, ) 在 [0,1] 上是凸增函数。文献中常常略去参数 以求表述简练。
(9)
但洛伦兹曲线只能表现一个国家整体收入分配的不平等程度,在此基础上 对中等收入群体进行测定还是需要特殊的算法,经济学计算中等收入群体主要 有两种算法,一是“收入空间法” ,取收入落在中位收入 m 的一个范围内的人口 为中等收入人口,一是另一种方法可以视为“人口空间法” ,即选择 F (m) 1 2 邻近的一个范围为中等收入人口,例如取范围 p1 20%到 p2 80%,当然,按 定义,中等收入人口比例已经取定为 60%。再用此 60%的人口所拥有的收入占 总收入的比例来描述中等收入人口的状态。但两种方法都有一定的局限,对此 结合参考文献,在此基础上进行创新,完成如下问题: 一、构造满足(9)式的新模型 L( p, ) ,使得能很好的拟合上述分组数据、