数据处理与数据建模方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2014-7-3 17
模糊定性指标量化的应用案例
(1)CUMCM2003-A,C:SARS的传播问题 (2)CUMCM2004-D:公务员招聘问题; (3)CUMCM2005-B:DVD租赁问题; (4)CUMCM2008-B:高教学费标准探讨问题; (5)CUMCM2008-D:NBA赛程的分析与评价问题; (6)CUMCM2009-D:会议筹备问题。
[1 ( x ) 2 ] 1 ,1 x 3 f ( x) 3 x5 a ln x b , 其中 , , a, b 为待定常数.
2014-7-3 15
二、数据处理的一般方法
3. 定性指标的量化处理方法
当“很满意”时,则隶属度为1,即 f (5) 1; 当“较满意”时,则隶属度为 0.8 ,即 f (3) 0.8 ; 当“很不满意”时,则隶属度为 0.01,即 f (1) 0.01. 计算得 1.1086, 0.8942, a 0.3915 , b 0.3699。
2014-7-3 24
四、数据建模的动态加权综合方法
2014-7-3 9
什么是一 致化处理? 为什么要 一致化?
二、数据处理的一般方法
1. 数据类型的一致化处理方法
(1)极小型: 对某个极小型数据指标 x ,
1 则 x ( x 0) ,或 x M x . x
(2)中间型: 对某个中间型数据指标 x ,则 1 2( x m) M m , m x 2 ( M m) x 2( M x) 1 , ( M m) x M 2 M m
2 1 1 1.1086( x 0.8942) ,1 x 3 则 f ( x) , 3 x 5 0.3915 ln x 0.3699 [1 ( x ) 2 ] 1 ,1 x 3 f ( x) 3 x5 a ln x b , 其中 , , a, b 为待定常数.
2014-7-3 20
三、数据建模的综合评价方法
3. 逼近理想点(TOPSIS)方法
Baidu Nhomakorabea
设定系统指标的一个理想点 ( x , x , , x ) ,将 每一个被评价对象与理想点进行比较。
如果某一个被评价对象指标 ( xi1 , xi 2 ,, xim ) 在某种意义 下与 ( x1 , x2 ,, xm ) 最接近,则被评价对象 ( xi1 , xi 2 ,, xim ) 为最好的。
w ,wm 1, w 2,
2014-7-3
8
二、数据处理的一般方法
1. 数据类型的一致化处理方法
一般问题的数据指标 x1, x2 ,, xm (m 1) 可能有 “极大型” 、 “极小型” 、 “中间型” 和 “区间型” 指标。
极大型:期望取值越大越好; 极小型:期望取值越小越好; 中间型:期望取值为适当的中间值最好; 区间型:期望取值落在某一个确定的区间 内为最好。
12
二、数据处理的一般方法
3. 模糊指标的量化处理方法
在实际中,很多问题都涉及到定性,或 模糊指标的定量处理问题。 诸如:教学质量、科研水平、工作政绩 、人员素质、各种满意度、信誉、态度、意 识、观念、能力等因素有关的政治、社会、 人文等领域的问题。 如何对有关问题给出定量分析呢?
2014-7-3 13
M 和 m 分别为 x 可能取值的最大值和最小值。
2014-7-3 11
二、数据处理的一般方法
2. 数据指标的无量纲化处理方法
在实际数据指标之间, 往往存在着不可公度性, 会出现“大数吃小数”的错误,导致结果的不合理。
(1)标准差法: xij (2)极值差法:xij
xij x j sj
一、数据建模的一般问题
综合评价是科学、合理决策的前提。 综合评价的基础是信息的综合利用。 综合评价的过程是数据建模的过程。 数据建模的基础是数据的标准化处理。
如何构成一个综合评价问题呢?
2014-7-3 5
一、数据建模的一般问题 综合评价: 依据相关信息对实际对象所进行的客观、 公正、合理的全面评价。 如果把被评价对象视为系统,则问题: 在若干个(同类)系统中,如何确定哪个系 统的运行(或发展)状况好,哪个状况差?即哪 个优,哪个劣? 一类多属性(指标)的综合评价问题。
2014-7-3 16
二、数据处理的一般方法
3. 定性指标的量化处理方法
1 1 . 1086 ( x 0 . 8942 ) 2 f ( x) 0 . 3915 ln x 0 . 3699 ,
1
,1 x 3 3 x5
根据这个规律, 对于任何一个评价 值,都可给出一个合 适的量化值。 据实际情况可构 造其他的隶属函数。 如取偏大型正态分布。
2014-7-3 7
综合评价过程的流程
明任 确务 对 s1, s2,, sn 进行综合评价 明目 确的 排序或 分类 ? 确定评 价指标 确定指标 初始值 指预 标处 的理 规范化指标
x1, x2,, xm
确系 定数 权 权重系数
选价 择模 评型 综合评价指 标 y f (x,w ) 计算综合 依指标 y , y ,, y 对 1 2 n 评价指标 s1, s2,, sn 排序或分类
2014-7-3 10
二、数据处理的一般方法
1. 数据类型的一致化处理方法
(3)区间型:对某个区间型数据指标 x ,则
ax 1 c , x a x 1, a xb 1 x b , x b c
其中 [a, b] 为 x 的最佳稳定区间,c max{a m, M b} ,
xij m j
M j mj xij mj (3)功效系数法: c xij d Mj mj
2014-7-3
1 n x j xij n i1 1 1 n 2 2 s j [ ( xij x j ) ] n i1
M j m ax{ x ij } 1 i n in{ x ij } [0,1] (i 1,2, xij , n; j 1,2, , m) m j m 1 i n
二、数据处理的一般方法
3. 定性指标的量化处理方法
按国家的评价标准,评价因素一般分为五 个等级,如A,B,C,D,E。 如何将其量化?若A-,B+,C-,D+等又如 何合理量化? 根据实际问题,构造模糊隶属函数的量 化方法是一种可行有效的方法。
2014-7-3 14
二、数据处理的一般方法
假设有多个评价人对某项因素评价为A,B,C, D,E共5个等级: {v1 ,v2 ,v3 ,v4,v5}。 譬如:评价人对某事件“满意度”的评价可分为 {很满意,满意,较满意,不太满意,很不满意} 将其5个等级依次对应为5,4,3,2,1。 这里为连续量化,取偏大型柯西分布和对数函 数作为隶属函数:
假设 理想点为 ( x , x ,, x ) , 对于被评价 对象
* 1
* 2
* m
( xi1 , xi 2 ,, xim ) ,则定义二者之间的加权距离:
yi w j f ( xij x * j ), i 1,2,, n ,
j 1
m
其中 wj 为权系数,f (xij , x ) 为 xij 与 x 下距离。
2014-7-3 3
一、数据建模的一般问题 数据建模一般问题的提出:
一般
•实际对象都客观存在着一些反映其特征的相 关数据信息; •如何综合利用这些数据信息对实际对象的现 状做出综合评价,或预测未来的发展趋势, 制定科学的决策方案? --数据建模的综合评价、综合排序、预测与 决策等问题。
2014-7-3 4
数据处理与数据建模方法 • 21世纪的社会是信息社会,其影响最终将 要比十九世纪由农业社会转向工业社会更 加深刻。 • “一个国家总的信息流的平均增长与工业潜 力的平方成正比”。 • 信息资源与自然资源和物质资源被称为人 类生存与发展的三大资源。
2014-7-3 1
数据处理与数据建模方法 实际中大量信息或海量信息对应着大 量的数据或海量数据,从这些数据中寻求 所需要的问题答案--数据建模问题。 通过实际对象过去或当前的相关信 息,研究两个方面问题: (1)分析研究实际对象所处的状态 和特征,依此做出评价和决策; (2)分析预测实际对象未来的变化 状况和趋势,为科学决策提供依据。
2014-7-3
* j
* j 之间的某种意义
22
三、数据建模的综合评价方法
3. 逼近理想点(TOPSIS)方法
通常可取 f (xij , x ) (xij x )
* j
m
* 2 则综合评价函数为 j ,
2 yi wj (xij x* ) ,2,, n 。 j ,i 1 j 1
2014-7-3 6
综合评价问题的五个要素
(1)被评价对象:被评价者,统称为评价系统。 (2)评价指标:反映被评价对象的基本要素, 一起构成评价指标体系。原则:系统性、科学性、可 比性、可测性和独立性。 (3)权重系数:反映各指标之间影响程度大小 的度量。 (4)综合评价模型:将评价指标与权重系数综 合成一个整体指标的模型。 (5)评价者:直接参与评价的人。
按照 yi (i 1,2,, n) 值的大小对各被评价方案进行排 序选优,其值越小方案就越好。
特别地,当某个 yi 0时,则对应的方案就是最优的。
返回
2014-7-3 23
综合评价方法的应用案例
(1)CUMCM1993-B:足球队排名问题; (2)CUMCM2001-B:公交车调度问题; (3)CUMCM2002-B:彩票中的数学问题; (4)CUMCM2004-D:公务员招聘问题; (5)CUMCM2005-A:长江水质的评价和预测问题; (6)CUMCM2005-C:雨量预报方法评价问题; (7)CUMCM2006-B:艾滋病疗法评价与预测问题; (8)CUMCM2007-C:手机“套餐”优惠几何问题; (9)CUMCM2008-B:高教学费标准探讨问题; (10)CUMCM2008-D:NBA赛程的分析与评价问题; (11)CUMCM2009-D:会议筹备问题。
2014-7-3 2
数据处理与数据建模方法
1. 1.数据建模的一般问题 数据建模的一般问题 2. 2.数据处理的一般方法 数据处理的一般方法 3. 3.数据建模的综合评价方法 数据建模的综合评价方法 4. 4.数据建模的动态加权方法 数据建模的动态加权方法 5 ..数据建模的综合排序方法 5 数据建模的综合排序方法 6 ..数据建模的预测方法 6 数据建模的预测方法
2014-7-3
18
三、数据建模的综合评价方法
1. 线性加权综合法
用线性加权函数 y
w x
j 1 j
m
j
作为综合评价模型,
对 n 个系统进行综合评价。
适用条件:各评价指标之间相互独立。 对不完全独立的情况,其结果将导致各指标间 信息的重复,使评价结果不能客观地反映实际。 主要特点: (1)各评价指标间作用得到线性补偿; (2)权重系数的对评价结果的影响明显。
* * *
* 1
* 2
* m
基于这种思想的综合评价方法称为逼近理想点的排序方法 (The technique for order preference by similarity to ideal solution,简称为 TOPSIS) 。
2014-7-3 21
三、数据建模的综合评价方法
3. 逼近理想点(TOPSIS)方法
2014-7-3 19
三、数据建模的综合评价方法 2. 非线性加权综合法
用非线性函数 y
x
j 1
m
wj j
作为综合评价模型,对 n
个系统进行综合评价。 其中 w j 为权系数, 且要求 x j 1 。 适用条件:各指标间有较强关联性。 主要特点: (1)突出了各指标值的一致性,即平衡评价指标值 较小的指标影响的作用; (2)权重系数大小的影响不是特别明显,而对指标 值的大小差异相对较敏感。
模糊定性指标量化的应用案例
(1)CUMCM2003-A,C:SARS的传播问题 (2)CUMCM2004-D:公务员招聘问题; (3)CUMCM2005-B:DVD租赁问题; (4)CUMCM2008-B:高教学费标准探讨问题; (5)CUMCM2008-D:NBA赛程的分析与评价问题; (6)CUMCM2009-D:会议筹备问题。
[1 ( x ) 2 ] 1 ,1 x 3 f ( x) 3 x5 a ln x b , 其中 , , a, b 为待定常数.
2014-7-3 15
二、数据处理的一般方法
3. 定性指标的量化处理方法
当“很满意”时,则隶属度为1,即 f (5) 1; 当“较满意”时,则隶属度为 0.8 ,即 f (3) 0.8 ; 当“很不满意”时,则隶属度为 0.01,即 f (1) 0.01. 计算得 1.1086, 0.8942, a 0.3915 , b 0.3699。
2014-7-3 24
四、数据建模的动态加权综合方法
2014-7-3 9
什么是一 致化处理? 为什么要 一致化?
二、数据处理的一般方法
1. 数据类型的一致化处理方法
(1)极小型: 对某个极小型数据指标 x ,
1 则 x ( x 0) ,或 x M x . x
(2)中间型: 对某个中间型数据指标 x ,则 1 2( x m) M m , m x 2 ( M m) x 2( M x) 1 , ( M m) x M 2 M m
2 1 1 1.1086( x 0.8942) ,1 x 3 则 f ( x) , 3 x 5 0.3915 ln x 0.3699 [1 ( x ) 2 ] 1 ,1 x 3 f ( x) 3 x5 a ln x b , 其中 , , a, b 为待定常数.
2014-7-3 20
三、数据建模的综合评价方法
3. 逼近理想点(TOPSIS)方法
Baidu Nhomakorabea
设定系统指标的一个理想点 ( x , x , , x ) ,将 每一个被评价对象与理想点进行比较。
如果某一个被评价对象指标 ( xi1 , xi 2 ,, xim ) 在某种意义 下与 ( x1 , x2 ,, xm ) 最接近,则被评价对象 ( xi1 , xi 2 ,, xim ) 为最好的。
w ,wm 1, w 2,
2014-7-3
8
二、数据处理的一般方法
1. 数据类型的一致化处理方法
一般问题的数据指标 x1, x2 ,, xm (m 1) 可能有 “极大型” 、 “极小型” 、 “中间型” 和 “区间型” 指标。
极大型:期望取值越大越好; 极小型:期望取值越小越好; 中间型:期望取值为适当的中间值最好; 区间型:期望取值落在某一个确定的区间 内为最好。
12
二、数据处理的一般方法
3. 模糊指标的量化处理方法
在实际中,很多问题都涉及到定性,或 模糊指标的定量处理问题。 诸如:教学质量、科研水平、工作政绩 、人员素质、各种满意度、信誉、态度、意 识、观念、能力等因素有关的政治、社会、 人文等领域的问题。 如何对有关问题给出定量分析呢?
2014-7-3 13
M 和 m 分别为 x 可能取值的最大值和最小值。
2014-7-3 11
二、数据处理的一般方法
2. 数据指标的无量纲化处理方法
在实际数据指标之间, 往往存在着不可公度性, 会出现“大数吃小数”的错误,导致结果的不合理。
(1)标准差法: xij (2)极值差法:xij
xij x j sj
一、数据建模的一般问题
综合评价是科学、合理决策的前提。 综合评价的基础是信息的综合利用。 综合评价的过程是数据建模的过程。 数据建模的基础是数据的标准化处理。
如何构成一个综合评价问题呢?
2014-7-3 5
一、数据建模的一般问题 综合评价: 依据相关信息对实际对象所进行的客观、 公正、合理的全面评价。 如果把被评价对象视为系统,则问题: 在若干个(同类)系统中,如何确定哪个系 统的运行(或发展)状况好,哪个状况差?即哪 个优,哪个劣? 一类多属性(指标)的综合评价问题。
2014-7-3 16
二、数据处理的一般方法
3. 定性指标的量化处理方法
1 1 . 1086 ( x 0 . 8942 ) 2 f ( x) 0 . 3915 ln x 0 . 3699 ,
1
,1 x 3 3 x5
根据这个规律, 对于任何一个评价 值,都可给出一个合 适的量化值。 据实际情况可构 造其他的隶属函数。 如取偏大型正态分布。
2014-7-3 7
综合评价过程的流程
明任 确务 对 s1, s2,, sn 进行综合评价 明目 确的 排序或 分类 ? 确定评 价指标 确定指标 初始值 指预 标处 的理 规范化指标
x1, x2,, xm
确系 定数 权 权重系数
选价 择模 评型 综合评价指 标 y f (x,w ) 计算综合 依指标 y , y ,, y 对 1 2 n 评价指标 s1, s2,, sn 排序或分类
2014-7-3 10
二、数据处理的一般方法
1. 数据类型的一致化处理方法
(3)区间型:对某个区间型数据指标 x ,则
ax 1 c , x a x 1, a xb 1 x b , x b c
其中 [a, b] 为 x 的最佳稳定区间,c max{a m, M b} ,
xij m j
M j mj xij mj (3)功效系数法: c xij d Mj mj
2014-7-3
1 n x j xij n i1 1 1 n 2 2 s j [ ( xij x j ) ] n i1
M j m ax{ x ij } 1 i n in{ x ij } [0,1] (i 1,2, xij , n; j 1,2, , m) m j m 1 i n
二、数据处理的一般方法
3. 定性指标的量化处理方法
按国家的评价标准,评价因素一般分为五 个等级,如A,B,C,D,E。 如何将其量化?若A-,B+,C-,D+等又如 何合理量化? 根据实际问题,构造模糊隶属函数的量 化方法是一种可行有效的方法。
2014-7-3 14
二、数据处理的一般方法
假设有多个评价人对某项因素评价为A,B,C, D,E共5个等级: {v1 ,v2 ,v3 ,v4,v5}。 譬如:评价人对某事件“满意度”的评价可分为 {很满意,满意,较满意,不太满意,很不满意} 将其5个等级依次对应为5,4,3,2,1。 这里为连续量化,取偏大型柯西分布和对数函 数作为隶属函数:
假设 理想点为 ( x , x ,, x ) , 对于被评价 对象
* 1
* 2
* m
( xi1 , xi 2 ,, xim ) ,则定义二者之间的加权距离:
yi w j f ( xij x * j ), i 1,2,, n ,
j 1
m
其中 wj 为权系数,f (xij , x ) 为 xij 与 x 下距离。
2014-7-3 3
一、数据建模的一般问题 数据建模一般问题的提出:
一般
•实际对象都客观存在着一些反映其特征的相 关数据信息; •如何综合利用这些数据信息对实际对象的现 状做出综合评价,或预测未来的发展趋势, 制定科学的决策方案? --数据建模的综合评价、综合排序、预测与 决策等问题。
2014-7-3 4
数据处理与数据建模方法 • 21世纪的社会是信息社会,其影响最终将 要比十九世纪由农业社会转向工业社会更 加深刻。 • “一个国家总的信息流的平均增长与工业潜 力的平方成正比”。 • 信息资源与自然资源和物质资源被称为人 类生存与发展的三大资源。
2014-7-3 1
数据处理与数据建模方法 实际中大量信息或海量信息对应着大 量的数据或海量数据,从这些数据中寻求 所需要的问题答案--数据建模问题。 通过实际对象过去或当前的相关信 息,研究两个方面问题: (1)分析研究实际对象所处的状态 和特征,依此做出评价和决策; (2)分析预测实际对象未来的变化 状况和趋势,为科学决策提供依据。
2014-7-3
* j
* j 之间的某种意义
22
三、数据建模的综合评价方法
3. 逼近理想点(TOPSIS)方法
通常可取 f (xij , x ) (xij x )
* j
m
* 2 则综合评价函数为 j ,
2 yi wj (xij x* ) ,2,, n 。 j ,i 1 j 1
2014-7-3 6
综合评价问题的五个要素
(1)被评价对象:被评价者,统称为评价系统。 (2)评价指标:反映被评价对象的基本要素, 一起构成评价指标体系。原则:系统性、科学性、可 比性、可测性和独立性。 (3)权重系数:反映各指标之间影响程度大小 的度量。 (4)综合评价模型:将评价指标与权重系数综 合成一个整体指标的模型。 (5)评价者:直接参与评价的人。
按照 yi (i 1,2,, n) 值的大小对各被评价方案进行排 序选优,其值越小方案就越好。
特别地,当某个 yi 0时,则对应的方案就是最优的。
返回
2014-7-3 23
综合评价方法的应用案例
(1)CUMCM1993-B:足球队排名问题; (2)CUMCM2001-B:公交车调度问题; (3)CUMCM2002-B:彩票中的数学问题; (4)CUMCM2004-D:公务员招聘问题; (5)CUMCM2005-A:长江水质的评价和预测问题; (6)CUMCM2005-C:雨量预报方法评价问题; (7)CUMCM2006-B:艾滋病疗法评价与预测问题; (8)CUMCM2007-C:手机“套餐”优惠几何问题; (9)CUMCM2008-B:高教学费标准探讨问题; (10)CUMCM2008-D:NBA赛程的分析与评价问题; (11)CUMCM2009-D:会议筹备问题。
2014-7-3 2
数据处理与数据建模方法
1. 1.数据建模的一般问题 数据建模的一般问题 2. 2.数据处理的一般方法 数据处理的一般方法 3. 3.数据建模的综合评价方法 数据建模的综合评价方法 4. 4.数据建模的动态加权方法 数据建模的动态加权方法 5 ..数据建模的综合排序方法 5 数据建模的综合排序方法 6 ..数据建模的预测方法 6 数据建模的预测方法
2014-7-3
18
三、数据建模的综合评价方法
1. 线性加权综合法
用线性加权函数 y
w x
j 1 j
m
j
作为综合评价模型,
对 n 个系统进行综合评价。
适用条件:各评价指标之间相互独立。 对不完全独立的情况,其结果将导致各指标间 信息的重复,使评价结果不能客观地反映实际。 主要特点: (1)各评价指标间作用得到线性补偿; (2)权重系数的对评价结果的影响明显。
* * *
* 1
* 2
* m
基于这种思想的综合评价方法称为逼近理想点的排序方法 (The technique for order preference by similarity to ideal solution,简称为 TOPSIS) 。
2014-7-3 21
三、数据建模的综合评价方法
3. 逼近理想点(TOPSIS)方法
2014-7-3 19
三、数据建模的综合评价方法 2. 非线性加权综合法
用非线性函数 y
x
j 1
m
wj j
作为综合评价模型,对 n
个系统进行综合评价。 其中 w j 为权系数, 且要求 x j 1 。 适用条件:各指标间有较强关联性。 主要特点: (1)突出了各指标值的一致性,即平衡评价指标值 较小的指标影响的作用; (2)权重系数大小的影响不是特别明显,而对指标 值的大小差异相对较敏感。