数据标准化方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Leabharlann Baidu--数据标准化的方法
撰稿人:路璐
13167351936
1数据标准化的概念
数据的标准化是将数据按比例缩放,使之落入到一个小的特定区间,将其转化为纯数值,便于不同单位或量级的指标能够进行比较和加权。
2数据标准化的意义
在建设城市信用体系的多指标评级体系中,由于各评级指标的性质不同,通常具有不同的量纲和数量级。当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用。因此,在使用大数据进入评级算法前,为了保证结果的可靠性,首先会对原始指标数据进行标准化处理,数据标准化的方法是建设城市信用体系评级的重要技术之一。
3数据标准化的范围
由于数据采集涉及到多个来源不同标准的原始数据,数据标准化主要解决不同性质的数据对测评方案的作用力同趋化和数据可比性的问题,即各指标值都处于同一个数量级别上,可以进行综合测评分析,为进入下一步的评级算法打好基础。
4数据标准化原理
针对城市信用体系的建设,设计了以下技术方案:
由于原始数据在不同水平、区域内的变化对综合分析结果的影响是不一样的,设定a为重影响最底数值,b为重影响最高数值,即在多指标综合评价时,若 小于a, 变化对综合水平影响较大,平价值也有较大的变化;而当 大于b时, 的变化对被评价对象综合水平的影响较小,则平价值的变化也较小。
当原始数据 小于重影响最低数值a时,标准值为0;
当原始数据 大于重影响最高数值b时,标准值为1;
当原始数据 大于等于重影响最低数值a而小于重影响最高数值b时,标准值为 。
5数据标准化函数
由数据标准化原理得出数学表达式,即:
=10* =10*
将处理后的标准值扩大10倍,与定性指标统一取值区间。
撰稿人:路璐
13167351936
1数据标准化的概念
数据的标准化是将数据按比例缩放,使之落入到一个小的特定区间,将其转化为纯数值,便于不同单位或量级的指标能够进行比较和加权。
2数据标准化的意义
在建设城市信用体系的多指标评级体系中,由于各评级指标的性质不同,通常具有不同的量纲和数量级。当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用。因此,在使用大数据进入评级算法前,为了保证结果的可靠性,首先会对原始指标数据进行标准化处理,数据标准化的方法是建设城市信用体系评级的重要技术之一。
3数据标准化的范围
由于数据采集涉及到多个来源不同标准的原始数据,数据标准化主要解决不同性质的数据对测评方案的作用力同趋化和数据可比性的问题,即各指标值都处于同一个数量级别上,可以进行综合测评分析,为进入下一步的评级算法打好基础。
4数据标准化原理
针对城市信用体系的建设,设计了以下技术方案:
由于原始数据在不同水平、区域内的变化对综合分析结果的影响是不一样的,设定a为重影响最底数值,b为重影响最高数值,即在多指标综合评价时,若 小于a, 变化对综合水平影响较大,平价值也有较大的变化;而当 大于b时, 的变化对被评价对象综合水平的影响较小,则平价值的变化也较小。
当原始数据 小于重影响最低数值a时,标准值为0;
当原始数据 大于重影响最高数值b时,标准值为1;
当原始数据 大于等于重影响最低数值a而小于重影响最高数值b时,标准值为 。
5数据标准化函数
由数据标准化原理得出数学表达式,即:
=10* =10*
将处理后的标准值扩大10倍,与定性指标统一取值区间。