个人征信系统数据库以及数据分析处理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

个人征信系统数据库以及数据分析处理
个人征信系统数据库以及数据分析处理
一、个人征信数据库
个人征信数据库是用于存储个人信用信息的计算机软硬件设备,是信用数据中心的核心和基础,个人征信数据库必须确保信息及服务安全。

征信数据库建设的原则:
(1)信用信息的全面性和广泛性;
(2)信用信息的时效性;
(3)信用信息的安全性。

|二、个人征信数据分析处理
征信机构收集到的原始数据,只有经过一系列的科学分析之后,才能成为具有参考价值的征信数据。

原始征信数据处理包括核实、分类、剔除不良的数据项、筛选出不真实数据,并进行深加工,包括误差修正、形成中间变量、配以符号等,可以用于量化分(一)征信数据处理技术
征信数据的处理过程中涉及很多技术,而这些技术的提供又涉及不同的行业,并且需要由不同的公司来完成。

例如数据的存储、管理是由数据库技术来实现的,而数据库技术并不是征信公司所特有的核心技术?。

征信公司的核心技术之一,是个人数据的配对处理,即把有关某个消费者在各个部门、各个领域、各地方的分散数据甄别出来,集中到一起并形成一个完整的整体。

征信公司的核心技术之二,是对数量庞大的原始数据进行加工,形成数以千计的中间变量,或称特征变量,使得它们能够完整地刻画消费者的风险和价值特征。

与征信公司业务相关但不属于征信公司独有的另一核心技术,是建立在信公司数据库基础上的分析功能,其产生的主要结果就是风险评分。

在变量的选择、权重的分配、模型的调整上,国外有较成熟的
经验。

在实际操作过程中,国内一些机构开始积累一些有中国特色的经验,目前需要通过总结、调试、跟踪、分析,进行不断优化的~W 工作。

(二)数据查证
数据查证是保证征信产品真实性的关键步骤。

一查数据的真实性。

对于存疑的数据,征信机构可以通过比较不同采集渠道的数据,来确认正确的数据。

当数据来源唯一时,可通过二次调査或实地调査,进一步确定数据的真实性。

二查数据来源的可信度。

某些被征信人为达到不正当目的,可能向征信机构提供虚假的信息。

如果发现这种情况,征信机构除及时修改数据外,还应记录该被征信人的“不诚信行为”,作为以后业务的参考依据。

三查缺失的数据。

如果发现采集信息不完整,征信机构可以依据其他信息进行合理推断,从而将缺失部分补充完整。

四是被征信人自査,即异议处理程序。

当被征信人发现自己的信用信息有误时,可向征信机构提出申请,修正错误的信息或添加异议声明。

特别是批量报送数据时,征信机构无法对数据进行一一查证,一般常用异议处理方式②(三)数据清洗
数据清洗就是把“脏”数据“洗掉”。

因为数据仓库中的数据是面向某一主题的数据的集合,这些数据从多个业务系统中抽取而来而且包含历史数据,这样就避免不了有的数据是错误数据、有的数据相互之间有冲突,这些错误的或有冲突的数据显然是我们不想要的,称为“脏”数据。

我们要按照一定的规则把“脏”数据“洗掉”,这就是数据清洗。

而数据清洗的任务是过滤那些不符合要求的数据,主要分为不完整的数据、错误的数据、重复的数据三大类。

1.不完整的数据
这一类数据主要是一些应该有的信息缺失,如被征信人的名称、出生日期、家庭住址信息缺失。

对于这一类数据需过滤出来,按缺失的内容分别写入不同文件后提交,要求在规定的时间内补全,补全后才写入数据仓库。

2.错误的数据
这一类错误产生的原因是业务系统不够健全,在接收输入后没有
进行判断直接写人后台数据库造成的,比如数值数据输成全角数字字符、字符串数据后面有一个回车操作、日期格式不正确、日期越界等。

这一类数据也要分类,对于类似于全角字符、数据前后有不可见字符的问题,可以通过写SQL语句的方式找出来,然后要求客户在业务系统修正之后抽取。

日期格式不正确的或者是日期越界的这一类错误需要挑出修正之后再抽取。

3.重复的数据
对于这一类数据,需将重复数据记录的所有字段导出,让客户确认并整理。

数据清洗是一个反复的过程,不可能在几天内完成,只有不断地发现问题,解决问题。

对于是否过滤,是否修正一般要求客户确认,对于过滤掉的数据,写入Excel 文件或者将过滤数据写人数据表。

数据清洗需要注意的是不要将有用的数据过滤掉,对于每个过滤规则认真进行验证,并由客户确认。

三、个人征信系统
个人征信系统主要为消费信贷机构提供个人信用分析产品。

由专门的机构给每个人建立一个“信用档案”(即个人信用报告),再提供给借贷机构、数据主体本人、金融监管机构、司法部门以及其他政府机构使用。

目前个人征信系统的数据已经不局限于信用记录等传统运营范畴,注意力逐渐转向提供社会综合数据服务的业务领域。

个人征信系统含有广泛而精确的消费者信息,可以解决顾客信息量不足对企业市场营销的约束,帮助企业以最有效的、最经济的方式接触到自己的目标客户,因而具有极高的市场价值,个人征信系统应用也扩展到直销和零售等领域。

在美国个人征信机构的利润有1/3是来自直销或数据库营销,个人征信系统已被广泛运用到企业的营销活动中。

相关文档
最新文档