金融行业大数据应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

客户身份识 别模型
前父母时期
中父母时期 后父母时期 老年时期
终端信息
客户内容偏好
内容提纲
2 6
大数据业务概述
数据融合平台介绍
客户服务领域应用
投研及风控领域应用
沟通与交流
•26 > 11/20/2017
•Teradata Confidential
客户标签体系
2 7
•27 > 11/20/2017
•Teradata Confidential
客户信息
1986.10出生; 股龄7年; 某公司职员; 现住上海市威海路; 当前资产14,730.元;
客户群内潜力 值
同属性客户群资产潜力: 9,271元; 同区域客户群资产潜力: 56,649元; 单位同事群资产潜力: 31,831元; 历史交易数据集: 19,271元; 比较规则 程明博士
客户综合潜力 实际值:14730元 预测参考值:30629元
完善客户资产信息、投资信息、黑名单信息、 关联关系、 舆情信息、行政处罚信息、涉诉信息,对信息进行交叉验 证,确保客户基础信息准确性
3 9
外部数据
• 工商数据、法院数据、 纳税数据、投资数据 • 电商数据、舆情数据 • ……
追踪客户资产变动情况,关注客户履约能力
对客户涉及的诉讼、投资企业、关联企业风险事件、高管 变动、舆情信息等进行监测,对客户抵押证券的风险事件 进行监测,关注上述事件对客户履约能力的影响
数据样例——外部授权插件爬取的数据形成的报告样例
2 2
客户电信数据标签
示 例
客户电信数据标签的信息表征能力
电信数据用于客户身份识别
识别客户是什么身份,便于分析该客户对金融产品的需求
分析维度
移动业务定制信息 社交圈 账单金额
社会身份
学生时期 单身时期 年轻已婚夫妇
邮箱活跃度
金融产品定制信息 互联网行为
交易 持仓 索赔
数据产业群落
大数据产业在发展过程中,分为两条主线,一是数据处理产业链,二是依存于
数据处理的产业群落
产业链
数据采集
数据整理
数据租凭
数据销售
产业群落
存储技术
分析技术
分发技术
卖信息 卖数据
卖知识
内容提纲
8
大数据业务概述
数据融合平台介绍
客户服务领域应用
投研及风控领域应用
沟通与交流
•8 > 11/20/2017

其经纪人服务的客户 中,已流失23 人
数据样例——基于标签化处理的互联网文本情报数据
1 9
标签化以后的互联网数据
标签化的处理模板
个人数据--电商、学历(授权&非授权)
2 0
互联网数据应用场景

2 1
互联网数据通过对新闻资讯、论坛、博客、微博、贴吧、微信公众号、电子商务网 站、视频网站等源头进行监测,了解目标企业、高管、公司事件、项目资金运用、 政府信息、地区信息变化,为目标企业提供舆情监测服务,为金融机构贷前信用评 估评估、贷中及贷后企业风险监测提供预警及决策支持。
3 8
业务目标与应用: 本模型借鉴人际传播理论的研究成果,深入分析证券客户投资行为特征,寻找交易行为 模式相似度较高的客户群,并根据客户特征与业务规则,构建不同的“投资交易圈”
股友圈
专业理财圈 资讯敏感圈
大数据对于风险管理的提升
大数据时代,通过外部数据(工商、法院、电商等)与证券公司内部数据结合,主要从以下 方面对风险管理进行提升: 完善客户基础信息,对客户信息进行交叉验证
梳理形成的关键自然人族谱信息
数据样例——法院数据
1 5
法院数据应用样例

1 6
通过对企业及其关联企业的涉诉原因、案件类型、判决结果、执行公告等涉诉信息 进行分析,对企业监测预警、信用评级及授信额度调整、账务催收等提供依据。
涉诉分析报告
数据样例——个人消费数据

1 7
个人消费数据分为授权类数据、非授权类数据两类,作为个人央行征信信息的有效 补充。
我们对大数据的关键理解(2)
麦肯锡咨询公司“大数据”研究报告
“Big data: The next frontier for innovation, competition, and productivity” —McKinsey Global Institute, May 2011.
最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡在2011年发布的研究报告——《大数据:
创新、竞争和生产力的下一个新领域》之中,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能 领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪 潮的到来。” “大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时
日,却因为近年来互联网和信息行业的发展而引起人们关注。
客户标签属性
2 8
•28 > 11/20/2017
•Teradata Confidential
客户标签属性
2 9
•29 > 11/20/2017
•Teradata Confidential
客户标签属性
3 0
•30 > 11/20/2017
•Teradata Confidential
客户亲属关系判别
企业的经营状态、行 政处罚信息、股东结 构、是否经营异常/黑 名单等为企业征信及 信用评级提供支持。
通过股东/高管变更、 企业主营业务变更、 股权质押、动产质 押等信息变动,为 贷中及贷后风险监 测提供监测预警。
风险监测预警:
工商数据应用场景——关联关系图谱
1 4
工商原始信息
梳理形成的企业族谱信息
大数据应用内涵
大数据的内涵:通过技术手段对分散在不同系统的数据进行有效整合,从数据中获 取有用的信息,再将这些信息转化为知识,用于商业决策。
Decision
Knowledge
Information
Data
数据资产采集
数据源
官网 在线 社交 网站 搜索/ 位置 95522 语音 OA等
线上数据采集 服务端日志采集 客户端日志采集 API采集 网络爬虫
当前值 预测值
资产规模
程明,可挖掘的资产潜力 17,101元(54%)
外部数据在及其应用
• • • • • • 企业基本登记信息 法人及高管信息 对外投资信息 关联企业信息 …… 用于潜力预估与行 业偏好增强 • 公告类:立案、 开庭、执行、 仲裁、清算、 用于客户事件 营销
用于风险监测的外部数据主要包括
高流失(96.7%)
其经纪人服务的客户 中,已流失23 人
客户流失 模型
客户偏好聚类
业务目标
客户偏好模型是指证券公司在明确的战略业务模式和专注市场中根据客户的价 值、需求和偏好等综合因素对客户进行分类,通过客户偏好模型可以更好地了 解客户,从而提供更好的服务
模型算法
聚类分析:CCC指标图、K-mean算法 预定义评分:构建指标评价体系 属性分类模式(分位数):分类定指标属性级别
工商数据应用场景

1 3
工商数据作为企业信息查询的第一道防线,提供企业身份识别、关联关系图谱、信 用评级及风险预警等应用。
企业身份识别:
通过照面信息验证企 业身份,识别虚假、 未注册企业。
征信及信用评级:
关联关系图谱:
通过股东信息、高管信息、 对外投资信息、高管对外任 职信息,构建企业关联关系 图谱,评估集团类企业风险。
数据缓冲区
线上 数据 (交 互数 据)
HDFS/NoSQL (分布式文件系统)
内容 数据
内容数据/历史数据采集 分布式ETL( informatica for Hadoop,Sqoop 等) 专用适配器(语音转文本等)
客户
传统结构化数据采集
传统 数据 (交 易数 据) 营销
Replication Server SQL/Q复制 CDC (Change Data Capture) 传统ETL(Extract-Transform-Load 文件/关系数据库
亲属关系判读 夫妻关系
地址信息、 年龄、性别、姓氏等
地址判断规则
地址共同度
A
亲属关系判别 规则
使用变量:年龄、性 别、姓氏;
父子关系 兄妹关系
相同地址客户群
地址关键信息是否相同;
使用变量:联系地址;
邮箱信息 单位名称信息 委托IP信息
同事判断规则
同事关系
B
相同工作单位客户群
•31 > 11/20/2017
大数据在融资融券业务风险管理探索
结合融资融券业务,大数据可以从以下方面对风险管理进行提升:
完善客户信息:
4 0
征信调查及 信用评定
• • • •
工商信息(法人、注册地、高管、投资企业、行政处罚) 法院信息(案件类型、处理结果、涉及金额) 黑名单信息(央行、第三方评级机构黑名单、协会) 互联网信息(舆情、新闻媒体、社交网络等)
房地产信息
房产抵押 土地抵押 城市房价走势 …… 用于客户的潜力预估
电信数据 ……
• • • • 网站访问信息 位置信息 …… 用于客户信用评价 和偏好分析和事件 营销
工商数据应用场景——关联关系图谱
3 7
工商原始信息
梳理形成的企业族谱信息
梳理形成的关键自然人族谱信息
互联网数据应用---客户圈子分析
•Teradata Confidential
自有数据采集
9
可以协助客户进行数据的采集,采集类型包括但不限于以下几类: • • • 行业对标数据采集:如交易所网站数据、协会网站数据等; 研发部门特有账号对应的专业网站数据采集:如某特定行业网站的数据采集等,采集下来 的数据,可以落地存储到ODS,扩充对比分析的来源; 可以根据风险或投资方面的需要,专业定制标签化的情报数据;
工商数据
公司控制人 • 公司事件 • 项目资金运用 舆情信息 • …… • 用于投研支持和事 件营销 • • • 客户电商信 息 用于客户潜 力预估与偏 好划分 …… • • • • •
诉讼数据

电商信息
税务数据
…… • • • • • • 纳税信用等级 税务非正常户 纳税催报 涉税违法 …… 用于客户征信评价
自有数据采集(续)
1 0
自有主题提取

1 1
通过对自有数据主题进行提取,对合作伙伴数据形成有效补充,形成个性化的征信 报告、大数据风控等服务。
数据样例——工商数据

1 2
工商数据包括企业照面(基本)信息、股东信息、高管信息、分支机构信息、企业/ 人员对外投资信息、股权/动产质押信息等内容模块。
主要分析了日均资产、 佣金贡献、交易量、交 易次数、资金累计净流 入量、客户盈亏、开户 时间、仓位等指标
cluster5
cluster1 cluster3
聚类结果和细分服务建议
重点关注 客户数量11% 其总资产量82%
客户价值潜力预估
比较规则3: 综合价值潜力=组内潜力的最大值
内部数据
• • • • 客户基本信息 交易信息 经营报表 ……
追踪投资标的变动状况,确认风险等级变化
对投资标的证券的公告信息、市场价格、收益率、交易量 、交易频率、行业状况、行业排名等信息进行监测,合理 确定投资标的风险等级
挖掘分析客户投资风格及投资能力,进行风险预测
结合内外部数据对客户交易行为、客户投资盈亏进行挖掘 分析,对客户投资风格及投资能力进行分类,确定其风险 承受能力并进行风险预测
个人消费数据应用场景

1 8
个人消费信息提供的电商交易、电信数据、学历、商旅信息等,作为个人央行征信 信息的有效补充,提供更为完整的个人征信报告、优化个人信用评分模型及申请欺 诈模型等,为个人申请信用卡、各种贷款(例如车贷、房贷)等决策提供支持;
同时结合金融机构内部信息,建立完整的个人统一视图,对个人信息进行有效挖掘 ,为金融机构交叉销售、精准营销、客户流失预警等提供数据支持。
同事关系判读
邮箱后缀是否相同; 单位名称是否相同; 委托IP地址 使用变量:邮箱、单位名称、IP地址
•Teradata Confidential
客户流失预估模型
业务需求
从“正常”状态的客户中,找出潜在的即将流失的客户,并分析预测得出其流失的原因及表现,推
荐针对性的挽回建议,最大限度的挽留有流失意向的客户,指导客户流失预防工作。
BigData Service
金融行业大数据应用
内容提纲
2
大数据业务概述
数据融合平台介绍
客户服务领域应用
投研及风控领域应用
沟通与交流
•2 > 11/20/2017
•Teradata Confidential
我们对大数据的关键理解(1)
大数据 —— ①更加广泛、更加深入的数字化,以及②全社会
范围内数据的互联互通。
“更加广泛、更加深入的数字化”,并不等同于传统意义上的纸质文档电子化, 而是指企业在大数据时代以数据指导业务的习惯、策略与模式。 “全社会范围内数据的互联互通”,是指企业现在面对的不仅仅是其内部数据 互联互通的问题(如企业数据总线数据集成等),而是数据在全社会范围内的互联 互通问题,而这与移动互联网密不可分。如果仅仅局限在企业内部的数据,都不能 把握大数据的真正能力。
相关文档
最新文档