数据挖掘在金融投资领域的应用
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
小于58 索赔9.6%
年工资
年龄
大于58 索赔28%
年工资
通过数据挖掘,可以发现投保人中索 赔的具有什么特征,索赔的概率多大, 不索赔的具有什么特征
3000以下 3000-5000 5000以上 索赔4.5% 索赔4.6% 索赔0.5%
3000以下 3000-5000 5000以上
索赔14% 索赔87%
西安交l Rights Reserved. MERIT & its logo, are trademarks of MERIT.
目录
智慧数据 财富未来
1
资产金融投资的研究和应用
2
社保基金金融投资的特点
3
数据挖掘金融投资实例分析
4
数据挖掘中心介绍
理财产品销售 提升银行业务推销回复率
经营成本盈利分析 判断最具盈利性的客户
申请计分机制制定, 信用额、透支额的 厘订标准化
经典应用
预测付款拖欠的概率
银行个人住房贷款评分
银行账户欺诈识别
银行:客户关系管理
智慧数据 财富未来
➢ 目标:对保险业务风险进行一个准确的科学分析和预测,在保险公司建立的保单及索赔 信息数据的基础上寻找风陆较大的翎域,制定台理的保险费率确保立于不败之地; ➢ 示例:银行CRM应用框架、银行CRM管理系统构造、银行CRM中数据挖掘的应用;
证券
期货
信托
保险
银行
资产金融投资研究和应用
证券
智慧数据 财富未来
期货
资产金融 投资研究
和应用
银行
信托
保险
金融投资的研究和应用-证券
智慧数据 财富未来
股票行情数据
由交易所产生,美国 安必胜的able trend、 日本aberration、台湾 奕方摇钱树money tree、国内大智慧、指 南针、等智能股票分 析系统均可对股票行 情进行分析及预测;
红买、蓝卖、持有信号明确
证券: 客户交易数据分析
智慧数据 财富未来
证券公司通过对客户交易行为分析,可以判断股票的趋势走向(如羊群效应) 、可以洞悉股票的价格操纵、可以发展新客户并巩固老客户,最终在证券投资 的博弈战中取得优厚回报。
简单示例--股票购买者投资行为分析
选择年龄、受教育程度、职业、收入来分析判断是否购买投资股票,细分出高价值客户及 其特征。证券公司根据客户交易投资模型细分出的客户特征实行针对性营销建议;
CRM 决 策 分 析
目录
智慧数据 财富未来
1
资产金融投资的研究和应用
2
社保基金的金融投资的特点
3
数据挖掘金融投资实例分析
4
数据挖掘中心介绍
社保基金的金融投资特点
智慧数据 财富未来
第一,价值投资理念。社保基金会在股票投资中奉行价值投资理念。我们对股票 投资,一直坚持正确处理投资对象的内在价值与市场价格涨跌之间的关系,把投 资价值作为选择投资对象的标准,把发现和实现投资价值作为投资的首要工作, 而不是依靠概念炒做和内幕消息进行投资。
实例分析-股票选择(3/6)
智慧数据 财富未来
3.数据的准备(data preparation)选择、清洗、构造、整合、格式化数据
实例分析-股票选择(4/6)
智慧数据 财富未来
4.建立模型(modeling)选择建模技术、参数调优、构建模型 ➢ 建模技术:支撑向量机分类的方法 支持向量机的基本思想是在样本空间或特征空间,构造出最优超平面,使得超平面与不同类 样本集之间的距离最大,从而实现结构风险最小化;
智慧数据 财富未来
1.商业理解(business understanding) 确定数据挖掘目标、制定项目计划
2.数据的理解以及收集(data understanding) 收集、描述、探索、检验数据
3.数据的准备(data preparation) 选择、清洗、构造、整合、格式化数据
4.建立模型(modeling) 选择建模技术、参数调优、构建模型
各金融投资中的核心内容
智慧数据 财富未来
➢ 证券的经营的法宝应该建立在对股票的认识上,而此工作的重点是找出收益回报率高的股票 ➢ 期货是现在进行买卖,在将来进行交收或交割,针对未来市场变化趋势进行预测帮助实现盈利 ➢ 信托从委托人手中转移到受托者,对受托者的综合考察(发展及财务进行评估)至关重要 ➢ 保险的利润关键在于投保风险的度量,找出险种风险高的投保客户特征有助于降低赔付风险 ➢ 银行的核心竞争力就是经营好客户关系,增强贡献度高的客户黏性
第三,责任投资理念。责任投资的理念,要求社保基金会在以下几个方面做一个 负责任的股票投资者。在经济发展方面,社保基金投资强调要正确认识促进经济 发展与实现投资收益的关系。
目录
智慧数据 财富未来
1
资产金融投资的研究和应用
2
社保基金的金融投资的特点
3
数据挖掘金融投资实例分析
4
数据挖掘中心介绍
数据挖掘的跨行业标准流程
➢从板块轮动中寻找期指领先指标:通过观察研究行业板块市场表现对长期均衡比价关系的偏 离程度,预测未来相对于大盘的市场表现,并对市场重心的移动方向进行估计;
宏观经济预警模型 (PPI、CPI、PMI、M1、M2)
判断宏观经济周期拐点 (复苏、繁荣、滞涨、危机、萧条)
一贫如洗
一夜暴富
行情 走势 类
技术 指标 类
索赔54%
单位 类别
单位 类别
单位 类别
单位 类别
单位 类别
单位 类别
123 123 123 123 123 123
if
单位类别=1 and 年龄40岁以下 单位类别=2 and 年龄40岁以下 单位地区=3 and 年龄40岁以上 单位类别=3 and 年工资6000以下
then
不索赔
支持 度
3.3
保险客户风险评估
保险客户流失预警
保险客户利润贡献
典型应用
保险客户响应预测
保险电子商务推广
保险用户欺诈甄别
保险:风险预测
智慧数据 财富未来
➢ 目标:对保险业务风险进行一个准确的科学分析和预测,在保险公司建立的保单及索赔 信息数据的基础上寻找风陆较大的翎域,制定台理的保险费率确保立于不败之地; ➢ 方法:关联分析、决策树(SGI公司的Mine Set系统、澳大利亚HBF保险集团); ➢ 数据:个人信息、年龄、全年收入、单位信息、索赔金额、索赔次数、地区、是否索赔; ➢ 预处理: 缺失值等、测试集、训练集、学习集;
5.评估模型(evaluation) 对模型进行较为全面的评价,评价结果、重审
6.部署(deployment) 形成数据挖掘报告,结果应用 Cross-Industry Standard Process for Data Mining-- CRISP-DM
实例分析-股票选择(1/6)
智慧数据 财富未来
各业务系统
各分销渠道
客户账号
客户历史交易 数据
顾客购买倾向分 析、聚类分析
渠道喜好模型
会计系统 财务数据 利润评测模型
各业务系统
客户每日交易 数据
变化核对模型
资产负债系统
中 央
数
据
仓
资产负债交易
库
数据
数
据
信用和风险评估 挖
模型
掘
客户分析
渠道、客户和服 务的关系
客户和产品的利 润贡献度
客户关系优化
风险评估和管理
1.商业理解(business understanding) 确定数据挖掘目标、制定项目计划
数据挖掘的商业理解是最根本的,良好的商业理解能完 美地将业务和数据挖掘结合起来;
➢目标:
预测未知回报率收益高低的 股票,选出高收益率股票, 为股票最佳的投资决策提供 依据;
1.商业理解 business understanding
股股票票代训练号样本数 股票简称 100 股1票50代号 200 股票40简0 称
6样00本00内0正确分类数浦发银行 91.5% 609030.06%6 95.7% 宇通98客%车
6样00本00外9正确分类数上海机场 84.1%
600028
中国石化
训练样本
特
特征向量
征
向
训练样本 响应变量
训练
量
测试样本 特征向量
的 主 成
模式 分类器
测试样本 响应变量
测试
分
待识别股票样本 特征向量
提 取
识别结果输出
选股
实例分析-股票选择(5/6)
智慧数据 财富未来
5.评估模型(evaluation)对模型进行较为全面的评价,评价结果、重审 ➢检验手段有两种:一种是模型检验(不同方法结果比较),通过命中率、 查全率、准确率等指标分析;另一种是实际市场验证,检验未来选出的股票 是否符合高收益。 ➢通过测试后的模式分类器才可以用来选股,如果该模式分类器实际识别出 的股票能够获得理想的投资回报率,才能证明股票选择模型设计成功。
第二,长期投资理念。按照预期的负债结构,全国社会保障基金将在15至20年后 才发生支出。其负债期限较长,中短期支付压力较小。适应这种资产负债特性, 社保基金会确立了股票长期投资的理念。它要求社保基金必须树立长期投资目标, 必须围绕长期投资目标实行长期投资战略,并在一个较长时期内对投资执行情况 进行考核和评估。社保基金的股票投资,着眼于分享国民经济增长的长期收益, 着眼于分享股票市场健康发展的成果。
收入 教育程度
职业 年龄
影响公正购买股票的因素 (由强到弱)
优质客户 潜在优质客户
普通客户
主妇类客户
资产金融投资研究和应用
期货
智慧数据 财富未来
证券
资产金融 投资研究
和应用
银行
信托
保险
金融投资的研究和应用-期货
智慧数据 财富未来
国内外针对期货投资的研究有:
➢ 股指期货交割日的研究:机会出现在最后一个小时内,有若干次的套利机会,且收益颇丰;
信托结构
走产融结合
智慧数据 财富未来
信托
源于英国的一种重要的理财制度, 在现代社会经济生活中发挥着越来 越重要的作用,成为国家金融机构 体系中的一个重要组成部分。
信托:企业财务分析
智慧数据 财富未来
➢ 目标:根据上市公司的一些关键财务指标,对其进行分类。通过细小的差别发现它们之 间的异同,为做出最佳的投资决策提供依据(根据企业的财务情况是否单独或者组合投资) ➢ 方法:层次法聚类分析; ➢ 数据:流动、固定资产合计、可供出售金融资产、持有到期类金融资产、长期股权投资、 流动、长期负债合计,资本、盈余公积,未分配利润; ➢ 预处理: 通过关联分析,排除各财务指标之间的依赖性;
不索赔 2.2
索赔
1.8
索赔
2.5
置信 水平 94
90
86
67
资产金融投资研究和应用
银行
智慧数据 财富未来
期货
资产金融 投资研究
和应用
证券
信托
保险
资产金融投资的研究和应用-银行
智慧数据 财富未来
➢ 目标:全面分析银行自身和客户,量身定制金融产品,降低银行坏死账等经营风险; ➢ 方法:关联、决策树、聚类、神经网络(香港汇丰银行、美国第一银行); ➢ 数据:账户基本信息、银行财务数据、客户交易数据(转账、汇款、外汇、贷款);
➢计划:
根据股票的一些关键指标, 对其回报率收益进行分类。 通过已知的历史数据建立分 类模型并进行测试、评估;
实例分析-股票选择(2/6)
智慧数据 财富未来
2.数据的理解以及收集(data understanding):收集、描述、探索、检验数据 ➢ 数据:总资产净利润率、固定资产净利润率、主营业务收入增长率、资本保 值增值率、总资产增长率、净利润增长率、每股净资产、市净率、市盈率、流 动比率等等;
优质公司
公司维
中等公司 劣质公司
指标维
时间维
资产金融投资研究和应用
保险
智慧数据 财富未来
期货
资产金融 投资研究
和应用
银行
证券
信托
金融投资的研究和应用-保险
智慧数据 财富未来
➢ 目标: 以客户为中心,通过分析客户行为,找到盈利点提供针对性的服务。依靠深化 老客户忠诚度,挖掘新客户的潜在价值等手段,最终实现保险公司的自身价值。 ➢ 方法:聚类、关联、分类、偏差分析等; ➢ 数据: 客户基本信息(姓名,年龄等)、账号信息(工资卡,险种等)、客户交易信息
证券运营系 统产生两大
类数据
客户交易数据
在各个证券公司的营 业部产生,分布于各 个证券公司营业部和 证券交易所;针对此 类数据可通过客户交 易行为进行分析,为 证券机构决策提供支 撑。
证券:股票行情分析
智慧数据 财富未来
任意时间周期分析
阻力位和支撑位一目了然
美国安必胜的“和趋势”股票交易软件
动态止损位
成交分析类
资产金融投资研究和应用
信托
智慧数据 财富未来
期货
资产金融 投资研究
和应用
银行
证券
保险
金融投资的研究和应用-信托
投资对象
受托人对投 资对象的安 全性和收益 性进行分析
信托的法律 研究,受益
人和信托财 信托制度
产的多元化
投资技能
受托人投资 技能创新, 如日本的贷 款信托
信托公司跨
行业经营、 范围经济、