数据挖掘在各领域的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在生物科技上,如人脑与机器介面,可加 速发展生化义肢,学者认为这方面大有潜 力。 机器人将为人类处理更多复杂或重复性的 工作,现有研究人员发展出可设计、制造 机器人的机器人。 在信息科技上,数位权利管理愈来愈受重 视,以便保护知识财产,由全录公司Palo Alto研究中心创出的Content Guard公司, 利用加密技术保护知识财产。

Data Warehouse之步骤

汇集资料数据 撷取、合并、删除、归类..等,成为一定格式, 再放入资料仓储内 存贮并管理data 将所有的资料再集中存入一个大的资料库里,可 依照不同的需求建立小的资料库,方便读取 分析读取所需信息 银行各部门可依据不同的主题存取工具,进行查 询并结合图形,OLAP等工具
數據挖掘(Data Mining)的功能


对资料进行厚缩,给出它的紧凑描述。數據挖 掘主要关心从资料泛化的角度来讨论资料总结。 建立一个分类函数或分类模型,该模型能把资 料库的资料项目映射到给定类别中的某一个。 把一组个体按照相似性归成若干类别。使属于 同一类别的个体之间的距离尽可能地 小,而 不同类别的个体间的距离尽可能地大。 按某一规则探讨这一规则下的资料关联性。
投资决策分析 主要回答:怎样投资?向何处投资?投资 多少?如何筹措资金?包括:投资效益分 析、投资可行性分析 综合经营指标分析与预警 从时间、机构纬度监测信 考核指标分析 用风险、流动风险、经营 风险、资金风险、国际收 银行健康综合评估 支,如果有异常情况自动 给予警告。 指标预警

Technology Review杂志公布改变未来的十项新兴趋势 机器与人脑的介面 塑料电晶体 數據挖掘(Data mining) 数字权利管理 生物测定学(Biometrics) 语言识别处理 微光学技术(Microphotonics) 解开程序码(Untangling code) 机器人设计 微应用流体学(Microfluidics)
范例

ห้องสมุดไป่ตู้


商业银行首要关注于顾客关系的应用主题,即建立顾客信 息分析管理信息,从中收集顾客的基本资料、资产、负 债…等信息用以搭建一个良好的信息连接库。 美国第一银行运用 “ICARE"建立客户关系管理: I(Inquire) 向顾客询问并了解其需求 C(Communicate) 向顾客保证降很快满足其需求 A(Affirm) 使顾客确信有完成服务的工作与愿望 R(Recommend) 向顾客提出一系列的服务选择 E(Express) 使顾客银行接受单个客户的委托 顾客将可通过email 电话 网站信息等得到:金融服务、旅 游娱乐服务以及其他的综合信息服务,之后将会寄出邀请 函请顾客填写,银行将可了解顾客的需求,帮助其完成愿 望



资金管理分析 从时间、机构纬度研究资金流入、流出及管理现状。 资金来源成本估计 从时间、机构纬度研究资金来源成本估计、资金结构、资 金余缺、资金利用度、头寸匡算、资金运用及收益分析。 客户信贷分析 从时间、机构、科目、借款人性质、贷款形式、贷款期限、 贷款方式研究贷款结构、贷款流动,贷款发放与回收情况。
医药方面
Pain Control






Problem: Detecting pain Subjective & no direct measurement Clinical:Visual Analogue Scale(VAS) Where will cause the pain? Endoscope Operating room:ESWL;Prostate Post Op. :PCA ICU Cancer pain
银行踪面
Business Intelligent (BI)

BI For Bank是MDCL公司基于EOSS套件在银行领域 推出的一套完整的商业智慧解决方案。 它以先进的资料仓库(Data Warehousing)、联 机分析处理(OLAP)、數據挖掘(Data Mining) 技术为基础,结合顾客关系管理和电子商务的经 验,能够帮助企业全面提高科学管理水平和经营 决策能力,促进企业业务和利润的增长,提高市 场竞争力,迎接以客户为中心的经营方式的转变。
生物医学方面
背景
随着人类基因序列的解码,基因与各种疾 病间之关联性的研究正逐渐受到重视,而 相关之研究文献亦随之增多。 通过搜寻引擎等渠道,医学研究人员可以 快速取得所需之信息,但也同时面临了资 料过多的问题。

气象业务方面
背景


随着通信技术和电脑技术的发展,每天在气象 通信网上传输越来越庞大的气象资料,对这些 资料的存储、集成和应用的问题也就越来越突 出。 资料仓库是电脑应用发展的必然产物。经过长 期积累所形成的大量业务资料,是过去的真实 活动记录。如何利用这些资料并在此后的决策 中发挥效益,为决策分析和评估提供帮助,很 长时期内都困扰着资料库的发展。
數據挖掘于各领域之应用
谢邦昌 教授 辅仁大学统计信息系教授 中华數據挖掘协会 秘书长
STAT1001@MAILS.FJU.EDU.TW WWW.CDMS.ORG.TW 2004/12/26
你不能不知的十大创新 技术
资料来源: Technology Review杂志 (2002/1)
未来科技大预言
數據挖掘能为电子商务做什么?
通过數據挖掘,市场商人可以瞄准目标客 户,采用个人股票行市、最新信息、特殊 的市场推广活动或其他一些特殊的信息手 段,从而极大地减少广告预算和增加收入。 百货商场、超市和一些老字型大小的零售 店也在进行數據挖掘,以便猜测这些年来 顾客的消费习惯。




资料发掘与生物测定学也很有潜力,數據挖掘是 利用数学演算法,在庞大的资料库中寻找方式, 例如目前应用在掌纹、脸孔等图像辨识,或者是 语言辨识处理等方面。 塑料芯片也是一大突破,在IBM、朗讯、麻省理工、 剑桥大学、Penn State大学都在研发塑料或有机 物质芯片。 微光学技术,专家利用可反射光线的水晶、玻璃 等物质,让光纤传输资料的速度,不会因为通过 路由器、交换器时而降低速度。
P φ A
SystemResearch & Development
Pain Pattern
Patient Satisfaction
DATA MINING
Acute Pain
Service
PCA PφA PDA VAS
Fuzzy Logic
user Drug Demand
messenger
PCA data mining & management
古代史料方面
研究背景
人类已经进入信息时代,我们不仅面临着 用新技术来整理旧史料的问题,而且随着 考古的新发现和科技的发展,史料的容量 和形式急剧膨胀。 以何种方法处理、存贮史料,并且能够让 学者从中方便迅速地检索和得到所需的信 息,是当前史料学的一个大问题。


数位化是史料处理的必经之路 把各种史料统一为电脑资料,方便存贮和检索; 使史料的物理体积大大缩小,方便携带; 可以低成本无差错拷贝,方便传播和普及。 目前,不论是印刷文档、手写稿,还是电子档、 音像档、甚至于遗址与文物,越来越多的史料逐 渐被数位化,出现了资料仓库(Data warehousing)、资料集市(Data mart)、资料掘 取(Data mining)等新概念和信息数位化处理方 法,逐步形成了大资料量存贮和管理方式。

电子商务方面
资料来源: 硅谷动力
數據挖掘对电子商务的重要性



专家预测在今后十年中,“數據挖掘"将是具有 革命性进展的举措之一,是提供“个性化网络" 的关键,即通过采集信息、识别有用结构并进行 即时分析,从而满足用户个性化选择。 无论这种技术复杂与否,近年来各公司都在进行 各种各样的數據挖掘研究,以期让那些近年来急 速堆积增长的原始资料,变得有意义。 电子商务现在是最新和最炙手可热的一个行业, 无论在哪都有历史资料,用这些资料可以得到用 眼睛无法看到的方式结论。
农产品交易方面
资料来源: http://www.amis.gov.tw/price


新系统着重于农产品交易行情信息的加值应用, 利用农产品价量资料库充实的资料 ,加值处理后 提供使用者作为参考,朝向建立「农产品交易行 情资料仓储(Data Warehouse)」之目标发展,让 使用者可以通过资料仓储的资料处理进行 联机分析处理(On Line Analytic Processing , OLAP) 决策支援系统 (Decision Support System, DSS) 數據挖掘(Data Mining)

微应用流体学方面:科学家正试图利用物 理原则做实验,只利用极微量的水,加快 原本需要费时费金钱的实验。加州理工学 院的应用物理学家Stephen Quake,以微应 用流体学发展了一套DNA分析装置,比传统 的分析装置快。 Technology Review的编 辑指出,微应用流体学将为生物科技大有 帮助,就像当初电晶体提高了电子产品。
化学數據挖掘主要内容






Data cleaning Data reduction Feature detection Feature reduction Classifier and category detection Fraud detection Recognizing unusual patterns Novelty detection Construction of sample databases Knowledge discovery and rule detection from large databases



经营成本营利分析 从时间、机构纬度研究经营成本升降、经营成本专案、经 营成本的结构水平、银行收入和利润综合分析。 利率风险与营利分析 从时间、机构纬度研究利率调换交易分析、远期利率合同 分析、金融贷款分析、期权交易分析。 汇率风险与防范分析 从时间、机构纬度研究即期、远期外汇买卖分析,套汇分 析,外汇投机分析,期货、期权交易分析。
本系统包含以下主题:



商业银行资本分析 按时间、机构纬度研究资本的构成、资本需要量和充足度。 资产与负债 从时间、机构纬度研究资产的构成、资产的总量和风险、 负债的构成和趋势、负债同业情况分析等。 表科目查询 本模组以财务报表和会计科目为基础,按照科目、时间、 机构、产品和客户的纬度,进行报表和科目的即时查询、 挖掘和分析。
结论
对于过去,银行并未从企业的整体角度 实施顾客一体化管理,因此前后流程为实 践整合的状态,无法达到连接,将造成信 息重复、矛盾,甚至是过时,无法随时满 足应有的信息或服务,利用data mining的 技术,将可以解决如此的问题,更有效率 朝向以顾客为中心企业体系。
天文学方面
资料来源:张燕霞、赵永恒、崔辰川 中国科学院国 家天文台
摘要
综述數據挖掘和知识发现在天文学中兴起 的必然性及其近几年的发展状况、实现过 程和具体任务。 分析当前天文资料的复杂性,介绍天文学 中數據挖掘的科学要求。 系统地概括近年来天文学中數據挖掘和知 识发现领域研究的进展及其热点,并阐述 其所面临的挑战。

天文学中數據挖掘和知识发现的兴起将对 天文学的发展起到巨大的推动作用,同时 也在知识和技术等方面对天文学家提出新 的要求。 數據挖掘技术能否在虚拟天文台中成功应 用,是虚拟天文台充分配挥作用的关键所 在。
化学方面


近年来,随着化学资料的大量积累和资料库的普 遍使用,逐步认识到大量资料的利用是十分困难 且不充分的,更具价值的规律性的信息和知识反 而被隐蔽起来。因此,化学數據挖掘作为一种新 的信息技术开始出现于电脑化学中。 这一技术的关键是用软件来从大量的化学资料中 自动地发现新的不明显和有潜在应用价值的信息 和知识,因此它也常常与资料分析和知识发现 (Knowledge discovery)相紧密结合。
相关文档
最新文档