商业分析第2章 商业分析的流程、方法与工具
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
)。回归还能够进行销售预测。
2.1.3 数据挖掘和预处理
6.预测(forecasting):根据大多数集合中的模式估计未
来值。这是另一种形式的估计,应用的例子有使用统计 时间序列方法预测未来的销售数量。
7.其他技术:这些技术一般基于高级人工智能方法,包括
基于案例的推理、模糊逻辑、遗传算法和基于事实的推 理。
1.报表
用表格、图表等格式来动态显示数据。 交通工具的驾驶舱由众多的仪表和控制工具组成,
3.管理驾驶舱
管理驾驶舱就是模拟这种组合方式,将大量的已知数据有序地展示Hale Waihona Puke Baidu
,让使用者方便快速地获取所需信息。主要应用与企业的管理者。
2.2 商业分析的主要方法
2.2.1 商业数据分析方法
1.回归分析
回归分析(regression analysis)是确定两种或两种以上变量间相互依
2.1.3 数据挖掘和预处理
3.关联(association):识别发生在相同时间的事件之间的关系。关
联分析可用于解决市场“菜篮子”一类的分析问题。在零售业中需要 识别哪些商品更可能被同时购买,多大程度上如此。关联分析一般
应用统计方法。
4.序列分析(sequencing)
:和关联分析类似。不过序列分析的对象
捕捉商机,做到抢占先机,在竞争中获胜。
2.1.2 商业信息的收集
商业信息,不仅包括行业发展趋势、市场动态和终端消费者信息,而 且还包括竞争对手的各种情况。可以从以下一些渠道来获取商业信息 。
1.内部信息 2.人际关系网(第三方)信息 3.文献信息:
(1)正式出版物;(2)半正式出版物;(3)非正式出版物
(2)数据预处理是挖掘过程高效率完成的基础
(3)数据预处理的结果对数据挖掘的结果,乃至最终的
商业分析结果影响巨大
2.1.3 数据挖掘和预处理
数据预处理技术主要包括: 数据清洗
是指发现并纠正数 据文件中可识别错 误的步骤,包括对 噪声、缺失值、异 常值的处理。
数据集成
是把不同来源、格 式、特点性质的数 据在逻辑上或物理 上有机地集中,从
在商业应用中,数据挖掘是一种按照企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏 的、未知的信息或验证已知规律,并进一步将其模型化的有效方法。 数据库、机器学习和统计学在数据挖掘中起着核心作用。
2.1.3 数据挖掘和预处理
数据挖掘的主要方式包括以下几类:
1.分类(classification):推导一个群体的特征(例如转向竞争
第 2章 商业分析的流程、方法与工具
2.1 商业分析的流程与步骤
商业分析是针对商业活动中某一特定领域或问题的 对有关信息进行定向选择和科学抽象的研究,它通 常由以下五个步骤组成。
业务 需求
信息 收集
数据挖 掘和预 处理
知识运用 和商业分 析
总结与 评估
2.1.1 业务需求
完整的商业活动是一个过于庞杂的过程,在商业分析活动 中,我们必须明确业务需求,才能确立要研究的特定领域 和问题,了解商业分析工作的研究对象、研究目的和研究 内容。
数据变换
数据归约
是将数据库中的海
所谓数据变换就是 将数据转换或归并 成适合数据挖掘的
量数据进行归约, 归约后的数据仍接 近于保持原数据的
而提供全面的数据
共享。
描述形式。
完整性,但数据量
相对小得多。
2.1.4 知识应用和商业分析
在商业分析活动中,选择合适的处理方法对数据进行挖掘
、分析,能够得到丰富的数据模型和预测结果,这些知识 并不能直接用于商业活动,必须将其应用到一些商业分析
是在一段时间内发生的事件之间的关系(例如超市重复光顾的顾客 )。可以用购买者的账号或者其他方法记录购买行为。
5.回归分析(regression):用于图形表示数据得出预测值,有线性
(linear)回归和非线性(nonlinear)回归的区别。回归是估计值的
一种方法,经常包含识别测量值和通过评分评价每一个项目(顾客
4.网络信息
(1)商业情报数据库。eg:Dialog , Data-Star,ORBIT;(2)搜索引 擎;(3)社交网络
2.1.3 数据挖掘和预处理
1.商业问题的数据挖掘
广义:从大量、不完全的、有噪声、模糊和随机的数据中提取隐含在其 中的、人们事先不知道但又是潜在有用的信息和知识的过程。 狭义:是广义数据挖掘过程中抽取有用模式或建立模型的一个关键步骤。
2.1.1 业务需求
在业务需求分析过程中,还应该遵循以下基本原则:
①针对性 ②科学性 ③可行性 ④效益性
2.1.2 商业信息的收集
商业信息是一笔无形的财富。它的可利用价值,通过使用 者在利用信息实现其经营目标中表现出来。 信息量越大,决策的准确性越高,所以必须重视商业信息 的收集,这样才能减少决策的不确定性和盲目性,不断地
对手的顾客)。这些方法包括以已知类型的集合(可以由聚类方法 获得)作为数据的种子,并将其他的数据项(顾客)归入这些类别 。决策树、神经网络都是有用的工具。
2.聚类(clustering):识别数据的分组,每一组都有共同的特征
(聚类和分类的不同之处在于,聚类没有实现确定分类的特征)。
聚类方法可以解决市场细分问题,能够识别不同需要的顾客类型。
一个好的业务需求应该能够有效地表达用户对目标结论的
需求,准确而切中时要,并具有研究的价值和可能,能在 实际应用中创造社会价值和经济效益。
2.1.1 业务需求
分析业务需求期间通常会着重的主题:
①商业目标 ②实行方式 ⑥锁定使用者 ⑦使用者的利益
③需求范围
④利害关系人 ⑤关键特性
⑧安全性问题
⑨确定目标的优先级
2.1.3 数据挖掘和预处理
数据的选择; 数据的预处理 ; 数据的转换
数据挖掘的商业问题解决
的一般过程如下:
目标定义
数据准备
挖掘过程
商业信息应用
模型或模式结构 ; 评分函数; 优化和搜索办法 ;
数据管理策略
2.1.3 数据挖掘和预处理
数据预处理——商业分析的关键环节
其重要性体现在:
(1)数据预处理是数据挖掘顺利进行的基础
方法中,得出更加直观的结论,为最终的决策提供有效的
支持。 典型的商业分析方法有:SWOT分析、PEST分析、波特五 力分析等。
2.1.5 展示和评估
为了能够让商业分析得到的结论更有效地发挥作用,还需 要商业分析的情报人员对结论进行处理,通过各种展示方 法尤其是可视化方法二次表达,使结论能够被用户简单直 观地接受。
2.1.3 数据挖掘和预处理
6.预测(forecasting):根据大多数集合中的模式估计未
来值。这是另一种形式的估计,应用的例子有使用统计 时间序列方法预测未来的销售数量。
7.其他技术:这些技术一般基于高级人工智能方法,包括
基于案例的推理、模糊逻辑、遗传算法和基于事实的推 理。
1.报表
用表格、图表等格式来动态显示数据。 交通工具的驾驶舱由众多的仪表和控制工具组成,
3.管理驾驶舱
管理驾驶舱就是模拟这种组合方式,将大量的已知数据有序地展示Hale Waihona Puke Baidu
,让使用者方便快速地获取所需信息。主要应用与企业的管理者。
2.2 商业分析的主要方法
2.2.1 商业数据分析方法
1.回归分析
回归分析(regression analysis)是确定两种或两种以上变量间相互依
2.1.3 数据挖掘和预处理
3.关联(association):识别发生在相同时间的事件之间的关系。关
联分析可用于解决市场“菜篮子”一类的分析问题。在零售业中需要 识别哪些商品更可能被同时购买,多大程度上如此。关联分析一般
应用统计方法。
4.序列分析(sequencing)
:和关联分析类似。不过序列分析的对象
捕捉商机,做到抢占先机,在竞争中获胜。
2.1.2 商业信息的收集
商业信息,不仅包括行业发展趋势、市场动态和终端消费者信息,而 且还包括竞争对手的各种情况。可以从以下一些渠道来获取商业信息 。
1.内部信息 2.人际关系网(第三方)信息 3.文献信息:
(1)正式出版物;(2)半正式出版物;(3)非正式出版物
(2)数据预处理是挖掘过程高效率完成的基础
(3)数据预处理的结果对数据挖掘的结果,乃至最终的
商业分析结果影响巨大
2.1.3 数据挖掘和预处理
数据预处理技术主要包括: 数据清洗
是指发现并纠正数 据文件中可识别错 误的步骤,包括对 噪声、缺失值、异 常值的处理。
数据集成
是把不同来源、格 式、特点性质的数 据在逻辑上或物理 上有机地集中,从
在商业应用中,数据挖掘是一种按照企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏 的、未知的信息或验证已知规律,并进一步将其模型化的有效方法。 数据库、机器学习和统计学在数据挖掘中起着核心作用。
2.1.3 数据挖掘和预处理
数据挖掘的主要方式包括以下几类:
1.分类(classification):推导一个群体的特征(例如转向竞争
第 2章 商业分析的流程、方法与工具
2.1 商业分析的流程与步骤
商业分析是针对商业活动中某一特定领域或问题的 对有关信息进行定向选择和科学抽象的研究,它通 常由以下五个步骤组成。
业务 需求
信息 收集
数据挖 掘和预 处理
知识运用 和商业分 析
总结与 评估
2.1.1 业务需求
完整的商业活动是一个过于庞杂的过程,在商业分析活动 中,我们必须明确业务需求,才能确立要研究的特定领域 和问题,了解商业分析工作的研究对象、研究目的和研究 内容。
数据变换
数据归约
是将数据库中的海
所谓数据变换就是 将数据转换或归并 成适合数据挖掘的
量数据进行归约, 归约后的数据仍接 近于保持原数据的
而提供全面的数据
共享。
描述形式。
完整性,但数据量
相对小得多。
2.1.4 知识应用和商业分析
在商业分析活动中,选择合适的处理方法对数据进行挖掘
、分析,能够得到丰富的数据模型和预测结果,这些知识 并不能直接用于商业活动,必须将其应用到一些商业分析
是在一段时间内发生的事件之间的关系(例如超市重复光顾的顾客 )。可以用购买者的账号或者其他方法记录购买行为。
5.回归分析(regression):用于图形表示数据得出预测值,有线性
(linear)回归和非线性(nonlinear)回归的区别。回归是估计值的
一种方法,经常包含识别测量值和通过评分评价每一个项目(顾客
4.网络信息
(1)商业情报数据库。eg:Dialog , Data-Star,ORBIT;(2)搜索引 擎;(3)社交网络
2.1.3 数据挖掘和预处理
1.商业问题的数据挖掘
广义:从大量、不完全的、有噪声、模糊和随机的数据中提取隐含在其 中的、人们事先不知道但又是潜在有用的信息和知识的过程。 狭义:是广义数据挖掘过程中抽取有用模式或建立模型的一个关键步骤。
2.1.1 业务需求
在业务需求分析过程中,还应该遵循以下基本原则:
①针对性 ②科学性 ③可行性 ④效益性
2.1.2 商业信息的收集
商业信息是一笔无形的财富。它的可利用价值,通过使用 者在利用信息实现其经营目标中表现出来。 信息量越大,决策的准确性越高,所以必须重视商业信息 的收集,这样才能减少决策的不确定性和盲目性,不断地
对手的顾客)。这些方法包括以已知类型的集合(可以由聚类方法 获得)作为数据的种子,并将其他的数据项(顾客)归入这些类别 。决策树、神经网络都是有用的工具。
2.聚类(clustering):识别数据的分组,每一组都有共同的特征
(聚类和分类的不同之处在于,聚类没有实现确定分类的特征)。
聚类方法可以解决市场细分问题,能够识别不同需要的顾客类型。
一个好的业务需求应该能够有效地表达用户对目标结论的
需求,准确而切中时要,并具有研究的价值和可能,能在 实际应用中创造社会价值和经济效益。
2.1.1 业务需求
分析业务需求期间通常会着重的主题:
①商业目标 ②实行方式 ⑥锁定使用者 ⑦使用者的利益
③需求范围
④利害关系人 ⑤关键特性
⑧安全性问题
⑨确定目标的优先级
2.1.3 数据挖掘和预处理
数据的选择; 数据的预处理 ; 数据的转换
数据挖掘的商业问题解决
的一般过程如下:
目标定义
数据准备
挖掘过程
商业信息应用
模型或模式结构 ; 评分函数; 优化和搜索办法 ;
数据管理策略
2.1.3 数据挖掘和预处理
数据预处理——商业分析的关键环节
其重要性体现在:
(1)数据预处理是数据挖掘顺利进行的基础
方法中,得出更加直观的结论,为最终的决策提供有效的
支持。 典型的商业分析方法有:SWOT分析、PEST分析、波特五 力分析等。
2.1.5 展示和评估
为了能够让商业分析得到的结论更有效地发挥作用,还需 要商业分析的情报人员对结论进行处理,通过各种展示方 法尤其是可视化方法二次表达,使结论能够被用户简单直 观地接受。