大数据和管理科学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二
大数据的管理问题
(3)大数据的应用问题 大数据的主要是用来“预测”,而预测的目的是决策。那么,
大数据理论与决策科学如何结合?
大数据理论与决策科学的结合可以分为三种方式: (1)在决策科学的框架内来研究大数据中的知识挖掘问题
(嵌入式应用);
(2)从大数据中挖掘出的知识与领域科学的共同作用(合作 式应用);
四
大数据的研究方法
1 顶层规划
为了做好大数据研究、应用与产业发展规划,学界、业界和政 府有关部门要共同研究以下问题: (1)大数据对科技、经济、社会发展和国家安全的影响 (2)大数据与物联网、云计算以及智慧城市和智慧地球的关系
(3)大数据的获取、存储、传输、处理与管理方法
(4)大数据的产权界定和产业发展的法律法规 (5)发展大数据产业的市场机制
三
大数据研究的前景
(2)以互联网和可再生能源相结合为基础的第三次工业革命
这五个支柱为: ⑤将运输工具转向插电式以及 ④利用互联网技术将每一大洲 燃料电池动力车,这种电动车 的电力网转化为能源共享网络, ①向可再生能源转型。 这一共享网络的工作原理类似 所需要的电可以通过洲与洲之 ②将每一大洲的建筑转化为微 于互联网。(成千上万的建筑 间共享的电网平台进行买卖。 型发电厂,以便就地收集可再 物能够就地生产出少量的能源, 生能源。 这些能源多余的部分既可以被 ③在每一栋建筑物以及基础设 电网回收,也可以被各大洲之
二
大数据的管理问题
(6)大数据的法规问题 大数据产业的发展需要完善的政策和法规的支撑。 如在鼓励对大数据进行积极有效的开发和应用、对大数据所 有权和使用权进行界定、保障大数据应用过程中的安全和隐私保
护、防止大数据被非法获取和反向利用等方面,都需要严格的法
律法规进行指导、规范、监督和约束。
三
大数据研究的前景
数据,建设了亚洲第一个SAP Hana分析 平台,为运营决策提供及时、准确的数
据支持。
④ IBM智慧的分析洞察。每个月,全球 发布10亿条Twitter信息和300亿条Face
book信息。预计到2020,总量增长约44
倍。基于大数据的企业数据分析正成为 IBM的利润增长。
一
对大数据ቤተ መጻሕፍቲ ባይዱ认识
(2)大数据引起的思维变革
应该包括大数据的获取方法、加工技术、应用模式以及大数据的产
权问题、相关的产业发展问题和相应的法律法规建设问题。
二
大数据的管理问题
从管理的角度看,与大数据相关的管理问题有两类。一是与大 数据生产过程相关的管理问题,主要有大数据的获取问题、大数据 的加工问题和大数据的应用问题。二是与大数据产业发展相关的管 理问题,主要有大数据的产权问题、大数据的产业问题和大数据的 法规问题。
大数据研究的前景
2 大数据与物联网、云计算
物联网、云计算、大数据都是依托互联网并相互依存的有机整 体,是信息技术的新发展。对大数据来说,物联网既是数据来源,又 是数据用户,云计算则是大数据存储、处理的一种方式。随着物联网 和云计算技术的发展,大数据应用和大数据产业一定能够更快的发展。
三
大数据研究的前景
一
对大数据的认识
(2)麦肯锡公司(McKinsey & Company)的定义
大数据是一个大的数据池,其中的数据可以被采集、传递、聚 集、存储和分析。目前,大数据是全球经济每个部门和功能的一部
分。与固定资产和人力资本等其它重要的生产要素类似,没有数据,
很多现代经济活动、创新和增长都不会发生,这正成为越来越普遍 的现象。
施中使用氢和其他存储技术, 间通过联网而共享。)
以存储间歇式能源。
三
大数据研究的前景
对关于第三次工业革命两种主流观点的思考
能源互联网是解决化石能源危机与环境污染问题的途径之一。
一方面,它的建设与发展主要依靠信息科学与技术、新材料科学与 技术、新能源科学与技术等科学与技术的发展;另一方面,发展可
再生能源的主要目的是为了满足人类日益增长的物质生活和精神生
第三次工业革命是以数字化制造、分布式通讯、互联网、新材
料和空间技术的广泛应用为主要标志,它与信息技术、新材料技术、 新能源技术和生物技术等诸多领域的科技革命交相辉映。
这次工业革命不仅极大地推动人类社会经济、政治、文化领域
的变革,而且也影响人类的生活方式和思维方式,使科技经济社会 向更高境界推进,使人获得更加全面的发展。
这个定义指出大数据是一个大的数据集合,它与固定资产、人
力资本一样,也是一种生产要素,并能支持现代经济增长和创新活 动。因此,大数据研究的关键科学问题应该是大数据与经济增长和
创新活动的关系。
一
对大数据的认识
(3)IBM公司的定义
可以用四个特征来描述大数据,即规模性(Volume)、高速性 (Velocity)、多样性(Variety)和真实性(Veracity),这些特征 相结合,定义了IBM所称的“大数据”。 这个定义显然也是把大数据定义为一种数据集合,而且这些数 据具有规模性、高速性、多样性和真实性。所以,大数据研究所关 心的科学问题就应该是对结构多样性的大数据能够进行高速存储和 高速处理的技术。
活的需求。而为了满足这个需求,也离不开信息科学与技术、新材 料科学与技术、新能源科学与技术以及生命科学与技术的发展。从
这个意义上说,以上两种关于第三次工业革命的主流观点是可以合
二为一的。
三
大数据研究的前景
第三次工业革命是由第二次工业革命以来逐步形成的资源和 环境压力不断加大、经济和社会发展越来越不平衡以及人类对物
质生活和精神生活的需求日益提高而引发的。
信息科学与技术、新材料科学与技术、新能源科学与技术、 生命科学与技术的快速发展及其广泛应用极大地推动了第三次工 业革命的发展,它将极大地延伸人类的智慧,拓展人类的活动范 围,促进人类生产方式和生活方式的重大变革。
三
大数据研究的前景
综上所述,大数据研究具有重要的 理论意义和应用前景,但是大数据理论 至多只能作为新兴信息技术的一个组成 部分,来推动第三次工业革命的进程, 不可能成为引发第三次工业革命的龙头 技术。 不做跟风者,争当引领人,起码要 是弄潮儿。谨防被大数据!
一
对大数据的认识
总之,我们需要改变我们的思维方式,使用我们能收集到的所
有数据,而不仅仅是使用样本。我们不能再把精确性当成重心,我 们需要接受混乱和错误的存在。另外,我们应该侧重于分析相关关 系,而不再寻求每个预测背后的原因。
——引自《Big Data: A Revolution—That Will Transform How We Live, Work and Think》
大数据与管理科学
从管理科学视角对大数据研究的思考
合肥工业大学 杨善林
2015年1月
大数据与管理科学
汇报提纲
一 对大数据的认识 二 大数据中的管理问题 三 四 大数据研究的前景 大数据的研究方法
一
对大数据的认识
在提出大数据概念之前,实际上已有很多关于大数据的获取、 存储、处理和利用方法的研究成果。这说明实践是先于理论的, 当然深入的理论研究一定能够促进大数据应用实践更好更快的发 展。
一
对大数据的认识
1 《大数据时代》中的部分观点
(1)关于大数据的神奇传说
① 谷歌通过观察人们在网上的搜索记 录,提前几周成功预测了2009年在
美国爆发的甲型H1N1流感。
② 埃齐奥尼利用大数据创立了一个机 票价格预测系统,准确度高达75%,
平均每张机票可节省50美元。
一
对大数据的认识
③ 农夫山泉为处理每月收集的3TB业务
(3)大数据引起决策科学的变革(主导式应用)。
二
大数据的管理问题
(二)与大数据产业发展相关的管理问题
(4)大数据的产权问题 目前,大数据掌握在大型企业或其它社会组织的手中,如谷歌、 百度、淘宝等互联网公司,电网公司、电信公司、银行机构、政府 部门等企事业单位。大数据是由很多用户产生的小数据组成的,而 谁应该享有大数据的所有权或使用权,产品或服务的提供者还是用 户?这是大数据产业发展需要明确界定和解决的问题。 通过界定大数据产权关系,可将大数据分类为:公共数据、部 门数据和私人数据等。
二
大数据的管理问题
(5)大数据产业问题
大数据的产业链包括数据采集、存储、挖掘、管理与应用等环
节。 大数据产业链会促进原有相关产业的发展,如数据采集、存储 和管理的软硬件设备提供商等产业。 大数据产业链还会催生新的产业形成和发展,如以经营大数据 为主要业务的大数据供应商、以提供基于大数据的信息服务为主要 业务的大数据信息服务提供商等。
一
对大数据的认识
2 关于大数据的定义
(1)美国国家科学基金委(NSF)的定义
大数据是指由科学仪器、传感器、网上交易、电子邮件、视频、
点击流和/或所有其它现在或将来可用的数字源产生的大规模、多样 的、复杂的、纵向的和/或分布式的数据集。
这个定义指出了大数据是一类数据集,并指出了大数据现在和
将来的数据来源,以及大数据具有大规模、多样性、复杂性、分布 性、关联性等数据特征。
据的快速处理方法和非常规的软件工具。大数据始终在“大数据”
和“非大数据”之间不断的转换。
一
对大数据的认识
3 从管理的角度看大数据
定义:大数据是一类能够反映物质世界和精神世界的运动状态 和状态变化的信息资源,它具有海量性、异构性、增长性、复杂性
和可重复开采性,一般都具有多种潜在价值。
这个定义把大数据看做是一类资源,它对经济社会发展具有重 要的潜在价值。按照大数据的资源观,大数据研究的关键科学问题
二
大数据的管理问题
(2)大数据的加工问题
大数据的加工处理需要基础性处理方法,例如:超高维处理方 法、重采样处理方法、分布式实时计算方法、非结构化处理方法和
可视化分析方法等。
在基础处理方法之上,大数据的加工处理还需要应用驱动的处 理方法。如为解决市场营销、商务智能、社会安全、舆情监控等方 面问题,所需要的特定方法。
① 在大数据时代进行抽样分析就像是在汽车时代骑马一样,我们 分析数据会完全抛弃样本分析,而关注数据的总体。
即“样本=总体”。
② 在大数据时代,我们不再担心某个数据点对整套分析的不利影 响,我们要做的就是要接受这些纷繁的数据并从中受益,而不 再以高昂的代价消除所有的不确定性。 ③ 大数据时代对我们的生活,以及与世界交流的方式都提出了挑 战,社会需要放弃它对因果关系的渴求,而仅需关注相关关系。
二
大数据的管理问题
(一)与大数据生产过程相关的管理问题
(1)大数据的获取问题 大数据应用的首要步骤就是数据的获取问题。 大数据的来源是多方面的,既包括搜索引擎、社交网络和电子 商务等互联网的产生的数据,也包括物联网、智能楼宇、智能交通、
智慧城市、智慧地球等方式产生的数据。
有效获取各种方式产生的大数据是应用大数据和实现其价值的 前提和基础。
四
大数据的研究方法
2 实践导向
大数据的生命力全在于它的 应用价值。有关大数据科学问题 的研究必须坚持实践导向,从具 体的应用领域扎扎实实地开展研 究工作。
四
大数据的研究方法
例如:基于大数据的品牌管理
根据品牌管理
的核心内容以及大 数据资源的特点,
② 基于复杂关联关系的 品牌关系管理方法 ④ 大数据环境下品牌管 理范式创新 ① 大数据驱动的品牌战 略定位、组合与重构
3
大数据与第三次工业革命
第二次工业革命以来,全球科技
和经济都获得了高速发展,人类在取
得巨大的成就的同时,也面临着诸多
可持续发展问题,许多学者认为,目 前正在发生,或者即将发生第三次工
业革命。关于第三次工业革命有许多
观点,但最重要的只有两种。
三
大数据研究的前景
(1)以信息控制技术为核心的第三次工业革命
1 大数据的来源和应用领域
大数据具有广阔的应用前景。数据驱动的决策由来已久。 数据+决策能力=决策。 生产制造、物流交通、商务过程、资源环境、教育文化、医疗 卫生、社交信息、生命科学、天文地理、航空航天、政府部门、国 家安全等领域既是大数据的来源又是大数据的应用领域。 一个应用可能对应多个来源。
三
一
对大数据的认识
(4)维基百科(Wikipedia)的定义
大数据是指规模庞大且复杂的数据集合,很难用常规的数据
库管理工具或传统数据处理应用对其进行处理。其主要挑战包括 数据抓取、策展、存储、搜索、共享、转换、分析和可视化。
显然这个定义是从大数据的处理方法和处理工具的视角来看
待大数据的,根据这个定义,大数据研究应该围绕大数据的快速 处理方法和软件工具的研发来展开,研究的目的就是要得到大数