大数据基础介绍
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
由现代通信与信息技术、 计算机网络技术、行业技 术、智能控制技术汇集而 成的针对某一个方面的应 用。
信息化时代 新技术
一种基于互联网的计 算方式,通过这种方 式,共享的软硬件资 源和信息可以按需提 供给计算机和其他设 备。 将互联网的技术、平台、 商业模式和应用与移动通 信技术结合并实践的活动 的总称。
大数据基础介绍
2017年11月
中国邮政集团公司三门峡市分公司运营管理部
1
第一章:大数据基础介绍
第一节:大数据概念
中国邮政集团公司三门峡市分公司运营管理部
2
• 1.1、数据与大数据(一)
体 量 结 构 多 样 性
数据
大数据
无处不在,我们 工作每天都用到 数据
价值密度
处理速度
复杂度
中国邮政集团公司三门峡市分公司运营管理部
淘宝、 ebuy
社交网络 电子 商务 移动 互联
微博 Baidu Nhomakorabeapps
(微博)、物联网(传感器,智慧地
球)、车联网、GPS、医学影像、安 全监控、金融(银行、股市、保险) 、电信(通话、短信)都在疯狂产生
车联网
着数据。
GPS
物联网
更多来源
中国邮政集团公司三门峡市分公司运营管理部
6
01
• 1.3 数据的构成与关系 概念
概念
过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮
助企业经营决策更积极目的的资讯。 海量交易数据:
01
大数据
企业内部的经营交易信息主要包括联机交易数据和联机分析数据,是 结构化的,通过关系数据库进行管理和访问的静态历史数据,通过这 些数据,我们能了解过去发生了什么
海量交互数据:
02
10
所有数据(All data)
02 03
大数据(Big data)
开放数据(Open data)
04 05
政府开放数据(Open government data)
内部数据(My data)
7
中国邮政集团公司三门峡市分公司运营管理部
• 1.4 大数据的定义
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通
03
海量数据处理:
大数据的涌现已经催生出了设计用于数据密集型处理的脚骨。例如具 有开放源码、在商品硬件群众运行的Apache Hadoop。
中国邮政集团公司三门峡市分公司运营管理部
8
• 1.5 大数据、智能化、互联网和云计算
指需要新处理模式才能具 有更强的决策力、洞察发 现力和流程优化能力的海 量、高增长率和多样化的 信息资产。
中国邮政集团公司三门峡市分公司运营管理部
9
• 1.6 大数据与数据分析
• 数据分析:指用适当的统计分析方法、 数据挖掘算法对收集来的大量数据进 行详细研究、概括总结、深入挖掘分 析,进而提取出有用信息并形成有价 值结论的工作过程。 • 数据分析工作只是大数据相关工作的 一个重要组成部分。
中国邮政集团公司三门峡市分公司运营管理部
3
第一章 大数据概念与应用
• 1.1 数据与大数据(二)
风马牛可相及
在大数据背景下,因海量无限、包罗万象的数据存在,让许多看似毫不相干的现象之间发生一定的关联,使人们能够 更简捷、更清晰地认知事物和把握局势。大数据的巨大潜能与作用现在难以进行估量,但揭示事物的相关关系无疑是其 真正的价值所在。 经典案例: (1)啤酒与尿布 (2)谷歌与流感
海量数据 复杂类型 的数据
源于社交网络、电子商务、移动互联及其他来源的数据构成。它包括 了呼叫详细记录CDR、设备和传感器信息、GPS和地理定位映射数据、 通过管理文件传输Manage File Transfer协议的海量图像文件、
Web文本和点击流数据、科学信息、电子邮件等等。可以告诉我们
未来会发生什么。
中国邮政集团公司三门峡市分公司运营管理部
4
第一章 大数据概念与应用
• 1.1 数据与大数据(三)
经典案例: (3)纸牌屋为什么这么火? (4)塔吉特百货预测孕妇的故事
中国邮政集团公司三门峡市分公司运营管理部
5
• 1.2 大数据的来源
face book
21世纪是数据信息大发展的时代,移 动互联、社交网络、电子商务等极大 拓展了互联网的边界和应用范围,各 种数据正在迅速膨胀并变大。 互联网 (社交、搜索、电商)、移动互联网