IDC数据中心在大数据中的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
行业市场(500+)
• 华为电商平台 • 工商银行灾备系统托管
• 广发证券业务系统托管
• 平安保险业务系统托管 • 珠江期货业务系统托管 • 宽带在线业务托管
• 同花顺业务托管
• ……
大数据介绍(1) 何为大?—数据度量
1Byte = 8 Bit 1KB = 1,024 Bytes 1MB = 1,024 KB = 1,048,576 Bytes 1GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Byte1GB Bytes 1TB = 1,024 GB = 1,048,576 MB = 1,099,511,627,776 Bytes 1PB = 1,024 TB = 1,048,576 GB =1,125,899,906,842,624 Bytes 1EB = 1,024 PB = 1,048,576 TB = 1,152,921,504,606,846,976 Bytes 1ZB = 1,024 EB = 1,180,591,620,717,411,303,424 Bytes 1YB = 1,024 ZB = 1,208,925,819,614,629,174,706,176 Bytes
IDC发展在大数据中的应用
在网用户举例
OTT(top30+)
智慧城市(100+)
• 广州市社保灾备平台 • 广东省实验云平台 • 广州市越秀公安局视频监控平台
• 腾讯 • 阿里 • 百度 • 新浪 • 网易 • 京东 • 优酷 • 爱奇异 • 乐视 • 网速 • 蓝汛 • 世纪互联 • ……
• ……
健康档案数据 中国某一线城市
“数据日益成为商业的新源材料: 一种与资本和劳动力并列的新经济元素.”
“信息将成为21世纪的石油”.
— The Economist, 2010
— Gartner, 2010
大数据介绍(4)
大数据 – 四大区别于传统数据的特征
传统数据
数据量 速度 多样化 价值
GB -> TB 数据量稳定,增长不快 主要为结构化数据 统计和报表
大数据
TB -> PB以上 持续实时产生数据, 年增长率超过60% 半结构化,非结构化, 多维数据 数据挖掘和预测性分析
“大数据” 指数据集的大小超过了现有典型的数据库软件和工具的 处理能力 。与此同时,及时捕捉、存储、聚合、管理这些大数据以 及对数据的深度分析的新技术和新能力,正在快速增长,就像预测 计算芯片增长速度的摩尔定律一样。
4
大数据介绍(3)
1.8ZB in 2011
2天的数据量 > 文明起始到2003年
3.88亿/5.3亿
移动/互联网用户 中国 2012年6月
2090亿
2021年RFID标签销售量 2011年是1200万
200PB/季度
智慧城市数据 中国某一线城市
wenku.baidu.com
$8000亿
10年个人位置信息服务创 造的价值
5PB/年
感谢聆听!
大数据介绍(2)
《红楼梦》含标点87万字(不含标点853509字) 每个汉字占两个字节:1汉字=16bit = 2*8位=2bytes 1GB 约等于671部红楼梦 1TB 约等于631,903 部 1PB 约等于647,068,911部 美国国会图书馆藏书(151,785,778册)(2011年4月:收录数据235TB ) 中国国家图书馆:2631万册 1EB = 4000倍美国国会图书馆存储的信息量 600美元的硬盘就可以存储全世界所有的歌曲 MGI估计,全球企业2010 年在硬盘上存储了超过7EB(1EB 等于10 亿GB)的新 数据,同时,消费者在PC 和笔记本等设备上存储了超过6EB 新数据