大数据的特点及未来发展趋势

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

摘要 : 数据是 与 自然资源一样重要的战略资源, 大数据技 术就是从数量 巨大、 结构 复杂 、 类型众多的数据 中, 快速获得有价 值信 息的能力, 它 已成为学术界 、 企业界 甚至各 国政府 关注的热点。文章对 大数据 的特点进行 了分析 , 并对大数据未来
发展趋势进行 了展望 。 关键 词: 大数据 ; 特 点; 未来趋势
理技术之中 。
步实现数 据分 析的智能化 。 ( 2 ) 流线化、 实时性 的数据处理将广泛采用 。目前大数据
处理系 统采用 的多数是批量化 的处理方式 ,这种方式适用于
数据报 告的频率不 需要达到分钟级别 的场合 。传统的数据仓 库 系统 、 B I 、 链路挖掘等应用对数据处理 的时 间要求往往 以小 时或天为单位 。但大数据应用突 出强调数据处理的实时性 。 在线个性化推荐 、 股票交易处理、 实时路况信息等数据 处理时 间要求在分钟甚至秒级 。在一些大数据应用场合, 由于没有
( 3 ) 非结构化数据处理技术受到重视。 非结构化数据指 的 是 图片 、 文档 以及视频等数据形式 , 与传 统的文本信 息不 同。 这 类信 息随着云计 算的到来而 产生 的越来越 多。因此 ,对 非 结构化 数据 的处理需求越 来越 强烈 , 非结构化数据采集技术、 N o S Q L数据库等技术正取得快速发展 。
实时性分析 的可伸缩框架和平 台将会广泛应用。
( 3 ) 基于 云的数据分析平台将 更趋完善 。 云计算的发展为 大数据提供 了良好的处理平台和技术支持。云计 算为 大数据 提供 了分布式 的计算方法 、 可以弹性扩展 、 相对便宜的存储空
间和计算资源 。此外 , 云计算 I T资源庞 大、 分布较为广泛 , 是 异构系 统较多 的企业及 时准确处 理数据的有力方式 。未来 , 基于云平 台的大数据分析工具和数据库将 日趋成熟,推动 大
( 1 ) 数据 分析将成 为大 数据技术核心 。数据分析是大数据 的核心,数据分析技术足大数据技术 的核心 。大数据 的价值
体 现在 对大规模 数据集合 的智 能处理 ,从而在无穷多 的数据
中发现信息、 知识和智慧 。要想实现这样 的价 值, 最关键 的步
骤 就是对数 据的分析 和挖掘 。数据 的采集 、存储和管理都是
数据分 析步骤 的基础 ,数据分析得到 的智能结果可 以应用到
大 数据相关 的各个 领域 。未来 大数据将充分利 用机 器学 习、
数据挖掘 、 模 式识 别、自然语 言理解等人工智能基础技术 , 进

模数据集合 的智能分析处理 , 能够帮助人们从似乎无穷多的数 据 中发现信息 、 发现 规则、 发现知识、 发掘智 慧, 进而对 未来态 势发展做 出预测 。要想对大数据做 出智能处理,就必须要 用 人工智能技术, 大数据 的管理 、 分析和可视化 等技 术无 不与人 工智能相关联。 目前机器学习、 数据挖掘 、自然语 言理解 、 模 式识别等人工智能技术, 己经深深 融入 到大数据 各流 程的处
2 0 1 4年第 1 0期 ( 总第 1 4 2期)
信 息 通 信
I NF OR Ⅳ TI ON & C0M ^ 仉 i I C AT 1 0NS
2 0 1 4
( S u m .N o 1 4 2 )
wenku.baidu.com大数据 的特点及 未来发展趋 势
郭丽 娟 ( 石家庄机械化步兵学院, 河北 石家庄 西0 0 8 3 )
中图分类号 : T G 3 3
文献标识码 : A
文章编号 : 1 6 7 3 . 1 1 3 1 ( 2 0 1 4 ) 1 0 . 0 1 9 5 . O 1
和工具 已经非常多,在未来还会 继续 出现新 的技术和工具在
生 活中的很 多部 分都 能用数据表示 。当我们把生活的世 界数据化后 , 我们就可 以采用数据 的格式将其存储 、 分析 , 从
数据技术进一步发展 。
目前 ,分布式处理方式 已经成为大数据处理各环节 的通用处 理方法 , 分布式文件系统 、 大规模并行处理数据库 、 分布式编
程环境等技术也得到广泛应用 。
2 大数 据技 术发 展趋 势
大数据公司可 以分成三类 , 即技术型、 创新型 、 数据型 , 这 三种类型会形成大数据 的生态系统产生价值 。技术性 的大数 据公司通常是 I T公司, 并且需要知道如何组织数据 。创新型 的大数据公司需要一些非常有想象力的人 , 同一 组数据 了, 他
( 4 ) 开源 软件成为推动大数据技术 发展新动力。 开源软件 的盛行不会抑制商业软件发展 ,相反开源软件将 会给基础 架 构硬件 、 应用程序开发工具 、 应用 、 服务等各个方面的相关领
域带来更多 的机会 。 例如开源软件架构 Ha d o o p推 出后 , 成 为 大数据处理 的通用架构 , 很 多厂 商基寸开源 Ha d o o p 推 出了 自 己的商业化产 品。未来开源软件和商业化软件并存 的局面 还
将持续 , 二者相互促进 , 共 同发展
参考文献:
们可 以发现很多用途 。数据型 的大数据公司 ,通常情况下是 大公司, 比如像新浪 、 百度、 网易、 搜狐、 淘宝等 , 或者是大的零
售连 锁企业、 市政公司、 金融服务公司等, 这些公司拥有很多 数据 , 而这些数据 中的价值被忽略 , 需要从这些数据中找到价
( 4 ) 分布式处理架构成为大数据处理普遍模式 。 由于大数 据要处理大规模 、 海量、 异构 的数据, 传统的处理方法在存储空 间、 处理时间和效率上都难 以满足人们对大数据处理的要求 , 所 以在各个处理环节 中都普遍采用分布式方法进行并行处理。
足够 的空 间来存储业务接收到 的所有数据,人们 需要对数据 实 时处理并实时扔掉 。因此 , 在未来几年 中, 内存计算、 流处 理、 连续计算等实时计 算技术将迅速发展 , 用于处理流线化 和
值。
[ 1 1 ] 于艳华. 大数据 [ J ] . 中兴通讯技术, 2 0 1 3 ( 1 )
技术 型公司未来的技术趋向多样化,大数 据相关的技术
[ 2 ] 王柏, 徐六通 . 云计算[ J ] . 中兴通 讯技术, 2 0 1 0 ( 1 )
1 9 5
而 获得 巨大 价值 。
大数据生命 周期的各个环 节, 不 论是大数据 的采集 、 存储 、 管
理, 还是分析、 可视化 以及应用, 都将 出现大数据领域 的创新 热点。
1大数 据技 术 的主要 特点
( 1 ) 开源软件受到广泛应用。 开源项 目和产 品正在主导新 兴 的大数据市场 。分布式处理 的软件框架 H a d o o p 、 用来进行 数据挖掘和可视化 的软件环境 、 非关系型数据库 HB a s e 、 Mo n — g o DB和 C o u c h D B等开源软件都在大数据技术领域 占据重要 地位 , 2 0 1 2 年排名 前 5位的数据挖掘工具 中, 有 4个是开源软 件。 ( 2 ) 人 工智 能技术不断融入 。 “ 大数据” 可 以看作是对大规
相关文档
最新文档