大数据方向的安全技术研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据方向的安全技术研究

近年来,随着大数据应用的爆发性增长,大数据衍生出独特架构,并推动存储、网络及计算机技术的发展,同时也引发了新的安全问题。国际社会已经将大数据安全列入国家信息网络安全战略,国内学术界、信息安全界、产业界也正逐步关注大数据的发展。

一、大数据相关概念

1.1 研究背景及意义

大数据是继云计算、物联网之后信息产业当前科技创新、产业政策及国家安全领域的又次知识新增长点。在大数据的背景下信息安全面临着很多的挑战,特别是现阶段已有的信息安全手段已经不能满足大数据时代的信息安全的实际要求,因此研究大数据时代所面临的信息安全问题具有重要意义大数据的研究与应用也引起了各国政府部门的重视,成为重要的战略布局方向。纵观国际形势,各国陆续出台大数据相关的政策及战略方案。2012年,美国奥巴马政府宣布将投资2亿美元用于启动“大数据研发倡议( Big Data Research and Development Initiative),旨在从海量繁杂的数据中萃取有用的信息。大数据下信息安全的事件所涉及的内容日益增多,受到的危险越来越严重的。信息安全问题需要经过多方面、多部门共同努力进行解决。

1.2 大数据概念

所谓大数据,即海量数据,具有信息量大、信息主体多元、更新速度快和价值密度低等特点,通常是指大量非结构化或半结构化的数据集。其实早在几年前,数据的海量增长就引起了人们的关注,海量数据的发生、使用、储存伴随着云计算的发展等都成为了现实,“大数据”已经走入了我们的生活。最早将大数据用于IT环境的是知名咨询公司麦肯锡,麦肯锡在研究报告中指出:如果云计算为数据资产提供了保管、访问的场所和渠道,那么如何盘

活数据资产使其为国家治理、企业决策乃至个人生活服务,则是大数据的核心议题,也是云计算内在的灵魂和必然的升级方向。

从信息安全角看,大数据是指规模和格式前所未有而又相互关联的大量数据,搜集自企业的各个部分,技术人员可以对它们进行高速分析。

就像电影《黑客帝国》中的感知机器人或者《终结者》电影中的天网一样,现在的大数据环境由大规模并行处理数据库产品(不过所幸的是,它们没有自我感知能力)组成,这些产品通过处理PB级(1015)到ZB级(1021)看似不同的数据来创建趋势和数据映射。通过建立这种宏观层面的信息,大数据可以让企业了解到他们的产品是如何以前所未有的经济理解水平在运行。也就是说,通过以新方式来结合和分析海量数据,我们可以实现新的业务洞察力.

1.3 大数据特征

大数据的4V+1C特征:

1).Volume,数据量大,据国际知名数据公司IDC提供的数据,全球数据量大约每两年翻番,人类近两年产生的数据量相当于之前产生的全部。

2).Variety,数据类型多,数据可分为结构化数据,半结构化数据和非结构化数据,相较便于存储的文本为主的结构化数据,日志,音频,视频,图片等非结构化数据,对数据处理能力提出了更高要求。

3).Value,价值密度低,价值密度的高低与数据数量成反比。例如在连续的一小时监控过程中,可能有用的数据只有一秒。如何通过强大的计算机算法更迅速的完成对有用数据的提取,是大数据背景下亟待解决的问题。

4)Velocuty,处理速度快,这是大数据相较于传统数据挖倔最显著的特征,IDC的“数字宇宙”报告预计到2020年,全球以电子形式存储的数据数量将达到35.2ZB,在如此海量的数处理效率将成为衡量技术水平的关键。

5)Complexity,复杂性加大,更提升了处理分析大数据的难度。

二、大数据安全问题

2.1 大数据时代面临的挑战

当前互联网改变着世界,信息渗透到社会生活的各个角落,与各个领域密切结合。同时也给国家信息安全和个人信息安全带来了严峻的挑战。随着数据量的增大和数据的集中,对海量数据进行安全防护变得愈加困难,网络空间中大数据大信息的泄露风险来源涵盖范围非常广,数据的大量汇集、数据的集中存储不可避免的增加了用户数据泄露风险。这些数据成为维护公共安全的重要工作。另外,对敏感数据的所有权和使用权没有明确的界定,大数据的分析对涉及的个体隐私问题很多都未考虑。再有,对国外大数据分析技术与平台的过分依赖,使得别国通过获取的情报而摸清国家经济和社会脉搏,威胁到了国家安全,加大了信息泄露的风险。

大数据安全面临的种种威胁如下:

(一)从基础技术角度看,大数据依托的基础技术—NoSQL(非关系型数据库)与当前广泛应用的SQL(关系型数据库)技术不同,没有经过长期改进和完善,在维护数据安全方面也未设置严格的访问控制和隐私管理。NoSQL技术还因大数据中数据来源和承载方式的多样性使得企业将很难定位和保护其中的机密信息。这是NoSQL内在安全机制的不完善,即缺乏保密性和完善性特质。另一方面,NoSQL对来自不同系统,不同应用程序及不同活动的数据进行关联,也加大了隐私泄露的风险。此外,NoSQL允许不断对数据记录添加属性,这也对数据库管理员的安全性预见能力提出了更高的要求。数据的大量汇集,无形中增加了黑客的“收益率”降低了进攻成本,使得一次成功的攻击能获取更多的有价值的数据。从近年互联网公司发生的某些用户信息泄露案不难发现,被泄露的数据量都非常的庞大。

(二)大数据时代,智能终端的数据安全问题显得越发关键。中国已经成为全球最大智能终端市场。随身携带的终端在占用人们大部分时间的同时,也存储了大量的个人信息。人们对于“大数据并不安全”的担忧也不无道理。因此智能终端数据的安全就提上了议事日程。智能家居的产品化,假如人们所使用的智能终端如手机可以控制家里的所有智能终端,一旦被病毒侵犯,那么全家的智能终端都成为了被攻击的目标,那后果就不堪设想。

(三)与任何虚拟化技术一样,数据虚拟化是允许用户访问、管理和优化异构基础架构的良方。数据被人们视为财富的同时,大数据就成为了宝藏,数据虚拟化技术就是挖掘数据和利用宝藏的最好武器。最有代表性的应用就是数据的虚拟化存储技术。于用户而言,虚拟化的存储资源就像是一个巨大的磁石,用户不用关心具体的存储设备,也不必考虑数据经过的路径在应用虚拟化存储时,面对异构存储设备的特点,如何统一监管、虚拟化后不同密级信息混合存储的位置,造成的越权访问、数据泄密等成为大的难题。

三、大数据安全的对策

3.1 大数据信息安全对策

随着在线交易、在线对话、在线互动,在线数据越来越多,黑客们的犯罪动机也比以往任时候都来得强烈。如今的黑客们组织性更强,更加专业,作案工具也是更加强大,作案手段更是层出不穷。相比于以往一次性数据泄露或者黑客攻击事件的小打小闹,现在数据一旦泄露,对整个企业可以说是一着不慎满盘皆输,不仅会导致声誉受损、造成巨大的经济损失,严重的还要承担法律责任,所以在大数据时代,网络的恢复能力以及防范策略可以说是至关重要的。针对不同类型的大数据采取不同的决策,方法如下:

1)结构化数据

大数据时代下数据非常复杂,数据量惊人,对于许多企业而言,保证这些信息数据的安全有效利用是非常严肃的问题。数据结构化对于数据的安全及开发有着及其重要的作用。结

相关文档
最新文档