大数据平台数据脱敏关键技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据平台数据脱敏关键技术
作者:周海涛
来源:《电子技术与软件工程》2017年第21期
摘要随着社会的进步,我们逐渐的步入了大数据时代。大数据带给了我们巨大的商业价值,但也有很大的隐患,比如隐私问题、信息保护等方面。大数据的安全问题在于如何在实现数据共享,分享信息的同时保护人们的隐私和敏感问题不被泄露,这正是大数据中安全保护的棘手问题。而脱敏技术正是一个通过对技术和机制的研究,不断的创新来保护用户在共享和使用中出现的问题。数据脱敏可以在用户之间交流共享时保护人们的敏感隐私信息。本文是对在大数据环境下数据脱敏的作用以及出现的问题进行分析和研究,促进人们对其了解和认识。
【关键词】大数据安全数据脱敏信息安全数据隐私
1 概述
我国上层经济与信息技术的不断发展,带动了数据的不断增长,数据已经成为国家发展中不可缺少的一部分。现如今,我们已经迈步到了大数据时代,大数据带给我们方便的同时也存在很多的危险。因此,如何在大数据中方便人们的同时更好的保护人们的敏感隐私信息是我们应该思考的问题。现如今企业收集信息越来越多,到面临的信息泄露问题也越来越严峻。各行业中包含的信息非常敏感和重要,一旦泄露会带给社会甚至国家不可弥补的损失,因此投资大数据对于敏感信息的安全技术必不可少,在第十三个五年规划中有提到“实施国家大数据战略,推动数据资源开放共享”,这说明了大数据安全的保护问题非常重要。如何在各行业各用户进行交换使用的过程中不再造成敏感信息泄露,达到大数据不是看似安全而是非常安全,这是数据产生者和管理者都非常关心的问题。
2 数据脱敏的动机
2.1 敏感数据的安全风险
敏感数据也称为隐私数据,其中包括用户的姓名、电话、身份证号、银行卡号、个人信息等等。这些都是与人们的生活和工作息息相关的,一旦泄露会造成巨大的损失。这些信息都收到不同行业和国家的管制,如果泄露也会造成用户信用问题,财务和法律方面也会有很大影响。随着大数据在人们的生活中越来越受重视,相关企业和部门也应该重视用户的隐私安全,使得双方实现共赢,取得更大的利益。
2.2 当前的数据安全防护手段
由于数据越来越融入人们的生活,信息安全的重要性也不言而喻,而数据安全则是信息安全的重要一方面。就目前来说,数据安全的防护手段有:对称和非对称加密;访问控制;安全审计等。其中对称和非对称加密是指:把原来可解读的明文加密成为不可读的乱码,从而实现用户信息不被盗取的目的。访问控制指:根据数据模型以及用户角色模型,在数据库被查询时进行分析,若有问题可以阻断查询以达到对敏感信息的保护。安全审计是指:对数据时刻进行监控,访问时间和访问记录进行详细的记录,通过检测和分析对敏感信息达到保护作用。这些保护措施在不同领域都有一定的作用,但也存在一些缺陷,没办法对敏感信息更好的保护。
2.3 数据脱敏原理
数据脱敏在进行敏感信息的交换的同时还需要保留原始的特征条件,只有管理人员或者授权的用户才有权限在知道的情况下,进行统计访问数据的情况。以便达到保护数据在分享和使用时的安全性。数据脱敏可以在保证安全性的前提下,使得用户使用范围不断扩展,所以说数据脱敏是大数据环境下最有效对数据的保护办法。
3 数据脱敏过程
3.1 脱敏目标确认
不同企业对数据脱敏的目标制定也有所不同,因为数据脱敏会造成一定的业务开销,运行和维护也需要成本,所以不同的企业应该根据企业中不同的的需要而制定不同的数据脱敏目标。数据敏感程度的分级和确认可以说是数据脱敏目标中较为重要的一部分,其中包括确定原始数据中的敏感程度,脱敏数据在以后得使用中的可用程度等等。作为脱敏数据的依据有敏感信息字段、敏感信息名称、敏感级别、类型等等,这些都需要在使用过程中一一确定,为用户更好的服务。
3.2 脱敏策略制订
所谓脱敏策论是指在脱敏中的一系列规则、规范、方法、限制等的统称。脱敏规则是指:通过数据和用户的全局以及个别配置,进行特别制定以实现脱敏过程的方法。脱敏规范指在脱敏过程中必须遵循的规范和法则,以便于安全和管理。脱敏方法是指用户之间进行敏感交换是的运算方法以及流程。脱敏限制是指在脱敏过程中收到的限制和约束,这是必须遵守的。在脱敏过程中最重要的是脱敏方法,其可以分为可恢复和不可恢复两类,脱敏方法也是脱敏过程中的难点。
3.3 数据脱敏实现
数据脱敏可以分为静态数据脱敏和动态数据脱敏,这是以不同的作用位置和实现原理而划分的。随着数据脱敏应用领悟的不同(从非生产系统到生产系统)从业的技术也逐渐不同(从
SDM到SDM/DDM并重)。对于这两类的实现机制来说,都有着各自的优点和缺点,这两类都不能对大数据中数据脱敏进行应对。因此,需要设计更合理的系统框架以及脱敏方法,已达到分析大数据环境中人们对敏感数据类型以及使用场景等不同的需求,更好的保护敏感隐私的安全性以及人们的使用需求。
4 结语
在如今的大数据时代,数据脱敏是各企业运行管理必不可少的因素。随着社会的不断发展,数据脱敏必然会更加精准的满足用户的需求,数据脱敏将会拥有更高的准确性、更好的自动化程度和更好的抗盗取能力以及更强的拓展能力。可以更好的满足用户之间的分享信息以及共享交流,更好的保护各企业中的隐私信息和用户之间的敏感信息,多领域的满足各行各业的不同需求。
参考文献
[1]姜日敏.电信运营商数据脱敏系统建设方案探讨[J].信息科技,2014(08).
[2]刘明辉,张尼,张云勇等.云环境下的敏感数据保护技术研究[J].电信科学,2014(11).
作者简介
周海涛(1981-),男,湖北省襄阳市人。硕士研究生。研究方向为信息安全、数据治理。
作者单位
北京普元云动科技有限公司北京市 100080