大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术一、引言随着大数据时代的来临,大数据平台的应用越来越广泛。
然而,随之而来的数据安全和隐私保护问题也日益突出。
为了保障数据的安全性,数据脱敏技术成为大数据平台的一个关键技术。
本文将详细介绍大数据平台数据脱敏的关键技术。
二、数据脱敏概述数据脱敏是指对敏感数据进行处理,使其在保持数据的可用性的同时,削弱数据的敏感性,以保护数据的安全性和隐私。
在大数据平台中,数据脱敏通常包括对个人身份信息、银行账号、手机号码等敏感数据进行处理,以防止数据泄露和滥用。
三、数据脱敏关键技术1. 数据加密数据加密是数据脱敏的一种基本技术手段。
通过对敏感数据进行加密,可以确保数据在传输和存储过程中的安全性。
常用的加密算法有对称加密算法和非对称加密算法。
对称加密算法使用相同的密钥进行加密和解密,而非对称加密算法使用公钥和私钥进行加密和解密。
2. 数据脱敏算法数据脱敏算法是指对敏感数据进行处理,使其难以还原出原始数据。
常用的数据脱敏算法有:- 替换算法:将敏感数据替换为伪造的数据,如将姓名替换为随机生成的姓名。
- 哈希算法:将敏感数据通过哈希函数进行转换,使其成为固定长度的字符串,不可逆转。
- 掩码算法:对敏感数据进行部份隐藏,如只显示手机号码的前三位和后四位。
- 加盐算法:在数据脱敏过程中,引入随机的盐值进行加密,增加破解的难度。
3. 数据分区与权限控制数据分区和权限控制是大数据平台中保护数据安全的重要手段。
通过将数据分为多个区域,并对每一个区域设置不同的权限,可以实现对不同用户的数据访问控制。
同时,还可以对不同的数据进行不同级别的脱敏处理,以满足不同用户对数据的需求。
4. 脱敏策略管理脱敏策略管理是指对数据脱敏过程中的策略进行管理和控制。
包括对不同类型的敏感数据制定不同的脱敏策略,对脱敏结果进行评估和监控,及时调整脱敏策略以满足数据安全和隐私保护的需求。
5. 数据脱敏效果评估数据脱敏效果评估是指对脱敏过程中的数据安全性和隐私保护效果进行评估。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术1. 引言大数据平台的快速发展和广泛应用使得数据安全和隐私保护变得尤其重要。
数据脱敏是一种常用的数据安全技术,用于保护敏感数据的隐私。
本文将介绍大数据平台数据脱敏的关键技术,包括数据脱敏的概念、常见的数据脱敏方法以及数据脱敏的应用场景。
2. 数据脱敏的概念数据脱敏是指对敏感数据进行处理,使得数据再也不能够直接或者间接地与个人身份、敏感信息等关联起来。
数据脱敏的目的是保护数据的隐私,防止数据泄露和滥用。
数据脱敏通常包括对数据进行加密、替换、删除或者扰乱等处理,以保证数据的安全性。
3. 常见的数据脱敏方法3.1 字段加密字段加密是指对敏感数据字段进行加密处理。
常见的加密算法包括对称加密算法和非对称加密算法。
对称加密算法使用相同的密钥进行加密和解密,而非对称加密算法使用公钥进行加密,私钥进行解密。
字段加密可以保证数据在存储和传输过程中的安全性。
3.2 字段替换字段替换是指将敏感数据字段替换为具有相同数据类型和格式的伪造数据。
常见的字段替换方法包括随机替换、规则替换和字典替换。
随机替换是将敏感数据字段替换为随机生成的数据;规则替换是根据特定规则将敏感数据字段替换为固定的数据;字典替换是将敏感数据字段替换为预先定义的数据字典中的数据。
3.3 字段删除字段删除是指将敏感数据字段从数据集中彻底删除。
字段删除可以确保敏感数据不被存储和使用,从而保证数据的安全性。
但需要注意的是,在删除敏感数据字段之前,需要对数据进行备份和记录,以便日后的数据分析和使用。
3.4 字段扰乱字段扰乱是指对敏感数据字段进行随机的数据变换。
常见的字段扰乱方法包括数据混淆、数据交换和数据重排。
数据混淆是指将敏感数据字段进行随机的数据变换,使得原始数据无法被还原;数据交换是指将不同的敏感数据字段进行交换,使得数据之间的关联关系被破坏;数据重排是指对敏感数据字段进行随机的排序,使得数据的顺序被打乱。
4. 数据脱敏的应用场景4.1 数据共享在大数据平台中,不同的组织和部门需要共享数据进行分析和决策。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术一、引言随着大数据时代的到来,数据安全和隐私保护成为了重要的关注点。
大数据平台中的敏感数据需要进行脱敏处理,以保护用户的隐私和数据安全。
本文将介绍大数据平台数据脱敏的关键技术。
二、数据脱敏的概念和目的数据脱敏是指将敏感数据转换为不具备个体识别能力的数据,以保护数据的隐私和安全。
数据脱敏的目的是在保持数据可用性的同时,最大程度地减少敏感信息的泄露风险。
三、数据脱敏的方法1. 基于规则的脱敏方法基于规则的脱敏方法是通过事先定义脱敏规则,对敏感数据进行转换。
常见的规则包括替换、加密、删除等。
例如,将身份证号码的后四位替换为“****”,将电话号码的中间四位替换为“****”。
2. 基于统计的脱敏方法基于统计的脱敏方法是通过对数据进行统计分析,对敏感数据进行含糊化处理。
常见的方法有扰动和泛化。
扰动是通过添加噪音或者随机数来改变原始数据,使得敏感信息无法被还原。
泛化是通过将数据进行聚合或者分类,减少数据的精确度,从而保护隐私。
3. 基于加密的脱敏方法基于加密的脱敏方法是使用加密算法对敏感数据进行加密,惟独授权的用户才干解密数据。
常见的加密算法包括对称加密和非对称加密。
对称加密使用相同的密钥进行加密和解密,而非对称加密使用公钥进行加密,私钥进行解密。
四、数据脱敏的关键技术1. 脱敏规则的设计脱敏规则的设计是数据脱敏的核心。
在设计脱敏规则时,需要考虑敏感数据的特点和保护需求。
例如,对于姓名字段,可以使用替换规则将真实姓名替换为随机生成的姓名;对于身份证号码字段,可以使用加密规则将身份证号码进行加密处理。
2. 数据脱敏的粒度控制数据脱敏的粒度控制是指确定脱敏操作的作用范围。
在进行数据脱敏时,需要根据实际需求和法律法规的要求,确定脱敏的粒度。
例如,对于大数据平台中的用户数据,可以对整个用户表进行脱敏,也可以只对敏感字段进行脱敏。
3. 数据脱敏的可逆性处理数据脱敏的可逆性处理是指在需要使用脱敏数据时,能够将脱敏数据还原为原始数据。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术一、引言随着大数据时代的到来,数据安全和隐私保护问题日益凸显。
在大数据平台中,由于数据的规模庞大和多样性,数据脱敏成为了一项重要的技术。
本文将探讨大数据平台数据脱敏的关键技术,包括数据脱敏的定义、脱敏方法、脱敏算法以及脱敏效果评估等方面。
二、数据脱敏的定义数据脱敏是指对敏感数据进行处理,以保护数据的隐私和安全。
脱敏后的数据可以在非敏感场景下使用,同时不会暴露个人隐私信息。
数据脱敏的目标是在保持数据的可用性和有效性的同时,最大限度地降低数据泄露的风险。
三、数据脱敏的方法1. 基于规则的脱敏方法:基于规则的脱敏方法是根据预定义的规则对数据进行脱敏处理。
常见的规则包括替换、截断、加密等。
例如,将手机号码的前三位和后四位替换为“*”来保护用户隐私。
2. 基于加密的脱敏方法:基于加密的脱敏方法使用加密算法对敏感数据进行加密处理,惟独授权用户才干解密并访问原始数据。
常见的加密算法包括对称加密算法和非对称加密算法。
3. 基于生成算法的脱敏方法:基于生成算法的脱敏方法通过生成符合原始数据分布特征的合成数据来代替原始数据。
生成算法可以根据数据的统计特征和分布规律生成合成数据,从而保护原始数据的隐私。
四、数据脱敏的算法1. 替换算法:替换算法是将敏感数据替换为虚拟数据,例如将姓名替换为随机生成的姓名,将地址替换为虚拟地址等。
替换算法可以保持数据的格式和结构,但可能无法保证数据的可用性。
2. 加密算法:加密算法使用密钥对敏感数据进行加密,惟独持有正确密钥的用户才干解密数据。
常见的加密算法包括AES、RSA等。
加密算法可以提供较高的数据安全性,但解密过程可能会增加计算开消。
3. 扰动算法:扰动算法通过对敏感数据添加随机噪声来实现脱敏。
例如,对数值型数据添加随机数或者对分类数据进行随机排序。
扰动算法可以在一定程度上保护数据的隐私,但可能会降低数据的准确性。
五、脱敏效果评估评估数据脱敏效果的指标包括数据的可用性、隐私保护程度和数据的准确性。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术引言概述:在当前大数据时代,数据的安全性和隐私保护成为了重要的关注点。
为了保护敏感数据的安全,大数据平台需要采用数据脱敏技术。
本文将介绍大数据平台数据脱敏的关键技术,并分为五个部份进行详细阐述。
一、数据脱敏的概念1.1 数据脱敏的定义1.2 数据脱敏的目的1.3 数据脱敏的分类二、数据脱敏的方法2.1 字段级脱敏2.1.1 数据加密2.1.2 数据替换2.1.3 数据隐藏2.2 行级脱敏2.2.1 数据扰乱2.2.2 数据抽样2.2.3 数据切割2.3 数据脱敏的选择三、数据脱敏的算法3.1 哈希算法3.1.1 MD5算法3.1.2 SHA算法3.1.3 HMAC算法3.2 加密算法3.2.1 对称加密算法3.2.2 非对称加密算法3.2.3 混合加密算法3.3 数据脱敏算法的比较四、数据脱敏的实施4.1 数据脱敏的流程4.1.1 数据分类和分级4.1.2 数据脱敏策略的确定4.1.3 数据脱敏的实施4.2 数据脱敏的工具4.2.1 开源脱敏工具4.2.2 商业脱敏工具4.2.3 自定义脱敏工具4.3 数据脱敏的注意事项五、数据脱敏的应用5.1 金融行业5.1.1 个人账户信息脱敏5.1.2 交易数据脱敏5.1.3 风险评估数据脱敏5.2 医疗行业5.2.1 患者隐私数据脱敏5.2.2 医疗记录脱敏5.2.3 医学研究数据脱敏5.3 电商行业5.3.1 用户个人信息脱敏5.3.2 交易记录脱敏5.3.3 评价数据脱敏结论:数据脱敏是大数据平台中保护敏感数据安全和隐私的重要技术。
本文详细介绍了数据脱敏的概念、方法、算法、实施和应用。
在大数据时代,合理使用数据脱敏技术,能够有效保护用户隐私,提高数据安全性,推动大数据应用的发展。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术一、背景介绍随着大数据应用的不断发展,数据安全和隐私保护问题日益引起人们的关注。
大数据平台中存储的海量数据中可能包含敏感信息,如个人身份证号、银行账号等,如果这些数据泄露或被滥用,将对个人和组织造成严重的损失。
因此,数据脱敏技术在大数据平台中的应用变得尤为重要。
二、数据脱敏的定义数据脱敏是指在保持数据的可用性和完整性的前提下,对敏感数据进行加密或替换等处理,使得数据在传输和存储过程中无法被恶意获取和利用。
数据脱敏的目的是保护数据的隐私性,防止数据泄露和滥用。
三、数据脱敏的关键技术1. 哈希算法哈希算法是一种将任意长度的数据映射为固定长度散列值的算法。
通过对敏感数据进行哈希运算,可以将原始数据转化为不可逆的散列值,从而保护数据的隐私性。
常用的哈希算法有MD5、SHA-1等。
2. 加密算法加密算法是将敏感数据转化为密文,只有具备解密密钥的人才能解密还原出原始数据。
对于大数据平台中的敏感数据,可以采用对称加密算法或非对称加密算法进行加密保护。
常用的对称加密算法有AES、DES等,常用的非对称加密算法有RSA、ECC等。
3. 替换算法替换算法是将敏感数据替换为与之具有相同格式和长度的伪数据,从而保护原始数据的隐私性。
替换算法可以采用固定的替换规则,也可以根据特定的需求进行自定义替换。
例如,可以将身份证号替换为随机生成的身份证号,保持数据的格式和长度不变。
4. 脱敏策略脱敏策略是指根据数据的敏感程度和使用场景,制定相应的数据脱敏策略。
常用的脱敏策略包括完全脱敏、部分脱敏和不脱敏。
完全脱敏是指将所有的敏感数据都进行脱敏处理,适用于对数据隐私要求非常高的场景;部分脱敏是指只对部分敏感数据进行脱敏处理,适用于对数据隐私要求较高的场景;不脱敏是指不对敏感数据进行任何处理,适用于对数据隐私要求较低的场景。
四、数据脱敏的应用场景1. 金融行业在金融行业中,大数据平台存储了大量的客户个人信息和交易数据。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术引言概述:随着大数据时代的到来,数据安全和隐私保护成为了一个重要的问题。
在大数据平台中,数据脱敏技术被广泛应用来保护敏感数据的安全。
本文将介绍大数据平台数据脱敏的关键技术。
一、数据脱敏技术的概念和作用1.1 数据脱敏的定义数据脱敏是一种通过对敏感数据进行处理,使其在保留原有数据结构和特征的同时,削减或者隐藏敏感信息的技术。
1.2 数据脱敏的作用数据脱敏可以有效保护敏感数据的安全,防止数据泄露和滥用。
通过脱敏处理,可以降低数据的敏感度,使得数据在共享和使用过程中更加安全可靠。
1.3 数据脱敏的应用场景数据脱敏广泛应用于金融、医疗、电商等领域。
例如,在金融领域,银行需要共享数据给第三方合作火伴进行风险评估,但又不能暴露客户的敏感信息,这时就需要使用数据脱敏技术。
二、数据脱敏的常用方法2.1 替换方法替换方法是指将敏感数据替换为与之具有相同格式和特征的伪数据。
常见的替换方法包括随机替换、固定替换和字典替换。
2.2 删除方法删除方法是指直接删除敏感数据或者将其部份内容删除。
常见的删除方法包括全删除、部份删除和屏蔽删除。
2.3 加密方法加密方法是指对敏感数据进行加密处理,惟独具有解密密钥的人材干还原数据。
常见的加密方法包括对称加密和非对称加密。
三、数据脱敏的挑战和解决方案3.1 数据脱敏的挑战数据脱敏面临着数据准确性、数据关联性和性能问题等挑战。
在脱敏过程中,需要确保脱敏后的数据仍具有一定的准确性,同时还需要保持数据之间的关联性。
此外,数据脱敏还需要在保证数据安全的前提下,尽可能减少对性能的影响。
3.2 数据脱敏的解决方案为了解决数据脱敏的挑战,可以采取以下措施。
首先,需要制定脱敏策略,明确敏感数据的范围和脱敏级别。
其次,选择合适的脱敏方法,根据实际需求和数据特点进行选择。
最后,进行脱敏效果评估和性能测试,确保脱敏后的数据满足要求。
四、数据脱敏的未来发展趋势4.1 自动化脱敏未来的数据脱敏技术将更加智能化和自动化,能够根据数据的特征和要求自动选择合适的脱敏方法,并进行脱敏处理。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术一、背景介绍在大数据时代,随着数据的快速增长和广泛应用,数据安全和隐私保护成为了一个重要的问题。
大数据平台中的敏感数据需要进行脱敏处理,以保障用户隐私和数据安全。
本文将介绍大数据平台数据脱敏的关键技术。
二、数据脱敏的概念数据脱敏是指对敏感数据进行处理,使其在保留数据的基本特征的同时,去除或修改其中的敏感信息,以保护数据的隐私和安全。
数据脱敏的目的是在数据使用和共享的过程中,保护用户隐私和敏感信息。
三、数据脱敏的方法1. 字段层面脱敏:对于结构化数据,可以对字段进行脱敏处理。
常用的脱敏方法有:- 替换:将敏感数据替换成符合规则的伪造数据,如将手机号码替换成随机生成的手机号码。
- 掩码:对敏感数据进行部分隐藏,如将身份证号码的后几位用“*”代替。
- 加密:对敏感数据进行加密处理,只有授权的用户才能解密获取原始数据。
2. 数据集层面脱敏:对于非结构化数据或者整个数据集,可以进行整体脱敏处理。
常用的脱敏方法有:- 采样:从原始数据集中随机选择一部分数据进行分析,而不使用全部数据。
- 扰动:通过添加噪音或修改数据的分布,使得敏感信息无法被还原。
- 数据泛化:对数据进行泛化处理,降低数据的精确度,如将年龄数据按照一定的规则进行分段。
四、数据脱敏的关键技术1. 数据分类和敏感信息识别:首先需要对数据进行分类,确定哪些数据属于敏感信息。
常见的敏感信息包括身份证号码、手机号码、银行卡号等。
可以使用正则表达式、关键词匹配等技术进行敏感信息的识别。
2. 脱敏规则设计:根据不同的敏感信息和业务需求,设计合适的脱敏规则。
脱敏规则需要考虑数据的保真度和安全性,确保脱敏后的数据仍然具有一定的可用性。
3. 数据脱敏算法:选择合适的算法对数据进行脱敏处理。
常用的算法包括替换算法、掩码算法、加密算法等。
需要根据数据的特点和脱敏需求选择合适的算法。
4. 脱敏效果评估:对脱敏后的数据进行效果评估,确保脱敏后的数据仍然具有一定的可用性和安全性。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术一、引言随着大数据应用的快速发展,数据安全和隐私保护问题日益凸显。
在大数据平台中,数据脱敏是一项关键技术,用于保护敏感数据的隐私,同时保持数据的可用性和可分析性。
本文将详细介绍大数据平台数据脱敏的关键技术及其实现原理。
二、数据脱敏的概念数据脱敏是指对敏感数据进行处理,以使其无法直接或者间接地与个人身份、敏感信息等关联起来,从而保护数据的隐私。
数据脱敏可以通过多种方法实现,包括替换、加密、删除等。
三、数据脱敏的关键技术1. 替换技术替换技术是最常用的数据脱敏技术之一。
它通过将敏感数据替换成伪造的数据,以保护原始数据的隐私。
常见的替换技术包括:- 随机替换:将敏感数据替换为随机生成的数据,如将真实姓名替换为随机生成的姓名。
- 字典替换:使用字典表将敏感数据替换为预先定义的伪造数据,如将手机号码替换为预先定义的伪造手机号。
- 掩码替换:将敏感数据的一部份替换为特定的符号或者字符,如将信用卡号替换为**** **** **** 1234。
2. 加密技术加密技术是另一种常用的数据脱敏技术。
它通过对敏感数据进行加密,惟独拥有相应解密密钥的人材干还原数据。
常见的加密技术包括:- 对称加密:使用相同的密钥进行加密和解密,如AES(高级加密标准)算法。
- 非对称加密:使用公钥进行加密,私钥进行解密,如RSA算法。
- 哈希加密:将敏感数据通过哈希算法转换为固定长度的密文,无法还原为原始数据。
3. 删除技术删除技术是指直接删除或者屏蔽敏感数据,以保护数据的隐私。
常见的删除技术包括:- 数据屏蔽:将敏感数据的一部份或者全部屏蔽,如将身份证号码的后四位屏蔽为****。
- 数据截断:删除敏感数据的一部份,如将银行卡号的后八位删除。
四、数据脱敏的实现原理数据脱敏的实现原理可以通过以下步骤进行:1. 数据识别:确定敏感数据的类型和位置,如身份证号码、手机号码等。
2. 数据分类:根据敏感数据的级别和处理需求,将数据分为不同的分类,如高、中、低级别。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术一、概述大数据平台的数据脱敏是指对敏感数据进行处理,以保护个人隐私和数据安全的关键技术。
在大数据应用中,数据脱敏是必不可少的,它可以有效地保护用户的隐私信息,同时确保数据的可用性和分析的准确性。
本文将详细介绍大数据平台数据脱敏的关键技术,包括数据脱敏的概念、目的、方法和实施步骤。
二、数据脱敏的概念和目的数据脱敏是指对敏感数据进行处理,将其转化为不可识别或者不可关联的数据,以保护个人隐私和数据安全。
数据脱敏的目的是在保持数据可用性的前提下,最大限度地减少敏感信息的泄露风险。
通过脱敏处理,可以保护用户的个人身份信息、财务信息、健康信息等敏感数据,防止其被未经授权的人员获取和滥用。
三、数据脱敏的方法1. 替换方法:将敏感数据替换为符合规则的伪造数据。
例如,将用户的真实姓名替换为随机生成的姓名,将身份证号码替换为虚构的身份证号码。
替换方法可以保留数据的格式和结构,但可能无法保证数据的真实性和准确性。
2. 加密方法:对敏感数据进行加密处理,将其转化为密文。
惟独掌握密钥的人员才干解密得到原始数据。
加密方法可以提供更高的数据安全性,但在数据分析和挖掘过程中可能会增加计算和存储的成本。
3. 删除方法:直接删除敏感数据,只保留非敏感数据。
删除方法可以彻底消除敏感数据的泄露风险,但可能会导致数据的不完整和分析的不许确。
4. 掩盖方法:通过含糊化或者部份隐藏敏感数据,降低敏感信息的识别和关联性。
例如,将手机号码的后四位用星号代替,将银行卡号的前几位和后几位隐藏起来。
掩盖方法可以保留数据的一部份信息,但可能无法彻底防止敏感数据的泄露。
四、数据脱敏的实施步骤1. 风险评估:对数据进行风险评估,确定哪些数据属于敏感数据,需要进行脱敏处理。
根据不同的数据类型和业务需求,制定相应的脱敏策略和措施。
2. 数据分类:将数据按照敏感程度进行分类,确定不同数据类别的脱敏方法和级别。
例如,个人身份信息属于高度敏感数据,需要采用加密方法进行脱敏;而用户的购物记录属于中度敏感数据,可以采用替换或者掩盖方法进行脱敏。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术一、引言在大数据时代,数据安全和隐私保护是一个重要的问题。
大数据平台中存储的海量数据包含着大量的敏感信息,如个人身份信息、财务数据等。
为了保护这些敏感数据的安全性,数据脱敏技术应运而生。
本文将介绍大数据平台数据脱敏的关键技术。
二、数据脱敏的定义和目的数据脱敏是指对敏感数据进行加密或者转换,以保护数据的隐私性。
其目的是在保持数据的可用性的同时,防止未经授权的访问和使用。
三、数据脱敏的关键技术1. 加密算法加密算法是数据脱敏的核心技术之一。
常见的加密算法包括对称加密算法和非对称加密算法。
对称加密算法使用相同的密钥进行加密和解密,速度较快,但密钥管理较为复杂;非对称加密算法使用公钥和私钥进行加密和解密,安全性较高,但速度较慢。
在数据脱敏中,根据具体需求选择合适的加密算法进行数据加密,以保护数据的安全性。
2. 脱敏方法脱敏方法是指对敏感数据进行转换或者修改,以保护数据的隐私性。
常见的脱敏方法包括:- 替换:将敏感数据替换为不敏感的数据,如将姓名替换为"**"。
- 脱敏规则:根据特定规则对敏感数据进行转换,如将手机号码的前三位和后四位保留,中间数字用"****"代替。
- 数据扰动:对敏感数据进行随机扰动,如对年龄进行加减法运算,使得原始数据无法被还原。
- 数据泛化:将具体的敏感数据转换为更普通的数据,如将具体的地址转换为城市名称。
3. 脱敏策略脱敏策略是指根据数据的敏感程度和使用场景制定的数据脱敏规则。
在制定脱敏策略时,需要考虑以下因素:- 敏感程度:不同类型的数据具有不同的敏感程度,如个人身份证号比姓名更为敏感。
根据数据的敏感程度,制定不同的脱敏规则。
- 使用场景:不同的使用场景对数据的脱敏要求也不同,如数据分析场景对数据的脱敏要求较低,而数据共享场景对数据的脱敏要求较高。
根据使用场景,制定相应的脱敏策略。
4. 脱敏工具和平台为了方便实施数据脱敏,可以使用一些脱敏工具和平台。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术概述:大数据平台的快速发展和广泛应用,给数据隐私和安全带来了新的挑战。
为了保护敏感数据的隐私,数据脱敏成为了一项关键技术。
本文将介绍大数据平台数据脱敏的关键技术,包括数据分类、脱敏算法、脱敏策略以及脱敏效果评估等方面。
一、数据分类:在进行数据脱敏之前,首先需要对数据进行分类。
常见的数据分类包括个人身份信息、财务数据、医疗健康数据等。
根据不同的数据分类,可以采用不同的脱敏算法和策略。
二、脱敏算法:1. 替换算法:将敏感数据替换为符合规则的虚拟数据。
例如,将手机号码替换为随机生成的虚拟手机号码。
2. 加密算法:对敏感数据进行加密处理,只有授权的用户才能解密。
常用的加密算法包括AES、RSA等。
3. 掩码算法:对敏感数据进行部分隐藏,只显示部分信息。
例如,将银行卡号的前几位和后几位显示,中间部分用*代替。
4. 混淆算法:对敏感数据进行乱序处理,使其难以还原。
例如,将姓名的字母顺序打乱。
三、脱敏策略:1. 全局脱敏:对整个数据集进行脱敏处理,适用于不需要保留原始数据的场景。
2. 部分脱敏:只对敏感数据进行脱敏处理,保留非敏感数据的原始值。
适用于需要保留数据结构和分析需求的场景。
3. 动态脱敏:根据用户权限和需求,动态选择脱敏策略。
例如,管理员可以查看原始数据,而普通用户只能查看脱敏后的数据。
四、脱敏效果评估:脱敏后的数据需要经过效果评估,以确保脱敏后的数据仍能满足分析和应用需求,同时保护了隐私。
评估方法包括:1. 数据可用性评估:评估脱敏后数据的可用性,是否满足分析和应用需求。
2. 隐私保护评估:评估脱敏后数据的隐私保护程度,是否能有效保护敏感信息。
3. 数据质量评估:评估脱敏后数据的质量,包括准确性、完整性等指标。
五、应用案例:1. 金融行业:对客户的财务数据进行脱敏,保护客户隐私,同时满足风险评估和数据分析需求。
2. 医疗健康行业:对患者的个人身份信息和病历数据进行脱敏,保护患者隐私,同时支持医疗研究和数据挖掘。
大数据平台数据脱敏关键技术
受重视 ,相 关企业和部 门也应该 重视 用户的隐 私安全 ,使得双方实现共赢 ,取得更大的利益 。
2 . 2 当前 的数 据 安 全 防 护 手 段
行 特 别 制 定 以 实 现 脱 敏 过 程 的方 法 。 脱 敏 规 范
指在 脱敏 过程中必须遵循 的规 范和法 则, 以便
于 安 全和 管 理 。 脱 敏 方 法 是 指 用 户 之 间进 行 敏
是 我 们 应 该 思 考 的 问 题 。现 如 今 企 业 收 集 信 息
数 据脱 敏在 进行 敏感 信 息 的交换 的 同时 还需要保 留原始的特征条件 ,只有 管理人员或 者授权 的用户才 有权限在知道 的情况 下,进行 统计访 问数据 的情况。 以便达到保护 数据在分 享和使用 时的安全性 。数据脱敏 可以在保证安 全性 的前 提下,使得用户使用 范围不断扩展 , 所 以说数据 脱敏是大数据环境 下最有效对数据 的保护办法 。
3 . 1脱 敏 目标 确 认
守 的 。 在 脱 敏 过 程 中最 重 要 的 是 脱 敏 方 法 ,其
可以分为可恢复和不可恢复两 类,脱敏方法也
是脱敏过程中的难点 。
3 . 3 数 据 脱 敏 实现
安全 审计等 。其 中对称 和非对称加密是指 :把 原来可解读 的明文加密 成为不可读的乱码 ,从 而实现用户信息不被盗取 的 目的。 访 问控制捣 根据 数据模型 以及用户 角色模 型 ,在数据库被 查询 时进行分析 ,若有 问题可 以阻断查询 以达 到对敏感信 息的保 护。安全审计是指 :对数 据 时刻进行监控 ,访 问时间和访 问记录进 行详细
类型 以及使用场 景等不 同的需求 ,更好 的保护 敏感隐私 的安全性 以及 人们 的使用需求 。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术一、背景介绍在大数据时代,数据安全和隐私保护是亟待解决的重要问题。
大数据平台中包含着大量敏感信息,如个人身份信息、银行账号等,如果这些数据泄露或者被滥用,将对个人和企业造成巨大的损失。
因此,数据脱敏技术成为保护数据安全和隐私的重要手段。
本文将详细介绍大数据平台数据脱敏的关键技术。
二、数据脱敏技术的定义和作用数据脱敏是指将敏感数据中的关键信息替换为虚拟数据或者经过加密处理的数据,以保护数据的隐私和安全。
数据脱敏技术在大数据平台中起到以下作用:1. 保护个人隐私:通过脱敏技术,可以有效隐藏个人身份信息,保护用户隐私。
2. 遵守法律法规:数据脱敏可以匡助企业遵守相关的法律法规,如个人信息保护法等。
3. 降低数据泄露风险:脱敏后的数据即使泄露,也无法还原出原始数据,从而降低了数据泄露的风险。
三、数据脱敏的关键技术1. 哈希算法哈希算法是一种将任意长度的数据映射为固定长度哈希值的算法。
在数据脱敏中,可以使用哈希算法将敏感数据转换为不可逆的哈希值,从而保护数据的隐私。
常用的哈希算法有MD5、SHA-1等。
2. 加密算法加密算法是将原始数据通过密钥进行加密,惟独拥有正确密钥的人材干解密还原出原始数据。
在数据脱敏中,可以使用对称加密算法或者非对称加密算法对敏感数据进行加密处理。
常用的对称加密算法有AES、DES等,非对称加密算法有RSA等。
3. 脱敏规则脱敏规则是根据数据类型和数据需求制定的一系列规则,用于指导数据脱敏的具体操作。
常见的脱敏规则包括:- 随机替换:将敏感数据随机替换为虚拟数据,如将手机号码替换为随机生成的手机号码。
- 掩码处理:对敏感数据进行部份隐藏,如将银行卡号的前几位显示,后几位用星号代替。
- 字段删除:删除敏感字段,如删除身份证号码字段。
- 数据截断:对敏感数据进行截断处理,只保留部份信息,如只保留姓名的首字母。
4. 脱敏策略脱敏策略是根据具体业务需求和法律法规制定的数据脱敏方案。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术引言概述:随着大数据时代的到来,数据安全和隐私保护成为了亟待解决的问题。
大数据平台数据脱敏技术应运而生,它可以在保证数据可用性的同时,保护用户的隐私和敏感信息。
本文将重点介绍大数据平台数据脱敏的关键技术。
一、数据脱敏技术的概述1.1 数据脱敏的定义数据脱敏是指将敏感数据中的关键信息进行修改或者删除,使其不再能够被识别和关联到个人身份或敏感信息。
1.2 数据脱敏的目的数据脱敏的目的是保护用户隐私和敏感信息,防止数据泄露和滥用。
同时,数据脱敏也可以帮助企业满足法律法规对于个人隐私和敏感信息的保护要求。
1.3 数据脱敏的分类数据脱敏可以根据脱敏程度的不同分为多个层次,包括完全脱敏、部分脱敏和不可逆脱敏等。
根据脱敏的方法不同,可以分为替换脱敏、删除脱敏和加密脱敏等。
二、数据脱敏的关键技术2.1 数据脱敏的策略选择在进行数据脱敏之前,需要根据数据的特点和保护要求选择合适的脱敏策略。
常见的脱敏策略包括全局脱敏、字段脱敏和规则脱敏等。
2.2 数据脱敏的算法技术数据脱敏算法是实现数据脱敏的核心技术。
常用的数据脱敏算法包括基于规则的脱敏算法、基于模板的脱敏算法和基于加密的脱敏算法等。
2.3 数据脱敏的安全保障数据脱敏过程中需要保证数据的安全性,防止脱敏后的数据被重新识别和关联。
安全保障措施包括数据加密、访问控制和审计日志等。
三、数据脱敏的实施方法3.1 数据脱敏的流程数据脱敏的实施需要按照一定的流程进行,包括数据收集、数据分类、脱敏策略选择、脱敏算法实施和脱敏效果评估等。
3.2 数据脱敏的工具支持为了方便实施数据脱敏,可以使用一些专门的数据脱敏工具。
这些工具可以提供脱敏策略的配置、脱敏算法的实现和脱敏效果的评估等功能。
3.3 数据脱敏的效果评估数据脱敏后需要对脱敏效果进行评估,确保脱敏后的数据仍然具有可用性和准确性,同时保护了用户的隐私和敏感信息。
四、数据脱敏的应用场景4.1 金融行业金融行业涉及大量的个人隐私和敏感信息,数据脱敏技术可以保护用户的隐私,同时满足监管要求。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术一、引言随着大数据应用的不断发展,数据安全和隐私保护变得特别重要。
在大数据平台中,数据脱敏是一项关键技术,用于保护敏感数据的隐私性和机密性。
本文将介绍大数据平台数据脱敏的关键技术,并详细解释每种技术的原理和应用场景。
二、数据脱敏的概念和目的数据脱敏是指对敏感数据进行处理,使其在保持数据完整性和可用性的同时,去除或者替换敏感信息,以保护数据的隐私性和机密性。
数据脱敏的目的是防止未经授权的人员获取敏感数据并滥用。
三、数据脱敏的关键技术1. 哈希算法哈希算法是一种将任意长度的数据映射为固定长度散列值的算法。
在数据脱敏中,哈希算法可以将敏感数据转换为不可逆的散列值,从而保护数据的隐私性。
常用的哈希算法有MD5、SHA-1等。
2. 加密算法加密算法使用密钥将明文数据转换为密文数据,惟独掌握正确密钥的人材干解密密文数据。
在数据脱敏中,加密算法可以对敏感数据进行加密处理,保护数据的隐私性。
常用的加密算法有AES、DES等。
3. 脱敏规则脱敏规则是一种根据数据的特定格式和规则对数据进行转换或者替换的方法。
例如,将手机号码的中间四位替换为星号,将身份证号码的前六位和后四位替换为星号等。
脱敏规则可以保护敏感数据的隐私性,同时保持数据的格式和结构。
4. 伪造数据伪造数据是指根据敏感数据的特点和分布规律生成与原始数据相似但不包含真实信息的数据。
例如,根据用户的购物记录生成具有相似购买行为的虚拟用户数据。
伪造数据可以用于保护敏感数据的隐私性,同时保持数据的可用性和完整性。
5. 数据屏蔽数据屏蔽是指将敏感数据从源数据中删除或者隐藏,只保留非敏感信息。
例如,在日志数据中屏蔽用户的姓名、地址等敏感信息。
数据屏蔽可以保护敏感数据的隐私性,同时保持数据的可用性和完整性。
四、数据脱敏的应用场景1. 数据共享在跨组织或者跨部门共享数据时,为了保护数据的隐私性,可以对敏感数据进行脱敏处理。
例如,在医疗领域,医院可以将患者的病历数据脱敏后与其他医院共享,以促进医疗研究和合作。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术一、引言随着大数据时代的到来,大数据平台的应用越来越广泛。
然而,随之而来的是对数据隐私和安全的关注。
为了保护用户的隐私和敏感信息,数据脱敏成为了大数据平台中的关键技术之一。
本文将详细介绍大数据平台数据脱敏的关键技术和标准格式。
二、数据脱敏的定义和目的数据脱敏是指对敏感数据进行处理,使其无法直接或者间接地识别出个人身份或者敏感信息。
其目的是保护数据的隐私和安全,同时确保数据的可用性和价值。
三、数据脱敏的关键技术1. 哈希算法哈希算法是一种将任意长度的数据映射为固定长度哈希值的算法。
在数据脱敏中,可以使用哈希算法对敏感字段进行替换,以达到隐藏原始数据的目的。
常用的哈希算法有MD5、SHA-1等。
2. 加密算法加密算法是将明文数据通过特定的密钥转化为密文的算法。
数据脱敏中,可以使用加密算法对敏感数据进行加密,惟独拥有密钥的人材干解密得到原始数据。
常用的加密算法有AES、RSA等。
3. 脱敏规则脱敏规则是指根据具体需求制定的数据脱敏策略。
脱敏规则可以包括对字段的替换、截取、掩码等操作。
例如,对手机号码进行脱敏时,可以将中间四位数字替换为星号。
4. 保留数据关联性在数据脱敏过程中,需要保留数据之间的关联性,以确保数据的可用性和价值。
例如,在脱敏过程中,可以对多个字段进行联合脱敏,保持数据之间的关联关系。
5. 数据脱敏的层级数据脱敏可以根据不同的需求和场景进行层级划分。
常见的层级包括全局层级、应用层级和用户层级。
全局层级是对整个数据集进行脱敏,应用层级是对特定应用的数据进行脱敏,用户层级是对特定用户的数据进行脱敏。
四、数据脱敏的标准格式数据脱敏的标准格式可以按照以下结构进行编写:1. 引言:对数据脱敏的定义和目的进行简要介绍。
2. 技术介绍:详细介绍数据脱敏的关键技术,包括哈希算法、加密算法、脱敏规则、保留数据关联性和数据脱敏的层级等。
3. 实施步骤:描述数据脱敏的实施步骤,包括数据预处理、选择合适的脱敏技术、制定脱敏规则、实施脱敏和验证脱敏效果等。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术一、引言随着大数据时代的到来,大数据平台的应用越来越广泛。
然而,大数据平台所处理的数据往往包含大量的敏感信息,如个人身份信息、银行账号等,这些数据的泄露可能会带来严重的隐私和安全问题。
因此,对大数据平台中的敏感数据进行脱敏处理是非常重要的。
本文将介绍大数据平台数据脱敏的关键技术。
二、数据脱敏的概念数据脱敏是指对敏感数据进行一系列的处理,使其在保持数据格式和结构的同时,去除或者替换掉敏感信息,以保护数据的隐私和安全。
数据脱敏的目标是在不影响数据的可用性和分析结果的准确性的前提下,最大限度地保护数据的隐私。
三、数据脱敏的关键技术1. 哈希算法哈希算法是一种将任意长度的数据映射为固定长度哈希值的算法。
在数据脱敏中,可以使用哈希算法对敏感数据进行脱敏处理。
具体做法是将原始数据通过哈希算法转换为哈希值,然后将哈希值替换原始数据。
由于哈希算法是不可逆的,即无法从哈希值还原出原始数据,因此可以保护数据的隐私。
2. 加密算法加密算法是将明文数据转换为密文数据的算法。
在数据脱敏中,可以使用加密算法对敏感数据进行脱敏处理。
具体做法是将原始数据通过加密算法加密,然后将密文数据替换原始数据。
惟独拥有解密密钥的人材干将密文还原为明文,因此可以保护数据的隐私。
3. 替换算法替换算法是将敏感数据替换为特定的符号或者伪造的数据的算法。
在数据脱敏中,可以使用替换算法对敏感数据进行脱敏处理。
具体做法是将原始数据中的敏感信息替换为符号或者伪造的数据。
例如,将身份证号码中的数字替换为星号,将姓名替换为随机生成的姓名等。
4. 数据掩码数据掩码是一种将敏感数据部份隐藏起来的算法。
在数据脱敏中,可以使用数据掩码对敏感数据进行脱敏处理。
具体做法是将敏感数据的一部份用特定的符号或者伪造的数据进行覆盖,只显示部份数据。
例如,将手机号码的后四位用星号掩盖,只显示前面的几位数字。
5. 混淆算法混淆算法是一种通过对数据进行扰动来保护数据隐私的算法。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术在当今数字化时代,数据已成为企业和组织的重要资产。
然而,随着数据的大量收集、存储和分析,数据隐私和安全问题日益凸显。
为了保护敏感信息,确保数据在使用和共享过程中的安全性,数据脱敏技术应运而生。
大数据平台中的数据脱敏是一项至关重要的任务,它涉及一系列关键技术,以在不影响数据可用性的前提下,对敏感数据进行有效的保护和处理。
数据脱敏,简单来说,就是对原始数据中的敏感信息进行处理,使其变得不可识别或难以理解,同时保持数据的原有特征和可用性。
这对于满足合规要求、保护用户隐私以及防止数据泄露具有重要意义。
在大数据平台中,常见的数据脱敏技术包括以下几种:1、替换替换是一种常见的数据脱敏方法,即将敏感数据中的部分或全部内容用其他值进行替换。
例如,将手机号码中的中间几位数字用“”号代替,或者将姓名用随机生成的字符串替换。
这种方法简单直接,但需要注意的是,替换后的数据应具有一定的随机性和不可预测性,以防止通过推理或猜测恢复原始数据。
2、加密加密是一种通过数学算法将原始数据转换为密文的技术。
只有拥有正确的密钥才能将密文解密为原始数据。
在大数据平台中,可以对敏感字段进行加密处理,从而在数据存储和传输过程中保护其安全性。
然而,加密和解密过程可能会带来一定的性能开销,因此需要在安全性和性能之间进行权衡。
3、掩码掩码技术类似于替换,但它通常是按照一定的规则对敏感数据的部分内容进行隐藏。
例如,只显示身份证号码的前几位和后几位,中间用“X”代替。
掩码可以保持数据的格式和部分特征,同时隐藏关键信息。
4、随机化随机化是指通过随机生成的数据来替换原始的敏感数据。
例如,对于年龄这样的数值型数据,可以在一定范围内生成随机值来代替真实的年龄。
随机化可以有效地破坏数据的原始相关性,但需要注意生成的数据应符合业务逻辑和数据分布。
5、泛化泛化是将具体的敏感数据转换为更宽泛、更抽象的类别或范围。
比如,将具体的地址转换为城市级别或区域范围,将精确的收入值转换为收入区间。
大数据平台数据脱敏关键技术
大数据平台数据脱敏关键技术一、背景介绍随着大数据技术的快速发展和广泛应用,数据脱敏技术成为保护敏感数据安全和隐私的重要手段。
大数据平台数据脱敏关键技术旨在保护数据的隐私性和机密性,同时保持数据的可用性和完整性。
本文将详细介绍大数据平台数据脱敏的关键技术和方法。
二、数据脱敏的定义和目的数据脱敏是指在保持数据可用性的前提下,对敏感信息进行处理,使其无法被识别和关联到个人或实体。
数据脱敏的目的是保护个人隐私和敏感信息,防止数据泄露和滥用。
在大数据平台中,数据脱敏是确保数据安全的重要环节。
三、数据脱敏的关键技术1. 数据分类和敏感度分级数据分类是将数据按照敏感程度进行划分的过程,常见的分类包括个人身份信息、金融数据、医疗健康数据等。
敏感度分级是根据数据的敏感程度进行评估和划分,常见的分级包括高、中、低三个级别。
通过数据分类和敏感度分级,可以为后续的脱敏操作提供指导和依据。
2. 数据脱敏算法数据脱敏算法是实现数据脱敏的核心技术。
常见的数据脱敏算法包括替换、加密、删除、扰乱等。
替换算法是将敏感数据替换为虚拟数据,如将真实姓名替换为随机生成的姓名;加密算法是对敏感数据进行加密处理,只有授权用户才能解密;删除算法是将敏感数据直接删除,保留其他非敏感数据;扰乱算法是对敏感数据进行随机化处理,使其无法被还原。
3. 脱敏规则和策略脱敏规则和策略是指根据数据分类和敏感度分级,制定相应的脱敏规则和策略。
脱敏规则是指对不同类型的敏感数据采取不同的脱敏算法和处理方式;脱敏策略是指对整体数据集合进行脱敏处理的方式和顺序。
通过制定合理的脱敏规则和策略,可以确保数据脱敏的效果和可用性。
4. 数据脱敏工具和平台数据脱敏工具和平台是为了方便用户进行数据脱敏操作而设计和开发的软件工具和平台。
数据脱敏工具和平台提供了丰富的脱敏算法和处理方式,同时支持用户自定义脱敏规则和策略。
通过使用数据脱敏工具和平台,用户可以快速、高效地完成数据脱敏操作。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据平台数据脱敏关键技术
作者:周海涛
来源:《电子技术与软件工程》2017年第21期
摘要随着社会的进步,我们逐渐的步入了大数据时代。
大数据带给了我们巨大的商业价值,但也有很大的隐患,比如隐私问题、信息保护等方面。
大数据的安全问题在于如何在实现数据共享,分享信息的同时保护人们的隐私和敏感问题不被泄露,这正是大数据中安全保护的棘手问题。
而脱敏技术正是一个通过对技术和机制的研究,不断的创新来保护用户在共享和使用中出现的问题。
数据脱敏可以在用户之间交流共享时保护人们的敏感隐私信息。
本文是对在大数据环境下数据脱敏的作用以及出现的问题进行分析和研究,促进人们对其了解和认识。
【关键词】大数据安全数据脱敏信息安全数据隐私
1 概述
我国上层经济与信息技术的不断发展,带动了数据的不断增长,数据已经成为国家发展中不可缺少的一部分。
现如今,我们已经迈步到了大数据时代,大数据带给我们方便的同时也存在很多的危险。
因此,如何在大数据中方便人们的同时更好的保护人们的敏感隐私信息是我们应该思考的问题。
现如今企业收集信息越来越多,到面临的信息泄露问题也越来越严峻。
各行业中包含的信息非常敏感和重要,一旦泄露会带给社会甚至国家不可弥补的损失,因此投资大数据对于敏感信息的安全技术必不可少,在第十三个五年规划中有提到“实施国家大数据战略,推动数据资源开放共享”,这说明了大数据安全的保护问题非常重要。
如何在各行业各用户进行交换使用的过程中不再造成敏感信息泄露,达到大数据不是看似安全而是非常安全,这是数据产生者和管理者都非常关心的问题。
2 数据脱敏的动机
2.1 敏感数据的安全风险
敏感数据也称为隐私数据,其中包括用户的姓名、电话、身份证号、银行卡号、个人信息等等。
这些都是与人们的生活和工作息息相关的,一旦泄露会造成巨大的损失。
这些信息都收到不同行业和国家的管制,如果泄露也会造成用户信用问题,财务和法律方面也会有很大影响。
随着大数据在人们的生活中越来越受重视,相关企业和部门也应该重视用户的隐私安全,使得双方实现共赢,取得更大的利益。
2.2 当前的数据安全防护手段
由于数据越来越融入人们的生活,信息安全的重要性也不言而喻,而数据安全则是信息安全的重要一方面。
就目前来说,数据安全的防护手段有:对称和非对称加密;访问控制;安全审计等。
其中对称和非对称加密是指:把原来可解读的明文加密成为不可读的乱码,从而实现用户信息不被盗取的目的。
访问控制指:根据数据模型以及用户角色模型,在数据库被查询时进行分析,若有问题可以阻断查询以达到对敏感信息的保护。
安全审计是指:对数据时刻进行监控,访问时间和访问记录进行详细的记录,通过检测和分析对敏感信息达到保护作用。
这些保护措施在不同领域都有一定的作用,但也存在一些缺陷,没办法对敏感信息更好的保护。
2.3 数据脱敏原理
数据脱敏在进行敏感信息的交换的同时还需要保留原始的特征条件,只有管理人员或者授权的用户才有权限在知道的情况下,进行统计访问数据的情况。
以便达到保护数据在分享和使用时的安全性。
数据脱敏可以在保证安全性的前提下,使得用户使用范围不断扩展,所以说数据脱敏是大数据环境下最有效对数据的保护办法。
3 数据脱敏过程
3.1 脱敏目标确认
不同企业对数据脱敏的目标制定也有所不同,因为数据脱敏会造成一定的业务开销,运行和维护也需要成本,所以不同的企业应该根据企业中不同的的需要而制定不同的数据脱敏目标。
数据敏感程度的分级和确认可以说是数据脱敏目标中较为重要的一部分,其中包括确定原始数据中的敏感程度,脱敏数据在以后得使用中的可用程度等等。
作为脱敏数据的依据有敏感信息字段、敏感信息名称、敏感级别、类型等等,这些都需要在使用过程中一一确定,为用户更好的服务。
3.2 脱敏策略制订
所谓脱敏策论是指在脱敏中的一系列规则、规范、方法、限制等的统称。
脱敏规则是指:通过数据和用户的全局以及个别配置,进行特别制定以实现脱敏过程的方法。
脱敏规范指在脱敏过程中必须遵循的规范和法则,以便于安全和管理。
脱敏方法是指用户之间进行敏感交换是的运算方法以及流程。
脱敏限制是指在脱敏过程中收到的限制和约束,这是必须遵守的。
在脱敏过程中最重要的是脱敏方法,其可以分为可恢复和不可恢复两类,脱敏方法也是脱敏过程中的难点。
3.3 数据脱敏实现
数据脱敏可以分为静态数据脱敏和动态数据脱敏,这是以不同的作用位置和实现原理而划分的。
随着数据脱敏应用领悟的不同(从非生产系统到生产系统)从业的技术也逐渐不同(从
SDM到SDM/DDM并重)。
对于这两类的实现机制来说,都有着各自的优点和缺点,这两类都不能对大数据中数据脱敏进行应对。
因此,需要设计更合理的系统框架以及脱敏方法,已达到分析大数据环境中人们对敏感数据类型以及使用场景等不同的需求,更好的保护敏感隐私的安全性以及人们的使用需求。
4 结语
在如今的大数据时代,数据脱敏是各企业运行管理必不可少的因素。
随着社会的不断发展,数据脱敏必然会更加精准的满足用户的需求,数据脱敏将会拥有更高的准确性、更好的自动化程度和更好的抗盗取能力以及更强的拓展能力。
可以更好的满足用户之间的分享信息以及共享交流,更好的保护各企业中的隐私信息和用户之间的敏感信息,多领域的满足各行各业的不同需求。
参考文献
[1]姜日敏.电信运营商数据脱敏系统建设方案探讨[J].信息科技,2014(08).
[2]刘明辉,张尼,张云勇等.云环境下的敏感数据保护技术研究[J].电信科学,2014(11).
作者简介
周海涛(1981-),男,湖北省襄阳市人。
硕士研究生。
研究方向为信息安全、数据治理。
作者单位
北京普元云动科技有限公司北京市 100080。