大数据脱敏脱需求文档_v02
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Hbase数据脱敏系统
需求分析
一引言 (1)
1.1 编写目的 (1)
1.2 背景 (1)
1.2.1 需求缘由 (1)
1.2.2 硬件部署环境 (1)
1.2.3 软件部署环境 (1)
1.3 术语定义 (2)
1.4 名词解释 (2)
1.5 参考材料 (2)
二需求描述 (3)
2.1 需求点概述 (3)
2.2 需求点描述 (3)
2.2.1 G-01:下发策略 (4)
2.2.2 G-02:策略管理 (4)
2.2.3 G-03:规则管理 (4)
2.2.4 G-04:敏感信息管理 (5)
2.2.5 G-05:用户管理 (5)
2.2.6 G-06:角色管理 (6)
2.3 产品视图 (6)
2.4 用户特性 (7)
2.5 总体约束 (7)
三功能总结 (8)
3.1 概述 (8)
3.2 功能需求 (10)
3.2.1 F-02-01 用户登录 (10)
3.2.2 F-02-02 用户管理 (11)
3.2.3 F-02-03 角色管理 (11)
3.2.4 F-02-04 策略管理 (12)
3.2.5 F-02-05 规则制定 (13)
3.2.6 F-02-6 操作日志管理 (13)
3.2.7 F-02-7 数据访问日志管理 (14)
........................................................................................................................... 错误!未定义书签。
3.3 接口需要............................................................................................ 错误!未定义书签。
3.4 性能需求 (15)
3.5 质量需求 (15)
四待确认的问题列表 (15)
一引言
1.1 编写目的
为了研发明朝万达Hbase数据脱敏产品,规范产品研发流程,明确Hbase 脱敏产品需求而编写此文档。
1.2 背景
1.2.1 需求缘由
随着大数据时代的到来,大数据中蕴藏的巨大价值得以挖掘,同时也带来了隐私信息保护方面的难题,如何在实现大数据高效共享的同时,保护敏感信息不被泄露,已成为各个行业广泛关注的问题。即需要对敏感信息数据进行保护,防止用户个人私密信息泄露,也需要保证正常的信息共享,为此大数据脱敏系统应运而生。
1.2.2 硬件部署环境
客户环境需要有HBase大数据集群,此外需要提供一台Linux服务器,配置到该集群中,作为本系统的服务器使用。
1.2.3 软件部署环境
HBase数据脱敏系统以软件包(tar包+ jar包)的形式提供给用户。脱敏系统Server端(tar包)部署在服务器上,jar包部署在每个Hbase的节点上。
1.3 术语定义
协处理器:可以对HBase服务添加额外的逻辑处理的软件模块。
数据脱敏: 指对某些敏感信息通过规则进行数据的变形,实现敏感隐私数据的可靠保护,这样就可以在研发、测试和其他非生产环境以及外包环境中安全地使用脱敏后的真实数据集。
脱敏策略:针对数据脱敏时制定的规则。
1.4 名词解释
权限管理员:创建、删除、修改、查询管理员信息,分配管理员角色。本系统初始用户为权限管理员(Admin)。
操作管理员:制定策略、给用户下发策略、制定脱敏规则的管理人员。
审计管理员:审查管理员的操作日志以及业务用户的数据访问日志。
业务用户:业务用户是本系统边界之外的用户,用户信息会被同步到本系统。
1.5 参考材料
<<数据脱敏网关需求规格说明书>>
二需求描述
2.1 需求点概述
●客户可以配置策略,查看策略,修改策略,删除策略, 将策略指定给用户或
用户组,查看某个用户所有的策略,启停某个用户的策略。
●客户可以为某个策略制定一种或多种脱敏规则。
●客户可以查看敏感数据分类分级统计图表,敏感词频,安全评估风险报告。
●支持对指定表、列族、列做脱敏(替换,置空,加密解密)变换。
●客户可以创建新的权限管理员,操作管理员,审计管理员、查看管理员信息、
删除管理员、修改管理员的操作权限。
●所有被脱敏的用户数据访问操作都记录在日志中并可以查询和审计。
●所有管理员的操作日志都记录在日志中并可以查询和审计。
2.2 需求点描述
为了形象的说明需求点,特用以下示意图示进一步说明需求点:
●业务用户是在访问HBase的时候被动受控的角色。操作管理员可以针对不同
业务用户下发不同的管控策略。
●策略元素包含策略名称和数据目标。策略是数据目标和脱敏规则的整体描述。
一个策略是由多个治理规则聚合而成,即:策略= Table.family.column + n* 治理规则。
●治理规则元素包含规则名称,对该字段的操作动作。治理规则是对数据目标
具体操作的描述,即:治理规则= 动作+ 参数,如:(遮蔽后4位,正则替换)。
2.2.1 G-01:下发策略
操作管理员针对业务用户下的符合该用户身份权限的规则,用来屏蔽外部无权用户访问到机密信息。
2.2.2 G-02:策略管理
策略是针对指定HBase表、列族、列制定的不同的数据脱敏规则。操作管理员可以使用策略管理来创建,删除,修改,查询和启停策略。
2.2.3 G-03:规则管理
脱敏规则的组成元素包括名称,治理动作。名称是对该规则的称号;治理动作在本文指脱敏方法。操作管理员使用规则管理功能可以增加,删除,