移动互联网用户隐私信息检测保护技术研究及应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
移动互联网用户隐私信息检测保护技术研究及应用
许家乐,乔喆,王晓晴,李斐
(中国移动通信集团公司信息安全管理与运行中心,北京 100053)
摘 要 智能终端及应用作为“大连接”中的重要节点和业务载体,直接或间接接触大量用户敏感隐私信息。
近年
来,APP强制授权、过度索权和超范围收集个人信息的现象大量存在,违法违规使用个人信息的问题十分突出,用户隐私泄露的情况愈演愈烈,安全及隐私问题引发社会广泛关注。
本文根据不同源头的APP隐私安全风险全面梳理排查,创新提出“静态权限检测+动态行为特征+网络DPI智能分析”的隐私信息检测防护技术体系,实现了敏感权限智能分析、违规索权动态监控、隐私泄露探测预警和敏感信息深度追踪,确保移动应用APP安全、可信、可控,保障了业务单位和用户隐私安全权益。
关键词 APP隐私安全;用户隐私检测;敏感信息防护;移动互联网安全;大连接数据安全中图分类号 TN918 文献标识码 A 文章编号 1008-5599(2019)12-0012-06
收稿日期:2019-11-21
“大连接”IT 环境下,APP 已成为业务的主要入口,移动终端、物联网、智慧家庭和5G 等新型智能设备广泛应用。
随着APP 对用户服务的深入,智能终端及应用内保存的个人隐私信息愈加丰富,用户隐私泄露的情况愈演愈烈。
2018年8月中国消费者协会发布的《APP 个人信息泄露情况调查报告》显示,67.2%的受访者认为APP 在自身功能不必要的情况下获取用户隐私权限。
报告显示,移动社交及网购类APP 调用定位权限占比高达96.7%,移动视频、网购类APP 调用通讯录占比分别高达86.7%和80.0%。
APP 强制授权、过度索权和超范围收集个人信息的现象大量存在,违法违规使用个人信息的问题十分突出,安全及隐私问题引发社会广泛关注。
1 APP 用户隐私保护需求分析
1.1 APP 用户隐私保护威胁分析
(1)APP 过度索权现象普遍存在:用户通常在无意识或无感知情况下泄露了个人敏感隐私数据。
(2)强制授权行为屡禁不止:媒体报道,多款热门APP 在安装时强制要求用户授权读取手机号、通话记录、设备信息、拨打电话、发送短信等极度敏感隐私权限,出现“不授权不给用”的流氓行为和霸王条款,严重侵害了用户个人隐私权益。
2018年中国消费者协会对百款主流APP 进行隐私安全评测,有47款不达标。
(3)隐私泄露成网络诈骗犯罪祸首:数据显示,我国手机网民规模达7.88亿,我国市场上监测到的APP
在架数量为415万款,近年来因个人隐私信息被违规采集和泛滥使用,使得用户饱受垃圾短信和骚扰电话的困扰,网民反应强烈。
隐私信息贩卖到网络进行诈骗已形成规模惊人的地下黑产链条,不法分子及恶意软件通过窃取用户隐私信息实施精准诈骗,支付盗刷、监控跟踪、恶意推销等违法犯罪活动不断发生,对网络生态和社会稳定造成恶劣影响。
1.2 APP用户隐私保护需求分析
鉴于当前移动互联网快速发展及面临的严峻安全形势,APP用户隐私保护需求日趋强烈,主要的安全需求动力概括有以下3个方面。
1.2.1 国家及相关部委安全监管要求
近年来我国提出国家网络空间安全战略,对网络信息安全治理提出更高要求和目标,《中华人民共和国网络安全法》中更是明确了企业、运营商在提供移动互联网服务过程中的安全责任和义务及公民的网络安全权益。
2019年1月,中央网信办、工业和信息化部等四部委联合开展了“关于APP违法违规收集使用个人信息”专项治理行动,先后下发了多项管理规定,要求运营商加强自有及合作APP各环节隐私安全风险防控,全面构建移动互联网应用健康生态环境。
1.2.2 运营商保护用户隐私的社会责任需求
移动互联网业务运营企业为保障用户合法利益、维护企业口碑形象、承担社会安全责任等,对APP用户隐私保护需求日趋强烈,投入逐年增加,一方面满足政策法规和行业标准,另一方面运营商为保护用户个人隐私方面的社会责任日益突出。
1.2.3 普通用户安全权益诉求
普通用户作为智能终端的拥有者和APP业务受众者,希望个人隐私、数字财产和敏感信息等合法的网络信息安全权益得到切实有效地保障,可以享用绿色网络环境。
随着媒体报道和各类公益宣传,普通用户对APP 用户隐私保护要求日渐提高。
2 移动互联网用户隐私信息检测保护关键技
术研究及应用
为构建移动互联网用户隐私安全防护体系,中国移动信安中心和卓望公司联合开展研究,对中国移动 “自有APP、合作APP、商城APP”等不同源头的APP隐私安全风险全面梳理排查,创新提出“静态权限检测+动态行为特征+网络DPI智能分析”的隐私信息检测防护技术体系,自主研发移动互联网用户隐私信息检测保护平台,关键技术经过在中国移动终端公司等单位试点应用,实现了敏感权限智能分析、违规索权动态监控、隐私泄露探测预警和敏感信息深度追踪,确保公司自有及合作APP安全、可信、可控。
2.1 构建移动互联网用户隐私新型防护体系
针对APP强制授权、过度索权和超范围收集个人信息的严峻形势,为突破传统治理模式下被动应对、疲于救火的局面,本技术创新构建了移动互联网用户隐私信息检测防护体系,如图1所示。
本体系基于核心技术构建了APP隐私信息全链条安全防线,基于C2E模式实现云管控、管监控与端防护的有机协同。
该技术创新采用全流程、多控制点和云端联动保护模式,自主打造“静态检测+动态监控+网络探测”三重核心安全能力,灵活部署,可扩展性强。
(1) 基于静态申明标识识别、权限API调用识别和应用分类权限推荐特征库关联分析,高效发现过度授权和敏感API等风险。
通过12省试点,不断积累特征库数据,针对发现的新问题进行专门分析和总结,当前APP隐私合规使用率提升至100%。
(2) 基于APP安全测试床技术,动态监测APP运行过程中的函数调用和文件读写等情况,配合自动审核隐私文本技术,进一步保护隐私数据。
(3) 通过手机安全沙箱构建APP DPI环境,发现APP在网络传输过程中的隐私安全问题,重点关注跨境信息传送行为。
(4) 为避免APP 在检测阶段与上线后分发到渠道下载时隐私行为不一致,在应用发布时增加了敏感权限申请,我们通过“网络爬虫+应用相似度识别”技术,从各主流APP 发布渠道下载最新发布的APP,与已检测过的APP 进行相似度分析,对已发现的相关应用做隐私行为检测。
(5) 创新研发便携式安全工具箱,加强基层营业厅的应用检测手段,支持Android、iOS 等主流智能终端系统的检测,填补各运营单位APP 隐私安全自评估及应急处置工具空白,实现安全能力在一线的标准化推广。
(6) 为管理单位提供移动互联网用户隐私信息检测保护平台,聚合核心能力,与工具箱实现云端联动安全防护新模式,全网自有APP 隐私安全率提升23.6%,问题整改率达100%。
2.2 基于“申—调—聚合”的多维度非必要权限自动检
测发现技术
为全面、高效地检测APP 过度索权风险,提出“申(权限申明)—调(权限API 调用)—聚合(配置、代码、分类)”的多维度、跨平台(Android、iOS)的非必要
权限检测发现模型,包括如下。
(1)权限申明检测:分析APP 权限配置文件中已申请权限列表,识别出敏感清单,形成权限申请矩阵表。
(2)权限调用分析:基于代码逆向技术,获取被测APP 关键源码中的函数调用关系,检索与相应权限相关的API 及敏感行为API,生成基于平衡二叉树结构的敏感调用关系路径。
(3)聚合关联发现过度索权风险:通过多维综合分析和模式识别,发现申明后未使用的权限、违规调用的权限、敏感API 滥用情况和不必要权限申请等4大类隐私风险。
该技术构建基于权限调用关系链的隐私特征识别路径和风险决策树,形成高效的过度索权风险自动评测能力,如图2所示。
运用本技术,在试点应用期间,累计发现867款APP 的1 345个隐私安全风险,隐私权限风险识别效率较传统手工模式提升11.5倍。
2.3 基于动态行为深度关联的隐私滥用监测技术
为解决监测APP 运行过程中可能存在隐私滥用和违规行为等风险,提出基于动态行为深度关联的隐私滥用监测技术模型。
首先通过自研的APP
安全测试床技术,
图1 APP隐私信息安全防护体系
将待测应用镜像装载到监测环境,然后在APP 运行过程中通过随机拨测或模拟操作的方式驱动应用功能及界面切换,后台监控权限调用、文件读写、数据库操作、动态加载、敏感API 调用等操作行为和过程数据,基于智能算法模型和平台风险特征库,准确识别APP 在运行过程中的权限滥用、违规行为和本地敏感数据操作泄露等安全风险。
配合人工检测功能,检测人员在监测环境中操作被
检测应用,提取应用的隐私说明部分,如图3所示,根据检测项提示和实际情况判断应用是否符合规范要求。
点击“提取隐私文本”按钮可将当前页面隐私文本提取至工具箱或PC
端操作界面。
每个检测项后台匹配相关关键字,对隐私文本中的关键字进行突出提示,如图
4所示。
2.4 基于APP DPI 的敏感数据泄露追踪技术
用户隐私泄露不仅在APP 安装、运行和本地存储
图2 APP多维度非必要权限检测分析流程
图3 隐私政策申明合规性检测
阶段发生,更多是在网络通信传输过程中出现敏感信息明文暴露、弱加密、跨境传输和违规透传等泄露风险。
我们创新提出DPI技术应用,通过手机安全沙箱构建APP DPI环境,在APP运行过程中对网络通信数据分组进行深度解析分析,基于启发式规则引擎和安全特征库,将APP后台行为与通信数据关联分析,实现泄露链深度追踪,如图5所示。
该技术创新提出APP DPI技术的轻量化应用,基于移动终端安全沙箱技术,实现对APP运行过程中网络行为和数据分组还原及深度追踪分析,探测APP通信传输过程中存在的明文泄露、违规透传和不安全协议等风险。
构建“权限+行为+通信”的全链条隐私检测防护技术体系。
通过自动化测试技术,辅助人工测试手段,在监测环境中操作被检测应用,试用软件核心功能,监控软件捕捉IP地址并上传隐私检测工具后台,工具自动判断是否境外IP,并输出检测结果。
通过对传输信息内容进行关键字匹配分析和语义分析,及时发现应用在信息传输过程中存在的明文泄露和隐私信息透传等违规行为。
2.5 基于渠道监测的APP在线隐私行为追踪技术
为避免APP在检测阶段与上线后分发到渠道下载时隐私行为不一致,在应用发布时增加了敏感权限申请,通过“分布式爬虫+应用相似度识别”技术,在主流APP发布渠道下载最新发布的APP样本,与已检测过的APP进行相似度分析,对已发现的相关应用做隐私行为检测追踪,主要包含如下。
(1)根据应用名称和应用监测关键字,从已爬取的应用表中进行模糊匹配,凡是应用名称和应用介绍信息中包含有已检测正版应用的名称和监测关键字的,都列为匹配对象。
(2)进一步从匹配对象中分析,使用逆向技术手段对应用进行反向解分组,获取爬取应用和待监测正版应
用的进一步信息,包含分组名、签名证书和应用名、主图4 动态行为深度关联应用效果
配置文件、资源文件和反编译的Smali 文件。
(3)进一步进行签名证书匹配,如果应用名称相同、分组名相同且签名证书相同,则该应用为相关应用,纳入后续的隐私追踪检测。
(4)对目标应用进行静态、动态及网络行为检测分析,进行纵向版本维度、横向时间维度的交叉分析,得到其隐私合规轨迹。
3 结束语
用户隐私信息安全问题已引发社会广泛关注,随着移动互联网和物联网等应用场景日益丰富,可接触用户越来越多的敏感信息,新技术和新业务的快速发展对隐私安全管理和技术提出了更高要求。
本文分析了APP 应用过度索权、权限滥用和隐私泄露等问题风险,并针
对性的提出了敏感权限静态检测、动态行为深度关联、隐私泄露监测分析等应对措施和技术手段。
用户隐私信
息安全防护涉及法规监管、业务安全和用户个人信息保护多个层面,因此有必要建设一套完整的纵深防御体系,使得应用监管机构、渠道运营、开发者、业务单位、用户个人相互配合和监督,确保互联网新技术在推动社会发展的同时能够切实保障个人隐私安全权益。
图5 APP DPI技术应用效果
参考文献
[1] 张滨, 袁捷. 移动终端安全关键技术与应用分析[M]. 北京:
人民邮电出版社, 2015.
[2] 李兴新, 侯玉华. 移动互联网时代的智能终端安全[M]. 北
京: 人民邮电出版社, 2016.
[3] 车力军, 黄炎生, 徐丽. 基于智能双驱检测技术的APP一站
式安全监测探索与实践[J]. 电信技术, 2019(4).
[4] 徐小天, 王刚, 陈威, 等. 移动平台应用安全风险与防护方
法研究[J]. 华北电力技术, 2016(10).
[5] 邹煜. 企业级移动应用平台建设与安全保障体系探析[J]. 网
络空间安全, 2016(6).
(下转第22页)
Research on bad speech recognition technology based on acoustic model
DU Gang, ZHU Yan-yun, ZHANG Chen, DU Xue-tao (China Mobile Group Design Institute Co., Ltd., Beijing 100080, China)
Abstract Bad speech recognition technology is an effective means to monitor bad information in high-defi nition
audio and video services. This paper presents a framework for bad speech recognition based on acoustic models. The paper analyzes and describes the implementation methods of three important parts: feature extraction, acoustic model construction and bad speech judgment model. And enumerate the advantages and disadvantages of various methods. It has a high reference value for constructing an efficient bad speech recognition system.
Keywords artifi cial intelligence; speech recognition; acoustic modeling; bad speech recognition
参考文献
[1] 杨鸿武, 周刚. 基于改进混合CTC/attention架构的端到端普通
话语音识别[J]. 西北师范大学学报(自然科学版), 2019(3).[2] 杨胜捷, 朱灏耘, 冯天祥, 等. 基于Kaldi的语音识别算法[J].
电脑知识与技术, 2019(2).
[3] 王毅, 谢娟, 成颖. 结合LSTM和CNN混合架构的深度神经网络
语言模型[J]. 情报学报, 2018(2).
[4] 陈孟元. 基于改进型DTW算法和MFCC的语音识别[J]. 安徽工
程大学学报, 2014(1).
(上接第17页)
Research and application of privacy information detection and protection
technology for mobile internet users
XU Jia-le, QIAO Zhe, WANG Xiao-qing, LI Fei (China Mobile Information Security Center, Beijing 100053, China)
Abstract As an important node and business carrier in "big connection", intelligent terminals and applications have
direct or indirect contact with a large number of users' sensitive privacy information. In recent years, APP forced authorization, excessive claim of rights, and over-range collection of personal information abound. The problem of illegal use of personal information is very prominent. The leakage of users' privacy is getting worse and worse. Security and privacy issues have aroused widespread concern in society. This paper comprehensively sorts out and inspects APP privacy security risks from different sources, and innovatively proposes a privacy information detection and protection technology system of "static permission detection+dynamic behavior characteristics+network DPI intelligent analysis", which realizes sensitive permission intelligent analysis, illegal claim dynamic monitoring, privacy leak detection and early warning, sensitive information depth tracking, ensures mobile application APP to be safe, credible and controllable, and protects the privacy security rights and interests of business units and users.
Keywords APP privacy security; user privacy detection; sensitive information protection; mobile internet security; big
connection data security。