大数据安全风险与挑战

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
原理:通过互联网传播的公众对现实生活中的某些热点、焦 点问题所持有的较强影响力、倾向性的言论和观点,传播场 所包括论坛、博客、新闻跟帖、转帖、微博等 原理:开放性、时效性、互动性、多元性、突发性、个性化、 群体极性、揭露问题、批判现实
万千气象:感受数据之大
2 大数据舆情监测的挑战
大数据采集和处理
社交媒体数据量爆炸增长,传统舆情技术无力实现全数据采集 利用传统数据处理与存储方式,要实时处理海量数据,投入巨大
7
防不胜防: 大数据之安全风险
Jasmine.More
万千气象:感受数据之大
大数据的例子
GOOGLE通过全美各地区 搜索H1N1及流感相关关 键字频率和分布,得出疫 情爆发情报
对冲基金通过Twitter用户 每天关于情绪的关键字进 行以亿为单位的数据分析, 用以为买入和卖出股票 做参考
BOSTON 爆 炸 案 , 通过当天的数据分 析,第二天抓获嫌 疑犯,制止再次作 案。
实现“主动服务”,“信息找人”
实现有害信息的过滤 反动言论,谣言,保护国家安全 色情内容,保护青少年身心健康
防不胜防:大数据之安全风险
2 大数据信息过滤应用
协作过滤
用户和用户之间,关键问题是聚类 提供用户资源的新颖性
协同过滤时需要解决的是稀疏性,并尽力提高 可拓展性
防不胜防:大数据之安全风险
3 大数据舆情分析:

• 大数据分析能力逐渐加强,传统市场研究行业、证券研究所、 产业链咨询机构将逐渐消失。 • 银行都将基于企业大数据平台开展银行直销业务,同时按照产
业链金融服务事业部模式开展业务
• 因大数据系统的出现,所有依赖信息不对称盈利的业务都将消
改变
失。
大数据对政府、运营商,高校、企业来说,象空气一样不可或缺!
方案
超级 节点 方案
基于超级节点对图结构进行分割和集聚操作。
不足在于牺牲数据的可用性
沙里淘金: 大数据之内容安全
Jasmine.More
防不胜防:大数据之安全风险
大数据成为竞争新焦点同时,带来了更多安全风险
如何从海量数据中 过滤敏感信息内容
信息过滤
如何实时将最重要的 舆情信息优先放到用 户面前
舆情分析
Jasmine.More
任重道远:大数据展望
技术和政策并重
持续对大数据安全与隐私方向研究
完善重点领域数据管理和规范制度
加强对重点领域敏感数据的监管
大数据时代
期望数据与安全完美平衡
防不胜防:大数据之安全防护
1 大数据在带来了新安全风险的同时也为信 息安全的发展提供了新机遇
利用大数据分析,通过搜集来 自多种数据源的信息安全数据, 深入分析挖掘有价值的信息, 对未知安全威胁做到提前响应、 降低风险
网络安全 防护
网络信息 内容防护
借助基于大数据分析技术的 机器学习和数据挖据算法, 智能地洞悉信息与网络安全 的态势,从而加主动、弹性 地去应对新型复杂的威胁和 未知多变的风险。
大数据or大问题?
西北工业大学 戴冠中教授
大 数 据 时 代 的 安 全 挑 战 及 防 护
目录
1
2 3 4 万千气象:大数据之分析
防不胜防:大数据之风险
天网恢恢:数据之网络安全 淘沙取金:大数据之内容安全 任重道远:大数据之展望
5
万千气象: 大数据之分析
Jasmine.More
万千气象:大数据之分析
• 社会信息化和网络化导致数据的爆炸式增长 • 云计算、物联网等新技术催生大数据 • 数据仓库、数据分析、数据挖掘等技术
大数据的核心是数据、技术和思维
万千气象:大数据之分析
数据 指数 增长 根据IDC 监测,数据量正在呈 指数级增长,约每两年翻一番。 结构
日趋
复杂 大量新数据源的出现则导致 了非结构化、半结构化数据 爆发式的增长。
2 基于大数据的认证技术:
原理:收集用户行为和设备行为数据,对这些数据分析, 获得用户行为和设备行为的特征,进而确定其身份。
优点
攻击者很难模拟用户行为通过认证 减小用户负担 更好的支持各系统认证机制的统一
缺点
初始阶段认证分析不准确 对数据质量要求高 存在用户隐私问题
防不胜防:大数据之安全风险
3 大数据匿名保护技术:
舆情的发现
用户一天满负荷接收的数据量有限 如何实时将最重要的舆情信息优先放到用户面前成为重要问题。
舆论噪音的辨别与去除
社交平台中存在大量受控制的机器账号,可快速增长某些内容的转发量 需要有技术识别舆情的真假,防止被错误引导内容
防不胜防:大数据之安全风险
3 大数据舆情分析示例:
防不胜防:大数据之安全风险
缺点
不能应对数据连续多次发布、攻击 者从多渠道获得数据的问题的场景

防不胜防:大数据之安全风险
3 社交网络中典型的匿名保护:
原理:用户标识匿名与属性匿名,在数据发布时隐藏了 用户 的标识与属性信息;用户间关系匿名,在数据发布时隐藏了 用户间的关系
边匿 名
多基于边的增删,用随机增删交换便的方法有效地实现边匿名 不足:匿名边保护不足
随着经济社会快速发展,保障我国大数据信息安 全已经成为关乎大数据应用的重要
大数据安全防护-网络安全篇
保证大数据安全采取的措
安全 分析
大数据正在为安
全分析提供新的可 能性,对于海量数 收集用户行为和设 备行为数据,对这 些数据分析,获得 用户行为和设备行 为的特征,进而确 认证技 术 数据发布匿名保护 技术是对大数据中 结构化数据实现隐 私保护的核心关键 与基本技术手段 匿名保 护技术
防不胜防:大数据之安全风险
大数据成为竞争新焦点同时,带来了更多安全风险
大数据本身成为 网络攻击的显著 目标
业务数据
大数据加大隐私泄 露风险
隐私泄露
大数据对现有的存 储和安防措施提出 挑战
存储风险
大数据成为高 级可持续攻击 的载体
APT攻击
防不胜防:大数据之安全风险
大数据不仅意 味着海量的数 据,也意味更 复杂、更敏感 的数据
防不胜防:大数据之安全风险
2 基于大数据的认证技术:
攻击者总能找到方法来骗取用户所知的 秘密,或窃取用户凭证 传统认证技术中认证方式越安全往往意 味着用户负担越重
身份认证:信息系统或网络中确认操作者身份 的过程,传统认证技术只要通过用户所知的口 令或者持有凭证来鉴别用户
防不胜防:大数据之安全风险
据的分析有助于信
息安全服务提供商 更好的刻画网络异 常行为,从而找出 数据中的风险点。

定其身份
万千气象:感受数据之大
基于大数据,企业可以更主动的发现潜在的安全威胁 相较于传统技术方案,大数据威胁发现技术有以下优点:
1、分析内容的范围更大
2、分析内容的时间跨度 更长
3、攻击威胁的预测性
4、对未知威胁的检测
防不胜防:大数据之安全风险
4 大数据成为高级可持续攻击的载体
数据大集中的导致复杂多样的数据存储, 如可能出现数据违规存储 常规的安全扫描手段需要耗费过多时间, 已影响到安全控制措施能否正确运行 攻击者可设置陷阱误导安全厂商目标信 息提取,导致安全监测偏离应有的方向。
天网恢恢: 大数据之网络安全
Jasmine.More
数据会吸引更多 的潜在攻击者, 成为更具吸引力 的目标
数据的大量聚集, 使得黑客一次成 功的攻击能够获 得更多的数据, 无形中降低了黑 客的进攻成本, 增加了“收益率
防不胜防:大数据之安全风险
1 大数据成为网络攻击的显著目标
大数据成为更容易被“发现”的大目标, 承载着越来越多的关注度 大数据包含复杂敏感数据,会吸引更多 的潜在攻击者,成为更具吸引力的目标 数据的大量聚集,使得一次成功的攻击能 够获得更多的数据,增加了攻击收益率
控制网络功能
社会网络建模分析方法
防不胜防:大数据之安全风险
3 大数据社会网络分析:
研究内容:测量网络数据、发现网络性质、建立网络模型、 分析网络用户行为及与各个连接节点的关系。 发展应用:社会网络与大数据分析相结合,为分析复杂的社 会系统提供了有力的工具,在社会学、管理学、经济、国家 安全等领域将得到广泛应用。
测量网络数据 建立网络模型 分析网络行为
发现网络数据
控制网络功能
社会网络建模分析方法
防不胜防:大数据之安全风险
3 社交关系网结构:
防不胜防:大数据之安全风险
3 大数据社交关系结构:
防不胜防:大数据之安全风险
3 大数据开源情报分析:
研究内容:将大量的存在于网络中的开源各类数据以图形方 式对数据间的关联进行描述和展现,并运用众多数据分析的 方法(关联分析、网络分析、路径分析、时间序列分析、空 间分析等)来发现和揭示数据中隐含的公共要素和关联
大数据对现有的存储 和安防措施提出挑战
社会网络分析
开源情报分析
大数据成为高级可 持续攻击的载体
大数据安全防护-网络安全篇
大数据环境下的信息过滤特点
智能
高效 自学习
智能过滤违法国家
法律法规以及侵犯 用户权益的内容, 在本系统在保证准 确率的情况下,可 以满足海量处理规 模数据,快速便捷 地匹配自定义的关
• 当今创造的数据早已经远远超越了目前人力所能处理的范畴 • 大数据时代正在来临
万千气象:大数据之分析
大数据的特征
来自百度文库
数据巨大
大容量 多样性
高速度 真实性
处理速度快
数据类型繁多 追求高质量的数据
万千气象:感受数据之大
优化 革命 颠覆
• 各级政府、主管部门、上市公司、企业集团、外资公司都将基 于大数据分析平台优化其决策。
防不胜防:大数据之安全风险
2 大数据加大隐私泄露风险
数据汇集包括大量企业运营数据、客户 信息、个人行为的细节记录 敏感数据的所有权和使用权无明确的界 定,大数据分析未考虑到个体隐私问题 数据的集中存储增加了数据泄露风险
防不胜防:大数据之安全风险
3 大数据对现有的存储和安防措施提出挑战
攻击者利用大数据将攻击很好地隐藏起 来,使传统的防护策略难以检测出来 大数据的价值低密度性,让安全分析工具很 难聚焦在价值点上,攻击可隐藏在大数据中 随着数据增长,安全防护更新升级速度 无法跟上数据量非线性增长的步伐
3 大数据社会网络分析:
研究内容:测量网络数据、发现网络性质、建立网络模型、 分析网络用户行为及与各个连接节点的关系。 发展应用:社会网络与大数据分析相结合,为分析复杂的社 会系统提供了有力的工具,在社会学、管理学、经济、国家 安全等领域将得到广泛应用。
测量网络数据 建立网络模型 分析网络行为
发现网络数据
效率
丰富 隐蔽
情报收集成本小,
降低情报收集工作 量,减少违法或违 借助开源情报来理 解相关联的秘密情 报,且有助于研究 长期问题
可以保护情报源和 情报方法以及自身 战略意图
反道德的风险
防不胜防:大数据之安全风险
2 网络开源情报分析方法
协作过滤
数据定量分析 多源数据融合 相关性分析
任重道远: 大数据之展望
通过机器学习,自 动抽取新的语言知 识,以适应新的网 络语言变化,做到 因时而变。
达到净化网络空间、
提取情报的目的, 确保国家、社会与 个人的信息内容安 全。
键字、词
万千气象:感受数据之大
2 大数据信息过滤应用
克服重复查询 网络信息是动态变化的, 用户时常关心这种变化
查询同样的变化信息内容需花费大量的时间 提供个性化信息服务 对不同用户采取不同服务策略, 提供差异服务
原理:对大数据中结构化数据实现隐私保护的核心关键与基 本技术手段 典 型 例 子 : k- 匿 名 技 术 要 求 发 布 的 数 据 中 存 在 一定数量(至少为k) 的在准标识符上不可区分的记录,使攻击者 不能判别出隐私信息所属的具体个体,从而保护了个人隐私
K匿名方案
优点
一定程度上保护了数据的隐私,能 够很好的解决静态、一次发布的数 据隐私保护问题
历史性纵向比较 某信息源过去一定 时期的报道
同时期横向比较,信息源之间相互印证 可靠性已知 信息源1 可靠性已知 信息源2
已证实的事件 已得到的结论
可靠性已知 信息源……
可靠性未 知信息源
可靠性已知 信息源3
可靠性已知 信息源5 一则报道内容
可靠性已知 信息源4
大数据安全防护-网络安全篇
大数据环境下的网络开源情报分析特点
相关文档
最新文档