云存储应用中的加密存储及其检索技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3一种基于全同态加密的 检索方法
在加密信息检索研究中,结果的 排序是衡量检索箅法性能的重要指 标之一。当前随着云计算技术的提 倡和应用,加密文档必将呈爆炸式增 加。排序的准确性成为对检索系统 性能的客观要求,其主要目的是提高 检索系统服务质量和检索效率。分 析现有的加密信息检索算法发现,在 保证杳准和查全两方面性能的同时, 对排序问题以及准确性方面考虑不 够。针对该问题,本文提出了一种面 向云存储应用中的全同态加密的检 索方法。全同态加密的检索方法是 采用信息检索中的向量空间模型,计 算检索出的文档与待查询信息之间 的相关度,对检索词词频和倒排文档 频率进行统计,然后采用全同态方法 对文档进行加密并建立索引方法。 检索后将加密文档与索引项密文一 起上传到服务器端。
算法的过程如下,首先生成公 钥、私钥,然后对待存储的明文关键 词用公钥进行加密,生成可搜索的密 文信息。
2.3安全索引 安全索引由Park等人提出,解决
E窭万四方3数4据石而磊忑丽磊百赢两而蕊
了简单索引方式易受统计攻击的问 题。其机制是每次加密所用的密钥 是事先生成的一组逆Hash序列,加 密后的索引被放入布隆过滤器中。 当检索的时候,首先用逆Hash序列 密钥生成多个陷门,然后进行布隆检 测。对返回的密文文档解密即可得 到所需检索的文档。
孽伞驴日:国家科技支撑计划课题 (2008BAH37807j;国家自然科学基金 (60970148);国家重点基础研究发展 (“973”)规划(2007CB310806)
设施。 云计算主要目标是提供高效的
计算服务。云计算基础设施之一是 提供可靠、安全的数据存储中心。因 此,存储安全是云计算领域的安全话 题之一。为解决数据隐私的保护问 题,常见的方法是由用户对数据进行 加密,把加密后的密文信息存储在服 务端。当存储在云端的加密数据形 成规模之后,对加密数据的检索成为 一种迫切需要解决的问题。
针对有新用户加入、旧用户退出 的多用户加密信息检索,这是一种解 决方法。但其存在的缺陷是需要生 成大量的密钥序列,随着检索次数的 增加,每多进行一次检索,其计算复 杂度均线性增加。这在实际应用中 很难被接受。
在以上提到的多种加密信息检 索算法中,所用的检索模型都是布尔 模型,因而无法根据查询与待检索文 档的相关度进行排序操作。在实际 情况中,尤其是在数据规模较大的云 存储应用中,包含某一查询关键词的 文档可能有很多个,如何在多个可能 相关的文档中找出最相关的一个或 若干个文档是需要解决的问题。对 加密的文档,是否可以应用成熟的向 量空间模型,进而进行相关排序,是 一个开放的问题。
2加密信息检索技术
对加密信息检索的研究始于 2000年,Song等人提出加密数据搜索 的实用算法-t,Boneh等人提出基于关 键词的公钥加密算法嘲,Park等人提
出安全索引搜索算法m。
2.1线性搜索算法 在线性搜索算法中,首先用对称
加密算法对明文信息加密。对于每 个关键词对应的密文信息,生成一串 长度小于密文信息长度的伪随机序 列,并生成一由伪随机序列及密文信 息确定的校验序列。伪随机序列的 长度与检验序列长度之和等于密文 信息的长度。伪随机序列及检验序 列对密文信息再次加密。在搜索过 程中,用户提交明文信息对应的密文 信息序列。在服务器端,密文信息序 列被线性地同每一段序列模2加。 如果得到的结果满足校验关系,那么 说明密文信息序列出现,否则,说明 密文信息不存在。
访问控制服务实现用户身份认 证、授权,防止非法访问和越权访 问。主要功能包括:用户只能对经管 理员或文件所有者授权的许可文件 进行被许可的操作;管理员只能进行 必要的管理操作,如用户管理、数据 备份、热点对象迁移,而不能访问用 户加密了的私有数据。
加密存储是对指定的目录和文 件进行加密后保存,实现敏感数据存 储和传送过程中的机密性保护。
随着存储系统和存储设备越来 越网络化,存储系统在保证敏感数据 机密性的同时,必须提供相应的加密 数据共享技术。保护用户隐私性要 求存储安全建立在对存储系统的信 任基础之上。必须研究适用于网络 存储系统的加密存储技术,提供端到 端加密存储技术及密钥长期存储和 共享机制,以确保用户数据的机密性 和隐私性,提高密钥存储的安全性、 分发的高效性及加密策略的灵活 性。在海量的加密信息存储中,加密 检索是实现信息共享的主要手段,是 加密存储中必须解决的问题之一。
encryption,effective retrieval of encrypted data is difficult to achieve by traditional means.This paper analyzes storage security technology in cloud storage and also the demands of encrypted storage Iusing common methods of encryption and related technologies).In light of research results,this paper proposes a retrieval method based
USA:lEEE.2000:44—55. 16l BONEH D,CRESCENZ0 G,OSTROVSKY R.
et a1.Public Key Encryptlon With Keyword Search【C]//Advances fn Cryptology.
2.4引入相关排序的加密搜索算法 Swaminathan等人提出了保护隐
私的排序搜索算法tSl。在这一算法 中,每一文档中关键词的词频都被保 序加密算法加密。加密文档被提交 查询给服务器端后,首先计算检索出 含有关键词密文的加密文档;然后对 用保序算法加密的词频对应的密文 信息进行排序处理;最后把评价值高 的加密文档返回给用户,由用户对其 进行解密。
万方数据
计算得到。
‰p(¨:兰坐塑型堑些鲤垒上(1)
√∑J【胁np(巧)x Hmp(109(d昕))]2 对于检索词采用I司样方法来描 述,取两者的内积即町得到两者的相 关度,然后根据大小进行排序,将有 效排序后的文档返回给用户。用户 得到加密文档后,用私钥对文档解密 得到原始文档。 通过全同态加密算法加密的明 文数据可以在不恢复明文信息的情 况被有效检索出来,即把最相关的文 档返回给用户。既保护了用户的数 据安全,又提高了检索的性能。
云存储应用中的加密存储及其检索技
云存储应用中的加密存储 及其检索技术
Encrypted Storage and Its Retrieval in Cloud Storage Applications
圆云计算自身的数据安全问题阻碍其推广应用。通过对数据进行加密可以保
护企业及个人用户的数据隐私。对加密数据有效检索难以通过传统信息检索方式 实现。文章在分析云存储应用中的存储安全技术基础上,针对加密存储的需求,基 于常见的加密检索方法和相关技术,结合自己的研究成果,提出了一种基于全同态
EⅢ云存储;向量空间模型;相关排序 加密的检索方法,该方法能在一种程度上提高检索效率。
l::::四The problem of data security impedes the spread and application of cloud
computing.While corporate and personal data can be protected through data
1云存储应用中的加密 存储技术
大规模高性能存储系统安全需 求,特别是云存储应用中,可扩展和 高性能的存储安全技术,是推动网络 环境下的存储应用(如云存储应用)最 根本的保证,已经成为当前网络存储
万ቤተ መጻሕፍቲ ባይዱ数据
甄ii而赢丁丽鬲百而丽33屯魉圆
CATIoNS
黄永蜂等幽 云存储应用中的加密存储及其检索技术
领域的研究热点。云存储应用中的 存储安全包括认证服务、数据加密存 储、安全管理、安全日志和审计。
on fully homomorphic encryption--which can markedly improve efficiency.
E匮墨墨cloud storage;vector space model;relevance ranking
;计算是一种通过网络以按需、
‘▲易扩展的方式获取所需服务的 在线网络服务交付和使用模式,它是 分布式计算的一种形式。是网络上 的服务以及提供这种服务的数据中 心的软硬件集合“】。云计算是并行计 算、分布式计算和网格计算的演进。 云计算的实现形式包括软件即服务、 效用计算、平台即服务、基础设施即 服务。目前云计算已经有部分应用, 如C006h公司的GoogleDocs81,另外微 软、AmazonI“1也有类似的云计算服务
安全管理主要功能是用户信息 和权限的维护。如用户帐户注册和注 销等,授权用户、紧急情况下对用户 权限回收等。
安全日志和审计是记录用户和 系统与安全相关的主要活动事件,为 系统管理员监控系统和活动用户提 供必要的审计信息。
对用户来说,在上述4类存储安 全服务中,存储加密服务尤为重要。 加密存储是保证用户私有数据在共 享存储平台的机密性核心技术。
这一种方法可以在给定多个可 能相关文档的情况下对加密文档进 行排序,进而把最可能相关的文档返 回给用户。但这一种算法首先不适 用于一个查询包含多个查询词的情 况,其次算法只利用了文档中的诃频 信息,无法利用词的逆文档频率,进
云存储应用中的加密存储及其检索技
▲图l基于全同态的加密检索过程
而向量空间模型无法直接应用。解 决前一种fuJ题的一种方法是用加法 同态加密算法一I对词频信息进行加密 处理。
全同态加密检索及排序过程如 图1所示。提交检索之前,同样先对 检索语句进行分词、词干化,得到关 键词明文序列并对明文进行加密。 云端服务器对提交密文序列进行检 索时,提交加密后的检索词。
文档由每个关键词的权重向量 表示,权重是词频与倒排文档频率对 数的乘积的归一化。对用全同态加 密后的词频、倒排文档频率进行操作 可以得到权重。文档向量由公式(1)
线性搜索方法是一种一次一密 的加密信息检索算法,因此有极强的 抵抗统计分析的能力。但其有一个 致命的缺点,即逐次匹配密文信息, 这使得这种检索方法在大数据集的 情况下难以应用。
2.2基于关键词的公钥搜索 基于关键词的公钥加密搜索算
法由Boneh等人提出,其目的是可以 在用户端存储、计算资源不足的情况 下,通过访问远端数据库获取数据信 息。存储、计算资源分布具有不对称 性,即用户的计算存储能力不能实时 满足其需求。另一方面用户在移动 情况下存储、索引数据的需求也有增 加,比如Email服务等。在这种特定 情况下,需要保护用户的数据隐私。 加密数据有多个不同来源,针对这一 问题的解决方法是加密算法使用公 钥加密。
1 00084.China)
较高,不适用大规模数据检索的情 况,而且,在云存储中,检索时相关的 文档较多,对其进行相关排序是进一 步需要解决的问题,以上几种算法均 不能解决问题。
通过保序加密可以利用文档中 的词频信息对文档依相关度进行排 序,提高了检索准确率和返回率。然 而在文档中某些关键词出现的频率 非常高,指代性不强,这一类词称为 常用词,常用词的存在歪曲了文档和 实际查询相关度。而准确反映文档、 查询相关度的向量空间模型无法直 接应用。全同态加密提供可以对密 文进行操作的加密算法。而且通过 全同态加密,一方面可以保证密文信 息不被统计分析,另一方面可以对加 密信息进行加法和乘法运算,同时保 持其对应明文的顺序。
在加密信息检索的相关研究工 作中,对加密信息的检索有单用户线 性搜索、基于关键词的公钥搜索、安 全索引等几种算法。这儿种算法可 以快速地检索出所需信息,但其代价
黄永罐/HUANG Yongfeng 缵久盼/ZHANG Jiuling 李星/LIXing
(清华大学NGN实验室,北京100084) (NGN LAB.,Tsinghua University,Beijing
在加密信息检索研究中,结果的 排序是衡量检索箅法性能的重要指 标之一。当前随着云计算技术的提 倡和应用,加密文档必将呈爆炸式增 加。排序的准确性成为对检索系统 性能的客观要求,其主要目的是提高 检索系统服务质量和检索效率。分 析现有的加密信息检索算法发现,在 保证杳准和查全两方面性能的同时, 对排序问题以及准确性方面考虑不 够。针对该问题,本文提出了一种面 向云存储应用中的全同态加密的检 索方法。全同态加密的检索方法是 采用信息检索中的向量空间模型,计 算检索出的文档与待查询信息之间 的相关度,对检索词词频和倒排文档 频率进行统计,然后采用全同态方法 对文档进行加密并建立索引方法。 检索后将加密文档与索引项密文一 起上传到服务器端。
算法的过程如下,首先生成公 钥、私钥,然后对待存储的明文关键 词用公钥进行加密,生成可搜索的密 文信息。
2.3安全索引 安全索引由Park等人提出,解决
E窭万四方3数4据石而磊忑丽磊百赢两而蕊
了简单索引方式易受统计攻击的问 题。其机制是每次加密所用的密钥 是事先生成的一组逆Hash序列,加 密后的索引被放入布隆过滤器中。 当检索的时候,首先用逆Hash序列 密钥生成多个陷门,然后进行布隆检 测。对返回的密文文档解密即可得 到所需检索的文档。
孽伞驴日:国家科技支撑计划课题 (2008BAH37807j;国家自然科学基金 (60970148);国家重点基础研究发展 (“973”)规划(2007CB310806)
设施。 云计算主要目标是提供高效的
计算服务。云计算基础设施之一是 提供可靠、安全的数据存储中心。因 此,存储安全是云计算领域的安全话 题之一。为解决数据隐私的保护问 题,常见的方法是由用户对数据进行 加密,把加密后的密文信息存储在服 务端。当存储在云端的加密数据形 成规模之后,对加密数据的检索成为 一种迫切需要解决的问题。
针对有新用户加入、旧用户退出 的多用户加密信息检索,这是一种解 决方法。但其存在的缺陷是需要生 成大量的密钥序列,随着检索次数的 增加,每多进行一次检索,其计算复 杂度均线性增加。这在实际应用中 很难被接受。
在以上提到的多种加密信息检 索算法中,所用的检索模型都是布尔 模型,因而无法根据查询与待检索文 档的相关度进行排序操作。在实际 情况中,尤其是在数据规模较大的云 存储应用中,包含某一查询关键词的 文档可能有很多个,如何在多个可能 相关的文档中找出最相关的一个或 若干个文档是需要解决的问题。对 加密的文档,是否可以应用成熟的向 量空间模型,进而进行相关排序,是 一个开放的问题。
2加密信息检索技术
对加密信息检索的研究始于 2000年,Song等人提出加密数据搜索 的实用算法-t,Boneh等人提出基于关 键词的公钥加密算法嘲,Park等人提
出安全索引搜索算法m。
2.1线性搜索算法 在线性搜索算法中,首先用对称
加密算法对明文信息加密。对于每 个关键词对应的密文信息,生成一串 长度小于密文信息长度的伪随机序 列,并生成一由伪随机序列及密文信 息确定的校验序列。伪随机序列的 长度与检验序列长度之和等于密文 信息的长度。伪随机序列及检验序 列对密文信息再次加密。在搜索过 程中,用户提交明文信息对应的密文 信息序列。在服务器端,密文信息序 列被线性地同每一段序列模2加。 如果得到的结果满足校验关系,那么 说明密文信息序列出现,否则,说明 密文信息不存在。
访问控制服务实现用户身份认 证、授权,防止非法访问和越权访 问。主要功能包括:用户只能对经管 理员或文件所有者授权的许可文件 进行被许可的操作;管理员只能进行 必要的管理操作,如用户管理、数据 备份、热点对象迁移,而不能访问用 户加密了的私有数据。
加密存储是对指定的目录和文 件进行加密后保存,实现敏感数据存 储和传送过程中的机密性保护。
随着存储系统和存储设备越来 越网络化,存储系统在保证敏感数据 机密性的同时,必须提供相应的加密 数据共享技术。保护用户隐私性要 求存储安全建立在对存储系统的信 任基础之上。必须研究适用于网络 存储系统的加密存储技术,提供端到 端加密存储技术及密钥长期存储和 共享机制,以确保用户数据的机密性 和隐私性,提高密钥存储的安全性、 分发的高效性及加密策略的灵活 性。在海量的加密信息存储中,加密 检索是实现信息共享的主要手段,是 加密存储中必须解决的问题之一。
encryption,effective retrieval of encrypted data is difficult to achieve by traditional means.This paper analyzes storage security technology in cloud storage and also the demands of encrypted storage Iusing common methods of encryption and related technologies).In light of research results,this paper proposes a retrieval method based
USA:lEEE.2000:44—55. 16l BONEH D,CRESCENZ0 G,OSTROVSKY R.
et a1.Public Key Encryptlon With Keyword Search【C]//Advances fn Cryptology.
2.4引入相关排序的加密搜索算法 Swaminathan等人提出了保护隐
私的排序搜索算法tSl。在这一算法 中,每一文档中关键词的词频都被保 序加密算法加密。加密文档被提交 查询给服务器端后,首先计算检索出 含有关键词密文的加密文档;然后对 用保序算法加密的词频对应的密文 信息进行排序处理;最后把评价值高 的加密文档返回给用户,由用户对其 进行解密。
万方数据
计算得到。
‰p(¨:兰坐塑型堑些鲤垒上(1)
√∑J【胁np(巧)x Hmp(109(d昕))]2 对于检索词采用I司样方法来描 述,取两者的内积即町得到两者的相 关度,然后根据大小进行排序,将有 效排序后的文档返回给用户。用户 得到加密文档后,用私钥对文档解密 得到原始文档。 通过全同态加密算法加密的明 文数据可以在不恢复明文信息的情 况被有效检索出来,即把最相关的文 档返回给用户。既保护了用户的数 据安全,又提高了检索的性能。
云存储应用中的加密存储及其检索技
云存储应用中的加密存储 及其检索技术
Encrypted Storage and Its Retrieval in Cloud Storage Applications
圆云计算自身的数据安全问题阻碍其推广应用。通过对数据进行加密可以保
护企业及个人用户的数据隐私。对加密数据有效检索难以通过传统信息检索方式 实现。文章在分析云存储应用中的存储安全技术基础上,针对加密存储的需求,基 于常见的加密检索方法和相关技术,结合自己的研究成果,提出了一种基于全同态
EⅢ云存储;向量空间模型;相关排序 加密的检索方法,该方法能在一种程度上提高检索效率。
l::::四The problem of data security impedes the spread and application of cloud
computing.While corporate and personal data can be protected through data
1云存储应用中的加密 存储技术
大规模高性能存储系统安全需 求,特别是云存储应用中,可扩展和 高性能的存储安全技术,是推动网络 环境下的存储应用(如云存储应用)最 根本的保证,已经成为当前网络存储
万ቤተ መጻሕፍቲ ባይዱ数据
甄ii而赢丁丽鬲百而丽33屯魉圆
CATIoNS
黄永蜂等幽 云存储应用中的加密存储及其检索技术
领域的研究热点。云存储应用中的 存储安全包括认证服务、数据加密存 储、安全管理、安全日志和审计。
on fully homomorphic encryption--which can markedly improve efficiency.
E匮墨墨cloud storage;vector space model;relevance ranking
;计算是一种通过网络以按需、
‘▲易扩展的方式获取所需服务的 在线网络服务交付和使用模式,它是 分布式计算的一种形式。是网络上 的服务以及提供这种服务的数据中 心的软硬件集合“】。云计算是并行计 算、分布式计算和网格计算的演进。 云计算的实现形式包括软件即服务、 效用计算、平台即服务、基础设施即 服务。目前云计算已经有部分应用, 如C006h公司的GoogleDocs81,另外微 软、AmazonI“1也有类似的云计算服务
安全管理主要功能是用户信息 和权限的维护。如用户帐户注册和注 销等,授权用户、紧急情况下对用户 权限回收等。
安全日志和审计是记录用户和 系统与安全相关的主要活动事件,为 系统管理员监控系统和活动用户提 供必要的审计信息。
对用户来说,在上述4类存储安 全服务中,存储加密服务尤为重要。 加密存储是保证用户私有数据在共 享存储平台的机密性核心技术。
这一种方法可以在给定多个可 能相关文档的情况下对加密文档进 行排序,进而把最可能相关的文档返 回给用户。但这一种算法首先不适 用于一个查询包含多个查询词的情 况,其次算法只利用了文档中的诃频 信息,无法利用词的逆文档频率,进
云存储应用中的加密存储及其检索技
▲图l基于全同态的加密检索过程
而向量空间模型无法直接应用。解 决前一种fuJ题的一种方法是用加法 同态加密算法一I对词频信息进行加密 处理。
全同态加密检索及排序过程如 图1所示。提交检索之前,同样先对 检索语句进行分词、词干化,得到关 键词明文序列并对明文进行加密。 云端服务器对提交密文序列进行检 索时,提交加密后的检索词。
文档由每个关键词的权重向量 表示,权重是词频与倒排文档频率对 数的乘积的归一化。对用全同态加 密后的词频、倒排文档频率进行操作 可以得到权重。文档向量由公式(1)
线性搜索方法是一种一次一密 的加密信息检索算法,因此有极强的 抵抗统计分析的能力。但其有一个 致命的缺点,即逐次匹配密文信息, 这使得这种检索方法在大数据集的 情况下难以应用。
2.2基于关键词的公钥搜索 基于关键词的公钥加密搜索算
法由Boneh等人提出,其目的是可以 在用户端存储、计算资源不足的情况 下,通过访问远端数据库获取数据信 息。存储、计算资源分布具有不对称 性,即用户的计算存储能力不能实时 满足其需求。另一方面用户在移动 情况下存储、索引数据的需求也有增 加,比如Email服务等。在这种特定 情况下,需要保护用户的数据隐私。 加密数据有多个不同来源,针对这一 问题的解决方法是加密算法使用公 钥加密。
1 00084.China)
较高,不适用大规模数据检索的情 况,而且,在云存储中,检索时相关的 文档较多,对其进行相关排序是进一 步需要解决的问题,以上几种算法均 不能解决问题。
通过保序加密可以利用文档中 的词频信息对文档依相关度进行排 序,提高了检索准确率和返回率。然 而在文档中某些关键词出现的频率 非常高,指代性不强,这一类词称为 常用词,常用词的存在歪曲了文档和 实际查询相关度。而准确反映文档、 查询相关度的向量空间模型无法直 接应用。全同态加密提供可以对密 文进行操作的加密算法。而且通过 全同态加密,一方面可以保证密文信 息不被统计分析,另一方面可以对加 密信息进行加法和乘法运算,同时保 持其对应明文的顺序。
在加密信息检索的相关研究工 作中,对加密信息的检索有单用户线 性搜索、基于关键词的公钥搜索、安 全索引等几种算法。这儿种算法可 以快速地检索出所需信息,但其代价
黄永罐/HUANG Yongfeng 缵久盼/ZHANG Jiuling 李星/LIXing
(清华大学NGN实验室,北京100084) (NGN LAB.,Tsinghua University,Beijing