密码破译的常用算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

参赛队号:
1447
参赛密码 (由组委会填写)
所选题目:
B

Abstract
Cryptanalysis refers to a process that in the case of not knowing the secret key to recover the cipher plaintext message hidden in clear information. This paper designed the exhaustive algorithm based on frequency statistics and increase the grammatical rules of the improved algorithm, to decode the ciphertext of single letter , It also used the ideas of fuzzy comprehensive evaluation to establish the evaluation system of a decoding algorithm. This paper use the statistical features of natural language to decipher for long cipher decoding . By looking over all kinds of date books we find that the frequencies of all the letters in the English language is relatively stable, and it can be roughly divided into five groups. In the code table , the ciphertext and clear is corresponding to each other, so the statistical characteristics of the clear can also be mapped to the ciphertext.By taking advantage of this feather,we can make the frequency statistics of all the letters in this paper and handle the statistical result at the same time.Finally,we use exhaustive method to find all the possible secret keys.By exchanging with the database and finding the correct password table to decipher the ciphertext. For the deciphering of the short cipher.Given that English has the statistical properties of natural language and its own rules of grammer at the same time.So we formulate corresponding rules by concluding some other rules od English in this paper.We can handle the cipher with the bind of the rules and reduce the exhaustive data space,besides,we can increase the accuracy of decoding. For the establishment of algorithm evaluationrtance to four factors,including time complexity and the space complexity of the algorithm,the accuracy of the deciphering algorithm and the robustness.First,we use AHP to conclude the weight of these four factors when evaluating algorithm.Then we use the Fuzzy comprehensive judgement to set the comment collection.Due to the manifold of decoding method,the four factors has the different standard.So we classified the standard in detail and obtain the corresponded weight of the four factors in different standard.Then we will establish a reasonable evaluation system.Finally,we use this system to value the decoding algorithm in this paper.The final conclusion is in the better level.
2.2 问题二的分析
问题二需要设计一个衡量破译算法的标准,用来评价算法的破译能力。要建立算法 的评价体系,首先要先确定影响算法优劣的因素,那么就很自然地联想到算法的时间复 杂度、空间复杂度、准确度、鲁棒性这四个重要因素。根据算法的侧重点来求出这四个 影响因素的权值。由于评价的体系是针对各个算法的,不同算法的四个影响因素所达到 的标准自然也就不同,因此需要对四个因素分别进行单独的评价,最后整合从而建立一 个比较客观的评价体系。最后将本文第一问中设计出来的算法带入到建立的评价体系之 中,检验算法的优劣。
一、 问题重述
历史上有许多密码的编制方法。较为简单的是替换式密码,也就是将文中出现的字 符一对一地替换成其它的符号。对拼音文字而言,最简单的形式是单字母替换加密,也 就是以每个字母为一个单位,将每个字母替换成另外的字母或者另外的符号。较为复杂 的形式是以多个字母为一个单元, 整体替换成其它的字符。 这个映射方法被称为密码表, 拿到密码表的人就能够将密文破译成明文。 现在有如下问题需要解决: 1.假定明文是由现代通常使用的英语写成的。现在有一些由单字母加密方法加密的 密文,需要设计一个能够自动破译密文的算法。且为了问题的简便,假设密码表仅是针 对 26 个字母的,每个单词之间的空格,以及标点符号仍然会保留。 2.设计完破译算法之后,需要设计一个衡量该破译算法的标准,用来评价算法的破 译能力。
四、 符号说明
为简化对问题的分析和对数字的处理,我们在以后的文字中将使用如下的符号代表变量: 表 1:文中的部分变量符号说明
参赛队教练员 (签名): 谭欣欣
参赛队伍组别(例如本科组) :本科组
第八届“认证杯”数学中国 数学建模网络挑战赛 编 号 专 用 页
参赛队伍的参赛队号:1447
竞赛统一编号(由竞赛组委会送至评委团前编号):
竞赛评阅编号(由竞赛评委团评阅前进行编号):
2015 年第八届“认证杯”数学中国 数学建模网络挑战赛第一阶段论文
二、 问题分析
2.1 问题一的分析
问题一要求设计一个能自动破译密文的算法, 本文中考虑的密文都是单字母替换加 密的,所以最简单的办法就是穷举法。但是当字母表的大小为 n 时,使用穷举法破译的 算法时间复杂度为 O(n!)(针对本问题,n 的取值为 26),对于阶乘阶的算法,当问题规模 增大时,算法执行次数的增加将是十分恐怖的,直接使用穷举法显然是不合理的。 由于任何自然语言都有其统计特性, 因此, 本文考虑借助英语的统计特性进行破译。 经过文献调研发现,英文中各个字母出现的频率相对稳定。在密码表中,密文与明文是 一一对应的关系, 所以明文中的统计特性同样会映射到密文中。 本文就是利用这个性质, 对密文中的各个字母进行频率统计,对统计结果进行分组处理,最后采用穷举法遍历所 有可能的密钥,找出正确的密码表,从而破译密文。 英语除了具有自然语言的统计特性之外,还具有自身的语法规则。因此本文通过总 结出英语中的一些规律,制定相应规则,在规则的约束下对密文进行预处理,减少穷举 的数据空间,增加破译的准确度。
三、 模型假设
1. 假设语言的统计特性同样适用于英语,并且文献中统计的数据真实可信。
1
2. 3. 4. 5. 6.
假设所有的密文与明文都是一一对应的关系,不存在一对多或多对一的情况。 假设影响算法优劣的因素只有时间性能、空间性能、准确度和鲁棒性这四种。 假设时间复杂度和空间复杂度只考虑三种现实中可行的数量级。 假设算法的鲁棒性只划分为高中低三个等级。 假设在构建评价矩阵时,通过文献调研所得到的权值都是合理的。
第八届“认证杯”数学中国 数学建模网络挑战赛 承 诺 书
我们仔细阅读了第八届“认证杯”数学中国数学建模网络挑战赛的竞赛规则。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网 上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的 资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处和参 考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规 则的行为,我们接受相应处理结果。 我们允许数学中国网站()公布论文,以供网友之间学习交流,数学中 国网站以非商业目的的论文交流不需要提前取得我们的同意。 我们的参赛队号为: 参赛队员 (签名) : 队员 1:卢健 队员 2:孙一 队员 3:刘娇
题 目 频率统计 层次分析 替换式密码 穷举法 语法规则 模糊综合评价
关 键 词 评价体系

要:
密码破译是指在不知道密钥的情况下,恢复出密文中隐藏的明文信息的过程。随着 信息技术的发展,对数据加密的方法也越来越多,密码的破译也就变得更加困难。 本文设计出了基于频率统计的穷举算法和增加语法规则的改进算法, 对单字母替换 的密文进行破译,另外运用了模糊综合评价的思想建立了一个破译算法的评价体系。 对于长密文的破译,本文借助自然语言的统计特性进行破译。查找资料发现英文中 各个字母出现的频率相对稳定,并大致可以分为五组。在密码表中,密文与明文是一一 对应的关系,所以明文中的统计特性同样会映射到密文中。利用这个性质,对密文中的 各个字母进行频率统计,对统计结果进行分组处理,最后采用穷举法遍历所有可能的密 钥。通过与数据库的数据交换,找出正确的密码表,从而破译密文。 对于短密文的破译,考虑到英语除了具有自然语言的统计特性之外,还具有自身的 语法规则。因此本文通过总结出英语中的一些规律,制定相应规则,在规则的约束下对 密文进行预处理,减少穷举的数据空间,增加破译的准确度。 对于算法评价体系的建立,本文着重考虑了算法的时间复杂度、空间复杂度、算法 破译密文的准确度以及鲁棒性这四个因素。首先,利用层次分析法解得这四个因素在评 价算法时所占的权重, 然后根据模糊综合评判, 设定评语集。 由于破译算法的多种多样, 不同算法的四个因素所能达到的标准也是不一样的。于是本文对标准进行了详细的分类 并分别求出四个因素在不同标准下相应的权重,建立出一个合理的评价体系。最后利用 这个体系对本文设计的破译算法进行评价,得出的结论是处于较好的这个层次。
相关文档
最新文档