PythonChallenge第二关

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

PythonChallenge第⼆关
第⼆关和第⼀关⼀样,还是⼀幅图和⼀⾏提⽰。

提⽰说的是:
recognize the characters. maybe they are in the book, but MAYBE they are in the page source.
这就很明显了,直接查看源代码。

果然,源代码下⾯的注释就是要处理的内容:
<!--
find rare characters in the mess below:
-->
这⼀⾏注释提⽰让在下⾯那⼀堆符号中间查找稀有的字母,我想先把那些很长的符号复制出来。

复制了两次,由于太长加⼿抖均没成功。

转念⼀想,应该⾃⼰写代码把这⼀部分提取出来,就不⽤复制那么长的内容了。

url = '/pc/def/ocr.html'
req = urllib2.Request(url)
resp = urllib2.urlopen(req)
page = resp.read()
rstList = re.findall('<!--\s+(%.*)-->', page, re.S)
ss = rstList[0]
⽤了个正则表达式,把这⼀部分注释提取了出来,然后把它赋给⼀个字符串变量。

接着提取其中的字母,这个⽤列表解析就更简单了。

def getOcr(srcStr):
return''.join([x for x in srcStr if x.isalpha()])
把上⼀步得到的字符串传递给这个函数,就可以得到答案。

打印出来是: equality。

相关文档
最新文档