PythonChallenge第二关
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
PythonChallenge第⼆关
第⼆关和第⼀关⼀样,还是⼀幅图和⼀⾏提⽰。
提⽰说的是:
recognize the characters. maybe they are in the book, but MAYBE they are in the page source.
这就很明显了,直接查看源代码。
果然,源代码下⾯的注释就是要处理的内容:
<!--
find rare characters in the mess below:
-->
这⼀⾏注释提⽰让在下⾯那⼀堆符号中间查找稀有的字母,我想先把那些很长的符号复制出来。
复制了两次,由于太长加⼿抖均没成功。
转念⼀想,应该⾃⼰写代码把这⼀部分提取出来,就不⽤复制那么长的内容了。
url = '/pc/def/ocr.html'
req = urllib2.Request(url)
resp = urllib2.urlopen(req)
page = resp.read()
rstList = re.findall('<!--\s+(%.*)-->', page, re.S)
ss = rstList[0]
⽤了个正则表达式,把这⼀部分注释提取了出来,然后把它赋给⼀个字符串变量。
接着提取其中的字母,这个⽤列表解析就更简单了。
def getOcr(srcStr):
return''.join([x for x in srcStr if x.isalpha()])
把上⼀步得到的字符串传递给这个函数,就可以得到答案。
打印出来是: equality。