PythonChallenge第二关

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

PythonChallenge第⼆关
第⼆关和第⼀关⼀样，还是⼀幅图和⼀⾏提⽰。

提⽰说的是：
recognize the characters. maybe they are in the book, but MAYBE they are in the page source.
这就很明显了，直接查看源代码。

果然，源代码下⾯的注释就是要处理的内容：

这⼀⾏注释提⽰让在下⾯那⼀堆符号中间查找稀有的字母，我想先把那些很长的符号复制出来。

复制了两次，由于太长加⼿抖均没成功。

转念⼀想，应该⾃⼰写代码把这⼀部分提取出来，就不⽤复制那么长的内容了。

url = '/pc/def/ocr.html'
req = urllib2.Request(url)
resp = urllib2.urlopen(req)
page = resp.read()
rstList = re.findall('', page, re.S)
ss = rstList[0]
⽤了个正则表达式，把这⼀部分注释提取了出来，然后把它赋给⼀个字符串变量。

接着提取其中的字母，这个⽤列表解析就更简单了。

def getOcr(srcStr):
return''.join([x for x in srcStr if x.isalpha()])
把上⼀步得到的字符串传递给这个函数，就可以得到答案。

打印出来是： equality。