用Python实现Youku视频批量下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用Python实现Youku视频批量下载
用Python实现Youku视频批量下载分类:
python
2013-06-13 14:13
15人阅读
评论(0)
收藏
举报用Python实现Youku视频批量下载前段时间由于收集视频数据的需要,自己捣鼓了一个YouKu视频批量下载的程序。
东西虽然简单,但还挺实用的,拿出来分享给大家。
版本:Python2.7+BeautifulSoup3.2.1import
urllib,urllib2,sys,os
from BeautifulSoup import BeautifulSoup
import itertools,reurl_i =1
pic_num = 1
#自己定义的引号格式转换函数def _en_to_cn(str): obj = itertools.cycle(['“','”'])
_obj = lambda x: obj.next()
return re.sub(r"['\"]",_obj,str)if __name__ == '__main__': #下载连续3个网页的视频while url_i <= 3:
webContent =
urllib2.urlopen("/focus/index/_page2 6716_" + str(url_i) + ".html")
data = webContent.read() #利用BeautifulSoup读取视频列表网页数据soup = BeautifulSoup(data)
print "-------------------------Page " + str(url_i) +
"-------------------------"
#获得相应页面的视频thumbnail和title的list
tag_list_thumb = soup.findAll('li','v_thumb')
tag_list = soup.findAll('li', "v_title")
for item in tag_list:
#通过每个thumbnail中的herf导向视频播放页面web_video_play =
urllib2.urlopen(item.a['href'])
data_vp = web_video_play.read()
#利用BeautifulSoup读取视频播放网页数据soup_vp = BeautifulSoup(data_vp)
#找到“下载”对应的链接
tag_vp_list = soup_vp.findAll('a', id = 'fn_download')
for item_vp in tag_vp_list:
#将下载链接保存到url_dw中
url_dw = '"' + item_vp['_href'] + '"'
print item.a['title'] + ": " + url_dw
#调用命令行运行iku下载视频,需将iku 加入环境变量os.system("iku " + url_dw) #保存每个视频的thumbnail
for item_thumb in tag_list_thumb:
urllib.urlretrieve(item_thumb.img['src'], "E:\\下载视频\\thumbnails\\" + str(pic_num) + "." +
_en_to_cn(item_thumb.img['title']) + ".jpg")
pic_num += 1
print
"--------------------------------------------------------------"
print "--------Page " + str(url_i) + "'s video thumbnails have been saved!"
url_i += 1 程序思想很简单,就是通过解析网页数据找到相应的视频播放网页链接,然后根据播放页面找到下载的链接,如下图所示:
由于从网页数据中获得的下载链接是必须通过youku自己的iku才能下载的。
这一点费了我一番周折,侥幸发现iku 这个软件的命令行非常简单(直接iku
download_link即可),所以最简单的办法就是利用Python 中的命令行接口os.system来调用iku来下载视频。
另外注意程序运行之前需要先启动iku,否则下载完一个视频就要再启动一次。
PS:下载视频的时候就会发现,国内这些视频网页做的真的不够精细,含有太多的重复链接和坏死链接,小小鄙视一下。
转载请注明出处:
/eyeszjwang/archive/2012/04/11/2 442894.html。