今天突然想去下点评书放到手机里听,找到个网站,放眼望去116个链接,平均一个要点五次鼠标,实在懒得去点,折腾下写一个python吧。
具体代码:
import sys, urllib, re
from BeautifulSoup import BeautifulSoup
local_type = sys.getfilesystemencoding()
for i in range(1, 2):
url = 'http://www1.5ips.net/down_45_' + str(i) + '.htm'
wp = urllib.urlopen(url)
content = wp.read()
soup = BeautifulSoup(''.join(content))
outstr = soup.findAll('a', href=re.compile("^http://p186"))[1]
print str(outstr).decode("UTF-8").encode(local_type)
遇到一些问题,例如Python在windows命令行里会有乱码,例如BeautifulSoup太飘逸一下适应不了等等,不过细心上网查查,试一试就好了,这个代码会提取出下载页面中的链接,接下来就是保存到文件了。需要下载116个链接的话把i的范围修改下就好。
参考链接:
原本的吉祥物: