# -*- coding: utf-8 -*-
#---------------------------------------
# 作者:chendn
# 语言:Python 2.7.10
#---------------------------------------import string,urllib2
def tieba(url,beginPage,endPage):for i in range(beginPage,endPage+1):htmlName=string.zfill(i,3)+'.html' #自动填充成3位的文件名,i=1的时候htmlName=001.htmlprint '正在下载第'+str(i)+'个页面'+htmlNamecreateHtml=open(htmlName, 'w+') #我理解的是创建一个空白的html页面,名字为htmlName,w+表示读写tiebaHtml=urllib2.urlopen(url+str(i)).read() #读取要抓取的页面createHtml.write(tiebaHtml) #将抓取的页面写入空白页面createHtml.close() #关闭页面,完成
url='http://tieba.baidu.com/p/3977277793?pn='
tieba(url,1,5) #显示该帖的前5页
转载于:https://www.cnblogs.com/maixiaopai/p/4769404.html