上篇文章我们通过一个实际的例子,讲述了一下如何爬取网站图片并下载下来,
博客:http://blog.csdn.net/sinat_37967865/article/details/79120145
在那个例子中,我们用到了一些库和方法,总结一下:
1. 在cmd中,通过pip3的方式安装库
2. BeautifulSoup4 库
3. requests 库
4. lxml 库
5. 获取源文件中各元素的方法
6. 设置编码方式
7. 文件及文件夹的操作
8. 防止爬虫被拒的解决办法
9. 导包的几种方式
10.循环的使用
后续希望详细学习一下每个知识点,知道其中的原理。