Python 3.7.2 IDLE 纯手工编写 代码简单易懂 注释详细
代码特点:
0.代码已经做防反爬虫处理
1.Python利用多线程按分页爬取某食品网站休闲食品前80页文章源码
2.直接保存SQL文件,可以自行修改数据库字段,方便入库
3.学院级代码难度,每个操作都写成函数,方便修改的调用
注释详细,很适合入门学习或做为代码样板扩展爬取其他网站
4.代码自动容错,如果爬取有错误,不是报错终止,而是将错误网址保存,继续爬取下一个网址
语言版本:Python 3.7.2
开发工具:Python自带 IDLE
使用库名:urllib, requests, re, threading, time
都是爬虫必用库
其他技术:HTML,正则表达式,MySQL
QQ 67052796