资源名称:Python网络数据采集 ([美] 米切尔) 中文
第一部分 创建爬虫
第1章 初见网络爬虫 2
第2章 复杂HTML解析 11
第3 章 开始采集 26
第4 章 使用API 42
第5 章 存储数据 61
第6 章 读取文档 80
第二部分 高级数据采集
第7 章 数据清洗 94
第8 章 自然语言处理 103
第9 章 穿越网页表单与登录窗口进行采集 120
第10 章 采集Javascript 128
第11 章 图像识别与文字处理 139
第12 章 避开采集陷阱 154
第13 章 用爬虫测试网站 164
第14 章 远程采集 174
资源截图: