资源详情
[Python爬虫]---分布式爬虫
第一讲_第一个爬虫
第二讲_多线程、多进程的
第三讲_分布式数据
第四讲_爬虫任务调度、分布式爬虫
第五讲_PageRank、动态重排技术
第六讲_更有效率的爬取:利用网站的分布式部署及应对反爬_
第七讲_表单登录、动态页面抓取
第八讲Scrapy
第九讲网页去重及噪声处理
课件和源码
下载地址
链接 https://pan.baidu.com/s/174oYJniE9ioW2G3f_LF8zg 密码 7pzq