爬虫实战项目(一)

本次项目主要是爬取某论坛网站
明确目标
1.帖子
2.回答
3.用户信息(如果抓取用户,通过粉丝和关注进行抓取)
抓取策略
全站抓取策略:通过herf链接进行抓取
分析抓取网站的数据构成,避免出现循环,分散的抓取
页面是否动态
一般都是静态页面,详细见
https://www.cnblogs.com/bluesungz/p/5955170.html

全部评论

相关推荐

07-22 11:12
门头沟学院 Java
不是,我就随手投的怎么还真发面试啊
皮格吉:大厂特别快的——来自已经被共享中
点赞 评论 收藏
分享
06-12 16:23
已编辑
小米_软件开发
点赞 评论 收藏
分享
码农索隆:竞争压力小,就你一个不用卷
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务