首页 > 试题广场 >

设计一个简单的网页抓取系统,目标是抓取z.baidu.com

[问答题]

设计一个简单的网页抓取系统,目标是抓取z.baidu.com站点上的有价值网页。

1) 请设计基本模型,并做出简要说明。

请考虑如何获取网页、如何存储网页、如何判断网页的价值。。。。。。。。

2) 实际应用中,需要考虑哪些因素。

好开放的题目。。
发表于 2014-10-10 10:44:21 回复(0)