尝试了一下Python爬小说

和同学聊天的时候他告诉我,他看小说的这个网站防盗版做的很牛逼,网上都找不到盗版,我有点不信,连起点这些都到处是盗版,总不能一个不知名小说网站在安全上做的比这些大站还牛逼吧,所以就尝试了一下。

普通的章节毫无难度,直接就可以爬下来了,VIP 章节没尝试,太穷了,啥时候有钱了去充个VIP 来试试,我感觉应该都差不多,对于这个网站没有盗版的原因呢,,,可能是名气太小了,又整了VIP ,大佬们都忙着爬大站,所以这些VIP 章节被忽略了

# coding:UTF-8
from urllib import request
from bs4 import BeautifulSoup
url = "https://b.faloo.com/p/614602/1.html"
r = request.Request(url)
download_response = request.urlopen(r)
download_html = download_response.read().decode('gb2312', 'ignore')
soup = BeautifulSoup(download_html, 'html5lib')
texts = soup.find_all(id='content')   #获取content标签的内容
soup_text = BeautifulSoup(str(texts), 'lxml')
content = soup_text.get_text('\n', '<br>')  #替换<br>为换行
f = open('1.md', 'w+')
for line in content:
    if line == "-":
        break
    else:
        f.write(line)
全部评论

相关推荐

野猪不是猪🐗:现在的环境就是这样,供远大于求。 以前卡学历,现在最高学历不够卡了,还要卡第一学历。 还是不够筛,于是还要求得有实习、不能有gap等等... 可能这个岗位总共就一个hc,筛到最后还是有十几个人满足这些要求。他们都非常优秀,各方面都很棒。 那没办法了,看那个顺眼选哪个呗。 很残酷,也很现实
点赞 评论 收藏
分享
刘湘_passion:出国旅游?那就小心你的腰子咯
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务