爬虫第7节

Beautiful Soup库

安装

如果只有IDLE,应该是需要安装的,打开CMD,输入以下命令

pip install beautifulsoup4

如果使用的其他的,会自带,不用安装。

简单运用

import requests
from bs4 import BeautifulSoup #从beautifulsoup4(bs4)库中导入BeautifulSoup对象

url = "http://www.baidu.com"

try:
    kv = {'user-agent' :'Mozilla/5.0'}
    r = requests.get(url,headers = kv)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    demo = r.text
    soup = BeautifulSoup(demo,'html.parser')
    print(soup.prettify()) #按照html的dom树结构进行显示
except:
    print("爬取失败")
全部评论

相关推荐

03-19 09:58
河海大学 Java
最喜欢春天的奇亚籽很...:同学,是小红书不是小哄书,一眼就能看到的错误
投了多少份简历才上岸
点赞 评论 收藏
分享
03-29 18:59
运城学院 Java
程序员小白条:咱们要对自己的简历和学历有清晰的认知,不要动不动就大厂了....都26届了,没实习还想着大厂,唉
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务