python快速使用Urllib爬取网页
import urllib.request(先导入Urllib模块)
file=urllib.request.urlopen("http://www.baidu.com")(定义file变量,爬取百度网页)
data=file.read() (读取网页全部内容)
print(data)
fhandle=open("E:/学习文件夹/python练习/2.html","wb") (将爬取到的网页保存到指定目录,并以“wb”即二进制写入的方式打开)
fhandle.write(data) (打开后将句柄赋给变量fhandle,然后使用write()方法写入data,写入后在通过close方法关闭文件)
fhandle.close()
然后运行:
只是图片暂时没有爬取出来。。。
更多精彩文章请关注微信公众号:YQ编程,或微信扫描以下二维码关注,还有许多IT类电子书等你来拿。
Linux系列 文章被收录于专栏
本专栏收录Linux系列内容,包括但不限于中间件、shell