2020-10-07 16:45 中北大学 Java

关注

requests库网络爬虫------爬取实例（页面抓取，接口使用）

京东商品页面的爬取

选取一个商品页面

import requests
url = "https://item.jd.com/100011333796.html#crumb-wrap"
try:
    #更改头部信息，模拟浏览器访问
    kv = {
   'user-agent': 'Mozilla/5.0'}
    r = requests.get(url, headers = kv)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text)
except:
    print("爬取失败")

百度（360）关键词提交

baidu

import requests
keyword = "Python"
try:
    kv = {
   'wd': keyword}
    r = requests.get("http://www.baidu.com/s", params = kv)
    print(r.request.url)
    r.raise_for_status()
    print(len(r.text))
except:
    print("爬取失败")

360

import requests
keyword = "Python"
try:
    kv = {
   'q': keyword}
    r = requests.get("http://www.so.com/s", params = kv)
    print(r.request.url)
    r.raise_for_status()
    print(len(r.text))
except:
    print("爬取失败")

网络图片的爬取与存储

爬取csdn上的某张图片

import requests
import os
kv = {
   'user-agent' : 'Mozilla/5.0'}
url = "https://imgconvert.csdnimg.cn/aHR0cHM6Ly9tbWJpei5xcGljLmNuL21tYml6X2pwZy8xaFJlSGFxYWZhZTN5bVlZanN2TWRmRnB4YUZiY3VNRFBOVXNPNzg0NWZST0V1cmVTNGdWWmliYXYyWTIzYlI1WXZmUWRJNjJVTWhLNWJyTWRpYXRDSnJnLzY0MA?x-oss-process=image/format,png"
root = "E://python爬虫学习//"
path = root + '不想奋斗.' + url.split(',')[-1]
try:
    if not os.path.exists(root):
        os.mkdir(root)
    if not os.path.exists(path):
        r = requests.get(url, headers = kv)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        #print(r.status_code)
        with open(path, 'wb') as f:
            f.write(r.content)
            f.close()
            print("文件保存成功")
    else:
        print("文件已存在")
except:
    print("爬取失败")

IP地址归属地的自动查询

手动查询网址：https://www.ip138.com/
查询中北大学网址

import requests
kv = {
   'user-agent' : 'Mozilla/5.0'}
url1 = "https://www.ip138.com/iplookup.asp?ip="
url2 = "&action=2"
try:
    r = requests.get(url1 + '202.207.177.39' + url2, headers = kv)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text[1000:1800])
except:
    print("爬取失败")

全部评论

推荐最新楼层

昨天 11:17

门头沟学院 Java

实习是选平台还是业务

我觉得得根据个人的情况来说，如果你已经有了一段大厂实习，第二段实习遇到大厂边缘业务和中小厂核心业务的时候应该是偏向于中小厂的。因为核心业务相对来说不管是自己的产出还是偷产出都会更容易一点。第一段大厂的背书+第二段中小厂核心业务，这个竞争力还是可以的。但如果是第一段实习面临大厂和中小厂就是无脑大厂了，因为这个背书太重要了，另外你还可以接触到完整且规范的研发流程，对后续的发展是很有帮助的。

找实习是选平台还是选业务...

点赞评论收藏

分享

11-21 15:51

字节跳动_国际电商-营销平台_后端(实习员工)

有了实习之后，都会问哪些通用问题？

推荐各位有精力的同学可以搞个文档，提前就把相关问题的答案写好。通过书面表达来整理自己的逻辑。我也会在每个问题的后面都附上我一般是怎么回答的。所有内容不一定正确，仅供参考。如果你有更好的回答方式，也可以评论区留言。优先使用STAR法则来回答面试官的问题：STAR 法则是由 Situation（情境）、Task（任务）、Action（行动）、Result（结果）四个英文单词首字母组成的框架，能帮助使用者逻辑清晰、重点突出地描述具体经历。各维度关键要点Situation：明确事件发生的背景，包括时间、地点、所处环境等，简要说明 “当时处于什么情况”。Task：阐述在该情境下需要完成的任务、目标或面临...

代码之外的生存之道

点赞评论收藏

分享

11-06 20:17

重庆邮电大学 Java

三个月速通java

本大三鼠鼠7月半的时候才浑然醒悟，开始选择了走java这一条路，然后也是疯狂的学，每天十小时，然后前段时间实在忍不住了，看见大多数人都在说金九银十，也是把自己写的项目包装了一下，然后开始海投（因为我觉得我比较水，所以说就只投了小厂），也是不负守望，拿下三个实习，现在就等着最后一个offer了（感觉这个更好，所以说前面两个就不准备要了，希望能顺利得到offer）（我是双非，不太算科班，完全java零基础，只能说实习很好找，但是工作不好找，尝试投了一下秋招的那种，但是秒挂）java还是有活路的，刚好温饱是够的

在debug的伊泽瑞...：重邮标红加粗

点赞评论收藏

分享

09-29 00:03

门头沟学院 Java

哈哈，兄弟们，这份实习可以去吗😁

Data_Seven：这不纯黑奴吗

点赞评论收藏

分享

11-19 11:21

门头沟学院算法工程师

xhs真的很大方了

xhs真的给的很大方的，今年校招线下面试包了大家几天酒店，报销路费。其他什么叫得上名的公司几乎没有一家能做到，线下面试全部自己倒贴，找工作还真的得公司看对求职者的态度。

达芬骐：CVTE也报销

，敢不敢来

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 找实习是选平台还是选业务？ #

2194次浏览 20人参与

# 记录实习开销 #

166139次浏览 642人参与

# 小红书开奖了 #

38187次浏览 190人参与

209345次浏览 1384人参与

# 科大讯飞工作体验 #

30116次浏览 73人参与

# 秋招疯了，看什么都像offer #

19353次浏览 130人参与

# 百度秋招 #

53790次浏览 391人参与

# 应届生第一份工作最好去大厂吗？ #

87732次浏览 885人参与

# 材料转码还有必要吗？ #

33015次浏览 155人参与

# 华为工作体验 #

244362次浏览 1304人参与

# 实习学到最有价值的工作习惯 #

42307次浏览 368人参与

# 办公室恋情是职场大忌吗 #

11182次浏览 21人参与

# 设计人的面试记录 #

167955次浏览 1546人参与

# 华为池子有多大 #

125453次浏览 811人参与

# 你知道哪些职场黑话？ #

65735次浏览 454人参与

# 电信求职进展汇总 #

29552次浏览 159人参与

# 招银网络科技工作体验 #

26323次浏览 95人参与

# 实习生应该准时下班吗 #

318564次浏览 1718人参与

# 研究所VS国企，该如何选 #

226927次浏览 1944人参与

# CVTE求职进展汇总 #

27280次浏览 327人参与

# 移动求职进展汇总 #

14584次浏览 119人参与

# 蚂蚁求职进展汇总 #

134408次浏览 1214人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务