2019-08-06 17:01 已编辑河南理工大学 Java

关注

Python 利用Requests库爬取单个网页实例

实例一：京东商品页面的爬取

import requests
url = "http://item.jd.com/2967929.html"\
try:
    r = requests.get(url)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text[:1000])
except:
    print("Error")

实例二：亚马逊商品商品页面的爬取
与京东商品页面爬取不同的是，亚马逊对爬虫访问有较好的限制，因此我们要把爬虫模拟成浏览器的访问

import requests
url = "https://www.amazon.cn/gp/product/B01M8L5Z3Y"
try:
    kv = {'user-agent': 'Mozilla/5.0'}
    r = requests.get(url, params = kv)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text[1000:2000])
except:
    print("Error")

实例三：百度搜索关键词提交
这个例子是利用爬虫向百度搜索提交一些关键词，然后爬取百度对这些关键词的搜索信息
百度搜索接口：http://www.baidu.com/s?wd=keyword

import requests
keyword = "Python"  # 设置关键词为Python
try:
    kv = {'wd':keyword}
    r = requests.get("http://www.baidu.com/s", params=kv)
    print(r.request.url)
    r.raise_for_status()
    print(len(r.text), r.text[:1000])
except:
    print("Error")

实例四：网络图片的爬取和存储
在网上任意找到一张图片右键单击图片，选择复制图片地址即可得到图片的url

import requests
try:
    path = "E:\pictures"    # 设置保存路径
    url = "http://img0.dili360.com/pic/2019/03/26/5c9a065e910d05u57137556.jpg"
    r = requests.get(url)
    r.raise_for_status()
    with open(path, "wb") as f:
        f.write(r.content)
    f.close()
except:
    print("Error")

实例五：ip地址归属地的自动查询
有一个网站 http://m.ip138.com 可以提供ip地址查询的功能
提供的查询接口为：http://m.ip138.com/ip.asp?ip=ipaddress

import requests
try:
    url = "http://m.ip138.com/ip.asp?ip="
    r = requests.get(url + '204.204.80.112')
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text)
except:
    print("Error")

课程为：中国大学MOOC嵩天老师的网络爬虫

全部评论

推荐最新楼层

11-14 12:21

基恩士_销售工程师(准入职员工)

基恩士内推，基恩士内推码

问题（面试刚开始会让做一个自我介绍，可以提前准备一下） 1.我是如何实现一周涨粉5000+的？ 这个问题是根据经历上面的经验提问的 我简单回答了一下 选题策划-AB测试-评论转换-账号定位一些内容 2.为什么开始这个小红书运营项目？ 其实这是老师布置的小组作业 我回答：有项目想法-调研后熟悉小红书规则等等 3.在运营账号过程中有没有低谷期或者困难你是怎么解决的？ 这个问题的核心：就是问你遇到困难是如何解决的？ 4.你有没有向他人推销产品的经历？如果有你是如何推销的？ 这个我刷到收到面试的同学好像都问了 这个问题必须准备，好好回答是一个必答题 5.你推销产品时其他人是什么反应？ 我当时的回答是“...

点赞评论收藏

分享

11-13 12:49

魔门塔（苏州）科技有限公司_感知算法工程师(准入职员工)

momenta内推momenta内推

momenta自动驾驶C++日常实习一面面经流程时间线：3.25HR联系约一面3.25晚7点一面3.26早上通知一面通过约二面3.26下午5点二面3.27早上HR沟通入职时间，已OC。一面流程：无手撕50min1.自我介绍2.面试官介绍部门职责(不涉及算法开发，是否能接受)3.简历浅挖（面试官大概率不是规控方向的，对项目可能了解不多,后续了解到是电气背景的）(1)hybird启发项如何设计(2)介绍latticeplanner流程(3)项目中涉及哪些传感器，如何获取heading angle。4.一系列C++,Linux,ROS八股（只列出部分还记得的）1.听说过rvo嘛2.知道raii嘛，原...

点赞评论收藏

分享

11-11 13:51

已编辑

北京理工大学珠海学院嵌入式软件工程师

找到一个实习，是你，你去干吗？

孙艹肘：校招不给三方直接让实习我都去了，

，主打一个在学校呆着也是闲着，不如出来实习一下

点赞评论收藏

分享

09-25 00:21

湖南工业大学嵌入式工程师

嵌入式一定要报培训班才能找到工作吗！！！🥹

一本投了400多份无面，难道真的要去报培训班才可以找到工作吗

故事和酒66：假设一下，就算报了培训班，不还是要投简历，只是项目改了。那不如先写几个培训班的项目，纯靠编，然后试试有没有面试。如果真有再报也不迟，如果没有还是没有，那就不是培训班的问题了。

点赞评论收藏

分享

11-13 14:13

睿琪软件_产品经理(准入职员工)

滴滴内推，滴滴内推码

滴滴后端一二面面经一面40min纯技术面，面试官很友好，时不时会对你微笑，然后点头表示肯定，答对了还会说说得对。挑选一个你最想介绍的项目介绍一下，没有深挖。八股盛宴：C++、C、数据结构、数据库。总结就是不是简单的问你什么是虚函数，然后你说个虚指针，虚函数表就完事了。还会问你空指针可以调用类的方法吗？调用虚函数或者非静态成员变量的非虚函数为什么会崩溃？在什么阶段？大概就是这个意思，所以需要对每个方向的知识点有很深的理解，或者说实际开发中切实的应用过才能答得出来。二面25min个人感觉是目前为止碰到的最让人不解的面试官，全程皱着眉头，问的问题我没理解清楚也不会过多解释，直接默认我不会，然后说那我...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 职场中那些令人叹为观止的八卦 #

11239次浏览 153人参与

# 你找工作想离家近 or 离家远？ #

8158次浏览 157人参与

# 百度秋招 #

45090次浏览 364人参与

# 我的职场社死时刻 #

9296次浏览 105人参与

# 如何拒绝/反向PUA #

82843次浏览 372人参与

# 你父母给过你哪些不靠谱的职场建议？ #

8059次浏览 138人参与

# 腾讯音乐秋招 #

423078次浏览 4740人参与

# 秋招吐槽大会 #

46239次浏览 424人参与

# 哪些公司开始补录了 #

9036次浏览 114人参与

# 那些年，我收到的‘奇葩’回复 #

5308次浏览 55人参与

# 职场中对你有帮助的书 #

23344次浏览 213人参与

# 你秋招最后悔的选择 #

8104次浏览 69人参与

# 租房前辈的忠告 #

273862次浏览 7195人参与

# XX请雇我工作 #

6876次浏览 72人参与

# 秋招你经历过哪些无语的事 #

5230次浏览 59人参与

# 月薪多少能在一线城市生存 #

92869次浏览 676人参与

# 假如你的老板掉河里，你的工作能为他做什么 #

39824次浏览 402人参与

# 通信硬件知识分享 #

39237次浏览 527人参与

# 你觉得机械有必要实习吗 #

66707次浏览 481人参与

# 交通银行工作体验 #

20908次浏览 69人参与

# 中科曙光工作体验 #

5254次浏览 23人参与

# 秋招疯了，看什么都像offer #

8191次浏览 95人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务