2020-08-02 17:05 已编辑字节跳动_今日头条_架构

关注

<span>2019-02-01 Python爬虫爬取豆瓣Top250</span>

这几天学了一点爬虫后写了个爬取电影top250的代码，分别用requests库和urllib库，想看看自己能不能搞出个啥东西，虽然很简单但还是小开心。

import requests
import re

# https://movie.douban.com/top250?start=25&filter=
# <span class="title">勇士</span>

count = 1


def getdata(url):
    data = requests.get(url)
    return data.text


def showdata(data):
    global count
    regex = re.compile(r"<span class=\"title\">(.*?)</span>")
    data = regex.findall(data)
    newdata = data.copy()
    for dataa in newdata:
        if "nbsp" in dataa:
            data.remove(dataa)
    for i in data:
        print(count, i)
        count = count + 1


for i in range(0, 10):
    i = i * 25
    url = "https://movie.douban.com/top250?start={}&filter=".format(str(i))
    data = getdata(url)
    showdata(data)

# 用requests来实现,正则表达式解析网页

import urllib
import urllib.request
import re
#https://movie.douban.com/top250?start=25&filter=
#<span class="title">勇士</span>

count = 1
def getdata(url):
    data = urllib.request.urlopen(url).read().decode("utf-8")
    return data


def showdata(data):
    global count
    regex = re.compile(r"<span class=\"title\">(.*?)</span>")
    data = regex.findall(data)
    newdata = data.copy()
    for dataa in newdata:
        if "nbsp" in dataa:
            data.remove(dataa)
    for i in data:
        print(count,i)
        count = count+1


for i in range(0,10):
    i = i*25
    url = "https://movie.douban.com/top250?start={}&filter=".format(str(i))
    data = getdata(url)
    showdata(data)

#用urllib来实现，正则表达式解析网页

emmmmmmm

全部评论

推荐最新楼层

每天简历上限投满

05-15 01:17

广州华商学院计算机类

前端24应届毕业生，投不到一个计算机岗

，升本二本，没有实习经验，项目只有自己平时写的，还有个毕设是用uniapp+spring boot自己手搓的，大神们该怎么修改？该往哪方向继续深造

实习，投递多份简历没人回复怎么办

点赞评论收藏

转发

菜鸟成长历程

04-09 11:20

哈尔滨工程大学能源动力类

嵌入式，25届，听劝

1.想问问大家这个简历怎么改去找暑期实习，大家都说简历最好一页，但是这个好难缩成一页呀。2.大家能提提建议简历怎么修改嘛，拜托了。3.还有能源动力这个专业愁死我了，本科是自动化，调剂来的能源动力，一直害怕找嵌入式工作因为能源动力卡我4.想冲暑期实习的大厂，就是找暑假的日常实习不是暑期实习，但是感觉就能源动力这都能把我卡死5.其实我是想找偏linux驱动的岗位，但是我这个学历和专业......#嵌入式##实习##听劝，这个简历怎么改#

听劝，这个简历怎么改

点赞评论收藏

转发

05-18 12:53

杭州电子科技大学计算机类

滴滴前端日常实习一面

一、前言 首先，面试官很和蔼，甚至我感觉和蔼过头了——他戴着牙套，长得很像我的有个高中同学，讲话也软绵绵的，不过听得出来是非常有实力的。 其次，面试环境非常嘈杂，各种噪音不绝于耳，怀疑是在一个办公室里面面试的，我甚至有时候听不清面试官在讲什么。 最后，面试官感觉是优点刻意的想跳过我和他的交流过程，想尽快的让我进行八股吟唱。这点稍微有点令人忍俊不禁。 不过总之，还是有收获一些东西的。 二、题目列表 自我介绍。 从我的简历上面自己选了一个项目让我讲，并问了团队规模，Github 上怎么去协作一个项目。 你的这个专业为什么会让你接触到前端这个方向？你是怎么看待前端这个岗位的呢？ GE...

点赞评论收藏

转发

点赞收藏评论

全站热榜

正在热议

# 牛客帮帮团来啦！有问必答 #

779317次浏览 12213人参与

# 机械制造薪资爆料 #

314227次浏览 3638人参与

# 海康威视求职进展汇总 #

97904次浏览 1179人参与

# 0offer是寒冬太冷还是我太菜 #

421427次浏览 4878人参与

# 投了多少份简历才上岸 #

59144次浏览 966人参与

# 荣耀求职进展汇总 #

68052次浏览 682人参与

# 提前批过来人的忠告 #

21318次浏览 437人参与

# 你的工作大概什么时候入职？ #

4347次浏览 53人参与

# 简历无回复，你会继续海投还是优化再投？ #

22468次浏览 316人参与

# 毕业租房也有小确幸 #

26784次浏览 1482人参与

# 晒一晒我的offer #

3418629次浏览 54784人参与

# 非技术岗是怎么找实习的 #

77141次浏览 1431人参与

# 工作压力大怎么缓解 #

10542次浏览 148人参与

# 产品人求职现状 #

51882次浏览 763人参与

# 宁德时代求职进展汇总 #

36399次浏览 401人参与

# 实习生应该准时下班吗 #

79555次浏览 587人参与

# 找工作中的意难平 #

194402次浏览 3441人参与

# 2022届毕业生现状 #

323580次浏览 4463人参与

# 产品实习，你更倾向大公司or小公司 #

38618次浏览 594人参与

# 本周投递记录 #

202222次浏览 5130人参与

牛客网
牛客企业服务