真实 Python 爬虫面试题



笔试题


1. python 常用数据结构有哪些?请简要介绍一下。


2. 简要描述 Python 中单引号、双引号、三引号的区别。


3. 如何在一个 function 里面设置一个全局的变量?


4. Python 里面如何拷贝一个对象?(赋值、浅拷贝、深拷贝的区别)


5. 如果 custname 字符串的内容为 utf-8 的字符,如何将 custname 的内容转为 gb18030 的字符串?


6. 请写出一段 Python 代码实现删除一个 list 里面的重复元素。


7. 这两个参数是什么意思:*args,**kwargs?


8. 统计如下 list 单词及其出现次数。


a=['apple', 'banana', 'apple', 'tomato', 'orange', 'apple', 'banana', 'watermeton']


9. 给列表中的字典排序:假设有如下 list 对象


alist=[{"name":"a", "age":20}, {"name":"b", "age":30}, {"name":"c", "age":25}]


将 alist 中的元素按照 age 从大到小排序。


10. 写出下列代码的运行结果


a = 1 def fun(a):   a = 2 fun(a) print(a)


a = [] def fun(a):   a.append(1) fun(a) print(a)


class Person: name = 'Lily' p1 = Person() p2 = Person() p1.name = 'Bob' print(p1.name) print(p2.name) print(Person.name)


11. 假设有如下两个 list:a = ['a', 'b', 'c', 'd', 'e'],b = [1, 2, 3, 4, 5],将 a 中的元素作为 key,b 中元素作为 value,将 a,b 合并为字典。


12. 使用 python 已有的数据结构,简单的实现一个栈结构。


面试官提的问题


1. 项目上遇到了哪些难点?如何解决?


2. 数据如何去重,清洗,存入数据库?


3. 有一个升序后又降序的数组,比如 1356742,如何查找到 2 的位置。


4. 如何查找到二叉树两个节点的最低公共祖节点?


5. mysql 的序列都有哪些?


6. 遇到哪些反爬机制?如何解决?





#打开Python的大门##python爬虫##python面试##Python面经##python开发实习#
全部评论
感谢大神分享,学到了
点赞 回复 分享
发布于 2022-09-22 11:15 江苏

相关推荐

09-20 19:53
已编辑
广州商学院 数据采集
公司不大不小给我来说足够了,可惜好像很难转正。说是数据开发实际上是数据采集,能感觉到面试官对数据采集也不是很熟悉问的问题更倾向项目内容,名创优品的爬虫面试就是纯拷打了从基础到深入的技术问题。第一个:playwright跟selenium的区别,因为从一开始就用playwright我只知道一个异步,也回答了因为从一开始就使用了playwright框架所以对selenium也不太了解。第二个:谈谈反爬经历,我主要讲了youtube逆向以及cloudflare的绕过第三个:出现爬不到内容该如何排查,网页结构,ip池,cookies池,u-a头第四个:最难的项目,上份实习的监控系统youtube逆向以及cloudflare的绕过还有一个网页的逆向,最后是crawlab爬虫管理技术第五个:验证码,我实话实说没有接触验证码,因为通常拿playwright指纹绕过会更简单快捷,所以基本没有接触过验证码的绕过。第六个:大规模数据的保存,先用redis保存到一千到五千时再统一存入mysql第七个:mysql的运用,当时说了一个系统的mysql使用逻辑第八个:问我上份实习部署工作是是否为我做的,我说了是自己使用docker部署到服务器的第九个:ai技术如何运用到爬取,我说了使用openai可以很有效的解决爬虫对于数据模糊爬取难的情况,以及crawl4ai的工作原理第十个:爬虫的开发流程,我说主要是根据时间以及爬取的量,短时间可以用自动化工具,如果量大而且有时间则是用逆向加scrapy的协议爬虫,他说我太笼统了,于是我追加了crawlab的爬虫监控技术还有docker的多容器通信这些。后面就没了,面试官也介绍了一下他的团队,3点半左右线上面试结束,4点左右hr就在boss问我一会是否有时间电话沟通确认到岗时间还有薪资情况,说第二天就发offer了
查看10道真题和解析
点赞 评论 收藏
分享
评论
12
63
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务