爬虫开发实习生

150-180元/天
Python
深圳
本科
5天/周
最少3个月
有转正
岗位关键词
岗位职责
1. 参与公司爬虫工具的设计与开发,重点负责基于 Python 的动态网页数据采集模块编写与优化,熟练运用 Playwright 框架处理 JS 渲染页面,提升复杂场景下的数据抓取效率。 2. 协助团队完成网页数据抓取、解析与存储全流程,针对含反爬机制的目标站点,开展JS 逆向分析,破解参数加密、签名验证等限制,保障数据准确性与完整性。 3. 研究并应用JS 注入技术,实现对动态加载内容的精准捕获,同时探索 IP 代理池、请求频率控制等反反爬策略,持续提升爬虫稳定性与运行效率。 4. 与团队协作开展爬虫工具测试与调试,针对 JS 逆向过程中出现的参数异常、加密逻辑变更等问题,快速定位并修复,确保爬虫工具正常迭代。 5. 关注爬虫领域最新技术动态,尤其是 Playwright 进阶用法、JS 逆向新工具(如 AST 反混淆)、JS 注入创新场景等方向,定期输出技术调研报告,提出工具性能优化建议。
岗位要求
1. 计算机科学与技术、软件工程、信息安全等相关专业本科及以上学历,大三、大四或研一、研二在读优先,能保证 3 个月及以上全职实习时长。 2. 熟练掌握 Python 编程语言,具备良好的代码规范与面向对象编程思维,能独立编写可复用的爬虫脚本; 3. 熟悉网络爬虫基本原理与常用技术,深入理解 HTTP/HTTPS 协议、HTML DOM 结构、CSS 选择器;掌握 Playwright 框架核心用法,能实现页面自动化操作、动态内容抓取与截图 / 录屏调试。 4. 熟悉异步化编程,熟练掌握多线程、多进程任务的计算机基础知识以及相关用法,了解GIL的基本概念。能够针对项目性能进行合适的资源分配。 5. 具备基础的JS 逆向能力,了解JS逆向的基本概念以及操作流程。能够掌握浏览器开发者工具的信息基本定位工具,能够了解HOOK脚本的基本概念以及编写HOOK脚本的能力者优先。 6. 了解JS 注入技术原理,能编写简单的注入脚本实现页面元素修改、请求拦截与篡改,辅助突破前端反爬限制;熟悉 HTML5、Vue/React 等前端框架者优先。 7. 了解基本的GUI知识,可使用GUI框架(如Tkinter、PyQt等)快速搭建并开发基本的GUI程序。 8. 具备较强的学习能力与问题解决能力,面对未知反爬场景能主动查阅资料、调试分析;有独立完成的爬虫项目(需包含动态页面抓取或 JS 逆向场景)或相关技术竞赛经历者优先。 9. 具备良好的沟通协作能力与责任心,能清晰同步开发进度与遇到的问题,积极参与团队技术讨论。 我们提供:周末双休,弹性工作,自由创新的技术氛围,扁平化管理,没有Dirty work
龙华区中佳创意园C2栋215
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
浩迹智能
人工智能
天使轮
深圳市
查看其他 4 个职位