求职首页 > 搜狐集团

投递规则

每位同学通过内推or网申至多可申请3个职位,申请职位超过3个,系统将自动提示无法继续推荐。

职位详情

暂时没有符合条件的职位

搜狐焦点-爬虫工程师

岗位职责
1、负责分布式爬虫系统的核心架构设计以及系统规划。
2、负责特定网站的抓取工作。
3、负责爬虫前沿技术探索与创新。
4、结合业务背景,优化爬虫路由调度策略,完善爬虫体系。
岗位要求
1、计算机相关专业;
2、有较强的学习能力;思维活跃;喜欢钻研和解决问题,乐于分享;
3、掌握PC网页抓取原理及技术,包括基于Cookie的登录管理,基于headless的采集,熟悉正则表达式、XPath、Jsoup等网页信息抽取技术;
4、对APP采集有丰富经验,包括抓包工具,中间人代理二次开发以及APP模拟器等优先考虑;
5、有APP反编译识别,修改内核浏览器经验者,优先考虑;
6、熟悉Scrapy、Pyspider、nutch等主流爬虫框架使用,了解js引擎技术等优先考虑;
8、有数据爬取、通用爬取、爬虫平台搭建处理经验优先考虑;
9、有机器学习、自然语言处理、图像处理等学习背景和经验的优先考虑;
10.具备较强的团队协作精神,工作责任心强,良好的沟通、理解和执行能力。

工作地点:北京。

搜狐集团

互联网

上市公司

北京

搜狐集团是第一家拥有搜狐公司(NASDAQ: SOHU)、畅游公司(NASDAQ:CYOU)和搜狗公司(NYSE:SOGO)三家美国上市公司的中国互联网企业,是中文世界最强劲的互联网品牌之一。也是2008北京奥运会互联网内容服务赞助商。搜狐为超过7亿的中国互联网和移动互联网用户提供优质服务。

http://www.sohu.com/

  • 笔试

    0
  • 面试短评

    0
  • 面经

    0
牛客网,程序员必备求职神器
QQ群:169195721
微 信:www_nowcoder_com 关注
微 博:牛客网 关注

扫一扫,把题目装进口袋