职位详情

暂时没有符合条件的职位

搜狐焦点-爬虫工程师

技术类
岗位职责
1、负责分布式爬虫系统的核心架构设计以及系统规划。
2、负责特定网站的抓取工作。
3、负责爬虫前沿技术探索与创新。
4、结合业务背景,优化爬虫路由调度策略,完善爬虫体系。
岗位要求
1、计算机相关专业;
2、有较强的学习能力;思维活跃;喜欢钻研和解决问题,乐于分享;
3、掌握PC网页抓取原理及技术,包括基于Cookie的登录管理,基于headless的采集,熟悉正则表达式、XPath、Jsoup等网页信息抽取技术;
4、对APP采集有丰富经验,包括抓包工具,中间人代理二次开发以及APP模拟器等优先考虑;
5、有APP反编译识别,修改内核浏览器经验者,优先考虑;
6、熟悉Scrapy、Pyspider、nutch等主流爬虫框架使用,了解js引擎技术等优先考虑;
8、有数据爬取、通用爬取、爬虫平台搭建处理经验优先考虑;
9、有机器学习、自然语言处理、图像处理等学习背景和经验的优先考虑;
10.具备较强的团队协作精神,工作责任心强,良好的沟通、理解和执行能力。

工作地点:北京。

搜狐集团

互联网

上市公司

北京

搜狐集团是第一家拥有搜狐公司(NASDAQ: SOHU)、畅游公司(NASDAQ:CYOU)和搜狗公司(NYSE:SOGO)三家美国上市公司的中国互联网企业,是中文世界最强劲的互联网品牌之一。也是2008北京奥运会互联网内容服务赞助商。搜狐为超过7亿的中国互联网和移动互联网用户提供优质服务。

http://www.sohu.com/

  • 笔试

    0
  • 面试短评

    0
  • 面经

    0

扫一扫,把题目装进口袋

牛客网,程序员必备求职神器

扫描二维码,进入QQ群

扫描二维码,关注牛客网公众号

  • 公司地址:北京市朝阳区大屯路东金泉时代3-808北京牛客科技有限公司
  • 联系方式:010-60728802(电话) admin@nowcoder.com
  • 牛客科技©2018 All rights reserved
  • 京ICP备14055008号-4
  • 京公网安备 11010502036488号