2018-11-26 11:07 已编辑杭州电子科技大学 Java

关注

秋招总结分享，数据研发方向，阿里，网易，华为等

秋招总结

秋招结束了，从六七月份开始到十一月，从艰难的准备阶段，到忙碌的面试奔波，感慨良多。我面的基本上都是杭州的公司，目前拿到的offer有，网易互娱、雷火、华为、海康、拼多多、滴滴、51，大部分是数据研发岗位。写个经验总结,回馈牛客。

岗位选择

在准备复习之前首先应该确定的是自己的岗位方向，然后再针对性地去寻找面经和资料复习。我当时可选的是数据挖掘算法和数据研发两个方向，因为不同的公司对岗位的具体要求有一些差别，导致我有些迷惑。我自身因为工程和算法比赛都接触过，但是在算法原理方面了解的还是比较少的，所以当时有一些退缩了，选择了数据研发方向。其实机器学习的薪资在今年来看更诱人，从我的经历来看我觉得也能找到不错的工作。当然这都是后话，确定岗位之后就是怎么准备了。

复习准备

我大概是从六月开始准备，刚开始最大的困难就是不知道该如何准备效果好。看到其它实验室的同学年后就开始准备了，并且秋招的提前批七月左右就开始，很着急，其实现在想来，踏实复习才是关键，不能因为着急而导致知识点一知半解。大厂对基础的要求相对来说更高，其次是自身的亮点。

面试中第一关一般都是手撕代码，其实代码题把剑指Offer过两遍就能应付大多数面试算法了，因为面试的时候不可能让你写很长的代码。学有余力去刷 leetcode。

其它知识点可以先把相应岗位的面经都保存下来，再去总结重要的知识点。知识点形成体系比较重要，可以画个体系图不断回顾。比如，Java 的JVM部分，集合类部分，并发部分，分开整理形成知识体系。把自己保存的面经上的问题都准备一遍，其实面试就不虚了。

其它

暑期实习的经历挺重要的，但是我们实验室不给实习比较可惜。
提前批的机会要把握好，也就是多一次机会。大厂其实十一月份可能还有补招。
早点准备，将自身的亮点表现给面试官。

面经

分享自己面的几个比较典型的面经。

蚂蚁金服数据研发五面

蚂蚁是我第一个面的，也是最可惜的一个，很后悔当时自己没有准备好。大概面了五面，但是因为当时复习不够好，面试表现不够好，没能拿到 offer。阿里都是电面，前后时间拉得也比较长。

一面

自我介绍
项目
设计支付宝 APP 滑动条的推荐系统，算法，架构实现
用户轨迹如何获取特征，点击条目 7-5-2-4 这种， word2vec 怎么构建句子特征
GC
Linux 10个进程10个线程，系统如何调度
线程池，poolsize 5 , 进来第六个线程，会发生什么
Java 锁机制，悲观锁、乐观锁
数据结构题，青蛙跳台阶，二叉树层序遍历

二面

天池比赛项目及思路，为什么选择 XGBoost
推荐系统是什么，给完全不懂的人讲一讲（按分类讲各种算法）
协同过滤的缺点，现在流行怎么做（协同过滤目前更多用于召回）
讲一讲逻辑回归，原理及推导
Synchronized。锁在操作系统级别的实现
Java 中的并发包
Linux 进程调度
网络相关协议
Zookeeper ***算法，Paxos
用命令行敲命令存储一个文件到 HDFS 上，源码级别是怎么样一个流程
Linux 的基本命令，如何查看内存使用等
动态规划和分治法的区别

三面

项目自己发挥，追问细节
觉得自己是个怎样的人，别人觉得自己怎样
有过比较大的挫折吗
自己做过最有成就感的事情

四面

讲一个项目
项目中的细节追问（线上 A/BTest 怎么做，对结果怎么优化）
项目中自己做的亮点
一个环形链表里面存数字，如何最快速度找到指定数字
一个文件，里面是英文小说，统计词频最高的两个词
notify() 和 sleep() 的区别（应该问错了，wait() 和 sleep() ），在源码中哪里看到过 (阻塞队列)
线程池，corePoolsize 5 ,max 200 ，什么时候线程池中有10个线程
阻塞队列满了，线程也超过 200 了，会发生什么
线程池实际怎么用
你有什么要问我的吗
11.为什么没去实习，是不是从现在到毕业都不能出去

五面

自我介绍
Github 库做了什么
各个项目做了什么
Mapreduce Join
Mapreduce shuffle
远程代码题，输入一个 n ，求 1~n 中每个数字二进制位中 1 的个数

网易杭研大数据开发

一面

自我介绍
Mapreduce 原理
数据倾斜怎么办
比如统计广东省的记录数据倾斜，怎么自定义 partition ，代码？（我觉得我说得挺清楚了，一定要代码写出来）
推荐系统项目细节，角色，做了什么
华为软件精英挑战赛，如何调参
代码，两个集合取交集，怎么最快
字符串反向输出，用递归实现
知道什么ETL工具
dataX架构

二面

自我介绍
项目细节
Mapreduce 原理
splitsize 如何确定，算法
数据倾斜怎么办
无 shuffle 的过程叫什么
大数据组件都知道哪些
数据仓库和数据库的区别
数据库原理懂吗
数据库范式知道吗
sql 题，按某列排序，并增加排序编号（说了 mysql 怎么做，hive 有点忘了row_number没说明白，可惜了)
sql 题，一列从1到n顺序编号，一列是各种类别，输出某一类别编号是连续四个以上的数据行
代码题，两个集合取交集....，有哪些做法
平时有什么爱好

网易雷火数据挖掘

一面

a += 4 和 a =a+4的区别，a是byte类型
Integer 数据比较
python 两个列表合并去重排序（python 很久不敲，基本语法忘记很多了）说了下怎么做。
Linux 两个文本不同的统计，删除目录文件，删除重复行
代码 java 字符串反转

二面

推荐项目
一条sql 外表是 gz格式压缩，查询会有几个 map 几个 reduce
什么压缩格式解决gz不可分片问题
集群 mr任务分配到某个节点一直 timeout 什么问题。（网络，防火墙问题）
Github

三面

推荐项目
代码输出连续数字和等于某个值的所有情况
知道的算法
LR 原理，为什么用极大似然
随机森林原理
Bagging原理
GBDT和XGBOOST区别
比赛为什么选用XGBOOST
Boosting

四面

介绍自己，别说技术
自己会给雷火带来什么收益
自己最不能接受的状态，会考虑离职的
推荐系统的应用一堆扯

51 大数据开发

项目细节，为什么用kylin，知道其他etl工具吗
sqoop和datax区别
推荐项目数据量多大，日增多大
搭建集群碰到过什么问题
mapreduce 二次排序怎么做
mapreduce原理，调优做了什么
mapreduce比较慢，你认为哪些地方可以优化
hadoop 和spark的区别
Hbase 知道什么，和mysql的区别
Hbase 支持事务吗
mysql事务隔离级别
java常用集合
hashmap 原理，resize过程
hashmap 为什么会出现并发问题
AQS
java 的线程是用户态还是内核态
栈里保存了什么
什么情况栈溢出
thread 栈多大
jvm其他组成部分
gc了解吗自己调优过吗
直接看代码的？有没有dump出来看日志
cms什么时候发生stop the word
垃圾收集算法
Hadoop 生态还了解哪些组件
two sum 问题，说怎么做，不写代码

二面

项目各种细节
mapreduce 原理
推荐系统算法了解哪些，商品推荐如何做
用户协同过滤和聚类的区别
基础机器学习算法
线上场景如何评估算法优劣
个人优势，遇到的挫折等等

#秋招##网易##华为##面经##蚂蚁集团##Java工程师#

全部评论

推荐最新楼层

牛客493228417号

门头沟学院 Java

数据研发都问这么多算法吗

1 回复分享

发布于 2021-06-01 03:02

上海电机学院 Java

大公司不是有笔试吗？不是不都是算法问题吗？？你是直接面试的饿吗？？

点赞回复分享

发布于 2019-08-19 23:54

卖萌的小鱼干在游泳

武汉大学算法工程师

就是问大数据的东西哈

点赞回复分享

发布于 2019-08-19 23:17

早上9点上班

门头沟学院算法工程师

请问没有shuffle的过程是什么呀？mapreduce不是都有shuffle的吗

点赞回复分享

发布于 2019-08-19 22:07

楼主

杭州电子科技大学 Java

欢迎关注我的微信公众号（DataWave）

点赞回复分享

发布于 2019-02-18 15:40

楼主

杭州电子科技大学 Java

补充一下牛客访谈贴，牛客访谈 | 无实习，看大佬如何补救收获多家offer https://www.nowcoder.com/discuss/150270

点赞回复分享

发布于 2019-02-18 14:33

独立特行的喵

门头沟学院 Java

为何你如此优秀

点赞回复分享

发布于 2018-12-01 11:18

南京理工大学 Java

是本科还是研究生啊？

点赞回复分享

发布于 2018-12-01 10:43

楼主

杭州电子科技大学 Java

可以关注我的个人博客，接下来会考虑发一些大数据和数据挖掘方面文章： http://www.jianshu.com/u/70b4fd000153

点赞回复分享

发布于 2018-11-27 18:20

北京邮电大学

一般大数据不会怎么问算法吧，你这都懂厉害了

点赞回复分享

发布于 2018-11-26 10:30

柠檬阿婆主

蚂蚁集团_算法专家

感觉没去算法有点可惜

点赞回复分享

发布于 2018-11-26 01:04

北京开放大学 Java

蚂蚁金服问的感觉跟后台开发差不多啊…

点赞回复分享

发布于 2018-11-25 22:08

弹钢琴的程序员

CFJ： Centre de formation des journalistes Java

天池大佬

点赞回复分享

发布于 2018-11-25 19:29

07-19 15:25

已编辑

蚌埠坦克学院 Java

回忆录：后端鼠鼠苦苦哀求日常实习

自我介绍：一只鼠鼠，并非有大厂实习经历，并非双9，并非开发圣体。腾讯一面1.实习（10min）2.项目（10min）3.synchronized和reentrantlock4.怎么等待多个线程结束后，再执行一个任务（countdownlatch）5.协程了解吗，介绍一下6.协程怎么调度的6.JVM相关知识，GC的日志看过吗，了解哪些JVM参数7.mysql怎么做优化（看explain，修改sql，加索引）8.分布式锁怎么实现算法题：反转链表二面1.实习业务（10min）2.threadlocal介绍一下3.threadlocal的内存回收问题4.强软弱虚四种引用的区别5.介绍一下GC6.三色标...

面试问题记录

点赞评论收藏

分享

07-16 11:11

杭州电子科技大学网络安全

这得多少人争啊？

看了下英伟达26校招都有6000多转发了，阅读7.9w，才发了4天，而且实在应届生投递率没那么高的七月……

码农索隆：没事哒，学历筛选就像机场安检，双非坐过牢，过不去安检

26届校招投递进展

点赞评论收藏

分享

06-26 17:24

已编辑

宁波大学 golang

hr为了KPI演都不演了

迷失西雅图：别给，纯kpi，别问我为什么知道

点赞评论收藏

分享

06-16 11:40

华为终端bg终端云服务实习

投票

华黑子进程百分之60。Base杭州通软从5.28开始泡池子，到现在泡了20天了，hr那边说还在审批，具体流程他没有权限看不到。请问各位uu有没有已经开奖开出来的，孩子快疯了。

华为求职进展汇总

点赞评论收藏

分享

07-17 16:22

陕西师范大学算法工程师

滴滴26届校招挂了，会影响正常批投递吗

rt，看见提前批开了就投了，秒挂了，不知道有咩有影响？

是单身的猕猴桃很优秀：可以参考高考吧，提前批挂了不影响正常批吧

26届校招投递进展

点赞评论收藏

分享

评论

26

285

招聘动态

现代汽车前瞻技术研发挑战赛

拼多多集团-PDD

2026届秋季校招提前批

滴滴

2026届秋季校招提前批

Touch CIB

数字兴业科技挑战赛

26届校招投递表格

7月更新166条网申投递链接

快手

快Star-X特别技术人才计划启动

京东2026

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 不卡学历的大厂有哪些？ #

6948次浏览 60人参与

# 百度秋招提前批进度 #

108560次浏览 1148人参与

# 实习如何「偷」产出？ #

13468次浏览 171人参与

# 除了主业以外，你还有哪些其他收入？ #

2971次浏览 55人参与

# 实习打杂，要跑路吗 #

7652次浏览 97人参与

# 风评不好的公司，你会去吗？ #

40735次浏览 269人参与

# 校园里的破防时刻 #

4628次浏览 50人参与

# 职场新人体验 #

9398次浏览 96人参与

# 为什么那么多公司毁约 #

180992次浏览 1339人参与

# 蔚来求职进展汇总 #

92785次浏览 769人参与

# 第一份工作应该选高薪还是热爱？ #

77091次浏览 746人参与

# 一人推荐一个值得去的通信/硬件公司 #

188131次浏览 1867人参与

# 设计人如何选offer #

127314次浏览 748人参与

# 考研可以缓解求职焦虑吗 #

52729次浏览 470人参与

# 学历贬值真的很严重吗？ #

27604次浏览 186人参与

# 腾讯求职进展汇总 #

952958次浏览 9573人参与

# 秋招结束之后的日子 #

77493次浏览 941人参与

# 你觉得现在还能进互联网吗？ #

16479次浏览 178人参与

# 你觉得早上几点上班合适？ #

74326次浏览 308人参与

# 24届软件开发秋招薪资爆料 #

355804次浏览 1229人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务