秋招总结分享,数据研发方向,阿里,网易,华为等

秋招总结

秋招结束了,从六七月份开始到十一月,从艰难的准备阶段,到忙碌的面试奔波,感慨良多。我面的基本上都是杭州的公司,目前拿到的offer有,网易互娱、雷火、华为、海康、拼多多、滴滴、51,大部分是数据研发岗位。写个经验总结,回馈牛客。

岗位选择

在准备复习之前首先应该确定的是自己的岗位方向,然后再针对性地去寻找面经和资料复习。我当时可选的是数据挖掘算法和数据研发两个方向,因为不同的公司对岗位的具体要求有一些差别,导致我有些迷惑。我自身因为工程和算法比赛都接触过,但是在算法原理方面了解的还是比较少的,所以当时有一些退缩了,选择了数据研发方向。其实机器学习的薪资在今年来看更诱人,从我的经历来看我觉得也能找到不错的工作。当然这都是后话,确定岗位之后就是怎么准备了。

复习准备

我大概是从六月开始准备,刚开始最大的困难就是不知道该如何准备效果好。看到其它实验室的同学年后就开始准备了,并且秋招的提前批七月左右就开始,很着急,其实现在想来,踏实复习才是关键,不能因为着急而导致知识点一知半解。大厂对基础的要求相对来说更高,其次是自身的亮点。

面试中第一关一般都是手撕代码,其实代码题把剑指Offer过两遍就能应付大多数面试算法了,因为面试的时候不可能让你写很长的代码。学有余力去刷 leetcode。

其它知识点可以先把相应岗位的面经都保存下来,再去总结重要的知识点。知识点形成体系比较重要,可以画个体系图不断回顾。比如,Java 的JVM部分,集合类部分,并发部分,分开整理形成知识体系。把自己保存的面经上的问题都准备一遍,其实面试就不虚了。

其它

  • 暑期实习的经历挺重要的,但是我们实验室不给实习比较可惜。
  • 提前批的机会要把握好,也就是多一次机会。大厂其实十一月份可能还有补招。
  • 早点准备,将自身的亮点表现给面试官。

面经

分享自己面的几个比较典型的面经。

蚂蚁金服 数据研发 五面

蚂蚁是我第一个面的,也是最可惜的一个,很后悔当时自己没有准备好。大概面了五面,但是因为当时复习不够好,面试表现不够好,没能拿到 offer。 阿里都是电面,前后时间拉得也比较长。

一面

  1. 自我介绍
  2. 项目
  3. 设计支付宝 APP 滑动条的推荐系统,算法,架构实现
  4. 用户轨迹如何获取特征,点击条目 7-5-2-4 这种, word2vec 怎么构建句子特征
  5. GC
  6. Linux 10个进程10个线程,系统如何调度
  7. 线程池,poolsize 5 , 进来第六个线程,会发生什么
  8. Java 锁机制,悲观锁、乐观锁
  9. 数据结构题,青蛙跳台阶,二叉树层序遍历

二面

  1. 天池比赛项目及思路,为什么选择 XGBoost
  2. 推荐系统是什么,给完全不懂的人讲一讲 (按分类讲各种算法)
  3. 协同过滤的缺点,现在流行怎么做 (协同过滤目前更多用于召回)
  4. 讲一讲逻辑回归,原理及推导
  5. Synchronized。 锁在操作系统级别的实现
  6. Java 中的并发包
  7. Linux 进程调度
  8. 网络相关协议
  9. Zookeeper ***算法,Paxos
  10. 用命令行敲命令存储一个文件到 HDFS 上,源码级别是怎么样一个流程
  11. Linux 的基本命令,如何查看内存使用等
  12. 动态规划和分治法的区别

三面

  1. 项目自己发挥,追问细节
  2. 觉得自己是个怎样的人,别人觉得自己怎样
  3. 有过比较大的挫折吗
  4. 自己做过最有成就感的事情

四面

  1. 讲一个项目
  2. 项目中的细节追问(线上 A/BTest 怎么做,对结果怎么优化)
  3. 项目中自己做的亮点
  4. 一个环形链表里面存数字,如何最快速度找到指定数字
  5. 一个文件,里面是英文小说,统计词频最高的两个词
  6. notify() 和 sleep() 的区别(应该问错了,wait() 和 sleep() ),在源码中哪里看到过 (阻塞队列)
  7. 线程池,corePoolsize 5 ,max 200 ,什么时候线程池中有10个线程
  8. 阻塞队列满了,线程也超过 200 了 ,会发生什么
  9. 线程池实际怎么用
  10. 你有什么要问我的吗
    11.为什么没去实习,是不是从现在到毕业都不能出去

五面

  1. 自我介绍
  2. Github 库做了什么
  3. 各个项目做了什么
  4. Mapreduce Join
  5. Mapreduce shuffle
  6. 远程代码题, 输入一个 n , 求 1~n 中每个数字二进制位中 1 的个数

网易杭研 大数据开发

一面

  1. 自我介绍
  2. Mapreduce 原理
  3. 数据倾斜怎么办
  4. 比如统计广东省的记录数据倾斜,怎么自定义 partition ,代码?(我觉得我说得挺清楚了,一定要代码写出来)
  5. 推荐系统项目细节,角色,做了什么
  6. 华为软件精英挑战赛,如何调参
  7. 代码,两个集合取交集,怎么最快
  8. 字符串反向输出,用递归实现
  9. 知道什么ETL工具
  10. dataX架构

二面

  1. 自我介绍
  2. 项目细节
  3. Mapreduce 原理
  4. splitsize 如何确定,算法
  5. 数据倾斜怎么办
  6. 无 shuffle 的 过程叫什么
  7. 大数据组件都知道哪些
  8. 数据仓库和数据库的区别
  9. 数据库原理懂吗
  10. 数据库范式知道吗
  11. sql 题,按某列排序,并增加排序编号(说了 mysql 怎么做,hive 有点忘了row_number没说明白,可惜了)
  12. sql 题,一列从1到n顺序编号,一列是各种类别,输出某一类别编号是连续四个以上的数据行
  13. 代码题,两个集合取交集....,有哪些做法
  14. 平时有什么爱好

网易雷火 数据挖掘

一面

  1. a += 4 和 a =a+4的区别,a是byte类型
  2. Integer 数据比较
  3. python 两个列表合并去重排序(python 很久不敲,基本语法忘记很多了)说了下怎么做。
  4. Linux 两个文本不同的统计,删除目录文件,删除重复行
  5. 代码 java 字符串反转

二面

  1. 推荐项目
  2. 一条sql 外表是 gz格式压缩,查询会有几个 map 几个 reduce
  3. 什么压缩格式解决gz不可分片问题
  4. 集群 mr任务分配到某个节点一直 timeout 什么问题。 (网络,防火墙问题)
  5. Github

三面

  1. 推荐项目
  2. 代码 输出连续数字和等于某个值的所有情况
  3. 知道的算法
  4. LR 原理,为什么用极大似然
  5. 随机森林原理
  6. Bagging原理
  7. GBDT和XGBOOST区别
  8. 比赛为什么选用XGBOOST
  9. Boosting

四面

  1. 介绍自己,别说技术
  2. 自己会给雷火带来什么收益
  3. 自己最不能接受的状态,会考虑离职的
  4. 推荐系统的应用一堆扯

51 大数据开发

  • 项目细节,为什么用kylin,知道其他etl工具吗
  • sqoop和datax区别
  • 推荐项目数据量多大,日增多大
  • 搭建集群碰到过什么问题
  • mapreduce 二次排序怎么做
  • mapreduce原理,调优做了什么
  • mapreduce比较慢,你认为哪些地方可以优化
  • hadoop 和spark的区别
  • Hbase 知道什么,和mysql的区别
  • Hbase 支持事务吗
  • mysql事务隔离级别
  • java常用集合
  • hashmap 原理,resize过程
  • hashmap 为什么会出现并发问题
  • AQS
  • java 的线程是用户态还是内核态
  • 栈里保存了什么
  • 什么情况栈溢出
  • thread 栈多大
  • jvm其他组成部分
  • gc了解吗 自己调优过吗
  • 直接看代码的?有没有dump出来看日志
  • cms什么时候发生stop the word
  • 垃圾收集算法
  • Hadoop 生态还了解哪些组件
  • two sum 问题,说怎么做,不写代码

二面

  • 项目各种细节
  • mapreduce 原理
  • 推荐系统算法了解哪些,商品推荐如何做
  • 用户协同过滤和聚类的区别
  • 基础机器学习算法
  • 线上场景如何评估算法优劣
  • 个人优势,遇到的挫折等等
#秋招##网易##华为##面经##蚂蚁集团##Java工程师#
全部评论
数据研发都问这么多算法吗
1 回复 分享
发布于 2021-06-01 03:02
大公司不是有笔试吗?不是不都是算法问题吗??你是直接面试的饿吗??
点赞 回复 分享
发布于 2019-08-19 23:54
就是问大数据的东西哈
点赞 回复 分享
发布于 2019-08-19 23:17
请问没有shuffle的过程是什么呀?mapreduce不是都有shuffle的吗
点赞 回复 分享
发布于 2019-08-19 22:07
欢迎关注我的微信公众号(DataWave)
点赞 回复 分享
发布于 2019-02-18 15:40
补充一下牛客访谈贴,牛客访谈 | 无实习,看大佬如何补救收获多家offer https://www.nowcoder.com/discuss/150270
点赞 回复 分享
发布于 2019-02-18 14:33
为何你如此优秀
点赞 回复 分享
发布于 2018-12-01 11:18
是本科还是研究生啊?
点赞 回复 分享
发布于 2018-12-01 10:43
可以关注我的个人博客,接下来会考虑发一些大数据和数据挖掘方面文章: http://www.jianshu.com/u/70b4fd000153
点赞 回复 分享
发布于 2018-11-27 18:20
一般大数据不会怎么问算法吧,你这都懂厉害了
点赞 回复 分享
发布于 2018-11-26 10:30
感觉没去算法有点可惜
点赞 回复 分享
发布于 2018-11-26 01:04
蚂蚁金服问的感觉跟后台开发差不多啊…
点赞 回复 分享
发布于 2018-11-25 22:08
天池大佬
点赞 回复 分享
发布于 2018-11-25 19:29

相关推荐

bg双非本科,方向是嵌入式。这次秋招一共拿到了 8 个 offer,最高年包 40w,中间也有一段在海康的实习经历,还有几次国家级竞赛。写这篇不是想证明什么,只是想把自己走过的这条路,尽量讲清楚一点,给同样背景的人一个参考。一、我一开始也很迷茫刚决定走嵌入式的时候,其实并没有一个特别清晰的规划。网上的信息很零散,有人说一定要懂底层,有人说项目更重要,也有人建议直接转方向。很多时候都是在怀疑:1.自己这种背景到底有没有机会2.现在学的东西到底有没有用3.是不是已经开始晚了这些问题,我当时一个都没答案。二、现在回头看,我主要做对了这几件事第一,方向尽早确定,但不把自己锁死。我比较早就确定了嵌入式这个大方向,但具体做哪一块,是在项目、竞赛和实习中慢慢调整的,而不是一开始就给自己下结论。第二,用项目和竞赛去“证明能力”,而不是堆技术名词。我不会刻意追求学得多全面,而是确保自己参与的每个项目,都能讲清楚:我负责了什么、遇到了什么问题、最后是怎么解决的。第三,尽早接触真实的工程环境。在海康实习的那段时间,对我触动挺大的。我开始意识到,企业更看重的是代码结构、逻辑清晰度,以及你能不能把事情说清楚,而不只是会不会某个知识点。第四,把秋招当成一个需要长期迭代的过程。简历不是一次写完的,面试表现也不是一次就到位的。我会在每次面试后复盘哪些问题没答好,再针对性补。三、我踩过的一些坑现在看也挺典型的:1.一开始在底层细节上纠结太久,投入产出比不高2.做过项目,但前期不会总结,导致面试表达吃亏3.早期有点害怕面试,准备不充分就去投这些弯路走过之后,才慢慢找到节奏。四、给和我背景相似的人一点建议如果你也是双非,准备走嵌入式,我觉得有几件事挺重要的:1.不用等“准备得差不多了”再投2.项目一定要能讲清楚,而不是做完就算3.不要只盯着技术,多关注表达和逻辑很多时候,差的不是能力,而是呈现方式。五、写在最后这篇总结不是标准答案,只是我个人的一次复盘。后面我会陆续把自己在嵌入式学习、竞赛、实习和秋招中的一些真实经验拆开来讲,希望能对后来的人有点帮助。如果你正好也在这条路上,希望你能少走一点弯路。
x_y_z1:蹲个后续
点赞 评论 收藏
分享
评论
26
284
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务