23实习求职之路:个人总结和分享

23实习求职之路:个人总结和分享 回馈一下社区~

完完全全就是小白,首先就是感谢:各个帮助内推的同学,牛客上无私分享的经验和一些大牛的帖子和参考等等,以及一路上给予过各种帮助的同学,和那些很好的hr,接口人。

个人情况:科班本硕+两段数据工程(分析)实习(50%相关吧)+有几个实验室对口项目
持续时间:上一年有刷题一段时间,三月开始复习,三月二十号开始陆陆续续投递简历(一直投到四月中下旬。其实有点晚了,因为投了你还要继续等的)到五月底结束。
投递岗位:大数据开发工程师岗位(有些公司岗位命名可能不一样)

投递情况:全国大大小小的公司一共投递了25+公司。有些投了完全没消息,有些简历就挂了,各种情况都有。

没消息的:58集团(58同城)、shein(海外服装电商)、宽德投资、金山云、联想。
简历没过的:贝壳找房、米哈游(原神)、完美世界、Flow++(信息安全)、网易互联网(网易云音乐)、OPPO、美的。
有笔试但是笔试后无消息的:奇虎360、阅文集团(旗下拥有QQ阅读)、美团、字节跳动公司。
原因:有些投的太晚,明显是没有hc,有的就很奇怪不知为什么莫名其妙就挂了。


下面列出一些有面试及后续的公司面试(都是面试后凭记忆复盘记录下来的),具体结果看对应公司:

(一)蔚来汽车:

1.自我介绍,问可以实习多久。
2.你说你熟悉spark,介绍一下spark运行机制。
3.如果需要按设备和时间去查询数据,在大数据中,每天10TB的话,怎么处理才能更好实现查询?(这题其实不怎么会)(提示从综合技术的角度)
4.问了几个项目的具体实现,问出书的事情,问使用什么编程语言,问java的线程创建方式,问JVM垃圾回收,问TCP与UDP的区别。问IP和端口号在哪一层(ip和传输)。

后续:口头offer

(二)Keep公司(面试流程非常完整和体验都非常不错):

1.自我介绍。问我是怎么理解大数据的?问我理解中的spark是什么样子的?问相比与MapReduce有什么优点?为什么快?
2.做项目时有没有遇到什么难点。讲了一个项目,涉及难点有哪些?
3.问了Spark RDD窄依赖和宽依赖的关系,问了shuffle。问了用过哪些算子,问了foreachpartition和mappartition。
4.问了还有哪些学过的大数据组件?问了hdfs怎么保证高可用?
5.问了hdfs写流程,读流程,以及三个备份的摆放位置。
6.问了平时用什么编程语言。问了堆栈队列的区别。
7.反问了部门做什么,问了什么时候有二面
8.问了除了做项目之外做什么,回答了写技术博客的事情,又问如何学一样新的技术。查看api。
9.问了以后的工作方向和未来规划。
10.手撕算法:需要说说思路,问了算法题(两个分别是正序逆序的组合并成一个正序数组,和一题SQL简单题(查找有某个字段中有重复值的记录)。

1.问了平时编程开发用什么语言。然后先考了Y字型(横着看)链表相交处的节点和岛屿数量。
2.接着算法问了四个时间复杂度的大小比较。问了实验室的事情,老师研究的方向,实验室的工作分配,以及为什么选择2.4这个版本。
3.问了实习,就是搭建CH和Kylin的细节和遇到的困难(部署遇到的)问了写书的事情。问了项目是是自己找的还是实验室安排的。
4.反问需要提升的点:整体不错,然后项目技术也有。

1.问了为什么选用spark进行深入的研究和开发。问了了解大数据行业的职责方向有哪些吗?对自己的职业方向的定位和未来发展方向。
2.问了一个项目(还问了有什么难点,和数据规模多大)问了写书的东西。问了怎么学习新技术,问了为什么选择keep?。
3.反问环节:问了是否有导师带,进去做什么(可能学习新框架新组件),是否对我的评价,简历评价(面试官说挺好的,是适合他们的需求)。

后续:邮件offer

(三)华为公司

先说说时间线吧:
03-31投递简历、04-06笔试、04-08测评、04-22一面、04-27二面、04-29流程全绿、05-07入池短信、05-16状态码提前、05-28意向书和短信offer

1.自我介绍,介绍Spark的运行机制。讲一下三种Spark的Join机制(两个HashJoin、sort merge join)。问了spark的性能调优(说不能改变源码的情况下如何去解决)
2.问了是写SQL多还是内核多(jar包),问了用什么语言。问了做离线还是流式数据多。问写算子多的话讲讲GroupByKey和ReduceByKey的区别。
3.问SQL写的多不多,问了左连接, 右连接, 半连接 ,开窗函数等等。问了奖项?有没有除了奖学金之外的奖。问了是否了解消息队列,问了ZK的协议(如何选主)。
4.算法题(LC26,共享屏幕从我的力扣里挑了一题我没做过的)

1.自我介绍,问了什么时候毕业,问了哪里人,意愿地在哪。问了感兴趣是做组件开发还是数据分析业务(变现)?
2.问了有没有业务数据分析的经验和说一下实习,有没有这种业务项目合作的经验和数据业务沟通的理解。对华为的直观感受和理解。华为公司是否最佳的选择。
3.在实习中想学习到什么?跟我解释了很多工作上的场景和业务需求,教了实习很多东西。问了以后3-5年职业规划。
4.主管说是做软件开发的。

后续:意向书和短信offer

(四)网易互娱

(两个长得很年轻稚嫩的面试官,半个小时结束,感觉很敷衍,面试完连录入都没有录入,官网直接说我没参加面试,大概率就是kpi)

1.自我介绍,一开始说要记录一下面试过程什么的,介绍一个项目(面试官几次提出疑问):本地还是(hdfs)??说你的项目的partition是借鉴了RDD的partition,那RDD是怎么分区的(其实就是问分区器)。shuffle RDD 是怎么分区的?
2.换了一个面试官,问实习,部署ck和kylin的部署过程和了解程度和特点,问了怎么数据从MySQL导入CK。问了写书的过程。问了升级的过程Spark的ML包有哪些变化?再问了Spark的新特性有哪些,回答了AQE,继续追问AQE。问了有没有逛开源社区提PR,介绍了他们部门是干嘛的,说做组件开发提PR的。
3.居然没有考算法题和八股等常规问题。真的无语。。

后续:流程结束

(五)顺丰科技(面试效率非常高,很优质的体验)跳转

1.自我介绍,详细介绍一个个人的关于分布式系统开发的项目以及根据项目问了一些问题。问了项目都使用什么语言,回答了scala,java。问了为什么选择大数据这个方向。代码题考了单例模式的编写。
2.问了java的垃圾回收器种类和CMS垃圾回收器的东西,多线程的东西(threadlocal原理等等),问了锁的种类以及特点原理等等。
3.问了DAG分解的东西,stages划分的东西,还有本地化原则以及怎么分发task到executor中执行的东西,问了blockmanager的东西(资源管理和内存磁盘相关)。还问了yarn的流程等等。
4.反问部门做什么,回答组件开发,平台开发。

后续:邮件offer

(六)携程集团

1.自我介绍,问了好多(分为实验室的项目还是自己感兴趣去做的项目)项目(具体到工作和细节,还进行了讨论很久,也讨论场景)(还问了实习)。问了写书的事情(说了出版了)。
2.说一下MapReduce流程,Spark比MR快的地方和原因,区别与优势,数据倾斜的解决与经验,问了用什么语言开发。
3.问了很多java语言的东西:问了volatile、问了怎么进行线程安全,线程同步。问了锁的了解。问了线程池怎么用。问了concurrenthashmap的原理。问如果自定义用户类的对象怎么放进hashmap中作为key以及如何进行key的唯一性判定?问了StringBuilder和StringBuffer的区别。
4.问了一个类里三个方法:A()、B()、C(),A和B加了synchronizd,如果现在A被一个线程占用了,那么访问B和C的线程会阻塞等待吗?如果是静态的又是怎样呢?
5.反问了部门做什么?说是公共部门,提供大数据平台的。

1.自我介绍,问了改了源码什么地方,具体改了什么东西(代码层面)(有点深入)。问为什么要切分,怎么切分?为什么要这样改动?具体怎么改?Spark本来是怎么样的?问了写书的。
2.具体问了很久数据怎么切分,怎么读取,数据量比较大会怎么样。我们编写的代码task是怎么分发到executor中跑的和是否有序列化和反序列化?问了怎么才能不序列化某些东西。
3.问了Spark的瓶颈是网络传输开销还是内存不够。问了如果万兆网线还有传输问题吗?问了Spark和MR的区别,为什么要用Spark。问了Spark的shuffle。
4.问了动态资源调度的问题。问了SparkSQL是怎么转化为任务具体执行。问了Hive中的数据跟RDD的联系。问了Spark-Join的东西。
5.问了Spark的版本和用了什么模式启动Spark。

后续:进入人才池

(七)荣耀公司

1. 出示身份证,自我介绍。说大数据实验室主要做什么?问了实验室集群规模多大,是不是自己搭建的?用什么搭建?是不是云服务器。问了实验室还有做其他方向的吗?
2. 看过Spark的源码没?有没有遇到什么困难的地方。问毕设项目?修改源码主要做了什么?设计的算子是做什么的。项目的动机?简历里写着计算引擎(论文里)是什么意思?项目的进展如何?项目的创新点在哪?这样做为什么能提高稳定性?与传统的不同点在哪?问了用我做的这个系统做过什么样的应用和测试?
3. 问了写书和实习的工作。问了LightGBM的项目是做什么的?
4. 反问部门做什么?面试官说他不是做大数据的。部门里做大数据的在南京那边。

1. 出示身份证,自我介绍。问在项目中有没有遇到什么难点和解决方法是什么?问在做项目时有没有遇到和别人想法不一样的地方?是怎么解决?问有没有团队协作的经历?问了给自己在项目中的表现10分打几分?问项目是不是都是在导师的建议下做的?问了毕设的课题?问了科研助理是不是老师?
2. 问了平时有没有出去和朋友同学出去吃饭?问了导师对自己的评价是不是比较内向。
3. 说留意官网,六月初会有结果?说看我博客看出我对大数据的热爱。

后续:暂未有消息

(八)腾讯csig(非常晚的面试,kpi)(面试时转岗了,不是投的那个岗位)

1.自我介绍,问了用什么语言编程。然后叫我等等,他去找题找了五分钟,然后开始做题:LC695:岛屿的最大面积(一直在和我斡旋,30分钟,其实我是做对了,一直说不太对)
2.说一个项目。说到一半提出质疑:问怎么做分布式?做了什么具体的功能和方法。设计的转换算子有什么作用?数据是怎么进行划分存储?。项目什么动机和意义?每个块是怎么样的?会不会导致欠拟合和过拟合?怎么去重?块与块之间的相似性问题(推荐算法里面的itemCF和userCF?)
3.继续提问:Spark里的参数资源一般怎么配置?内存和task数量这些?内存一般分配多点(大点)还是小点?task数量一般分配多点(大点)还是小点?

(结束十分钟后约二面)

1. 自我介绍。说项目挺多的,把重要的项目说一下。说完之后问了是不是自己做,做了多久,问了已经开源没?测试过什么项目?问了有没有遇到难点的地方。
2. 问了写书的东西,问了具体工作(是不是自己写的,学到了什么,这个过程收获最大是什么)。叫我再讲一个觉得学到东西的项目。
3. 问了有没有看Spark的源码,从哪里入手,看了哪些部分,印象最深刻是哪部分?回答了资源调度,运行参数入手,shuffle过程和分区器的部分等方面。
4. 怎么学习新技术?讲讲一面那道题LC695的思路。问了什么时候可以来实习。可以实习多久?
(二面环境很吵,他说:在工位上,旁边有同事在说话聊天。??)

后续:流程结束

最后的,这段时间就是心比较累,很焦虑,很多时候都是在等待的煎熬里,有次面试前还吐了。实习就告一段落了,就分享到这里吧。求职,最重要是摆正心态。







#暑期实习##实习##面经##面试流程##校招##大数据开发工程师#
全部评论
同学保持一颗良好的心态哈,首先你要知道能去实习的学生没多少,有的是导师不允许(例如我),有的是没有找到,我觉得你经过这么多轮面试,你肯定对大数据开发的内容有了更深入的理解,这是别人没有的,你已经超过了很多了。 接下来就是和自己赛跑,好好实习或者好好打基础,你真的很棒了
3
送花
回复
分享
发布于 2022-06-02 01:39
所以准备去哪😂
点赞
送花
回复
分享
发布于 2022-06-01 19:00
秋招专场
校招火热招聘中
官网直投
大佬在哪投的啊。为什么我在boss投。几乎都是小公司😢
点赞
送花
回复
分享
发布于 2022-06-06 09:38
这是提前批吗还是暑期实习
点赞
送花
回复
分享
发布于 2022-06-18 15:56
你的专业就是大数据吗,我研究生自学大数据怎么样
点赞
送花
回复
分享
发布于 2022-06-27 17:42
大佬,请问有什么靠谱的大数据项目推荐吗?
点赞
送花
回复
分享
发布于 2022-07-13 20:27
写的啥书啊大佬
点赞
送花
回复
分享
发布于 2023-02-09 18:35 北京
都太难了叭
点赞
送花
回复
分享
发布于 2023-04-14 10:46 重庆

相关推荐

22 87 评论
分享
牛客网
牛客企业服务