大数据开发实习面经(阿里、360、腾讯)

我是末流985本科大三生,找一个大数据方向的实习。因为没有课了,所以可以实习六个月左右。

阿里

时间: 2020年3月26日

一面

阿里一面的时候,刚刚开始复习。Python Java等等都还没看。只看了下大数据相关的知识。凉的明明白白。

  1. 写一道算法题,旋转数组求最小值(剑指offer面试题11)。当时只记得是二分查找,没写出来。
  2. 问下Java GC (不会)
  3. 问下Python GIL(不会)

非常感谢这位老师,面试之后就不再觉得自己很厉害了。我知道自己还有太多要复习的了。自己还是把面试想得太简单,周围牛人太多了。

360

一面 43min:

2020年4月8日

  1. 自我介绍
  2. 问了两个项目, 问了下项目中如何实现的Mysql和hdfs数据同步
  3. 讲一下对Hadoop的了解
    讲了下HDFS原理、MapReduce的过程,想讲HDFS检查点机制没让讲。
  4. Spark和MapReduce的区别?是不是用了Spark就不需要MapReduce了?(答得不太好)
  5. 问对Hive的了解? 自己提了下数据倾斜
  6. 如果有海量数据,如何求Top10?(说错了一块,后来又改过来了)
  7. Linux平常用的指令?说了 ls 、 ll 、 df 、 nohup & 、ps 、 kill 等等
    Hadoop用到的指令 Hadoop fs -ls 、 mkdir、 hdfs fsck(查看块信息)
  8. 用什么语言比较多? (我用的py比较多) Python常用的数据类型? list 和 tuple的区别?
    回答了下 不可变对象和可变对象
  9. 常用的python库(requests 、bs4 、keras 等等)如何安装包
  10. 算法题:数组去重 上台阶、动态规划和递归的区别
  11. 还有什么问题要问我吗?(问了下缺不缺hc、主要工作内容)

二面 23min

2020年4月15日
全程问项目,同时问了很多有没有看过Spark 源码 ES源码 Flask源码(都没看过)。
各个项目问的比较深,算法模型等等。

HR面 30min

2020年4月20日

  1. 可以实习多久
  2. 如何解决做项目和社团和日常生活的平衡问题
  3. 简单介绍下流计算的spark streaming storm flink的优缺点
  4. 未来发展等等

腾讯

腾讯是找了内推,后台开发,但是与大数据相关。面试都在腾讯会议,一面手撕代码是屏幕共享,二面手撕代码在腾讯文档。

一面

2020年4月23日

  1. 自我介绍。
  2. Spark和Hadoop的区别
  3. MR流程、RDD流程
  4. new malloc区别 epoll原理看过吗? 讲一下多态
  5. 写到算法题吧:二分查找,写一下旋转数组最小值(又是这道题。我说这道题之前做过,面试官没再让我写)。

二面

2020年4月28日

  1. 自我介绍、在家里?没开学?
  2. 学过Hadoop,讲一下MR流程。说一下Partition分区的优化是怎么做的(Partition没答出来)
    MR会有数据倾斜,讲一下如何解决(说了一些方法,被要求说的更详细一些。比如为什么增加Reduce数量就可以提高效率,如何自定义分区,如何重新设计key)
  3. 然后问的是Hadoop Streaming (没听说过,讲了下spark streaming)
  4. 看简历上有个socket项目,问如何讲一下流程,问如何从socket中提取数据(时间太长,完全记不清了)
  5. 写个算法题。 给一个树,每个节点的val都有取或不取两种状态。限定条件是,直接连接的节点不能同时取或者不取(比如父子节点) 想的是分成四次递归。问如何剪枝。没答出来
  6. 上面那个题没想法了。那咱们换个,给一个二叉树和两个节点 a ,b 找出二叉树的最近公共祖先。(剑指offer原题 最后一题)

平时大部分都是Py Java Scala开发,很少用C++,就很难受。还需要多学习啊。

字节跳动

一面

  1. 自我介绍
  2. 介绍项目:详细项目中介绍下深度协同过滤算法,和mysql与hdfs同步的策略
  3. 写两个Mysql
    ① 给出两个表,计算left join的结果
    ② 一个广告的表,包含广告的id,广告的开始时间,广告的结束时间,给出一个时间(比如2020-03-02 —— 2020-04-02)。所有与这个日期有交集的广告id.
  4. 写两个算法题
    ①写个层次遍历
    ②写个排序数组中查找k这个数出现的个数 (我用了二分查找,然后向前向后搜索)
  5. Spark会吧。介绍下宽窄依赖。(从action 讲到 shuffle ,讲了Aggregator,讲了下DAG解析的阶段划分)
  6. Hive会用吧。讲一下内表和外表的区别
  7. 学过Mysql,讲一下索引的数据结构吧(自己说了下聚集索引和非聚集索引)
  8. 还有 sql 各种join之间的不同

    二面

  9. 自我介绍
  10. 写个题目吧 把一个数字转换成汉字 比如1001 “一千零一" 用了递归但是写的太复杂,有点拉分
  11. 讲一下你觉得最难的两个项目
  12. Spark cache和 persite的区别(讲了下广播机制,没回答好)
  13. 你未来想学些什么(简单说了下Flink 、 Spark源码和参数服务器)
  14. 还有什么问我吗

    HR面

  15. 自我介绍
  16. 想实习多久
  17. 未来读研吗
  18. 来北京租房吗
  19. 父母对来北京的意见
  20. 你觉得自己有什么缺点 (最后说了个自己熬夜多 )

其他

也投了很多其他的公司,比如蘑菇街、百度、知乎等等,现在还没有消息,可能是不太匹配吧。

总结

感觉自己的技术还是有很大不足啊。自己的复习的路线是:

  1. 语言: Python、Java、scala面试题
  2. 计算机基础:计算机网络、操作系统和数据库(索引是重点)
  3. 大数据相关:Hadoop、Spark、hive、hbase、flume、kakfa、storm等
  4. 算法:主要是刷了一下剑指offer。
#大数据##实习##面经##大数据开发工程师##阿里巴巴##360公司##腾讯#
全部评论
居然问Flask源码🤣
点赞 回复
分享
发布于 2020-04-28 18:13
老哥怎么想找大数据的实习的😃
点赞 回复
分享
发布于 2020-04-29 00:40
春招专场
校招火热招聘中
官网直投
大数据的东西好多啊,你是直接上手做吗,还是先看书
点赞 回复
分享
发布于 2020-05-07 23:47

相关推荐

头像
不愿透露姓名的神秘牛友
03-25 17:14
美的储能 热设计工程师 17.5k*14 硕士985
点赞 评论 收藏
转发
hiii~这里是小米的求职陪跑经验分享:📚【教育背景】考文垂大学本硕📚【在校经历】校园代理+留学工作室创业经历📮一面—组长面1、请简单介绍一下自己的职业背景和储能行业的相关经验。2、你为什么选择加入比亚迪的海外储能销售团队?3、在你的职业生涯中,哪些经历对你成为一名优秀的储能销售员产生了积极影响?4、你对全球储能市场的现状和未来趋势有何了解?5、你认为比亚迪在海外储能市场的竞争优势和劣势分别是什么?6、请举例说明你是如何跟踪和分析竞争对手的?7、描述一次你成功开拓海外储能市场的经历,包括你采取的策略和取得的成果。8、在面对海外客户的疑虑或反对意见时,你通常如何应对?9、请谈谈你是如何建立和维护与海外客户的长期合作关系的。📮二面—大Boss面1、你在与不同文化背景的海外客户沟通时,遇到过哪些挑战?你是如何克服的?2、请分享一次你成功适应不同文化背景的商业场合的经历。3、在跨文化沟通中,你认为哪些因素对于建立信任和增进理解至关重要?4、请描述一次你在团队项目中发挥领导作用的经历,并说明你的贡献。5、在与团队成员合作时,你通常如何协调不同意见以实现共同目标?6、在团队中,你如何保持积极的工作氛围并激励团队成员?7、请谈谈你在面对工作压力时通常是如何调节自己的?8、描述一次你遇到复杂销售问题并成功解决的经历,包括你采取的方法和取得的成果。9、在处理紧急情况时,你通常如何保持冷静并快速做出决策?📮三面—HRBP面1、在团队工作中,你通常扮演什么角色?你如何与不同性格和背景的团队成员合作?2、请举例说明你是如何协调团队内部冲突或分歧的。3、在你的团队中,你通常如何激励和鼓舞团队成员?4、请分享一个你认为自己最有成就感的经历,并说明原因。5、你在未来三到五年内的职业目标是什么?你计划如何实现这些目标?6、你还有什么想要我们了解关于你的信息吗?💡过去一年,我们国家的储能在海外一直高歌猛进,超级多电池企业都在走向全球储能市场。如果本身有留学背景,精通英语或者某个小语种,那可以冲一种新赛道了!也许还能吃到新能源行业发展的一波红利!! #校招#  #面经#  #牛客在线求职答疑中心#  #非技术2024笔面经#  #牛客解忧铺#  #你觉得比亚迪今年还有春招吗?#
点赞 评论 收藏
转发
12 103 评论
分享
牛客网
牛客企业服务