大数据开发实习面经(阿里、360、腾讯)

我是末流985本科大三生,找一个大数据方向的实习。因为没有课了,所以可以实习六个月左右。

阿里

时间: 2020年3月26日

一面

阿里一面的时候,刚刚开始复习。Python Java等等都还没看。只看了下大数据相关的知识。凉的明明白白。

  1. 写一道算法题,旋转数组求最小值(剑指offer面试题11)。当时只记得是二分查找,没写出来。
  2. 问下Java GC (不会)
  3. 问下Python GIL(不会)

非常感谢这位老师,面试之后就不再觉得自己很厉害了。我知道自己还有太多要复习的了。自己还是把面试想得太简单,周围牛人太多了。

360

一面 43min:

2020年4月8日

  1. 自我介绍
  2. 问了两个项目, 问了下项目中如何实现的Mysql和hdfs数据同步
  3. 讲一下对Hadoop的了解
    讲了下HDFS原理、MapReduce的过程,想讲HDFS检查点机制没让讲。
  4. Spark和MapReduce的区别?是不是用了Spark就不需要MapReduce了?(答得不太好)
  5. 问对Hive的了解? 自己提了下数据倾斜
  6. 如果有海量数据,如何求Top10?(说错了一块,后来又改过来了)
  7. Linux平常用的指令?说了 ls 、 ll 、 df 、 nohup & 、ps 、 kill 等等
    Hadoop用到的指令 Hadoop fs -ls 、 mkdir、 hdfs fsck(查看块信息)
  8. 用什么语言比较多? (我用的py比较多) Python常用的数据类型? list 和 tuple的区别?
    回答了下 不可变对象和可变对象
  9. 常用的python库(requests 、bs4 、keras 等等)如何安装包
  10. 算法题:数组去重 上台阶、动态规划和递归的区别
  11. 还有什么问题要问我吗?(问了下缺不缺hc、主要工作内容)

二面 23min

2020年4月15日
全程问项目,同时问了很多有没有看过Spark 源码 ES源码 Flask源码(都没看过)。
各个项目问的比较深,算法模型等等。

HR面 30min

2020年4月20日

  1. 可以实习多久
  2. 如何解决做项目和社团和日常生活的平衡问题
  3. 简单介绍下流计算的spark streaming storm flink的优缺点
  4. 未来发展等等

腾讯

腾讯是找了内推,后台开发,但是与大数据相关。面试都在腾讯会议,一面手撕代码是屏幕共享,二面手撕代码在腾讯文档。

一面

2020年4月23日

  1. 自我介绍。
  2. Spark和Hadoop的区别
  3. MR流程、RDD流程
  4. new malloc区别 epoll原理看过吗? 讲一下多态
  5. 写到算法题吧:二分查找,写一下旋转数组最小值(又是这道题。我说这道题之前做过,面试官没再让我写)。

二面

2020年4月28日

  1. 自我介绍、在家里?没开学?
  2. 学过Hadoop,讲一下MR流程。说一下Partition分区的优化是怎么做的(Partition没答出来)
    MR会有数据倾斜,讲一下如何解决(说了一些方法,被要求说的更详细一些。比如为什么增加Reduce数量就可以提高效率,如何自定义分区,如何重新设计key)
  3. 然后问的是Hadoop Streaming (没听说过,讲了下spark streaming)
  4. 看简历上有个socket项目,问如何讲一下流程,问如何从socket中提取数据(时间太长,完全记不清了)
  5. 写个算法题。 给一个树,每个节点的val都有取或不取两种状态。限定条件是,直接连接的节点不能同时取或者不取(比如父子节点) 想的是分成四次递归。问如何剪枝。没答出来
  6. 上面那个题没想法了。那咱们换个,给一个二叉树和两个节点 a ,b 找出二叉树的最近公共祖先。(剑指offer原题 最后一题)

平时大部分都是Py Java Scala开发,很少用C++,就很难受。还需要多学习啊。

字节跳动

一面

  1. 自我介绍
  2. 介绍项目:详细项目中介绍下深度协同过滤算法,和mysql与hdfs同步的策略
  3. 写两个Mysql
    ① 给出两个表,计算left join的结果
    ② 一个广告的表,包含广告的id,广告的开始时间,广告的结束时间,给出一个时间(比如2020-03-02 —— 2020-04-02)。所有与这个日期有交集的广告id.
  4. 写两个算法题
    ①写个层次遍历
    ②写个排序数组中查找k这个数出现的个数 (我用了二分查找,然后向前向后搜索)
  5. Spark会吧。介绍下宽窄依赖。(从action 讲到 shuffle ,讲了Aggregator,讲了下DAG解析的阶段划分)
  6. Hive会用吧。讲一下内表和外表的区别
  7. 学过Mysql,讲一下索引的数据结构吧(自己说了下聚集索引和非聚集索引)
  8. 还有 sql 各种join之间的不同

    二面

  9. 自我介绍
  10. 写个题目吧 把一个数字转换成汉字 比如1001 “一千零一" 用了递归但是写的太复杂,有点拉分
  11. 讲一下你觉得最难的两个项目
  12. Spark cache和 persite的区别(讲了下广播机制,没回答好)
  13. 你未来想学些什么(简单说了下Flink 、 Spark源码和参数服务器)
  14. 还有什么问我吗

    HR面

  15. 自我介绍
  16. 想实习多久
  17. 未来读研吗
  18. 来北京租房吗
  19. 父母对来北京的意见
  20. 你觉得自己有什么缺点 (最后说了个自己熬夜多 )

其他

也投了很多其他的公司,比如蘑菇街、百度、知乎等等,现在还没有消息,可能是不太匹配吧。

总结

感觉自己的技术还是有很大不足啊。自己的复习的路线是:

  1. 语言: Python、Java、scala面试题
  2. 计算机基础:计算机网络、操作系统和数据库(索引是重点)
  3. 大数据相关:Hadoop、Spark、hive、hbase、flume、kakfa、storm等
  4. 算法:主要是刷了一下剑指offer。
#大数据##实习##面经##大数据开发工程师##阿里巴巴##360公司##腾讯#
全部评论
大数据的东西好多啊,你是直接上手做吗,还是先看书
点赞 回复 分享
发布于 2020-05-07 23:47
老哥怎么想找大数据的实习的😃
点赞 回复 分享
发布于 2020-04-29 00:40
居然问Flask源码🤣
点赞 回复 分享
发布于 2020-04-28 18:13

相关推荐

我是某985大四的孙某某,产品设计专业,平时外向爱聊,但找实习时差点儿抑郁。现在我美团产品实习转正了,回想大三那年,从0基础到offer的深度过程,像场持久战。大三上学期开学,2024年9月。我简历空白:无项目、无奖项、GPA3.4。室友已经在投了,我慌了。第一个决定:卷起来!但卷错方向,第一周海投30份产品岗,全石沉大海。深度低谷:10月国庆回家,我爸问“实习找得咋样”,我说“在面”,其实拒信堆满邮箱。我躲房间哭,觉得自己废物。方法论起步:祛魅认知。第一步:调研岗位。刷牛客“产品经理面经”,列出要求:用户调研、竞品分析、原型设计。深度经历:我买了Axure软件,自学一周,画了个垃圾App原型,投了腾讯,拒信“经验不足”。第二步:项目积累,从小练手。10月,我选校园二手市场做项目。方法:用问卷星调研100同学痛点(闲置物品难卖),竞品分析闲鱼/转转。深度故事:调研时,我在宿舍楼发二维码,被保安赶;分析报告写了20页,熬夜到4点。原型画完,写报告:“目标用户大学生,核心功能一键发布,竞品优势:AI匹配买家,提升成交率30%。”但简历写得太水,投阿里挂了。转机在11月,看到一个工具推荐推文。我试了泡泡小程序的AiCV简历王,19块月费,导入,它匹配产品JD,加关键词如“用户画像”“AARRR模型”。改完投美团,三天一面通知。面试血泪:一面HR问“为什么产品”,我说“爱解决问题”;二面问项目,我讲调研细节,面试官追问“怎么量化痛点”,我用数据答;三面组长模拟场景:“App崩溃怎么处理”,我用方法论答“日志分析+用户反馈”。offer到手,我在操场吼了声。实习阶段:12月入职,祛魅产品岗。组里KPI重,我负责小程序优化。第一周调研用户反馈,访谈20人,报告被退三次。深度经历:有天加班到凌晨,调研数据错,我崩溃大哭。方法论第三步:迭代反馈。用Notion建“项目日记”,每天记“做了啥+问题+优化”。第二个月:大项目,优化外卖页面。方法第四步:全链路思考。调研(问卷+访谈)、竞品(饿了么)、原型(Figma迭代5版)、测试(A/B上线)。深度:测试时bug多,用户吐槽,我改了10版,领导夸“细致”。结果点击率升15%。第三步到第五个月:深化方法,写经历。实习结束,我用STAR重写简历:“Situation:用户流失高;Task:优化页面;Action:调研-原型-测试;Result:升15%,反思:下次加数据埋点。”现在转正,工资7k。深度方法论总结:调研岗位:牛客列要求,自学工具。项目小练:调研+分析+原型,量化报告。工具匹配:JD定制简历。迭代日记:Notion记反馈,祛魅成长。STAR深化:全链路写经历,加反思。
简历中的项目经历要怎么写
点赞 评论 收藏
分享
评论
12
105
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务