字节大数据开发实习一二HR面

5/5一面
5/14 二面
5/18 hr面
5/19 OC

一面(1h10min)

1.自我介绍一下
2.介绍一下你的项目
  2.1 Mysql全量数据规模
  2.2 既然Mysql能存储,为什么要导入到hive中
3.说一下MySQL的ACID特性
4.脏读和幻读分别是什么含义
5.spark持久化的级别和作用
6.spark任务出现数据倾斜有哪些方法解决
7.hive没办法创建分区怎么理解,怎么解决。
8.常见的工厂模式有哪些
9.介绍一下TCP连接,三次握手。
10.为什么要三次握手,如果两次握手会出现什么问题呢?
[算法题]
1.情景题:客户端发送请求,batch数
数组题,面试官手打。
2.判断一棵树是否是二叉搜索树
说一下什么是二叉搜索树。

二面(1h20min)

1.自我介绍
2.深挖项目
  2.1 项目需求
  2.2 最终交付的成果,数据从哪里,对交付方有什么帮助
  2.3 怎么理解数仓建模
  2.4 举一个真实的例子,介绍你负责的项目
  2.5 介绍一下你是怎样建模,为什么要这么建模的。
3. 数据爬取,爬虫是怎么拿到数据的,根据你介绍的聊后续扩充
  3.1 你写一个爬虫,为什么能拿到你想要的数据,中间经历了什么
  3.2 扩展,当你需要爬取的数据量增大,你怎么处理
  3.3 并行爬
4.如果多个任务都在爬取网站,如何保证吞吐量尽可能高的同时不让爬取的网站宕机或任务崩溃(大概是这样)
5.收到大量的url,如何选择任务分发模式(分布式场景)
6.介绍一下MapReduce的过程
7.map端的数据如何保证分发到reduce数据的准确性
8.Java中的集合、类有用过嘛
9.SQL题
很简单的多表查询单列聚合,卡住了没做出来(g)。
10.Linux命令,一个进程很慢,你会查看什么指标,用什么命令去分析,可能是什么原因
11.算法题:链表
链表求和的变式:
leetcode连接

hr面

1.自我介绍
2.实习时间
3.你觉得自己的缺点是什么
4.对前面的面试官评价一下,有什么改进的建议
5.反问环节

#实习面经##实习##大数据开发工程师#
全部评论
楼主base哪里?
1 回复
分享
发布于 2022-05-23 15:31
楼主二面第7个怎么答的🤔
1 回复
分享
发布于 2022-07-09 22:44
联易融
校招火热招聘中
官网直投
楼主上岸了吧
点赞 回复
分享
发布于 2022-05-22 16:27
醉了,为什么今天字节的面试官和我说实习有三面技术面和一面hr😅
点赞 回复
分享
发布于 2022-05-23 15:23
同问,二面第7个怎么答的
点赞 回复
分享
发布于 2022-07-12 20:40
优秀的同学
点赞 回复
分享
发布于 2022-07-13 01:02

相关推荐

16 82 评论
分享
牛客网
牛客企业服务