面经 | 字节跳动大数据实习生 Tiktok

面试时长40min 面试体验很棒 面试官会引导你思考
1.自我介绍
2.详细介绍项目
3.业务域主题域区别
4.为什么只有一个用户域,可不可以有订单域
5.你说了商品主题,这个主题应该有哪些字段
6.mapreduce流程
7.map发生在里面的哪个阶段(答的不对)
8.spark dag定位指什么
9.dag是什么
10.如何判断有环
11.按你的思路可以实现一下吗(好久没写深搜,忘了)
12.如何定位数据倾斜
13.怎么解决数据倾斜
14.你说了增加分区数,这能解决热点key的倾斜问题吗
15.那热点key怎么解决
16.为什么要划分热表,为什么这样能解决倾斜问题,join维度表之后不是依旧倾斜吗
反问:
1.通知时间 一周后
2.map问题的答案 回去搜一下 你说的不对
3.对我的建议 网上的练手项目照比工作有区别 可以根据互联网资源进行更广的学习

面试官询问实习长度和时间,问了老师是否放实习
全部评论
👍
点赞 回复 分享
发布于 03-01 17:34 山东
一眼群友
点赞 回复 分享
发布于 01-06 18:26 河南
有后续吗
点赞 回复 分享
发布于 01-06 18:15 广东

相关推荐

06-28 18:18
已编辑
门头沟学院 Java
全程大概75min, 前面小打小闹,先自我介绍,然后问简历项目,穿插八股,后面手撕两题场景题,汗流浃背,估计是凉了~1. 海洋物联网平台是做什么的?2. 如何接入多源异构的设备数据?描述一下数据结构之间有什么差异?3. 你提到反射,Java中实现反射有哪几种方式?4. CgLib和JDK动态代理差异?5. 数据是如何存储的?按照每半年存储,如果我想查6~8月数据,如何查询?查询出来的数据如何计算?6. MySQL索引有哪些?用过MySQL的全文索引吗?(没有)举出索引和非聚簇索引的区别?7. 假设一个SQL执行很慢,如何排查?哪些原因可能导致索引未命中?8. Spring事务传播行为有几种?为什么要有事务传播行为?(没背,寄)9. 消息队列有什么应用场景?10. Kafka有深入了解过吗?Kafka中有哪些组件?broker是什么? Kafka如何保证消息不丢失?问到30时候开始手撕,后面45min都是手撕,最难绷的一集1. 写sql: 员工表和部门表,计算每个部门薪资最高的员工(不难,但是当时降智没写出来,面试官一步步引导,最后勉强写出)2. 一个日志系统的场景题,有三个小问2.1 写shell脚本统计日志系统中的top10 IP(不会写shell,寄)2.2 用java统计日志系统中top 10 IP(用堆来统计,需要手写堆,写出伪代码就好,不会,寄)2.3 日志系统统计一天内哪一秒峰值在线人数最多:class Line {String ip;int start;int end;}用差分 + 前缀和做的,最后还是靠面试官引导做出来反问:简历可以优化的点?(没说)面试结果大概什么时候出?(不一定,然后被问是否有其他offer比较着急?)------------------------------6.13更新  约6.16三面了
查看14道真题和解析
点赞 评论 收藏
分享
评论
4
16
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务