字节 data 大数据开发一面

9.12 大数据一面,好像是抖音本地生活服务部门,话说字节约面是真的快,投的第二天直接约了 9.12 的一面,都没笔试
以下内容都是简历强相关的:
- 上来没自我介绍直接开问
- 你怎么看待你B站和美团的这两段经历的关系
- 本科和硕士专业的跨度挺大的,为什么
- Spark 的 count distinct 是怎么做的
- SparkSQL 做 Join 的时候有哪些 Join 算法
- 对数据库有哪些了解?关系型和非关系型有哪些典型的产品?区别是什么?
- 美团实习的介绍
- 主题域的建设,工作的时候是偏整体建设视角还是对接一些需求去做一些事情
- 为什么要建设商品主题域,你对它的认知是怎么样的
- 你提到商品会作为维度和交易、流量主题有关联,那具体建设的时候会包含其他主题吗
- 团队有多少人,怎么分工的
- 实习过程中协作感受怎么样?是清晰的吗,还是说会涉及到一些边界的问题
- 讲讲治理的工作,你实习三个月大概多少精力放在治理上
- 总结复盘一下治理思路是什么样子的
- 计算、存储、SLA治理这三部分,分别的目标是啥
- 计算治理方面你提到OOM,怎么减少OOM
- 除了事后调度时报错,有没有办法提前去识别任务可能出现的问题(比如有没有办法提前通过输入表的输入、计算的复杂度去在运行前提前判断任务会不会 OOM,来进行前置的预警)
- 存储治理大概有几种方案
- 大数据相关知识你的学习路径是怎么样的
- 比方今天有很紧急的任务,存储的数据通过正常 SQL 解析太慢了,可能要通过比如写 Java UDF 或学一个新的方式去实现,你会怎么处理这件事情
- SQL:找评分连续下降7天的商家
全部评论

相关推荐

bg 9本硕,某团暑期实习。记录一下80分钟:5分钟1. 自我介绍35分钟2. 了解实习经历3. 针对实习项目,问数据层次怎么分层4. 数据分层的作用5. 针对具体实习项目,说明业务逻辑6. 说明实习项目的“订单量”这个指标从源头到产出的ETL过程7. 针对实习项目,复盘后最大的难点是什么8. 复盘之后有什么收获9. 你刚才说复盘收获是处理小文件,那么spark怎么处理小文件的?10. 处理小文件有哪些方法,举例子11. hive冷热分离的方法12. 你刚才提到了组里有做ec存储,你了解ec存储吗13. 暑期实习有什么感受,转正了吗15分钟14. 了解spark的semi join吗,他是干嘛的15. 了解spark的AQE,这是什么16. 你刚才讲AQE提到了广播机制,这个在spark中很重要,讲讲广播过程呢17. 了解网络吗?讲讲三次握手和四次握手区别。18. 了解数据结构吗?讲讲O(nlog n)的不稳定排序算法。20分钟两个编程题:Q1.求开方:给定num=5.79,error=1e-8,求x使得abs(x^2-num)<error19. 先讲讲思路吧,有什么思路:二分O(log n)20. 刚开始没做出来,面试官提示了下细节21. 后面二分法做出来了,面试官说那如果num小于1有什么变化呢22. 面试官问还有什么方法吗:牛顿下山法23. 公式写上去,但是面试官不关心公式,关心原理:会无限逼近24. 如果是三次方四次方,牛顿下山怎么用呢,公式会变的Q2.1TB的int类型数据怎么在512MB的虚拟机中求中位数25. 已经70分钟了,没时间了,没要求写代码,只要讲思路:外部排序,归并思想26. 面试官问还有什么方法吗:没想到了,但是后面搜了下有分布式排序,mapreduce排序等,估计想让我回答spark相关的,但是真不知道。5分钟反问27. 反问业务、作息、感受:都是套话28. 反问可以提升的点、我的不足:涉及到应聘者的评价,不能说。29. 谢谢面试官勒,吃饭去咯。
查看26道真题和解析
点赞 评论 收藏
分享
评论
13
34
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务