腾讯新闻-数据工程实习-一面

写一下面经吧,给自己积攒一下福
面试整个过程大概1.2个小时
背景:博主在美团研发部门从去年十一月实习到今年四月九号
1.聊了一下AI,skill和Agent
2.聊了一下美团项目
3.Spark oom,数据倾斜,结合自己在美团实际工作中遇到的问题讲解了一下
4.问了一下知道Spark和Flink吗
4.问了一下Spark join类型,博主忘了具体的用法了
5.问了一下类加载机制(博主已经半年没有使用过,面试官就跳过了)
6.问了一下Spring AOI(博主大概说了一下,几乎都忘了)
7.聊了一下Springboot基本概念

一道hot100,连续数组求连续子集和大于等于k的连续子集个数,博主第一时间暴力破解,后面问是否能优化,博主一时没有想起来可以滑动窗口

问了三道SQL,最后一道SQL算连续在线天数,博主忘记有个窗口函数(能计算分组内每行数据之间的差值)的名称,跟面试官讲了整个思路#腾讯##我的求职进度条#
全部评论
这是做数据平台的吗,怎么没问什么数仓的问题啊
点赞 回复 分享
发布于 04-16 16:51 上海

相关推荐

又是超过一小时的拷打,感觉这次挺综合的,八股、语言、大数据全都问了一遍1. 项目拷打,主要问我的项目为什么采用Hive Transform这种比较小众的方案,我的回答感觉他还是比较满意的2. 简述至少3种常见的排序算法,时间复杂度,稳定性3. 关系型数据库的索引的常用数据结构是?选择这种数据结构的原因是?4. MySQL中什么时候会导致索引失效?5. Java线程安全的数据结构有哪些?6. ConcurrentHashMap是怎么实现的?相比于在直接在HashMap外边加锁有什么区别?7. HashMap的key可以是什么类型?有什么要求?8. 处理金额相关的数据的时候,应该如何存储?在Java中和MySQL中应该选择什么数据类型?9. Linux下如何用一条命令统计某个目录下各个子目录的占用空间大小?10. 如果把Linux换成HDFS呢?如何统计?11. 对于一个超大的HDFS系统,会有什么性能风险?有什么优化手段?12. Spark的并发度是如何控制的?在一个任务中什么情况会导致并发度变化?13. 考虑以下场景:某电商网站有一个用户表(用户id,用户所在城市)和一个订单表(订单id,下单用户id,订单金额),请(1)统计总销售额前十的城市和这些城市对应的销售额(2)统计总销售额在10万元至20万元之间的城市14. 一个表有年、月、pv三个列,要求写行专列代码,转成年、一月、二月、三月……
查看14道真题和解析
点赞 评论 收藏
分享
评论
3
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务