03-27 11:10 滴滴出行_国际化事业部_数据开发(实习员工)

发布于北京

关注

腾讯数据工程一面

1. 自我介绍
2. 用Hive还是Spark,比较了解哪个
3. spark问题定位流程，以及解决方法
4. 现在有一个任务跑的很慢，你如何去定位
5. 介绍一下广播和Shuffle的区别，以及Shuffle为什么会比广播慢？
你这里面之前说到的大部分都是在数据传输上，包括涉涉及到一些网络会导致它传数据量大比较慢嘛。
6. Shuffle将各个节点的数据传输到另一个节点之后，会做什么操作呢？
7. 小文件导致任务运行缓慢，是在Spark读的环节还是哪个环节？
8. 用过二级分区吗？用Spark写Hive二级分区时有没有遇到过什么问题？
9. flink的滑动窗口，以滑动窗口为例子啊，就是每5分钟统计过去一小时的那个行为流水，100万一分钟的，然后你5分钟去输做这种滑动窗口所计算的时候，怎么去预估它可能会产生多大的输出，以及计算量。
10. flink 的就它发完了，它在重写的时候有个问题，我想问一下。它能基于checkpoint，我们可能说是checkpoint来重启嘛。那我数据从kafka里面消费的时候，我们可以某个精确到某一秒的时间点，能回溯对应的数据吗？
11. 那有没有哪里有性能问题？换一种更好的方式写的话，你会怎么写？
12. 如何优化你写的这两个sql
13. 这两段sql在spark里面是如何运行的

全部评论

推荐最新楼层

爱睡觉的冰箱哥

字节跳动_番茄小说_数据开发(实习员工)

蹲蹲后续

点赞回复分享

发布于 04-14 21:53 安徽

学学学学学我学

中国矿业大学数据分析师

佬sql题出了什么呀

点赞回复分享

发布于 03-30 19:31 广东

调皮的山羊在写bug

上海科技大学数据仓库

哪个事业群呀

点赞回复分享

发布于 03-27 16:46 广东

04-30 10:14

北京邮电大学 Java

腾讯 IEG 后台开发一面

自我介绍实习A 系统 多业务线的统一纳管配置是什么意思延时双删解释一下；有没有可以根治数据库与缓存不一致的方法；为什么不采用主从读写分离用户如何触发点位上的投放召回有没有通过算法模型推测用户喜好；如果让你设计，比如给用户推荐美食，如何做（数据越多，构建出来的模型越清晰）；一直拉其他业务的数据合适吗，有没有更好的方法B 平台 为什么要做综合运用三个设计模式，具体是如何做的为什么用轮询，而不是通过线程做异步通知；现在前端会做轮询，如果有人伪造大量恶意请求，怎么办C 系统 如何根据用户的实时数据优化算法模型详细说一下双链路诊断工具；为什么不在落日志之前针对失败做告警主从资源利用不均的问题是如何发现的...

查看27道真题和解析

点赞评论收藏

分享

04-28 09:24

门头沟学院大数据开发工程师

京东数据开发2面

我最近又来面京东了，感觉京东这家公司有点意思，感觉一直有缺口，面试如下1 先自我介绍2 聊一下你做的项目，主要有哪些是你负责的，主要解决了啥问题，有啥技术难点3 说一下离线数仓和实时数仓侧重点，技术栈选型4 对于实时有个场景，京东电商可能存在用户出现跨多天退款，如何实时的解决这个订单跨天问题带来的订单实付更新问题，如何解决毛利实时更新问题5 对于实时来说，目前有些商家可能会更新资质，如何实时保证目前商家资质监控，做到实时展示最新的资质6 目前对于财务指标你这边都是分了哪些数据域和数据主题，如果要你来做一个财务的基建，你会优先建设哪些主题7 对于数据治理来说你们平台治理有哪些治理规则，如何体现收益，如果要你来做这个数据治理你会怎么建设8 数据质量和延迟有遇到吗，一般怎么发现解决的，晚上起夜解决异常任务最快怎么处理9 有啥要问我的10 来个SQL题目吧，如何快速在一个字段找到a字符的数量我感觉京东这个2面应该是个资深的人来面的，感觉全是技术难题啊，对于实时和离线必须要有实际开发水准

查看9道真题和解析

点赞评论收藏

分享

04-21 22:55

门头沟学院大数据开发工程师

字节，数据开发2面

最近也面试了字节，感觉面试还比较难，面试技术较深1 先自我介绍一下自己2 介绍一下目前接触的项目，做了哪些工作，有啥亮点，技术栈主要包含哪些3 flink的窗口函数有哪些，底层运行原理是啥，触发器如果自定义一般都是怎么触发的4 对于flink来说怎么做到精确一致性，实时指标如何确保数据没有问题，有哪些保障措施5 对于olap引擎来说如果要短时间回溯百亿数据，怎么做到秒级别写入，如果一个表查询挂了写入任务，如何做到保障6 对于湖仓来说为啥现在都在说这个，湖仓对于普通的数仓来说有哪些好处，为啥现在都在部署湖仓7 对于模型建设来说，主要是设计哪些模型，每个模型在建设的时候，主要是需要考虑哪些方面，如果不遵循该怎么解决8 对于数据治理来说，你觉得一个数仓如果需要治理主要是从哪些方面入手，对于技术来说有哪些措施9 有啥需要找我了解的

查看8道真题和解析

点赞评论收藏

分享

04-21 21:35

北京邮电大学 Java

27实习字节后端ai开发一面

整体面试还是不错的，但是没后续了，不知道是哪里出了问题1.实习拷打2.挑一个项目仔细讲讲3.做项目的过程中觉得哪里是比较困难比较复杂的，做了哪些具体工作完成的4.RAG知识库分块怎么分?有哪些分块方法?目前使用的方法的不足是怎么优化的?5.问题改写怎么做的?6.RAG中比较重要的知识库，如果其中部分知识失效了或者需要更新，应该如何处理?能想到什么方法?八股:1.Java数据结构中的hashmap有哪些设计点你觉得比较好?答了访问元素时间复杂度低，还说了一下底层结构a.面试官引导问扩容机制b.为什么都是扩容到2的次幂c.面试官补充还有位运算快2.redis为什么快?3.redis过期的数据再访问就访问不到了，怎么做到的?答的惰性删除和定期删除a.追问为什么有惰性删除还需要定期删除?b.定期删除和redis的IO是一个线程吗?是或不是都有什么问题?4.MySQL的ACID怎么实现的?5.什么时候加表锁?6.了解索引下推吗?手撕:求二叉树的最大宽度

查看16道真题和解析

点赞评论收藏

分享

04-16 16:21

已编辑

门头沟学院 Java

4.16 滴滴一面

基本都答上来了 看到手撕出这个的时候就感觉不太妙  确实面完秒挂（kpi？）1. 自我介绍。2. 平时通过哪些渠道了解 AI 方向的新技术、新产品和新动态？3. 在学习或项目中用过哪些 AI 工具、产品或工程化框架？为什么这样选型？4. 实习中接触的系统数据规模大概是多少？表数量、单表数据量级分别如何？5. MySQL 慢查询一般怎么排查？会看哪些日志、用哪些分析手段？6. explain的常见关注指标有哪些？如何根据执行计划判断慢查询原因？7. 遇到查询慢时，一般会从哪些方向做优化？8. 为什么不建议直接 `select *`？按需查询字段为什么可能提升性能？9. 联合索引为什么会失效？什么是最左前缀匹配原则？10. 联合索引在范围查询、缺失中间列等场景下会有什么影响？11. 联表查询时索引是否还能生效？需要关注哪些问题？12. 介绍一下你做过的 AI Agent / 智能问答类项目：整体目标、系统形态、核心流程分别是什么？13. 为什么要引入 RAG？RAG 主要解决了大模型的哪些问题？14. SSE 是什么？为什么需要用它来做流式输出？15. 你的 RAG 流程是怎么实现的？从文档导入到最终回答，中间经历了哪些步骤？16. 向量检索里只做 TopK 是否足够？还有哪些更精细的召回或重排方案？17. 文档分段策略是怎么设计的？除了固定长度切分，还有哪些做法？18. 为什么要在分段时设置重叠区域（overlap）？它主要解决什么问题？19. 向量化存储用的是什么方案？为什么选择这种向量数据库 / 存储方式？20. 项目中接入过哪些模型？模型接入时如何考虑能力、成本和向量化支持？21. 进程间通信有哪些常见方式？22. 什么是死锁？死锁产生的典型场景和必要条件是什么？23. 网络分层模型有哪些？OSI 七层和 TCP/IP 四层分别怎么划分？24. TCP 和 UDP 属于哪一层？两者的主要区别是什么？25. TCP 为什么说是可靠传输？可靠性主要靠哪些机制保证？26. 三次握手的流程是什么？27. 为什么断开连接通常需要四次挥手，而不是三次或五次？28. Redis 中点赞 / 互动状态这类功能适合用什么数据结构实现？为什么？29. Redis 如何做高可用？30. 如果 Redis 挂掉，互动数据如何保证不丢？除了 Redis 本身，还可以怎么做持久化和兜底？31. 算法题：二叉树的最大深度。32. 解题思路？33. 反问环节

点赞评论收藏

分享

评论

2

11

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如果春招能重来，我会___ #

27707次浏览 275人参与

# 机械人还在等华为开奖吗？ #

338900次浏览 1652人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

49148次浏览 637人参与

# 这个offer值得去吗？ #

28663次浏览 207人参与

# 24秋招避雷总结 #

1019189次浏览 7097人参与

# 你会因为行情，降低找工作标准吗？ #

42697次浏览 313人参与

# 在爱玛，骑向未来 #

19227次浏览 379人参与

# 大学最后一个寒假，我想…… #

103086次浏览 846人参与

# 机械求职避坑tips #

103512次浏览 589人参与

# 刚入职就____，这样正常吗？ #

147953次浏览 708人参与

# 记录我的毕业季 #

3367次浏览 90人参与

# 去年你投递实习了吗？ #

32749次浏览 339人参与

# 字节开奖 #

158238次浏览 774人参与

# 华为池子有多大 #

177464次浏览 927人参与

# 做完笔试后你收到面试了吗？ #

65104次浏览 309人参与

# 今年找实习到底有多难？ #

104729次浏览 489人参与

# 秋招盘点:机械人值得去的企业 #

106383次浏览 741人参与

# 面试体验最好和最差的公司 #

47954次浏览 197人参与

# 秋招前后对offer的期望对比 #

551479次浏览 3464人参与

# 有深度的简历长什么样？ #

60646次浏览 771人参与

# 金融财会交流会 #

150944次浏览 498人参与

# 今年春招是金一银二嘛？ #

104869次浏览 566人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务