11-04 21:10 门头沟学院大数据开发工程师

关注

26秋招虾皮数据开发一二面

一面：
1.实习经历追问，数仓建设流程，为什么要设计各个层
2.spark的任务调度流程，spark的数据量级
3.spark的性能优化经验？
4.如何定位任务失败？有哪些原因？分别应该怎么处理
5.对于数据治理的理解，在元数据管理的治理中不同的元数据分别有什么作用？你是怎么使用的？
6.数据倾斜的情况在具体的什么业务中出现，举例，并给出你的优化方案
7.如何去保障数据的质量？数据标准你是如何制定的？
8.为什么源数据存在mongoDB？
9.了解agent么？大致讲一下agent的工作原理，mcp和functioncalls的区别是什么？
10.是否参与过模型的微调？agent的数据具体如何处理？数据增强那一块是怎么做的？
手撕：
拓扑排序，leetcode hot100课程表的变形 medium难度（之前背过模版所以还好）
二面：
1.具体追问了数据倾斜和OOM的问题是如何处理？
2.数据治理这一块你做了什么？不要说数据治理分这些
3.你是怎么做数据监控的？有哪些方面的监控？你如何具体定位问题去解决？
4.你的数据标准是如何制定的？你如何去保证数据的准确性和一致性？
5.agent这块是否了解？你实习主要是做什么的？agent的原理和强化学习这些是否有了解过？
手撕：
接雨水用了双指针后要求用单调栈

全部评论

推荐最新楼层

上海交通大学算法工程师

同学，瞅瞅我司，医疗独角兽，因为新业务扩展，11月校招HC暴增！我的主页最新动态，绿灯直达，免笔试～

1 回复分享

发布于 11-17 09:26 广东

11-24 19:03

已编辑

门头沟学院数据仓库

数新智能数据开发一面

30分钟 0.自我介绍1.谈了谈有无考公考研的打算2.回归正题 介绍项目（某硅谷的离线实时，还有paimon湖仓）讲了讲ads层指标什么三天登录，用户流向分析之类的，我说这三个项目指标都差不多问了我在哪做的，我说在自己虚拟机上部署的问数据来源，我说是有模拟生成业务库数据和日志数据的jar包，然后讲了一个这两条链路的数据的路径，maxwell，flume,kafka什么的然后问我paimon湖仓 怎么做的  我说paimon湖仓用官方的mysql-paimon的包直接进行同步，代替了maxwell然后我说paimon的snapshot+tag代替了传统离线的拉链表，感觉很方便，问我什么地方做的拉链，我说的用户表，然后我又讲了讲hdfs的小文件，paimon怎么解决的实时写入的小文件问了有没有遇到过什么问题  我说遇到执行任务的时候doris fe节点崩溃，查不到数据，然后我就一直扩大内存，虚拟机也搞得一台25g了3.flink怎么保证数据不丢不重   我答了kafka支持事务，checkpoint记录状态和kafka消费位点，又讲了paimon sink的时候自动清除没有snapshot指向的manifest来删除故障前多读的数据，说了一堆paimon相关的，比如lsm树文件结构，checkpoint时产生snapshot，还有paimon写入文件的大概流程4.数据倾斜  我说的原因就是比如短视频业务下某个视频火了产生热点key，导致某个分区数据特别多，可以用flink的重分区算子，写代码加盐打散，或者自定义kafka的分区逻辑5.sql优化  我说的谓词下推提前过滤，多表join优先join小表，还有starrocks，doris这些olap引擎的CBO优化查询，讲了starrocks物化视图是一个实际读出来的表，可以设置新鲜度来变更读的频率，而且CBO会自动查询sql语句的查询结果是不是某个物化视图的子集，以此来优化，然后这些引擎底层也会帮我们做些优化。6.问我知道paimon的结构化非结构化数据的存储格式吗    不知道，没接触过6.1讲一下什么是湖仓一体 我说是湖的各种数据都能存和仓的规范的，规定好字段名，类型等元数据便于分析的能力的结合，我自己又说了一些什么schema on write，read之类的7.问我还知道什么数据湖技术  我说iceberg，hudi 区别我之前看过，但是忘了，我就记得paimon和flink的集成比较好，比较亲儿子，然后就没问了8.怎么看现在很多人都投身大模型行业   我说的感觉很正常，因为这个ai本身看着就很吸引人（）8.1我说我用过那个阿里云的data什么，面试官说dataworks是吧，就是我们之前做的，问我还用过什么，我说阿里云的flink,fluss都用过，也用过神策，然后面试官讲了讲他们的产品8.2说了说我做过的其他东西，我说我搭建过网站，做过抖音小游戏但是上架太麻烦（）9.英语好不好  我答：半废   面试官说那海外业务就不考虑你了10.怎么看data+ai （因为我简历上写了了解data+ai）我说的就是从前我们用个什么库只能对文字完成基本情感的正负分析，而引入了大模型就可以做出更精确的判断，比如用在用户直播间识别弹幕给主播提建议，或者金融行业智能agent检测到风险实时邮件通知之类的反问 15分钟1.flink现实市场上用的多不多2.paimon这类数据湖到底用的多不多当时忘录音了（），有的问题记不清了整场面试也是又说有笑，面试体验给到夯（）🤠🤠🤠

查看21道真题和解析

点赞评论收藏

分享

11-28 22:58

复旦大学 Java

RabbitMQ最全面试题，面试官再问直接把这篇文章丢给他！

RabbitMQ的核心组件有哪些？RabbitMQ的核心组件包括：1、生产者（Producer）： 生产者是发送消息到RabbitMQ的应用程序。2、消费者（Consumer）： 消费者是接收RabbitMQ消息的应用程序。3、交换器（Exchange）： 它负责接收生产者发送的消息并将其路由到一个或多个队列。4、队列（Queue）： 存储消息直到它们被消费或过期。5、绑定（Binding）： 用于连接交换器和队列的规则。RabbitMQ如何保证消息的可靠传输？RabbitMQ保证消息可靠传输的机制：1、消息确认机制（Acknowledgments）： 消费者处理完消息后发送ACK信号。2、持...

点赞评论收藏

分享

12-07 21:20

门头沟学院客户端其它

26秋招腾讯客户端开发一面

1. 实习介绍2. 说我做了很多项目，叫我推荐几个说，开始拷打项目，先讲拼团3. 拼团项目业务流程介绍、营销规则树、高并发、自己做的吗？4. 责任链模式一般用来解决什么问题5. 项目tps和qps多少？有点忘记了6. qps的瓶颈？7. 最终数据一致性8. 读多写少的优化策略：缓存策略、数据库优化、写操作优化、缓存一致性9. 读多写少的索引设计10. mysql单库单表 数据超过2kw，索引是否有效：有效、但性能慢：内存压力大、写入变慢、全表扫描失效灾难11. 为什么DDD架构设计？12. SpringBoot处理HTTP请求的核心流程13. HTTP传输数据的安全问题和防护14. HTTPS握手过程（TLS握手）：Hello协商算法 → 证书验证身份 → 交换密钥 → 开始加密通信15. 拼团项目反思改进空间：高并发其他方案、部署、业务拓展16. 共享屏幕看我的Agent笔记17. 解释为什么做Agent开发？18. 出算法了，问我源码读的多不，我说不多，然后还是出常规算法题（估计想出多线程）19. 手撕：整数矩阵最长递增路径：DFS+记忆化搜索20. 为什么代码过度使用static，写习惯了leetcode、方便直接用21. Java中static编译后的效果：内存分配、字节码层面、类加载初始化、访问方式22. 手撕：连续子数组和为K的倍数的所有子数组：一开始暴力双层循环了，应该要哈希表存索引或者前缀和23. 代码怎么达到最优的性能：我答成了阿里代码规范、AI工具优化（回答空泛、缺乏具体优化案例）24. 反问什么部门和业务

查看19道真题和解析

点赞评论收藏

分享

11-30 14:28

上海交通大学算法工程师

高并发实时排行榜如何设计

面试题简述我们有一个玩家战力排行榜，战力实时变化，访问量巨大。我们想知道两件事：1、当前的 Top 100的战力是多少？2、某玩家的战力大概排在第几？在高并发、高波动情况下，你会怎样设计这个系统？怎么保证高可用和高QPS？面试官想听到的1、明白排行榜查询 = 有序结构查询；2、能讲 Redis Sorted Set 的方案；3、能讲高QPS场景下的分片、缓存、异步等。4、能讲清 Top 100 和个人排名两类查询的差异。面试回答举例排行榜本质上是一个有序集合问题，最合适的结构是Redis Sorted Set。Redis Zset天然支持：1、ZRANGE 0 99：拿 Top 100；2、Z...

2025系统设计复盘

点赞评论收藏

分享

12-06 23:15

山东大学算法工程师

哔哩哔哩大模型算法校招一面

1.实习介绍2.SFT中数据是怎么构造的  cot是怎么写的3.Cot的组成4.Transformer的架构介绍一下，self attention和cross attention的区别5.为什么大模型使用的是encoder6.PPO与DPO的区别7.PPO里用了几个模型，训练时更新哪个模型8.Python深拷贝与浅拷贝9.代码：子集问题

查看8道真题和解析

点赞评论收藏

分享

评论

2

5

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你小心翼翼的闯过多大的祸？ #

3853次浏览 68人参与

# 找不到实习会影响秋招吗 #

1399715次浏览 13635人参与

# 实习没事做是福还是祸？ #

4132次浏览 68人参与

# 重来一次，你会对开始求职的自己说 #

915次浏览 19人参与

# 2025年终总结 #

134130次浏览 2292人参与

# 考研人，我有话说 #

156572次浏览 1211人参与

# 哪些公司笔/面试难度大？ #

7058次浏览 32人参与

# 实习简历求拷打 #

23927次浏览 249人参与

# 你觉得现在还能进互联网吗？ #

29947次浏览 201人参与

# 携程工作体验 #

18941次浏览 66人参与

# 大厂VS公务员你怎么选 #

69130次浏览 638人参与

# 扒一扒那些奇葩实习经历 #

140164次浏览 1149人参与

# 找不到好工作选择GAP真的丢人吗 #

93680次浏览 1007人参与

# 那些我实习了才知道的事 #

253051次浏览 1784人参与

# 非技术投递记录 #

672883次浏览 6820人参与

# 机械求职避坑tips #

81066次浏览 531人参与

# 投格力的你，拿到offer了吗？ #

154900次浏览 829人参与

# 第一份工作能做外包吗？ #

94049次浏览 599人参与

# 作业帮求职进展汇总 #

85434次浏览 559人参与

# 秋招遇到的奇葩面试题 #

101253次浏览 416人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务