03-13 02:45 门头沟学院推荐算法

关注

腾讯大模型算法校招凉经

攒人品中，祝大家都能拿到满意的Offer！
1.实习拷打
2.项目拷打
3. Lora 一般用在什么场景？你对 Lora 初始化有做过不同尝试吗？有没有试过局部模型 lora，局部 full 全参。
4. 你的 Agentic 训练平均输出 token 是多少？有对单条 assistant 做压缩吗？
5. 原生多模态是指什么？听了你的 Paper 场景描述既然 MLLM 在 edited image 上表现不好，为什么不考虑预训练做你的场景？可以讲一下你对原生多模态的理解吗？你觉得预训练引入 image token 会不会对整体训练造成损失？
6. 我要手写一个输出端生成理解统一的模型，你会怎么设计（我没做过，但我说我会引入额外的结束 token，他说用原来的结束 token 就行）
7. 你的paper 用了 gspo，这个和 grpo 有什么区别？了解其他比如 DSPO 吗？
8. 数据蒸馏特点是什么？和模型蒸馏区别是什么？你为什么 paper 不采用模型蒸馏？（冷启动就是数据蒸馏）
9. MOE 特点是什么？你训练 MOE 和普通 SFT 有什么区别吗？额外加哪些并行训练？

手撕：
1. DPO Loss
2. MQA，写完后让我自己根据代码写一下 GQA 的分组

全部评论

推荐最新楼层

03-20 20:31

同济大学算法工程师

百度 - 大模型后训练实习生二面

📍面试公司：百度 🕐面试时间：2026.03.20💻面试岗位：文心一言 后训练❓面试问题：自我介绍，教育背景，项目，和实习（两段本科Java web实习，没有后训练实习经验）GRPO训练的数据流KL散度的计算公式，怎么做平滑softmax的计算公式，怎么防止数值爆炸，有什么影响GRPO里的$\pi_\theta$, $\pi_\theta_{old}$, $\pi_\theta_{rollout}GRPO里是off-poliy/on-policy，当batch_size非常大时，如何缓解off-poliy的问题？平时使用vibing code的频率，以及使用的模型有哪些？了解TRL，VE...

查看13道真题和解析

点赞评论收藏

分享

03-30 20:53

东南大学 C++

26.3.30 腾讯QQ浏览器客户端一面

一、自我介绍 / 岗位匹配 / 方向选择1.请做一下自我介绍。2.你之前主要投的是后台岗位，为什么后来转向客户端？3.你说自己和后台岗位匹配度不高，主要差在哪些方面？4.你对移动客户端开发岗位是怎么理解的？5.你为什么会考虑客户端 / SDK / AI 应用这些方向？二、实习项目整体理解：端侧特征平台做什么6.你在字节这段实习主要做了什么？7.你们这个 SDK 的定位是什么？是跨端的吗？8.你们这套东西更像 APM、数据采集，还是特征处理平台？9.你对这套业务在线上产品里的完整流程理解到什么程度？10.原始事件是怎么转成特征，并最终被业务方使用的？三、本地数据库 / SQL / 特征查询链路11.你们端上的数据是怎么存的？为什么用本地数据库？12.这个数据库用的是什么？它是普通数据库，还是有针对性能做特殊设计？13.你看到过哪些查询 / SQL 优化相关的内容？14.你做的 SQL 复用优化，本质上是在优化什么问题？四、设备特征缓存优化：设计、指标、并发问题15.你讲一下设备特征缓存优化这个需求的背景和方案。16.为什么会想到做 2s / 10s / 90s 这样的分层缓存？这些数值是怎么定的？17.你这个缓存是怎么检查过期、怎么更新的？18.这套缓存是你们第一次上线的吗？19.最终的优化收益是怎么测出来的？30%、Android 4.8%、iOS 2.5% 分别代表什么？20.你这里用到的智能指针和 concurrent hash map，线程安全和内存安全是怎么理解的？21.如果缓存瞬间失效，又来了很多并发请求，会不会出现类似缓存击穿的问题？你怎么处理？22.如果让你继续优化这套缓存，你觉得还能怎么做？五、特征 SQL 结果缓存 / 事件驱动失效 / TTL23.你说的特征 SQL 复用具体是怎么做的？24.所谓 SQL 签名化是什么意思，为什么要这么做？25.这个查询结果缓存的 key 和 value 分别是什么？26.查询结果缓存怎么判断是否还能复用？27.事件驱动失效机制具体是什么？为什么事件变了缓存就会失效？28.你这里有两个 TTL：设备特征缓存 TTL 和特征查询缓存 TTL，它们分别是怎么设计的？29.后期你提到不是直接删缓存，而是把最新结果插入缓存，这个思路具体是什么？30.这里有没有用队列或者别的方式维护事件变更？六、实习中的挑战 / 自动化测试 / MCP & Agent 生成用例31.这段实习里你遇到过最大的挑战是什么？32.这个需求是你一个人做的吗，还是 mentor 带着推进的？33.你提到自动化测试用例，这块具体做了什么？34.这些测试用例属于什么级别，是接口测试、单元测试，还是别的？35.你做的 MCP / Agent 自动补全测试用例，大致思路是什么？36.如果测试失败了，你们后续有没有自动分析、自动修复，还是主要人工处理？七、AI Coding：工具使用、代码占比、主要问题37.你现在 AI 用得多吗？平时会付费用哪些工具？38.你在项目里手写代码和 AI 生成代码的比例大概是多少？39.你主要用什么 AI coding 工具？40.你觉得 AI 写代码最大的优点和最大的问题分别是什么？41.如果 AI 生成的代码不符合你的预期，你一般怎么改进？八、多 Agent 项目：设计、评估、稳定性42.你这个 AI 投资分析系统整体是怎么设计的？43.多 Agent 的分工和整体执行流程是什么？44.你是一步步确认它生成的内容，还是一次性让它完成？45.你怎么判断一个 Agent 是否满足你的预期？46.Agent 和 Agent 之间通信的数据格式是谁定义的？47.多次运行的时候，Agent 之间输出的格式和结果能保持一致吗？48.如果模型不按你定义的格式输出，你会怎么优化？49.你这里 prompt、rule、skill 分别用在什么地方？九、上下文窗口 / 滑动窗口 / 记忆管理50.你高并发 AI 聊天系统里提到的“滑动窗口”具体是怎么做的？51.为什么要做这个滑动窗口？它解决了什么问题？52.这个窗口的 size、起点和终点是怎么定的？53.你怎么判断哪些上下文该保留，哪些该裁掉？54.你这个设计是不是严格来说不算真正的滑动窗口？55.如果让你重新设计这块上下文管理，你会怎么优化？十、C++ / 网络库 / 并发框架56.你这个高并发 AI 聊天系统里的网络库，是自己写的还是现成的？57.你给我讲一下这个网络框架的整体设计。58.epoll 在这里起到了什么作用？59.你的线程池是怎么设计的，为什么要动态扩容 / 缩容？60.你的网络库里，最核心的几个组件和职责分别是什么？十一、弱网排查 / 网络链路 / 协议优化61.如果用户反馈“很卡”，你怎么判断到底是不是弱网问题？62.如果线上只能看到网络日志，你会重点看哪些指标来排查？63.从输入网址到页面加载完成，整个网络链路里会经过哪些步骤？64.DNS、TCP 建连、资源下载这些环节分别可能出什么问题？65.如果 DNS 慢或者查不到，有什么优化思路？66.如果服务端响应慢或者 TCP 层有问题，你会怎么排查？67.对于弱网场景，有没有一些客户端侧的兜底优化手段？68.你了解哪些协议层面的优化，比如多路复用、QUIC 之类的吗？算法题：滑动窗口最大值面了一个半小时，面试官整体比较和蔼，不追问。转面客户端整体强度还是小了很多，不管了，现在能赚几年钱赚几年，有了AI以后哪个方向都是危机了，还是争取拿个好背书吧

点赞评论收藏

分享

03-20 20:41

同济大学算法工程师

蔚来 - 大模型后训练 - HRBP面

📍面试公司：蔚来🕐面试时间：2026.03.13💻面试岗位：大模型后训练❓面试问题：自我介绍实习时长，出勤频次薪资待遇🙌面试感想：BP老师很和蔼岗位不太match拒掉了offer

查看1道真题和解析

点赞评论收藏

分享

03-24 12:40

门头沟学院人工智能

科大讯飞大模型算法一面业务拷打

发点面经攒攒人品～1.实习拷打2. 论文拷打3.有什么涉及的具体的应用吗4.我看里面上写上面写了一些知识图谱的一个构建说一下这个这个任务的一个输入和输出吧，大概你用到了什么数据，然后什么模型去产出什么样的一个东西5.你这个图谱里边都有哪些类型的实体？关系是怎么定义的6.你用了BERT去做实体识别哈，那为啥用BERT呢？能不能直接用个BiLSTM搞定5.我看你提到了LayerNorm，这块为啥要用个条件LayerNorm有什么作用6.说一下transformer的底层结构吧7.Transformer为什么用了LayerNorm呢8.你说你做了一个Multi-Head Self-Attention，那注意力权重那部分你还记得公式是咋算的吗？9.说一下LoRA原理10.刚才提到用LoRA做参数高效微调的必要性，那如果不是用LoRA，而是做全参数微调，那会消耗多少显存，比如说我以一个7B规模的大语言模型为例11.说说现在千问里有哪些主流的大模型结构12.项目拷打13.那你们这个DAG 图是怎么构建的？根因节点怎么推出来的

点赞评论收藏

分享

03-19 15:01

已编辑

同济大学算法工程师

百度大模型后训练一面

📍面试公司：百度 文心一言🕐面试时间：2026.03.18💻面试岗位：大模型RL后训练❓面试问题：自我介绍，教育背景，项目经历项目介绍，基于大语言模型的信号灯控制，问题是什么，如何结合熵，怎么评测，指标结果如何强化学习理论内容，trust-range和PPO的关系PPO是off-policy or on-policy? on-policy为什么会有importance sampling，采样的策略模型和要训练的策略模型有偏差，重要性采样加以修正PPO的clip在优势A 正/负时 限制上/下届，A为正限制上届，A为负限制下届PPO的损失函数怎么计算的？广义优势估计是怎么计算？GAE中lam...

查看17道真题和解析

点赞评论收藏

分享

评论

1

5

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

61948次浏览 535人参与

# 机械笔面试考察这些知识点 #

17814次浏览 121人参与

# 商战，最累的是我们 #

31435次浏览 97人参与

# AI时代还有必要刷leetcode吗？ #

45681次浏览 550人参与

# 分享一个让你热爱工作的瞬间 #

69735次浏览 504人参与

# 米哈游笔试 #

671295次浏览 1207人参与

# 毕业租房也有小确幸 #

173441次浏览 4555人参与

# 字节7000实习来了，你投了吗？ #

42236次浏览 319人参与

# 想从事Agent应该学习哪些技术？ #

13276次浏览 379人参与

# 机械制造秋招总结 #

117690次浏览 927人参与

# 大学生该如何认清当下的就业环境？ #

165557次浏览 905人参与

# 国企/银行/研究所公司爆料 #

209038次浏览 917人参与

# 26届春招投递记录 #

4727次浏览 49人参与

# 有哪些公司在面试时考察AICoding？ #

26292次浏览 427人参与

# 实习必须要去大厂吗？ #

202152次浏览 1784人参与

# HR面都在聊什么？ #

20767次浏览 230人参与

# 初创公司值得加入吗？ #

44657次浏览 226人参与

# 春招什么时候投？ #

52390次浏览 709人参与

# 你都在哪些场所面过试？ #

80865次浏览 506人参与

# 你现在一天AI几次？ #

21921次浏览 147人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务