昨天 07:50 门头沟学院推荐算法

关注

字节大模型算法面经-面麻了已经

攒人品中，祝大家都能拿到满意的Offer！
1.项目拷打
2生成式推荐本质上是在做隐空间到离散iD的映射，你如何证明你生成的 ID 序列保留了用户意图的最优压缩
3.比如广告场景下不仅仅是预估 CTR。如果我们将生成式排序引入 GSP拍卖，大模型生成的候选列表概率分布，如何保证满足激励相容性
4如果模型生成的排序导致广告主出现竞价上的博弈呢
5.在H100集群上跑生成式重排，现在的瓶颈不在计算而在存储带宽。如果分阶段推理，我在Prefill阶段采用了FlashAttention-3，但在 Decoding 阶段因为 KV Cache 导致的Fragmented Memory太严重，怎么办
6.推荐系统要求毫秒级响应对于1B规模的排序模型，如果我要做Speculative Decoding，你如何设计那个Draft Model？这个小模型是该学大模型的 Logits 分布，还是该学用户的Embedding聚类
7.假设构建一个端到端生成式广告系统。现在面临一个场景：某个新入驻的土豪广告主投放了一批高质量视频，但由于模型对新 ID 的 Semantic Indexing 尚未完全对齐，导致第一波推荐给了错误的人群，产生了极高的 Negative Feedback，生成式模型的自回归特性会不断放大这种“第一印象”，导致该广告主瞬间被屏蔽你如何设计一套Online Counterfactual Correction这种，在不重新训练模型的前提下，通过修改 KV Cache里的隐藏状态来强行挽回这批广告的生命周期
9.在短视频重排阶段使用了一个 10B 的生成式模型但是业务反馈说模型在学会了今天最火的某个梗以后，竟然忘记了如何处理用户对“长尾科普视频”的旧兴趣，发生了明显的 Catastrophic Forgetting，设计一种基于 Gradient Orthogonal Projection的优化器，确保模型在更新实时热点知识时，参数更新量在旧知识的Null Space内。
10.都知道生成式模型有位置偏差从 Attention Entropy 的角度来看，为什么 $N$ 个候选 Item 在序列中的排列顺序会直接导致 Logits 的非线性漂移

全部评论

推荐最新楼层

上海交通大学算法工程师

强烈推荐！这个笔记写得很清晰 http://github.com/AccumulateMore/CV

1 回复分享

发布于昨天 16:11 广东

会一点点编程

National University of Singapore 算法工程师

这么难吗

点赞回复分享

发布于昨天 14:05 新加坡

03-25 22:34

天津大学 Java

字节后端一面（秒挂，加上本科的体验，再也不想投字节了）

1.你这后面怎么那么大一个校徽（我费劲抢到的学校面试间。。对这场面试我足够看重）2.拷打科研经历15min，最后的结论是我觉得你这个做的没意义（那我也承认啊，那我硕士科研不就为了能毕业吗。。能有什么意义）3.你没有实习经历，那给你一个情景，你设计一下吧，要实现发红包功能，你底层怎么写围绕这个场景，拷打了40min。。我设计一种，面试官觉得存在问题，让我改，翻来覆去六版，还是不满意，ok，fine，那我不就是没实习才要找实习。。4.手撕，没什么好说的，秒了。。最后纠结了一会输出，发现我写的是对的。5.为什么hashmap可以O1访问到数组。我人晕了，不然呢。。那能是什么。姑且答了数组是连续的内存空间，可以根据首内存+偏移量得到数据说实话，三年前面字节，面试官独一份的掐秒表问问题，以及最后手撕没按她思路写，说没时间了那就这样吧，然后给我挂了。导致我心中挺排斥字节的。从三年前到现在，面了正好是39次了，下次刚好第40次，只有字节给我的体验最差。我始终觉得面试是个双向选择的过程，我不否认我没有出众的技术实力，我也认可公司或者部门想要高技术经验丰富的人，那不合适就友好结束，为什么非要在面试的过程中不断表现出负面的感觉呢？这也不是我第一次挂面试了，但上次挂面试我没有觉得什么，我认为我和面试官友好沟通了之后发现可能确实不太合适。只能说读研也改变了我，放以前我可能很生气，现在我只是觉得真没必要，都是打工人，无非生的早晚而已。愿每个辛苦找实习，投简历，做测评，做笔试，为面试焦虑的同学们都能被正常对待。

查看2道真题和解析

点赞评论收藏

分享

昨天 19:08

中国矿业大学后端工程师

3.26字节财经一面

1 synchronized底层原理 2.voliate 为什么不能保证原子性 3.threelocal内存泄漏的原因 4.mysql为什么用b+树 5.事务隔离级别有哪些主要解决什么问题  6.mvcc原理 7.对ai的理解 8 skill作用 9 mcp是什么样的协议 10.怎么开发一个mcp服务 11上下文过大怎么解决  12.leetcode438. 找到字符串中所有字母异位词

点赞评论收藏

分享

昨天 10:35

门头沟学院推荐算法

高德大模型算法一面面经 1h

给我面没招了，发点面经攒攒人品～1.项目拷打2.语义漂移吗？如果遇到罕见病，模型产生‘幻觉对齐’导致误操，有没有方案去做兜底3.在医疗决策里，‘兴趣’是伪命题，‘合规’才是核心。用常规的DIN是做用户兴趣建模，但把DIN 里的激活单元改成了双线性交互这会不会导致模型对‘强特征’（如过敏史）的敏感度被‘软语义’稀释？4.知识库里既有权威指南又有脱敏病例。当这两者发生逻辑冲突时（比如新版指南否定了旧病例的方案），路由机制是怎么做确定性仲裁的？5.说的算子融合具体是怎么做的6.做生成式推荐重构，LLM虽然语义理解强，但天生带有选择偏见（。在冷启动场景下，怎么保证模型生成的物料序列不会陷入‘信息茧房’？7.手术机器人的环境是很复杂的，比如它组织形变是不规则的。你提到的不确定性感知），具体是基于传统的卡尔曼滤波还是基于大模型的分层鲁棒控制？当模型预测的8.动作序列与传感器实时反馈发生显著偏离，怎么实现毫秒级的安全制动9.用Pseudo-ID做时序追踪，但如果攻击者通过多维病理特征进行逆向重构，Embedding层做了哪些差分隐私处理10.手撕：Transformer block实现

查看10道真题和解析

点赞评论收藏

分享

昨天 10:41

香港理工大学 Python

当使用claude code上下文卫生管理

当在主任务上下文中注入不相关的问题和答案时，会发生两件事：Token预算缩小。每次Q&A交换消耗的空间本可以容纳文件内容、代码分析或实现计划。信号降级。降级了Claude在会话剩余时间生成的每个响应。这时就要灵活使用这三个命令：/btw 在污染发生前预防它。用于每个不需要工具访问的中途问题。/fork 隔离探索。当你需要全功能调查而不污染主会话时使用。/rewind 在污染发生后移除它。用于航向纠正和上下文压缩。决策框架：使用哪个Claude Code命令当你在会话中间需要决定使用哪个工具时，使用这个流程图：快速参考：命令选择指南快速问题： 使用/btw——成本非常低，无上下文影响需要...

点赞评论收藏

分享

03-25 19:33

郑州轻工业大学 Java

字节简历秒挂……不到半小时，道心破碎了？

我是犯天条了吗？大佬们

牛客57020934...：双非本投Seed吗，这种都是在9本9硕上还要挑一堆论文竞赛的岗

点赞评论收藏

分享

评论

点赞

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI面会问哪些问题？ #

13859次浏览 277人参与

# 你做过最难的笔试是哪家公司 #

16444次浏览 109人参与

# 厦门银行科技岗值不值得投 #

4854次浏览 116人参与

# 你的实习产出是真实的还是包装的？ #

14125次浏览 209人参与

# 找AI工作可以去哪些公司？ #

3711次浏览 82人参与

# 春招至今，你的战绩如何？ #

44123次浏览 383人参与

# 开放七大实习专项，百度暑期实习值得冲吗 #

8680次浏览 116人参与

# 从事AI岗需要掌握哪些技术栈？ #

3895次浏览 110人参与

# 机械/制造每日一题 #

91923次浏览 1491人参与

# 阿里笔试 #

167937次浏览 1204人参与

# 春招你拿到offer了吗 #

822430次浏览 9947人参与

# 应届生进小公司有什么影响吗 #

132696次浏览 1188人参与

# 长得好看会提高面试通过率吗？ #

18055次浏览 190人参与

# 学历对求职的影响 #

656216次浏览 4202人参与

# 应届生第一份工作最好去大厂吗？ #

143267次浏览 1214人参与

# 沪漂/北漂你觉得哪个更苦？ #

6898次浏览 119人参与

# 一张图晒出你司的标语 #

2400次浏览 35人参与

# HR最不可信的一句话是__ #

3878次浏览 75人参与

# AI时代，哪个岗位还有“活路” #

7769次浏览 210人参与

# 职场新人体验 #

180336次浏览 1215人参与

# 工作丧失热情的瞬间 #

374945次浏览 2574人参与

# 什么专业适合考公 #

58513次浏览 303人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务