昨天 09:50 门头沟学院推荐算法

关注

字节大模型算法二面面经分享

祝大家都能拿到满意的Offer！
1.项目拷打
2.你们这里说的分层混合编排式 Agent 架构设计是具体怎么做的
3.我问一个就是你们在Routing那里，你会根据难度去做不同的一个处理，对吧？那你们这个难度是怎么划分的呢
4.你刚才提到就是说，比方说如果刚开始有动态升级的一个范式，就是比方说这个任务刚开始被分配到了7B但是如果它在生成的过程当中，置信度或者说生成的结果它的置信度比较低，你们这个置信度是怎么生成的呢
5.你们大概配备了多少个工具
6.以风险评估为例，你们的输入输出分别是什么呢
7.你的字段是什么
8.比方说你说的收缩压这个字段，在用户的问题当中可能不会有这样的一个检测数据。那这种情况你们是怎么来处理呢
9.我看到你这里有说在引入了应用层的MOE按照任务动态的激活专家路径，这个具体是怎么实现的呢
10.这里就有个问题，我们针对不同的科室去训练一个微调专家，那你们是你们怎么训练的呢？怎么针对于不同科室去训练的，第二个问题就是逻辑上你们这个专家数量可不会少，然后你们的工作量会比较大，这个问题你们又是怎么解决的呢
11.你们最终大概是用了多少个专家
12.每个大概训练的数据量是多少呢
13你们的这个70b模型用的是自己？从头开始预训练的吗？还是用的开源的
14那你们医疗数据你们医疗数据的主要来源是在哪里呢？

全部评论

推荐最新楼层

上海交通大学算法工程师

强烈推荐！这个笔记写得很清晰 http://github.com/AccumulateMore/CV

1 回复分享

发布于昨天 16:11 广东

昨天 21:08

杭州电子科技大学大数据开发工程师

【深夜长文】AI杀疯了的2026年，前后端、测试、运维、UI到底谁还有活路？

老实说，看着现在各种大模型一键生成页面、秒写正则、连发版脚本都能顺手写了，大家心里慌是正常的。在牛客上每天都能看到“XXX岗位是不是要凉了”的焦虑贴。但剥开情绪外衣，客观现实是：AI干掉的不是某个岗位，而是某个岗位的低级执行层。 咱们挨个岗位盘一盘，现在的“活路”到底在哪。1. 后端：从CRUD 机器到业务与架构的守门员如果你的日常就是接参数、查数据库、拼 JSON 吐给前端，那确实非常危险，AI 写这种样板代码比你快，还不会漏写分号。活路在哪？ 核心在于复杂的业务壁垒和系统架构能力。AI 很难理解深度的业务上下文。比如搞个竞标平台的后端，瞬间的高并发打过来怎么扛？出价时的事务一致性怎么保证？...

AI时代，哪些岗位最容易...

点赞评论收藏

分享

昨天 07:50

门头沟学院推荐算法

字节大模型算法面经-面麻了已经

攒人品中，祝大家都能拿到满意的Offer！1.项目拷打2生成式推荐本质上是在做隐空间到离散iD的映射，你如何证明你生成的 ID 序列保留了用户意图的最优压缩3.比如广告场景下不仅仅是预估 CTR。如果我们将生成式排序引入 GSP拍卖，大模型生成的候选列表概率分布，如何保证满足激励相容性4如果模型生成的排序导致广告主出现竞价上的博弈呢5.在H100集群上跑生成式重排，现在的瓶颈不在计算而在存储带宽。如果分阶段推理，我在Prefill阶段采用了FlashAttention-3，但在 Decoding 阶段因为 KV Cache 导致的Fragmented Memory太严重，怎么办6.推荐系统要求毫秒级响应对于1B规模的排序模型，如果我要做Speculative Decoding，你如何设计那个Draft Model？这个小模型是该学大模型的 Logits 分布，还是该学用户的Embedding聚类7.假设构建一个端到端生成式广告系统。现在面临一个场景：某个新入驻的土豪广告主投放了一批高质量视频，但由于模型对新 ID 的 Semantic Indexing 尚未完全对齐，导致第一波推荐给了错误的人群，产生了极高的 Negative Feedback，生成式模型的自回归特性会不断放大这种“第一印象”，导致该广告主瞬间被屏蔽你如何设计一套Online Counterfactual Correction这种，在不重新训练模型的前提下，通过修改 KV Cache里的隐藏状态来强行挽回这批广告的生命周期9.在短视频重排阶段使用了一个 10B 的生成式模型但是业务反馈说模型在学会了今天最火的某个梗以后，竟然忘记了如何处理用户对“长尾科普视频”的旧兴趣，发生了明显的 Catastrophic Forgetting，设计一种基于 Gradient Orthogonal Projection的优化器，确保模型在更新实时热点知识时，参数更新量在旧知识的Null Space内。10.都知道生成式模型有位置偏差从 Attention Entropy 的角度来看，为什么 $N$ 个候选 Item 在序列中的排列顺序会直接导致 Logits 的非线性漂移

查看9道真题和解析

点赞评论收藏

分享

昨天 08:57

浙江大学算法工程师

Momenta C++ 智驾二面面经

1. 自我介绍，介绍一下你觉得最有挑战性的项目2. 你提到用过多任务架构，任务数量多了之后内存压力怎么处理的？静态分配和动态分配你怎么选择？答：任务多了之后内存压力主要来自两块：每个任务的栈空间，以及任务间通信用的队列和信号量。栈空间的处理：先用 uxTaskGetStackHighWaterMark 跑一段时间，看每个任务实际用了多少栈，按实际用量加一定余量分配，不要每个任务都给一个很大的默认值对于简单任务（只做状态机跳转、没有深层函数调用）可以给很小的栈，比如 128 字对于有 printf、sprintf 或者复杂字符串处理的任务，栈需要大一些静态分配 vs 动态分配：嵌入式项目里我倾向...

C++八股文全集

点赞评论收藏

分享

昨天 00:15

上海交通大学算法工程师

OPPO大模型应用开发一面攒人品

继续来分享下之前的面经~欢迎友好讨论，信息共享1. 项目拷打2.实习拷打3. 数据收集和处理，使用Grpah-Rag的优势，本项目中Grpah的作用。4. 训练数据的构建细节5. 遇到数据内容冲突时应该如何处理？6. Rec、MRR、Acc等常见检索指标。7. 除了LLM as a Judge，还有什么方法评测回答的效果？8. 当不同的专家对同一回答评分方差很大时应该怎么解决？9. 在校内的科研/实践经历。10. 常见的Agent和Memory管理的范式。11. 遇到的印象最深/工作量最多的实际工程编码问题。

查看11道真题和解析

点赞评论收藏

分享

昨天 14:12

已编辑

吉林农业大学算法工程师

MiniMax 大模型开发一面

1. 介绍一下你的实习、项目和论文，重点讲一个你真正做深了的点2. 介绍一个你最熟悉的大模型架构，并说清楚它在注意力结构、训练策略和推理优化上的特点可以拿 Transformer 系列来答。核心由 Embedding、Multi-Head Attention、FFN、残差连接和 LayerNorm 组成。注意力结构负责建模 token 间依赖，训练上一般采用大规模自监督预训练，比如 next token prediction，然后再做 SFT、偏好对齐。推理优化上会做 KV Cache、FlashAttention、Continuous Batching、量化和张量并行。如果你想答得更像大模型...

AI-Agent面试实战...

点赞评论收藏

分享

评论

1

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI面会问哪些问题？ #

13859次浏览 277人参与

# 你做过最难的笔试是哪家公司 #

16444次浏览 109人参与

# 开放七大实习专项，百度暑期实习值得冲吗 #

8680次浏览 116人参与

# 你的实习产出是真实的还是包装的？ #

14125次浏览 209人参与

# 找AI工作可以去哪些公司？ #

3711次浏览 82人参与

# 春招至今，你的战绩如何？ #

44123次浏览 383人参与

# 厦门银行科技岗值不值得投 #

4854次浏览 116人参与

# 从事AI岗需要掌握哪些技术栈？ #

3895次浏览 110人参与

# 机械/制造每日一题 #

91923次浏览 1491人参与

# 阿里笔试 #

167937次浏览 1204人参与

# 春招你拿到offer了吗 #

822430次浏览 9947人参与

# 应届生进小公司有什么影响吗 #

132696次浏览 1188人参与

# 长得好看会提高面试通过率吗？ #

18055次浏览 190人参与

# 学历对求职的影响 #

656216次浏览 4202人参与

# 应届生第一份工作最好去大厂吗？ #

143267次浏览 1214人参与

# 沪漂/北漂你觉得哪个更苦？ #

6898次浏览 119人参与

# 一张图晒出你司的标语 #

2400次浏览 35人参与

# HR最不可信的一句话是__ #

3878次浏览 75人参与

# AI时代，哪个岗位还有“活路” #

7769次浏览 210人参与

# 职场新人体验 #

180336次浏览 1215人参与

# 工作丧失热情的瞬间 #

374945次浏览 2574人参与

# 什么专业适合考公 #

58513次浏览 303人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务