算法打工人阿旺

2025-06-01 23:15 中山大学算法工程师发布于山东

关注

竞争激烈:米哈游大模型算法岗面经

1.请简述什么是大模型，以及它与传统模型的主要区别是什么？
2.你如何评估大模型的性能？有哪些常用的评估指标？
3.请描述一下你如何对大模型进行优化，以提高其性能和效率。
4.你是否有过使用或开发大模型的经验？请分享一个具体的案例。
5.大模型中的注意力机制是如何工作的？它在大模型中起到了什么作用？
6.大模型中的优化算法有哪些常见的选择？它们各有什么优缺点？
7.如何处理大模型训练过程中的梯度消失或梯度爆炸问题？
8.在大模型设计中，如何权衡模型的复杂度和性能？
9.面对大模型训练和推理所需的庞大计算资源，你有什么解决建议？
10.请简述你了解的大模型的主要结构特点。
11.reward bench上的reward model分哪几类?
12. reward model如何训练的，训练目标是什么?
13.dp0训练的损失函数和训练目标，dpo如何改进怎么理解大模型安全，包含哪些方面的内容？
14.指令跟随能力的评估集有什么，如何评估的?
15.阿尔法狗强化学习策略是什么?提升推理能力和指令跟随能力哪个更难, 为什么, 提升指令跟随能力的优化方式和其他的比如推理有什么不一样的地方?
16.dpo训完了一般输出长度会变化吗? 如何解决这个问题大模型训练过程学习率一般是怎么变化的, 退火阶段学习率如何变化
的?
17.在开发大模型时，当你面临推理阶段的资源需求时，你如何确保模型的可解释性和公平性？
18.谈谈你对Transformer模型的理解，以及它在自然语言处理中的应用。
19.请简述Transformer的基本结构和工作原理？
20.为什么Transformer使用位置编码(Positional Encoding)？
21.如何优化 Transformer 模型的性能？
22.Transformer在自然语言处理中有哪些应用？
23.transformer里边norm的位置在哪里,norm如何计算的多头自注意力机制的作用是什么？
24.注意力机制为什么除以根号dk, 为什么不是dk请解释什么是注意力机制，并举例说明其应用场景。
25.注意力机制是如何工作的？请简述其计算过程。
26.多头注意力机制是什么？它相比单头注意力有什么优势？
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

牛客747507093号

南京大学自然语言处理

点赞回复分享

发布于 2025-07-28 21:50 江苏

03-20 22:47

门头沟学院 C++

腾讯 WXG客户端开发-C++ 一面

1. 自我介绍2. 讲一下你做过的项目，重点说说一个最有挑战的点3. shared_ptr 性能优于 unique_ptr 的原因是什么答案：严格来说，这个说法通常是不成立的。unique_ptr 一般比 shared_ptr 更轻，因为它只有独占所有权，不需要维护引用计数，也没有额外控制块的原子增减开销。shared_ptr 的优势不是“更快”，而是适合共享所有权场景，多个对象都需要安全持有同一资源时，它能减少手动管理生命周期带来的错误。所以如果对象所有权天然唯一，优先用 unique_ptr；只有当共享所有权确实是业务需要时，才考虑 shared_ptr。面试里如果对方故意这么问，比较好的...

C++ 常考面试题总结

点赞评论收藏

分享

03-24 21:30

门头沟学院推荐算法

滴滴大模型算法实习一面 1h

给我面没招了，发点面经攒攒人品～多Agent系统与垂域大模型落地1. 中心化调度的多Agent架构中，子Agent的接口设计与结果回流机制如何保证系统稳定性？2. 纯Prompt实现的Agent范式下，如何设计评测体系以实现自动化的能力判定与迭代闭环？3. 基于外部知识检索的内容生成，为何容易出现信息复述而非独立推理？如何从算法层面解决这一问题？4. 垂域量化指标（风险/情绪类）的建模中，小样本场景下为何选择LoRA微调而非全量微调或Prompt Engineering？5. 垂域LoRA适配时，如何构造高质量监督数据以保证模型输出数值的合理性与一致性？6. 从原型验证到工程化迭代，如何平衡系统效果、推理成本与训练开销？Transformer Encoder 底层原理与训练稳定性1. 完整描述Transformer Encoder的计算流、残差连接与归一化位置设计。2. 写出多头自注意力的完整数学公式，并说明各维度的含义与变化。3. 从概率分布与梯度视角，解释scaled dot-product中除以√dₖ的必要性。4. 对比固定缩放系数与可学习缩放系数在注意力计算中的训练稳定性与表达效率差异。5. 从序列特性、padding影响、梯度传播三个角度，分析NLP中LayerNorm优于BatchNorm的原因。

查看11道真题和解析

点赞评论收藏

分享

03-03 21:35

门头沟学院 Java

华为AI应用开发校招一面

继续来分享下之前的面经~欢迎友好讨论1.项目拷打2.代码题：数组中仅一个元素出现一次，其余均出现两次，要求线性时间、常数空间复杂度3.介绍实习经历4.Mcp server的构建方式。5.大模型调用Mcp工具的完整流程。6.工具多导致token数过多的解决办法。7.上下文管理的实现方式。8.如何判断当前对话与历史对话有无关。9.上下文过长时的处理方法。10.介绍了解的强化学习内容11.分享一个最有挑战的经历

查看11道真题和解析

点赞评论收藏

分享

03-26 10:35

门头沟学院推荐算法

高德大模型算法一面面经 1h

给我面没招了，发点面经攒攒人品～1.项目拷打2.语义漂移吗？如果遇到罕见病，模型产生‘幻觉对齐’导致误操，有没有方案去做兜底3.在医疗决策里，‘兴趣’是伪命题，‘合规’才是核心。用常规的DIN是做用户兴趣建模，但把DIN 里的激活单元改成了双线性交互这会不会导致模型对‘强特征’（如过敏史）的敏感度被‘软语义’稀释？4.知识库里既有权威指南又有脱敏病例。当这两者发生逻辑冲突时（比如新版指南否定了旧病例的方案），路由机制是怎么做确定性仲裁的？5.说的算子融合具体是怎么做的6.做生成式推荐重构，LLM虽然语义理解强，但天生带有选择偏见（。在冷启动场景下，怎么保证模型生成的物料序列不会陷入‘信息茧房’？7.手术机器人的环境是很复杂的，比如它组织形变是不规则的。你提到的不确定性感知），具体是基于传统的卡尔曼滤波还是基于大模型的分层鲁棒控制？当模型预测的8.动作序列与传感器实时反馈发生显著偏离，怎么实现毫秒级的安全制动9.用Pseudo-ID做时序追踪，但如果攻击者通过多维病理特征进行逆向重构，Embedding层做了哪些差分隐私处理10.手撕：Transformer block实现

查看10道真题和解析

点赞评论收藏

分享

03-25 08:30

西安交通大学算法工程师

阿里大模型算法面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.项目拷打2.你在去部署或者训练预训练或者后训练的模型时，有没有用过一些比较底层的一些训练的调试的工具，比如说千卡的话很容易就会出NCCL timeout，如果出现 NCCL timeout，一般怎么定位和解决？3.像那种rl里面的那个MOE之类的那种的优化有去做过吗4.看您的训练经验比较丰富，而且您上线运行的推理内容之前也进行过一些什么样的优化吗？5.有没有做过 kernel级别的优化？比如用 CUTE DSL或者手写 CUDA去做 fusion这类算子融合优化，介绍一下6像底层，如果你们在做.kernel fusion，倾向于用什么方式来做7.有没有哪次你做了 fusion 结果性能反而下降的？原因是什么8.平时写 CUDA的时候，有没有关注到底层实现细节？比如你刚提到 FA2，那再往下一层，像 Hopper架构里那个 warp specialization是什么，它底层大概是怎么实现的9.试过用 Agent去生成cuda内核么，怎么去做的10.如果我把 warp specialization 去掉，只保留 tile 和 shared memory 优化，大概会损失在哪？11.怎么么判断一个 MoE 模型是真的学到了分工，而不是只是把 dense模型拆开了12.在 RL + MoE 里，有没有遇到过 reward把 routing学坏的情况？就是模型为了拿 reward，全都走某几个 expert，这种情况你当时是怎么处理的

查看11道真题和解析

点赞评论收藏

分享

评论

2

32

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI时代还有必要刷leetcode吗？ #

33539次浏览 429人参与

# 大学生该如何认清当下的就业环境？ #

162125次浏览 884人参与

# 有哪些公司在面试时考察AICoding？ #

18721次浏览 346人参与

# 运营来爆料 #

98756次浏览 508人参与

# HR面都在聊什么？ #

13283次浏览 162人参与

# 美团开奖 #

407660次浏览 1805人参与

# 26届春招投递记录 #

3540次浏览 42人参与

# 百度工作体验 #

325301次浏览 2247人参与

# 想从事Agent应该学习哪些技术？ #

8180次浏览 279人参与

# 实习学到最有价值的工作习惯 #

69558次浏览 551人参与

# OPPO求职进展汇总 #

808849次浏览 5441人参与

# 校招生月薪1W算什么水平 #

143333次浏览 492人参与

# 你觉得什么岗位会被AI替代 #

57119次浏览 371人参与

# 从投递到OC，你用了多久 #

23220次浏览 238人参与

# 什么人最适合大厂？ #

12434次浏览 132人参与

# 父母问你工作找得怎么样，怎么回 #

22633次浏览 281人参与

# 哪些公司面试还在问八股？ #

13631次浏览 123人参与

373742次浏览 2921人参与

# 我与AI的日常 #

3243次浏览 16人参与

# 我的求职进度条 #

1110069次浏览 8022人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务