03-26 04:50 门头沟学院推荐算法

关注

minimax大模型算法一面好难啊感觉

#MiniMax求职进展汇总# 攒攒人品！有面试过同岗的朋友欢迎评论区交流
1.介绍实习和论文
2.介绍你熟悉的大模型架构
追问：两者在注意力结构、训练策略和推理优化上的主要差异。
3.为什么 MoE 架构能在参数规模继续扩大的情况下保持训练效率？
4.MoE 的路由机制是怎么工作的？
为什么会出现专家负载不均的问题？
5.如果专家利用率很低，你会怎么优化路由策略？
6.SFT 和 RLHF 在训练目标上有什么本质区别？
为什么很多模型在 SFT 后仍然需要 RLHF？
7.RLHF 中 PPO 的核心优化目标是什么？
写出 PPO 的目标函数，并解释每一项的意义。
8.手撕：实现 K 个有序数组的中位数

全部评论

推荐最新楼层

上海交通大学算法工程师

强烈推荐！这个笔记写得很清晰 http://github.com/AccumulateMore/CV

1 回复分享

发布于 03-26 16:12 广东

哈哈哈，你是老六

门头沟学院大数据开发工程师

看着似乎没问啥东西啊

点赞回复分享

发布于 03-27 23:02 北京

拼多多校园招聘2027

拼多多_基础电商_资深算法工程师

考虑我司不欢迎联系

点赞回复分享

发布于 03-27 00:09 上海

04-13 08:54

广西大学算法工程师

作业帮大模型算法开发二面

1. 大模型微调的完整技术方案与工程落地细节采用 LoRA 参数高效微调方案，仅对 Transformer 的 Q/V 投影层添加低秩矩阵，冻结底座模型参数。训练时设置秩 r=8、缩放因子 α=16，使用 AdamW 优化器，学习率 2e-4，配合余弦退火学习率调度与梯度裁剪。工程上使用混合精度训练、分布式数据并行，提升训练效率，训练后合并 LoRA 权重，不增加推理延迟。 import torch import torch.nn as nn class LoRALinear(nn.Module):def __init__(self, in_features, out_features, r=...

查看24道真题和解析

点赞评论收藏

分享

05-09 06:25

门头沟学院 Java

minimax大模型agent二面分享

还是太菜了，下去沉淀一下1.深入剖析ReAct框架的局限性，并在此基础上，详细解释Plan-Then-Act、ReAct + 轻规划以及Tree/Graph Planning（如ToT、LATS）这三种范式的核心区别、适用场景和各自的优缺点。 2.请阐述“思维链”（Chain-of-Thought, CoT）与“规划”（Planning）的本质区别。为什么说CoT仅仅是“将推理过程写出来”而Planning是生成一个“可执行的任务表”？请用具体例子说明。 3.在处理一个需要多步工具调用的复杂任务（例如“调研三篇关于RAG+RL的论文并输出中文总结”）时，如何设计一个鲁棒的规划机制来应对中间步骤的失败（如某个API调用超时或返回数据格式错误）请描述具体的重试、回滚或重规划策略。 4.详细解释Tree-of-Thoughts (ToT) 或类似LATS（使用LLM进行蒙特卡洛树搜索）的框架是如何工作的？它们与传统的线性规划相比，在探索最优解题路径上有何本质优势？ 5.在Agent推理过程中，经常会出现“推理断层”或“结果与目标偏离”的问题。请结合具体技术或你的实践经验，说明如何通过提示工程、记忆机制或架构设计来缓解或解决这一问题。6.请深入剖析大模型Agent的“长期记忆”模块。在设计一个能够持续运行、与用户长期交互的Agent时，你会如何设计记忆的存储结构（如向量数据库、图数据库）、更新策略（如记忆合并、遗忘机制）、检索机制（如重排序、混合检索）来确保记忆的高效和准确？ 7.当历史对话记录非常长时（远超模型上下文窗口）你有哪些策略来优化记忆的查询效率并保证关键信息不丢失？请比较“滑动窗口”、“总结压缩”、“向量检索”等不同方案的优劣。 8.什么是“混合检索”（Hybrid Search）？请解释为什么在工业级RAG系统中，纯向量检索往往不够用，需要结合关键词检索（如BM25）。请给出一个具体的业务场景，说明混合检索的必要性。

查看8道真题和解析

点赞评论收藏

分享

03-31 00:26

广西大学算法工程师

小鹏大模型算法二面

1. 你做过的后训练项目里，最难解决的问题是什么2. SFT 数据你怎么构造，怎样避免模型被训练“油了”SFT 最大的问题不是量不够，而是数据风格太单一，最后把模型训成一种固定腔调：很会说、很圆滑、但信息密度低。构造数据时我一般会先按任务拆层，比如信息抽取、工具调用、复杂问答、拒答、安全、长文总结、结构化输出，每一层的目标都不一样。然后再做难度分桶，避免模型只见过简单样本。另一个关键点是负面风格清理。很多数据表面上没错，但非常模板化，比如“这是一个非常好的问题，让我们一步一步分析”，这类东西在少量数据里没问题，规模一大就会把模型带偏。所以我会专门清掉这种“高礼貌、低信息”的样本，保留更接近真实...

AI-Agent面试实战...

点赞评论收藏

分享

03-31 00:39

广西大学算法工程师

微信大模型算法开发一面

1. 介绍下你实习学了什么 做过什么项目,为什么离职的2. MoE 为什么能在参数量很大的情况下还能把训练和推理成本压住，真正难点在哪MoE 的关键不是“参数变多了”，而是“每个 token 只激活一部分参数”。也就是说总参数量可以做得很大，但单次前向只走少数几个 expert，所以理论上计算量不会随着总参数线性增长。这个思路在大模型里很有吸引力，因为可以同时兼顾容量和成本。但真正难的地方是路由和负载均衡。路由器如果只偏爱少数 expert，训练会很不稳定，热门 expert 被打爆，冷门 expert 学不到东西。另一个难点是通信开销，尤其多机训练时，token dispatch 和 gat...

AI-Agent面试实战...

点赞评论收藏

分享

04-14 08:50

广西大学算法工程师

快手大模型算法开发一面

1. 自我介绍2. 项目拷打3. Reward Model 在对齐训练里扮演什么角色Reward Model 本质上是在学一个“人类更偏好什么”的可微近似函数。SFT 学的是“像人那样答”，RM 学的是“人更喜欢哪种答法”。它并不直接生成答案，而是给候选答案打分，把人类偏好从离散排序信号压进一个标量目标里，后续无论是 PPO 还是其他策略优化方法，核心都要依赖这个分数去推动模型往偏好更强的方向移动。RM 最大的价值不是替代人工，而是把人工偏好从逐条监督扩展成可批量泛化的训练信号。真正难的地方在于它很容易学到表面模式，比如更长、更像模板、更会说套话的答案可能被错判成更优，所以 RM 训练的上限很...

AI-Agent面试实战...

点赞评论收藏

分享

评论

点赞

2

招聘动态

完美世界

拍了拍你并邀请你投递

“联宝杯”

2026 大学生创新大赛

上海人工智能实验室

2026年春季校园招聘

联想

27届暑期实习

联想

26届补录

27届校招宝典

厦门银行

2026届春季校园招聘

快手

27届实习超多转正机会

海信集团

联宝科技

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI让海力士市值突破9000亿美元 #

6622次浏览 56人参与

# 如何排解工作中的焦虑 #

339742次浏览 2875人参与

# 在爱玛，骑向未来 #

47862次浏览 458人参与

# 我的求职总结 #

467861次浏览 6647人参与

# 牛油的搬砖plog #

203819次浏览 1313人参与

# 机械笔面试考察这些知识点 #

20486次浏览 156人参与

# 这些公司卡简历很严格 #

106144次浏览 453人参与

# 国企vs私企，怎么选？ #

52261次浏览 233人参与

# 职场新人体验 #

194279次浏览 1266人参与

# 哪些公司对双非友好 #

236797次浏览 1261人参与

# 机械人与华为的爱恨情仇 #

161024次浏览 1060人参与

# 求职低谷期你是怎么度过的 #

41952次浏览 370人参与

# 什么专业适合考公 #

70655次浏览 390人参与

# 百度工作体验 #

337536次浏览 2295人参与

# 软开人，秋招你打算投哪些公司呢 #

204233次浏览 1584人参与

# 硬件人求职现状 #

538646次浏览 4838人参与

# 打工人的精神状态 #

156193次浏览 1581人参与

# 面试尴尬现场 #

228957次浏览 873人参与

# 设计人如何选offer #

214223次浏览 888人参与

# 海康威视求职进展汇总 #

612970次浏览 3774人参与

# 游戏求职进展汇总 #

794113次浏览 6522人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务