03-26 05:35 门头沟学院推荐算法

关注

大模型算法二面技术面-minimax

#MiniMax求职进展汇总# 整体面试还是不错的，但是没后续了，不知道是哪里出了问题
1.介绍实习项目时，重点讲你解决过最困难的问题以及最终的优化效果。
2.你在训练大模型时用过哪些分布式训练方案？
数据并行、模型并行、流水并行的区别是什么？
3.DeepSpeed 的 ZeRO-1 / ZeRO-2 / ZeRO-3 的核心差异是什么？
4.如果训练一个 70B 模型，如何估算单卡显存占用？
5.除了 ZeRO，你还了解哪些训练优化方法？
6.LoRA 的原理是什么？为什么低秩分解可以减少训练参数？
7.LoRA 中矩阵 A 和 B 为什么通常采用不同初始化方式？
8.手撕：实现滑动窗口最大值

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

可以的，看着可以

点赞回复分享

发布于 03-29 21:40 北京

拼多多校园招聘2027

拼多多_基础电商_资深算法工程师

考虑我司不欢迎联系

点赞回复分享

发布于 03-27 00:09 上海

04-09 11:38

门头沟学院全栈开发

大模型Agent面试全攻略（附答题思路）

一、核心概念与架构篇Q1：请简述Agent的基本架构组成，并解释其与传统LLM Chain的区别。回答要点：Agent = LLM + 规划(Planning) + 记忆(Memory) + 工具使用(Tool Use)。区别：Chain是预定义的、线性的硬编码工作流。Agent具备“自主性”，它根据目标自发决定执行路径，通过推理循环（Reasoning Loop）不断调整策略。Q2：解释ReAct模式的工作原理。回答要点：ReAct (Reasoning + Acting)是Agent的基石。它将“思考”（Thought）和“行动”（Action）结合。LLM先生成一段推理，说明下一步要做什...

Agent面试会问什么？

点赞评论收藏

分享

05-09 06:25

门头沟学院 Java

minimax大模型agent二面分享

还是太菜了，下去沉淀一下1.深入剖析ReAct框架的局限性，并在此基础上，详细解释Plan-Then-Act、ReAct + 轻规划以及Tree/Graph Planning（如ToT、LATS）这三种范式的核心区别、适用场景和各自的优缺点。 2.请阐述“思维链”（Chain-of-Thought, CoT）与“规划”（Planning）的本质区别。为什么说CoT仅仅是“将推理过程写出来”而Planning是生成一个“可执行的任务表”？请用具体例子说明。 3.在处理一个需要多步工具调用的复杂任务（例如“调研三篇关于RAG+RL的论文并输出中文总结”）时，如何设计一个鲁棒的规划机制来应对中间步骤的失败（如某个API调用超时或返回数据格式错误）请描述具体的重试、回滚或重规划策略。 4.详细解释Tree-of-Thoughts (ToT) 或类似LATS（使用LLM进行蒙特卡洛树搜索）的框架是如何工作的？它们与传统的线性规划相比，在探索最优解题路径上有何本质优势？ 5.在Agent推理过程中，经常会出现“推理断层”或“结果与目标偏离”的问题。请结合具体技术或你的实践经验，说明如何通过提示工程、记忆机制或架构设计来缓解或解决这一问题。6.请深入剖析大模型Agent的“长期记忆”模块。在设计一个能够持续运行、与用户长期交互的Agent时，你会如何设计记忆的存储结构（如向量数据库、图数据库）、更新策略（如记忆合并、遗忘机制）、检索机制（如重排序、混合检索）来确保记忆的高效和准确？ 7.当历史对话记录非常长时（远超模型上下文窗口）你有哪些策略来优化记忆的查询效率并保证关键信息不丢失？请比较“滑动窗口”、“总结压缩”、“向量检索”等不同方案的优劣。 8.什么是“混合检索”（Hybrid Search）？请解释为什么在工业级RAG系统中，纯向量检索往往不够用，需要结合关键词检索（如BM25）。请给出一个具体的业务场景，说明混合检索的必要性。

查看8道真题和解析

点赞评论收藏

分享

04-10 20:47

广西大学算法工程师

联想大模型开发一面

1. 自我介绍2. 训练一个 decoder-only 大模型时，为什么 embedding 层和 lm head 常常共享权重权重共享本质上是一种参数高效和统计一致性的设计。输入端 embedding 学到的是“token 到向量空间”的映射，输出端 lm head 学到的是“隐藏状态到词表概率”的映射，如果这两个空间本身就在描述同一个词表语义，那么共享权重可以减少冗余参数，并让输入语义空间与输出判别空间保持一致。从优化角度看，共享权重还能起到轻微正则化作用，尤其在词表非常大时更明显。代价是模型表达自由度下降了一点，但对大多数语言模型来说这个损失远小于收益。很多实现里会保留一个独立 bias...

AI-Agent面试实战...

点赞评论收藏

分享

04-11 12:49

已编辑

香港中文大学（深圳）人工智能

【暑期实习】阿里云 AI Infra 二面复盘

项目深挖很多，也聊到了互联和软件硬件协同最近面了一场阿里云的 AI Infra 二面，整体感受是，这轮不是那种偏八股或者偏刷题的面试，更像是围绕项目经历一路深挖，看你到底有没有真的做过优化，也看你对自己后面想做的方向是不是足够清楚。开头还是常规自我介绍，我主要讲了自己现在在做的方向，包括 AI Infra、异构计算、底层性能优化，以及一些算子开发、图优化、推理优化相关的经历。后面的问题也基本都是顺着这些内容往下展开。前半段主要是在深挖项目。面试官先问了我现在做过的几类事情，我把内容归成了三块：一块是算子优化，一块是算子融合和图优化，还有一块是一些稳定性问题和 bug 修复。这里他问得比较细，不...

查看13道真题和解析

点赞评论收藏

分享

04-17 08:55

广西大学算法工程师

影石 AI开发一面(日常)

1. 自我介绍2. TCP 和 IP 的职责边界是什么，为什么说“HTTP 基于 TCP，TCP 基于 IP”这个表述只对了一半IP 负责尽力而为地把报文从源地址送到目标地址，它不保证到达、不保证顺序，也不保证不重复。TCP 建立在 IP 之上，提供有连接、可靠传输、流量控制、拥塞控制和按序交付。HTTP 是应用层协议，它依赖传输层提供的可靠字节流，但 HTTP 本身并不“知道”底下是不是 TCP，也可以跑在 QUIC 上。所以“HTTP 基于 TCP”对传统 HTTP/1.1 和 HTTP/2 是对的，但对 HTTP/3 就不成立；“TCP 基于 IP”则更准确，因为 TCP 的寻址和转发确...

AI-Agent面试实战...

点赞评论收藏

分享

评论

点赞

2

招聘动态

完美世界

拍了拍你并邀请你投递

“联宝杯”

2026 大学生创新大赛

上海人工智能实验室

2026年春季校园招聘

联想

27届暑期实习

联想

26届补录

27届校招宝典

厦门银行

2026届春季校园招聘

快手

27届实习超多转正机会

联宝科技

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

88974次浏览 639人参与

# 百度工作体验 #

332457次浏览 2254人参与

# 在爱玛，骑向未来 #

44915次浏览 437人参与

# 简历当中有水分算不算造假？ #

176543次浏览 2330人参与

# 打工人的精神状态 #

154635次浏览 1553人参与

# 你收到了哪些公司的笔试？ #

69372次浏览 446人参与

# 你以为的实习VS真实的实习 #

142754次浏览 758人参与

# 备战春招/暑实，现在应该做什么？ #

70321次浏览 557人参与

# 距离春招还有一个月，你现在是什么开局？ #

62868次浏览 320人参与

# 职场新人体验 #

192902次浏览 1241人参与

# 机械人，说说你的烦心事 #

148803次浏览 1165人参与

# 银行笔面经互助 #

198580次浏览 1326人参与

# 工作后，你落下了哪些病根 #

42454次浏览 294人参与

# 应届生，你找到工作了吗 #

174220次浏览 900人参与

# 毕业季，给职场新人一些建议 #

221435次浏览 2603人参与

# 面试被问期望薪资时该如何回答 #

402730次浏览 2219人参与

# 实习生工资多少才算正常？ #

76856次浏览 532人参与

# 你被哪些公司挂了？ #

198402次浏览 1077人参与

# 你会为了工作牺牲生活吗？ #

81920次浏览 466人参与

# 我们是不是被“优绩主义”绑架了？ #

49535次浏览 550人参与

# 机械人，秋招第一次笔试的企业是哪家？ #

103586次浏览 707人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务