minimax大模型算法一面 好难啊感觉

#MiniMax求职进展汇总# 攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.介绍实习和论文
2.介绍你熟悉的大模型架构
追问:两者在注意力结构、训练策略和推理优化上的主要差异。
3.为什么 MoE 架构能在参数规模继续扩大的情况下保持训练效率?
4.MoE 的路由机制是怎么工作的?
为什么会出现专家负载不均的问题?
5.如果专家利用率很低,你会怎么优化路由策略?
6.SFT 和 RLHF 在训练目标上有什么本质区别?
为什么很多模型在 SFT 后仍然需要 RLHF?
7.RLHF 中 PPO 的核心优化目标是什么?
写出 PPO 的目标函数,并解释每一项的意义。
8.手撕:实现 K 个有序数组的中位数
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 03-26 16:12 广东
看着似乎没问啥东西啊
点赞 回复 分享
发布于 03-27 23:02 北京
考虑我司不 欢迎联系
点赞 回复 分享
发布于 03-27 00:09 上海

相关推荐

05-09 06:25
门头沟学院 Java
还是太菜了,下去沉淀一下1.深入剖析ReAct框架的局限性,并在此基础上,详细解释Plan-Then-Act、ReAct + 轻规划以及Tree/Graph Planning(如ToT、LATS)这三种范式的核心区别、适用场景和各自的优缺点。 ​2.请阐述“思维链”(Chain-of-Thought, CoT)与“规划”(Planning)的本质区别。为什么说CoT仅仅是“将推理过程写出来”而Planning是生成一个“可执行的任务表”?请用具体例子说明。 ​3.在处理一个需要多步工具调用的复杂任务(例如“调研三篇关于RAG+RL的论文并输出中文总结”)时,如何设计一个鲁棒的规划机制来应对中间步骤的失败(如某个API调用超时或返回数据格式错误)请描述具体的重试、回滚或重规划策略。 ​4.详细解释Tree-of-Thoughts (ToT) 或类似LATS(使用LLM进行蒙特卡洛树搜索)的框架是如何工作的?它们与传统的线性规划相比,在探索最优解题路径上有何本质优势? ​5.在Agent推理过程中,经常会出现“推理断层”或“结果与目标偏离”的问题。请结合具体技术或你的实践经验,说明如何通过提示工程、记忆机制或架构设计来缓解或解决这一问题。​6.请深入剖析大模型Agent的“长期记忆”模块。在设计一个能够持续运行、与用户长期交互的Agent时,你会如何设计记忆的存储结构(如向量数据库、图数据库)、更新策略(如记忆合并、遗忘机制)、检索机制(如重排序、混合检索)来确保记忆的高效和准确? ​7.当历史对话记录非常长时(远超模型上下文窗口)你有哪些策略来优化记忆的查询效率并保证关键信息不丢失?请比较“滑动窗口”、“总结压缩”、“向量检索”等不同方案的优劣。 ​8.什么是“混合检索”(Hybrid Search)?请解释为什么在工业级RAG系统中,纯向量检索往往不够用,需要结合关键词检索(如BM25)。请给出一个具体的业务场景,说明混合检索的必要性。
查看8道真题和解析
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务