minimax大模型算法一面 好难啊感觉

攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.介绍实习和论文
2.介绍你熟悉的大模型架构
追问:两者在注意力结构、训练策略和推理优化上的主要差异。
3.为什么 MoE 架构能在参数规模继续扩大的情况下保持训练效率?
4.MoE 的路由机制是怎么工作的?
为什么会出现专家负载不均的问题?
5.如果专家利用率很低,你会怎么优化路由策略?
6.SFT 和 RLHF 在训练目标上有什么本质区别?
为什么很多模型在 SFT 后仍然需要 RLHF?
7.RLHF 中 PPO 的核心优化目标是什么?
写出 PPO 的目标函数,并解释每一项的意义。
8.手撕:实现 K 个有序数组的中位数
全部评论

相关推荐

03-24 02:07
已编辑
南开大学 Java
全程2小时共享屏幕+看项目具体代码,压力面算法题(40min+20min优化):74. 搜索二维矩阵      秒了1482. 制作 m 束花所需的最少天数贪心+二分    搞了半天,不过撕出来了问怎么优化时间复杂度1. TCP连接建立过程为何是3次segment交互,而非4次?请详细说明四次握手合并为三次的核心原因。2. 没见过的代码,让我猜结果,后来查了是js`const a = {i:1,toString: function(){return a.i++;}};console.log(a==1 && a==2 && a==3)`为何会输出 `true`?其底层类型转换和执行顺序是怎样的?3. 请解释CPU执行指令时,为何数字比较是串行执行而非并行处理?这和`a==1 && a==2 && a==3`的执行逻辑有何关联?4. 大模型生成语句基于HTTP长连接逻辑时,和WebSocket的全双工通信特性有何本质区别?5. SSE是否具备双工通信能力?如何清晰澄清SSE的单向推送特性?6. SSE实现客户端消息推送时,持续推送无法中断的问题该如何解决?是否需要后端配合实现流程控制?7. SSE存在自动断连风险,该如何优化协议稳定性以适配业务场景?有哪些重连或保活方案?8. 大模型流式输出的分段内容格式该如何设计?需要考虑哪些兼容性和可读性要求?9. 智能体Prompt的完整构建流程是怎样的?从角色设定、任务范围到格式化输出要求,具体步骤是什么?10. 智能体的场景化细节设计有哪些?该如何嵌入Prompt?11. AI Agent的核心工作流程是什么?请详细说明从用户需求分析、工具调用意图生成,到参数转化、MCP客户端校验执行的全链路。12. MCP调用逻辑的权限归属问题是什么?谁来主导MCP工具的调用?13. LangChain在你的项目中具体承担什么角色?是否仅作为大模型接口?如何实现框架的深度定制?14. 大模型在Agent系统中是思考核心,那工具调用的触发主体是谁?是Agent解析字符串触发,还是大模型主动分析意图后调用?15. 大语言模型输出字符串的机制是什么?工具调用的触发时机具体在哪个环节?16. Agent与大模型的协作流程是怎样的?17. MCP调用工具时的参数校验流程是怎样的?校验失败后该如何处理异常?18. MCP和Skill的功能边界是什么?两者在工具调用、模块化设计上有何区别?19. 如何将现有MCP工具改造为支持Skill功能?具体的代码或配置修改步骤是什么?20. 渐进式披露技术的具体实现方式是什么?如何通过文件格式和系统提示词控制大模型读取范围?21. 改造工具调用链路(如从MCP切换到skill接口)时,是否需要修改大模型本身?如何实现解耦以避免核心代码变动?22. 新建Scale工具文件并注册到映射体系的具体操作步骤是什么?如何保证工具调用的灵活性?23. 直接使用AI生成的代码方案(如Markdown表格形式的函数列表)是否可靠?存在哪些灵活性不足的问题?24. 现有文件名匹配逻辑不够完善,该如何优化?需要考虑哪些匹配规则和异常场景?25. 项目中的主控逻辑和记忆模块是否为自主实现?LangChain之外还使用了哪些技术栈?反问:一周出结果
冰炸橙汁_不做oj版:已吓哭
发面经攒人品
点赞 评论 收藏
分享
头像
昨天 22:34
天津大学 Java
1.你这后面怎么那么大一个校徽(我费劲抢到的学校面试间。。对这场面试我足够看重)2.拷打科研经历15min,最后的结论是我觉得你这个做的没意义(那我也承认啊,那我硕士科研不就为了能毕业吗。。能有什么意义)3.你没有实习经历,那给你一个情景,你设计一下吧,要实现发红包功能,你底层怎么写围绕这个场景,拷打了40min。。我设计一种,面试官觉得存在问题,让我改,翻来覆去六版,还是不满意,ok,fine,那我不就是没实习才要找实习。。4.手撕,没什么好说的,秒了。。最后纠结了一会输出,发现我写的是对的。5.为什么hashmap可以O1访问到数组。我人晕了,不然呢。。那能是什么。姑且答了数组是连续的内存空间,可以根据首内存+偏移量得到数据说实话,三年前面字节,面试官独一份的掐秒表问问题,以及最后手撕没按她思路写,说没时间了那就这样吧,然后给我挂了。导致我心中挺排斥字节的。从三年前到现在,面了正好是39次了,下次刚好第40次,只有字节给我的体验最差。我始终觉得面试是个双向选择的过程,我不否认我没有出众的技术实力,我也认可公司或者部门想要高技术经验丰富的人,那不合适就友好结束,为什么非要在面试的过程中不断表现出负面的感觉呢?这也不是我第一次挂面试了,但上次挂面试我没有觉得什么,我认为我和面试官友好沟通了之后发现可能确实不太合适。只能说读研也改变了我,放以前我可能很生气,现在我只是觉得真没必要,都是打工人,无非生的早晚而已。愿每个辛苦找实习,投简历,做测评,做笔试,为面试焦虑的同学们都能被正常对待。
查看2道真题和解析
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务