我实习转正上岸MiniMax了

先交代个人bg:26届北大计算机硕士,后端开发,已拿MiniMax转正Offer。闲来刷牛客发现了MiniMax的话题,也来凑个热闹,分享几点真实体验。

关于技术成长:新人也能啃硬骨头
入职第二周,mentor给我派了个活:海螺AI的流式输出在高峰期有延迟抖动,目标是P99延迟再降50ms。
说实话当时有点懵,心想这不应该是他们干的活么?结果mentor直接拉我看Grafana大盘,拆解M2.5模型推理架构,让我自己找切入点。那一周基本在读代码、看论文、和infra团队过方案。
后来我提了个想法:在网关层加自适应批处理策略,根据实时流量动态调整batch大小。
mentor看完说思路可行,直接让我写代码上线试试。最后优化上线,高峰期P99延迟降了60ms。
怎么说呢,工作确实很硬核,之前实习的时候这种活儿大概率轮不到新人碰。这边倒好,只要方案有数据支撑,没人会因为你是实习生就拦着。

关于mentor:教的是怎么思考问题
记得有次遇到状态同步的坑,mentor没直接给答案,而是从分布式系统的一致性模型开始推,让我自己琢磨结论。他的原话:不只是会写代码,要成为能设计系统的人。
听起来比较简单,但对于校招生来说并没有这些意识,很多时候需要有这样的引路人指引方向,这可能比敲2000行代码都管用。

团队里学习氛围也很好,算法专家、infra大牛都有,中午吃饭聊的都是最新论文、模型边界。这种环境待三个月,比自己闷头学一年来得快。

关于地理位置
还有个挺实际的,公司在海淀区蓟门一号,骑车十分钟到公司。中午甚至能溜回学校吃顿饭,下午再骑回来写代码。对于还在学校想找实习的同学来说,这种通勤体验确实香。

大概就分享这么多吧,如果说对MiniMax观望的学弟学妹总结的话,我觉得是这样,如果你想找个地方写写CRUD混个实习经历,那这边可能不太合适,但如果你想碰点真东西、做的东西真能上线跑、愿意被推着往前走,这里确实是个还不错的选择。

#MiniMax求职进展汇总#
全部评论
北大去这个地方真的有点屈才了
9 回复 分享
发布于 03-18 22:50 江西
说实话 看下来还是觉得有点装逼的成分
1 回复 分享
发布于 04-29 11:46 北京
1 回复 分享
发布于 03-19 13:43 浙江
给佬跪了
点赞 回复 分享
发布于 04-21 13:52 江苏
太强了,27届学弟想请问一下minimax的后端开发实习会对ai背景有很高的要求吗?目前我暑期找的实习都偏向搜广推的后端开发,想往ai相关的方向试试
点赞 回复 分享
发布于 04-21 10:21 北京
帖主,我想请问一下后端面试难吗?手撕算法之类的
点赞 回复 分享
发布于 04-12 00:56 四川
看到也有人夸这家,看来真是不错啊
点赞 回复 分享
发布于 04-10 22:02 陕西
牛逼
点赞 回复 分享
发布于 04-09 17:20 浙江
沾沾喜气
点赞 回复 分享
发布于 03-19 13:42 浙江
北大佬太强了
点赞 回复 分享
发布于 03-18 21:52 四川
北大去这里有点屈才了
点赞 回复 分享
发布于 03-18 21:25 北京
北大佬
点赞 回复 分享
发布于 03-18 19:50 广东

相关推荐

04-09 17:20
门头沟学院 Java
1.Transformer 中 Attention 的本质是什么?从数学角度解释一下。2.了解Agent吗?把RAG做成Agent有什么好处3. 在 Agent 多轮对话任务中,Attention 的局限性体现在哪些方面?4.介绍 一下SFT 的核心流程以及数据集的构建策略是怎么样的。5. SFT 之后常见的 Post-Training(如 RLHF)还有哪些?它们之间的目的有何区别?5.什么是 RAG?它是怎么提升生成质量的?标准RAG有什么问题与传统“检索 + 模型生成”的流程有何不同?6.如何评估一个RAG系统是否真正 work?有哪些具体的指标或框架?7.PPO和DPO 在大模型对齐中的主要区别是什么?DPO 训练通常有哪些注意事项?8.是否了解或使用过 GRPO 算法?9. 项目里的 Modular Agent 是如何实现Multi-step Planning的?10. 项目中工具调用的调度策略是如何设计的?是否有异常 fallback策略?11. Agent评估体系包括哪些维度?如何衡量规划能力 vs 幻觉率?12.在微调Qwen 模型时,选择的训练阶段和 Loss 函数是如何决定的?13. Prompt 自动推荐模块用了哪些优化策略?有没有尝试过 Prompt 压缩或 Embedding 表示的方式?14. 场景题: 假如一个 Agent 推理链路包含 3 个工具 + 高频请求,导致系统整体延迟较高,你会如何进行工程优化?15. 说一下LoRA的原理;LoRA完推理的时候要挂着Adaptor吗?16手撕代码:torch写SFT的loss计算代码(注意shift right
mcart:这是应用开发还是算法开发
查看17道真题和解析
点赞 评论 收藏
分享
评论
32
16
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务