接好运

相关推荐

刚好晚上吃饭的时候闲来无事,随笔记录一下来MiniMax实习3个月的真实感受,给正在看机会的兄弟们一些参考:关于技术氛围:怎么说呢,这边确实能接触到比较核心的东西,而且有着大厂没有的“高速”,比如我第二周就开始跟着调优M2.5的代码了。记得当时在做模型“自我修正”能力的优化,我提了个想法:能不能让模型遇到编译报错时,模拟编译器思路走一圈?mentor听了没含糊其辞的让我只关注他安排的工作,而是直接说“你做个Demo试试”。然后我就去做了,最后效果还行就被采纳了,说实话很有成就感。之前在别的地方面试时,很多面试官画的饼比这大多了,但来了之后发现根本碰不到核心业务。这边至少让你真动手,不只是听概念。关于Mentorship:我的mentor人挺实在的,但是指导方式.....emmm怎么形容呢,不是那种手把手教的类型,应该算是引导型?分享一下我们的日常给大家感受一下,有次我为了赶一个Agent工具调用的demo,写了一堆if-else,自己都知道写得烂。Code Review时他没直接说我代码写的烂(虽然是事实),而是跟我聊:“咱现在写的每行代码,以后都可能变成M2.6甚至M3.0的训练语料。”然后他花了一下午重构了代码,引入工厂模式,还顺便给我讲了讲大模型底层MoE路由的原理。刚开始我觉得重构挺浪费时间的,但后来想想确实帮我理解了“为什么这么写”比“怎么写”更重要,算是被带着上了一课。关于工作方式:这边节奏不算轻松,但卷的方向比较明确。API额度确实不设限,但我发现也没人真去“刷”ArXiv……主要还是先把分配的活干完。干完了可以自由安排时间,去看论文、琢磨优化都可以。同事之间氛围还行,有问题直接问,不用绕来绕去。扁平化这个点虽然被说烂了,但确实不用天天写周报(感动)。总结:在MiniMax这里,整体感觉就是:你做的事能被看见,想法能被试,愿意学也能学到东西。对想踏实做点事的同学来说,是个不错的地方。今天就分享到这里了,继续肝大模型去了。
点赞 评论 收藏
分享
现在入门AI,还是按照自己的项目方向吧,具体可能是RAG这种轻量级、易落地、贴近业务的方向,远比一上来啃深度学习理论、从头训练大模型更适合新手,也更能快速积累可展示的项目经验。毕竟对大多数非算法岗的开发者来说,AI 入门的核心不是 “造轮子”,而是 “用轮子”——RAG(检索增强生成)就是这样一个绝佳的切入点:它不需要深厚的机器学习功底,基于 LangChain、Chroma 这些成熟框架就能快速上手;它的应用场景足够广泛,不管是企业知识库问答、智能客服,还是垂直领域的文档检索,都能找到落地场景;更重要的是,RAG 项目的完整链路(数据预处理→向量存储→检索策略→LLM 调用→结果优化),能帮你串联起 AI 应用开发的核心流程。除了 RAG,还有几个和后端开发强相关的入门方向也值得考虑:Agent 智能体开发:基于 LangChain 或 AutoGPT,搭建一个能自主完成任务的小助手(比如 “代码调试 Agent”“简历优化 Agent”),核心是理解工具调用、prompt 编排逻辑,和后端的接口设计思维高度契合;大模型微调(LoRA):不用从头训练,针对垂直领域数据做轻量化微调,比如用公司内部文档微调开源模型,实现更精准的专属问答,适合想深入模型应用层的开发者;AI + 后端工程化:比如用 AI 生成接口测试用例、自动优化 SQL 语句、排查 JVM 异常日志,把 AI 工具融入日常开发流程,这也是后端岗位现在非常看重的能力。入门的关键不是 “贪多求全”,而是选一个方向做深做透:比如先搭一个简单的 RAG 知识库,再逐步优化检索策略(比如混合检索、重排),最后部署成一个可访问的 API 服务。这样一套完整的项目经验,写在简历上远比 “了解大模型概念” 更有说服力。毕竟现在的 AI 岗位,更青睐 “懂业务、能落地” 的开发者,而不是只会背理论的 “纸上谈兵者”。选对一个贴近自己技术栈的方向,快速做出 demo,才是最高效的入门路径。
现在入门AI应该走哪些方...
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务