几周速通大模型实习,你需要做什么?

我通过牛客赚了一包薯片,整整5块,然后一直没到账,然后发现人家放假了,今天到了之后买了吃掉,已经变成葡萄糖了。

那么我也是顺利收下几家offer了,没学多久,今天给一下具体路线,求别私信我(真想问问题,直接把问题写上去留个微信,动不动弹出来红点点,你总会去点他的。。),然后东西都是你感兴趣才能去做,你肯定难以接受一天爽学10几个小时。同时五一假期还不出门,连续5天高强度琢磨新玩意,所谓欲戴王冠,必承其重你知道的,光是走马观花肯定很困难。我给出你具体思路还是比较重要的。

首先确定走这一行,我的话有两年开发经验,有实习经验,然后直接转行,本身就有基础,计算机的知识是有迁移性质的。

我先讲讲大模型ai应用开发学什么吧,首选python语言->python框架(langchain,langgraph),这个东西就算比较新的了,然后flask框架搞搞,fastapi搞搞,差不多了,大胆冲,现在就是10年前的互联网,大模型接入应用层搞就对了。

大模型NLP,LLM微调,要学什么,这个鱼书,花书你看看,强化学习你看看,然后我先前写了怎么跑模型,你去试试,

装个cuda,用GPU,跑跑PT,SFT,混合损失函数,RL,DPO,差不多了,来加上个RAG,RAG调优,MCP来一个,数据集下载人家的这会大概率不够用了,怎么办,学一下数据清洗,召回,检索,怎么强制过滤,之类的那么微调的学的差不多了,搞两个开源模型开源项目,然后pytorch,transformer架构一写就直接冲,

然后是论文复现,量化模型,这个东西首先学历少说你来个9嘛,不是9那怎么着也得有个QS100,这种公司比如九坤,幻方之类的,人少,里面我可以说没一个差的,基本上都是大佬,有了学历不够,CCF-A之类的顶会的一二作,你整一手,那么大概有去面试的资格,里面会涉及到数学公式了,类似这样:贝尔曼方程(具体的不解释,因为你看懂了没什么屁用,快去刷抖音),

有幸面过一个公司,(四位面试官,同时面试,来自哈工大,加利福尼亚大学,港科技大学,清华大学,很友好,但是技术不够,直接被打傻了,问些听都没听过),这种进去的话,工资挺不错,大概是60w-300w不等,幻方也就这个价,除了字节头部高管,基本上鲜有年薪千万的,很感谢你看到这里,但是我推荐各位去试试,有详细的资料后面看看会不会发,上一期才100观看,打字都打了两小时,一度以为被限流了,后面琢磨人家是出去玩了,后面回来再emo??

最后放些图给各位增加些信心吧,如果有人看,我就接着写,后面我的agent会全平台发布,你在那个平台上都能看到我写的教程。

#面试中的破防瞬间##牛友故事会##牛客激励计划##创作激励计划##牛客创作赏金赛#
大模型集合 文章被收录于专栏

这里全放大模型的,需要自取,后面可能没什么空搞这些了。

全部评论
大模型现在行情确实很不错,我也是all in
2 回复 分享
发布于 2025-05-09 18:23 浙江
齐工大搞大模型,你是我的神
2 回复 分享
发布于 2025-05-07 18:12 山东
mark一下
点赞 回复 分享
发布于 01-07 11:19 上海
这也是你发的吗?
点赞 回复 分享
发布于 2025-10-21 21:27 辽宁
mark一下
点赞 回复 分享
发布于 2025-08-31 23:56 浙江
想问下佬,看了很多微调的书,跑了蛮多例程的,代码大致都能看得懂,但是写不出来,所以有个问题就是,LLM代码应该熟悉到什么程度,要独立写抽象接口吗?
点赞 回复 分享
发布于 2025-06-05 11:13 广东
mark一下
点赞 回复 分享
发布于 2025-05-26 14:05 江苏
mark一下
点赞 回复 分享
发布于 2025-05-22 18:20 广东
双非硕搞大模型有希望吗
点赞 回复 分享
发布于 2025-05-21 00:17 广东
蹲后续
点赞 回复 分享
发布于 2025-05-19 21:02 湖北
牛的哥们
点赞 回复 分享
发布于 2025-05-16 17:27 重庆
已all in
点赞 回复 分享
发布于 2025-05-14 18:03 美国
mark一下
点赞 回复 分享
发布于 2025-05-13 21:45 北京
mark一下
点赞 回复 分享
发布于 2025-05-13 16:48 澳大利亚
点赞 回复 分享
发布于 2025-05-12 21:30 马来西亚
后面去了哪个公司呀
点赞 回复 分享
发布于 2025-05-09 21:23 北京
mark一下
点赞 回复 分享
发布于 2025-05-09 13:55 陕西
大四快毕业了现在学可以转去ai应用开发吗
点赞 回复 分享
发布于 2025-05-09 11:09 广东
佬,怎么赚薯片,是写文章吗
点赞 回复 分享
发布于 2025-05-07 18:03 四川

相关推荐

前些天看了 Clawdbot 创始人的采访——这哥们单日提交 1.3k commits,一个月 6600+ 次提交,有的代码自己一句都没看过,非常恐怖。所以在不久的将来,当 AI 已经完全具备写代码的能力,人类程序员的操作空间还能剩多少?最近在实习,做大模型微调,新鲜期过了,发现不过是机械劳动,造数据 → 训模型 → 看 badcase → 然后再造数据,循环往复...这不就是Agent的ReAct范式么? (坏了,我成智能体了) 需求明确的情况下,Claude-3.5/3.6 也完全可以独立完成造数据 pipeline 的开发,偶尔会留下一些语法错误,在两三轮尝试之内也能自己修正过来......这里非要人来完成的环节并不多,只能用人来完成的理由,好像只剩人比较便宜了...? 但 AI infra、推理加速也在飞速发展,这种相对的便宜,又能持续多久呢?Clawdbot已经火到到处都在讨论,尽管目前在国内的适配有限,(门槛高是一方面,还很重要的一点是比较烧钱...)不过它对人类劳动力的节省是没办法忽视的。目前同事们普遍认为这玩意儿现在只能接入飞书写写文档,但你也知道,“目前”而已。GPT-4 推出的那年或许看上去还有点呆,但短短几年,拥有 skills 和 function call 的大模型已经可以帮你完成打开应用、查看消息、撰写文档这种复合任务——写代码又能比写飞书文档复杂多少呢?不过是接入不同的软件,阅读不同的文本,调用不同的修改命令,底层是一样的,现在 Copilot 已经做得有模有样,更别说 Clawdbot 这种具有自我进化能力的 Agent,只要 token 多,Clawdbot 完全可以给自己装一堆功能,能量超乎你想象。有人说了,我做的项目大着呢,全是屎山代码,我不信 AI 能看完,这说的其实是长上下文问题,我个人不认为是一个无法解决的问题,随着上下文窗口的扩展和长期记忆管理的研究工作不断发展,AI 总能找到方法把你的超长文本压缩成一个一个的小块,然后逐个击破(虽然目前 GPT-5.2 Codex 改我的代码还是会改着改着一片红...)有句话说得好,你怕被 AI 替代,是因为你太像 AI。你的工作流程高度标准化、可预测、可复现——接需求、看文档、查 API、写代码、测试、提交。每一步都有明确的输入输出,每一步都能被拆解成清晰的指令。这种工作方式,恰好是 AI 最擅长的。如果你的价值体现在“把业务逻辑翻译成代码”,那 AI 确实可以做得更快、更稳定、更便宜。它不会写错大小写,不会忘记边界条件,不会因为昨晚没睡好就漏掉一个判断。要想不被替代,就得做那些 AI 做不了的事,比如和产品经理撕逼,解释为什么这个需求做不了;看着三个技术方案,权衡性能、成本、开发周期,最后拍板选一个;跨部门开会,听运营讲了半天业务痛点,翻译成技术语言,还得判断她说的是真需求还是伪需求。这些事情需要判断、需要博弈、需要对人的理解, AI 暂时还做不来。但问题是,这些事情需要多少人来干?以前一个项目可能需要十个程序员,现在有了 AI,也许三个人就够了,剩下那七个人上哪去?......也许他们会转型,在行业找到新位置,也许是去卖炒粉了,说不好。但有一点感觉很明显:AI 在拉高门槛。以前你会写代码就能找到工作,现在得会“用 AI 写代码 + 理解业务 + 做技术决策”。这个组合技能,不是每个人都能凑齐的。工具会进化,但人怎么不被工具定义,可能是我们未来一段时间需要长期思考的问题。
李橙子:有句话说得好,你怕被 AI 替代,是因为你太像 AI。这句话说的很对
AI求职实录
点赞 评论 收藏
分享
评论
59
195
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务