几周速通大模型实习,你需要做什么?
我通过牛客赚了一包薯片,整整5块,然后一直没到账,然后发现人家放假了,今天到了之后买了吃掉,已经变成葡萄糖了。
那么我也是顺利收下几家offer了,没学多久,今天给一下具体路线,求别私信我(真想问问题,直接把问题写上去留个微信,动不动弹出来红点点,你总会去点他的。。),然后东西都是你感兴趣才能去做,你肯定难以接受一天爽学10几个小时。同时五一假期还不出门,连续5天高强度琢磨新玩意,所谓欲戴王冠,必承其重你知道的,光是走马观花肯定很困难。我给出你具体思路还是比较重要的。
首先确定走这一行,我的话有两年开发经验,有实习经验,然后直接转行,本身就有基础,计算机的知识是有迁移性质的。
我先讲讲大模型ai应用开发学什么吧,首选python语言->python框架(langchain,langgraph),这个东西就算比较新的了,然后flask框架搞搞,fastapi搞搞,差不多了,大胆冲,现在就是10年前的互联网,大模型接入应用层搞就对了。
大模型NLP,LLM微调,要学什么,这个鱼书,花书你看看,强化学习你看看,然后我先前写了怎么跑模型,你去试试,
装个cuda,用GPU,跑跑PT,SFT,混合损失函数,RL,DPO,差不多了,来加上个RAG,RAG调优,MCP来一个,数据集下载人家的这会大概率不够用了,怎么办,学一下数据清洗,召回,检索,怎么强制过滤,之类的那么微调的学的差不多了,搞两个开源模型开源项目,然后pytorch,transformer架构一写就直接冲,
然后是论文复现,量化模型,这个东西首先学历少说你来个9嘛,不是9那怎么着也得有个QS100,这种公司比如九坤,幻方之类的,人少,里面我可以说没一个差的,基本上都是大佬,有了学历不够,CCF-A之类的顶会的一二作,你整一手,那么大概有去面试的资格,里面会涉及到数学公式了,类似这样:贝尔曼方程(具体的不解释,因为你看懂了没什么屁用,快去刷抖音),
有幸面过一个公司,(四位面试官,同时面试,来自哈工大,加利福尼亚大学,港科技大学,清华大学,很友好,但是技术不够,直接被打傻了,问些听都没听过),这种进去的话,工资挺不错,大概是60w-300w不等,幻方也就这个价,除了字节头部高管,基本上鲜有年薪千万的,很感谢你看到这里,但是我推荐各位去试试,有详细的资料后面看看会不会发,上一期才100观看,打字都打了两小时,一度以为被限流了,后面琢磨人家是出去玩了,后面回来再emo??
最后放些图给各位增加些信心吧,如果有人看,我就接着写,后面我的agent会全平台发布,你在那个平台上都能看到我写的教程。