llm应用开发 和 传统后端开发 思考

想知道各位牛友如何看现在市场上的传统后端开发和“llm应用开发”呢,因为llm应用开发其实市场上做的工作内容参差挺大的,我大致分了几类供参考,如有不对,轻喷
1.第一种最接近后端,调大模型api,然后还是搞后端那一套,无奈很多公司喜欢打着这个噱头,其实跟后端无异。
2.做agent,核心工作就是prompt,rag,用低代码平台搭工作流、智能体这种,这种去了感觉失业得最快。
3.搞微调,这种门槛也不是很高,但比第二种好多了,涉及模型微调、指标评估、造数据啥的。
4.预训练,这种都是算法招进去的,门槛有点高,感觉危机感没那么高,虽然说也是搞数据清洗的多。
5.模型压缩、推理加速啥的,这种偏底层 门槛也很高,个人感觉很好,就是要求高。
大概这五种,依次从后端到算法,市面上很多名字,大模型/ai/ai agent应用开发太多了,但工作的内容差别超大。
如果说涉及到的主要工作就是洗数据、造指标、微调、prompt、rag之类的或者再加一点agent,那感觉护城河似乎没那么高,甚至感觉可能还比不过java(说法可能有些绝对),总结来说就是感觉危机感很重,想知道大伙是怎么看的,作为在校生该如何做选择呢?
全部评论
1 2 3其实可以归为一块,我们组都在做。跟业务场景结合,做解决特定领域的agent,壁垒就在于和业务场景绑定和工程优化。agent框架,mcp等都是为业务服务的,而微调的话重要的是数据,以及当前模型更新速度这么快,做微调的成本远高于primpt
3 回复 分享
发布于 06-02 10:40 浙江
大佬,你Agent开发就说了个低代码平台,企业没人用LangChain、CrewAI这些吗
2 回复 分享
发布于 06-03 11:10 日本
第二种目前我就在涉及一些 感觉前景并不像你说的灰暗 因为涉及多流程交互 其中需要额外的流程控制工程才能保证效果 服务多了 才能体现出来流程控制的重要性 这点没那么容易的
2 回复 分享
发布于 05-25 02:39 北京
1
点赞 回复 分享
发布于 06-24 16:09 四川
急招LLM应用开发实习生,要有rag相关经验,没有实习自己做过项目也可以!
点赞 回复 分享
发布于 06-19 22:08 北京
点赞 回复 分享
发布于 06-03 10:14 湖北
mark
点赞 回复 分享
发布于 05-30 20:36 澳大利亚
支持
点赞 回复 分享
发布于 05-28 00:23 辽宁
我的部门现在1,2都在搞 而且都是传统Java程序员在搞的
点赞 回复 分享
发布于 05-27 23:56 上海
mark
点赞 回复 分享
发布于 05-27 23:55 上海
蹲蹲蹲
点赞 回复 分享
发布于 05-24 18:03 四川

相关推荐

06-20 16:49
已编辑
字节跳动_llm开发(实习员工)
大家很多人私信我大模型应用开发具体是做啥,正好我讲讲在字节实习3个月+的体验。现在以字节为例我看很多岗位,其实大模型应用岗位已经被纳入后端开发(大多还是属于开发序列,至少我看不在算法序列)当中了,所以总的来说二者并没有特别明显的区别,起码在公司的角度来看。以我自己为例,我也是面的后端岗位然后进来做Agent的开发,Agent开发暂时不涉及模型的训练,最多包含一些模型的微调(而且公司有平台)。总的来说,Agent开发主要是搭建workflow,主要涉及Rag、微调、Mcp、Prompt这些方面,包含一些技术栈py:langgraph、langchain、langSmith,java: SpringAI、langchain4j?,所以我觉得后端的同学直接投问题不大,但是需要python or java or 大模型基本知识的landing。我之前也没接触过类似的知识,还在字节里面有LLM学习季的好东西,包含了大模型的基本知识Transformer、Prompt工程、Rag实战等等各种基本知识的解释和实操,让我非常循序并循序渐进的了解了这方面的知识,并且燃起了对大模型学习的兴趣,不得不说这一点还是很值得学习的。其次,就是在实习过程中,大家讨论的都是如何提高大模型产生的效果、以及有没有更加方便的Agent工具能够参与 or 使用提效,整体氛围很不错,而且都是去聊一些比较新的东西,例如之前刚出的Agent2Agent协议。在我看来,Agent主要是以Multi-Agent写作文的形式完成一系列任务,例如Deep-Research利用搜索、爬虫等工具,获取想要查询的网页并爬取文章内容,并且生成一篇分析报告,包括了一些意图识别、任务规划、记忆、工具调用等。在这个过程可以加很多环节去提高分析报告的效果(在Prompt的层面),例如反思、自问自答、知识库、human-in-loop等等,我觉得设计这些环节还是需要很多经验的,目前很多需要参考了类似的设计有比如cursor等。至于学历的要求,不知道现在岗位需不需要硕士的学历,但是我看来其实本科也能做,包括我在的组很多Agent内容在Cursor、Trae等工具的辅助下,前端也参与了不少(没错,前端也写Agent)。所以现在在各种Agent工具不断出现的今天,大厂更加需要“能够熟练使用AI工具的人”。举例,本组有个本科校招生,ld说后续会让他参与LLM的开发内容。当然,以上是我3个月浅薄的理解,我其实也看了不少内容的一些技术文章,整体来说大概是个这么情况,感觉技术壁垒不深,但是基于目前资料跟Java(黑马)比有所欠缺的情况下,还是筛掉了相当一部分人,感觉可冲(感觉比较缺人,至少我们组人很缺);但是基于我之前很多段实习都是Java开发,我觉得大模型应用更在乎大模型的效果而不是性能,可能还是关注点会跟Java开发有一些区别,优先级不一样,很少用到一些中间件来做啥,目前我在整个过程中只用过Redis来缓存stream流。实习体验:1.需求:字节跟我实习过的其他大厂有很明显的区别,他是直接安排活让你去做,至于你做不做得了,这个就另说了(即使有mentor的帮助)。有个群友举的例子很好“就是把一个不会游泳的初学者丢进水池里,如果活下来了,就学会了哈哈”。所以在我很久没写py、langchain等内容的基础上、没在字节做过任何需求的时候,让我开发了一个我认为很大的一个需求,大概6-7000行(两周),我为了不延期,主动加班到10-11点,才在排期前做完。。2.福利:经历了字节下午茶的LastDay目前已经没啥福利了,零食、水果还是不错;其次,允许实习生出差,刚来没几天就团建 + 出差去北京(出差了一周),那段时间还是很滋润的,在北京也小小旅游了一下(带着女朋友一起去了,当然她的不报销,只是住在一起)3.博客:当初在快手实习的时候,基本上看遍了Kstack的文章,但是在字节我目前还没看完,而且受益匪浅,感觉文章整体含金量要高不少(可能快手现在也变好了,不尬黑)。4.带教:mentor和ld对我很好,也让我进入了一个新的领域,目前正好考虑通过这次机会往大模型应用甚至大模型算法转型.正好有学长跟我说过,“阿里很值得去实习体验一次,哪怕不留下来”,我觉得“字节也很值得去体验一次,哪怕不留下来”,之前在前几家公司反而没这么深刻的感悟。如果对各位有帮助的话,求求🥺给朵小红花,有问题可以在评论区交流~
枫糖441:你是我见过最帅的牛客男孩
字节跳动公司福利 1013人发布 投递字节跳动等公司9个岗位
点赞 评论 收藏
分享
06-11 23:35
门头沟学院 Java
她突然凑近问我:“你做AI的,具体负责哪块呀?”我后背一凉,支支吾吾道:“就....就是大家都做的那种……”女生眼睛一下亮起来:“是做Pretraining的吗?构建超大规模语料库、搭建万亿参数模型、算力优化、多机多卡并行,听起来就超高端!”我声音发虚:“不是……”“那一定是做Post-training的咯?指令微调、对齐、RLHF、Reflection,这种训练方案优化现在大火,前景无限!”她兴致盎然。“不……”我声音更弱了。我死死盯着键盘,恨不得把它盯出个洞。“难道是多模态架构?文本、图像、语音跨模态融合,炫酷又实用呀!”她笑着鼓励。“也不是…”我声音微不可闻。女生沉默两秒,突然眼神闪烁:“你该不会......做 Inference优化吧?部署环境、性能调优,提升模型速度和成本效益,很牛啊!”她的目光如探照灯般直射而来,我被烤得浑身发烫,手心出汗。我死死掐住大腿,从牙缝里挤出蚊子般的声音:“都.……都不是……”空气骤然凝固下来。女生的笑容僵住了,声音陡然降温:“那你,到底是在做AI的什么?”“做AI的还能有多少特别的?”她的话像冰锥扎进我的胸膛。我膝盖一软,扑通跪倒在地,眼眶泛红,带着哭腔说:“我.....我做的是Agent开发……”整个办公区瞬间陷入死寂,只剩同事们微妙的窃笑声。我低下头,感到周围人投来疑惑夹杂怜悯的目光,仿佛看到我夜深人静苦苦调Prompt却屡遭失败时的凄惨。女生抓起外套,毫不犹豫转身要走。我哭喊着拽住她的衣角:“求你别走!我们Agent开发真的很重要!”人群中响起窃笑声,我却抱得更紧:“你们不要笑我们Agent开发!Prompt不好写又怎样!幻觉问题多又怎样! Action失败率高又怎样!我们直接解决用户的实际需求,是AI真正落地的关键一步啊!”远处传来领导缓慢的脚步声和一声无奈的叹息:“唉,又是做Agent开发的……”
墨西哥大灰狼:查看图片
点赞 评论 收藏
分享
评论
16
40
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务