如今NLP方向的同学都在做什么
理性讨论。 目前 LLM 对于文本处理的影响巨大。CV领域目前未见类似NLP方向上极具影响力的模型。
大致现状:
1 无论是 NLP 还是 CV,很多时候都面临数据不足等问题。CV可能还停留在数据不足扩充数据的微调阶段。
2 NLP 方向,LLM看似强大,但是对于实际业务的对齐与落地,目前仍然没有让人眼前一亮的垂类应用出现(可能是我不知道,如有,欢迎告知)
所以问题来了:
1. 如果说 CV 的微调仍有意义的话,NLP的未来在哪里:大多数人或者企业是没办法训练模型的,甚至部署推理都有硬件压力。
2. NLPer难道真的都在写一些 prompts? 做一些 RAG? 大多数情况下做出来的产品,无论CV还是NLP,都是四不像的,这有什么意义吗?
3. 如果想要扩展职业道路或者开辟新赛道,又有哪些选择呢?
配个图,可能又要伤一批人的心了。但是事实就是如此。希望能看到一些有用的讨论,以为广大所谓的 "算法工程师" 带来一些理解
大致现状:
1 无论是 NLP 还是 CV,很多时候都面临数据不足等问题。CV可能还停留在数据不足扩充数据的微调阶段。
2 NLP 方向,LLM看似强大,但是对于实际业务的对齐与落地,目前仍然没有让人眼前一亮的垂类应用出现(可能是我不知道,如有,欢迎告知)
所以问题来了:
1. 如果说 CV 的微调仍有意义的话,NLP的未来在哪里:大多数人或者企业是没办法训练模型的,甚至部署推理都有硬件压力。
2. NLPer难道真的都在写一些 prompts? 做一些 RAG? 大多数情况下做出来的产品,无论CV还是NLP,都是四不像的,这有什么意义吗?
3. 如果想要扩展职业道路或者开辟新赛道,又有哪些选择呢?
配个图,可能又要伤一批人的心了。但是事实就是如此。希望能看到一些有用的讨论,以为广大所谓的 "算法工程师" 带来一些理解
全部评论
本鼠鼠在暑期实习(某大厂)从CV转了LLM,现在已经准备回CV赛道了。所谓agent就是如楼主说的那样,做一些prompt,做一些rag。基座能力不行,llm就是没法理解文档chunk,就是没法对问题拆解。业务的数据脏的不能看,还少的一批,RLHF和SFT完全做不了。现在看到大模型应用算法就默认是prompt engineer就行了。本鼠鼠确实受不了天天坐在工位上写prompt,解析json字符串,跟ld沟通完,直接双向拒了oc。从本鼠鼠的两段实习看来,想要模型在特定领域可以落地,海量的高质量数据是必需的(之前跑车道线检测,一次训练260w张图片起步)。至于LLM包括其衍生的所谓agent,不过是赚钱的噱头。
确实 所以我做开发了
AI产品出海的那么多,搞API站的都赚了几千万了,你还在这LLM没用,纠结这学术或是工程技术有啥意义吗
我硕士论文正好选题就是开放域问答(做的还是传统模型,检索器阅读器)....幸好今年毕业了,感觉后面再研究这个方向估计只能往LLM上靠,没有服务器,寸步难行啊。
相关推荐