大模型是实习重要还是论文重要?

自从转llm后一直看到类似的问题,下面想简单谈一下我自己的理解(叠甲)。

1. 谁更重要?

先说结论,match论文 > match实习 >> 不match实习 > 不match论论文。match指大模型相关,但是topic不同。topic指具体的研究方向,如CPT,PT,RAG,推理优化下面的 **具体task** 。

- match论文指大模型相关的,topic是面试部门关注的 论文。但实际上这样的论文非常少,这不光与研究水平有关,更与研究兴趣相关。企业关心的问题往往是具体且trivial的,而学界关心的问题是前瞻且high level的。尽管我们能够用一些fancy 方法在公开数据上做一个SOTA的论文,但是有多少工业界可以用的上呢?当然,不排除有高手,可以把trivial的问题抽象成科学问题并很好地解决它。但具备这样研究能力的人也是非常稀少的。那少具体是多少呢?以今年为例,如果match论文1a1b硕士大概率是可以人才计划的。
- match实习是指在部门专注的方向上做了工程实践,踩了很多坑有很多经验,但是没有用一个fancy方法解决它并整理成一篇论文。相比于最后的产出物,经过实践训练得到的经验和认知对企业来说是更务实的选择。并且,只要后续持续进行科研训练,具备实践经验的人也有更大的机会在部门专注的这个方向上发表论文。
- 不match实习是指,大模型实习,实习期间做的东西和部门有gap,但是依旧有很多工程实践,能在企业级setting下工作。match实习显然比不match实习更好。
- 不match论文是指,大模型论文,和部门有gap,但是在实验室级setting下工作。一般来说,实验室环境要比企业环境的工程要求低很多。企业环境在实验规模,数据质量,针对生产环境的结果分析与实验设计上需要专门的训练。

简单来说,干相关的活且干的好的人>能干相关的活的人>能干活的人>基础好的人。如果你是部门ld,你想招人提升业绩,你会选谁呢?

2. 应该怎么做?

根据上面的说法,惯性的做法应该是根据自己的实际情况选择发match论文或者match实习。但是这样做就是最好的吗?我觉得不是。虽然谁重要这个问题看起来问的是精力分配,但是评论下的答案往往是具体的选择。这是一种典型的学生思维,先入为主地认为实习和论文本身就是互斥的。但事实上两者并不冲突,实习论文两者都有只会让你有更大概率获得心仪的offer。所以最优解应该是去公司实习,实习时以发表论文为目标规划后面的实习安排(也可以一步到位是研究实习)。前期深入项目,熟悉业务,现有方法和实验流程。然后针对部门当前普遍关心的技术问题,抽象或类比到现有的科学问题。用公司的卡,公司的数据(或开源数据)完成这篇工作。最后在实习过程中把这个技术上线用起来。我知道,上面说的每一步都不容易。但是做了没做出来 和 根本没想做 对个人能力提升的差距会非常大。我们可以以论文为目标安排工作,比如怎么设计实验,怎么分析结果,怎么改进方案。即便方案最后无法达到预期,我们也可以退而求其次,发b,发c或者专利。上线效果可以没那么好,但是要用起来,并分析为什么work为什么不work,最后给出定量结果与定性结论。当你能完整地走完这样一个算法开发,迭代,发版的流程后,你势必已经对这个topic积累了很多深刻见解。至于论文,很多时候真的需要一点运气。
全部评论
能发一篇真正match工业界的论文早就人才计划抢走了
3 回复 分享
发布于 2024-12-11 11:58 四川
大佬,问问具体怎么样算match,能举个例子吗
1 回复 分享
发布于 2024-12-04 18:46 黑龙江
很有insight!
点赞 回复 分享
发布于 01-05 16:26 湖北
大佬请问下,我现在研二,实验室是做区块链安全的;没有相关项目,想转搜广推或LLM搞个日常实习,有什么推荐吗,目前有一个RAG项目的idea但还没开始做
点赞 回复 分享
发布于 2024-12-13 11:11 北京
哥,真的学到了
点赞 回复 分享
发布于 2024-12-03 14:48 湖北
佬,点了!
点赞 回复 分享
发布于 2024-11-30 12:14 湖北
好文~
点赞 回复 分享
发布于 2024-11-24 18:25 江苏

相关推荐

上周组里招人,我面了六个候选人,回来跟同事吃饭的时候聊起一个让我挺感慨的现象。前三个候选人,算法题写得都不错。第一道二分查找,五分钟之内给出解法,边界条件也处理得干净。第二道动态规划,状态转移方程写对了,空间复杂度也优化了一版。我翻他们的简历,力扣刷题量都在300以上。后三个呢,就有点参差不齐了。有的边界条件没处理好,有的直接说这道题没刷过能不能换个思路讲讲。其中有一个女生,我印象特别深——她拿到题之后没有马上写,而是先问我:“面试官,我能先跟你确认一下我对题目的理解吗?”然后她把自己的思路讲了一遍,虽然最后代码写得不是最优解,但整个沟通过程非常顺畅。这个女生的代码不是最优的,但当我问她“如果这里是线上环境,你会怎么设计’的时候,她给我讲了一套完整的方案——异常怎么处理、日志怎么打、怎么平滑发布。她对这是之前在实习的时候踩过的坑。”我在想LeetCode到底在筛选什么?我自己的经历可能有点代表性。我当年校招的时候,也是刷了三百多道题才敢去面试。那时候大家都刷,你不刷就过不了笔试关。后来工作了,前三年基本没再打开过力扣。真正干活的时候,没人让你写反转链表,也没人让你手撕红黑树。更多的是:这个接口为什么慢了、那个服务为什么OOM了、线上数据对不上了得排查一下。所以后来我当面试官,慢慢调整了自己的评判标准。算法题我还会出,但目的变了。我出算法题,不是想看你能不能背出最优解。而是想看你拿到一个陌生问题的时候,是怎么思考的。你会先理清题意吗?你会主动问边界条件吗?你想不出来的时候会怎么办?你写出来的代码,变量命名乱不乱、结构清不清楚?这些才是工作中真正用得到的能力。LeetCode是一个工具,不是目的。它帮你熟悉数据结构和常见算法思路,这没问题。但如果你刷了三百道题,却说不清楚自己的项目解决了什么问题、遇到了什么困难、你是怎么解决的,那这三百道题可能真的白刷了。所以还要不要刷LeetCode?要刷,但别只刷题。刷题的时候,多问自己几个为什么:为什么用这个数据结构?为什么这个解法比那个好?如果换个条件,解法还成立吗?把刷题当成锻炼思维的方式,而不是背答案的任务。毕竟面试官想看到的,从来不是一台背题机器,而是一个能解决问题的人。
牛客51274894...:意思是光刷力扣还不够卷
AI时代还有必要刷lee...
点赞 评论 收藏
分享
评论
63
80
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务