大模型应用or算法?

我是985本港硕,今年毕业,目前0论文0实习。有一个RAG项目,没涉及微调。11月开始断断续续在投实习,主要投的是深圳的大模型应用岗和产品岗,都没什么回声😭

也是因为那个时候看到很多应用岗已经合并到后端了,所以后面开始从头学JAVA。学着学着发现自己在开发方面兴趣不是很大,而且现在大多都是朝agent方向做开发,自己已有的经验好像没什么竞争力,不太确定要不要继续。

因为我学过深度学习,也不反感读论文,想试着往大模型算法方向走一走。会去补一个这方面的项目,但是不知道应该从什么方向入手。我今年就要秋招了,听说算法方向很看重实践经历,所以秋招前必须要有一段实习,时间紧迫,可能做不了太大的项目。

请问大家做一个微调项目或者复现一篇简单的强化学习论文,对于算法实习足够吗?以及大模型应用这个方向要放弃吗?感谢大家🙏#大模型# #0经验如何找实习?#
全部评论
我听师兄讲大厂算法岗要求都是清北+paper的
点赞 回复 分享
发布于 01-31 16:38 四川
我和你一样情况,也想请问
点赞 回复 分享
发布于 01-18 00:25 新加坡
试试算法呢,应用感觉大部分都是java开发过去干的,算法岗目前我感觉我干不了
点赞 回复 分享
发布于 01-15 16:23 北京

相关推荐

一面: 1. 自我介绍,讲论文和实习。2. Transformer自注意力机制、位置编码、梯度消失/爆炸的解决方案。3. 微调方法对比(Full Fine-tuning vs. LoRA/Adapter/P-Tuning)。4. 推理加速技术(量化、动态批处理、FlashAttention)。5. 如何优化大模型在长文本生成中的显存占用?6. RLHF中奖励模型(RM)的训练数据如何构建?7. 为网易云音乐设计一个AI歌词生成系统,如何提升创意性和押韵效果?8. 模型剪枝/量化(GPTQ、AWQ)、服务化框架(FastAPI+vLLM)。9. 如何解决大模型API服务的响应延迟问题?一面八股挺多的,问的知识点也非常多,主要考察对大模型的理解,整体来说难度不算大,复习熟记八股应该都比较好答。二面:1. 自我介绍,讲论文和实习。2. LayerNorm和BatchNorm在大模型中的区别?为什么Transformer用LayerNorm?3. 解释大模型训练中的“灾难性遗忘”现象及解决方法。4. 如果微调后的模型过拟合,你会如何调整?5. 如何评估一个对话系统的生成质量?6. 如何用大模型提升网易新闻的推荐效率?7. 设计一个游戏内AI陪玩系统,需考虑哪些模块?8. 领域适配时,如何构建高质量的垂域训练集?9. 你在项目中如何解决数据稀缺问题?10. 模型上线后遇到了什么性能瓶颈?如何优化的?建议:精读《Attention Is All You Need》、HuggingFace文档。如果没有大模型项目,可用Kaggle/开源项目复现(如LangChain应用)。
查看18道真题和解析
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务