26届毕业211硕双非本,超焦虑,大模型应用or java

投票
超级焦虑,已经好几晚没有睡好觉了,现在研二下学期,论文已经投递出去等结果,研究生做的是时序预测,学了深度学习和机器学习。本科做的C#开发。最近有师兄去培训班培训出来找了个20k在北京的大模型应用的工作。我的能力不强,不做了大模型算法,

想球球大家给一些建议是钻  大模型应用微调方向 or  java开发方向 or  数据分析(没有学过)#计算机校招# #java# #大模型#
全部评论
请问 同双非本2硕这种情况大模型好找吗
2 回复 分享
发布于 03-27 19:51 辽宁
看到选项里面没有测开我就放心了
2 回复 分享
发布于 02-25 14:56 北京
可以沟通一下么,我目前也是研二下,有一篇llm方向的一区top文章,在一家中厂的llm算法岗实习了三个月(实际工作内容是做llm应用开发),可能是我在成都的原因吧,我感觉llm太卷了,投的简历清北都有两个,其他全是华5。目前我在学java,不知道其他城市好不好找llm应用开发的工作。而且llm更新迭代太快了,我觉得做agent这些技术根本就积累不下来,说不定过个一两年就是淘汰技术了,就像以前关于bert模型的应用开发一样。
1 回复 分享
发布于 04-26 06:50 四川
佬,现在找咋样了
1 回复 分享
发布于 04-18 08:52 湖北
你好,一样26年毕业,一样的焦虑,我现在研究也是大模型在安全上的应用,请问,老兄现在打算做哪个方向
1 回复 分享
发布于 03-17 11:19 广东
你好,你师兄大模型应用开发的简历能看看吗
1 回复 分享
发布于 03-13 10:37 山东
蹲一下
点赞 回复 分享
发布于 04-21 14:22 广东
你好 参加 大模型训练营吗 感兴趣的话可以私信我
点赞 回复 分享
发布于 03-01 23:17 天津

相关推荐

09-03 20:48
龙岩学院 护士
攒个人品,秋招不指望了,希望春招能有机会上岸吧。------------------------------------------------------没有自我介绍环节,一上来直接拷打实习,边拷打边问八股,基本上是我说一个做的东西,然后面试官就要开始问对应的八股了,记录一下问的八股:1. Qwen 与传统的Transformer模型相比,有什么结构上的改进?2. RMSNorm相较于LayerNorm有什么优势?公式是什么?3. SwiGLU的公式是什么?4. GRPO的公式是什么,这样做为什么更好?5. KL散度的公式是什么,为什么要用KL散度?6. LLM的损失函数是什么?给你一个10w的词表,计算出事的损失值7. GRPO为什么要做clip,直接用SFT后的模型还会不稳定吗?优势度可以怎样改进?8. 为什么你要用GRPO?GPRO结果比之前好多少?显存开销多大?训练一个Step需要多久?奖励函数如何设置的,为什么?有没有想过为什么一开始Reward出现大幅度震荡?GRPO是否一定有效,还有什么解决方法?9. Post-Training 的工作机制,为什么要做三阶段训练?什么情况下应该用GRPO?为什么DeepSeek用了GRPO?如何从V3到R1?10. 微调是如何进行微调的?为什么LoRA能够work?除了LoRA外,还了解哪些微调方法?11. 后训练用的哪个框架?你用过什么框架?如何使用deepspeed进行分布式训练?脚本是你自己写的吗?12. 知道什么Linux命令?13. 用过C++,Java吗?平时用什么多?14. 如何去评价你工作的产出和质量(基本上每个面试官都会问)15. FLUX的工作原理,LoRA在这个地方起到了什么作用?16. 你认为实习过程中哪些是从零到一的工作?(全部!鼠鼠之前学地理的)遇到一个不熟悉的领域,你会如何进行学习?-------------------------------------------------------大概是这些,可能不是很全手撕:删除链表中的节点;快慢指针秒了反问:面试官先介绍了下部门业务,随后反问:1. 为啥初试后又是初试?(可以自己点的,实际上就是二面)2. 后续几轮面试呢?(三轮,还有大老板面)3. 工作强度 (8-9.30左右)4. 这个岗位需要什么样的人? (努力学习新知识,耐心)总而言之美团的面试体验真没的说,面试官会笑这一点就值得夸了,全程没啥压力,但是估计凉了,有些没答好
查看17道真题和解析
点赞 评论 收藏
分享
评论
4
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务