拿下第一份大模型实习时间线

bg:
双9,2024级硕,传统工科专业,算法知识范围仅限知道一些机器学习理论,了解基本的pytorch语法,打算砖码算法岗位,计划研1下找一段实习,从今年3月初已经开始在各大平台搜索实习经验了。
转码时间线:
2.28开始有实习想法,但是在岗位上纠结,在后端,大模型岗位纠结。最终决定大模型岗
3.1-3.7吴恩达机器学习
3.8-3.21李沐深度学习
3.22开始刷leedcode
3.24开始做简历
3.24-3.25在github上跑开源项目:BERT部署+文本分类
3.25-4.1在github上跑开源项目:ChatGLM-6B部署+LLaMA-Factory微调+Prompt模板
3.27注册BOSS直聘
3.28参加了第一场初创公司大模型的面试,感觉面试还可以,基本上能hold住但最后也都无疾而终了,盲猜可能是技术栈不太相符以及觉着我是低年级。
3.29-4.5在github上跑开源项目:Llama3-8B+RAG
4.7收到三家公司面试
4.7下午面试一家中厂,问题太工程,而我是凑开源项目+偏算法理论性的科研,完全经不住拷打。
4.8收到第一个offer,岗位感觉偏大模型调研,拒绝。
4.10收到第二个offer,离学校路程半小时+大模型核心岗,但小厂,接收。

回归整个实习准备,对我个人而言其实最难的是不断细化调整方向,以及在面试pass被无数次的心态调整,但总体来说是看着自己一步步的进步。记得第一次修改简历时,我对着空白文档发呆了两个小时,如今却能快速抓住岗位JD的关键词进行精准匹配;曾经在群面中紧张到声音发抖,现在面对压力面试已经能从容展现逻辑思维。

#大模型##研究生##面试##实习##硕士#
全部评论
项目地址可以开源给大家 后台T一下
2 回复 分享
发布于 2025-04-29 14:24 湖南
求开源项目
1 回复 分享
发布于 2025-06-22 17:00 江苏
求开源项目
1 回复 分享
发布于 2025-06-18 16:57 上海
求项目地址
1 回复 分享
发布于 2025-06-11 16:27 重庆
求开源项目
1 回复 分享
发布于 2025-06-06 06:41 湖北
求开源项目
1 回复 分享
发布于 2025-05-29 09:36 广东
求开源项目
1 回复 分享
发布于 2025-05-22 18:50 河南
求项目地址
1 回复 分享
发布于 2025-05-16 00:27 四川
求开源项目
1 回复 分享
发布于 2025-05-14 13:47 广东
求开源项目
1 回复 分享
发布于 2025-05-11 20:25 北京
求开源项目
1 回复 分享
发布于 2025-05-09 13:24 广东
求开源项目
1 回复 分享
发布于 2025-05-08 22:24 广东
求开源项目
1 回复 分享
发布于 2025-05-08 14:47 四川
求开源项目
1 回复 分享
发布于 2025-05-06 17:31 辽宁
求开源项目
1 回复 分享
发布于 2025-05-05 20:01 美国
求开源项目
1 回复 分享
发布于 2025-05-04 23:46 澳大利亚
请问是跑完就写在自己的项目经历那里吗?以及求项目
1 回复 分享
发布于 2025-04-29 19:44 广东

相关推荐

很多人问我如何准备大模型的面试,分享下我的经验,针对两种情况:1. 有大模型实习2. 无大模型实习针对无大模型实习的情况,我建议先找一段中厂实习为主,比如 zhipu、Minimax (当然有大厂进大厂)这些,相对容易进,尽量积累大模型实习经历。针对有大模型实习的情况,复习内容为:1. 常规八股(transformer、bert 等)2. 最新八股(GQA 等)3. 技术报告(一定要自己看原PDF,目前推荐 DeepSeekV3, R1, kimi1.5, Minimax-01, Qwen2.5, Qwen2.5-VL)4. 手撕 Leetcode:Hot1005. 手撕模型,比如 MHA 这些首先是常规八股和最新八股,这一部分可以自己找找网上资料,整理好的,背。然后是技术报告,目前推荐的内容有:1. DeepSeekV3:必读2. DeepSeekR1:必读3. Kimi1.5:选读4. Minimax-01:选读,据我所知最长上下文模型(外推到 4M,不过好像被 LLama4 的 10M 超过了)5. Qwen2.5:必读6. LLama3.1:必读7. Qwen2.5-VL(如果简历有多模态内容):选读重点关注:1. 阶段训练(预训练几段、Post-training 几段?上下文用了多少?数据配比是什么?)2. 模型创新点(MHA 创新是什么?作用是什么?)3. 上下文优化创新点(一般是优化显存和阶段训练)4. 多模态优化创新点(简历有多模态内容)5. 几个模型不同之处(比如 Qwen2 和 Qwen2.5 的不同之处)最后是手撕,Leetcode 只刷 Hot100 够了,模型手撕建议关注(我目前会的):1. MHA2. LayerNorm3. Transformer Encoder (MHA+LayerNorm+FFN)4. PE(绝对位置编码)5. ROPE6. SwiGLU7. RmsNorm每次面试前快速过一遍就 ok 了。
喜欢吃卤蛋的托尼of...:大佬想问下项目该怎么准备
查看19道真题和解析
点赞 评论 收藏
分享
评论
3
22
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务