相关推荐

02-28 16:11
已编辑
南京邮电大学 深度学习
今天刚完成毕业论文初稿,一直拖着没写秋招总结,来补一下,本人很菜单纯分享。bg双非本硕,研究生读的方向主要是cv相关,因为项目接触到nvidia orin一系列嵌入式板子,所以一开始实习找的方向是嵌入式AI应用,技术栈也是c++,python为主。因为项目跟orin芯片相关,被当时高通的mentor看中,运气很好找到了高通实习。实习内容跟智驾infra相关,由此接触部分ai infra知识。(由于原本一点基础没有,甚至没学过cuda)之后去b站和github上学习相关技术栈,通过傅哥的介绍视频了解到ai infra大概方向,后续便把重点方向放在推理方向(这个了解最多)。以下是秋招投递offer情况(因为过了很久,好多忘记了,记录不太准):简历挂:vivo、寒武纪、地平线、小鹏、理想、阿里云、高德、阿里国际、平头哥(阿里系没过几个)、深信服、联发科  、商汤笔试挂:影石、大疆、淘天、饿了么(淘宝闪购)、海尔、海信一面挂:oppo ostar、荣耀、轻舟、蔚来、元戎、字节、海康终面挂:百度(百度换岗来回面了六面)泡池没泡出来:华为offer:小米相机部门infra、科大讯飞人才计划转普通批大模型推理优化岗位、高通转正最终去向:高通。虽然原部门没转正但是换部门转正了,这里非常感谢高通hr团队,高通hr真的很尽职专业,目前遇到的最好评的hr。并且高通这边做的方向个人很感兴趣,加上base也是理想base,直接决定去高通了。找工作时候非常内耗,面试阶段几乎一天两面,而且挂了这个新的面试又来了,并且面试要么一面挂要么终面挂,每天处于心态已崩和在崩的路上两种状态,好在结果个人还挺满意。秋招和实习一样,运气占一部分,剩下的就靠个人能力了,打铁还需自身硬。最后祝大伙都收获比较满意的offer。
一句话证明你在找工作
点赞 评论 收藏
分享
很多人问我如何准备大模型的面试,分享下我的经验,针对两种情况:1. 有大模型实习2. 无大模型实习针对无大模型实习的情况,我建议先找一段中厂实习为主,比如 zhipu、Minimax (当然有大厂进大厂)这些,相对容易进,尽量积累大模型实习经历。针对有大模型实习的情况,复习内容为:1. 常规八股(transformer、bert 等)2. 最新八股(GQA 等)3. 技术报告(一定要自己看原PDF,目前推荐 DeepSeekV3, R1, kimi1.5, Minimax-01, Qwen2.5, Qwen2.5-VL)4. 手撕 Leetcode:Hot1005. 手撕模型,比如 MHA 这些首先是常规八股和最新八股,这一部分可以自己找找网上资料,整理好的,背。然后是技术报告,目前推荐的内容有:1. DeepSeekV3:必读2. DeepSeekR1:必读3. Kimi1.5:选读4. Minimax-01:选读,据我所知最长上下文模型(外推到 4M,不过好像被 LLama4 的 10M 超过了)5. Qwen2.5:必读6. LLama3.1:必读7. Qwen2.5-VL(如果简历有多模态内容):选读重点关注:1. 阶段训练(预训练几段、Post-training 几段?上下文用了多少?数据配比是什么?)2. 模型创新点(MHA 创新是什么?作用是什么?)3. 上下文优化创新点(一般是优化显存和阶段训练)4. 多模态优化创新点(简历有多模态内容)5. 几个模型不同之处(比如 Qwen2 和 Qwen2.5 的不同之处)最后是手撕,Leetcode 只刷 Hot100 够了,模型手撕建议关注(我目前会的):1. MHA2. LayerNorm3. Transformer Encoder (MHA+LayerNorm+FFN)4. PE(绝对位置编码)5. ROPE6. SwiGLU7. RmsNorm每次面试前快速过一遍就 ok 了。
查看19道真题和解析
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务