我是如何准备大模型算法岗面试的?

很多人问我如何准备大模型的面试,分享下我的经验,针对两种情况:
1. 有大模型实习
2. 无大模型实习
针对无大模型实习的情况,我建议先找一段中厂实习为主,比如 zhipu、Minimax (当然有大厂进大厂)这些,相对容易进,尽量积累大模型实习经历。
针对有大模型实习的情况,复习内容为:
1. 常规八股(transformer、bert 等)
2. 最新八股(GQA 等)
3. 技术报告(一定要自己看原PDF,目前推荐 DeepSeekV3, R1, kimi1.5, Minimax-01, Qwen2.5, Qwen2.5-VL)
4. 手撕 Leetcode:Hot100
5. 手撕模型,比如 MHA 这些
首先是常规八股和最新八股,这一部分可以自己找找网上资料,整理好的,背。
然后是技术报告,目前推荐的内容有:
1. DeepSeekV3:必读
2. DeepSeekR1:必读
3. Kimi1.5:选读
4. Minimax-01:选读,据我所知最长上下文模型(外推到 4M,不过好像被 LLama4 的 10M 超过了)
5. Qwen2.5:必读
6. LLama3.1:必读
7. Qwen2.5-VL(如果简历有多模态内容):选读
重点关注:
1. 阶段训练(预训练几段、Post-training 几段?上下文用了多少?数据配比是什么?)
2. 模型创新点(MHA 创新是什么?作用是什么?)
3. 上下文优化创新点(一般是优化显存和阶段训练)
4. 多模态优化创新点(简历有多模态内容)
5. 几个模型不同之处(比如 Qwen2 和 Qwen2.5 的不同之处)
最后是手撕,Leetcode 只刷 Hot100 够了,模型手撕建议关注(我目前会的):
1. MHA
2. LayerNorm
3. Transformer Encoder (MHA+LayerNorm+FFN)
4. PE(绝对位置编码)
5. ROPE
6. SwiGLU
7. RmsNorm
每次面试前快速过一遍就 ok 了。 #AI面试问题分享#
全部评论
大佬想问下项目该怎么准备
2 回复 分享
发布于 03-09 20:15 辽宁

相关推荐

04-08 09:29
门头沟学院 Java
刷到这个话题,真的像看到了半年前的自己。那时候我满脑子都是 “想入行 AI”,却连第一步该迈哪只脚都不知道,网上一会说要先学 Python,一会说要啃深度学习花书,一会说没硕士学历别碰 AI,越看越懵,越学越焦虑,踩了半年的坑,走了无数弯路,才终于摸明白,新手入门 AI,最该先做的根本不是背公式、啃代码。我是双非计算机本科,去年秋招看着身边同学都往 AI 方向冲,薪资比普通开发岗高一大截,也动了入行的心思。最开始我跟绝大多数新手一样,陷入了 “全栈学习” 的误区,觉得入门 AI 就得把所有东西都学透。先是翻出了大学的线性代数、概率论课本,啃了半个月,公式背了一堆,却不知道用在哪;然后去网上找 Python 教程,把基础语法、数据结构过了一遍,觉得自己行了,又去啃深度学习花书,看到反向传播、梯度下降就头大;听别人说 Transformer 是 AI 的核心,又去手抄 Transformer 代码,背多头注意力的公式,结果背完了,连个最简单的 AI 对话接口都调不明白。就这么瞎学了 3 个月,我看着自己记了满满一本的公式笔记,却连一个能落地的 AI 小项目都做不出来,投出去的 AI 岗简历,全是已读不回。那时候我特别崩溃,觉得自己不是这块料,甚至想过放弃,觉得 AI 根本不是我们双非本科生能碰的。直到后来跟一个在 AI 公司做开发的学长聊,他一句话点醒了我:“你连自己要入 AI 的哪个门都没搞清楚,瞎学一堆有什么用?AI 不是只有大模型算法岗这一条路,你先想清楚自己要做什么方向,再针对性学东西,比你瞎学半年都有用。”也是那时候我才明白,我之前所有的努力,都是本末倒置。入门 AI 的第一步,从来不是学 Python、啃数学、背公式,而是先搞清楚 AI 行业的赛道划分,选一个适合自己的、能落地的方向,定好清晰的目标,再开始针对性学习。学长给我拆解了 AI 行业的核心赛道,我才知道,原来 AI 不是只有高大上的大模型算法岗,还有对本科生极其友好的 AI 应用开发 / Agent 开发岗、AIGC 多模态开发岗、AI Infra 岗,每个方向的技术要求、入门门槛、学习路径天差地别。比如大模型算法岗,基本要求硕士以上学历,要啃透数学、深度学习、Transformer 全流程,普通本科生根本没机会;而 AI 应用开发岗,只要你有 Python 基础、后端开发能力,懂点 Prompt 工程、RAG、LangChain,就能快速上手,企业 hc 也多,是本科生入行 AI 的最佳路径。想清楚了这些,我才终于停止了无效的全栈学习,定了 AI 应用开发的方向,针对性去学 LangChain、RAG、Prompt 工程这些核心技术,不再去啃那些用不上的数学公式。我做的第一个项目,不是什么高大上的大模型微调,就是一个最简单的本地知识库问答助手,跟着教程一步步跑通,能上传 PDF 文档,用自然语言查询文档里的内容。当我输入问题,AI 准确返回文档里的答案的时候,那种成就感,是我背了半年公式从来没有过的。也是从这个最小的 demo 开始,我慢慢建立了正反馈,一点点优化这个项目,加了多轮对话、分块优化、重排序,把它做成了一个完整的企业知识库项目,写进了简历里。后来靠着这个项目,我拿到了杭州一家 AI 公司的实习 offer,终于入了 AI 的门。现在回头看,我踩过最大的坑,就是入门的时候,连方向都没选好,就盲目地学一堆东西,最后什么都没学透,还把自己的信心磨没了。所以想跟所有想入门 AI 的牛友们说:如果你是零基础、本科生,想入行 AI,第一步绝对不是学 Python、啃数学、背公式,更不是上来就冲最难的算法岗。先花一周时间,搞清楚 AI 行业的各个赛道,每个方向的门槛、要求、发展前景,结合自己的学历、基础、职业目标,选一个适合自己的方向,定好清晰的目标,再开始针对性学习。方向对了,你的努力才会有意义。不然只会像我最开始那样,瞎学半年,最后还是在门外徘徊。
现在入门AI首先要做什么...
点赞 评论 收藏
分享
评论
14
47
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务