大模型界的路边一条 level
获赞
579
粉丝
58
关注
32
看过 TA
2764
中国科学院软件研究所
2026
算法工程师
IP属地:北京
大厂offer,我舔着要,给我一个吧!
私信
关注
0 点赞 评论 收藏
分享
📍面试公司:虾皮🕐面试时间:2025-08-24💻面试岗位:虾皮- AI训/推框架算法工程师❓面试问题:如下🙌面试感想:面试官很好,秋招以来遇到过最好的。BG:末9本,中科院硕,和组内课题不相关自我介绍:一分钟完事## 1.讲讲FlashAttention机制## 2.讲讲PageAttention机制## 3.既然提到了操作系统虚拟内存,那讲讲操作系统中页表的结构,页面是否是连续存储的?## 4.讲讲PPO核心原理## 5.PPO中有个重要性采样是什么?写一下PPO的损失函数?为什么需要重要性采样?## 6.深度剖析PPO中每个模型的作用是什么## 7.为什么需要KL散度## 8.奖励模型时怎么训练的,既然有了奖励模型打分,那为什么还需要价值模型,价值模型的作用是什么?奖励模型和价值模型是怎么训练的?## 9.GRPO在此基础上有什么优化?## 10.讲一讲连续批处理技术是什么,为什么需要连续批处理技术?## 11.为什么需要PD分离?## 12.集合通信原语有哪些?## 13.Python中的Dict是什么,如何解决哈希冲突的问题?有哪些解决方案,有没有可能降到O(1)## 14.你这个RAG项目是如何进行Embedding的,用的什么向量检索工具,Fassi的原理是什么?## 15.跑过PPO训练吗?## 16.分布式并行策略有哪些?## 17.TP并行张量是如何切分的,又是如何合并的,按行切和按列切有何不同?## 18.PP并行的缺陷是什么?如何解决气泡问题?你能写出计算气泡大小的公式吗?## 19.有没有了解过分布式训练?## 20.你用过哪些显卡,他们的动态指标有哪些?有用过什么工具去监测吗?🍣手撕:Hot100.数组中只出现过一次的数,其他元素都只出现过两次变形:其他元素都出现过三次呢?反问:您觉得我掌握的怎么样,我自认为觉得还有点距离需要沉淀;面试官评价理论还可以,实操太少。确实中肯,虚心接受,挂了也心服口服。
查看20道真题和解析
0 点赞 评论 收藏
分享
0 点赞 评论 收藏
分享
📍面试公司:美团🕐面试时间:2025-08-14,菜只因秋招处女面💻面试岗位:北斗计划-基座大模型推理引擎工程师BG:末9本,中科院硕,和组内课题不相关❓面试问题:自我介绍:一分钟完事1.介绍一下Transformer的架构,和传统RNN循环神经网络相比有何优势2.Transformer中参数都分布在哪里,参数量最大的是哪部分?计算量最大的是哪部分,为什么?3.了解GPU的cuda core、Tensor core吗,你常用的GPU有哪些,他们的显存和显存带宽有多大4.讲讲大模型的量化5.为什么需要PD分离技术6.讲讲PageAttention和Continous Batching技术7.讲讲cuda编程8.了解DeepSeek 的MLA机制吗?详细介绍一下和MHA、GQA、MQA的区别9.介绍一下DeepSeek MoE架构10.详细介绍一下各种并行方法,TP、PP、DP是什么11.为什么说Prefill阶段是计算密集型的,为什么Decode阶段是内存密集型的?无寿司🍣,感觉是回答的太烂了,30分钟结束。反问:从刚才的面试来看,感觉是不是做底层系统优化比较多,是不是CUDA编程很多?答:也不全是。主要综合来看,不是一定要掌握CUDA编程,但是作为大模型开发而言,CUDA编程肯定要学的,🙌面试感想:和蔼,有几道问题给我解释了;开始开了摄像头,后期关闭了摄像头;大模型八股偏多,依据简历问的,没问项目,我的项目是RAG,可能跟岗位关系不大,所以没问。
查看11道真题和解析
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务