求职战斗鸡

03-15 17:40 合肥工业大学算法工程师

关注

大模型算法面经分享-字节

整体面试还是不错的，但是没后续了，不知道是哪里出了问题
1.深挖论文
2.讲一下multi-head attention 用pytorch手撕一下要可以实现cross attention的
3.讲一下你用的大模型是什么结构特征是怎么喂给大模型的
4.大模型训练为什么不用SFT
5.LoRA是什么？有什么好处
6.知道RLHF吗？讲一下训练流程
7.接下来就是好几个场景题

全部评论

推荐最新楼层

04-15 11:59

OPPO_AI算法部_AI研究员(准入职员工)

OPPO内推，OPPO内推码

OPPO计算机视觉算法面经OPPO一面实习介绍，上色的损失函数，项目介绍，数据集，损失函数，有没有做轻量化？边缘模糊怎么办？会不会C++，落地部署传统的去噪方法，BM3D，WNNM脸上的痣怎么用传统方法识别出来？数学理论对学深度学习有什么优势？GAN的应用场景和优缺点OPPO二面项目(真实图像去噪怎么做，是否了解高光谱图像的噪声来源机理)，实习(做了什么改进)定了高目标实现了的事情，发不了顶刊的原因，拿了什么offer，职业规划，工作强度怎么看待？C和C++熟练嘛？工程部署落地出问题怎么办？算法部署到手机，封装成SDK，出现各种问题怎么办？OPPO27届寻梦计划暑期实习3.6启动啦，26届补招...

点赞评论收藏

分享

03-27 11:40

门头沟学院算法工程师

蚂蚁实习大模型算法一面 1h

发点面经攒攒人品～1.项目介绍2.介绍实习3.数据集使用的是公开数据集还在有自己构造数据集大模型相关八股提问4.分别讲一下 Dense 模型和 MoE 模型以及二者的区别5.讲一下MoE的 路由机制是如何做的6.训练完验证使用的是什么数据集7.做这个工作的过程中的难点在哪8.如何做的 SFT9.介绍一下 PPO10.讲一下 RAG 项目11.分类任务常用的评测指标有哪些12.讲一下 LoRA 微调的原理13.A、B 矩阵怎么初始化的14.LoRA 微调秩设置的是多少coding最小生成树

查看15道真题和解析

点赞评论收藏

分享

03-30 20:48

门头沟学院研发工程师

一天面三场的耐面王

第一场字节，三进宫，压力还是那么的大，现场共享屏幕启动项目看流程，结果当场出bug，在这浪费了将近20min还没搞出来（其实就是提示词模版给错了，导致空指针，还是压力太大了），然后问我二开项目是不是没跑过 ,算法是判断一棵树是不是另一棵树的子树，好像是力扣原题，75min。第二场钉钉，出场景题看你思考的深度（大型qps的一个系统，要求用到磁盘，怎么优化，我的思路是redis那一套，多实例，缓存，缓存淘汰策略），跟面试官有说有笑，谈到了ai 替代程序员的话题，45min，无算法。第三场美团，这个体验最好，面试官是个同龄人，彬彬有礼，一直围绕着项目聊，对每一个点都仔细询问，有没有什么替代方案，也问...

查看7道真题和解析

点赞评论收藏

分享

03-25 08:30

西安交通大学算法工程师

阿里大模型算法面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.项目拷打2.你在去部署或者训练预训练或者后训练的模型时，有没有用过一些比较底层的一些训练的调试的工具，比如说千卡的话很容易就会出NCCL timeout，如果出现 NCCL timeout，一般怎么定位和解决？3.像那种rl里面的那个MOE之类的那种的优化有去做过吗4.看您的训练经验比较丰富，而且您上线运行的推理内容之前也进行过一些什么样的优化吗？5.有没有做过 kernel级别的优化？比如用 CUTE DSL或者手写 CUDA去做 fusion这类算子融合优化，介绍一下6像底层，如果你们在做.kernel fusion，倾向于用什么方式来做7.有没有哪次你做了 fusion 结果性能反而下降的？原因是什么8.平时写 CUDA的时候，有没有关注到底层实现细节？比如你刚提到 FA2，那再往下一层，像 Hopper架构里那个 warp specialization是什么，它底层大概是怎么实现的9.试过用 Agent去生成cuda内核么，怎么去做的10.如果我把 warp specialization 去掉，只保留 tile 和 shared memory 优化，大概会损失在哪？11.怎么么判断一个 MoE 模型是真的学到了分工，而不是只是把 dense模型拆开了12.在 RL + MoE 里，有没有遇到过 reward把 routing学坏的情况？就是模型为了拿 reward，全都走某几个 expert，这种情况你当时是怎么处理的

查看11道真题和解析

点赞评论收藏

分享

04-02 10:47

重庆邮电大学 Java

联想-AI应用开发-面经

联想一面自我介绍rag文本分块策略你对AI agent的了解了解哪些框架在rag中如何构建上下文对话的能力关于大模型提示词的经验你知道哪些agent工具rag中的幻觉问题是这么处理的？你知道哪些向量数据库？在rag中，有哪些相似度的计算方法你知道最近两年有哪些agent框架吗谈谈你对openClaw的人生谈谈对agent Skills的认识什么是python闭包，你在项目中哪些场景中使用了的Java中如何处理内存泄漏风险反问：大概有几面：总共两面，后面一面是HR面多久能知道本次面试的结果：应该很快吧大概多久能入职：得HR才能知道（整个流程总共20分钟，无手撕代码环节。时间短的比拷打1个半小时，...

查看15道真题和解析

点赞评论收藏

分享

评论

1

9

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI时代还有必要刷leetcode吗？ #

30772次浏览 394人参与

# 大学生该如何认清当下的就业环境？ #

161635次浏览 871人参与

# 有哪些公司在面试时考察AICoding？ #

17580次浏览 331人参与

# 运营来爆料 #

98649次浏览 508人参与

# HR面都在聊什么？ #

12542次浏览 153人参与

# 美团开奖 #

407507次浏览 1805人参与

# 百度工作体验 #

325156次浏览 2247人参与

# 想从事Agent应该学习哪些技术？ #

7629次浏览 258人参与

# 26届春招投递记录 #

3352次浏览 38人参与

# OPPO求职进展汇总 #

808578次浏览 5441人参与

# 校招生月薪1W算什么水平 #

143194次浏览 492人参与

# 你觉得什么岗位会被AI替代 #

56981次浏览 369人参与

# 从投递到OC，你用了多久 #

22177次浏览 227人参与

# 什么人最适合大厂？ #

11905次浏览 122人参与

# 父母问你工作找得怎么样，怎么回 #

21754次浏览 258人参与

# 哪些公司面试还在问八股？ #

12980次浏览 112人参与

373588次浏览 2921人参与

# 我与AI的日常 #

3182次浏览 16人参与

# 实习最想跑路的瞬间 #

137538次浏览 762人参与

# 我的求职进度条 #

1099375次浏览 7907人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务