03-03 20:19 南京大学算法工程师发布于江苏

关注

大模型面经 - 通义实验室

#算法##面经##春招##互联网大厂##大模型#

面试经验分享文章被收录于专栏

大厂大模型面试经验分享

全部评论

推荐最新楼层

中国科学技术大学 Python

佬能推一下通义认识的hr么

，有事情想问

点赞回复分享

发布于 03-28 09:55 江苏

投降输一半😋

南京大学算法工程师

佬最后去哪里了哇

点赞回复分享

发布于 03-05 13:25 广东

牛客893265314号

同济大学 Java

佬 transformer encoder代码题是什么呀，要怎么写呀

点赞回复分享

发布于 03-04 21:12 香港

能赶紧毕业找个班上吗

门头沟学院深度学习

佬太强了，想问下通义进度推进吗

点赞回复分享

发布于 03-04 16:31 北京

门头沟学院移动通讯工程师

佬，什么时候面的啊，我投了之后一直还没消息

点赞回复分享

发布于 03-04 12:31 天津

同济大学算法工程师

顶，nju✌🏻

点赞回复分享

发布于 03-04 00:57 上海

05-07 22:04

已编辑

上海华东师范大学算法工程师

蚂蚁网银 NLP算法面经

4.21 投简历4.23 约后天一面4.25 一面无手撕，上来先拷打论文，其中有个地方用了rag，面试官问我这里是怎么把文本转换成向量储存的。(我以为是问我工程上的实现，这是去年做的一个小模块，回忆了半天细节，答得支支吾吾，面完了之后结合下一个问我才意识到其实是问我embedding过程)看我支支吾吾就直接问transformer是怎么把token处理成向量的。transformer的self-attention和cross self-attention区别在哪里。pre-norm和post-norm的区别？进一步，为什么现在主流大模型都用post-norm。lora的实现过程。大模型用的Lo...

查看10道真题和解析实习进度记录

点赞评论收藏

分享

04-11 10:17

哈尔滨工业大学算法工程师

淘天淘宝直播大模型实习一面

📖面试问题：#找实习#(4.9)Q1:简单介绍一下在研究生期间的科研和实习经历。Q2:介绍一下简历上那个完整的大模型项目。Q3:做这个项目的背景，做项目的动机。Q4:第三个项目是实习项目吗？Q5:对第1个项目有用NER的方法吗？微调前base模型的准确率是多少？Q6:第2个项目的数据集构造是不是有问题？这些数据的判断是不是对大模型来说太简单了？Q7:有用传统方法来测你构造数据集的有效性吗？比如用BERTQ8:介绍一下Lora的原理。Q9:LORA基于什么问题，什么样的模型可以用LORA进行微调？什么是低秩分解？Q10:LORA的初始化方法。Q11:两个权重矩阵的初始化。Q12:项目中的可解释性模块是什么？Q13:介绍一下Int8和FP32的区别是什么？Q14:Int8的表示范围。Q15:Int8和FP32前向计算的区别。Q16:除了大模型，你对推荐系统，CV模型有了解吗？手撕代码：lc82. 删除排序链表中的重复元素 II反问：做什么业务（淘宝直播生态和主播智能手卡）进组后做什么业务（预训练）🙌面试体验：挺好的，注重业务，八股并不多。

查看16道真题和解析

点赞评论收藏

分享

05-06 14:15

中南林业科技大学机器学习

面试官: 为什么大模型的损失函数采用交叉熵而不是 MSE? 这个回答神了！

点赞评论收藏

分享

04-27 22:02

联想_移动互联事业部_C++(准入职员工)

灵犀互娱26届暑期实习面经

岗位：前端；一面1.Vue和React的特点2.Vue的响应式原理3.Vue DIFF算法4.computed和watch的区别，在什么场景应用5.输入URL到出现画面的全过程6.HTTP缓存，静态资源缓存7.有了解过SSE吗8.有没有多人协作编辑的场景9.怎么通过AI生成配置10.AI的输入是什么，AI在这里发挥的作用是什么？AI生成图片是调用了大模型的API来做吗？11.大模型是本地部署还是使用第三方API12.怎么对用户的输入进行判断；用户输入的提示词有没有进行优化#灵犀互娱##灵犀互娱，我不允许你这么低调##暑期实习##26届暑期实习#

查看12道真题和解析

点赞评论收藏

分享

04-18 08:06

中山大学算法工程师

大厂面经｜字节大模型算法岗

✅一面1️⃣深挖多模态论文2️⃣介绍transformer架构3️⃣详细说一下Decoder的因果注意力 QKV分别来自哪4️⃣Attention为什么要做scaled 不做会怎么样 为什么用根号d_k5️⃣Transformer怎么做加速训练（KV缓存） 训练和推理有什么区别（并行化）6️⃣深挖多模态大模型论文用的video-llama 讲一下大模型的结构7️⃣论文用了CoT讲一下论文的CoT是怎么样的8️⃣微调用的LoRA介绍一下LoRA9️⃣LoRA初始化怎么做的，用的秩是多少，为什么不选其他的数1️⃣0️⃣知道deepspeed和megatron吗？分别介绍一下1️⃣1️⃣论文用的deepspeed详细讲了一下三个stage分别是什么✅二面1️⃣深挖多模态和大模型的论文2️⃣Decoder文本生成有哪几种方法3️⃣还知道哪些多模态大模型4️⃣介绍一下ALBEF、BLIP5️⃣BLIP2的结构是什么  两阶段怎么训练的 有哪些损失6️⃣知道PEFT吗 讲一下LoRA7️⃣还有什么微调方法 -&amp;gt; prefix-tuning和P-tuning 两者分别是怎么做的 为了解决什么提出的8️⃣后面就是一些场景题✅三面1️⃣深挖论文2️⃣讲一下multi-head attention 用pytorch手撕一下 要可以实现cross attention的3️⃣讲一下你用的大模型是什么结构 特征是怎么喂给大模型的4️⃣大模型训练为什么不用SFT5️⃣LoRA是什么？有什么好处6️⃣知道RLHF吗？讲一下训练流程7️⃣接下来就是好几个场景题，电商相关的，用大模型解决prompt应该怎么设计，怎么处理prompt的输出，怎么过滤错误格式的输出📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

字节跳动三面462人在聊

查看23道真题和解析

点赞评论收藏

分享

评论

3

40

招聘动态

招商金科

25届+26届校园招聘

完美世界

25届春招&26届实习生招聘

腾娱互动

26届实习生火热招聘中

字节跳动

25届补录&26届实习

联想

2026届实习招聘

26届实习软件笔试必刷题单

26届实习求职交流群

字节跳动Tik Tok

26届实习招聘

26届投递链接合集

快手

25届补录+26届实习

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 硬件人你反向读研了吗 #

38966次浏览 608人参与

# 硬件人秋招的第一个offer #

64776次浏览 1079人参与

17105次浏览 136人参与

# 滴滴工作体验 #

22396次浏览 123人参与

# 机械求职避坑tips #

40367次浏览 355人参与

# 材料进Fab厂真的劝退吗？ #

35366次浏览 158人参与

# 职场新人生存指南 #

325526次浏览 6973人参与

# 不考虑转正，实习多久合适 #

23221次浏览 116人参与

# 机械只有转码才有出路吗？ #

125400次浏览 1590人参与

# 面试问题记录 #

11206次浏览 223人参与

# 非技术岗投递进展 #

137020次浏览 1221人参与

# 面试经验谈 #

8542次浏览 129人参与

# vivo求职进展汇总 #

208180次浏览 1341人参与

# 异地恋该为对方跳槽吗 #

19911次浏览 106人参与

# 硬件人更看重稳定还是高薪 #

35185次浏览 190人参与

# 租房找室友 #

25890次浏览 140人参与

# 你遇到过哪些神仙同事 #

68646次浏览 623人参与

# 携程求职进展汇总 #

484621次浏览 3573人参与

# 25届如何提前做秋招准备？ #

163434次浏览 2451人参与

# 深信服求职进展汇总 #

187583次浏览 1691人参与

# 学历or实习经历，哪个更重要 #

111754次浏览 747人参与

牛客网
牛客企业服务