04-28 09:07 百度_NLP算法(实习员工)

发布于山西

关注

4.24滴滴大模型算法一面面经

1. 自我介绍
2. 过一下你觉得最好的项目/实习。说了一个教程类开源项目，其中包括部署、LoRA微调等内容。又说了了另一个在学校做的项目，问的很细，包括我们使用Function Call做检索的流程、用langchain如何实现的，内部原理是什么。
3. 下一个项目BERT相关的，问了问Transformer的原理结构，他的优点是什么，我讲的是他是不限制距离计算，有效遏制了经典RNN模型的长序列遗忘问题。问了问BERT的原理，幸好看过原论文，简单说了下。
4. 下一个项目是做的Qwen SFT，训练数据如何生成的，多少数据，训练的参数，训了多久。
5. 问了强化学习deepseek，我答了GRPO和PPO，问了DPO我没看过。
6. medium题

全部评论

推荐最新楼层

牛客384563374号

开源项目经验加分

1 回复分享

发布于 05-03 17:40 广东

拒绝内卷的安哥拉兔很有一套

暨南大学人工智能

佬，开源项目可以分享一下吗

点赞回复分享

发布于 05-13 11:46 广东

牛客650834652号

湖南大学算法工程师

方便问问佬bg吗

点赞回复分享

发布于 04-29 14:03 浙江

牛客193865349号

电子科技大学算法工程师

求问是哪个部门啊

点赞回复分享

发布于 04-28 13:53 四川

顶呱呱的高级磨洋工很完美

Université PSL 法语翻译

佬，可以问一下是哪个部门吗，我们的问题好相似

点赞回复分享

发布于 04-28 09:21 浙江

05-14 16:26

华北电力大学（北京） Java

突然发现Transformer拆解思路真的好清晰

🌈 Transformer模型核心解析 Transformer以自注意力机制为核心，打破传统序列模型依赖循环结构的局限，通过并行计算在输入序列各位置间建立关联，成为自然语言处理领域的“顶流”架构！模型由编码器和解码器构成，通过多层注意力机制实现信息交互与特征提取，精准捕捉文本语义。 💡 不可忽视的优势 1️⃣ 并行计算王者：支持高效并行运算，轻松应对大规模数据与分布式训练场景，大幅提升训练效率 2️⃣ 迁移学习利器：预训练+微调模式适配多任务，从机器翻译到情感分析，一键切换超灵活 3️⃣ 长距离依赖杀手：自注意力机制无视序列长度，轻松捕捉跨段落语义关联，告别“健忘症” ⚠️ 使用需注意的短...

点赞评论收藏

分享

05-28 20:13

中山大学算法工程师

强度拉满:网易大模型算法岗

1️⃣一面时间：9.12  时长：1hcode：统计岛屿数量、最大岛屿面积，DFS方法解了然后介绍实习项目，面试官非常耐心地听，没有打断八股1.bert和gpt的区别？（从模型架构、训练方式、使用场景方面回答的）2.训练/微调一个LLM的流程？3.实习时用的 megatron 框架吗，对分布式训练框架了解多少？（回答了deepspeed和megatron区别，以及几种并行方式，以及deepspeed的三种zero）4.了解强化学习吗，跟SFT有什么区别？5.反问：业务，对岗位的期望💣评价：有点紧张，算法题有一个小失误没注意到2️⃣二面时间：9.14  时长：1h八股1.写一下 attention 公式（代码实现了下）2.训练时为什么要mask，推理时也需要吗？两处有什么区别？推理时的sequence length和训练时一样吗3.transformer和传统seq2seq模型有什么区别？4.计算attention时为什么要除以d_k，这个d_k的含义是？5.attention计算时还有哪些scale处理？6.attention中softmax函数作用、公式、为什么有减去最大值的处理？换个函数还能这样处理吗？7.解释数值上溢、下溢问题8.讲一下prompt书写的经验，如何判断prompt是否达标，如何改进prompt9.讲一下SFT，会对哪部分计算loss？为什么？10.讲一下deepspeed11.训练用一个7b模型要占用多少显存？不同zero阶段能够节省多少显存？12.训练模型时用了几张卡，有遇到什么异常中断问题吗？反问： 在乎候选人什么能力？对面试表现有哪些改进意见？💣评价： 基础不够扎实，网上有的知识都能回答上来，在同龄人里算比较优秀，欠缺一些多机多卡实践经验。  

查看17道真题和解析

点赞评论收藏

分享

05-06 14:15

中南林业科技大学机器学习

面试官: 为什么大模型的损失函数采用交叉熵而不是 MSE? 这个回答神了！

点赞评论收藏

分享

05-08 18:05

浙江大学算法工程师

字节大模型实习面经记录完结！（3/3）已oc

电商治理面经 第三面三面完就hr面了记录一下面经

面试问题记录

点赞评论收藏

分享

05-26 19:30

西北工业大学 Java

Shopee虾皮Android开发实习笔试

📍面试公司：Shopee💻面试岗位：Android开发❓面试问题：先来说说选择题吧，一共是10道题，我记得的核心点有： 几种常见插入算法的附加存储开销比较 里氏替换 Kotlin(这是我之前没了解过，直接懵了) Java的方法签名 虚拟内存 HTTPS（默认端口，是否一定安全，是对称还是非对称加密） RetentionPolicy.Runtime，注解什么时候可见 Handler,MessageQueue的区别 简单的Java并发和JVM（当时做到这里才缓了口气，感觉遇见了老熟人） 简单的链表 用Android Intent传输数据，哪种类型的可以直接传（这里也是懵了）再来说说3道编程题吧...

查看14道真题和解析

投递虾皮信息等公司7个岗位 > 笔试

点赞评论收藏

分享

评论

5

28

全站热榜

更多

字节暑期补捞

热聊中

创作者周榜

更多

正在热议

更多

# 写给毕业5年后的自己 #

3780次浏览 63人参与

# 好好告别我的学生时代 #

39700次浏览 783人参与

# 华泰证券Fintech星战营 #

167907次浏览 190人参与

# 职场捅娄子大赛 #

316686次浏览 3247人参与

# 晒一下我的毕业照 #

30322次浏览 320人参与

# 华为求职进展汇总 #

4641963次浏览 28243人参与

# 如何缓解求职过程中的焦虑？ #

6982次浏览 93人参与

# 海信求职进展汇总 #

64714次浏览 356人参与

# 如果今天是你的last day，你会怎么度过？ #

22503次浏览 197人参与

# 记录实习开销 #

23721次浏览 174人参与

# 晒晒我司的端午福利 #

14735次浏览 99人参与

# HR问：你期望的薪资是多少？如何回答 #

39845次浏览 524人参与

# 上班苦还是上学苦呢？ #

222589次浏览 1327人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

108090次浏览 780人参与

# 毕业季等于分手季吗 #

11334次浏览 108人参与

# 如果中了500万，你会离职吗？ #

81876次浏览 649人参与

# 视觉/交互/设计百问百答 #

43091次浏览 427人参与

# 实习/项目/竞赛奖项，哪个对找工作更重要？ #

82763次浏览 1108人参与

# 参加完秋招的机械人，还参加春招吗？ #

47703次浏览 544人参与

# 工作两年想退休了 #

119749次浏览 1116人参与

# 简历无回复，你会继续海投还是优化再投？ #

70144次浏览 699人参与

牛客网
牛客企业服务