本人_牛客网

神奇的大师兄摆烂了

05-27 14:39 亳州职业技术学院业务管理

关注

本人

点赞 1

05-12 22:12

门头沟学院 Java

速通大模型实习的我，现在怎么样？

写在最前面，首先感谢各位驻足观看，我受宠若惊，一共赚了三包薯片了，这期呢还是讲讲最近的去向，还有大伙比较关心的实习工作怎么样，好不好找工作，有好些人私信我，这里一块讲一下。第一个问题，大模型好不好找工作？还是那句话，看你喜欢做什么，大模型应用agent开发是蛮好找的，大模型底层算法调优蒸馏做小模型也好找（不过有点吃学历这个很多只要硕士），大模型做论文复现，写量化这种（很吃学历和paper，一篇还不够，要高端的paper，ccf-a这种算差不多）。在5月2号我做完第一份简历，5月6号收到第一份offer，5月11号去北京时候我已经手握6家offer了，有初创，有小厂，有远程，有大厂，最后我选择了...

牛友故事会牛客激励计划

点赞评论收藏

分享

05-25 20:22

中山大学算法工程师

压力大:百度大模型算法岗面试回放

1️⃣一面1.自我介绍和项目介绍2.介绍一下了解的大模型有哪些，这些模型在结构上有什么差异3.说一下大模型常用的位置编码有哪些，各有什么优缺点4.介绍一下大模型的预训练后训练以及推理是怎么做的，并且详细问了 RLHF 的做法，包括 PPO 算法的原理，以及 DPO 和 PPO 的区别5.大模型的超长上下文是怎么做的，比如说 KIMI6.大模型智能体是怎么工作的，有哪些组件7.场景题：如何训练一个大模型，可以做到精确的提取摘要8.代码:股票的四个题121. 买卖股票的最佳时机122. 买卖股票的最佳时机 II123. 买卖股票的最佳时机 III188. 买卖股票的最佳时机 IV✴️整体来说一面偏基础，没有太多发散性的问题，整个面试一个半小时多2️⃣二面1.自我介绍2.因为之前是做 CV 的，所以面试官问了 CV 和 NLP 的区别和联系，在 Transformer 的大背景下，CV、NLP，包括语音等，能否实现大一统3.训练大模型的时候数据怎么清洗，怎么处理，怎么配比，怎样操作能更容易使模型达到更好的性能4.什么是大模型的幻觉，如何减轻幻觉问题5.大模型的复读问题是怎么产生的，业内一般有什么解决办法6.大模型的工具调用怎么实现7.Agent 有哪几部分构成，了解哪些具体的实现方法8.开放题：之前训练大模型的时候遇到过什么困难，你是怎么解决的9.代码：实现一个 Tokenizer，只能用 PyTorch 基础语法✴️二面相比于一面更加看重综合素质，喜欢考察分析问题解决问题的能力，二面也面试了一个多小时，面试官还是挺专业的。3️⃣三面1.首先过项目，但是问的特别细致，尤其是一个 Agent 的项目，从背景，到动机，再到做法，最后的结果，都问的非常细，大概有半个小时的时间2.开放题：你觉得当前大模型还存在怎样的问题，有什么解决办法吗3.开放题：让你自己设计一个 Agent，会怎么做，为什么这样做4.找工作比较在意的点是什么，除了薪资还有什么5.对文心一言这个产品了解吗，有哪些优点和值得改进的点6.如果给你发 Offer，你到这个团队能做出什么贡献✴️三面整体来说更加综合，不止有一些技术问题，还有职业规划这些问题，更加考察整体的能力。面试官应该是这个团队的大老板，看问题更加系统和全面，整体面下来还是比较有压力的。📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

百度三面308人在聊

查看26道真题和解析

点赞评论收藏

分享

05-21 15:54

北京交通大学产品经理

平台产品经理-大模型AIGC一面凉经

📍面试公司：快手💻面试岗位：如题❓面试问题：1、自我介绍2、为什么要做这款工具？需求是什么？3、如何验证你的工作满足了需求？4、如何评判模型输出的内容达到了预期的效果？如何量化？5、指标是怎么设计的？6、反问🙌面试感想：比较注重思考的逻辑性和深度，很注重数据指标方面的设计（可能做模型相关的业务都注重评测指标），面试官小姐姐人很好，反问环节我提问我的改进之处一针见血指出了我的问题（面的过程中我也感觉到了），总体来说面试体验很好，就是准备的不充分15min秒结束了 太可惜了，这个业务方向我还是很感兴趣的

查看5道真题和解析面试时最害怕被问到的问题面试问题记录

点赞评论收藏

分享

05-28 20:13

中山大学算法工程师

强度拉满:网易大模型算法岗

1️⃣一面时间：9.12  时长：1hcode：统计岛屿数量、最大岛屿面积，DFS方法解了然后介绍实习项目，面试官非常耐心地听，没有打断八股1.bert和gpt的区别？（从模型架构、训练方式、使用场景方面回答的）2.训练/微调一个LLM的流程？3.实习时用的 megatron 框架吗，对分布式训练框架了解多少？（回答了deepspeed和megatron区别，以及几种并行方式，以及deepspeed的三种zero）4.了解强化学习吗，跟SFT有什么区别？5.反问：业务，对岗位的期望💣评价：有点紧张，算法题有一个小失误没注意到2️⃣二面时间：9.14  时长：1h八股1.写一下 attention 公式（代码实现了下）2.训练时为什么要mask，推理时也需要吗？两处有什么区别？推理时的sequence length和训练时一样吗3.transformer和传统seq2seq模型有什么区别？4.计算attention时为什么要除以d_k，这个d_k的含义是？5.attention计算时还有哪些scale处理？6.attention中softmax函数作用、公式、为什么有减去最大值的处理？换个函数还能这样处理吗？7.解释数值上溢、下溢问题8.讲一下prompt书写的经验，如何判断prompt是否达标，如何改进prompt9.讲一下SFT，会对哪部分计算loss？为什么？10.讲一下deepspeed11.训练用一个7b模型要占用多少显存？不同zero阶段能够节省多少显存？12.训练模型时用了几张卡，有遇到什么异常中断问题吗？反问： 在乎候选人什么能力？对面试表现有哪些改进意见？💣评价： 基础不够扎实，网上有的知识都能回答上来，在同龄人里算比较优秀，欠缺一些多机多卡实践经验。  

查看17道真题和解析

点赞评论收藏

分享

05-06 18:41

门头沟学院 Java

几周速通大模型实习，你需要做什么？

我通过牛客赚了一包薯片，整整5块，然后一直没到账，然后发现人家放假了，今天到了之后买了吃掉，已经变成葡萄糖了。那么我也是顺利收下几家offer了，没学多久，今天给一下具体路线，求别私信我（真想问问题，直接把问题写上去留个微信，动不动弹出来红点点，你总会去点他的。。），然后东西都是你感兴趣才能去做，你肯定难以接受一天爽学10几个小时。同时五一假期还不出门，连续5天高强度琢磨新玩意，所谓欲戴王冠，必承其重你知道的，光是走马观花肯定很困难。我给出你具体思路还是比较重要的。首先确定走这一行，我的话有两年开发经验，有实习经验，然后直接转行，本身就有基础，计算机的知识是有迁移性质的。我先讲讲大模型ai应用...

面试中的破防瞬间牛友故事会

点赞评论收藏

分享

牛客热帖

更多

正在热议

更多

# 写给毕业5年后的自己 #

4223次浏览 95人参与

# 毕业季等于分手季吗 #

14672次浏览 169人参与

# 华泰证券Fintech星战营 #

168391次浏览 191人参与

# 职场捅娄子大赛 #

319620次浏览 3264人参与

# 好好告别我的学生时代 #

43690次浏览 837人参与

# 华为求职进展汇总 #

4646130次浏览 28247人参与

# 海信求职进展汇总 #

65045次浏览 359人参与

# 机械制造岗投递时间线 #

22286次浏览 341人参与

# 晒一下我的毕业照 #

32879次浏览 359人参与

# 如何缓解求职过程中的焦虑？ #

7517次浏览 97人参与

# 如果今天是你的last day，你会怎么度过？ #

22748次浏览 197人参与

# HR问：你期望的薪资是多少？如何回答 #

40087次浏览 525人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

108295次浏览 782人参与

# 晒晒我司的端午福利 #

14868次浏览 99人参与

# 记录实习开销 #

27032次浏览 195人参与

# 如果重来一次，你还会学计算机吗 #

46881次浏览 417人参与

# 我想象的实习vs现实的实习 #

280389次浏览 2214人参与

# 上班苦还是上学苦呢？ #

222917次浏览 1329人参与

# 工作两年想退休了 #

119969次浏览 1120人参与

# 视觉/交互/设计百问百答 #

43231次浏览 427人参与

# 实习生如何通过转正 #

85005次浏览 1326人参与

牛客网
牛客企业服务